Kursus 242 Introduktion til Statistik Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik Bygning 35/324 Danmarks Tekniske Universitet 28 Lyngby Danmark e-mail: pbb@imm.dtu.dk Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 3 Foråret 213 1 / 33 Oversigt 1 Kontinuerte Stokastiske variable og fordelinger Fordelingsfunktion Middelværdi af en kontinuert stokastisk variabel Varians af en kontinuert stokastisk variabel 2 Eksempel 1 Eksempel 2 Eksempel 3 Eksempel 4 Eksempel 5: Approimation af binomialfordeling Eksempel 6 Eksempel 7 3 R (R Note afsnit 4 ) Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 3 Foråret 213 2 / 33 Kontinuerte Stokastiske variable og fordelinger Kontinuerte Stokastiske variable og fordelinger for en kontinuert variabel en for en stokastisk variabel betegnes ved f() f() siger noget om hyppigheden af udfaldet for den stokastiske variabel X For kontinuerte variable svarer tætheden ikke til sandsynligheden, dvs. f() P (X = ) Et godt plot af f() er et histogram (kontinuert) For en kontinuert stokastisk variabel skrives tæthedsfunktionen som: Der gælder: f() f() > f() = f()d = 1 for S for / S Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 3 Foråret 213 4 / 33 Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 3 Foråret 213 5 / 33
Kontinuerte Stokastiske variable og fordelinger Fordelingsfunktion Fordelingsfunktion Kontinuerte Stokastiske variable og fordelinger Middelværdi af en kontinuert stokastisk variabel Middelværdi af en kontinuert stokastisk variabel Fordelingsfunktion for en kontinuert stokastisk variabel betegnes ved F (). Fordelingsfunktionen svarer til den kumulerede tæthedsfunktion: F () = P (X ) F () = t= f(t)dt Et godt plot for fordelingsfunktionen er den kumulative fordeling Middelværdien af en kontinuert stokastisk variabel beregnes ved: µ = f()d hvor S er udfaldsrummet for X S Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 3 Foråret 213 6 / 33 Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 3 Foråret 213 7 / 33 Kontinuerte Stokastiske variable og fordelinger Varians af en kontinuert stokastisk variabel Varians af en kontinuert stokastisk variabel Konkrete statistiske fordelinger Variansen af en kontinuert stokastisk variabel beregnes ved: σ 2 = ( µ) 2 f()d hvor S er udfaldsrummet for X S Der findes en række statistiske fordelinger, som kan bruges til at beskrive og analysere forskellige problemstillinger med Vi betragter nu kontinuerte fordelinger Normal fordelingen Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 3 Foråret 213 8 / 33 Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 3 Foråret 213 1 / 33
Normal fordelingen.5 Normalfordeling.45.4.35.3 5.15.1.5 5 4 3 2 1 1 2 3 4 5 X N(µ, σ 2 ) tæthedsfunktion: f() = 1 σ 2π Middelværdi: µ = µ Varians: σ 2 = σ 2 Tabel 3 for F () ( µ) 2 e 2σ 2 Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 3 Foråret 213 11 / 33 Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 3 Foråret 213 12 / 33 Normalfordeling N(,1 2 ) Sammenligning af to normalfordelinger med forskellig middelvardi og ens varians.45.4.45.4 N(,1 2 ) N(5,1 2 ).35.35.3.3 5.15 5.15.1.1.5.5 3σ 2σ σ µ.5 5 4 3 2 1 1 2 3 4 5 σ 2σ 3σ.5 5 5 1 Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 3 Foråret 213 13 / 33 Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 3 Foråret 213 14 / 33
Normal fordelingen Sammenligning af tre normalfordelinger med ens middelvardi og forskellig varians.5 En normal fordeling med middelværdi og varians 1, dvs.4.3.1 1 8 6 4 2 2 4 6 8 1 X N(, 1 2 ) kaldes en standard normal fordeling En vilkårlig normal fordelt variabel Y N(µ, σ 2 ) kan standardiseres ved at beregne X = Y µ σ Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 3 Foråret 213 15 / 33 Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 3 Foråret 213 16 / 33 Eksempel 1 Eksempel 1 En vægt har en målefejl, E, der kan beskrives ved en standard normalfordeling, dvs E N(, 1 2 ) dvs. middelværdi µ = og spredning σ = 1 gram. Vi måler nu vægten af ét emne a) hvad er sandsynligheden for at vægten måler mindst 2 gram for lidt? b) hvad er sandsynligheden for at vægten måler mindst 2 gram for meget? c) hvad er sandsynligheden for at vægten måler højst ±1 gram forkert? Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 3 Foråret 213 17 / 33 Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 3 Foråret 213 18 / 33
Eksempel 2 Eksempel 3 Det antages, at blandt en gruppe lærere i folkeskolen, at lønnen kan beskrives ved en normalfordeling med middelværdi µ = 28. og spredning σ = 1.. a) hvad er sandsynligheden for at en tilfældig udvalgt lærer tjener mere end 3.? Det antages, at blandt en gruppe lærere i folkeskolen, at lønnen kan beskrives ved en normalfordeling med middelværdi µ = 29. og spredning σ = 4.. a) hvad er sandsynligheden for at en tilfældig udvalgt lærer tjener mere end 3.? Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 3 Foråret 213 19 / 33 Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 3 Foråret 213 2 / 33 Eksempel 4 Eksempel 5: Approimation af binomialfordeling Det antages, at blandt en gruppe lærere i folkeskolen, at lønnen kan beskrives ved en normalfordeling med middelværdi µ = 29. og spredning σ = 4.. a) angiv det interval, der dækker over 95% af læreres løn I et dosis-respons forsøg med 8 rotter antages at sandsynligheden for at en rotte overlever forsøget er p =.5. a) hvad er sandsynligheden for at højst 3 rotter dør i forsøget? b) hvad er sandsynligheden for at mellem 38 og 42 rotter dør i forsøget? Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 3 Foråret 213 21 / 33 Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 3 Foråret 213 22 / 33
5 Log Normalfordeling LN(1,1) X LN(α, β) tæthedsfunktion: { 1 f() = β 2π 1 e (ln() α)2 /2β 2 >, β > ellers Middelværdi: µ = e α+β2 /2 Varians: σ 2 = e 2α+β2 (e β2 1).15.1.5 LN(1,1) 5 1 15 2 25 3 Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 3 Foråret 213 23 / 33 Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 3 Foråret 213 24 / 33 Eksempel 6 En log-normal fordelt variabel Y LN(α, β), kan transformeres til en standard normal fordelt variabel X ved dvs. X = ln(y ) α β X N(, 1 2 ) Partikelstørrelsen (µm) i et stof kan antages at være Log-Normal fordelt. Vi har observationerne 2.2 3.4 1.6.8 2.7 3.3 1.6 2.8 1.9 Vi tager logaritmen af data og får:.8 1.2.5-1. 1.2.5 1..6 Heraf beregnes =.733 og s =.44. Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 3 Foråret 213 25 / 33 hvad er andelen af partikler med en størrelse i intervallet [2; 3] Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 3 Foråret 213 26 / 33
Eksempel 6 X U(α, β) tæthedsfunktion: Middelværdi: µ = α+β 2 Varians: σ 2 = 1 12 (β α)2 f() = 1 β α Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 3 Foråret 213 27 / 33 Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 3 Foråret 213 28 / 33 Eksempel 7 1.8.6.4 Uniform fordeling U(4,5) Medarbejdere på en arbejdsplads ankommer mellem klokken 8. og 8.3. Det antages, at ankomsttiden kan beskrives ved en uniform fordeling. Hvad er sandsynligheden for at en tilfældig udvalgt medarbejder (Hans) ankommer mellem 8.2 og 8.3? Hvad er sandsynligheden for at en tilfældig udvalgt medarbejder (Martin) ankommer efter 8.3? 3.5 4 4.5 5 5.5 Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 3 Foråret 213 29 / 33 Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 3 Foråret 213 3 / 33
R (R note afsnit 4) R (R Note afsnit 4 ) Oversigt R (R Note afsnit 4 ) Eksempel: R norm unif lnorm ep Betegnelse Den uniforme fordeling Log-normalfordelingen Eponentialfordelingen d f() (probability density function). p Fordelingsfunktion F () (cumulative distribution function). q Fraktil (quantile) i fordeling. r Tilfældige tal fra fordelingen (Forelæsning 1). P (Z 2) pnorm(2) Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 3 Foråret 213 32 / 33 1 Kontinuerte Stokastiske variable og fordelinger Fordelingsfunktion Middelværdi af en kontinuert stokastisk variabel Varians af en kontinuert stokastisk variabel 2 Eksempel 1 Eksempel 2 Eksempel 3 Eksempel 4 Eksempel 5: Approimation af binomialfordeling Eksempel 6 Eksempel 7 3 R (R Note afsnit 4 ) Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 3 Foråret 213 33 / 33