Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

Relaterede dokumenter
Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff.

enote 2: Kontinuerte fordelinger Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher enote 2: Continuous Distributions

Oversigt. Kursus Introduktion til Statistik. Forelæsning 2: Kapitel 4, Diskrete fordelinger. Per Bruun Brockhoff. Stokastiske Variable

Forelæsning 2: Kapitel 4, Diskrete fordelinger

Oversigt. Course 02402/02323 Introducerende Statistik. Forelæsning 3: Kontinuerte fordelinger. Per Bruun Brockhoff

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher

Oversigt. Kursus Introduktion til Statistik. Forelæsning 4: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff. Eksponential fordelingen

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Oversigt. Kursus Introduktion til Statistik. Forelæsning 4: Kapitel 5: Kontinuerte fordelinger

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff

02402 Vejledende løsninger til hjemmeopgaver og øvelser, Uge 4

Oversigt. Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger

Oversigt. Course 02402/02323 Introducerende Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger

Forelæsning 1: Intro og beskrivende statistik

Oversigt. Kursus Introduktion til Statistik. Forelæsning 1: Intro og beskrivende statistik. Per Bruun Brockhoff. Praktisk Information

Kvantitative Metoder 1 - Forår Dagens program

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Landmålingens fejlteori - Repetition - Kontinuerte stokastiske variable - Lektion 3

4 Oversigt over kapitel 4

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen

Forelæsning 11: Kapitel 11: Regressionsanalyse

Forelæsning 8: Inferens for varianser (kap 9)

Oversigt. Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff. Envejs variansanalyse - eksempel

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

MM501 forelæsningsslides

Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff

Teoretisk Statistik, 9 marts nb. Det forventes ikke, at alt materialet dækkes d. 9. marts.

Elementær sandsynlighedsregning

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kvantitative Metoder 1 - Forår Dagens program

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff

Uge 10 Teoretisk Statistik 1. marts 2004

Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable

INSTITUT FOR MATEMATISKE FAG c

Forelæsning 9: Inferens for andele (kapitel 10)

1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable

Kapitel 4 Sandsynlighed og statistiske modeller

Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger. Peder Bacher

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger. Peder Bacher

Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable

Forelæsning 10: Statistik ved hjælp af simulering

Lidt om fordelinger, afledt af normalfordelingen

MM501/MM503 forelæsningsslides

Billedbehandling og mønstergenkendelse: Lidt elementær statistik (version 1)

Produkt og marked - matematiske og statistiske metoder

Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Kursus Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, ( , ) Per Bruun Brockhoff

Kvantitative Metoder 1 - Forår 2007

Kursus Introduktion til Statistik. Oversigt, Inferens for gennemsnit (One-sample setup)

Statistiske modeller

Kvantitative Metoder 1 - Efterår Dagens program

Definition. Definitioner

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Kapitel 4 Sandsynlighed og statistiske modeller

Sandsynlighedsregning 7. forelæsning Bo Friis Nielsen

Løsning eksamen d. 15. december 2008

Bernoulli og binomial fordelingerne Kontinuerte stokastiske variable Normalfordelingen

Sandsynlighedsregning 7. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 5. forelæsning Bo Friis Nielsen

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/

Oversigt. Kursus Introduktion til Statistik. Forelæsning 10: Statistik ved hjælp af simulering. Per Bruun Brockhoff.

Sandsynlighedsregning 7. forelæsning Bo Friis Nielsen

02402 Vejledende løsninger til hjemmeopgaver og øvelser i uge 5

For nemheds skyld: m = 2, dvs. interesseret i fordeling af X 1 og X 2. Nemt at generalisere til vilkårligt m.

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

Hvorfor er det lige at vi skal lære det her?

Tema. Dagens tema: Indfør centrale statistiske begreber.

Hvorfor er normalfordelingen så normal?

Elementær sandsynlighedsregning

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

Opgaver til kapitel 3

Nanostatistik: Opgavebesvarelser

Højde af kvinder 2 / 18

02402 Vejledende løsninger til Splus-opgaverne fra hele kurset

Kvantitative Metoder 1 - Forår Dagens program

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup)

Program. Statistik og Sandsynlighedsregning 2 Middelværdi og varians. Eksempler fra sidst. Sandsynlighedstæthed og sandsynlighedsmål

Løsning til eksaminen d. 29. maj 2009

1 Sandsynlighed Sandsynlighedsbegrebet Definitioner Diskret fordeling Betinget sandsynlighed og uafhængighed...

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen

Løsning til eksaminen d. 14. december 2009

Eksempel I. Tiden mellem kundeankomster på et posthus er eksponential fordelt med middelværdi µ =2minutter.

Statistik og Sandsynlighedsregning 2

CIVILINGENIØREKSAMEN Side 1 af 18 sider. Skriftlig prøve, den: PQ. juli 200Z Kursus nr : (navn) (underskrift) (bord nr)

Sandsynlighedsregning 4. forelæsning Bo Friis Nielsen

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Overheads til forelæsninger, mandag 5. uge På E har vi en mængde af mulige sandsynlighedsfordelinger for X, (P θ ) θ Θ.

CIVILINGENIØREKSAMEN Side?? af?? sider. Skriftlig prøve, den: 16. december 2004 Kursus nr : (navn) (underskrift) (bord nr)

Kvantitative Metoder 1 - Forår 2007

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

Matematisk Modellering 1 Cheat Sheet

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Statistisk Model

Statistik og Sandsynlighedsregning 2

Kvantitative Metoder 1 - Efterår Dagens program

Transkript:

Kursus 02402 Introduktion til Statistik Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: perbb@dtu.dk Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 3 Foråret 2014 1 / 33

Oversigt 1 Kontinuerte Stokastiske variable og fordelinger Tæthedsfunktion Fordelingsfunktion Middelværdi af en kontinuert stokastisk variabel Varians af en kontinuert stokastisk variabel 2 Konkrete Statistiske fordelinger Eksempel 1 Eksempel 2 Eksempel 3 Eksempel 4 Eksempel 5: Approximation af binomialfordeling Log-Normal fordelingen Eksempel 6 Uniform fordelingen Eksempel 7 3 R (R Note afsnit 4 ) Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 3 Foråret 2014 2 / 33

Kontinuerte Stokastiske variable og fordelinger Oversigt 1 Kontinuerte Stokastiske variable og fordelinger Tæthedsfunktion Fordelingsfunktion Middelværdi af en kontinuert stokastisk variabel Varians af en kontinuert stokastisk variabel 2 Konkrete Statistiske fordelinger Eksempel 1 Eksempel 2 Eksempel 3 Eksempel 4 Eksempel 5: Approximation af binomialfordeling Log-Normal fordelingen Eksempel 6 Uniform fordelingen Eksempel 7 3 R (R Note afsnit 4 ) Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 3 Foråret 2014 3 / 33

Kontinuerte Stokastiske variable og fordelinger Tæthedsfunktion Tæthedsfunktion Tæthedsfunktionen for en stokastisk variabel betegnes ved f(x) f(x) siger noget om hyppigheden af udfaldet x for den stokastiske variabel X For kontinuerte variable svarer tætheden ikke til sandsynligheden, dvs. f(x) P (X = x) Et godt plot af f(x) er et histogram (kontinuert) Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 3 Foråret 2014 4 / 33

Kontinuerte Stokastiske variable og fordelinger Tæthedsfunktion Tæthedsfunktion for en kontinuert variabel For en kontinuert stokastisk variabel skrives tæthedsfunktionen som: Der gælder: f(x) f(x) > 0 f(x) = 0 f(x)dx = 1 for x S for x / S Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 3 Foråret 2014 5 / 33

Kontinuerte Stokastiske variable og fordelinger Fordelingsfunktion Fordelingsfunktion Fordelingsfunktion for en kontinuert stokastisk variabel betegnes ved F (x). Fordelingsfunktionen svarer til den kumulerede tæthedsfunktion: F (x) = P (X x) F (x) = x t= f(t)dt Et godt plot for fordelingsfunktionen er den kumulative fordeling Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 3 Foråret 2014 6 / 33

Kontinuerte Stokastiske variable og fordelinger Middelværdi af en kontinuert stokastisk variabel Middelværdi af en kontinuert stokastisk variabel Middelværdien af en kontinuert stokastisk variabel beregnes ved: µ = x f(x)dx hvor S er udfaldsrummet for X S Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 3 Foråret 2014 7 / 33

Kontinuerte Stokastiske variable og fordelinger Varians af en kontinuert stokastisk variabel Varians af en kontinuert stokastisk variabel Variansen af en kontinuert stokastisk variabel beregnes ved: σ 2 = (x µ) 2 f(x)dx hvor S er udfaldsrummet for X S Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 3 Foråret 2014 8 / 33

Oversigt 1 Kontinuerte Stokastiske variable og fordelinger Tæthedsfunktion Fordelingsfunktion Middelværdi af en kontinuert stokastisk variabel Varians af en kontinuert stokastisk variabel 2 Konkrete Statistiske fordelinger Eksempel 1 Eksempel 2 Eksempel 3 Eksempel 4 Eksempel 5: Approximation af binomialfordeling Log-Normal fordelingen Eksempel 6 Uniform fordelingen Eksempel 7 3 R (R Note afsnit 4 ) Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 3 Foråret 2014 9 / 33

Konkrete statistiske fordelinger Der findes en række statistiske fordelinger, som kan bruges til at beskrive og analysere forskellige problemstillinger med Vi betragter nu kontinuerte fordelinger Normal fordelingen Log-Normal fordelingen Uniform fordelingen Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 3 Foråret 2014 10 / 33

0.5 Normalfordeling 0.45 0.4 0.35 Taethed, f(x) 0.3 0.25 0.2 0.15 0.1 0.05 0 5 4 3 2 1 0 1 2 3 4 5 x Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 3 Foråret 2014 11 / 33

Normal fordelingen X N(µ, σ 2 ) tæthedsfunktion: f(x) = 1 σ 2π Middelværdi: µ = µ Varians: σ 2 = σ 2 Tabel 3 for F (x) (x µ) 2 e 2σ 2 Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 3 Foråret 2014 12 / 33

Normalfordeling N(0,1 2 ) 0.45 0.4 0.35 0.3 Taethed, f(x) 0.25 0.2 0.15 0.1 0.05 0 3σ 2σ σ µ 0.05 5 4 3 2 1 0 1 2 3 4 5 x σ 2σ 3σ Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 3 Foråret 2014 13 / 33

Sammenligning af to normalfordelinger med forskellig middelvardi og ens varians 0.45 N(0,1 2 ) N(5,1 2 ) 0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 0.05 5 0 5 10 Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 3 Foråret 2014 14 / 33

Sammenligning af tre normalfordelinger med ens middelvardi og forskellig varians 0.5 0.4 Taethed, f(x) 0.3 0.2 0.1 0 10 8 6 4 2 0 2 4 6 8 10 x Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 3 Foråret 2014 15 / 33

Normal fordelingen En normal fordeling med middelværdi 0 og varians 1, dvs X N(0, 1 2 ) kaldes en standard normal fordeling En vilkårlig normal fordelt variabel Y N(µ, σ 2 ) kan standardiseres ved at beregne X = Y µ σ Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 3 Foråret 2014 16 / 33

Eksempel 1 En vægt har en målefejl, E, der kan beskrives ved en standard normalfordeling, dvs E N(0, 1 2 ) dvs. middelværdi µ = 0 og spredning σ = 1 gram. Vi måler nu vægten af ét emne a) hvad er sandsynligheden for at vægten måler mindst 2 gram for lidt? Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 3 Foråret 2014 17 / 33

Eksempel 1 b) hvad er sandsynligheden for at vægten måler mindst 2 gram for meget? c) hvad er sandsynligheden for at vægten måler højst ±1 gram forkert? Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 3 Foråret 2014 18 / 33

Eksempel 2 Det antages, at blandt en gruppe lærere i folkeskolen, at lønnen kan beskrives ved en normalfordeling med middelværdi µ = 280.000 og spredning σ = 10.000. a) hvad er sandsynligheden for at en tilfældig udvalgt lærer tjener mere end 300.000? Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 3 Foråret 2014 19 / 33

Eksempel 3 Det antages, at blandt en gruppe lærere i folkeskolen, at lønnen kan beskrives ved en normalfordeling med middelværdi µ = 290.000 og spredning σ = 4.000. a) hvad er sandsynligheden for at en tilfældig udvalgt lærer tjener mere end 300.000? Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 3 Foråret 2014 20 / 33

Eksempel 4 Det antages, at blandt en gruppe lærere i folkeskolen, at lønnen kan beskrives ved en normalfordeling med middelværdi µ = 290.000 og spredning σ = 4.000. a) angiv det interval, der dækker over 95% af læreres løn Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 3 Foråret 2014 21 / 33

Eksempel 5: Approximation af binomialfordeling I et dosis-respons forsøg med 80 rotter antages at sandsynligheden for at en rotte overlever forsøget er p = 0.5. a) hvad er sandsynligheden for at højst 30 rotter dør i forsøget? b) hvad er sandsynligheden for at mellem 38 og 42 rotter dør i forsøget? Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 3 Foråret 2014 22 / 33

Log-Normal fordelingen Log-Normal fordelingen X LN(α, β) tæthedsfunktion: { 1 f(x) = β 2π x 1 e (ln(x) α)2 /2β 2 x > 0, β > 0 0 ellers Middelværdi: µ = e α+β2 /2 Varians: σ 2 = e 2α+β2 (e β2 1) Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 3 Foråret 2014 23 / 33

Log-Normal fordelingen Log-Normal fordelingen 0.25 Log Normalfordeling LN(1,1) 0.2 LN(1,1) Taethed, f(x) 0.15 0.1 0.05 0 0 5 10 15 20 25 30 x Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 3 Foråret 2014 24 / 33

Log-Normal fordelingen Log-Normal fordelingen En log-normal fordelt variabel Y LN(α, β), kan transformeres til en standard normal fordelt variabel X ved dvs. X = ln(y ) α β X N(0, 1 2 ) Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 3 Foråret 2014 25 / 33

Log-Normal fordelingen Eksempel 6 Partikelstørrelsen (µm) i et stof kan antages at være Log-Normal fordelt. Vi har observationerne 2.2 3.4 1.6 0.8 2.7 3.3 1.6 2.8 1.9 Vi tager logaritmen af data og får: 0.8 1.2 0.5-0.2 1.0 1.2 0.5 1.0 0.6 Heraf beregnes x = 0.733 og s = 0.44. hvad er andelen af partikler med en størrelse i intervallet [2; 3] Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 3 Foråret 2014 26 / 33

Log-Normal fordelingen Eksempel 6 Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 3 Foråret 2014 27 / 33

Uniform fordelingen Uniform fordelingen X U(α, β) tæthedsfunktion: Middelværdi: µ = α+β 2 Varians: σ 2 = 1 12 (β α)2 f(x) = 1 β α Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 3 Foråret 2014 28 / 33

Uniform fordelingen Uniform fordelingen Uniform fordeling U(4,5) 1 0.8 Taethed, f(x) 0.6 0.4 0.2 0 3.5 4 4.5 5 5.5 x Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 3 Foråret 2014 29 / 33

Uniform fordelingen Eksempel 7 Medarbejdere på en arbejdsplads ankommer mellem klokken 8.00 og 8.30. Det antages, at ankomsttiden kan beskrives ved en uniform fordeling. Hvad er sandsynligheden for at en tilfældig udvalgt medarbejder (Hans) ankommer mellem 8.20 og 8.30? Hvad er sandsynligheden for at en tilfældig udvalgt medarbejder (Martin) ankommer efter 8.30? Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 3 Foråret 2014 30 / 33

R (R Note afsnit 4 ) Oversigt 1 Kontinuerte Stokastiske variable og fordelinger Tæthedsfunktion Fordelingsfunktion Middelværdi af en kontinuert stokastisk variabel Varians af en kontinuert stokastisk variabel 2 Konkrete Statistiske fordelinger Eksempel 1 Eksempel 2 Eksempel 3 Eksempel 4 Eksempel 5: Approximation af binomialfordeling Log-Normal fordelingen Eksempel 6 Uniform fordelingen Eksempel 7 3 R (R Note afsnit 4 ) Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 3 Foråret 2014 31 / 33

R (R Note afsnit 4 ) R (R note afsnit 4) R norm unif lnorm exp Betegnelse Den uniforme fordeling Log-normalfordelingen Exponentialfordelingen Eksempel: d Tæthedsfunktion f(x) (probability density function). p Fordelingsfunktion F (x) (cumulative distribution function). q Fraktil (quantile) i fordeling. r Tilfældige tal fra fordelingen (Forelæsning 10). P (Z 2) pnorm(2) Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 3 Foråret 2014 32 / 33

R (R Note afsnit 4 ) Oversigt 1 Kontinuerte Stokastiske variable og fordelinger Tæthedsfunktion Fordelingsfunktion Middelværdi af en kontinuert stokastisk variabel Varians af en kontinuert stokastisk variabel 2 Konkrete Statistiske fordelinger Eksempel 1 Eksempel 2 Eksempel 3 Eksempel 4 Eksempel 5: Approximation af binomialfordeling Log-Normal fordelingen Eksempel 6 Uniform fordelingen Eksempel 7 3 R (R Note afsnit 4 ) Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 3 Foråret 2014 33 / 33