Kursus 02402 Introduktion til Statistik Forelæsning 4: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik Bygning 305/324 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbb@imm.dtu.dk Oversigt 1 Intro 2 Eksempel 1 Eksempel 2 Eksempel 3 3 Regneregler for stokastiske variable Eksempel 4 Eksempel 5 Eksempel 6 Eksempel 7 Eksempel 8 4 5 Normalplot 6 R (R Note afsnit 5 ) Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 4 Foråret 2013 1 / 37 Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 4 Foråret 2013 2 / 37 Nogle anvendte fordelinger Intro (Både kontinuerte og diskerete) Diskrete: Binomial fordelingen Den hypergeometriske fordeling Poisson fordelingen Kontinuerte: Normal fordelingen Log-Normal fordelingen Uniform fordelingen { 1 f(x) = β e x/β x > 0, β > 0 0 ellers Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 4 Foråret 2013 4 / 37 Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 4 Foråret 2013 6 / 37
Eksponentialfordelingen Sammenhæng mellem Eksponential og Poisson fordelingen er et special tilfælde af Gamma fordelingen anvendes f.eks. til at beskrive levetider og ventetider kan bruges til at beskrive (vente)tiden mellem hændelser i poisson fordelingen Middelværdi µ = β Varians σ 2 = β 2 t 1 t2 Poisson: Diskrete hændelser pr. enhed Eksponential: Kontinuert afstand mellem hændelser tid t Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 4 Foråret 2013 7 / 37 Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 4 Foråret 2013 8 / 37 Taethed, f(x) Eksponential fordeling med β=1 1 0.8 EXP(1) 0.6 Eksempel 1 Eksempel 1 Tiden mellem kundeankomster på et posthus er eksponential fordelt med middelværdi µ = 2 minutter. En kunde er netop ankommet. Hvad er sandsynligheden for at der ikke kommer flere kunder indefor en periode på 2 minutter? 0.4 0.2 0 1 0 1 2 3 4 5 6 7 8 9 10 x Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 4 Foråret 2013 9 / 37 Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 4 Foråret 2013 10 / 37
Eksempel 1 Eksempel 2 Eksempel 1 Eksempel 2 tæthed 0.0 0.1 0.2 0.3 0.4 0.5 exp(2) Tiden mellem kundeankomster på et posthus er eksponential fordelt med middelværdi µ = 2 minutter. En kunde er netop ankommet. Beregn sandsynligheden for at der ikke kommer flere kunder indefor en periode på 2 minutter vha. Poissonfordelingen 0 2 4 6 8 x Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 4 Foråret 2013 11 / 37 Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 4 Foråret 2013 12 / 37 Eksempel 3 Eksempel 3 Eksempel 3 Eksempel 3 Tiden mellem kundeankomster på et posthus er eksponential fordelt med middelværdi µ = 2 minutter. Vi betragter nu en periode på 10 minutter Beregn sandynligheden for at der ikke kommer nogen kunder i perioden vha. Poissonfordelingen Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 4 Foråret 2013 13 / 37 Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 4 Foråret 2013 14 / 37
Regneregler for stokastiske variable Regneregler for stokastiske variable (Gælder BÅDE kontinuert og diskret) Vi antager at a og b er konstanter og X er en stokastisk variabel. Da gælder Regneregler for stokastiske variable Eksempel 4 Eksempel 4 En stokastisk variabel X har middelværdi 4 og varians 6. Beregn middelværdi og varians for Y = 3X + 2 E(aX + b) = ae(x) + b V ar(ax + b) = a 2 V ar(x) Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 4 Foråret 2013 16 / 37 Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 4 Foråret 2013 17 / 37 Regneregler for stokastiske variable Eksempel 4 Regneregler for stokastiske variable Følgende linear kombinationer gælder: E(a 1 X 1 + a 2 X 2 +.. + a n X n ) = a 1 E(X 1 ) + a 2 E(X 2 ) +.. + a n E(X n ) Eksempel 5 Regneregler for stokastiske variable Eksempel 5 Vægten af passagerer på en flystrækning antages normalfordelt X N(70, 10 2 ). Et fly, der kan tage 55 passagerer, må max. lastes med 4000 kg (kun passageres vægt betragtes som last). V ar(a 1 X 1 + a 2 X 2 +.. + a n X n ) = a 2 1V ar(x 1 ) +.. + a 2 nv ar(x n ) Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 4 Foråret 2013 18 / 37 Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 4 Foråret 2013 19 / 37 Beregn sandsynligheden for at flyet bliver overlastet
Eksempel 5 Regneregler for stokastiske variable Eksempel 5 Eksempel 6 Regneregler for stokastiske variable Eksempel 6 En færge medtager X passagerer. Det oplyses, at E[X] = 400 og V ar[x] = 40 2 og at X er normalfordelt. Færgeselskabet har en fortjeneste på 120 kr. pr. passager Beregn middelværdi og varians for færgeselskabets fortjeneste, og beregn sandsynligheden for at fortjenesten vil overstige 50.000 kr. Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 4 Foråret 2013 20 / 37 Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 4 Foråret 2013 21 / 37 Eksempel 6 Regneregler for stokastiske variable Eksempel 6 Eksempel 7 Regneregler for stokastiske variable Eksempel 7 Antag, at æg sælges i pakker á 144 æg. Sandsynligheden for at et tilfældig udvalgt æg er salmonella inficeret antages at være 5%. Et firma, der producerer fødevarer, indkøber nu 100 pakker æg. Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 4 Foråret 2013 22 / 37 Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 4 Foråret 2013 23 / 37
Eksempel 7 Regneregler for stokastiske variable Eksempel 7 Eksempel 8 Regneregler for stokastiske variable Eksempel 8 Antag, at du vil købe noget sand, da du vil lave en ny indkørsel til dit hus. Det er specielt vigtigt for dig, at der ikke er sten blandet i sandet. Producenten lover, at der i gennemsnit kun er 0.5 sten pr. m 3. Du køber nu 10 m 3 sand og erfarer, at der er 11 sten i blandingen. Føler du dig snydt af producentens løfte om at der kun er 0.5 sten pr. m 3? Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 4 Foråret 2013 24 / 37 Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 4 Foråret 2013 25 / 37 - Før 50 45 40 Såfremt data afviger fra at være normal fordelt, kan man ofte med fordel transformere data, således at de transformerede data kan antages at være normal fordelt. 35 30 25 20 15 10 5 0 0 10 20 30 40 50 60 70 Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 4 Foråret 2013 27 / 37 Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 4 Foråret 2013 28 / 37
- Efter Hyppigt anvendte transformationer 25 20 15 10 5 Gør store værdier mindre: 1 x ln x x 1/4 x Gør store værdier større: x 2 x 3 0 0.5 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 4 Foråret 2013 29 / 37 Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 4 Foråret 2013 30 / 37 Normalplot Normalplot Ofte vil man udføre statistiske analyser på de transformerede data, såfremt det viser sig, at de transformerede data er pænere, f.eks. mere symmetriske. Man kan kontrollere/undersøg om data ser ud til at være normalfordelt: Plotte histogram Lave box plots Lave et normalplot: En direkte sammenligning med normalfordelingen Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 4 Foråret 2013 31 / 37 Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 4 Foråret 2013 33 / 37
Normalplot Normalplot R (R Note afsnit 5 ) R (R note 5) R Betegnelse norm Normalfordelingen unif Den uniforme fordeling lnorm Log-normalfordelingen exp Exponentialfordelingen Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 4 Foråret 2013 34 / 37 d Tæthedsfunktion f(x) (probability distribution). p Fordelingsfunktion F (x) (cumulative distribution function). q Fraktil (quantile) i fordeling. r Tilfældige tal fra fordelingen (Forelæsning 10). Eksempel: P (X 2), X Exp(3) pexp(2,1/3) Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 4 Foråret 2013 36 / 37 R (R Note afsnit 5 ) Oversigt 1 Intro 2 Eksempel 1 Eksempel 2 Eksempel 3 3 Regneregler for stokastiske variable Eksempel 4 Eksempel 5 Eksempel 6 Eksempel 7 Eksempel 8 4 5 Normalplot 6 R (R Note afsnit 5 ) Per Bruun Brockhoff (pbb@imm.dtu.dk) Introduktion til Statistik, Forelæsning 4 Foråret 2013 37 / 37