Statistik og Sandsynlighedsregning 1 MS kapitel 3 Susanne Ditlevsen Institut for Matematiske Fag Email: susanne@math.ku.dk http://math.ku.dk/ susanne Definition 3.2.1 Lad X 1, X 2,..., X n være uafhængige stokastiske variable med værdier i {0, 1}, som alle har samme fordeling givet ved P (X i 1 p, P (X i 0 1 p for et givet tal p mellem 0 og 1. Fordelingen af summen: S X 1 + X 2 + + X n kaldes binomialfordelingen med antalsparameter n og sandsynlighedsparameter p. 3. undervisningsuge, mandag Bemærk at S {0, 1,..., n}. 1 2 E.: En mønt kastes n gange. Antallet af kast med udfaldet krone er binomialfordelt med antalsparameter n og sandsynlighedsparameter p 1/2. Lad os finde fordelingen af S - eller hvad der er det samme - sandsynlighedsfunktionen for binomialfordelingen. Lad os først finde sandsynlighedsfunktionen for den stokastiske vektor (X 1,..., X n. Den er koncentreret på mængden {0, 1} n. Først bemærkes det at for alle i 1,..., n er P (X i i p i (1 p 1 i for i {0, 1}. Da X 1,..., X n er uafhængige får vi P (X 1 1,..., X n n P (X 1 1 P (X n n p 1++n (1 p n (1++n 3 4
Definer funktionen t( 1,..., n 1 + + n. Vi skal finde fordelingen af den stokastiske variable S t(x 1,..., X n. (Husk transformationssætningen for fordelinger, s.48 49!. For s {0, 1,..., n} er P (S s P (t(x 1,..., X n s P ((X 1,..., X n t 1 ({s} P ((X 1,..., X n ( 1,..., n ( 1,..., n t 1 ({s} ( 1,..., n t 1 ({s} p s (1 p n s #t 1 ({s} p s (1 p n s Sætning 3.2.3 s sandsynlighedsfunktion er givet ved p( p (1 p n for {0, 1,..., n}. 5 6 med n 10 og p 0.1 med n 100 og p 0.4 0.0 0.1 0.2 0.3 0.4 0.00 0.02 0.04 0.06 0.08 0 20 40 60 80 100 7 8
E.: En studerende skal til en skriftlig eksamen der består af 20 spørgsmål med 3 svarmuligheder hver. For at bestå skal mindst 15 spørgsmål være korrekt besvaret. Hvad er sandsynligheden for at få 15 korrekte svar, hvis der svares helt tilfældigt? Svar: Antallet af korrekte svar er binomialfordelt med antalsparameter n 20 og sandsynlighedsparameter p 1/3. Sandsynligheden er således: P (X 15 ( 20 15 ( 15 ( 20 15 1 2 0.000142 3 3 Tilsvarende fås: P (X 16 P (X 17 P (X 18 P (X 19 P (X 20 ( ( 16 ( 4 20 1 2 0.00002223252 16 3 3 ( ( 17 ( 3 20 1 2 0.00000261559 17 3 3 ( ( 18 ( 2 20 1 2 0.00000021797 18 3 3 ( ( 19 ( 1 20 1 2 0.00000001147 19 3 3 ( ( 20 20 1 0.00000000029 20 3 9 10 med n 20 og p 0.33 Endelig får vi at sandsynligheden for at bestå hvis man svarer helt tilfældigt er P (X 15 20 j15 P (X j 0.000167 0.00 0.05 0.10 0.15 0 5 10 15 20 11 12
Den Hypergeometriske Fordeling Den hypergeometriske fordelings punktsandsynligheder er givet ved Sætning 3.2.6 Lad S 1 og S 2 være uafhængige stokastiske variable, hvor S i er binomialfordelt med antalsparameter n i og sandsynlighedsparameter p, i 1, 2. Da er S 1 + S 2 binomialfordelt med antalsparameter n 1 + n 2 og sandsynlighedsparameter p. P (X ( R N R ( n ( N n R ( (N R (n N (n hvis (n (N R 0 R, og ellers er P (X 0. 13 14 Hypergeometrisk fordeling - eksempel 13 kort trækkes tilfældigt fra et spil kort. Hypergeometrisk fordeling - eksempel Hvad nu hvis man vil regne den samme sandsynlighed ud for makkeren i bridge - og man selv har 1 spar på hånden? Spørgsmål: Hvad er sandsynligheden for at netop 7 af dem er spar? Svar: Punktsandsynligheden i punktet 7 for den hypergeometriske fordeling med parametre N 52, R 13 og n 13: P (X 7 ( R N R 7( n 7 ( N n ( 13 7 ( 39 6 ( 52 13 ( 13 13 (7 39 (6 0.00882 7 52 (13 Spørgsmål: Hvad er sandsynligheden for at makkeren har netop 7 spar? Svar: Punktsandsynligheden i punktet 7 for den hypergeometriske fordeling med parametre N 39, R 12 og n 13: P (X 7 ( R N R 7( n 7 ( N n ( 12 7 ( 27 6 ( 39 13 ( 12 12 (7 27 (6 0.0289 7 39 (13 15 16
Hypergeometrisk fordeling - mange kugler En kasse indeholder 1000 røde og 2000 hvide kugler. 5 kugler udtages. Hvad er sandsynligheden for at netop 2 af disse er røde? ( 5 P (X 2 1000(2 2000 (3 2 3000 (5 10 (1000 999 (2000 1999 1998 3000 2999 2998 2997 2996 P (X 2 10 10002 2000 3 3000 2 3000 3 10 ( 1 3 0.3295 2 ( 3 2 0.3292 3 Dette er netop sandsynligheden for udfaldet S 2, når S er binomialfordelt med antalsparameter 5 og sandsynlighedsparameter 1/3. Hypergeometrisk fordeling - mange kugler Sætning 3.3.4 Lad X være hypergeometrisk fordelt med parametre N, R og n. Hvis stikprøvestørrelsen n holdes fast, mens parametrene N og R går imod uendelig på en sådan måde, at R/N konvergerer mod et tal p (0, 1, vil P (X p (1 p n 17 18 Hypergeometrisk fordeling - mange kugler Bevis: P (X R( (N R (n N (n (R (R + 1 (N R (N R (n + 1 N (N 1 (N + 1 (N (N n + 1 ( [( ( ( ] n R R 1 R + 1 N N 1 N + 1 }{{} a( [( ( ( ] N R N R 1 N R (n + 1 N N 1 N n + 1 }{{} b( a( ( ( ( R R 1 R + 1 N N 1 N + 1 ( ( ( ( ( R R N R 1 R N R + 1 N N R N 1 N R N + 1 ( [( ( ( ] R 1 R 1 1 2R 1 1 ( 1R 1 N 1 N 1 1 2N 1 1 ( 1N 1 ( R p N når R, N og R/N p, hvor P (0, 1. 19 20
Hypergeometrisk fordeling - mange kugler På tilsvarende vis b( ( ( ( N R N R 1 N R (n + 1 N N 1 N n + 1 N R N [( ( ( ] 1 1 (N R 1 1 (n 1(N R 1 1 N 1 1 ( + 1N 1 1 (n 1N 1 (1 p n når R, N og R/N p, hvor P (0, 1. Hypergeometrisk fordeling - mange kugler Endeligt fås P (X a( b( p (1 p n Dvs den hypergeometriske fordeling konvergerer mod en binomialfordeling når R, N og R/N p, hvor P (0, 1. Det var det vi ville vise. 21 22 med n 10 og p 0.33 med n 10 og p 0.33 N10 N20 N100 N1000 23 24
med n 10 og p 0.33 N10 N20 N100 N1000 25 med n 10 og p 0.33 N10 N20 N100 N1000 26 med n 10 og p 0.33 N10 N20 N100 N1000 27