Uge 9 Teoretisk Statistik 23. februar 24 1. Binomialfordelingen 2. Den hypergeometriske fordeling 3. Poissonfordelingen 4. Den negative binomialfordeling 5. Gammafordelingen Binomialfordelingen X ~ bin(n,p): X = antal "succeser" i n uafhængige forsøg, der alle har samme sandsynlighed p for at ende med succes. 1 hvis succes (ssh. p) X= X1+ + Xn hvorxi = ellers (ssh.1 p) Eksempler: Færdighedsprøve med n spørgsmål. Succes hvis korrekt svar. X = antal rigtige. Forbrugerklager over n varer. Succes hvis der klages. X = antal klager.
(2) Binomialfordelingen Sandsynlighedsfunktion: n n P(X = ) = p (1 p), =,...,n hvor binomialkoefficienten n n! =!(n )! er antal måder man kan udtage elementer blandt n. Middelværdi, E[X] = np; varians var [X] = np( 1 p). Den hypergeometriske fordeling Stikprøve uden tilbagelægning Population bestående af N personer M af disse har særlig egenskab Stikprøve bestående af n personer udtaget uden tilbagelægning (eller på en gang) Lad X være antallet personer blandt de n med den særlige egenskab => X ~ hypgeo(n,m,n).
(2) Den hypergeometriske fordeling Eksempler: X = antal personer der ville stemme på liste A i meningsmåling af størrelse n X = antal røde bolde taget af kasse med røde og sorte bolde. X = antal rigtige i LOTTO (3) Den hypergeometriske fordeling Udfaldsrum givet ved:, n, M, n- N M Punktsandsynligheder ( ) f = P(X= ) = M N M n N n (Husk at n k Middelværdi, er antal måder man kan vælge k elementer ud af n). M EX n ; N [ ] = Varians, [ ] MN MN n var X = n. N N N 1
Eksempel: LOTTO Spil af en enkelt LOTTO-række: N = 36, M =, n =. X = antal rigtige. 29 1 P(X = ) = = =.12 36 83468 29 6 1 P(X = 6) = =.24 36 29 P(X = ) = =.19 36 Eksempel: meningsmåling Antal vælgere, N = 3 Stikprøvestørrelse, n=12 M = antal vælgere der vil stemme liste A. M ukendt. X = antal vælgere i stikprøven der vil stemme liste A. X observeres til 35. Interesseret i M eller p = M/N. Kender kun X. Estimat for p : pˆ = X / n =.29. (Mˆ = 1916). Hvor godt/sikkert er dette estimat? (Kapitel 15)
(2) Eksempel : meningsmåling Antal organisationsmedlemmer, N = 4 Stikprøvestørrelse, n = 2. Strejke? Antagelse M > N/2 = 2 (<=> flertal for strejke) X = = 3, antallet i stikprøven der stemmer for strejke Vurdering : P(X 3 4, M> 2, 2) < P(X 3 4, 2, 2) = 3 = 2 2 2 =.13 4 2 Denne ssh. er så lille at antagelsen må anses for at være forkert. Dvs. vi kan herved komme til at forkaste en sand antagelse (type 1-fejl). Alternativt kunne vi acceptere antagelsen, men så kunne vi derved komme til at undlade at forkaste en forkert antagelse (type 2-fejl). Kun disse to muligheder for fejlslutning foreligger.
Binomial vs. hypergeometrisk Uden tilbagelægning: X ~ hypgeo(n,m,n) Med tilbagelægning: X ~ bin(n,m/n) Varians i hypergeo. mindre end varians i den tilsvarende binom. Endvidere: Hvis N er meget stor (og M tilsvarende stor) så ligner hypergeometriske fordeling binomialfordelingen. Der gælder: M N M n ) n p (1 p) N n n for N hvis M/N p (stikprøvestørrelsen n er konstant). Poissonfordelingen Eksponentialrækken (for λ > ): = λ = λ e.derfor er! f() = λ e! en punktsandsynlighed på {,1,2, }. Hvis X har punktsandsynlighed f siges X at være Poissonfordelt med parameter λ; X ~ Ps(λ). Middelværdi, E[X] = λ; varians, var[x] = λ. λ
(2) Poissonfordelingen Poissonfordelingen er god til at beskrive antal gange en hændelse med meget lille sandsynlighed indtræffer i et stort antal forsøg. Begrundelse: n p (1 p) e λ λ! for n, p således at np λ. (Varians i Poissonfordelingen er λ; varians i binomial er np(1-p); næsten ens for p lille). Den negative binomialfordeling Sandsynlighedsfunktion (for fast k N, p ],1[ ): + k 1 f p (1 p) k 1 k ( ) = Hvis X har punktsandsynlighed f siges X at være negativt binomialfordelt med parametre p og k. Beskriver antal fiaskoer før k'te succes bedre end Poissonford. i situationer med relativt stor ssh. i og relativt tung hale. For k = 1 kaldes f() for kvotientfordelingen eller den geometriske fordeling: f () p(1 p),1,2,... = =
Gammafordelingen, '($,") Udfaldsrum S=],4 [, parametre ",$ >. Tæthed Her er '-funktionen givet ved β α f() = e Γβ ( ) β 1 α så f ()d = 1. Γ = y 1 (y) e d Gammafordeling med formparameter $ og skalaparameter ". (2) Gammafordelingen '-funktionen er defineret på ], 4[ og opfylder: Γ (1) = 1, Γ (1/ 2) = π Γ (y + 1), = y Γ (y), y > Γ (n + 1) = n!, n N 3 1 Γ (n + 1/2) = (n 1/2) π, n N 2 2
(3) Gammafordelingen Hvis X ~ '($,") og c > så er cx ~ '($,c/"). Hvis X ~ '($,") så er [ ] =,varx [ ] = 2 EX β α Specielle Gammafordelinger: '(1,") er lig eksponentialfordelingen med intensitet ". Hvis f = 2$ N: '($,1/2) = P 2 (f) P 2 -fordelingen med f frihedsgrader. β α