1 Uge 15 Teoretisk Statistik, 5. april 004 1. Store tals lov Eksempel: møtkast Koverges i sadsylighed Tchebychevs ulighed Sætig: Store tals lov. De cetrale græseværdisætig 3. Approksimatio af sadsyligheder med N-sadsyligheder Eksempel: Møtkast Lad h være de relative hypighed af "kroe" efter kast: h atal gage kroe sker i første kast = Store tals lov (STL): h kovergerer mod P(kroe)=0.5. h er e stok. var. så det er ikke "almidelig" koverges. F.eks.: Vi kue i pricippet blive ved med at slå plat, svarede til h = 0 for alle. Me P(h = 0) = 0.5 0 for. Hvilke slags koverges?
() Eksempel: Møtkast Et aturligt kovergesbegreb er koverges med ssh. 1: P(h 0.5) = 1 Dette er desværre for matematisk kompliceret at arbejde med! I stedet arbejder ma med koverges i sadsylighed: P( h 0.5 ε) 1, for ethvert ε > 0. Vi skriver h 0. 5 og siger at h kovergerer mod 0.5 i sadsylighed. P (3) Eksempel: Møtkast Hvis vi defierer X i 1hviskroeikasti = 0hvisplatikasti så er X 1,,X uafhægige stokastiske variable: X i ~ bi(1,0.5). Specielt er µ = E[X i ] = 0.5. Og h atal kroe i første kast X + + X = = så resultatet fra før ka skrives P X µ 1 = X
3 Koverges i sadsylighed Følge af stokastiske variable Y 1,Y Tæk blot på situatioe med uafhægige, idetisk fordelte stokastiske variable X 1,X, og Y = (X 1 + + X )/, me variablee kue også være oget helt adet. Defiitio: Y kovergerer i sadsylighed mod a: der for ethvert ε > 0 gælder: P( Y a ε) 1, P Y a, hvis Store Tals Lov Lad X 1,X, være e følge af uafhægige, idetisk fordelte variable med middelværdi µ. Geemsit af de første variable: X = X + + X 1 Store Tals Lov: X kovergerer i sadsylighed mod µ: P X µ
4 Tchebychevs ulighed Hvis X har middelværdi µ og varias σ, så er [ ] var X E[(X ) ] (x ) f(x)dx = µ + x µ >ε µ x µ ε σ = = µ = µ (x ) f(x)dx (x ) f(x)dx x µ >ε ε f(x)dx=ε P( X µ >ε) σ P( X µ >ε) ε der kaldes Tchebychevs ulighed (TU) (og som også gælder for diskrete variable). Middelværdi og varias siger e hel del om fordelige af e stokastisk variabel. Sadsylighede er højest σ / ε for at e stokastisk variabel atager e værdi, hvis afstad fra middelværdie er større ed ε ( > 0). Eksempler vedr. Tchebychevs ulighed Eksempel (1) : X = atal terigkast til 6'er sker (se uge 7 II ). x 1 f(x) = p(1 p) x= 1,,..., hvor p = 1/6. X med dee puktsadsylighed siges at være geometrisk fordelt (GF) med E[X] = 1/p = 6 og var[x] = (1 - p)/p = 30.
5 30/36 5/ 6 0.83 ved TU P( X 6 6) = = x 1 11 = x = 1(5/ 6) (1/ 6) = (5/ 6) = 0.14 ved GF. Eksempel () : X = levetid for el-pære. Det atages at X ex( λ ) med E[X] = 1/ λ= 1 og var[x] = 1/ λ = 1. X 1 ) 1/4 = 0.5 ved TU P( = t e dt = [ t e ] = 3 e = 3 3 0.05 ved ex.ford. Bevis for Store Tals Lov Atag at X 1,X, har varias σ (STL gælder faktisk også for variable, hvor variase ikke eksisterer). Så er Dermed: E[X ] =µ, var[x ] =σ / eller σ P( X µ >ε) 0 for ε P( X µ ε ) = 1 P( X µ >ε) 1,
6 Store Tals Lov for hyppigheder Uafhægige getagelser af et eksperimet hvor hædelse A ete idtræffer eller ikke idtræffer. Lad X i 1 hvis A idtræffer i i'te getagelse = 0 ellers Så er X 1,X, uafhægige idetisk fordelte med E[X i ] = 1 P(A) + 0 P(A c ) = P(A), så store tals lov giver at X1+ + X Relativ hyppighed af A = h (A) = P(A) for. Teoretisk Statistik, 5. april 004 1. Store tals lov. De cetrale græseværdisætig 3. Approksimatio af sadsyligheder med N-sadsyligheder
7 De cetrale græseværdisætig Store Tals lov siger at ok. Me hvad er fordelige af Hvis X ere er ormalfordelt, er situatioer? X ærmer sig E[X i ] = µ år bliver stor X,år er stor? X det også. Hvad med adre Det viser sig at X er asymptotisk ormalfordelt, dvs. at fordelige på e bestemt måde ka approksimeres med N(µ,σ /) uaset hvad fordelige af X ere er! Dette er meget bekvemt, fordi det gør det emt at berege (approksimative) sadsyligheder om X og adre størrelser. () De cetrale græseværdisætig Lad ige X 1,X,, være uafhægige, idetisk fordelte variable med mv. µ og var. σ. Husk at (X µ ) Z = σ E[X ] =µ og var[x ] =σ / så har mv. 0 og var. 1. Vi ka approksimere ford. af Z med N(0,1): (X µ ) Φ σ P u (u), Dette resultat kaldes de cetrale græseværdisætig.
8 (3) De cetrale græseværdisætig Approksimatio: P(X x) = Φ = P U (x µ ) σ ( x µ ) σ σ σ = P µ+ U x X =µ+ U~ N( µ, σ Ma ka altså approksimere ford. af stor. /) X med N(µ,σ /), år er (4) Eksempel: Møtkast Husk at h atal kroe i første kast X + + X = = 1 = X hvor X i 'ere var 0/1-variable; E[X i ] = 0.5, var[x i ] = 0.5. h = X ka atage værdiere 0,1/,/,,1, me de cetrale græseværdisætig siger at fordelige ka approksimeres med N(0.5, 0.5), år er stor ok.
9 Teoretisk Statistik, 5. april 004 1. Store tals lov. De cetrale græseværdisætig 3. Approksimatio af sadsyligheder med N-sadsyligheder Approksimatio af biomialsadsyligheder Approksimatio af Poissosadsyligheder Approksimatio af hypergeometriske sadsyligheder Approksimatio af ssh.'er med N-sadsyligheder På grud af de cetrale græseværdisætig ka mage fordeliger approksimeres med ormalfordeliger. De følgede approksimatioer var vigtigere i gamle dage, dvs. før vi alle havde adgag til SAS (eller ligede). Me det vil ofte være såda at vi ikke keder de eksakte fordelig af e estimator (f.eks.), me ka vise at de approksimeres godt af e ormalfordelig! Edu e helt særlig egeskab for ormalfordelige!
10 Approksimatio af biomialsadsyligheder Lad X ~ bi(,p). Atag at X = I 1 + +I hvor I 1,,I er uafhægige og idetisk fordelte 0/1-variable med P(I i = 1) = p. Specielt er E[I i ] = p og var[i i ] = p(1-p). Derfor fås: x x/ p x p P(X x) = P I Φ =Φ p1 ( p )/ p(1 p dvs. vi ka approksimere bi(,p) med N (p,p(1 p)), år er stor! () Approksimatio af biomialsadsyligheder Approksimerer e diskret fordelig med e kotiuert. Puktet x svarer i e vis forstad til hele itervallet [x 0.5, x + 0.5]. At X x (x ) svarer derfor til at de tilhørede ormalfordelte approksimatio er højst x + 0.5. Derfor er følgede approksimatio bedre: x+ 0.5 p P(X x) Φ p(1 p) Tommelfigerregel: Approksimatio god, år p 5.
11 (3) Approksimatio af biomialsadsyligheder Atag at X ~ bi(0, 0.). Så er for eksempel P(3 X 6) = P(X 6) P(X ) 6+ 0.5 4 + 0.5 4 Φ Φ 0 0. 0.8 0 0. 0.8 = 0.919 0.01 = 0.718 Sade værdier: P(3 X 6) = P( > X 6) = P(X 6) P(X ) = 0.913 0.06 = 0.707 Approksimatio af biomialfraktiler Atag at vi vil fide 97.5%-fraktile i e bi(0,0.)-fordelig, dvs. fide x så P(X x) = 0.975. Approksimativt: x + 0.5 4 x 3.5 0.975 = P(X x) Φ =Φ 0 0. 0.8 1.789 x 3.5 1 Φ (0.975) = 1.96 x = 7.0 1.789 Sade værdier: P(X 7) = 0.968 og P(X 8) = 0.990.
1 Approksimatio af Poissosadsyligheder Lad X ~ Ps(λ). Ma ka vise at Ps(λ) for store værdier af λ ka approksimeres med N(λ,λ): X λ x λ x λ P(X x) = Φ λ λ λ Som før bliver approksimatio bedre, hvis vi korrigerer med 0.5: x+ 0.5 λ P(X x) Φ λ Tommelfigerregel: Approksimatioe er god, år λ >9. () Approksimatio af Poissosadsyligheder Atag at X ~ Ps(1). Så er 7+ 0.5 1 P(X > 7) = 1 P(X 7) 1 Φ = 1 0.097 = 0.903 1 Sad værdi: P(X > 7) = 1 P(X 7) = 1 0.090 = 0.910
13 Approksimatio af hypergeometriske sadsyligheder Hvis X ~ hypgeo (N,M,) så er M M N M N E[X] =, var[x] = N N N N 1 og hypgeo-sadsylighedere ka approksimeres ved ormalfordeligssadsyligheder : x+ 0.5 M/N P(X x) Φ MN MN N N N 1 3 exempler på avedelse af ormalfordeligsapproximatioe Eksempel 1 :størrelse af lager Givet: (1) Butik med e expediet har åbet 5 timer pr. uge () Gem. atal solgte eheder pr. uge er 15 stk. (3) I hvert salg som tager 15 mi. sælges ku et stk. (4) Lageret suppleres op hver madag morge. Krav : Ku i e uge ud af 100 må lageret slippe op ide uges udgag. Def. : r = miimumslager, der uder de 4 betigelser tilfredsstiller kravet. Spørgsmål : Hvad er r`s værdi? Def. : X = atal solgte eheder pr. uge Atag : X~ bi(= 4 5= 08, p= p/= 15/08= 0.07). For r gælder at 08 x=r+1 ( ) f x 08,0.07 0.01 1-F(r) 0.01 F(r) 0.99
For at bestemme r beyttes ormalfordeligsapproximatioe til biomialfordelige. Vi får σ = p(1 p) = 15 (1 0.07) = 13.91 <=> σ = 3.7307 og r +0.5 15 F(r 08,0.07) Φ 0.99 3.7307 hvoraf r 14.5 1 Φ ( 0.99) =.36 3.7307 <=> r 14.5 + 3.7307.36 = 3.18 4 14 Eksempel (): HT`s busser Givet: HT`s busser. Spørgsmål: Hvor mage mekaikere skal HT have asat, år ma kræver at sadsylighede skal være midst 95% for at der er e mekaiker rede til straks at reparere e sammebrudt motor? X : atal motorsammebrud pr. dag Atagelse: X~ Ps(λ) med λ= 5 sammebrud pr. dag Lad k være det midste atal mekaikere der tilfredsstiller kravet, dvs. λ k+1/-λ x=0 x! λ k x -λ P X k λ=5 = F k λ=5 = e Φ 0.95 ( ) ( ) ( ) -1 k+1/ - λ λ Φ 0.95 = 1.645 λ k λ -1/+1.645 λ = 3.73 33
15 Eksempel (3): meigsmålig (se uge 9) Atal orgaisatiosmedlemmer, N = 400 Stikprøvestørrelse: = 0. Strejke? Atagelse: M > N/ = 00 (<=> flertal for strejke) X = x = 3: atallet i stikprøve der stemmer for strejke Vurderig af resultatet af stikprøveudersøgelse : Til brug herfor øskes sadsylighede P(X 3 400, M> 00, 0) bereget. De ka imidlertid ikke bestemmes, medmidre M sættes lig e fast talværdi. Vi vælger da at sætte M=00, således at de ssh. vi bereger, er større ed de øskede P(X 3 400, M> 00, 0) < P(X 3 400, 00, 0) = 3 x= 0 00 00 x 0 x = 0.0013 400 0 Har ma ikke e tabel over de hypergeometriske fordelig med parametree N= 400, M= 00 og = 0 ka i stedet ormalfordeligsapproximatioe beyttes:
P 1 00 3+ 0 Φ 400 00 00 400 0 0 1 400 400 400 1 ( X 400, 00, 0) 6.5 =Φ =Φ(.979) = 0.0014 4.76 altså æste øjagtig det samme som tidligere. Dee ssh. er så lille, at atagelse må ases for at være forkert. Dvs. vi ka herved komme til at forkaste e sad atagelse (type 1-fejl). Alterativt kue vi acceptere atagelse, me så kue vi derved komme til at udlade at forkaste e forkert atagelse (type -fejl). 16