Statisti og Sadsylighedsregig STAT apitel 4.4 Test i polyomialfordelige Lad X (X,..., X ) Poly (, p). Observatio: (,..., ) der agiver atal udfald, 2,..., Susae Ditlevse Istitut for Matematise Fag Email: susae@math.u.d http://math.u.d/ susae 7. udervisigsuge, osdag Sadsylighedsvetor: p (p,..., p ) Hus at i hvor i {0,,..., } p i hvor p i [0, ] 2 Statistis model: hvor Lielihoodfutio: (D (), (P p ) p ) ( ) P p (X ) p,...,... p L : D () [0, ] L(, p) ( ) p,..., Maimum lielihoodestimatorere er givet ved ˆp i i for alle i,..., Atag u at vi øser at teste hypotese: H 0 : p p 0, p 2 p 20,..., p p 0 Lidt mere ompat a vi srive: H 0 : p p 0 hvor p og p 0 er -dimesioale vetorer. De alterative hypotese er H A : p p 0 Bemær: Det er o at ogle af p i ere er forsellige fra de tilsvarede p i0 er for at ulhypotese ie gælder. 4
For at teste ulhypotese H 0 mod de alterative hypotese H A beyttes følgede teststørrelse: X 2 ( i p i0 ) 2 p i0 (obs i forv i ) 2 forv i idet EX i p i0 uder hypotese. Hypotese forastes, hvis X 2 er stor. Bemær: store værdier af X 2 er ritise for H 0, og dermed er X 2 et esidet test. Sætig 4. I e polyomialfordelig Poly (, p) gælder uder ulhypotese H 0 : p p 0, hvor p 0 er e edt -dimesioal vetor, at teststørrelse X 2 ( i p i0 ) 2 p i0 er approsimativt χ 2 -fordelt med ( ) frihedsgrader, og dermed a P -værdie (testsadsylighede) baseret på e observeret værdi Xobs 2 approsimativt udreges som ɛ P (X 2 X 2 obs) P (χ 2 X 2 obs) 5 6 Tommelfigerregel: F χ 2() F χ 2() 0.0 0.2 0.4 0.6 0.8.0 0 2 4 6 8 f f 2 f f 4 f 5 f 0 0.0 0.2 0.4 0.6 0.8.0 0 2 4 6 8 f f 2 f f 4 f 5 f 0 Approsimatioe a avedes år følgede betigelser begge er opfyldt:. p i0 for alle ategorier i,...,. 2. p i0 5 for midst 80% af ategoriere i,...,. Der er altså tale om et asymptotis resultat: Fordelige af X 2 uder H 0 overgerer mod e χ 2 -fordelig år atallet af observatioer voser mod. 7 8
Esempel 4.9. Svampesporer i boliger Jauar 4 Maj 0 September 5 Februar 26 Jui 7 Otober 7 Marts Juli 0 November 4 April 2 August 20 December 8 I alt 79 Vi atager at atallet af sporer i de i te måed, i,..., 2, er Polyomialfordelt. svampesporer 0 5 0 5 20 25 Vi øser at udersøge om svampeforeomste ædrer sig heover året. For at udersøge dette atager vi at der ie er e effet heover året, dvs ulhypotese er H 0 : p p 2 p 2 2 Ja Mar Maj Juli Sep Nov Ò Ø º Ì Ø ½ 9 0 Ì Ð º Ö Ò Ò X 2 ÓÖ ÝÔÓØ Ò ÓÑ Ð Ð ÓÖ Ð Ò Ú ÑÔ ÔÓÖ Ö Ô Ö Ø ÑÒ Ö ÑÔ Ð º½ º ÅÒ ÒØ Ð ÓÖÚº ÒØ Ð X 2 ¹ Ö i N i p i0 (N i p i0 ) 2 /(p i0 ) ÒÙ Ö ½ ½ º ¾ ¼º¼ ÖÙ Ö ¾ ½ º ¾ º¾ Ñ ÖØ ½ ½ º ¾ ¼º¼ ÔÖ Ð ½¾ ½ º ¾ ¼º ¼ Ñ ½¼ ½ º ¾ ½º ¾½ ÙÒ ½ ½ º ¾ ¼º¾ ½ ÙÐ ½¼ ½ º ¾ ½º ¾½ Ù Ù Ø ¾¼ ½ º ¾ ½º ¾ ÔØ Ñ Ö ½ ½ º ¾ ¼º¼¼¼ Ó ØÓ Ö ½ ½ º ¾ ¼º¾ ½ ÒÓÚ Ñ Ö ½ ½ º ¾ ¼º¼ Ñ Ö ½ º ¾ º¾¼ Á ÐØ ½ ½ º¼ X 2 ½ º 0.0 0.2 0.4 0.6 0.8.0 F χ 2() med frihedsgrader F χ 2(9.68) 0.95 F χ 2(24.72) 0.99 0 5 0 5 20 25 0 ÑÔ Ð º¾¼º ËÚ ÑÔ ÔÓÖ Ö ÓÐ Ö ÓÖØ Øµº Ì Ð º Ú Ö Ù Ö Ò¹ Ò ÓÖÚ ÒØ ÒØ Ð p i0 Ó Ö Ò (Ó i ÓÖÚ i ) 2 / ÓÖÚ i Ø Ð X 2 ÓÑ Ø Ð 2 2
F χ 2() med frihedsgrader F χ 2() med frihedsgrader 0.0 0.2 0.4 0.6 0.8.0 F χ 2(9.68) 0.05 F χ 2(24.72) 0.0 0.0 0.2 0.4 0.6 0.8.0 F χ 2(7.76) 0.087 F χ 2(9.68) 0.05 F χ 2(24.72) 0.0 0 5 0 5 20 25 0 0 5 0 5 20 25 0 4 I Maple a fratiler og p-værdier slås op: > restart, with(statistics); Her agives 95% vatile i χ 2 -fordelige med frihedsgrader: Quatile(ChiSquare(),.95, umeric); 9.675758 Det betyder at P (X 9.675) 0.95, hvis X følger e χ 2 -fordelig med frihedsgrader. På samme måde a vi fide adre vatiler: > Quatile(ChiSquare(),.99, umeric); 9.675758 > Quatile(ChiSquare(),.999, umeric);.2646 P -værdie -fordeligsfutioe i de beregede teststørrelse: > -CDF(ChiSquare(), 7.76, umeric); 0.087990 På samme måde a vi slå vatilere i ormalfordelige op, her 97.5% og 99.5%: > Quatile(Normal(0, ),.975, umeric);.95996985 > Quatile(Normal(0, ),.995, umeric); 2.57582904 Hvis vi øser at fide P-værdie i esempel 4.8: Nedarvig hos fluer, sriver vi: > Y : (46-.5-76*.25)/sqrt((76*.25)*(-.25)); 0.26488 > 2*(-CDF(Normal(0, ), Y, umeric)); 0.794002680 5
Hypotese H : p p (0) (edt). Kvotietteststørrelse er Test i Polyomialfordelige Q() L(, p(0) ) L(, ˆp) Vi har lige geemgået hvorda ma a teste med X 2 teststørrelse, også aldet Pearso-testet. Vi a også teste ved vores stadardmetode i lielihood-teorie, emlig votietteststørrelse, også aldet lielihood ratio testet. (,..., ) (p i0) i (,..., ) (ˆp i) i ( ) i pi0 ˆp i ( ) i pi0 i / 7 8 Testsadsylighed ɛ() { D m():q( ) Q()} ( ),..., (p i0 ) i Approsimatio år p i0 > 0 for i,..., og er stor: ɛ() F χ 2 ( 2 log Q()) Approsimatioe til ɛ() atages at gælde, hvis p i0 5 for i,...,. Esempel: Svampesporer i boliger Nulhypotese er Vi får Q() H 0 : p p 2 p 2 2 ( 79 2 ( ) i pi0 i / ( ) i /2 i /79 ) 79 ( ) i 0.00085 i Bemær: 2 log(q()) 7.9 7.76 X 2 9 20
F χ 2() med frihedsgrader Lad os fide P -værdie for votietteststørrelse: > -CDF(ChiSquare(), 7.8506, umeric); 0.02594854 Testsadsylighede er altså lidt større her, me dog meget tæt på testsadsylighede fra Pearso-teststørrelse. 0.0 0.2 0.4 0.6 0.8.0 F χ 2(7.9) 0.025 F χ 2(7.76) 0.087 F χ 2(9.68) 0.05 0 5 0 5 20 25 0 F χ 2(24.72) 0.0 2 22 Esempel: Medels ærter Fæotyper hos ade geeratios ærtefrø Fæotype Atal Hyppighed Gul, glat 5 56.7% Gul, ryet 0 8.2% Grø, glat 08 9.4% Grø, ryet 2 5.8% Ialt 556 00.% Forhold mellem fæotyper uder Medels hypotese: (gule, glatte) : (gule, ryede) : (grøe, glatte) : (grøe, ryede) 9 : : : Hvis Medels arvelighedsregler gælder er ( 9 (p, p 2, p, p 4 ),,, ) (0.56, 0.9, 0.9, 0.06) Statistis model med lielihoodfutio (D 4 (556), (P p ) p 4 ) L : D 4 (556) 4 [0, ] ( ) 556 L(, p) p,...,... p4 4 4 ( 9 H : p,,, ) 2 24
Kvotietteststørrelse Vi får følgede maimum lielihood estimater (ˆp, ˆp 2, ˆp, ˆp 4 ) Var(ˆp s ) ( 5 556, 0 556, 08 556, 2 ) (0.567, 0.82, 0.94, 0.058) 556 0.567( 0.567) 556 sˆps 0.00044 0.02 0.00044 Q() Q(5, 0, 08, 2) ( 556 9 5 0.788 )5( 556 0 )0( 556 08 2 log Q() 2 log Q(5, 0, 08, 2) 0.475 ɛ() F χ 2 (0.475) 0.924 )08( 556 )2 2 Approsimatio OK: 556 p i0 556 5, i,..., 4 25 26 Pearso-teststørrelse X 2 (5, 0, 08, 2) 9 (5 556 )2 556 9 + (0 556 )2 556 (08 556 + )2 (2 556 556 + )2 556 0.470 ( 2 log Q() 0.475 ) ɛ() F χ 2 (0.470) 0.925 Fortolig? Forsøget beræfter Medels hypotese. 27