E6 efteå 999 Notat 20 Jøgen Lasen 30 novembe 999 Lineæe nomale modelle (3) udkast 44 Tosidet vaiansanalyse Man ha nogle obsevatione y de e aangeet i et tosidet skema: 2 j s y k k=,2,,n 2 y 2k k=,2,,n 2 y 2k k=,2,,n 2 y jk k=,2,,n j y sk k=,2,,n s y 22k y 2 jk y 2sk k=,2,,n 22 k=,2,,n 2 j k=,2,,n 2s i y ik k=,2,,n i y k k=,2,,n y i2k y i jk y isk k=,2,,n i2 k=,2,,n i j k=,2,,n is y 2k y jk y sk k=,2,,n 2 k=,2,,n j k=,2,,n s Vi buge betegnelsen y i jk fo obsevation n k i skemaets (i, j)-te celle som i alt indeholde n i j obsevatione Den (i, j)-te celle befinde sig i skemaets i-te ække og j-te søjle; de e i alt ække og s søjle Vi opstille en statistisk model gående ud på at y i jk -ene e obseveede vædie af uafhængige nomalfodelte stokastiske vaiable Y i jk med samme vaians σ 2 og med en middelvædistuktu de e bestemt ud fa den måde obsevationene e inddelt på elle måske e det inddelingen de e bestemt af den fomodede middelvædistuktu Hvoom alting e, he e en pæsentation af gundmodel og mulige inteessante hypotese: 2 Gundmodellen G e at Y-e høende til samme celle ha samme middelvædi Mee pæcist skal de findes tal η i j, i =, 2,,, j =, 2,, s, således at E Y i jk = η i j fo alle i, j og k Vi fomulee det kot som G : E Y i jk = η i j Additivitetshypotesen elle hypotesen om fosvindende vekselvikning sige at de ikke e nogen vekselvikning mellem ække og søjle, men at I engelske og ameikanske bøge vil de typisk væe ows and c columns 2 Vi omtale kun middelvædipaametene; det e bestandig undefostået at alle Y-e ha samme ukendte vaians σ 2
Lineæe nomale modelle (3) Side 2 af 0 ækkevikninge og søjlevikninge 3 indgå additivt Mee pæcist sige hypotesen at de findes tal α,α 2,,α og β, β 2,, β s således at E Y i jk = α i + β j fo alle i, j og k Den kote fomuleing af additivitetshypotesen e H 0 : E Y i jk = α i + β j Hypotesen om ens søjle elle om fosvindende søjlevikning sige at de ikke e nogen foskel på søjlene, mee pæcist at de findes tal α,α 2,,α således at E Y i jk = α i fo alle i, j og k Den kote fomuleing e H : E Y i jk = α i Hypotesen om ens ække elle om fosvindende ækkevikning sige at de ikke e nogen foskel på ækkene, mee pæcist at de findes tal β, β 2,, β s således at E Y i jk = β j fo alle i, j og k Den kote fomuleing e H 2 : E Y i jk = β j Hypotesen om total homogenitet sige at de ikke e nogen foskel på cellene ovehovedet, mee pæcist at de findes et tal γ således at E Y i jk = γ fo alle i, j og k Den kote fomuleing e H 3 : E Y i jk = γ Vi vil nu skive tingene op i lineæ algeba-spog Vi opfatte obsevationene som udgøende en vekto y V = R n hvo n e antallet af obsevatione; vektoene e stuktueet i et todimensionalt skema som ovenfo Gundmodellen og de fie hypotese kan fomulees som udsagn om at middelvædivektoen µ = EY tilhøe bestemte undeum: G : µ L hvo L = {ξ : ξ i jk = η i j } H 0 : µ L 0 hvo L 0 = {ξ : ξ i jk = α i + β j } H : µ L hvo L = {ξ : ξ i jk = α i } H 2 : µ L 2 hvo L 2 = {ξ : ξ i jk = β j } H 3 : µ L 3 hvo L 3 = {ξ : ξ i jk = γ} De gælde visse elatione mellem hypotesene/undeummene: G H 0 H H 2 H 3 og L L 0 L L 2 L 3 3 Nogle menneske synes at mene at gaden af videnskabelighed i tekst og tale e popotional med antallet af femmedod, så he e et pa femmedod: vekselvikning = inteaktion, ække/ søjlevikning = ække/søjleeffekt
Lineæe nomale modelle (3) Side 3 af 0 Gundmodellen samt modellene svaende til H og H 2, e eksemple på k-stikpøvepoblemet (k e hhv s, og s), og modellen svaende til H 3 e et enstikpøvepoblem Defo kan vi uden videe skive estimatene ove middelvædipaametene op i disse fie modelle: Unde G e ˆη i j = ȳ i j, dvs gennemsnittet i celle (i, j) Unde H e ˆα i = ȳ i, dvs gennemsnittet i den i-te ække Unde H 2 e ˆβ j = ȳ j, dvs gennemsnittet i den j-te søjle Unde H 3 e ˆγ = ȳ, dvs totalgennemsnittet Deimod e det ikke lige så let at estimee paametene unde H En påstand om at det hele blive sælig pænt hvis alle n i j -ene e lige stoe, vil næppe komme som nogen støe oveaskelse, også selv om læseen måske ikke e kla ove hvad det egentlig e de blive pænt, og hvofo I»det vikelige liv«kan man ikke satse på at de altid vil væe lige mange obsevatione i hve celle, så defo vil vi nu undesøge hvilke kav og hvilke ønske man skal stille til antallene n i j 44 Sammenhængende modelle Må nogle af cellene væe tomme? Det sige sig selv at de ikke må væe tomme ække elle søjle, men hvad med enkelte celle? Fo klalægge poblemene se vi på et oveskueligt eksempel Lad os sige at = 2 og s = 2, og at n i j -ene e n = 0 n 2 = 9 n 2 = 9 n 22 = 0 I dette tilfælde e L todimensionalt (de e kun de to paamete η 2 og η 2 ), og faktisk e L = L 0 = L = L 2 I sædeleshed e L L 2 = L 3, selv om mange måske ville have toet at de altid gjaldt at L L 2 = L 3 Poblemet e at modellen i ealiteten bestå af to sepaate delmodelle (fo hhv celle (, 2) og celle (2, )), og defo blive dim(l L 2 ) > elle ensbetydende hemed 4 dim(l 0 ) < + s Vi kan fomulee det som en betingelse på n i j -ene: lav en gaf hvo knudene e de talpa (i, j) fo hvilke n i j > 0, og hvo kantene fobinde pa af»naboknude«som enten ha samme i elle samme j Betingelsen e at denne gaf skal væe en sammenhængende gaf 5 4 Iflg den geneelle fomel dim(l + L 2 ) = dim L + dim L 2 dim(l L2) og da L 0 = L + L 2 5 Ved bevis: man ovebevise sig let om at gafen e sammenhængende hvis og kun hvis nulummet fo den lineæe afbildning de afbilde (α,α 2,,α, β, β 2,, β s ) R R s ove i den»tilsvaende«vekto i L 0, e endimensionalt; og dimensionen af L 0 = L + L 2 e lig + s minus dimensionen af dette nulum
Lineæe nomale modelle (3) Side 4 af 0 He e et eksempel på en sådan gaf: n > 0 n 2 > 0 n 3 = 0 n 2 > 0 n 22 = 0 n 23 > 0 I det følgende beskæftige vi os kun med sammenhængende modelle 442 Pojektionen på L 0 Ifølge den geneelle teoi estimees middelvædivektoen µ unde H 0 ved pojektionen p 0 y af y på L 0 I visse tilfælde findes en nem fomel til beegning af denne pojektion Vi minde om at L 0 = L + L 2 og L 3 = L L 2 Antag at det e sådan at i så fald e (L L 3 ) (L 2 L 3 ); () L 0 = (L L 3 ) (L 2 L 3 ) L 3 og demed dvs p 0 = (p p 3 ) + (p 2 p 3 ) + p 3 α i + β j = (ȳ i ȳ ) + (ȳ j ȳ ) + ȳ (2) = ȳ i + ȳ j ȳ Se, det va jo en meget fin fomel Spøgsmålet e nu hvonå foudsætningen () e opfyldt Nødvendigt og tilstækkeligt fo () e at p e p 3 e, p 2 f p 3 f = 0 (3) fo alle e, f E hvo E e en basis fo L Som E kan man feks buge vektoene e ρσ hvo (e ρσ ) i jk = hvis (i, j) = (ρ,σ), og 0 elles Hvis man indsætte sådanne vektoe i (3) finde man let at den nødvendige og tilstækkelige betingelse e at n i j = n i n j n, i =, 2,, ; j =, 2,, s (4) Nå denne betingelse e opfyldt, sige man at de foeligge det balanceede tilfælde Sammenfattende kan vi nu sige at i det balanceede tilfælde, dvs nå (4) e opfyldt, så kan estimatoene unde additivitetshypotesen udegnes efte fomlene (2)
Lineæe nomale modelle (3) Side 5 af 0 443 Test af hypotese De foskellige hypotese om middelvædistuktuen kan nu testes; hve gang kan man benytte en F-teststøelse hvo nævneen e vaiansskønnet i den aktuelle gundmodel, og tælleen e et skøn ove»hypotesens vaiation omking gundmodellen«sine to fihedsgadsantal ave F fa hhv tælle- og nævnevaiansskønnet Additivitetshypotesen H 0 testes med F = s2 s 2 0 hvo s 2 0 = = n dim L n g i= s j= y py 2 n i j k= (y i jk ȳ i j ) 2 beskive vaiationen inden fo guppe (g = dim L e antal ikketomme celle), og s 2 = = dim L dim L 0 py p 0 y 2 g ( + s ) i= s j= n i j k= ( ) 2 ȳ i j ( αi + β j ) beskive vekselvikningsvaiationen I det balanceede tilfælde e s 2 = g ( + s ) i= s j= n i j k= (ȳi j ȳ i ȳ j + ȳ ) 2 Ovenstående foudsætte at n > g, dvs de skal væe celle med mee end én obsevation 2 Hvis additivitetshypotesen acceptees, udegne man et nyt vaiansskøn s 2 0 = = y p n 0 y 2 dim L 0 ( y py 2 + py p n 0 y 2) dim L 0 og alt efte de konkete omstændighede og poblemstillinge vil man så teste H og/elle H 2 Fo at teste hypotesen H om fosvindende søjlevikning buges teststøelsen F = s 2 /s2 0 hvo s 2 = = dim L 0 dim L p 0 y p y 2 s i= s ( ) 2 n i j αi + β j ȳ i j=
Lineæe nomale modelle (3) Side 6 af 0 I det balanceede tilfælde e s 2 = s s ) 2 n j (ȳ j ȳ j= Fo at teste hypotesen H 2 om fosvindende ækkevikning buges teststøelsen F = s 2 2 /s2 0 hvo s 2 2 = = dim L 0 dim L 2 p 0 y p 2 y 2 i= s ( ) 2 n i j αi + β j ȳ j j= I det balanceede tilfælde e s 2 2 = n i (ȳ i ȳ ) 2 i= Bemæk at H og H 2 testes sideodnet, altså i fohold til det samme s 2 0 ; i det balanceede tilfælde e de to F-tællee s 2 og s2 2 stokastisk uafhængige (fodi p 0 y p y og p 0 y p 2 y e otogonale) 444 Et eksempel 6 Fo at opnå de optimale vækstbetingelse skal plante have de fonødne næingsstoffe i de ette fohold Dette eksempel handle om at bestemme det ette fohold mellem mængden af tilføt kvælstofgødning og mængden af tilføt fosfogødning til katofle Man ha dyket nogle katoffelmake på seks foskellige måde, svaende til seks foskellige kombinatione af mængde tilføt fosfo (0, elle 2 enhede) og mængde tilføt kvælstof (0 elle enhed), og deefte ha man målt høstudbyttet På den måde få man nogle obsevatione, høstudbyttene, som e inddelt i guppe efte dykningsmetode således at guppene e fastlagt ved hjælp af to kiteie, nemlig tilføt kvælstof og tilføt fosfo Et sådant dykningsfosøg udføt i 932 ved Ely gav de esultate de e vist i Tabel 7 Opgaven e nu at undesøge hvodan de to faktoe kvælstof og fosfo vike hve fo sig og sammen E det feks sådan at vikningen af at gå fa en til to enhede fosfo afhænge af om de tilføes kvælstof elle ej? Det kan undesøges med en tosidet vaiansanalysemodel 6 Kopieet foholdsvis diekte fa IMFUFA-tekst 67 defo visse notationsmæssige foskelle 7 Bemæk i øvigt at høstudbyttene ha undegået visse foandinge på dees vej til Tabel Den væsentligste e at man ha taget logaitmen til tallene Gunden hetil e at efaingsmæssigt e høstudbyttet af katofle ikke sælig nomalfodelt, hvoimod det det se bede ud med logaitmen til høstudbyttet Da man havde taget logaitmen til tallene, viste det sig at alle esultatene hed 3- komma-et-elle-andet, så fo at få nogle pæne tal ud af det ha man tukket 3 fa og ganget med 000
Lineæe nomale modelle (3) Side 7 af 0 Tabel Udbytte ved dykningsfosøg med katofle Vædiene e 000 (log(udbytte målt i lbs) 3) fo 36 pacelle 0 kvælstof 0 59 450 584 509 636 43 69 68 524 65 655 564 fosfo 2 722 689 625 584 64 53 702 677 684 643 668 699 80 688 682 703 774 623 84 757 80 792 790 703 Vi udegne føst estimatene Man kan væe inteesseet i fo en odens skyld at teste gundmodellens antagelse om vaianshomogenitet, og defo beegnes fo hve af de seks guppe ikke blot gennemsnit, men også vaiansestimate, se Tabel 2 Endvidee finde man den samlede kvadatsum til 87, således at den fælles vaians inden fo guppe estimees til s 2 0 = 87 36 6 = 37272 Batletts teststøelse blive B obs = 95 de skal sammenlignes med χ 2 - fodelingen med 6 = 5 fihedsgade Tabelopslag vise at de e knap 0% chance fo at få en støe vædi, og de e således ikke noget de tale alvoligt imod antagelsen om vaianshomogenitet Vi kan defo basee de videe undesøgelse på den fomodede gundmodel Vi vil deefte gå i gang med at nu undesøge om talmateialet kan beskives med en model hvo vikningene af de to faktoe»tilføt fosfo«og»tilføt kvælstof«indgå additivt Vi betegne den k-te obsevation i den i-te ække og j-te søjle y i jk Gundmodellen e at y i jk -ene opfattes som obseveede vædie af uafhængige nomalfodelte stokastiske vaiable Y i jk hvo Y i jk e nomalfodelt med middelvædi µ i j og vaians σ 2 Additivitetshypotesen kan fomulees som H 0 : EY i jk = ξ + η i + ζ j He beskive ξ det fælles niveau, η i -ene vikningene af tilføt fosfo og ζ j -ene vikningene af tilføt kvælstof, og det e sådan at η = ζ = 0 Det fælles niveau ξ estimees til ȳ = 65475 De estimeede fosfovikninge (ækkevikninge) e ȳ ȳ = 8692 ȳ 2 ȳ = 342 ȳ 3 ȳ = 7350
Lineæe nomale modelle (3) Side 8 af 0 Tabel 2 Middeltal ȳ (øvest) og vaiansestimat s 2 (nedest) i hve af de seks guppe, jf Tabel Tabel 3 Guppegennemsnit (øvest) og estimeede guppemiddelvædie unde additivitetshypotesen (nedest) kvælstof 0 kvælstof 0 0 53050 768030 6057 264457 0 53050 52436 6057 630 fosfo 62450 556990 783 424857 fosfo 62450 62470 783 764 2 67883 47497 77767 74507 2 67883 68478 77767 7772 De estimeede kvælstofvikninge (søjlevikninge) e ȳ ȳ = 4347 ȳ 2 ȳ = 4347 Heudfa kan man eventuelt udegne de estimeede guppemiddelvædie unde additivitetshypotesen, se Tabel 3 Det vaiansestimat de skal benyttes hvis additivitetshypotesen e igtig, e s 2 0 = 26935 36 (3 + 2 ) = 3527 med 36 (3 + 2 ) = 32 fihedsgade Vi kan nu teste om de e additivitet mellem fosfo og kvælstof i katoffeldykningseksemplet Vi ha tidligee fundet at Vekselvikningsvaiansen findes til s 2 0 = 87 36 6 = 37272 s 2 = 877 6 (3 + 2 ) = 877 2 = 4385 Teststøelsen e demed F = s2 s 2 0 = 4385 37272 = 02 de skal sammenlignes med F-fodelingen med (2,30) fihedsgade Tabelopslag vise at testsandsynligheden e lidt unde 90%, så de e næppe nogen tvivl om at additivitetshypotesen kan godkendes
Lineæe nomale modelle (3) Side 9 af 0 Tabel 4 Vaiansanalyseskema f stå fo antal fihedsgade, SS fo Sum af kvadatiske afvigelse, s 2 = SS/ f vaiation f SS s 2 test inden fo guppe 30 87 3727 vekselvikning 2 877 439 439/3727=02 additivitetshypotesen 32 2694 3522 mellem N-niveaue 68034 68034 68034/3522=9 mellem P-niveaue 2 5764 78820 78820/3522=22 omking total-gns 35 338369 Som fobedet estimat ove den fælles vaians benyttes heefte s 2 0 = 2694 36 (3 + 2 ) = 3527 med 36 (3 + 2 ) = 32 fihedsgade Nu da vi ved at den additive model give en god beskivelse af obsevationene og det således ha mening at tale om en kvælstofvikning og en fosfovikning, kan det væe af inteesse at undesøge om e e en signifikant vikning af kvælstof hhv fosfo Fo at undesøge om kvælstof ha en vikning, testes hypotesen H 2 om fosvindende kvælstofvikning (søjlevikning) Vaiansen mellem kvælstofniveaue udegnes til s 2 2 = 68034 2 = 68034 Vaiansestimatet i den additive model va s 2 02 og F-teststøelsen blive defo = 3522 med 32 fihedsgade, F obs = s2 2 s 2 02 = 68034 3522 = 9 de skal sammenlignes med F,32 -fodelingen Vædien F obs = 9 e ganske utvetydigt signifikant sto således at hypotesen om fosvindende kvælstofvikning må fokastes, dvs konklusionen blive at det ha en vikning at tilføe kvælstof Hvis man undesøge om de e en fosvindende fosfovikning, så må også denne hypotese fokastes, dvs det ha også en signifikant vikning at tilføe fosfogødning Vaiansanalyseskemaet (Tabel 4) give en samlet ovesigt ove analysen
Lineæe nomale modelle (3) Side 0 af 0 445 En opgave Dette e en beømt tosidet vaiansanalyse-opgave fa Københavns Univesitet: En student cykle hve dag fa sit hjem til HC Østed Institutet og tilbage igen Han kan cykle to foskellige veje, én som han pleje at benytte, og én som han mistænke fo at væe en genvej Fo at undesøge dette måle han nogle gange hvo lang tid tuen tage ham Resultatene femgå af nedenstående skema hvo tidene e opgivet med 0 sekunde som enhed og ud fa et beegningsnulpunkt på 9 minutte genvej sædvanlig vej ud 4 3 3 8 5 7 hjem 6 6 8 7 2 9 Da det som bekendt kan væe vanskeligt at slippe væk fa HC Østed Institutet på cykel, tage hjemtuen gennemsnitligt længee tid end udtuen Havde studenten et i sin mistanke? Vejledning: Det e klat at disse esultate må kunne behandles ved tosidet vaiansanalyse; da cellene imidletid ikke indeholde lige mange obsevatione, kan den sædvanlige fomel fo pojektionen på undeummet svaende til additivitetshypotesen ikke buges