Program Ensidet variansanalyse Sammenligning af grupper Helle Sørensen E-mail: helle@math.ku.dk I dag: Sammenligning af middelværdier Sammenligning af spredninger Parvise sammenligninger To eksempler: Aldersfordeling i hjertestudie (Example 2.) Collinge et al Torsdag: Tosidet variansanalyse StatBK (Uge 49, mandag) Ensidet ANOVA / 8 StatBK (Uge 49, mandag) Ensidet ANOVA 2 / 8 Eksempel: Aldersfordeling i hjertestudie Statistisk model og hypotese Data fra Tabel 2. (side 325), parallelle boxplot side 329: Tre behandlingsgrupper: surgery, control I, control II med hhv. 25, 25 og 8 observationer Er aldersfordelingen ens i de tre grupper? Kunne lave parvise test. Hvorfor er det ikke en god ide? Notation: y ij : observationen nummer j i den i te gruppe r grupper, her r = 3 n i observationer i gruppe i. Her: n = 25, n 2 = 25 og n 3 = 8 n observationer i alt, n = n +... + n r. Her n = 68 i =,2,...,r og j =,2,...n i. Statistisk model, dvs. antagelser: y ij normalfordelt med middelværdi α i og spredning σ y ij erne er uafhængige Forskellige middelværdier i grupperne, α,α 2,...,α r Samme spredning σ i grupperne (kan testes vha. Bartlett s test) Hvad er den interessante hypotese? StatBK (Uge 49, mandag) Ensidet ANOVA 3 / 8 StatBK (Uge 49, mandag) Ensidet ANOVA 4 / 8
Variation mellem grupper og indenfor grupper Frihedsgrader og Mean Squares (MS) Mere notation Gruppegennemsnit ȳ i. Totalgennemsnit ȳ.. Opdeling af total variation i variation mellem grupper (between) og variation indenfor grupper (within): hvor SST = SSB + SSW SST: afstand fra observationer til totalgennemnit (y ij ȳ..) SSB: afstand fra gruppegennems. til totalgennemsnit (y i. ȳ..) SSW: afstand fra observationer til gruppegennemsnit (y ij ȳ i.) Se formler for SST, SSB, SSW på side 325. Frihedsgrader: antal uafhængige led i SS-størrelserne, Mean squares, MS = SS/DF: DFT = n, DFB = r, DFW = n r MST = SST DFT, SSB MSB = DFB, SSW MSW = DFW Størrelserne samles som regel i et variansanalyseskema (side 326). NB. Trykfejl side 326 i MSW: ȳ i. rettes til y ij. StatBK (Uge 49, mandag) Ensidet ANOVA 5 / 8 StatBK (Uge 49, mandag) Ensidet ANOVA 6 / 8 Eksempel Test af hypotesen om ens middelværdier Gruppegennemsnit, ȳ. = 26.08, ȳ 2. = 33.80, ȳ 3. = 27.22, Kvadratsummer, SST = 3503.7, SSB = 842.9, SSW = 2660.8 Variansanalyseskema side 328. Husk: SST = SSB + SSW og DFT = DFB + DFW. Men: MST MSB + MSW. MS-størrelserne er nyttige fordi de kan bruges til at teste hypotesen om ens middelværdier MSW er et estimat for σ 2 : ˆσ = MSW Husk H 0 : α = α 2 = α r. F -teststørrelsen måler variation mellem grupper i forhold til variation indenfor grupper: F = MSB MSW = r n i= i j= (ȳ i. ȳ..) 2 /(r ) r i= n i j= (y ij ȳ i.) 2 /(n r) Hvilke værdier af F passer godt med hypotesen? Hvilke værdier af F passer dårligt med hypotesen? Hvis H 0 sand: F er F -fordelt med r og n r frihedsgrader, så p-værdien skal beregnes i denne fordeling: p = P(F F obs ) StatBK (Uge 49, mandag) Ensidet ANOVA 7 / 8 StatBK (Uge 49, mandag) Ensidet ANOVA 8 / 8
F -fordelingen og konklusion Tætheder for F (,20) og F (5,20) på side 327. Sir R.A. Fisher Ifølge bogen er F -fordelingen opkaldt efter Ronald Aylmer Fisher, variansanalysens fader : Density 0.0 0.2 0.4 0.6 0.8.0 F(2,65) 0 2 4 6 8 0 2 F Tabel B side 475 og 476 giver fraktilerne (cirka): F 2,65,0.95 = 3.5 F 2,65,0.99 = 4.98 Hvad fortæller det os om p-værdien? Bør altså tage højde for alder i analysen af hjertedata det burde vi faktisk gøre under alle omstændigheder da det kan forklare dele af variationen. StatBK (Uge 49, mandag) Ensidet ANOVA 9 / 8 StatBK (Uge 49, mandag) Ensidet ANOVA 0 / 8 Bartlett s test Bartlett s test Bemærk: Disse slides er en del af pensum! En vigtig antagelser er at spredningerne er ens i grupperne. Man bør undersøge om denne antagelse er rimelig før man sammenligner middelværdierne Bartlett s test. Antagelser og hypotese: Antagelse: y ij N(α i,σ i ) Hypotese: H 0 : σ = σ 2 = = σ r Stikprøvespredning i i te gruppe: s i Testet går ud på at sammenligne værdierne s,...,s r på passende måde. Teststørrelse hvor B = c ( (n r)log(msw) c = + ( r 3(r ) i= r i= (n i )log(s 2 i ) ) n i n r Store værdier passer dårligt med H 0, så p-værdien er p = P(B B obs ). Hvis H 0 er sand så er B χ 2 -fordelt med r frihedsgrader. Se tabel B7. SAS kan heldigvis nemt beregne dette for os... I eksemplet fås: B = 0.87, p = 0.9 ) StatBK (Uge 49, mandag) Ensidet ANOVA / 8 StatBK (Uge 49, mandag) Ensidet ANOVA 2 / 8
Sammenligning af to grupper Parvise sammenligninger Interesseret i at sammenligne gruppe og 2, for eksempel. Forskel estimeres til ȳ. ȳ 2. med 95%-konfidensinterval ȳ. ȳ 2. ± t 0.975,n r MSW + n n 2 Bemærk at konfidensintervallet er baseret på alle data: antal frihedsgrader er n r spredningsestimatet ˆσ = MSW er baseret på alle obs. Konfidensintervallet fra før tager hensyn til the individual error rate, altså den usikkerhed der er associeret netop denne sammenligning. Hvis vi foretager mange parvise sammenligninger er der en sådan usikkerhed associeret med hver sammenligning. Den samlede usikkerhed the family error rate er større. Hvis vi vil tage højde for det skal vi gøre vores konfidensintervaller bredere. Skifter t-fraktilen ud med et større tal. Flere forskellige metoder, men lad os fokusere på Tukey-metoden. Hvad giver dette i eksemplet? StatBK (Uge 49, mandag) Ensidet ANOVA 3 / 8 StatBK (Uge 49, mandag) Ensidet ANOVA 4 / 8 Tukey-konfidensintervaller SAS Tukey-konfidensinterval for forskel mellem gruppe og 2: ȳ. ȳ 2. ± q r,n r,0.95 MSW + 2 n n 2 q-størrelsen er givet i Tabel B2, side 478 479. I eksemplet er q 3,65,0.95 = 3.40 og konfidensintervallerne bliver: surgery vs. control I : ( 2.06, 3.38) surgery vs. control II : ( 5.89, 3.60) control I vs. control II : (.83,.32) proc glm data=biost2_; class group; model age = group / solution; means group / hovtest=bartlett tukey; run; StatBK (Uge 49, mandag) Ensidet ANOVA 5 / 8 StatBK (Uge 49, mandag) Ensidet ANOVA 6 / 8
Eksempel: data fra Collinge et al Resumé Flere muligheder for analyser Sædvanlig ensidet variansanalyse med fire grupper Sammenligning af spredninger Sammenligning af (alle fire) middelværdier Konfidensintervaller for interessante forskelle To trinsanalyse: først sammenligning af de tre kontrolgrupper, dernæst sammenligning af kontroller mod gruppe 4. (Den anden analyse er gennemført i Variansanalyse i SAS ) Ensidet variansanalyse sammenligning af grupper Sammenligning af spredninger: Bartlett s test Sammenligning af middelværdier: F -test baseret på MSB og MSW Efterfølgende parvise sammenligninger hvor alle observationer inddrages til kontstruktion af konfidensintervaller (og evt. test) Tukey-korrektion for multiple sammenligninger Og lidt om fremtiden... Tosidet variansanalyse (to indelingskriterier) torsdag Flersidet variansanalyse mandag uge 50 Modelkontrol (residualanalyse) formentlig først mandag i uge 5 StatBK (Uge 49, mandag) Ensidet ANOVA 7 / 8 StatBK (Uge 49, mandag) Ensidet ANOVA 8 / 8