Ensidet variansanalyse Sammenligning af grupper Helle Sørensen E-mail: helle@math.ku.dk StatBK (Uge 47, mandag) Ensidet ANOVA 1 / 18
Program I dag: Sammenligning af middelværdier Sammenligning af spredninger Parvise sammenligninger To eksempler: Aldersfordeling i hjertestudie (Example 12.1) Collinge et al Torsdag: Tosidet variansanalyse StatBK (Uge 47, mandag) Ensidet ANOVA 2 / 18
Eksempel: Aldersfordeling i hjertestudie Data fra Tabel 12.1 (side 325), parallelle boxplot side 329: Tre behandlingsgrupper: surgery, control I, control II med hhv. 25, 25 og 18 observationer Er aldersfordelingen ens i de tre grupper? Kunne lave parvise test. Hvorfor er det ikke en god ide? Notation: y ij : observationen nummer j i den i te gruppe r grupper, her r = 3 n i observationer i gruppe i. Her: n 1 = 25, n 2 = 25 og n 3 = 18 n observationer i alt, n = n 1 +... + n r. Her n = 68 i = 1,2,...,r og j = 1,2,...n i. StatBK (Uge 47, mandag) Ensidet ANOVA 3 / 18
Statistisk model og hypotese Statistisk model, dvs. antagelser: y ij normalfordelt med middelværdi α i og spredning σ y ij erne er uafhængige Forskellige middelværdier i grupperne, α 1,α 2,...,α r Samme spredning σ i grupperne (kan testes vha. Bartlett s test) Hvad er den interessante hypotese? StatBK (Uge 47, mandag) Ensidet ANOVA 4 / 18
Variation mellem grupper og indenfor grupper Mere notation Gruppegennemsnit ȳ i. Totalgennemsnit ȳ.. Opdeling af total variation i variation mellem grupper (between) og variation indenfor grupper (within): hvor SST = SSB + SSW SST: afstand fra observationer til totalgennemnit (y ij ȳ..) SSB: afstand fra gruppegennems. til totalgennemsnit (y i. ȳ..) SSW: afstand fra observationer til gruppegennemsnit (y ij ȳ i.) Se formler for SST, SSB, SSW på side 325. StatBK (Uge 47, mandag) Ensidet ANOVA 5 / 18
Frihedsgrader og Mean Squares (MS) Frihedsgrader: antal uafhængige led i SS-størrelserne, DFT = n 1, DFB = r 1, DFW = n r Mean squares, MS = SS/DF: MST = SST DFT, SSB MSB = DFB, SSW MSW = DFW Størrelserne samles som regel i et variansanalyseskema (side 326). NB. Trykfejl side 326 i MSW: ȳ i. rettes til y ij. StatBK (Uge 47, mandag) Ensidet ANOVA 6 / 18
Eksempel Gruppegennemsnit, ȳ 1. = 26.08, ȳ 2. = 33.80, ȳ 3. = 27.22, Kvadratsummer, SST = 3503.7, SSB = 842.9, SSW = 2660.8 Variansanalyseskema side 328. Husk: SST = SSB + SSW og DFT = DFB + DFW. Men: MST MSB + MSW. StatBK (Uge 47, mandag) Ensidet ANOVA 7 / 18
Test af hypotesen om ens middelværdier MS-størrelserne er nyttige fordi de kan bruges til at teste hypotesen om ens middelværdier MSW er et estimat for σ 2 : ˆσ = MSW Husk H 0 : α 1 = α 2 = α r. F -teststørrelsen måler variation mellem grupper i forhold til variation indenfor grupper: F = MSB MSW = r n i=1 i j=1 (ȳ i. ȳ..) 2 /(r 1) r i=1 n i j=1 (y ij ȳ i.) 2 /(n r) Hvilke værdier af F passer godt med hypotesen? Hvilke værdier af F passer dårligt med hypotesen? Hvis H 0 sand: F er F -fordelt med r 1 og n r frihedsgrader, så p-værdien skal beregnes i denne fordeling: p = P(F F obs ) StatBK (Uge 47, mandag) Ensidet ANOVA 8 / 18
F -fordelingen og konklusion Tætheder for F (1,20) og F (5,20) på side 327. Density 0.0 0.2 0.4 0.6 0.8 1.0 F(2,65) 0 2 4 6 8 10 12 F Tabel B11 side 475 og 476 giver fraktilerne (cirka): F 2,65,0.95 = 3.15 F 2,65,0.95 = 4.98 Hvad fortæller det os om p-værdien? Hvad er konklusionen? Bør altså tage højde for alder i analysen af hjertedata det burde vi faktisk gøre under alle omstændigheder da det kan forklare dele af variationen. StatBK (Uge 47, mandag) Ensidet ANOVA 9 / 18
Sir R.A. Fisher Ifølge bogen er F -fordelingen opkaldt efter Ronald Aylmer Fisher, variansanalysens fader : StatBK (Uge 47, mandag) Ensidet ANOVA 10 / 18
Bartlett s test Bemærk: Disse slides er en del af pensum! En vigtig antagelser er at spredningerne er ens i grupperne. Man bør undersøge om denne antagelse er rimelig før man sammenligner middelværdierne Bartlett s test. Antagelser og hypotese: Antagelse: y ij N(α i,σ i ) Hypotese: H 0 : σ 1 = σ 2 = = σ r Stikprøvespredning i i te gruppe: s i Testet går ud på at sammenligne værdierne s 1,...,s r på passende måde. StatBK (Uge 47, mandag) Ensidet ANOVA 11 / 18
Bartlett s test Teststørrelse hvor B = 1 c ( (n r)log(msw) c = 1 + ( 1 r 3(r 1) i=1 r i=1 (n i 1)log(s 2 i ) ) 1 n i 1 1 n r Store værdier passer dårligt med H 0, så p-værdien er p = P(B B obs ). Hvis H 0 er sand så er B χ 2 -fordelt med r 1 frihedsgrader. Se tabel B7. SAS kan heldigvis nemt beregne dette for os... I eksemplet fås: Hvad er konklusionen? B = 0.187, p = 0.91 ) StatBK (Uge 47, mandag) Ensidet ANOVA 12 / 18
Sammenligning af to grupper Interesseret i at sammenligne gruppe 1 og 2, for eksempel. Forskel estimeres til ȳ 1. ȳ 2. med 95%-konfidensinterval ȳ 1. ȳ 2. ± t 0.975,n r MSW 1 + 1 n 1 n 2 Bemærk at konfidensintervallet er baseret på alle data: antal frihedsgrader er n r spredningsestimatet ˆσ = MSW er baseret på alle obs. Hvad giver dette i eksemplet? StatBK (Uge 47, mandag) Ensidet ANOVA 13 / 18
Parvise sammenligninger Konfidensintervallet fra før tager hensyn til the individual error rate, altså den usikkerhed der er associeret netop denne sammenligning. Hvis vi foretager mange parvise sammenligninger er der en sådan usikkerhed associeret med hver sammenligning. Den samlede usikkerhed the family error rate er større. Hvis vi vil tage højde for det skal vi gøre vores konfidensintervaller bredere. Skifter t-fraktilen ud med et større tal. Flere forskellige metoder, men lad os fokusere på Tukey-metoden. StatBK (Uge 47, mandag) Ensidet ANOVA 14 / 18
Tukey-konfidensintervaller Tukey-konfidensinterval for forskel mellem gruppe 1 og 2: ȳ 1. ȳ 2. ± q r,n r,0.95 MSW 1 + 1 2 n 1 n 2 q-størrelsen er givet i Tabel B12, side 478 479. I eksemplet er q 3,65,0.95 = 3.40 og konfidensintervallerne bliver: Hvad er konklusionen? surgery vs. control I : ( 12.06, 3.38) surgery vs. control II : ( 5.89, 3.60) control I vs. control II : (1.83, 11.32) StatBK (Uge 47, mandag) Ensidet ANOVA 15 / 18
SAS proc glm data=biost12_1; class group; model age = group / solution; means group / hovtest=bartlett tukey; run; StatBK (Uge 47, mandag) Ensidet ANOVA 16 / 18
Eksempel: data fra Collinge et al Flere muligheder for analyser Sædvanlig ensidet variansanalyse med fire grupper Sammenligning af spredninger Sammenligning af (alle fire) middelværdier Konfidensintervaller for interessante forskelle To trinsanalyse: først sammenligning af de tre kontrolgrupper, dernæst sammenligning af kontroller mod gruppe 4. (Den anden analyse er gennemført i Variansanalyse i SAS 1 ) StatBK (Uge 47, mandag) Ensidet ANOVA 17 / 18
Resumé Ensidet variansanalyse sammenligning af grupper Sammenligning af spredninger: Bartlett s test Sammenligning af middelværdier: F -test baseret på MSB og MSW Efterfølgende parvise sammenligninger hvor alle observationer inddrages til kontstruktion af konfidensintervaller (og evt. test) Tukey-korrektion for multiple sammenligninger Og lidt om fremtiden... Tosidet variansanalyse (to indelingskriterier) torsdag Flersidet variansanalyse mandag uge 50 Modelkontrol (residualanalyse) formentlig først mandag i uge 51 StatBK (Uge 47, mandag) Ensidet ANOVA 18 / 18