Program. Tosidet variansanalyse og forsøgsplanlægning. Repetition: ensidet variansanalyse. Eksempel: data fra Collinge et al

Relaterede dokumenter
Program. Forsøgsplanlægning og tosidet variansanalyse. Eksempel: fuldstændigt randomiseret forsøg. Forsøgstyper

Program. Residualanalyse Flersidet variansanalyse. Opgave BK.15. Modelkontrol: residualplot

Ensidet variansanalyse

Program. Ensidet variansanalyse Sammenligning af grupper. Statistisk model og hypotese. Eksempel: Aldersfordeling i hjertestudie

Program. Flersidet variansanalyse og hierarkiske modeller. Eksempel: iltoptag for krabber. Eksempel: iltoptag for krabber.

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Program. Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering. Test for ens spredninger

To-sidet varians analyse

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Module 12: Mere om variansanalyse

Eksamen i Statistik for biokemikere. Blok

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Modelkontrol i Faktor Modeller

Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff

Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration

Program. Sammenligning af grupper Ensidet ANOVA. Case 3, del II: Fiskesmag i lammekød. Case 3, del I: A-vitamin i leveren

Module 4: Ensidig variansanalyse

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

Modul 11: Simpel lineær regression

Reeksamen i Statistik for Biokemikere 6. april 2009

Tema. Dagens tema: Indfør centrale statistiske begreber.

Vejledende besvarelse af eksamen i Statistik for biokemikere, blok

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

1 Hb SS Hb Sβ Hb SC = , (s = )

To-sidet variansanalyse

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Sidste gang: One-way(ensidet)/one-factor ANOVA I dag: Two-factor ANOVA (Analysis of variance) Two-factor ANOVA med interaktion

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

Multipel Lineær Regression

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Program. 1. Varianskomponent-modeller (Random Effects) 2. Transformation af data. 1/12

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)

Normalfordelingen og Stikprøvefordelinger

Konfidensintervaller og Hypotesetest

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Statistik Lektion 4. Variansanalyse Modelkontrol

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Ovenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm.

Tovejs-ANOVA (Faktoriel) Regler og problemer kan generaliseres til mere end to hovedfaktorer med tilhørende interaktioner

Module 12: Mere om variansanalyse

Forelæsning 11: Envejs variansanalyse, ANOVA

Multipel regression. Data fra opgave 3 side 453: Multipel regressionsmodel: Y = α + β 1 x 1 + β 2 x 2 + ǫ. hvor ǫ N(0, σ 2 ).

Model. (m separate analyser). I vores eksempel er m = 2, n 1 = 13 (13 journalister) og

Statistik for Biokemikere Projekt

Dagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at

Module 3: Statistiske modeller

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

1 Multipel lineær regression

Forsøgsplanlægning Stikprøvestørrelse

1 Multipel lineær regression

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se

Anvendt Statistik Lektion 7. Simpel Lineær Regression

En Introduktion til SAS. Kapitel 5.

Forelæsning 11: Tovejs variansanalyse, ANOVA

Statistik Lektion 16 Multipel Lineær Regression

1 Sammenligning af 2 grupper Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver... 2

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...

Besvarelse af vitcap -opgaven

Program. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

Transkript:

Program Tosidet variansanalyse og forsøgsplanlægning Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Ensidet ANOVA: repetition og Collinge eksempel. Additiv tosidet ANOVA (blokforsøg) Tosidet ANOVA med vekselvirkning I eftermiddag: Forsøgstyper og forsøgsplanlægning Evt. BK.16 (og BK.15) StatBK (Uge 4, torsdag) Tosidet ANOVA 1 / 27 StatBK (Uge 4, torsdag) Tosidet ANOVA 2 / 27 Repetition: ensidet variansanalyse Eksempel: data fra Collinge et al n observationer fra r grupper (n i obs. fra gruppe i) Interesseret i at sammenligne niveauet i grupperne. Statistisk model: y ij erne uafhængige y ij normalfordelt med middelværdi α i og spredning σ Alternative men identiske formuleringer af N-antagelsen: y ij = α i + ε ij, ε ij N(0,σ) y ij = µ + α i + ε ij, ε ij N(0,σ) Flere muligheder for analyser Sædvanlig ensidet variansanalyse med fire grupper Sammenligning af spredninger Sammenligning af (alle fire) middelværdier Konfidensintervaller for interessante forskelle To trinsanalyse: først sammenligning af de tre kontrolgrupper, dernæst sammenligning af kontroller mod gruppe 4. (Den anden analyse er gennemført i Variansanalyse i SAS 1 ) Fortolkningerne af α i er: forventede værdier vs. forventede forskelle. Test for H 0 : α 1 = = α r baseret på MSB og MSW: variation mellem grupper og indenfor grupper. StatBK (Uge 4, torsdag) Tosidet ANOVA 3 / 27 StatBK (Uge 4, torsdag) Tosidet ANOVA 4 / 27

Eksempel: vægttab Additiv tosidet ANOVA: notation og model Data fra eksempel 12.7 side 332. Formål: Vægttab i løbet af 6 måneder for 30 kvinder Tre behandlinger/programmer: diæt, motion, diæt og motion To arbejdssteder: kontor og fabrik 15 kvinder fra hhv. kontor og fabrik inddeles tilfældigt i tre grupper svarende til programmerne. Taber kvinder sig mere på nogle programmer end på andre? Ikke specielt interesseret i forskellen mellem arbejdsstederne (men kunne være det). Blokforsøg. Bliver under alle omstændigheder nødt til at tage højde for en eventuel forskel mellem kontor og fabrik tosidet variansanalyse. Notation: y ijk : observation k i behandlingsgruppe i, blok j. Statistisk model: y ijk = µ + α i + β j + ε ijk hvor ε ijk er normalfordelt med middelværdi 0 og spredning σ (fælles). Dvs. y ijk er normalfordelt med middelværdi µ + α i + β j og spredning σ. ε ijk beskriver afvigelsen fra den forventede værdi (middelværdien). Parametre: µ beskriver niveauet af y (på passende måde) α 1,...,α r beskriver forskelle mellem behandlinger β 1,...,β c beskriver forskelle mellem blokke σ er spredningen indenfor kombination af behandling og blok StatBK (Uge 4, torsdag) Tosidet ANOVA 5 / 27 StatBK (Uge 4, torsdag) Tosidet ANOVA 6 / 27 Vægttab: notation mm. Opdeling af total variation Notationen for eksempel 12.7: Hvad er r? Hvad er c? Hvad er m? Hvad er n? Hvad er middelværdien for vægttabet for en kvinde der kun er på diæt og arbejder på kontoret, udtrykt ved µ, α, β? Hvad er middelværdien for vægttabet for en kvinde både er på diæt og motion og som arbejder på fabrikken, udtrykt ved µ, α, β? Hvad er forskellen i middelværdien mellem to kvinder der begge arbejder på fabrikken men får både diæt og motion hhv. kun motion? Hvad er forskellen i middelværdien mellem to kvinder der begge arbejder på fabrikken men får både diæt og motion hhv. kun motion? Hvad er den interessante hypotese? Som i ensidet variansanalyse opdeles den totale variation efter de forskellige variationskilder: SST = SSR + SSC + SSW hvor SST: total variation (y ijk ȳ...) SSR: variation mellem behandlinger eller rows (ȳ i.. ȳ...) SSC: variation mellem blokke eller columns (ȳ. j. ȳ...) SSW: resten, variationen indenfor kombination af behandling of blok Frihedsgrader, SS, MS samles i variananalyseskema, side 335. StatBK (Uge 4, torsdag) Tosidet ANOVA 7 / 27 StatBK (Uge 4, torsdag) Tosidet ANOVA 8 / 27

Test af behandlingseffekt Vægttab: behandlingsforskelle Hypotesen om ingen forskel på behandlingerne, H 0 : α 1 = α 2 = = α r Som i ensidet variansanalyse måler vi hvor meget af variationen der skyldes behandlingen i forhold til restvariationen, F = MSR MSW F r 1,n r c+1 Hypotesen forkastes for store værdier af F. Eksemplet: F = 137.4/18.3 = 7.51 der skal vurderes i F 2,26. Dette giver en p-værdi på 0.003. Hypotesen forkastes: vi har med stor sikkerhed påvist en forskel på behandlingerne (p = 0.003). Vi har altså påvist en forskel på behandlingerne. Men hvad består forskellen i? Interesseret i estimater og konfidensintervaller for forskelle mellem α er. Tukey-korrigerede konfidensintervaller: motion vs. diæt : ˆα 2 ˆα 1 = 4.1 ( 8.85,0.65) begge vs. diæt : ˆα 3 ˆα 1 = 3.3 ( 1.45,8.05) begge vs. motion : ˆα 3 ˆα 2 = 7.4 (2.66,12.15) Hovedkonklusion: kombination af diæt og motion virker bedre end motion alene. Kunne i princippet også teste for en forskel mellem fabrik og kontor, men knapt så interessant som testet for en behandlingseffekt. StatBK (Uge 4, torsdag) Tosidet ANOVA 9 / 27 StatBK (Uge 4, torsdag) Tosidet ANOVA 10 / 27 Vægttab: SAS Eksempel: effekt at lærebog og uv-metode proc glm data=eks12_7; class program site; model weight = site program / solution; means program / tukey cldiff; run; solution giver parameterestimater SAS vælger en gruppe site=2 (fabrik) og program=1 (diæt) som referencegruppe. Estimater for site og program angiver så forskelle til referencegruppen. proc glm giver som default både Type I vs. type III test: Ens når data er balancerede dvs. lige mange obs. per kombination Kan være forskellige når data er ubalancerede mere om det senere Data fra Eksempel 12.8 side 336. Formål: Forbedring af testresultat efter fire ugers undervisning 36 studerende inddelt i 6 grupper, 6 studerende per gruppe Tre lærebøger (1, 2, 3) To undervisningsmetoder (forelæsning, diskussion) Grupper svarer til kombination af lærebog og uv-metode. giver lærebøgerne forskelligt udbytte for de studerende? giver uv-metoderne forskelligt udbytte for de studerende? Er forskellen mellem undervisningsmetoderne den samme for alle tre lærebøger? Eller egner den ene uv-metode sig bedre til ene bog? Vil undersøge effekten af flere faktorer og deres indbyrdes virkning i samme forsøg. StatBK (Uge 4, torsdag) Tosidet ANOVA 11 / 27 StatBK (Uge 4, torsdag) Tosidet ANOVA 12 / 27

Effekt af lærebog og uv-metode: model Effekt af lærebog og uv-metode: test for vekselv. Notation: y ijk : obs. k for lærebog i og uv-metode j. r = 3 lærebøger (rows), c = 2 uv-metoder (columns), m = 6 observationer per kombination af lærebog og uv-metode. n = rcm = 36 observationer i alt Additiv model: y ijk = µ + α i + β j + ε ijk hvor ε ijk er normalfordelt med middelværdi 0 og spredning σ (fælles). Med den additive model antages det at (ækvivalente udsagn): forskellen mellem uv-metoderne er den samme for alle tre lærebøger forskel mellem lærebøger er den samme for begge uv-metoder Men dette behøver jo ikke at være tilfældet! Der kan være vekselvirkning. Se figur 12.3 side 339. Model med vekselvirkning: y ijk = µ + α i + β j + γ ij + ε ijk NB: I bogen kaldes γ ij for αβ ij (uheldig notation!?) Denne model svarer til en ensidet variansanalyse med seks grupper. Opdeler den totale variation i variation mellem lærebæger, mellem uv-metoder, mellem grupper (de seks kombinationer), og indenfor grupper. Variansanalyseskema side 338. Starter med at teste for om vekselvirkningen er signifikant, dvs. H 0 : alle γ ij = 0 F = 0.17 der skal vurderes i F 2,30 -fordelingen. Dette giver p = 0.84 altså ingen tegn på vekselvirkning. StatBK (Uge 4, torsdag) Tosidet ANOVA 13 / 27 StatBK (Uge 4, torsdag) Tosidet ANOVA 14 / 27 Effekt af lærebog og uv-metode: flere test Effekt af lærebog og uv-metode: konklusion Ny model er den additive: Mulige hypoteser: y ijk = µ + α i + β j + ε ijk Ingen forskel på lærebøger, dvs. H 0 : α 1 = α 2 = α 3 Ingen forskel på uv-metoder, dvs. H 0 : β 1 = β 2. Testene giver: lærebøger: F = 1.75, F 2,32, p = 0.19. Konklusion? uv-metoder: F = 9.29, F 1,32, p = 0.0046. Konklusion? Fitter derfor også modellen kun med effekt af uv-metode: Hvilken model er dette? y ijk = µ + β j + ε ijk Hypotese om igen effekt af uv-metoder, H 0 : β 1 = β 2. Test: F = 8.90, F 1,34, p = 0.0053 tæt på værdierne fra før. Altså: vi har med stor sikkerhed påvist en forskel på uv-metoderne. Den forventede forskel mellem diskussion og lecture er 10.1 med 95% konfidensinterval (3.2, 16.9). StatBK (Uge 4, torsdag) Tosidet ANOVA 15 / 27 StatBK (Uge 4, torsdag) Tosidet ANOVA 16 / 27

Effekt af lærebog og uv-metode: konklusion Effekt af lærebog og uv-metode: SAS Startmodel: Så hvad laver vi egentlig her... proc glm data=ex12_8; class instruct text; model test = instruct text instruct*text; run; (Og hvorfor er jeg i gang med at skrive en lærebog...) Slutmodel og estimater: proc glm data=ex12_8; class instruct text; model test = instruct / solution; means instruct / tukey cldiff; run; StatBK (Uge 4, torsdag) Tosidet ANOVA 17 / 27 StatBK (Uge 4, torsdag) Tosidet ANOVA 18 / 27 Effekt af lærebog og uv-metode: opsummering Forsøgstyper Fittede model med vekselvirkning, og testede for vekselvirkning Fittede additiv model (uden vekselvirkning), testede for hovedeffekter Fjernede en ikke-signifikant hovedeffekt, fittede modellen igen Testede for den anden hovedeffekt Angav estimater og konfidensintervaller i slutmodellen Brugte type III test overalt. Kunne også have benyttet type I test fra modellen med vekselvirkning fordi data er pænt balancerede. Pas på med type I test hvis data er ubalanceret. SAS kan sagtens finde ud af ubalancerede data vi skal bare bruge udskrifterne rigtigt! Den sikre metode: kun et test per modelfit fjern en ikke-signifikant effekt og kør igen. Fjern aldrig en hovedeffekt hvis der er en vekselvirkning i modellen! Skelner ofte mellem observationelle studier og designede eksperimenter. Observationelle studier (surveys): stikprøve udtages tilfældigt fra en population registrerer diverse variable fra stikprøven information om sammenhængen mellem disse variable i populationen ingen intervention Designede eksperimenter Formålet er som regel at sammenligne grupper: forskellige behandlinger, celletyper, køn, alder, osv. Behandlinger allokeres tilfældigt til forsøgsenheder Flere faktorer kan undersøges i samme eksperiment Forsøgsenhederne skal være repræsentative. Ekstrapolation. StatBK (Uge 4, torsdag) Tosidet ANOVA 19 / 27 StatBK (Uge 4, torsdag) Tosidet ANOVA 20 / 27

Eksempel: fuldstændigt randomiseret forsøg Fuldstændigt randomiseret forsøg Data fra Sommer 2002 03, opgave 2: kvælstofindhold i protein fra hønseæg fem foderblandinger observationer fra i alt 37 høns, allokeret tilfældigt til de fem grupper 7 9 høns per gruppe Formålet er at undersøge om kvælstofindholdet varierer med foderblandingerne. Hvilken type analyse ville du bruge? Engelsk: Completely randomized design. n forsøgsenheder til rådighed (personer, celleprøver, planter,...) r forskellige behandlinger Forsøgsenhederne allokeres tilfældigt til behandl. lodtrækning Evt. balanceret: lige mange forsøgsenheder per behandling Randomiseringen skal sikre imod selection bias, fx. ulige aldersfordeling i hjertestudie, kønseffekter effekter af andre variable, også ikke-observerede variable Sammenligning af populationer: Grupper svarer til delpopulationer, ikke behandlinger. Ingen intervention. StatBK (Uge 4, torsdag) Tosidet ANOVA 21 / 27 StatBK (Uge 4, torsdag) Tosidet ANOVA 22 / 27 Blokforsøg Fuldstændigt randomiseret blokforsøg Forsøgsenhederne samles i blokke således at forsøgsenheder fra samme blok formodes at ligne hinanden mere end forsøgsenheder fra forskellige blokke. Typiske blokvariable: laboratorium, hospital, mark, kuld,... Afprøver de forskellige behandlinger i alle blokke. Ofte vil forsøgsenhederne i nogle blokke generelt ligge højt, i andre lavt. Skal tage hensyn til blokvariablen i analysen også selvom vi ikke er specielt interesseret i en eventuel blokeffekt. Hvis vi ikke tager højde for det i analysen vil behandlingsforskellene ofte blive sløret af eventuelle blokforskelle. Eksempel: data om vægttab. Arbejdssted kan opfattes som en blok-variabel. Engelsk: Completely randomized block design Balanceret, med m gentagelser. r forskellige behandlinger c blokke hver med plads til k r forsøgsenheder i hver blok allokeres de r behandlinger tilfældigt til forsøgsenhederne således at alle behandlinger bruges m gange per blok. m = 1: uden gentagelser, hver behandling afprøves een gang per blok. Ubalanceret: alle behandlinger optræder ikke lige mange gange i hver blok: ikke plads til alle behandlinger i hver blok, andre praktiske hensyn Manglende observationer, fx. pga. dødsfald eller tekniske fejl StatBK (Uge 4, torsdag) Tosidet ANOVA 23 / 27 StatBK (Uge 4, torsdag) Tosidet ANOVA 24 / 27

Eksempel: flerfaktorforsøg Eksempel: flerfaktorforsøg Flere faktorer undersøges i et eksperiment (eller en dataindsamling). To faktorer undersøges i et eksperiment (eller en dataindsamling). Eksempel: effekt af bøger og uv-metoder. Interesseret i effekten af begge faktorer samt deres indbyrdes virkning. Eksempel (fra notatet Flerfaktormodeller af Julie Lyng Forman): Iltoptag for 72 krabber To arter, tre temperaturer, to køn 6 krabber for hver kombination af art, temperatur og køn Interesseret i forskel mellem arterne, forskel mellem hanner og hunner og effekten af temperatur. Kan undersøge effekten af flere faktorer og deres indbyrdes virkning i samme forsøg. StatBK (Uge 4, torsdag) Tosidet ANOVA 25 / 27 StatBK (Uge 4, torsdag) Tosidet ANOVA 26 / 27 Resumé Forsøgstyper: fuldstændigt randomiserede forsøg fuldstændigt randomiserede blokforsøg tofaktorforsøg og flerfaktorforsøg Modeller: ensidet variansanalyse tosidet variansanalyse med og uden vekselvirkning Trin i den statistiske analyse: modelkontrol residualplot. Kommer på mandag! test for vekselvirkning og hovedeffekter afrapportering af estimater og konfidensintervaller Mandag: residualanalyse, forsøg med mere end to faktorer. StatBK (Uge 4, torsdag) Tosidet ANOVA 27 / 27