To-sidet variansanalyse

Program 1. To-sidet variansanalyse 2. Hierarkisk princip 3. Tre (og flere) sidet variansanalyse 4. Variansanalyse med blocking 5. Flersidet variansanalyse med tilfældige faktorer 6. En oversigtsslide til variansanalyse 1/12

To-sidet variansanalyse Eksempel: (opgave 14.2 side 587) vitamin indhold i frossen juice målt for ialt 9 kombinationer af mærke (Rich food, Sealed-sweet, Minute Maid) og tid i fryser (0, 3, 7 dage) - 4 gentagelser per kombination af de 2 faktorer. 0 3 7 Richfood 52.6 54.2 49.4 49.2 42.7 48.8 49.8 46.5 42.8 53.2 40.4 47.6 Sealed-sweet... Minute Maid... Hovedeffekt A: Hvilket mærke er bedst mht. vitamin? Hovedeffekt B: Ændrer frysetid på vitamin indholdet? Vekselvirkning (AB): Ændrer de forskellige mærker sig forskelligt med frysetiden? 2/12

To-sidet variansanalyse Model: Y ijk = µ ij + ǫ ijk = µ + α i + β j + (αβ) ij + ǫ ijk Niveauer i faktor A: i = 1,...,a Niveauer i faktor B: j = 1,...,b Gentagelser i hver kombination: k = 1,...,n Fejlled: ǫ ijk N(0, σ 2 ), uafhængige Parametre for hovedeffekter: α i og β j Paremetre for vekselvirkning: (αβ) ij 3/12

Hypoteser og ANOVA-tabel Hypoteser: H0 A : Ingen hovedeffekt fra faktor A (dvs. alle α i = 0) H0 B : Ingen hovedeffekt fra faktor B (dvs. alle β j = 0) H (AB) 0 : Ingen vekselvirkning mellem A og B (dvs. alle (αβ) ij = 0) ANOVA-tabel: Model SS df MS f A SSA a 1 MSA = SSA a 1 B SSB b 1 MSB = SSB b 1 AB SS(AB) (a 1)(b 1) MS(AB) = SS(AB) (a 1)(b 1) Error SSE ab(n 1) MSE = SSE k(n 1) Total SST abn 1 f A = MSA MSE f B = MSB MSE f (AB) = MS(AB) MSE Der hører en p-værdi til hver af af de første tre rækker - hvis p > α kan den pågældende hovedeffekt/vekselvirkning udelades. Bemærk: alle formler for SS erne er på side 579. 4/12

Hierarkisk princip Hvis to faktorer A og B har en signifikant vekselvirkning AB så ved vi at A har en effekt som dog afhænger af B og omvendt! I dette tilfælde tester man ikke om A og B hver især har en effekt, da de har en effekt igennem den anden faktor og derfor i alle praktiske betydninger påvirker dataen. Hierarkisk princip: Først testes vekselvirkning, og hvis denne ikke er signifikant, testet hovedeffekterne - ellers beholdes hovedeffekterne automatisk. 5/12

Fortolkning af parametre i SPSS Referencecelle: I SPSS er et niveau i hver faktor α a og β b sat lig 0 (istedet for at summen af alle niveauer er sat lig 0). Vekselvirkningerne (αβ) aj og (αβ) ib (i = 1,...,a og j = 1,...,b) er også sat til 0. (αβ) 11 (αβ) 12 0 α = (α 1,...,α a 1, 0) (αβ) 21 (αβ) 22 0 (αβ) =. β = (β 1,...,β b 1, 0)..... 0 0 0 Dvs. de andre α i angiver altså effekten på y ij af at skifte niveau fra i = a til et andet i (tilsvarende for β j og (αβ) ij ). Eksempel med a = 2 og b = 4: ŷ 2,4 = ˆµ ŷ 1,4 = ˆµ + ˆα 1 ŷ 1,3 = ˆµ + ˆα 1 + ˆβ 3 + (αβ) 1,3 6/12

Modelkontrol Husk at der er i flersidet ANOVA ligesom i ensidet er antaget at der ens varians i alle grupper, og at fejlleddene er normalfordelte - dette skal checkes for at vi kan regne men resultaterne i modellen: Varianshomogenitet: Brug Levene s test og scatter-plots af residualer vs. prediktioner (og evt. residualer vs. de forskellige niveauer i i et scatter-plot for hver faktor). Normalitet: Brug QQ-plots eller histogrammer for residualerne. 7/12

Tresidet variansanalyse Eksempel: løn vs. køn, race og stillingstype (fuld tid/deltid). Model: Y ijkl = µ+α i +β j +γ k +(αβ) ij +(αγ) ik +(βγ) jk +(αβγ) ijk +ǫ ijkl Intet nyt, bortset fra at vi nu har et 3. ordens interaktionsled. Fortolkning af signifikant 3. ordens interaktionsled: De forskellige niveauer i C ændrer hvordan de forskellige niveauer i B ændrer på effekten af A - altså noget sværere at forklare i praksis i i tilfældet med to faktorer. Man kan selvfølgelig også lave firesidet, femsidet osv. variansanalyse, men interaktionsleddene bliver ret obskurte at fortolke, og den nødvendige størrelse af datasættet vokser eksponentielt for at dække alle kombinationer af faktorer - overvej at indskrænke jeres forsøg istedet for at lave så komplicerede modeller hvor I varierer alt hvad I kan! 8/12

Tilbage til blocking Ensidet variansanalyse med blocking Y ijk = µ + α i + β j + ǫ ijk er egentlig blot en tosidet variansanalyse uden vekselvirkning, hvor man kun er intereseret i den ene faktor. Man bør i princippet også inkludere vekselsvirkningen når man bruger blocking. 9/12

Tosidet variansanalyse med tilfældig faktorer Tosidet variansanalyse: Alternativ: tilfældig blok effekter: Y ijk = µ + α i + β j + (αβ) ij + ǫ ijk Y ijk = µ + α i + B j + (αb) ij + ǫ ijk hvor B j N(0, σ 2 B ), (αb) ij N(0, σ 2 αb ) og ǫ ijk N(0, σ 2 ). VarY ijk = σ 2 B + σ2 αb + σ2. I flersidet variansanalyse kan man kombinere fast og tilfældige faktorer på mange måder, men der er forskel på udregningerne til at teste faktorer/vekselvirkning væk! (det klarer SPSS heldigvis) Bemærk: hvis bare en af faktorerne i en vekselsvirkning er tilfældig, så bliver vekselvirkningen også tilfældig. 10/12

Flersidet variansanalyse i SPSS SPSS kan lave alle tilfældene fra idag inde under Analyze General Linear Models Univariate I kan trække alle de faktorer i har lyst til ind i boxene fixed eller random factor. Husk at inde under Model kan I vælge Custom så i selv kan bestemme hvilke hovedeffekter og interaktionsled der skal med - hvis I skal inkludere interaktionsled med fx. to faktorer skal I markere begge faktorer (hold control-tasten inde mens I klikker på dem) og trække dem over. Benærk også at I kan lave interaktionsplot der visuelt viser de forskellige grupper - under knappen Plots kan I lave sådanne plots ved at trække de forskellige faktorer ind under Horizontal Axis, Separate Lines og Separate plots. 11/12

Variansanalyse: en opskrift Ting at gøre Hvordan SPSS Undersøg data Scatterplot/boxplots af data GC, Scatterplot/Boxplot Interaktionsplots AGU, Plots Lav model Inkl. alle faktorer AGU (faste/tilfældige) Tilpas model Fjern ikke signifikante faktorer AGU, Model (Check Sig.) (hierarkisk princip) Modelkontrol Histogram, QQ-plot og AGU, Plots/Save andre residual-plots samt Levene s test AGU, Options, Homo. tests Parametre Estimater, konfidensint. AGU, Options, Parameter est. Tukey s test (faste faktorer) AGU, Post Hoc, Prediktion Estimater AGU, Save GC = Graph Chart builder AGU = Analyze General Linear Models Univariate 12/12