To-sidet variansanalyse



Relaterede dokumenter
To-sidet varians analyse

Program. 1. Varianskomponent-modeller (Random Effects) 2. Transformation af data. 1/12

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Modelkontrol i Faktor Modeller

Statistik Lektion 4. Variansanalyse Modelkontrol

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Module 12: Mere om variansanalyse

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration

Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model

Program. Residualanalyse Flersidet variansanalyse. Opgave BK.15. Modelkontrol: residualplot

Analysestrategi. Lektion 7 slides kompileret 27. oktober :24 p.1/17

Program. Ensidet variansanalyse Sammenligning af grupper. Statistisk model og hypotese. Eksempel: Aldersfordeling i hjertestudie

Ensidet variansanalyse

Multipel Lineær Regression

Modul 11: Simpel lineær regression

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Program. Flersidet variansanalyse og hierarkiske modeller. Eksempel: iltoptag for krabber. Eksempel: iltoptag for krabber.

Statistik Lektion 16 Multipel Lineær Regression

Module 12: Mere om variansanalyse

Generelle lineære modeller

Program. Forsøgsplanlægning og tosidet variansanalyse. Eksempel: fuldstændigt randomiseret forsøg. Forsøgstyper

Program. 1. Repetition: konfidens-intervaller. 2. Hypotese test, type I og type II fejl, signifikansniveau, styrke, en- og to-sidede test.

Faculty of Health Sciences. SPSS appendix. Basal Statistik: Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 22.

Opsamling Modeltyper: Tabelanalyse Logistisk regression Generaliserede lineære modeller Log-lineære modeller

Multipel regression. Data fra opgave 3 side 453: Multipel regressionsmodel: Y = α + β 1 x 1 + β 2 x 2 + ǫ. hvor ǫ N(0, σ 2 ).

Konfidensinterval for µ (σ kendt)

Økonometri lektion 5 Multipel Lineær Regression. Inferens Modelkontrol Prædiktion

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Anvendt Statistik Lektion 7. Simpel Lineær Regression

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer.

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Kapitel 12 Variansanalyse

Log-lineære modeller. Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres.

Statistik Lektion 17 Multipel Lineær Regression

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j

To samhørende variable

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup)

Statistik II Lektion 5 Modelkontrol. Modelkontrol Modelsøgning Større eksempel

Basal Statistik - SPSS

Eksamen i Statistik for biokemikere. Blok

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Kapitel 12 Variansanalyse

Sidste gang: One-way(ensidet)/one-factor ANOVA I dag: Two-factor ANOVA (Analysis of variance) Two-factor ANOVA med interaktion

Løsning til øvelsesopgaver dag 4 spg 5-9

Program. Tosidet variansanalyse og forsøgsplanlægning. Repetition: ensidet variansanalyse. Eksempel: data fra Collinge et al

Kursus Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, ( , ) Per Bruun Brockhoff

Økonometri: Lektion 6 Emne: Heteroskedasticitet

Basal Statistik - SPSS

Module 4: Ensidig variansanalyse

Økonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol

Reeksamen i Statistik for Biokemikere 6. april 2009

Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff

Reeksamen i Statistik for biokemikere. Blok

Dagens Temaer. Test for lineær regression. Test for lineær regression - via proc glm. k normalfordelte obs. rækker i proc glm. p. 1/??

Tovejs-ANOVA (Faktoriel) Regler og problemer kan generaliseres til mere end to hovedfaktorer med tilhørende interaktioner

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model

Basal Statistik - SPSS

Module 9: Residualanalyse

Normalfordelingen. Statistik og Sandsynlighedsregning 2

PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006

Basal Statistik - SPSS

Modul 7: Eksempler. 7.1 Beskrivende dataanalyse Diagrammer. Bent Jørgensen. Forskningsenheden for Statistik ST501: Science Statistik

Forelæsning 11: Envejs variansanalyse, ANOVA

1 Hb SS Hb Sβ Hb SC = , (s = )

Variansanalyse (ANOVA)

Eksamen i Statistik for Biokemikere, Blok januar 2009

Oversigt. 1 Intro: Regneeksempel og TV-data fra B&O. 2 Model og hypotese. 3 Beregning - variationsopspaltning og ANOVA tabellen

Modul 5: Test for én stikprøve

Økonometri: Lektion 4. Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater

Lagrange multiplier test. Økonometri: Lektion 6 Håndtering ad heteroskedasticitet. Konsekvenser af Heteroskedasticitet

Statistik II 4. Lektion. Logistisk regression

Synopsis til eksamen i Statistik

Økonometri: Lektion 6 Emne: Heteroskedasticitet

Oversigt. 1 Intro: Regneeksempel og TV-data fra B&O. 2 Model. 3 Beregning - variationsopspaltning og ANOVA tabellen. 4 Hypotesetest (F-test)

a) Har måleresultaterne for de 2 laboranter samme varians? b) Tyder resultaterne på, at nogen af laboranterne måler med en systematisk fejl?

Basal Statistik - SPSS

Transkript:

Program 1. To-sidet variansanalyse 2. Hierarkisk princip 3. Tre (og flere) sidet variansanalyse 4. Variansanalyse med blocking 5. Flersidet variansanalyse med tilfældige faktorer 6. En oversigtsslide til variansanalyse 1/12

To-sidet variansanalyse Eksempel: (opgave 14.2 side 587) vitamin indhold i frossen juice målt for ialt 9 kombinationer af mærke (Rich food, Sealed-sweet, Minute Maid) og tid i fryser (0, 3, 7 dage) - 4 gentagelser per kombination af de 2 faktorer. 0 3 7 Richfood 52.6 54.2 49.4 49.2 42.7 48.8 49.8 46.5 42.8 53.2 40.4 47.6 Sealed-sweet... Minute Maid... Hovedeffekt A: Hvilket mærke er bedst mht. vitamin? Hovedeffekt B: Ændrer frysetid på vitamin indholdet? Vekselvirkning (AB): Ændrer de forskellige mærker sig forskelligt med frysetiden? 2/12

To-sidet variansanalyse Model: Y ijk = µ ij + ǫ ijk = µ + α i + β j + (αβ) ij + ǫ ijk Niveauer i faktor A: i = 1,...,a Niveauer i faktor B: j = 1,...,b Gentagelser i hver kombination: k = 1,...,n Fejlled: ǫ ijk N(0, σ 2 ), uafhængige Parametre for hovedeffekter: α i og β j Paremetre for vekselvirkning: (αβ) ij 3/12

Hypoteser og ANOVA-tabel Hypoteser: H0 A : Ingen hovedeffekt fra faktor A (dvs. alle α i = 0) H0 B : Ingen hovedeffekt fra faktor B (dvs. alle β j = 0) H (AB) 0 : Ingen vekselvirkning mellem A og B (dvs. alle (αβ) ij = 0) ANOVA-tabel: Model SS df MS f A SSA a 1 MSA = SSA a 1 B SSB b 1 MSB = SSB b 1 AB SS(AB) (a 1)(b 1) MS(AB) = SS(AB) (a 1)(b 1) Error SSE ab(n 1) MSE = SSE k(n 1) Total SST abn 1 f A = MSA MSE f B = MSB MSE f (AB) = MS(AB) MSE Der hører en p-værdi til hver af af de første tre rækker - hvis p > α kan den pågældende hovedeffekt/vekselvirkning udelades. Bemærk: alle formler for SS erne er på side 579. 4/12

Hierarkisk princip Hvis to faktorer A og B har en signifikant vekselvirkning AB så ved vi at A har en effekt som dog afhænger af B og omvendt! I dette tilfælde tester man ikke om A og B hver især har en effekt, da de har en effekt igennem den anden faktor og derfor i alle praktiske betydninger påvirker dataen. Hierarkisk princip: Først testes vekselvirkning, og hvis denne ikke er signifikant, testet hovedeffekterne - ellers beholdes hovedeffekterne automatisk. 5/12

Fortolkning af parametre i SPSS Referencecelle: I SPSS er et niveau i hver faktor α a og β b sat lig 0 (istedet for at summen af alle niveauer er sat lig 0). Vekselvirkningerne (αβ) aj og (αβ) ib (i = 1,...,a og j = 1,...,b) er også sat til 0. (αβ) 11 (αβ) 12 0 α = (α 1,...,α a 1, 0) (αβ) 21 (αβ) 22 0 (αβ) =. β = (β 1,...,β b 1, 0)..... 0 0 0 Dvs. de andre α i angiver altså effekten på y ij af at skifte niveau fra i = a til et andet i (tilsvarende for β j og (αβ) ij ). Eksempel med a = 2 og b = 4: ŷ 2,4 = ˆµ ŷ 1,4 = ˆµ + ˆα 1 ŷ 1,3 = ˆµ + ˆα 1 + ˆβ 3 + (αβ) 1,3 6/12

Modelkontrol Husk at der er i flersidet ANOVA ligesom i ensidet er antaget at der ens varians i alle grupper, og at fejlleddene er normalfordelte - dette skal checkes for at vi kan regne men resultaterne i modellen: Varianshomogenitet: Brug Levene s test og scatter-plots af residualer vs. prediktioner (og evt. residualer vs. de forskellige niveauer i i et scatter-plot for hver faktor). Normalitet: Brug QQ-plots eller histogrammer for residualerne. 7/12

Tresidet variansanalyse Eksempel: løn vs. køn, race og stillingstype (fuld tid/deltid). Model: Y ijkl = µ+α i +β j +γ k +(αβ) ij +(αγ) ik +(βγ) jk +(αβγ) ijk +ǫ ijkl Intet nyt, bortset fra at vi nu har et 3. ordens interaktionsled. Fortolkning af signifikant 3. ordens interaktionsled: De forskellige niveauer i C ændrer hvordan de forskellige niveauer i B ændrer på effekten af A - altså noget sværere at forklare i praksis i i tilfældet med to faktorer. Man kan selvfølgelig også lave firesidet, femsidet osv. variansanalyse, men interaktionsleddene bliver ret obskurte at fortolke, og den nødvendige størrelse af datasættet vokser eksponentielt for at dække alle kombinationer af faktorer - overvej at indskrænke jeres forsøg istedet for at lave så komplicerede modeller hvor I varierer alt hvad I kan! 8/12

Tilbage til blocking Ensidet variansanalyse med blocking Y ijk = µ + α i + β j + ǫ ijk er egentlig blot en tosidet variansanalyse uden vekselvirkning, hvor man kun er intereseret i den ene faktor. Man bør i princippet også inkludere vekselsvirkningen når man bruger blocking. 9/12

Tosidet variansanalyse med tilfældig faktorer Tosidet variansanalyse: Alternativ: tilfældig blok effekter: Y ijk = µ + α i + β j + (αβ) ij + ǫ ijk Y ijk = µ + α i + B j + (αb) ij + ǫ ijk hvor B j N(0, σ 2 B ), (αb) ij N(0, σ 2 αb ) og ǫ ijk N(0, σ 2 ). VarY ijk = σ 2 B + σ2 αb + σ2. I flersidet variansanalyse kan man kombinere fast og tilfældige faktorer på mange måder, men der er forskel på udregningerne til at teste faktorer/vekselvirkning væk! (det klarer SPSS heldigvis) Bemærk: hvis bare en af faktorerne i en vekselsvirkning er tilfældig, så bliver vekselvirkningen også tilfældig. 10/12

Flersidet variansanalyse i SPSS SPSS kan lave alle tilfældene fra idag inde under Analyze General Linear Models Univariate I kan trække alle de faktorer i har lyst til ind i boxene fixed eller random factor. Husk at inde under Model kan I vælge Custom så i selv kan bestemme hvilke hovedeffekter og interaktionsled der skal med - hvis I skal inkludere interaktionsled med fx. to faktorer skal I markere begge faktorer (hold control-tasten inde mens I klikker på dem) og trække dem over. Benærk også at I kan lave interaktionsplot der visuelt viser de forskellige grupper - under knappen Plots kan I lave sådanne plots ved at trække de forskellige faktorer ind under Horizontal Axis, Separate Lines og Separate plots. 11/12

Variansanalyse: en opskrift Ting at gøre Hvordan SPSS Undersøg data Scatterplot/boxplots af data GC, Scatterplot/Boxplot Interaktionsplots AGU, Plots Lav model Inkl. alle faktorer AGU (faste/tilfældige) Tilpas model Fjern ikke signifikante faktorer AGU, Model (Check Sig.) (hierarkisk princip) Modelkontrol Histogram, QQ-plot og AGU, Plots/Save andre residual-plots samt Levene s test AGU, Options, Homo. tests Parametre Estimater, konfidensint. AGU, Options, Parameter est. Tukey s test (faste faktorer) AGU, Post Hoc, Prediktion Estimater AGU, Save GC = Graph Chart builder AGU = Analyze General Linear Models Univariate 12/12