Program. 1. Flersidet variansanalyse 1/11



Relaterede dokumenter
To-sidet variansanalyse

Plot af B j + ǫ ij (Y ij µ α i )): σ 2 : within blocks variance. σb 2 : between blocks variance

Program. 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. 1/12

To-sidet varians analyse

Program. Residualanalyse Flersidet variansanalyse. Opgave BK.15. Modelkontrol: residualplot

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Modelkontrol i Faktor Modeller

Program. 1. Varianskomponent-modeller (Random Effects) 2. Transformation af data. 1/12

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Program. Forsøgsplanlægning og tosidet variansanalyse. Eksempel: fuldstændigt randomiseret forsøg. Forsøgstyper

Multipel regression. Data fra opgave 3 side 453: Multipel regressionsmodel: Y = α + β 1 x 1 + β 2 x 2 + ǫ. hvor ǫ N(0, σ 2 ).

Variansanalyse i SAS. Institut for Matematiske Fag December 2007

Analysestrategi. Lektion 7 slides kompileret 27. oktober :24 p.1/17

(tæt på N(0,1) hvis n ikke alt for lille). t i god til at checke for outliers som kan have stor indflydelse på estimaterne s 2 og ˆσ 2 e i

Modul 11: Simpel lineær regression

Statistik Lektion 4. Variansanalyse Modelkontrol

Eksamen i Statistik for biokemikere. Blok

Program. Flersidet variansanalyse og hierarkiske modeller. Eksempel: iltoptag for krabber. Eksempel: iltoptag for krabber.

Statistik Lektion 16 Multipel Lineær Regression

Program. Tosidet variansanalyse og forsøgsplanlægning. Repetition: ensidet variansanalyse. Eksempel: data fra Collinge et al

Indhold. 2 Tosidet variansanalyse Additive virkninger Vekselvirkning... 9

Module 4: Ensidig variansanalyse

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Eksempel , opg. 2

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Muligheder: NB: test for µ 1 = µ 2 i model med blocking ækvivalent med parret t-test! Ide: anskue β j som stikprøve fra normalfordeling.

Multipel Lineær Regression

1 Hb SS Hb Sβ Hb SC = , (s = )

Økonometri lektion 5 Multipel Lineær Regression. Inferens Modelkontrol Prædiktion

Generelle lineære modeller

Module 12: Mere om variansanalyse

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Kapitel 12 Variansanalyse

Lineær regression i SAS. Lineær regression i SAS p.1/20

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer.

Module 9: Residualanalyse

SPSS appendix SPSS APPENDIX. Box plots. Indlæsning. Faculty of Health Sciences. Basal Statistik: Sammenligning af grupper, Variansanalyse

Faculty of Health Sciences. SPSS appendix. Basal Statistik: Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 22.

SPSS appendix SPSS APPENDIX. Box plots. Indlæsning. Faculty of Health Sciences. Basal Statistik: Sammenligning af grupper, Variansanalyse

Sidste gang: One-way(ensidet)/one-factor ANOVA I dag: Two-factor ANOVA (Analysis of variance) Two-factor ANOVA med interaktion

Oversigt. 1 Intro: Regneeksempel og TV-data fra B&O. 2 Model. 3 Beregning - variationsopspaltning og ANOVA tabellen. 4 Hypotesetest (F-test)

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

Økonometri: Lektion 6 Emne: Heteroskedasticitet

Reeksamen i Statistik for biokemikere. Blok

Reeksamen i Statistik for Biokemikere 6. april 2009

1 Multipel lineær regression

Model. k = 3 grupper: hvor ǫ ij uafhængige og normalfordelte med middelværdi nul og varians σi 2, i = 1,2,3.

Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model

Module 12: Mere om variansanalyse

Eksamen i Statistik for Biokemikere, Blok januar 2009

Opsamling Modeltyper: Tabelanalyse Logistisk regression Generaliserede lineære modeller Log-lineære modeller

1 Multipel lineær regression

Kapitel 12 Variansanalyse

Økonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol

Program. Ensidet variansanalyse Sammenligning af grupper. Statistisk model og hypotese. Eksempel: Aldersfordeling i hjertestudie

Log-lineære modeller. Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres.

Regressionsanalyse i SAS

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression

Ensidet variansanalyse

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression

Module 3: Statistiske modeller

Lagrange multiplier test. Økonometri: Lektion 6 Håndtering ad heteroskedasticitet. Konsekvenser af Heteroskedasticitet

Program. Indhold af kursus i overskrifter. Farlighed af GM-majs? (Ingeniøren Generel lineær model/multipel regression

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model

Økonometri: Lektion 6 Emne: Heteroskedasticitet

Afdeling for Anvendt Matematik og Statistik Januar Regressionsanalyse i SAS 2. Regressionsanalyse med GLM Sammenligning af regressionslinier

Variansanalyse (ANOVA)

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1

Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration

n r x rs x r = 1 n r s=1 (x rs x r ) 2, s=1

Oversigt. Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff. Envejs variansanalyse - eksempel

Løsning til øvelsesopgaver dag 4 spg 5-9

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j

Økonometri: Lektion 4. Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater

Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff

eksaminand nr Opgavesættet består af 3 sædvanlige (essay) opgaver samt et antal opgaver af multiple choice typen.

Modul 6: Regression og kalibrering

Vi ønsker at konstruere normalområder for stofskiftet, som funktion af kropsvægten.

Program. Sammenligning af grupper Ensidet ANOVA. Case 3, del II: Fiskesmag i lammekød. Case 3, del I: A-vitamin i leveren

Logistisk regression

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)

Økonometri: Lektion 2 Multipel Lineær Regression 1/27

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i.

Basal Statistik - SPSS

Basal Statistik - SPSS

Basal Statistik - SPSS

Statistik og skalavalidering Synopsis. Eksamensnumre 15, 33 og 45

Opgavebesvarelse, korrelerede målinger

k normalfordelte observationsrækker (ensidet variansanalyse)

Eksamen i statistik 2010 Kandidatuddannelsen i folkesundhedsvidenskab

Tovejs-ANOVA (Faktoriel) Regler og problemer kan generaliseres til mere end to hovedfaktorer med tilhørende interaktioner

Forelæsning 11: Envejs variansanalyse, ANOVA

Perspektiver i Matematik-Økonomi: Linær regression

Kvantitative metoder 2

Logistisk regression

1 Regressionsproblemet 2

Transkript:

Program 1. Flersidet variansanalyse 1/11

To-sidet variansanalyse Eksempel: (opgave 14.2 side 587) vitamin indhold i frossen juice målt for ialt 9 kombinationer af mærke (Rich food, Sealed-sweet, Minute Maid) og tid i fryser (0, 3, 7 dage) - 4 gentagelser per kombination af de 2 faktorer. 0 3 7 Richfood 52.6 54.2 49.4 49.2 42.7 48.8 49.8 46.5 42.8 53.2 40.4 47.6 Sealed-sweet... Minute Maid... Hovedeffekt A: Hvilket mærke er bedst mht. vitamin? Hovedeffekt B: Ændrer frysetid på vitamin indholdet? Vekselvirkning (AB): Ændrer de forskellige mærker sig forskelligt med tiden? 2/11

To-sidet variansanalyse Model: Y ijk = µ ij + ǫ ijk = µ + α i + β j + (αβ) ij + ǫ ijk Niveauer i faktor A: i = 1,...,a Niveauer i faktor B: j = 1,...,b Gentagelser i hver kombination: k = 1,...,n Fejlled: ǫ ijk N(0, σ 2 ), uafhængige Parametre for hovedeffekter: α i og β j Paremetre for vekselvirkning: (αβ) ij 3/11

Hypoteser og ANOVA-tabel Hypoteser: H A 0 H B 0 : Ingen hovedeffekt fra faktor A : Ingen hovedeffekt fra faktor B H (AB) 0 : Ingen vekselvirkning mellem A og B ANOVA-tabel: Model SS df MS f A SSA a 1 MSA = SSA a 1 B SSB b 1 MSB = SSB b 1 AB SS(AB) (a 1)(b 1) MS(AB) = SS(AB) (a 1)(b 1) Error SSE ab(n 1) MSE = SSE k(n 1) Total SST abn 1 Hvis p > α kan den pågældende hovedeffekt/vekselvirkning udelades. Bemærk: formler for SS på side 579. f A = MSA MSE f B = MSB MSE f (AB) = MS(AB) MSE 4/11

Hierarkisk princip Hvis to faktorer A og B har en signifikant vekselvirkning AB så ved vi at A har en effekt som dog afhænger af B og omvendt! I dette tilfælde tester man ikke om A og B hver især har en effekt. Hierarkisk princip: Først testes vekselvirkning, og hvis denne ikke er signifikant, testet hovedeffekterne - ellers beholdes hovedeffekterne automatisk. 5/11

Fortolkning af parametre i SPSS Referencecelle: I SPSS er et niveau i hver faktor α a og β b sat lig 0 (istedet for at summen af alle niveauer er sat lig 0). Vekselvirkningerne (αβ) aj og (αβ) ib (i = 1,...,a og j = 1,...,b) er også sat til 0. (αβ) 11 (αβ) 12 0 α = (α 1,...,α a 1, 0) (αβ) 21 (αβ) 22 0 (αβ) =. β = (β 1,...,β b 1, 0)..... 0 0 0 Dvs. de andre α i angiver altså effekten på y ij af at skifte niveau fra i = a til et andet i (tilsvarende for β j og (αβ) ij ). Eksempel med a = 2 og b = 4: ŷ 2,4 = ˆµ ŷ 1,4 = ˆµ + ˆα 1 ŷ 1,3 = ˆµ + ˆα 1 + ˆβ 3 + (αβ) 1,3 6/11

Modelkontrol Varianshomogenitet: Levene s test og plots af residualer vs. prediktioner. Normalitet: QQ-plots eller histogrammer af residualer 7/11

Tresidet variansanalyse Eksempel: løn vs. køn, race og stillingstype (fuld tid/deltid). Model: Y ijkl = µ+α i +β j +γ k +(αβ) ij +(αγ) ik +(βγ) jk +(αβγ) ijk +ǫ ijkl Intet nyt, bortset fra at vi nu har et 3. ordens interaktionsled. Fortolkning af signifikant 3. ordens interaktionsled: De forskellige niveauer i C ændrer hvordan de forskellige niveauer i B ændrer på effekten af A. Man kan selvfølgelig også lave firesidet, femsidet osv. variansanalyse, men parametrene bliver ret obskurte at fortolke, og den nødvendige størrelse af datasættet vokser eksponentielt for at dække alle kombinationer - overvej at indskrænke jeres forsøg istedet for at lave så komplicerede modeller! 8/11

Tilbage til blocking Ensidet variansanalyse med blocking Y ijk = µ + α i + β j + ǫ ijk er egentlig blot en tosidet variansanalyse uden vekselvirkning, hvor man kun er intereseret i den ene faktor. Man bør i princippet også inkludere vekselsvirkningen. 9/11

Tosidet variansanalyse med tilfældig faktorer Tosidet variansanalyse: Alternativ: tilfældig blok effekter: Y ijk = µ + α i + β j + (αβ) ij + ǫ ijk Y ijk = µ + α i + B j + (αb) ij + ǫ ijk hvor B j N(0, σ 2 B ), (αb) ij N(0, σ 2 αb ) og ǫ ijk N(0, σ 2 ). VarY ijk = σ 2 B + σ2 αb + σ2. I flersidet variansanalyse kan man kombinere fast og tilfældige faktorer på mange måder, men der er forskel på udregningerne til at teste faktorer/vekselvirkning væk! (det klarer SPSS heldigvis) Bemærk: hvis bare en af faktorerne i en vekselsvirkning er tilfældig, så bliver vekselvirkningen også tilfældig. 10/11

Variansanalyse: en opskrift Ting at gøre Hvordan SPSS Undersøg data Scatterplot/boxplots af data GC, Scatterplot/Boxplot Interaktionsplots AGU, Plots Lav model Inkl. alle faktorer AGU (faste/tilfældige) Tilpas model Fjern ikke signifikante faktorer AGU, Model (Check Sig.) (hierarkisk princip) Modelkontrol Histogram, QQ-plot og AGU, Plots/Save andre residual-plots samt Levene s test AGU, Options, Homo. tests Parametre Estimater, konfidensint. AGU, Options, Parameter est. Tukey s test (faste faktorer) AGU, Post Hoc, Prediktion Estimater AGU, Save GC = Graph Chart builder AGU = Analyze General Linear Models Univariate 11/11