Oversigt. Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff. Envejs variansanalyse - eksempel

Relaterede dokumenter
Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff

Forelæsning 11: Envejs variansanalyse, ANOVA

Oversigt. 1 Intro: Regneeksempel og TV-data fra B&O. 2 Model og hypotese. 3 Beregning - variationsopspaltning og ANOVA tabellen

k UAFHÆNGIGE grupper Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen 4 Hypotesetest (F-test)

Oversigt. 1 Intro: Regneeksempel og TV-data fra B&O. 2 Model. 3 Beregning - variationsopspaltning og ANOVA tabellen. 4 Hypotesetest (F-test)

k UAFHÆNGIGE grupper F-test Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Forelæsning 11: Tovejs variansanalyse, ANOVA

Forelæsning 11: Kapitel 11: Regressionsanalyse

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Kursus Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, ( , ) Per Bruun Brockhoff

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff

Forelæsning 9: Inferens for andele (kapitel 10)

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

Side 1 af 19 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402

Program. 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. 1/12

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup)

Muligheder: NB: test for µ 1 = µ 2 i model med blocking ækvivalent med parret t-test! Ide: anskue β j som stikprøve fra normalfordeling.

Model. k = 3 grupper: hvor ǫ ij uafhængige og normalfordelte med middelværdi nul og varians σi 2, i = 1,2,3.

To-sidet varians analyse

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff.

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse

(studienummer) (underskrift) (bord nr)

Opgave I.1 II.1 II.2 II.3 III.1 IV.1 IV.2 IV.3 V.1 VI.1 Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar

Løsning eksamen d. 15. december 2008

(studienummer) (underskrift) (bord nr)

Eksamen i Statistik for biokemikere. Blok

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

(studienummer) (underskrift) (bord nr)

Oversigt. Kursus Introduktion til Statistik. Forelæsning 2: Kapitel 4, Diskrete fordelinger. Per Bruun Brockhoff. Stokastiske Variable

Eksempel , opg. 2

Forelæsning 2: Kapitel 4, Diskrete fordelinger

Forelæsning 8: Inferens for varianser (kap 9)

Sidste gang: One-way(ensidet)/one-factor ANOVA I dag: Two-factor ANOVA (Analysis of variance) Two-factor ANOVA med interaktion

(studienummer) (underskrift) (bord nr)

Forelæsning 10: Statistik ved hjælp af simulering

(studienummer) (underskrift) (bord nr)

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Indhold. 2 Tosidet variansanalyse Additive virkninger Vekselvirkning... 9

Vejledende besvarelse af eksamen i Statistik for biokemikere, blok

Forelæsning 1: Intro og beskrivende statistik

Opgave I.1 I.2 II.1 II.2 III.1 III.2 IV.1 V.1 VI.1 VI.2 Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar

02402 Vejledende løsninger til Splus-opgaverne fra hele kurset

Modul 11: Simpel lineær regression

Danmarks Tekniske Universitet Side 1 af 19 sider

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j

Klasseøvelser dag 2 Opgave 1

1 Hb SS Hb Sβ Hb SC = , (s = )

Test nr. 5 af centrale elementer 02402

Løsning til eksaminen d. 29. maj 2009

Oversigt. Kursus Introduktion til Statistik. Forelæsning 1: Intro og beskrivende statistik. Per Bruun Brockhoff. Praktisk Information

Løsning til eksamen d.27 Maj 2010

Reeksamen i Statistik for biokemikere. Blok

Oversigt. Kursus Introduktion til Statistik. Forelæsning 10: Statistik ved hjælp af simulering. Per Bruun Brockhoff.

Tema. Dagens tema: Indfør centrale statistiske begreber.

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Program. Tosidet variansanalyse og forsøgsplanlægning. Repetition: ensidet variansanalyse. Eksempel: data fra Collinge et al

Oversigt. Kursus Introduktion til Statistik. Forelæsning 4: Kapitel 5: Kontinuerte fordelinger

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

Ovenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm.

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr)

Løsning til eksaminen d. 14. december 2009

Kursus 02402/02323 Introduktion til statistik. Forelæsning 13: Et overblik over kursets indhold. Klaus K. Andersen og Per Bruun Brockhoff

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6

(studienummer) (underskrift) (bord nr)

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model

Plot af B j + ǫ ij (Y ij µ α i )): σ 2 : within blocks variance. σb 2 : between blocks variance

Reeksamen i Statistik for Biokemikere 6. april 2009

Kursus 02323: Introducerende Statistik. Forelæsning 12: Forsøgsplanlægning. Peder Bacher

Konfidensintervaller og Hypotesetest

Forsøgsplanlægning Stikprøvestørrelse

Multipel regression. Data fra opgave 3 side 453: Multipel regressionsmodel: Y = α + β 1 x 1 + β 2 x 2 + ǫ. hvor ǫ N(0, σ 2 ).

1 enote 1: Simple plots og deskriptive statistik. 2 enote2: Diskrete fordelinger. 3 enote 2: Kontinuerte fordelinger

Oversigt. Kursus Introduktion til Statistik. Forelæsning 4: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff. Eksponential fordelingen

(studienummer) (underskrift) (bord nr)

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

Test nr. 4 af centrale elementer 02402

Multipel Lineær Regression

Multiple choice opgaver

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

En Introduktion til SAS. Kapitel 5.

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Module 4: Ensidig variansanalyse

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

Module 3: Statistiske modeller

Forsøgsplanlægning Stikprøvestørrelse

Program. Indhold af kursus i overskrifter. Farlighed af GM-majs? (Ingeniøren Generel lineær model/multipel regression

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Tovejs-ANOVA (Faktoriel) Regler og problemer kan generaliseres til mere end to hovedfaktorer med tilhørende interaktioner

Transkript:

Kursus 02402 Introduktion til Statistik Forelæsning 12: Variansanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: perbb@dtu.dk Oversigt 1 Model og hypotese Eksempel 1 Post hoc comparisons 2 Tovejs ANOVA Model og opspaltning af varians 3 Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 12 Foråret 2014 1 / 36 Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 12 Foråret 2014 2 / 36 Envejs variansanalyse - eksempel Envejs variansanalyse - eksempel Gruppe A Gruppe B Gruppe C 2.8 5.5 5.8 3.6 6.3 8.3 3.4 6.1 6.9 2.3 5.7 6.1 Er der forskel (i middel) på grupperne A, B og C? Variansanalyse (ANOVA) kan anvendes til analysen såfremt observationerne i hver gruppe kan antages at være normalfordelte. respons 3 4 5 6 7 8 Grafisk sammenligning af 3 grupper A B C grupper Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 12 Foråret 2014 4 / 36 Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 12 Foråret 2014 5 / 36

Envejs variansanalyse - eksempel Envejs variansanalyse - eksempel Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 12 Foråret 2014 6 / 36 Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 12 Foråret 2014 7 / 36 Model og hypotese Model og hypotese Envejs variansanalyse, model Envejs variansanalyse, hypotese hvor det antages, at Y ij = µ + α i + ɛ ij ɛ ij N(0, σ 2 ) µ er gennemsnit for alle målinger α i angiver niveau af gruppe i Vi vil nu sammenligne (flere end to) middelværdier µ + α i i modellen Y ij = µ + α i + ɛ ij, ɛ ij N(0, σ 2 ) dvs vi kan specificere hypotesen: H 0 : α i = 0 for alle i H 1 : α i 0 for mindst et i Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 12 Foråret 2014 8 / 36 Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 12 Foråret 2014 9 / 36

Envejs variansanalyse, opspaltning og ANOVA tabellen Formler for kvadratafvigelsessummer Svarende til modellen Y ij = µ + α i + ɛ ij, ɛ ij N(0, σ 2 ) kan den totale variation i data opspaltes: SST = SS(T r) + SSE Envejs hentyder til, at der kun er én faktor i forsøget, på i alt k nivauer Metoden kaldes variansanalyse, fordi testningen foregår ved at sammenligne varianser hvor SST = k n i yij 2 C i=1 SS(T r) = C = T. 2 N T i = j=1 k i=1 n i j=1 T 2 i n i C y ij T. = k i=1 T i Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 12 Foråret 2014 10 / 36 Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 12 Foråret 2014 11 / 36 Envejs variansanalyse, F-test Variations- Friheds- Kvadratafvig. Testkilde grader sum størrelse F Behandling k 1 SS(T r) Residual N-k SSE Total N-1 SST SS(T r)/(k 1) SSE/(N k) Vi har: fås teststørrelsen, F : SST = SS(T r) + SSE F = SS(T r)/(k 1) SSE/(N k) hvor k er antal nivauer af faktoren, og N er antal observationer Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 12 Foråret 2014 12 / 36 Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 12 Foråret 2014 13 / 36

Ensidig variansanalyse: test F-Fordeling Teststørrelsen F beregnes og signifikansniveau α vælges Eksempel paa en F fordeling F = SS(T r)/(k 1) SSE/(N k) Teststørrelsen sammenlignes med en fraktil i F fordelingen: F F α (k 1, N k) taethed 0.0 0.2 0.4 0.6 0 1 2 3 4 5 6 x Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 12 Foråret 2014 14 / 36 Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 12 Foråret 2014 15 / 36 F-fordeling F-fordeling Test af hypotese Test af hypotese taethed 0.0 0.2 0.4 0.6 Accept omraade F(f1,f2) Kritisk omraade taethed 0.0 0.2 0.4 0.6 95 % Accept omraade F(f1,f2) 5 % Kritisk omraade 0 1 2 3 4 5 6 x 0 1 2 3 4 5 6 x Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 12 Foråret 2014 16 / 36 Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 12 Foråret 2014 17 / 36

Eksempel 1 Eksempel 1 Eksempel 1 Eksempel 1 Ved målinger af gravitationskonstanten, G, benyttede Heyl (1930) kugler af tre forskellige materialer og fik bl.a. følgende observationer af G (enhed 10 11 Nm 2 kg 2 ) Materiale Måling Guld 6.683 6.681 6.676 6.678 6.679 Platin 6.661 6.661 6.667 6.667 6.664 Glas 6.678 6.671 6.675 6.672 6.674 maal 6.665 6.670 6.675 6.680 Guld Glas Platin 1.0 1.5 2.0 2.5 3.0 Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 12 Foråret 2014 18 / 36 Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 12 Foråret 2014 19 / 36 Eksempel 1 Post hoc comparisons Eksempel I Post hoc konfidensinterval Opstil en statistisk model for forsøget, og test om der er forskel på bestemmelse af gravitationskonstanten for de 3 materialer. Anvend signifikansniveau α = 5% Var. kilde SSQ df MS F teststørrelse Materiale 6.1053 10 4 Residual 9.5200 10 5 Total 7.0573 10 4 (Side 366) ȳ 1 ȳ 2 ± t α/2 s 2 ( 1 n 1 + 1 n 2 ) Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 12 Foråret 2014 20 / 36 Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 12 Foråret 2014 21 / 36

Tovejs ANOVA Tovejs ANOVA Et høreapparat skal tilpasses individuelt. En måde at validere et apparat på er at afspille en liste (eller serie) ord ved lavt volumen og bede patienten om at gentage ordene. I et studie ville man sammenligne 4 forskellige lister, der skulle have samme sværhedsgrad og samme antal ord Opstil en statistisk model for forsøget. Redegør for hvordan man kan teste om der er forskel i sværhedsgrad for de 4 lister. Burde undersøgelsen laves anderledes for at sikre valide resultater? Test list I 28 24 32 30 34 30 36 32... 40 list II 20 16 38 20 34 30 30 28... 44 list III 24 32 20 14 32 22 20 26... 34 list IV 26 24 22 18 24 30 22 28... 42 Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 12 Foråret 2014 23 / 36 Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 12 Foråret 2014 24 / 36 Tovejs ANOVA Tovejs variansanalyse Tovejs ANOVA Det viser sig, at man har anvendt de samme 24 personer til hver af de fire lister, som vist i tabellen Test/Person 1 2 3 4 5 6 7 8 24 list I 28 24 32 30 34 30 36 32... 40 list II 20 16 38 20 34 30 30 28... 44 list III 24 32 20 14 32 22 20 26... 34 list IV 26 24 22 18 24 30 22 28... 42 Vi antager nu, at vi har modellen Y ij = µ + α i + β j + ɛ ij, ɛ ij N(0, σ 2 ) dvs vi har to indelingskriterier, både α og β, hvor β også kan opfattes som en blok, hvorfor designet også kaldes et randomiseret blokforsøg Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 12 Foråret 2014 25 / 36 Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 12 Foråret 2014 26 / 36

Tovejs variansanalyse Tovejs ANOVA Tovejs ANOVA Model og opspaltning af varians Tovejs variansanalyse, Model og opspaltning af varians A 1 A 2 A 3 B 1 x x x B 2 x x x B 3 x x x B 4 x x x Svarende til modellen Y ij = µ + α i + β j + ɛ ij, ɛ ij N(0, σ 2 ) SST = SS(T r) + SS(Bl) + SSE Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 12 Foråret 2014 27 / 36 Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 12 Foråret 2014 28 / 36 Tovejs ANOVA Tovejs ANOVA Variations- Friheds- Kvadrat- Testkilde grader afvig.sum størrelse F Behandlig a 1 SS(T r) Blokke b 1 SS(Bl) Residual (a 1)(b 1) SSE Total N 1 SST SS(T r)/(a 1) SSE/((a 1)(b 1)) SS(Bl)/(b 1) SSE/((a 1)(b 1)) Kritisk værdi for blokke: F α (b 1, (a 1)(b 1)) Kritisk værdi for behandling: F α (a 1, (a 1)(b 1)) Det viser sig, at man har anvendt de samme 24 personer til hver af de fire lister, som vist i tabellen Test/Person 1 2 3 4 5 6 7 8 24 list I 28 24 32 30 34 30 36 32... 40 list II 20 16 38 20 34 30 30 28... 44 list III 24 32 20 14 32 22 20 26... 34 list IV 26 24 22 18 24 30 22 28... 42 Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 12 Foråret 2014 29 / 36 Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 12 Foråret 2014 30 / 36

Tovejs ANOVA Tovejs ANOVA Opstil en statistisk model for forsøget. Redegør for hvordan man kan teste om der er forskel i sværhedsgrad for de 4 lister. Var. kilde SSQ df MS F teststørrelse Liste 920.5 Person 3231.6 Residual 2506.5 Total 6658.6 15 20 25 30 35 40 45 List1 List2 List3 List4 Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 12 Foråret 2014 31 / 36 Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 12 Foråret 2014 32 / 36 > attach(c12tin) > Lab <- factor(lab) > anova(lm(weight~lab)) Analysis of Variance Table Response: weight Df Sum Sq Mean Sq F value Pr(>F) Lab 3 0.013006 0.0043354 2.8097 0.05038. Residuals 44 0.067892 0.0015430 --- Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 > attach(example) > treatm <- factor(treatm) > block <- factor(block) > anova(lm(y~treatm+block)) Analysis of Variance Table Response: y Terms added sequentially (first to last) Df Sum of Sq Mean Sq F Value Pr(F) treatm 2 56 28.00000 3.230769 0.1116192 block 3 90 30.00000 3.461538 0.0913831 Residuals 6 52 8.66667 Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 12 Foråret 2014 34 / 36 Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 12 Foråret 2014 35 / 36

Oversigt 1 Model og hypotese Eksempel 1 Post hoc comparisons 2 Tovejs ANOVA Model og opspaltning af varians 3 Per Bruun Brockhoff (perbb@dtu.dk) Introduktion til Statistik, Forelæsning 12 Foråret 2014 36 / 36