Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration



Relaterede dokumenter
Program. Logistisk regression. Eksempel: pesticider og møl. Odds og odds-ratios (igen)

Kursus Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, ( , ) Per Bruun Brockhoff

Program. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data

To samhørende variable

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Modelkontrol i Faktor Modeller

Program. Sammenligning af grupper Ensidet ANOVA. Case 3, del II: Fiskesmag i lammekød. Case 3, del I: A-vitamin i leveren

Program. Residualanalyse Flersidet variansanalyse. Opgave BK.15. Modelkontrol: residualplot

Løsning til øvelsesopgaver dag 4 spg 5-9

Analysestrategi. Lektion 7 slides kompileret 27. oktober :24 p.1/17

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup)

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006

Modul 7: Eksempler. 7.1 Beskrivende dataanalyse Diagrammer. Bent Jørgensen. Forskningsenheden for Statistik ST501: Science Statistik

Program. Simpel og multipel lineær regression. I tirsdags: model og estimation. I tirsdags: Prædikterede værdier og residualer

Program. Forsøgsplanlægning og tosidet variansanalyse. Eksempel: fuldstændigt randomiseret forsøg. Forsøgstyper

Program. Ensidet variansanalyse Sammenligning af grupper. Statistisk model og hypotese. Eksempel: Aldersfordeling i hjertestudie

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Ensidet variansanalyse

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse

To-sidet variansanalyse

Konfidensinterval for µ (σ kendt)

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk

Multipel Lineær Regression

Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model

Susanne Ditlevsen Institut for Matematiske Fag susanne

Opsamling Modeltyper: Tabelanalyse Logistisk regression Generaliserede lineære modeller Log-lineære modeller

Note til styrkefunktionen

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse

Hypotese test. Repetition fra sidst Hypoteser Test af middelværdi Test af andel Test af varians Type 1 og type 2 fejl Signifikansniveau

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Statistik Lektion 4. Variansanalyse Modelkontrol

Program. 1. Varianskomponent-modeller (Random Effects) 2. Transformation af data. 1/12

Basal statistik. 30. januar 2007

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Modul 11: Simpel lineær regression

Forelæsning 11: Kapitel 11: Regressionsanalyse

Statistik II 4. Lektion. Logistisk regression

Module 12: Mere om variansanalyse

Module 4: Ensidig variansanalyse

Oversigt. Course 02402/02323 Introducerende Statistik. Forelæsning 3: Kontinuerte fordelinger. Per Bruun Brockhoff

Økonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol

Modul 6: Regression og kalibrering

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Reeksamen i Statistik for Biokemikere 6. april 2009

Module 9: Residualanalyse

Kvantitative Metoder 1 - Forår Dagens program

Konfidensintervaller og Hypotesetest

Program. 1. Repetition: konfidens-intervaller. 2. Hypotese test, type I og type II fejl, signifikansniveau, styrke, en- og to-sidede test.

Epidemiologi og Biostatistik

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer.

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Valgkampens og valgets matematik

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Økonometri lektion 5 Multipel Lineær Regression. Inferens Modelkontrol Prædiktion

Dagens Emner. Likelihood teori. Lineær regression (intro) p. 1/22

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression

Dagens Temaer. Test for lineær regression. Test for lineær regression - via proc glm. k normalfordelte obs. rækker i proc glm. p. 1/??

Logistisk regression. Basal Statistik for medicinske PhD-studerende November 2008

Løsning eksamen d. 15. december 2008

Modul 5: Test for én stikprøve

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge

Statistisk modellering og regressionsanalyse

9. Chi-i-anden test, case-control data, logistisk regression.

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge

Velkommen til kurset. Teoretisk Statistik. Lærer: Niels-Erik Jensen

Statistik Lektion 16 Multipel Lineær Regression

Multipel regression 22. Maj, 2012

Rygtespredning: Et logistisk eksperiment

Dagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Statistik kommandoer i Stata opdateret 16/ Erik Parner

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Tema. Dagens tema: Indfør centrale statistiske begreber.

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge

Løsning til eksaminen d. 14. december 2009

02402 Løsning til testquiz02402f (Test VI)

Statistik i basketball

Faculty of Health Sciences. Logistisk regression: Kvantitative forklarende variable

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Program. Tosidet variansanalyse og forsøgsplanlægning. Repetition: ensidet variansanalyse. Eksempel: data fra Collinge et al

Transkript:

Faculty of Life Sciences Program Modelkontrol og prædiktion Claus Ekstrøm E-mail: ekstrom@life.ku.dk Test af hypotese i ensidet variansanalyse F -tests og F -fordelingen. Multiple sammenligninger. Bonferroni-korrektion Opsummering af statistiske modeller/eksempler Modelkontrol Prædiktion Slide 2 Statistisk Dataanalyse 1 (Uge 4-2) Modelkontrol og prædiktion Multiple sammenligninger Opgave 5.2: fosforkoncentration Lineær regression Hver gang vil laver et test er der risiko for at lave en fejl af type I. Risikoen afhænger af signifikansniveauet ofte 5%. Ved et test: risiko for fejl: 5% Ved m tests: 1 0.95 m Probability 0.0 0.2 0.4 0.6 0.8 1.0 0 10 20 30 40 50 No. of tests (m) Uge 1 2 3 4 5 6 7 8 9 Forfor 0.51 0.48 0.44 0.44 0.39 0.35 0.28 0.24 0.19 Statistisk model: fosfor i = α + β uge i + e i, R: model1 <- lm(fosfor ~uge) Slide 3 Statistisk Dataanalyse 1 (Uge 4-2) Modelkontrol og prædiktion Slide 4 Statistisk Dataanalyse 1 (Uge 4-2) Modelkontrol og prædiktion

Opgave 6.7: vægttilvækst hos kyllinger Opgave 6.1: drægtighed for heste Ensidet ANOVA Statistisk model: Feed type Weight gain 1 55 49 42 21 52 2 61 112 30 89 63 3 42 97 81 95 92 4 169 137 169 85 154 gain i = α feed(i) + e i, R: model2 <- lm(gain~factor(feed)) Bemærk factor(feed)! En enkelt stikprøve Drægtighedstider for 13 heste: 339 339 339 340 341 340 343 348 341 346 342 339 337 Statistisk model: gest i N(µ,σ 2 ) uafhængige Modellen kan også skrives: gest i = µ + e i, R: model3 <- lm(gest~1) Slide 5 Statistisk Dataanalyse 1 (Uge 4-2) Modelkontrol og prædiktion Slide 6 Statistisk Dataanalyse 1 (Uge 4-2) Modelkontrol og prædiktion Alle modeller fosfor i = α + β uge i +e i, gain i = α feed(i) +e i, gest i = µ+e i, Variabeltyper: Responsvariabel, y: fosfor, gain, gest Forklarende variabel: age (kvantitativ), feed (faktor/kategorisk) Antagelser: Alle e i (eller y i ) er normalfordelte Middelværdien af y i afhænger evt. af en forklarende variabel Alle e i (eller y i ) har samme spredning e 1,...,e n (eller y 1,...,y n ) uafhængige Resumé 1: statistiske modeller og inferens Modellerne for lineær regression, ensidet variansanalyse og en enkelt stikprøve er i virkeligheden meget ens! Det er derfor den statistiske inferens også er den samme i de tre slags modeller (p er antallet af middelværdiparametre): middelværdiparametre estimeres med LS spredningen σ estimeres på samme måde Konfidensintervaller: estimat ± t 0.975,n p SE(estimat) Hypotesetest udføres som t-test eller F -test Modellerne kan udvides til at omfatte flere forklarende variable kvantitative variable og/eller faktorer. Lineære normale modeller: y i = middelværdi i + e i Slide 7 Statistisk Dataanalyse 1 (Uge 4-2) Modelkontrol og prædiktion Slide 8 Statistisk Dataanalyse 1 (Uge 4-2) Modelkontrol og prædiktion

Residualer Forventet værdi eller fittet værdi eller prædikteret værdi, ŷ i : ŷ i = fosfor i = ˆα + ˆβ x i ŷ i = ĝain i = ˆα g(i) ŷ i = ĝest i = ˆµ Residualer: r i = y i ŷ i = observeret fittet Residualerne er vores bedste gæt på e erne! Så ˆσ = s = 1 n p n i=1 ri 2 hvor p er antal middelværdiparametre (2, k, 1) residualerne kan bruges til modelkontrol! Residualer i R > model1 <- lm(fosfor~uge) ## Lineær regression > fit1 <- fitted(model1) ## Fittede værdier > res1 <- residuals(model1) ## Rå residualer > stdres1 <- rstandard(model1) ## Standard. residualer > model2 <- lm(gain~factor(feed)) > fit2 <- fitted(model2) > res2 <- residuals(model2) > stdres2 <- rstandard(model2) Og hvis du har isdals installeret > residualplot(model1) Residualerne kan standardiseres så de har spredning 1: r i = r i /SE(r i ). Slide 9 Statistisk Dataanalyse 1 (Uge 4-2) Modelkontrol og prædiktion Slide 10 Statistisk Dataanalyse 1 (Uge 4-2) Modelkontrol og prædiktion Modelkontrol: hvorfor? Modelkontrol består i at kontrollere om modelantagelserne er rimelige for vores data. Hvorfor skal vi lave modelkontrol? Hvis antagelserne er ok, så indeholder 95%-CI populationsværdien med 95% sandsynlighed, og p-værdierne er korrekte. Vi kan stole på vores resultater! Hvis antagelserne ikke er ok, så ved vi ikke om vi kan stole på vores resultater! Antagelserne om e 1,...,e n kontrolleres vha. de standardiserede residualer r 1,..., r n. Modelkontrol: hvordan? Antagelser: 1. e i er normalfordelt 2. e i har middelværdi 0 uanset de forklarende variable 3. e i har samme spredning uanset de forklarende variable 4. e 1,...,e n uafhængige Hvordan? Uafhængighed er snarere et spørgsmål om eksperimentielt design Kontrollerer de tre første antagelser om e 1,...,e n vha. de standardiserede residualer r 1,..., r n Thorvald Nicolai Thiele, 1838 1910 Man skal tegne før man kan regne Slide 11 Statistisk Dataanalyse 1 (Uge 4-2) Modelkontrol og prædiktion Slide 12 Statistisk Dataanalyse 1 (Uge 4-2) Modelkontrol og prædiktion

Plantevækst og fosfor: antagelse 1 Plantevækst og fosfor: antagelse 2 og 3 Sample Quantiles 1.0 0.5 0.0 0.5 1.0 1.5 Normal Q Q Plot 1.5 1.0 0.5 0.0 0.5 1.0 1.5 Theoretical Quantiles Antagelse 1. e i er normalfordelt: QQ-plot over r 1,..., r n Sammenlign med ret linie, med skæring 0 og hældning 1 Standardized residuals 1.0 0.5 0.0 0.5 1.0 1.5 0.20 0.30 0.40 0.50 Fitted values Hvis man har installeret isdals kan man bruge residualplot(model) Antagelse 2. og 3. e i har middelværdi 0 og samme spredning Residualplot, r i mod ŷ i Ingen systematik i den lodrette variation Er det outliers, dvs. ekstreme observationer? ( r 1,..., r n har spredning 1) Slide 13 Statistisk Dataanalyse 1 (Uge 4-2) Modelkontrol og prædiktion Slide 14 Statistisk Dataanalyse 1 (Uge 4-2) Modelkontrol og prædiktion Residualplot for to andre datasæt Residualanalyse for kyllingedata Andemad (eks. 2.4 og 6.2) Pillbugs/bænkebidere (case 2) QQ-plot Residualplot Std. residuals 1 0 1 2 rstandard(model2) 2 1 0 1 2 Sample Quantiles 2 1 0 1 stdres2 2 1 0 1 1000 1000 3000 5000 Predicted values 50 100 150 fitted(model2) 2 1 0 1 2 Theoretical Quantiles 40 60 80 100 120 140 fit2 Slide 15 Statistisk Dataanalyse 1 (Uge 4-2) Modelkontrol og prædiktion Slide 16 Statistisk Dataanalyse 1 (Uge 4-2) Modelkontrol og prædiktion

Antagelse 4: uafhængighed Resumé 2: modelkontrol Kan som regel ikke testes vha. data (residualer), men er snarere et spørgsmål om eksperimentets design. Observationerne må ikke dele information. Hvis en observation ligger højere end forventet, ændrer det så vores viden om hvorvidt de nogle af de øvrige observationer ligger højere/lavere end forventet? Eksempler på afhængige data: Data fra samme marker, samme personer, samme planter, etc. Data fra søskende, kuld,... Sommetider vil vi gerne have afhængighed men så skal der tages højde for det i modellen. Det er ekstremt vigtigt at at lave modelkontrol, for ellers ved vi ikke om vi kan stole på konfidensintervaller, p-værdier osv. Modelkontrol udføres først og fremmest grafisk, vha. residualplot og QQ-plot for standardiserede residualer. Især residualplottet er vigtigt! I residualplottet skal den lodrette variation være tilfældig. Må ikke være systematisk forskellige fra venstre til højre. Meget store standardiserede residualer svarer til ekstreme observationer eller outliers. Bør undersøges nærmere. I QQ-plottet skal punkterne som sædvanlig være spredt tilfældigt om en ret linie, her linien med skæring 0 og hældning 1. Er det rimeligt at antage uafhængighed? Slide 17 Statistisk Dataanalyse 1 (Uge 4-2) Modelkontrol og prædiktion Slide 18 Statistisk Dataanalyse 1 (Uge 4-2) Modelkontrol og prædiktion Plantevækst og fosfor: prædiktion Plante bliver fulgt i 7 uger. Forventet forforkoncentration er α + β 7 der estimeres til ŷ = ˆα + ˆβ 7 = 0.56972 0.04017 7 = 0.28853 med estimeret spredning (side 110) 1 (7 x)2 SE(ŷ 0 ) = s + = 0.02031 0.4216 = 0.00856 n SS x 95%-konfidensinterval: 0.28853 ± 2.306 0.00856 = (0.2688; 0.3083) En plante på 7 uger får målt forfoskoncentrationen til 0.25. Hvorfor kan vi ikke bruge konfidensintervallet til at afgøre om det er usædvanligt? Plantevækst og fosfor: prædiktion Konfidensintervallet udtaler sig om den forventede værdi ikke en ny observation. Konfidensintervallet tager kun hensyn til estimationfejlen ikke observationsfejlen. 95%-prædiktionsinterval: Plante på 7 uger: ŷ ± t 0.975,n 2 s 1 + 1 n + (x 0 x) 2 SS x ŷ ± 2.306 0.02031 1 + 0.4216 = (0.2377,0.3394) Er en fosforkoncentration på 0.25 usædvanlig for en plante på 7 uger? Slide 19 Statistisk Dataanalyse 1 (Uge 4-2) Modelkontrol og prædiktion Slide 20 Statistisk Dataanalyse 1 (Uge 4-2) Modelkontrol og prædiktion

Konfidensinterval vs. prædiktionsinterval Resumé 3: prædiktion Fatpct 0 10 20 30 40 50 20 30 40 50 60 Age CI vs. PI: Fortolkning: forventet værdi eller ny observation PI altid bredere end CI CI kan gøres vilkåligt smalt ved at øge n, PI kan ikke Prædiktion i ensidet ANOVA og en enkelt stikprøve: se afsnit 7.2.3! Prædiktion handler om at forudsige nye observationer. 95%-prædiktionsintervallet indeholder med sandsynlighed 95% en ny observation for en given værdi af de(n) forklarende variabel. Et prædiktionsintervaller er altid bredere end det tilsvarende konfidensinterval fordi det ogå tager hensyn til observationsfejlen Kan ikke gøres vilkårligt smalle ved at øge n. Slide 21 Statistisk Dataanalyse 1 (Uge 4-2) Modelkontrol og prædiktion Slide 22 Statistisk Dataanalyse 1 (Uge 4-2) Modelkontrol og prædiktion Resumé 1 3 Dagens hovedpunkter Modellerne for lineær regression, ensidet ANOVA og en enkelt stikprøve er samme suppe. Samme antagelser på nær specifikationen af middelværdien To typer forklarende variable: kvantitative og faktorer Statistisk inferens ens : LS-estimation, konfidensintervaller, test, prædiktion, modelkontrol Flere forklarende variable kan kobles på stadig samme modeltype og samme måde at lave statistisk inferens Modellerne er baseret på normalfordelingen pga. den centrale grænseværdisætning! Multiple sammenligninger hvorfor er det et problem, og hvad kan vi gøre ved det? Modelkontrol Analyse af standardiserede residualer hvad skal vi se efter? Prædiktion. Forskel på konfidens- og prædiktionsintervaller. Udregning. Slide 23 Statistisk Dataanalyse 1 (Uge 4-2) Modelkontrol og prædiktion Slide 24 Statistisk Dataanalyse 1 (Uge 4-2) Modelkontrol og prædiktion

Ordliste Engelsk explanatory variable independence response variable standardized residual outlier Dansk forklarende variabel uafhængighed responsvariabel standardiseret residual ekstrem observation Slide 25 Statistisk Dataanalyse 1 (Uge 4-2) Modelkontrol og prædiktion