Program. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data



Relaterede dokumenter
Program. Sammenligning af grupper Ensidet ANOVA. Case 3, del II: Fiskesmag i lammekød. Case 3, del I: A-vitamin i leveren

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Program. Logistisk regression. Eksempel: pesticider og møl. Odds og odds-ratios (igen)

Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i.

Konfidensintervaller og Hypotesetest

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Tema. Dagens tema: Indfør centrale statistiske begreber.

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

Forelæsning 11: Kapitel 11: Regressionsanalyse

Økonometri: Lektion 4. Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Dagens Emner. Likelihood teori. Lineær regression (intro) p. 1/22

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t.

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Kursus Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, ( , ) Per Bruun Brockhoff

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

Analysestrategi. Lektion 7 slides kompileret 27. oktober :24 p.1/17

Afsnit E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Forelæsning 9: Inferens for andele (kapitel 10)

Statistik II 4. Lektion. Logistisk regression

I dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt)

Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model

Dagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup)

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning

Vejledende besvarelser til opgaver i kapitel 14

Estimation og konfidensintervaller

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge

Appendiks Økonometrisk teori... II

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

(studienummer) (underskrift) (bord nr)

Hvad er danskernes gennemsnitshøjde? N = 10. X 1 = 169 cm. X 2 = 183 cm. X 3 = 171 cm. X 4 = 113 cm. X 5 = 174 cm

Program. Statistisk inferens En enkelt stikprøve og lineær regression Stat. modeller, estimation og konfidensintervaller. Fordeling af gennemsnit

Susanne Ditlevsen Institut for Matematiske Fag susanne

(studienummer) (underskrift) (bord nr)

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

Klasseøvelser dag 2 Opgave 1

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Uafhængighedstestet

Side 1 af 19 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

Program. Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering. Test for ens spredninger

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Module 4: Ensidig variansanalyse

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Personlig stemmeafgivning

Reeksamen i Statistik for Biokemikere 6. april 2009

Økonometri Lektion 1 Simpel Lineær Regression 1/31

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Statistik og Sandsynlighedsregning 2

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Vejledende løsninger kapitel 8 opgaver

Side 1 af 17 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 25. maj 2007 Kursus navn og nr: Introduktion til Statistik, 02402

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Logistisk Regression - fortsat

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse

Kursus 02323: Introducerende Statistik. Forelæsning 12: Forsøgsplanlægning. Peder Bacher

Løsning til eksaminen d. 14. december 2009

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Eksamen i Statistik for biokemikere. Blok

Indhold. 2 Tosidet variansanalyse Additive virkninger Vekselvirkning... 9

Model. k = 3 grupper: hvor ǫ ij uafhængige og normalfordelte med middelværdi nul og varians σi 2, i = 1,2,3.

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk

Opgavebesvarelse, brain weight

Kapitel 12 Variansanalyse

Løsning eksamen d. 15. december 2008

Muligheder: NB: test for µ 1 = µ 2 i model med blocking ækvivalent med parret t-test! Ide: anskue β j som stikprøve fra normalfordeling.

Forsøgsplanlægning Stikprøvestørrelse

Skriftlig eksamen Science statistik- ST501

En Introduktion til SAS. Kapitel 5.

Forelæsning 11: Envejs variansanalyse, ANOVA

(studienummer) (underskrift) (bord nr)

Opgaver til kapitel 3

Perspektiver i Matematik-Økonomi: Linær regression

Modul 7: Eksempler. 7.1 Beskrivende dataanalyse Diagrammer. Bent Jørgensen. Forskningsenheden for Statistik ST501: Science Statistik

Preben Blæsild og Jens Ledet Jensen

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

(studienummer) (underskrift) (bord nr)

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Epidemiologi og Biostatistik

1 Regressionsproblemet 2

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Transkript:

Faculty of Life Sciences Program t-test Hypoteser, teststørrelser og p-værdier Claus Ekstrøm E-mail: ekstrom@life.ku.dk Resumé og hængepartier fra sidst. Eksempel: effekt af foder på hormonkoncentration repetition af statistisk model og konfidensinterval test af hypotese sammenhæng mellem konfidensintervaller og hypotesetest Hypotesetest: begreber og resume Lineær regression (stearinsyre og fordøjelighed): test af hypotese(r) Midtvejsevaluering ca. 9.40. Slide 2 Statistisk Dataanalyse 1 (Uge 3-2) t-test Hormonkoncentration: data Forsøg om effekt af fodertype på koncentration af hormon: Ni køer har fået foderet i en periode Hormonkoncentrationen målt før og efter Spørgsmål: har foderet en effekt på hormonkoncentrationen? Cow 1 2 3 4 5 6 7 8 9 Initial (µg/ml) 207 196 217 210 202 201 214 223 190 Final (µg/ml) 216 199 256 234 203 214 225 255 182 Difference, y 9 3 39 24 1 13 11 32-8 Hormonkonc.: statistisk model og konfidensinterval Lad os se på differencerne, y 1,...,y 9. Statistisk model? Parametre? Estimater? Standard error? Konfidensinterval? Fortolkning? Konklusion: har foderet en effekt på hormonkoncentrationen? Statistisk analyse: Statistisk model, parametre, estimation, konfidensinterval Test af hypotese Slide 3 Statistisk Dataanalyse 1 (Uge 3-2) t-test Slide 4 Statistisk Dataanalyse 1 (Uge 3-2) t-test

Hypotese Ideen i et hypotesetest Hypotese H 0 : µ = 0 Hvis foderet ikke har nogen effekt, så er der ikke systematisk forskel på før og efter dette svarer til at µ = 0. Vil derfor teste hypotesen (nulhypotesen) H 0 : µ = 0 Hypotesen er en ekstra restriktion på den statistiske model. Under modellen: y i N(µ,σ 2 ), uafhængige Hvis H 0 er sand: y i N(0,σ 2 ), uafhængige Vi har estimatet bedste gæt ˆµ = ȳ. Hvis ˆµ = ȳ ligger langt fra nul, tyder det på at H 0 er falsk. Hvis ˆµ = ȳ ligger tæt nul, tyder det ikke på at H 0 er falsk. Men hvad er langt fra og hvad er tæt på? Værdien ˆµ = 13.78 alene er ikke nok! Hvis vi målte i µg/l i stedet ville vi have fået 0.01378 i stedet. Det lyder lille, men er jo helt den samme forskel. Skal tage højde for variationen i data! Skyldes forskellen i stikprøven en reel effekt eller skyldes den blot tilfældigheder? Hvad ville der ske hvis vi gentog eksperimentet? Slide 5 Statistisk Dataanalyse 1 (Uge 3-2) t-test Slide 6 Statistisk Dataanalyse 1 (Uge 3-2) t-test Ideen i et hypotesetest Måler langt fra / tæt på følgende måde: Hvis H 0 virkelig er sand dvs. µ er nul hvor sandsynligt er det så at få et ˆµ der ligger lige så langt eller længere fra nul end de 13.78 som vi faktisk fik? Hvis det er meget usandsynligt at få noget der passer dårligere med H 0 end det vi fik, så tyder det på at hypotesen er falsk. Hvis det er ret sandsynligt at få noget der passer dårligere end det vi faktisk fik, så tyder det ikke på at hypotesen er falsk. Dette er grundtanken i hypotesetestet! Lad os være mere præcise... Slide 7 Statistisk Dataanalyse 1 (Uge 3-2) t-test t-teststørrelsen Statistisk model: y i N(µ,σ 2 ). Husk at ˆµ = ȳ er normalfordelt med middelværdi µ og spredning σ/ n. Hvis hypotesen H 0 : µ = 0 er sand: ˆµ = ȳ er normalfordelt med middelværdi 0 og spredning σ/ n. Standardisér og erstat σ med s: T = ȳ 0 s/ n = ȳ 0 SE(ȳ) t n 1 Vi fik ȳ = 13.78 og s = 15.25. Så er SE(ȳ) = 15.25/ 9 = 5.08 og T obs = 13.78 0 5.08 = 2.71 Kan nu bruge t-fordelingen til at sige om dette er langt fra eller tæt på nul! Slide 8 Statistisk Dataanalyse 1 (Uge 3-2) t-test

p-værdi og konklusion på test p-værdien er sandsynligheden for at få en værdi af T der ligger lige så langt eller længere væk fra nul end det vi fik: p = P ( T T obs ) = P ( T 2.71 ) = 2 P ( T 2.71 ) = 0.026, Signifikansniveau og kritiske værdier Hvis vi bruger de 5% som signifikansniveau, så bliver det afgørende om T obs er større eller mindre end 97.5%-fraktilen i t n 1 -fordelingen. Density 0.0 0.1 0.2 0.3 0.4 t 8 T= 2.71 T=2.71 1.3% 1.3% 4 2 0 2 4 T > pt(2.71,df=8) [1] 0.986671 Hvis H 0 er sand er det altså ikke særligt sandsynligt at få en så stor værdi af T som vi fik H 0 afvises. Skiller normalt ved 5%. p < 0.05: H 0 afvises p 0.05: H 0 kan ikke afvises Density 0.0 0.1 0.2 0.3 0.4 t 8 T= 2.31 T=2.31 2.5% 2.5% 4 2 0 2 4 T > qt(0.975, df=8) [1] 2.306004 Slide 9 Statistisk Dataanalyse 1 (Uge 3-2) t-test Slide 10 Statistisk Dataanalyse 1 (Uge 3-2) t-test Hormonkoncentration: konklusion Konfidensinterval og hypotesetest Vi afviser hypotesen om at der ikke er en effekt. Vi har med en vis sikkerhed påvist en effekt (p = 0.026). Stigningen i hormonkoncentrationen estimeret til 13.78 med 95% konfidensinterval (2.06, 25.49). I eksemplet gav konfidensintervallet og hypotesetestet samme konklusion: Nul ligger ikke i 95%-konfidensintervallet Vi afviser H 0 med en p-værdi mindre end 5%. Sådan er det altid: nul ligger udenfor 95%-konfidensinterval hvis og kun hvis hypotesen H 0 : µ = 0 kan afvises på 5% signifikansniveau. Nul ligger udenfor 95%-CI hvis og kun hvis ˆµ 0 > t 0.975,n 1 SE(ˆµ) H 0 afvises hvis og kun hvis T = ˆµ 0 SE(ˆµ) > t 0.975,n 1. Slide 11 Statistisk Dataanalyse 1 (Uge 3-2) t-test Slide 12 Statistisk Dataanalyse 1 (Uge 3-2) t-test

Hypotesetest: begreber og resumé Hypotese Hypotese: simplificering af den statistiske model, restriktioner på parametrene. Her H 0 : µ = 0. Alternativ hypotese. Som regel blot det modsatte, her H A : µ 0. Teststørrelse og p-værdi Teststørrelse: Funktion af data der måler hvor godt data er i overensstemmelse med hypotesen. Her T = ˆµ 0 med både små og store værdier kritiske. SE(ˆµ) p-værdi: sandsynligheden for hvis H 0 er sand at få en værdi af teststørrelsen der passer mindst lige så dårligt med hypotesen som den observerede værdi. Her: p = P ( T T obs ) = P ( T T obs ) = 2 P ( T T obs ). Hypotesetest: generelt og resumé Konklusion Afvise/ikke-afvise: vi afviser hypotesen hvis p-værdien er lille, typisk hvis p < 0.05. Hvis p 0.05 kan vi ikke afvise hypotesen. Signifikansniveau som regel 5% men vær ikke religiøs! Husk at kvantificere en evt. effekt: estimat og konfidensinterval. Samme konklusion fra test og konfidensinterval. Type I og type II fejl: Afvise Ikke afvise H 0 sand type I OK H 0 falsk OK type II Hvis vi bruger signifikansniveau 5%, så laver vi type I fejl med 5% sandsynlighed! Slide 13 Statistisk Dataanalyse 1 (Uge 3-2) t-test Slide 14 Statistisk Dataanalyse 1 (Uge 3-2) t-test Lineær regression: stearinsyre og fordøjelighed Lineær regresison: test for ingen sammenhæng Statistisk model: y i = α + β x i + e i hvor e 1,...,e 9 N(0,σ 2 ) Digestibility % 65 70 75 80 85 90 95 100 0 5 10 15 20 25 30 35 Stearic acid % Vil teste hypotesen at der ikke er sammenhæng mellem stearinsyreindhold og fordøjelighed. Hvordan ser den rette linie ud under hypotesen? Hvad er hypotesen, udtrykt ved parametrene i modellen? Hvad er: hypotesen, den alternative hypotese? teststørrelsen, p-værdien? konklusionen? > model1 <- lm(ford~ssyre) > summary(model1) Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) 96.53336 1.67518 57.63 1.24e-10 *** ssyre -0.93374 0.09262-10.08 2.03e-05 *** Residual standard error: 2.97 on 7 degrees of freedom Slide 15 Statistisk Dataanalyse 1 (Uge 3-2) t-test Slide 16 Statistisk Dataanalyse 1 (Uge 3-2) t-test

Lineær regression: test af en anden hypotese En (opdigtet) fysiologisk teori siger at den forventede fordøjelighed er 78% for et stearinsyreindhold på 20% NB: lidt anderledes end i noterne. Undersøg om data i modstrid med denne teori! Forventet fordøjelighed ved 20% stearinsyre? Estimat? Hvad er hypotesen? Teststørrelse? p-værdi? Konklusion? Resumé: t-test Hypotese, H 0 : θ = θ 0 hvor θ er en parameter eller en kombination af parametre, og θ 0 er en fast værdi. Fx. µ = 0 eller β = 0 eller α + β 20 = 78. Alternativ hypotese, H A : θ θ 0 Teststørrelse, T = ˆθ θ 0 SE(ˆθ) t n p hvor p er antal middelværdiparametre i modellen p-værdi: p = P ( T T obs ) = P ( T T obs ) = 2 P ( T T obs ) 95%-konfidensinterval indeholder præcis de værdier µ 0 for hvilke hypotesen H 0 : θ θ 0 ikke vil blive afvist på 5% signifikansniveau. Husk at kvantificere resultaterne: ˆθ og 95%-konfidensinterval. Slide 17 Statistisk Dataanalyse 1 (Uge 3-2) t-test Slide 18 Statistisk Dataanalyse 1 (Uge 3-2) t-test Dagens hovedpunkter Ordliste Hypoteser: restriktion af parametre i en model Nulhypotese, alternativ hypotese Hvordan tester man en hypotese? Sammenhæng mellem hypotese-test og konfidensinterval Fortolkning af p-værdien. Engelsk alternative hypothesis critical values hypothesis test (null) hypothesis quantile p-value signifance level test statistic reject Dansk alternative hypotese kritiske værdier hypotesetest (nul)hypotese fraktil p-værdi siknifikansniveau teststørrelse afvise Slide 19 Statistisk Dataanalyse 1 (Uge 3-2) t-test Slide 20 Statistisk Dataanalyse 1 (Uge 3-2) t-test