Program. 1. Repetition: konfidens-intervaller. 2. Hypotese test, type I og type II fejl, signifikansniveau, styrke, en- og to-sidede test.



Relaterede dokumenter
Konfidensinterval for µ (σ kendt)

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

Modul 5: Test for én stikprøve

Hypotese test. Repetition fra sidst Hypoteser Test af middelværdi Test af andel Test af varians Type 1 og type 2 fejl Signifikansniveau

Kursus Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, ( , ) Per Bruun Brockhoff

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup)

PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006

Note til styrkefunktionen

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

Konfidensintervaller og Hypotesetest

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Ensidet variansanalyse

Program. Ensidet variansanalyse Sammenligning af grupper. Statistisk model og hypotese. Eksempel: Aldersfordeling i hjertestudie

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Chi-i-anden Test. Repetition Goodness of Fit Uafhængighed i Kontingenstabeller

Vejledende besvarelser til opgaver i kapitel 14

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

c) For, er, hvorefter. Forklar.

Afsnit E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Module 12: Mere om variansanalyse

Økonometri 1. Inferens i den lineære regressionsmodel 25. september Oversigt: De næste forelæsninger

Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model

02402 Løsning til testquiz02402f (Test VI)

Tema. Dagens tema: Indfør centrale statistiske begreber.

Kapitel 3 Centraltendens og spredning

Signifikanstestet. usædvanlig godt godt

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration

To-sidet variansanalyse

Dagens Temaer. Test for lineær regression. Test for lineær regression - via proc glm. k normalfordelte obs. rækker i proc glm. p. 1/??

ØVELSER Statistik, Logistikøkonom Lektion 6: Hypotesetest 1

Kvantitative Metoder 1 - Forår Dagens program

Multipel Lineær Regression. Polynomiel regression Ikke-lineære modeller og transformation Multi-kolinearitet Auto-korrelation og Durbin-Watson test

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Statistik og Sandsynlighedsregning 2

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Faculty of Health Sciences. Logistisk regression: Interaktion Kvantitative responsvariable

En intro til radiologisk statistik

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Statistik II 4. Lektion. Logistisk regression

Løsning eksamen d. 15. december 2008

Modul 7: Eksempler. 7.1 Beskrivende dataanalyse Diagrammer. Bent Jørgensen. Forskningsenheden for Statistik ST501: Science Statistik

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher

Opgaver til kapitel 3

Program. Simpel og multipel lineær regression. I tirsdags: model og estimation. I tirsdags: Prædikterede værdier og residualer

En Introduktion til SAS. Kapitel 6.

Vejledende løsninger kapitel 8 opgaver

Sandsynlighedsregning: endeligt udfaldsrum (repetition)

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

Kapitel 7 Forskelle mellem centraltendenser

SENIORKURSUS STATA OG BIOSTATISTIK

Appendiks Økonometrisk teori... II

Maple 11 - Chi-i-anden test

Kursus 02323: Introducerende Statistik. Forelæsning 12: Forsøgsplanlægning. Peder Bacher

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Indledende om Signifikanstest Boldøvelser

Module 2: Beskrivende Statistik

Basal statistik. 30. januar 2007

1 Hb SS Hb Sβ Hb SC = , (s = )

Statistik i basketball

Eksempler fra bogen Statistiske Grundbegreber løst ved anvendelse af Excel.

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge

Funktionalligninger - løsningsstrategier og opgaver

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Løsning til eksaminen d. 14. december 2009

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007

Susanne Ditlevsen Institut for Matematiske Fag susanne

Opsamling Modeltyper: Tabelanalyse Logistisk regression Generaliserede lineære modeller Log-lineære modeller

Forelæsning 9: Inferens for andele (kapitel 10)

S4-S5 statistik Facitliste til opgaver

9. Chi-i-anden test, case-control data, logistisk regression.

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Transkript:

Program 1. Repetition: konfidens-intervaller. 2. Hypotese test, type I og type II fejl, signifikansniveau, styrke, en- og to-sidede test. 1/19

Konfidensinterval for µ (σ kendt) Estimat ˆµ = X bedste bud på værdien af µ. Et interval af plausible bud på µ kan dannes som [ X a, X + a] a vælges så intervallet indeholder µ med en kendt sandsynlighed. 95 % konfidensinterval (a = 1.96σ/ n 2 standard error): [ X 1.96σ/ n, X + 1.96σ/ n] NB: X 1.96 σ n µ X + 1.96 σ n X µ 1.96 σ n Dvs. estimationsfejl X µ mindre end 1.96σ/ n med sandsynlighed 95%. 2/19

Eksempel En stikprøve med n = 75 og x = 0.31 udtages, hvor standardafvigelsen σ = 0.0015 er kendt. Udregning af 95 % konfidensinterval: 1.96 σ n = 1.96 0.0015 75 = 0.000339 Dvs. konfidensinterval [0.31 0.000339, 0.31 + 0.000339] = [0.3097, 0.3103] og X µ < 0.000339 med sandsynlighed 95 %. Antag vi er tilfreds med X µ < 0.0005 med sandsynlighed 95 %. Udregning af passende stikprøvestørrelse m: 0.0005 = 1.96 0.00015 m m = 1.96 0.00015 0.0005 m = 35 3/19

Konfidensintervaller 1. Konfidensinterval for middelværdi, hvor varians er kendt: [ x z α/2 σ n, x + z α/2 σ n ] 2. Konfidensinterval for middelværdi, hvor varians er ukendt: [ ] s s x t α/2, x + t n α/2 n 3. Konfidensinterval for varians: [ (n 1)s 2, χ 2 α/2 ] (n 1)s2 χ 2 1 α/2 4/19

Hypotese test: illustration udfra check af mønt Kast med mønt 50 gange. X antal plat. Sandsynlighed for plat: p. Hypotese H 0 : p = 0.5 (mod alternativ p 0.5). Forkastelsesområde: F = [0, 17] [33, 50] Acceptområde: A = [18, 32]. Fejl af type I: X F (forkast) når p = 0.5 Fejl af type II: X A (accept) når p 0.5 Ensidet forkastelsesområde: F = [31, 50]. 5/19

Type I og type II fejl H 0 sand H 0 falsk Accept H 0 korrekt afgørelse type II fejl Forkast H 0 type I fejl korrekt afgørelse Signifikansniveau α: sandsynlighed for type I fejl. β: sandsynlighed for type II fejl. Styrke 1 β: sandsynlighed for forkastelse når H 0 falsk. Optimalt: lille α og lille β (stor styrke 1 β) NB for en given stikprøve størrelse n kan vi ikke formindske α uden samtidig at øge β og omvendt. 6/19

Hypotese test: test af hypotese vedr. µ (σ kendt) Hypotese H 0 : µ = 68, H 1 : µ 68, σ = 3.6 kendt og n = 36. Accept hvis X i A = [67, 69] og forkast hvis X i F =], 67[ ]69, [. Antag µ = 70: α = P(type I) = P( X 67) + P( X > 69) = 0.095 β = P(type II) = P(67 X 69) = 0.0475 7/19

Hypotese test: test af hypotese vedr. µ (σ kendt) Bemærk: 67 X 69 1.67 Z = X 68 3.6/ 36 1.67 Hvis vi ønsker α = 5% skal vi forkaste hvis Z 1.96 eller Z 1.96. (det samme som X 66.8 = 68 1.96σ/ n eller X 69.2 = 68 1.96σ/ n, σ = 3.6 n = 36) Dvs. med udgangspunkt i Z og α = 5% er F =], 1.96] [1.96, [ og A =] 1.96, 1.96[. 8/19

Eksempel: beregning af styrke Antag µ rent faktisk er 70 hvorved X N(70, σ 2 /n). Da er Z = X 68 σ/ n N og ( ) n (70 68) σ, 1 = N(3.33, 1) (ikke N(0, 1)) 1 β = 1 P( 1.96 < Z < 1.96) = P(Z 5.29) + P(Z 1.37) = 91.5% Dvs. stærkt test (stor sandsynlighed for at forkaste) under alternativ µ = 70. Bemærk: større n betyder mindre varians for X og at fordelingen for Z forskydes væk fra 0. 9/19

Styrkefunktion H 0 : µ = 68 forkastes hvis Z mindre end -1.96 eller større end 1.96. 1 β(µ) er styrken når middelværdi er µ. Plot af styrke: styrke 0.0 0.2 0.4 0.6 0.8 1.0 n=36 n=100 64 66 68 70 72 mu 10/19

Relation til konfidensinterval Betragt hypotesen H 0 : µ = µ 0 mod alternativet µ µ 0 hvor µ 0 er en specifik værdi. Det to-sidede test med signifikansniveau 5 % accepterer hvis 1.96 X µ 0 σ/ n 1.96 X 1.96 σ n µ 0 X + 1.96 σ n Dvs. H 0 accepteres for alle værdier µ 0 der ligger i 95 % konfidensintervallet [ X 1.96 σ n, X + 1.96 σ n ] 95 % konfidensinterval: alle værdier af µ 0 som accepteres af et to-sidet test med signifikansniveau 5 % 11/19

Eksempel (fortsat) Hvis H 0 : µ = 30, x = 0.31 fås z = 0.31 0.30 0.0015/ 75 = 57.74 dvs. test med signifikansniveau 5 % forkaster. Dette kunne ses direkte af 95 % konfidensinterval, som 0.30 ligger udenfor. 12/19

En-sidet test Betragt H 0 : µ = µ 0. Sommetider er et en-sidet alternativ µ < µ 0 eller µ > µ 0 relevant. Ex forbrugerstyrelsen ønsker at teste at middelindholdet af sukker pr. pakke er mindst 1 kg. Hvad er den relevante H 0 og alternative hypotese? Alternativ µ < µ 0 : da er små værdier af kritiske. Z = X µ 0 σ/ n Test med signifikansniveau 5 % fås hvis vi forkaster når Z < 1.64 (5 % fraktil for N(0, 1)). 13/19

Hvad er stærkest konklusion: accept eller forkast? Som oftest designes test så sandsynlighed for type I fejl (fejl når der forkastes) er lille (f.eks. 5 %). Omvendt har man ofte ikke styr på sandsynlighed for type II fejl (fejl ved accept). Derfor er forkast en stærk konklusion, mens accept nemt kan svare til en type II fejl. Accept = hypotese kan ikke forkastes på baggrund af de foreliggende data. 14/19

t-test for hypotese vedr. µ (σ ukendt) H 0 : µ = µ 0, H 1 : µ µ 0. Store eller små værdier af kritiske. T = X µ 0 S/ n Test med signifikansniveau 5 % hvis vi forkaster når T < t 0.025 eller T > t 0.975, hvor antallet af frihedsgrader er n 1. Udregnes i SPSS via Analyze Compare means One-sample T-Test og vælge værdien for µ 0 (bemærk: kun to-sidet test). 15/19

Eksempel Målinger af ph: 7.01, 7.00, 7.10, 6.97, 7.00, 7.03, 7.01, 7.01, 6.98, 7.08 (n = 10) H 0 : µ = 7, H 1 : µ 7 Teststørrelsen skal vurderes i t(9) fordeling. t = x µ 0 s/ n = 7.0250 7 0.044/ 10 = 1.80 t 0.025 (9) = 2.26 og t 0.975 (9) = 2.26 dvs. accept. 16/19

p-værdi Test for H 0 : µ = µ 0 (σ kendt) med signifikansniveau 5 % forkaster når Z mindre end -1.96 eller større end 1.96. Der skelnes ikke mellem f.eks. z = 1.97 og z = 3.4 selvom sidstnævnte synes meget mere kritisk. p-værdi er et mål for hvor kritisk/usædvanlig en observeret test størrelse er: p-værdi = ssh for at observere noget ligeså eller mere kritisk Ex Med to-sidet test og z = 1.97 fås p = P(Z < 1.97) + P(Z > 1.97) = 4.9%. Hypotese forkastes hvis p-værdien er mindre end signifikansniveauet α. 17/19

Eksempel Observeret værdi t = 1.80. p = P(T 1.80) + P(T 1.80) = 11% hvor T er t(9)-fordelt. Med t = 2.28 fås p = P(T 2.28) + P(T 2.28) = 4.9% (dvs. ikke voldsom stærk evidens mod hypotese) Med t = 3.4 fås p = P(T 3.4) + P(T 3.4) = 0.8% (dvs. stærk evidens mod hypotese) 18/19

Hvilke tests kan man lave? Vi har idag set to tests for middelværdi µ = µ 0 : z-test når σ kendt, t-test når σ ukendt. Der findes også tests for varians, dvs H 0 : σ = σ 0 (afsnit 10.13), og tests med to stikprøver H 0 : µ 1 = µ 2 (afsnit 10.8) eller H 0 : σ 1 = σ 2 (afsnit 10.13). 19/19