Konfidensinterval for µ (σ kendt)

Relaterede dokumenter
Program. 1. Repetition: konfidens-intervaller. 2. Hypotese test, type I og type II fejl, signifikansniveau, styrke, en- og to-sidede test.

Modul 5: Test for én stikprøve

Hypotese test. Repetition fra sidst Hypoteser Test af middelværdi Test af andel Test af varians Type 1 og type 2 fejl Signifikansniveau

Kursus Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, ( , ) Per Bruun Brockhoff

Forelæsning 8: Inferens for varianser (kap 9)

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup)

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006

Note til styrkefunktionen

t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t.

Konfidensintervaller og Hypotesetest

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

Vejledende besvarelser til opgaver i kapitel 14

Ensidet variansanalyse

Program. Ensidet variansanalyse Sammenligning af grupper. Statistisk model og hypotese. Eksempel: Aldersfordeling i hjertestudie

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Chi-i-anden Test. Repetition Goodness of Fit Uafhængighed i Kontingenstabeller

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Afsnit E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse

Vi kalder nu antal prøverør blandt de 20, hvor der ikke ses vækst for X.

02402 Løsning til testquiz02402f (Test VI)

Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Module 12: Mere om variansanalyse

Økonometri 1. Inferens i den lineære regressionsmodel 25. september Oversigt: De næste forelæsninger

Signifikanstestet. usædvanlig godt godt

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

da er X 1 + X 2 N(µ 1 + µ 2,σ1 2 + σ2) Hvis X 1,...,X n er uafhængige og X r N(µ,σ 2 ), da er X = 1 n (X X n ) N(µ, σ2

Statistik og Sandsynlighedsregning 2

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

ØVELSER Statistik, Logistikøkonom Lektion 6: Hypotesetest 1

c) For, er, hvorefter. Forklar.

Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

Kapitel 3 Centraltendens og spredning

k UAFHÆNGIGE grupper F-test Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen

Modul 7: Eksempler. 7.1 Beskrivende dataanalyse Diagrammer. Bent Jørgensen. Forskningsenheden for Statistik ST501: Science Statistik

Kvantitative Metoder 1 - Forår Dagens program

4. september π B = Lungefunktions data fra tirsdags Gennemsnit l/min

Tema. Dagens tema: Indfør centrale statistiske begreber.

Forelæsning 9: Inferens for andele (kapitel 10)

Multipel Lineær Regression. Polynomiel regression Ikke-lineære modeller og transformation Multi-kolinearitet Auto-korrelation og Durbin-Watson test

En intro til radiologisk statistik

Oversigt. 1 Eksempel. 2 Fordelingen for gennemsnittet t-fordelingen. 3 Konfidensintervallet for µ Eksempel

Modul 12: Exercises Sukkersygepatienters vægt

Faculty of Health Sciences. Logistisk regression: Interaktion Kvantitative responsvariable

Kapitel 7 Forskelle mellem centraltendenser

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Løsning eksamen d. 15. december 2008

Nanostatistik: Middelværdi og varians

SENIORKURSUS STATA OG BIOSTATISTIK

02402 Vejledende løsninger til Splus-opgaverne fra hele kurset

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Indledende om Signifikanstest Boldøvelser

To-sidet variansanalyse

Forsøgsplanlægning Stikprøvestørrelse

Uge 48 II Teoretisk Statistik 27. november Numerisk modelkontrol af diskrete fordelinger: intro

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Dagens Temaer. Test for lineær regression. Test for lineær regression - via proc glm. k normalfordelte obs. rækker i proc glm. p. 1/??

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1)

Opsamling Modeltyper: Tabelanalyse Logistisk regression Generaliserede lineære modeller Log-lineære modeller

Statistik II 4. Lektion. Logistisk regression

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Kvantitative Metoder 1 - Forår 2007

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Kvantitative Metoder 1 - Forår 2007

Besvarelser til øvelsesopgaver i uge 6

To-sidet varians analyse

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Program. Simpel og multipel lineær regression. I tirsdags: model og estimation. I tirsdags: Prædikterede værdier og residualer

Eksamen i Statistik for biokemikere. Blok

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Kursus 02323: Introducerende Statistik. Forelæsning 12: Forsøgsplanlægning. Peder Bacher

En Introduktion til SAS. Kapitel 6.

Maple 11 - Chi-i-anden test

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff

Valgkampens og valgets matematik

Vejledende løsninger kapitel 8 opgaver

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...

Module 2: Beskrivende Statistik

Estimation og konfidensintervaller

Susanne Ditlevsen Institut for Matematiske Fag susanne

Løsning til eksaminen d. 14. december 2009

Multiple choice opgaver

Statistik og Sandsynlighedsregning 2

9. Chi-i-anden test, case-control data, logistisk regression.

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007

Susanne Ditlevsen Institut for Matematiske Fag susanne

MOGENS ODDERSHEDE LARSEN. VIDEREGÅENDE STATISTIK med Excel

Statistik i basketball

Funktionalligninger - løsningsstrategier og opgaver

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Eksempler fra bogen Statistiske Grundbegreber løst ved anvendelse af Excel.

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Basal statistik for sundhedsvidenskabelige forskere, forår 2015 Udleveret 3. marts, afleveres senest ved øvelserne i uge 13 (

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/

Transkript:

Program 1. Repetition: konfidens-intervaller. 2. Hypotese test 3. Type I og type II fejl, p-værdi 4. En og to-sidede tests 5. Test for middelværdi (kendt varians) 6. Test for middelværdi (ukendt varians) 1/17

Konfidensinterval for µ (σ kendt) Estimat ˆµ = X bedste bud på værdien af µ. Et interval af plausible bud på µ kan dannes som [ X a, X + a] a vælges så intervallet indeholder µ med en kendt sandsynlighed. 95 % konfidensinterval (a = 1.96σ/ n 2 standard error): [ X 1.96σ/ n, X + 1.96σ/ n] NB: X 1.96 σ n µ X + 1.96 σ n X µ 1.96 σ n Dvs. estimationsfejl X µ mindre end 1.96σ/ n med sandsynlighed 95%. 2/17

Eksempel En stikprøve med n = 75 og x = 0.31 udtages, hvor standardafvigelsen σ = 0.0015 er kendt. Udregning af 95 % konfidensinterval: 1.96 σ n = 1.96 0.0015 75 = 0.000339 Dvs. konfidensinterval [0.31 0.000339, 0.31 + 0.000339] = [0.3097, 0.3103] og X µ < 0.000339 med sandsynlighed 95 %. Antag vi er tilfreds med X µ < 0.0005 med sandsynlighed 95 %. Udregning af passende stikprøvestørrelse m: 0.0005 = 1.96 0.00015 m m = 1.96 0.00015 0.0005 m = 35 3/17

Konfidensintervaller 1. Konfidensinterval for middelværdi, hvor varians er kendt: [ x z α/2 σ n, x + z α/2 σ n ] 2. Konfidensinterval for middelværdi, hvor varians er ukendt: [ ] s s x t α/2, x + t n α/2 n 3. Konfidensinterval for varians: [ (n 1)s 2, χ 2 α/2 ] (n 1)s2 χ 2 1 α/2 4/17

Type I og type II fejl H 0 sand H 0 falsk Accept H 0 korrekt afgørelse type II fejl Forkast H 0 type I fejl korrekt afgørelse Signifikansniveau α: sandsynlighed for type I fejl. β: sandsynlighed for type II fejl. Styrke 1 β: sandsynlighed for forkastelse når H 0 falsk. Optimalt: lille α og lille β (stor styrke 1 β) NB for en given stikprøve størrelse n kan vi ikke formindske α uden samtidig at øge β og omvendt. 5/17

Hypotese om middelværdi (varians kendt) Betragt hypotesen H 0 : µ = µ 0 mod alternativet H 1 : µ µ 0. Vi forkaster H 0 hvis en stikprøve giver X der ligger langt fra µ 0 - men hvornår ligger den langt fra? Vi beregner teststørrelsen Z = X µ 0 σ/ n som er standardnormalfordelt hvis nul-hypotesen er rigtig (µ = µ 0 ). Idet et standardnormalfordelt tal typisk (altså med 95% ssh) ligger indenfor intervaller ±1.96, virker H 0 rimelig hvis Z ligger indenfor dette interval. 6/17

Hypotese om middelværdi (varians kendt) Generelt behøver vi ikke vælge 95%, man kan vælge et hvilket som helst niveau - vi kan bruge (1 α)100% hvor α er signifikansniveauet. I så fald accepterer vi H 0 hvis og ellers forkastes H 0. Z = X µ 0 σ/ n [ z α/2, z α/2 ] 7/17

Eksempel Målinger af ph: 7.01, 7.00, 7.10, 6.97, 7.00, 7.03, 7.01, 7.01, 6.98, 7.08 (n = 10) H 0 : µ = 7, H 1 : µ 7 Antag at vi ved at σ = 0.05. Teststørrelsen z = x µ 0 σ/ n = 7.0250 7 0.05/ 10 = 1.20 sammenlignes med normalfordelingen. z 0.025 = 1.96 og z 0.975 = 1.96 (α = 95%) dvs. accept. 8/17

Hvad er stærkest konklusion: accept eller forkast? Som oftest designes test så sandsynlighed for type I fejl α (fejl når der forkastes) er lille (f.eks. 5 %). Omvendt har man ofte ikke styr på sandsynlighed for type II fejl β (fejl ved accept). Derfor er forkast en stærk konklusion, mens accept nemt kan svare til en type II fejl. Accept = hypotese kan ikke forkastes på baggrund af de foreliggende data. 9/17

Relation til konfidensinterval Betragt hypotesen H 0 : µ = µ 0 mod alternativet µ µ 0 hvor µ 0 er en specifik værdi. Det to-sidede test med signifikansniveau 5 % accepterer hvis 1.96 X µ 0 σ/ n 1.96 X 1.96 σ n µ 0 X + 1.96 σ n Dvs. H 0 accepteres for alle værdier µ 0 der ligger i 95 % konfidensintervallet [ X 1.96 σ n, X + 1.96 σ n ] 95 % konfidensinterval: alle værdier af µ 0 som accepteres af et to-sidet test med signifikansniveau 5 % 10/17

Eksempel (fortsat) Hvis x = 7.025, σ = 0.05, n = 10 fås et 95% konfidensinterval til [ x z α/2 σ n, x + z α/2 σ n ] = [6.99; 7.05] Dvs µ 0 = 7 er indeholdt i konfidens intervallet for µ, og derfor er 7 en realistisk værdi. Dvs. igen er H 0 accepteret. 11/17

p-værdi Test for H 0 : µ = µ 0 (σ kendt) med signifikansniveau 5 % forkaster når Z mindre end -1.96 eller større end 1.96. Der skelnes ikke mellem f.eks. z = 1.97 og z = 3.4 selvom sidstnævnte synes meget mere kritisk. p-værdi er et mål for hvor kritisk/usædvanlig en observeret test størrelse er: p-værdi = ssh for at observere noget ligeså eller mere kritisk Ex Med to-sidet test og z = 1.97 fås p = P(Z < 1.97) + P(Z > 1.97) = 4.9%. Hypotese forkastes hvis p-værdien er mindre end signifikansniveauet α. 12/17

Eksempel Observeret værdi z = 1.80. p = P(Z 1.80) + P(Z 1.80) = 7.2% hvor T er t(9)-fordelt. Med z = 1.97 fås p = P(Z 1.97) + P(Z 1.97) = 4.9% (dvs. ikke voldsom stærk evidens mod hypotese) Med z = 3.2 fås p = P(Z 3.2) + P(Z 3.2) = 0.14% (dvs. stærk evidens mod hypotese) 13/17

En-sidet test Betragt H 0 : µ = µ 0. Sommetider er et en-sidet alternativ µ < µ 0 eller µ > µ 0 relevant. Ex forbrugerstyrelsen ønsker at teste at middelindholdet af sukker pr. pakke er mindst 1 kg. Hvad er den relevante H 0 og alternative hypotese? H 1 : µ < µ 0 - da er små værdier af kritiske. Z = X µ 0 σ/ n Test med signifikansniveau 5 % fås hvis vi forkaster når Z < 1.64 (5 % fraktil for N(0, 1)). Alternativt kan vi bruge p-værdien, som her er givet ved P(Z < z), hvor z er værdien udregnet fra data. 14/17

t-test for hypotese vedr. µ (σ ukendt) H 0 : µ = µ 0, H 1 : µ µ 0. Store eller små værdier af kritiske. T = X µ 0 S/ n Test med signifikansniveau 5 % hvis vi forkaster når T < t 0.025 eller T > t 0.975, hvor antallet af frihedsgrader er n 1. Udregnes i SPSS via Analyze Compare means One-sample T-Test og vælge værdien for µ 0 (bemærk: kun to-sidet test). 15/17

Eksempel Målinger af ph: 7.01, 7.00, 7.10, 6.97, 7.00, 7.03, 7.01, 7.01, 6.98, 7.08 (n = 10) H 0 : µ = 7, H 1 : µ 7 Teststørrelsen skal vurderes i t(9) fordeling. t = x µ 0 s/ n = 7.0250 7 0.044/ 10 = 1.46 t 0.025 (9) = 2.26 og t 0.975 (9) = 2.26 dvs. accept. 16/17

Hvilke tests kan man lave? Vi har idag set to tests idag middelværdi hvor H 0 : µ = µ 0 idag: z-test for middelværdi, når σ kendt t-test for middelværdi, når σ ukendt Der findes også andre relevante tests tests for varians, H 0 : σ = σ 0 (afsnit 10.13) tests for ens middelværdi i to stikprøver, H 0 : µ 1 = µ 2 (afsnit 10.8) tests for ens varians i to stikprøver, H 0 : σ 1 = σ 2 (afsnit 10.13) Dem skal I arbejde med for jer selv næste gang. 17/17