Konfidensinterval for µ (σ kendt)

Program 1. Repetition: konfidens-intervaller. 2. Hypotese test 3. Type I og type II fejl, p-værdi 4. En og to-sidede tests 5. Test for middelværdi (kendt varians) 6. Test for middelværdi (ukendt varians) 1/17

Konfidensinterval for µ (σ kendt) Estimat ˆµ = X bedste bud på værdien af µ. Et interval af plausible bud på µ kan dannes som [ X a, X + a] a vælges så intervallet indeholder µ med en kendt sandsynlighed. 95 % konfidensinterval (a = 1.96σ/ n 2 standard error): [ X 1.96σ/ n, X + 1.96σ/ n] NB: X 1.96 σ n µ X + 1.96 σ n X µ 1.96 σ n Dvs. estimationsfejl X µ mindre end 1.96σ/ n med sandsynlighed 95%. 2/17

Eksempel En stikprøve med n = 75 og x = 0.31 udtages, hvor standardafvigelsen σ = 0.0015 er kendt. Udregning af 95 % konfidensinterval: 1.96 σ n = 1.96 0.0015 75 = 0.000339 Dvs. konfidensinterval [0.31 0.000339, 0.31 + 0.000339] = [0.3097, 0.3103] og X µ < 0.000339 med sandsynlighed 95 %. Antag vi er tilfreds med X µ < 0.0005 med sandsynlighed 95 %. Udregning af passende stikprøvestørrelse m: 0.0005 = 1.96 0.00015 m m = 1.96 0.00015 0.0005 m = 35 3/17

Konfidensintervaller 1. Konfidensinterval for middelværdi, hvor varians er kendt: [ x z α/2 σ n, x + z α/2 σ n ] 2. Konfidensinterval for middelværdi, hvor varians er ukendt: [ ] s s x t α/2, x + t n α/2 n 3. Konfidensinterval for varians: [ (n 1)s 2, χ 2 α/2 ] (n 1)s2 χ 2 1 α/2 4/17

Type I og type II fejl H 0 sand H 0 falsk Accept H 0 korrekt afgørelse type II fejl Forkast H 0 type I fejl korrekt afgørelse Signifikansniveau α: sandsynlighed for type I fejl. β: sandsynlighed for type II fejl. Styrke 1 β: sandsynlighed for forkastelse når H 0 falsk. Optimalt: lille α og lille β (stor styrke 1 β) NB for en given stikprøve størrelse n kan vi ikke formindske α uden samtidig at øge β og omvendt. 5/17

Hypotese om middelværdi (varians kendt) Betragt hypotesen H 0 : µ = µ 0 mod alternativet H 1 : µ µ 0. Vi forkaster H 0 hvis en stikprøve giver X der ligger langt fra µ 0 - men hvornår ligger den langt fra? Vi beregner teststørrelsen Z = X µ 0 σ/ n som er standardnormalfordelt hvis nul-hypotesen er rigtig (µ = µ 0 ). Idet et standardnormalfordelt tal typisk (altså med 95% ssh) ligger indenfor intervaller ±1.96, virker H 0 rimelig hvis Z ligger indenfor dette interval. 6/17

Hypotese om middelværdi (varians kendt) Generelt behøver vi ikke vælge 95%, man kan vælge et hvilket som helst niveau - vi kan bruge (1 α)100% hvor α er signifikansniveauet. I så fald accepterer vi H 0 hvis og ellers forkastes H 0. Z = X µ 0 σ/ n [ z α/2, z α/2 ] 7/17

Eksempel Målinger af ph: 7.01, 7.00, 7.10, 6.97, 7.00, 7.03, 7.01, 7.01, 6.98, 7.08 (n = 10) H 0 : µ = 7, H 1 : µ 7 Antag at vi ved at σ = 0.05. Teststørrelsen z = x µ 0 σ/ n = 7.0250 7 0.05/ 10 = 1.20 sammenlignes med normalfordelingen. z 0.025 = 1.96 og z 0.975 = 1.96 (α = 95%) dvs. accept. 8/17

Hvad er stærkest konklusion: accept eller forkast? Som oftest designes test så sandsynlighed for type I fejl α (fejl når der forkastes) er lille (f.eks. 5 %). Omvendt har man ofte ikke styr på sandsynlighed for type II fejl β (fejl ved accept). Derfor er forkast en stærk konklusion, mens accept nemt kan svare til en type II fejl. Accept = hypotese kan ikke forkastes på baggrund af de foreliggende data. 9/17

Relation til konfidensinterval Betragt hypotesen H 0 : µ = µ 0 mod alternativet µ µ 0 hvor µ 0 er en specifik værdi. Det to-sidede test med signifikansniveau 5 % accepterer hvis 1.96 X µ 0 σ/ n 1.96 X 1.96 σ n µ 0 X + 1.96 σ n Dvs. H 0 accepteres for alle værdier µ 0 der ligger i 95 % konfidensintervallet [ X 1.96 σ n, X + 1.96 σ n ] 95 % konfidensinterval: alle værdier af µ 0 som accepteres af et to-sidet test med signifikansniveau 5 % 10/17

Eksempel (fortsat) Hvis x = 7.025, σ = 0.05, n = 10 fås et 95% konfidensinterval til [ x z α/2 σ n, x + z α/2 σ n ] = [6.99; 7.05] Dvs µ 0 = 7 er indeholdt i konfidens intervallet for µ, og derfor er 7 en realistisk værdi. Dvs. igen er H 0 accepteret. 11/17

p-værdi Test for H 0 : µ = µ 0 (σ kendt) med signifikansniveau 5 % forkaster når Z mindre end -1.96 eller større end 1.96. Der skelnes ikke mellem f.eks. z = 1.97 og z = 3.4 selvom sidstnævnte synes meget mere kritisk. p-værdi er et mål for hvor kritisk/usædvanlig en observeret test størrelse er: p-værdi = ssh for at observere noget ligeså eller mere kritisk Ex Med to-sidet test og z = 1.97 fås p = P(Z < 1.97) + P(Z > 1.97) = 4.9%. Hypotese forkastes hvis p-værdien er mindre end signifikansniveauet α. 12/17

Eksempel Observeret værdi z = 1.80. p = P(Z 1.80) + P(Z 1.80) = 7.2% hvor T er t(9)-fordelt. Med z = 1.97 fås p = P(Z 1.97) + P(Z 1.97) = 4.9% (dvs. ikke voldsom stærk evidens mod hypotese) Med z = 3.2 fås p = P(Z 3.2) + P(Z 3.2) = 0.14% (dvs. stærk evidens mod hypotese) 13/17

En-sidet test Betragt H 0 : µ = µ 0. Sommetider er et en-sidet alternativ µ < µ 0 eller µ > µ 0 relevant. Ex forbrugerstyrelsen ønsker at teste at middelindholdet af sukker pr. pakke er mindst 1 kg. Hvad er den relevante H 0 og alternative hypotese? H 1 : µ < µ 0 - da er små værdier af kritiske. Z = X µ 0 σ/ n Test med signifikansniveau 5 % fås hvis vi forkaster når Z < 1.64 (5 % fraktil for N(0, 1)). Alternativt kan vi bruge p-værdien, som her er givet ved P(Z < z), hvor z er værdien udregnet fra data. 14/17

t-test for hypotese vedr. µ (σ ukendt) H 0 : µ = µ 0, H 1 : µ µ 0. Store eller små værdier af kritiske. T = X µ 0 S/ n Test med signifikansniveau 5 % hvis vi forkaster når T < t 0.025 eller T > t 0.975, hvor antallet af frihedsgrader er n 1. Udregnes i SPSS via Analyze Compare means One-sample T-Test og vælge værdien for µ 0 (bemærk: kun to-sidet test). 15/17

Eksempel Målinger af ph: 7.01, 7.00, 7.10, 6.97, 7.00, 7.03, 7.01, 7.01, 6.98, 7.08 (n = 10) H 0 : µ = 7, H 1 : µ 7 Teststørrelsen skal vurderes i t(9) fordeling. t = x µ 0 s/ n = 7.0250 7 0.044/ 10 = 1.46 t 0.025 (9) = 2.26 og t 0.975 (9) = 2.26 dvs. accept. 16/17

Hvilke tests kan man lave? Vi har idag set to tests idag middelværdi hvor H 0 : µ = µ 0 idag: z-test for middelværdi, når σ kendt t-test for middelværdi, når σ ukendt Der findes også andre relevante tests tests for varians, H 0 : σ = σ 0 (afsnit 10.13) tests for ens middelværdi i to stikprøver, H 0 : µ 1 = µ 2 (afsnit 10.8) tests for ens varians i to stikprøver, H 0 : σ 1 = σ 2 (afsnit 10.13) Dem skal I arbejde med for jer selv næste gang. 17/17