Program 1. Repetition: konfidens-intervaller. 2. Hypotese test, type I og type II fejl, signifikansniveau, styrke, en- og to-sidede test. 1/19
Konfidensinterval for µ (σ kendt) Estimat ˆµ = X bedste bud på værdien af µ. Et interval af plausible bud på µ kan dannes som [ X a, X + a] a vælges så intervallet indeholder µ med en kendt sandsynlighed. 95 % konfidensinterval (a = 1.96σ/ n 2 standard error): [ X 1.96σ/ n, X + 1.96σ/ n] NB: X 1.96 σ n µ X + 1.96 σ n X µ 1.96 σ n Dvs. estimationsfejl X µ mindre end 1.96σ/ n med sandsynlighed 95%. 2/19
Eksempel En stikprøve med n = 75 og x = 0.31 udtages, hvor standardafvigelsen σ = 0.0015 er kendt. Udregning af 95 % konfidensinterval: 1.96 σ n = 1.96 0.0015 75 = 0.000339 Dvs. konfidensinterval [0.31 0.000339, 0.31 + 0.000339] = [0.3097, 0.3103] og X µ < 0.000339 med sandsynlighed 95 %. Antag vi er tilfreds med X µ < 0.0005 med sandsynlighed 95 %. Udregning af passende stikprøvestørrelse m: 0.0005 = 1.96 0.00015 m m = 1.96 0.00015 0.0005 m = 35 3/19
Konfidensintervaller 1. Konfidensinterval for middelværdi, hvor varians er kendt: [ x z α/2 σ n, x + z α/2 σ n ] 2. Konfidensinterval for middelværdi, hvor varians er ukendt: [ ] s s x t α/2, x + t n α/2 n 3. Konfidensinterval for varians: [ (n 1)s 2, χ 2 α/2 ] (n 1)s2 χ 2 1 α/2 4/19
Hypotese test: illustration udfra check af mønt Kast med mønt 50 gange. X antal plat. Sandsynlighed for plat: p. Hypotese H 0 : p = 0.5 (mod alternativ p 0.5). Forkastelsesområde: F = [0, 17] [33, 50] Acceptområde: A = [18, 32]. Fejl af type I: X F (forkast) når p = 0.5 Fejl af type II: X A (accept) når p 0.5 Ensidet forkastelsesområde: F = [31, 50]. 5/19
Type I og type II fejl H 0 sand H 0 falsk Accept H 0 korrekt afgørelse type II fejl Forkast H 0 type I fejl korrekt afgørelse Signifikansniveau α: sandsynlighed for type I fejl. β: sandsynlighed for type II fejl. Styrke 1 β: sandsynlighed for forkastelse når H 0 falsk. Optimalt: lille α og lille β (stor styrke 1 β) NB for en given stikprøve størrelse n kan vi ikke formindske α uden samtidig at øge β og omvendt. 6/19
Hypotese test: test af hypotese vedr. µ (σ kendt) Hypotese H 0 : µ = 68, H 1 : µ 68, σ = 3.6 kendt og n = 36. Accept hvis X i A = [67, 69] og forkast hvis X i F =], 67[ ]69, [. Antag µ = 70: α = P(type I) = P( X 67) + P( X > 69) = 0.095 β = P(type II) = P(67 X 69) = 0.0475 7/19
Hypotese test: test af hypotese vedr. µ (σ kendt) Bemærk: 67 X 69 1.67 Z = X 68 3.6/ 36 1.67 Hvis vi ønsker α = 5% skal vi forkaste hvis Z 1.96 eller Z 1.96. (det samme som X 66.8 = 68 1.96σ/ n eller X 69.2 = 68 1.96σ/ n, σ = 3.6 n = 36) Dvs. med udgangspunkt i Z og α = 5% er F =], 1.96] [1.96, [ og A =] 1.96, 1.96[. 8/19
Eksempel: beregning af styrke Antag µ rent faktisk er 70 hvorved X N(70, σ 2 /n). Da er Z = X 68 σ/ n N og ( ) n (70 68) σ, 1 = N(3.33, 1) (ikke N(0, 1)) 1 β = 1 P( 1.96 < Z < 1.96) = P(Z 5.29) + P(Z 1.37) = 91.5% Dvs. stærkt test (stor sandsynlighed for at forkaste) under alternativ µ = 70. Bemærk: større n betyder mindre varians for X og at fordelingen for Z forskydes væk fra 0. 9/19
Styrkefunktion H 0 : µ = 68 forkastes hvis Z mindre end -1.96 eller større end 1.96. 1 β(µ) er styrken når middelværdi er µ. Plot af styrke: styrke 0.0 0.2 0.4 0.6 0.8 1.0 n=36 n=100 64 66 68 70 72 mu 10/19
Relation til konfidensinterval Betragt hypotesen H 0 : µ = µ 0 mod alternativet µ µ 0 hvor µ 0 er en specifik værdi. Det to-sidede test med signifikansniveau 5 % accepterer hvis 1.96 X µ 0 σ/ n 1.96 X 1.96 σ n µ 0 X + 1.96 σ n Dvs. H 0 accepteres for alle værdier µ 0 der ligger i 95 % konfidensintervallet [ X 1.96 σ n, X + 1.96 σ n ] 95 % konfidensinterval: alle værdier af µ 0 som accepteres af et to-sidet test med signifikansniveau 5 % 11/19
Eksempel (fortsat) Hvis H 0 : µ = 30, x = 0.31 fås z = 0.31 0.30 0.0015/ 75 = 57.74 dvs. test med signifikansniveau 5 % forkaster. Dette kunne ses direkte af 95 % konfidensinterval, som 0.30 ligger udenfor. 12/19
En-sidet test Betragt H 0 : µ = µ 0. Sommetider er et en-sidet alternativ µ < µ 0 eller µ > µ 0 relevant. Ex forbrugerstyrelsen ønsker at teste at middelindholdet af sukker pr. pakke er mindst 1 kg. Hvad er den relevante H 0 og alternative hypotese? Alternativ µ < µ 0 : da er små værdier af kritiske. Z = X µ 0 σ/ n Test med signifikansniveau 5 % fås hvis vi forkaster når Z < 1.64 (5 % fraktil for N(0, 1)). 13/19
Hvad er stærkest konklusion: accept eller forkast? Som oftest designes test så sandsynlighed for type I fejl (fejl når der forkastes) er lille (f.eks. 5 %). Omvendt har man ofte ikke styr på sandsynlighed for type II fejl (fejl ved accept). Derfor er forkast en stærk konklusion, mens accept nemt kan svare til en type II fejl. Accept = hypotese kan ikke forkastes på baggrund af de foreliggende data. 14/19
t-test for hypotese vedr. µ (σ ukendt) H 0 : µ = µ 0, H 1 : µ µ 0. Store eller små værdier af kritiske. T = X µ 0 S/ n Test med signifikansniveau 5 % hvis vi forkaster når T < t 0.025 eller T > t 0.975, hvor antallet af frihedsgrader er n 1. Udregnes i SPSS via Analyze Compare means One-sample T-Test og vælge værdien for µ 0 (bemærk: kun to-sidet test). 15/19
Eksempel Målinger af ph: 7.01, 7.00, 7.10, 6.97, 7.00, 7.03, 7.01, 7.01, 6.98, 7.08 (n = 10) H 0 : µ = 7, H 1 : µ 7 Teststørrelsen skal vurderes i t(9) fordeling. t = x µ 0 s/ n = 7.0250 7 0.044/ 10 = 1.80 t 0.025 (9) = 2.26 og t 0.975 (9) = 2.26 dvs. accept. 16/19
p-værdi Test for H 0 : µ = µ 0 (σ kendt) med signifikansniveau 5 % forkaster når Z mindre end -1.96 eller større end 1.96. Der skelnes ikke mellem f.eks. z = 1.97 og z = 3.4 selvom sidstnævnte synes meget mere kritisk. p-værdi er et mål for hvor kritisk/usædvanlig en observeret test størrelse er: p-værdi = ssh for at observere noget ligeså eller mere kritisk Ex Med to-sidet test og z = 1.97 fås p = P(Z < 1.97) + P(Z > 1.97) = 4.9%. Hypotese forkastes hvis p-værdien er mindre end signifikansniveauet α. 17/19
Eksempel Observeret værdi t = 1.80. p = P(T 1.80) + P(T 1.80) = 11% hvor T er t(9)-fordelt. Med t = 2.28 fås p = P(T 2.28) + P(T 2.28) = 4.9% (dvs. ikke voldsom stærk evidens mod hypotese) Med t = 3.4 fås p = P(T 3.4) + P(T 3.4) = 0.8% (dvs. stærk evidens mod hypotese) 18/19
Hvilke tests kan man lave? Vi har idag set to tests for middelværdi µ = µ 0 : z-test når σ kendt, t-test når σ ukendt. Der findes også tests for varians, dvs H 0 : σ = σ 0 (afsnit 10.13), og tests med to stikprøver H 0 : µ 1 = µ 2 (afsnit 10.8) eller H 0 : σ 1 = σ 2 (afsnit 10.13). 19/19