Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 5: Test for én stikprøve 5.1 Test for middelværdi................................. 1 5.1.1 t-fordelingen................................. 1 5.1.2 Oversigt.................................... 2 5.1.3 Eksempel................................... 3 5.2 Test for varians.................................... 4 5.2.1 Oversigt.................................... 4 5.2.2 Eksempel................................... 5 5.3 Stikprøvestørrelse................................... 7 5.3.1 Oversigt.................................... 7 5.3.2 Eksempel................................... 7 5.3.3 Hvor stort et n?............................... 8 5.4 Rapportering af usikkerhed............................. 8 5.1 Test for middelværdi 5.1.1 t-fordelingen Tilfældigt udtrukket stikprøve af størrelse n. X N(µ,σX 2 ) X er normalfordelt med parametrene µ og σ X. Standardiser X med µ og s X = s x / n: t = X µ s X Fordelingen for t kaldes en t-fordeling med n 1 frihedsgrader (ikke normalfordelt, fordi σ x ikke kendes, men må estimeres). Antal frihedsgrader betegnes ν = n 1. Tæthedsfunktionen for t-fordelingen er symmetrisk og leptokurtisk. Ligner tætheden for N(0,1) mere og mere for ν stor.
5.1 Test for middelværdi 2 Kritiske værdier betegnes: Tosidet: t α(2),ν Ensidet: t α(1),ν Lad F tν betegne fordelingsfunktionen, så er er (tabel B.3): F tν ( tα(2),ν ) = 1 α/2 F tν ( tα(1),ν ) = 1 α 5.1.2 Oversigt Denne test kaldes en t-test. Tilfældigt udtrukket stikprøve af størrelse n. X N(µ,σX 2 ) X er normalfordelt med parametrene µ og σ X. Både µ og σ er ukendte. Nulhypotese H 0 : a) µ = µ 0 b) µ µ 0 c) µ µ 0 Alternativ hypotese H A : a) µ µ 0 b) µ < µ 0 c) µ > µ 0 Teststørrelse: t = X µ 0 s X = X µ 0 s x / n Fordeling: t t-fordelt med ν = n 1 frihedsgrader. Signifikansniveau: α p-værdi: a) p = 2 {1 F tν ( t )} b) p = F tν (t) c) p = 1 F tν (t)
5.1 Test for middelværdi 3 Beslutningsregel: Forkast H 0, hvis p < α eller a) t > t α(2),ν b) t < t α(1),ν c) t > t α(1),ν Konfidensinterval: intervallet med endepunkter: Dette interval opfylder at X ± t α(2),ν s X P ( X tα(2),ν s X µ X + t α(2),ν s X) = 1 α NB: For den tosidede test er beslutningsreglen ækvivalent med at forkaste H 0 hvis µ 0 ikke er indeholdt i konfidensintervallet. Bemærkninger: Testen er nogenlunde robust, dvs. ikke så afhængig af den underliggende forudsætning om normalitet især hvis fordelingen er symmetrisk. Specielt gælder der altid, ifølge den centrale grænseværdisætning, approximativt at X N(µ,σ 2 X ) for n stor. 5.1.3 Eksempel Data: Der er indsamlet data om opløsningstiden af et medicinsk præparat i mavesaften (målt i sekunder): 42.7, 43.4, 44.6, 45.1, 45.6, 45.9, 46.8, 47.6 (Zar, eks. 7.4, p. 98). Problemstilling: Det ønskes undersøgt om opløsningstiden er større end 45 sekunder, idet α vælges til 0.05. Der forventes at være tale om en tilfældigt udtrukket stikprøve, n = 8. Det må antages, at X N(µ,σX 2 ), hvilket bør checkes. Nulhypotese H 0 : µ 45. Alternativ hypotese H A : µ > 45. Teststørrelse: (se SAS-output nedenfor) t = X µ 0 s X = X µ 0 s X / 45.21 45 = n 1.64/ 8 = 0.366, Fordeling: t t-fordelt med n 1 = 7 frihedsgrader.
5.2 Test for varians 4 Signifikansniveau: α = 0.05. p-værdi: p = 1 F tν (t) = 0.3624, jvf. SAS-output. Beslutningsregel: Forkast H 0, hvis p < α = 0.05. Konklusion: Da dette ikke er tilfældet, kan vi ikke afvise H 0, dvs. den gennemsnitlige opløsningstid er ikke signifikant mere end 45 sekunder. Konfidensinterval: Da s X = 1.64/ 8 = 0.5798 og t 0.05(2),7 = 2.365 (tabel B3) er endepunkterne for et 95% konfidensinterval givet ved Altså fås intervallet 45.21 ± 0.5798 2.365 [43.84, 46.58] Da dette interval indeholder værdien µ 0 = 45 kan H 0 heller ikke afvises ved et tosidet test. SAS-output One Sample T Test for a Mean Sample Statistics for X N Mean Std. Dev. Std. Error ------------------------------------------------- 8 45.21 1.64 0.58 Hypothesis Test Null hypothesis: Mean of X <= 45 Alternative: Mean of X > 45 t Statistic Df Prob > t --------------------------------- 0.366 7 0.3624 5.2 Test for varians 5.2.1 Oversigt Tilfældigt udtrukket stikprøve. X N(µ,σ 2 ).
5.2 Test for varians 5 Både µ og σ er ukendte. Nulhypotese H 0 : a) σ 2 = σ0 2 b) σ 2 σ0 2 c) σ 2 σ0 2 Alternativ hypotese H A : a) σ 2 σ 2 0 b) σ 2 < σ 2 0 c) σ 2 > σ 2 0 Teststørrelse: χ 2 = ν s2 σ0 2, hvor ν = n 1 Fordeling: χ 2 χ 2 -fordelt med ν = n 1 frihedsgrader. Signifikansniveau: α p-værdi: a) p = 2F χ 2 ν (χ 2 ) eller p = 2 { 1 F χ 2 ν (χ 2 ) } (vælg den mindste). b) p = F χ 2 ν (χ 2 ) c) p = 1 F χ 2 ν (χ 2 ) Beslutningsregel: Forkast H 0, hvis p < α eller a) Enten χ 2 χ 2 α/2,ν eller χ2 χ 2 1 α/2,ν b) χ 2 χ 2 1 α,ν c) χ 2 χ 2 α,ν Konfidensinterval: Det tosidede test er analog til opstilling af konfidensinterval: ( ) ν s 2 P σ 2 ν s2 = 1 α χ 2 α/2,ν χ 2 1 α/2,ν Bemærkning: Testen afhænger af antagelsen om normalitet, især symmetrien.
5.2 Test for varians 6 5.2.2 Eksempel Data: Med udgangspunkt i de data, der blev benyttet i afsnit 5.1.3 ønskes en undersøgelse af om variansen er større end 1.5. Da vi antog, at forudsætninger for at gennemføre en t-test var opfyldte, er forudsætningerne for at lave varianstesten ligeledes opfyldte. Nulhypotese H 0 : σ 2 1.5 Alternativ hypotese H A : σ 2 > 1.5 Teststørrelse fra SAS output nedenfor, χ 2 = ν s2 σ 2 0 = 12.552 Fordeling: χ 2 χ 2 -fordelt med ν = n 1 = 8 1 = 7 frihedsgrader. p-værdi: fra SAS-output nedenfor, p = 1 F χ 2 ν (χ 2 ) = 0.0838 Beslutningsregel: Forkast H 0, hvis p < α. Konklusion: Med valg af α = 5% vil vi således acceptere H 0. Vi kan således ikke påvise, at variansen er større end 1.5. 95% Konfidensinterval: Fra tabel B1 fås χ 2 0.025,7 = 16.013, χ2 0.975,7 = 1.690 så intervallet er [ 7 1.6401 16.013, 7 1.6401 ] 1.690 = [0.717, 6.793] Konklusion: Bemærk intervallets store længde; informationen om σ 2 i en stikprøve på 8 er forholdsvis begrænset. SAS-output
5.3 Stikprøvestørrelse 7 One Sample Chi-square Test for a Variance Sample Statistics for X N Mean Std. Dev. Variance --------------------------------------------- 8 45.213 1.6401 2.6898 Hypothesis Test Null hypothesis: Variance of X <= 1.5 Alternative: Variance of X > 1.5 5.3 Stikprøvestørrelse 5.3.1 Oversigt Chi-square Df Prob --------------------------------- 12.552 7 0.0838 Problemstilling: Hvor stor en stikprøve kræves for at få en given præcision i estimationen af µ? Tilfældigt udtrukket stikprøve af størrelse n X N(µ,σX 2 ) X er normalfordelt med parametrene µ og σ X. Både µ og σ er ukendte. En værdi for s x kendes, f.eks. fra litteraturen eller fra en pilotundersøgelse. Problemanalyse: Skriv 1 α konfidensintervallet på formen X ± d, hvor d = t α(2),ν s X Den krævede stikprøvestørrelse afhænger af 1. Den ønskede præcision (hvor lille ønskes d); 2. spredningen σ, som estimeres ved s x ; 3. Konfidensniveauet 1 α. Iterativ metode: Lad d og α og s x være givet, og bemærk at s x d = t α(2),ν n
5.3 Stikprøvestørrelse 8 Lad som om ν er kendt, og løs mht. n: n = s2 xt 2 α(2),ν d 2 Sæt ν = n 1, find t α(2),ν igen og gå tilbage og udregn et nyt n. Fortsæt indtil n stabiliserer sig. 5.3.2 Eksempel Brug igen data fra afsnit 5.1.3. Vælg præcision d = 1.1. Vælg konfidensniveauet 1 α = 95%. Brug estimatet s x = 1.6401 og start med n = 8. 1. Iteration: Med ν = 8 1 = 7 fås t α(2),ν = 2.365, så ( ) 1.6401 2.365 2 n = = 12.4 12 1.1 2. Iteration: Med ν = 12 1 = 11 fås t α(2),ν = 2.201, så ( ) 1.6401 2.201 2 n = = 10.8 11 1.1 3. Iteration: Med ν = 11 1 = 10 fås t α(2),ν = 2.228, så ( ) 1.6401 2.228 2 n = = 11.0 = 11 1.1 Da værdien for n nu er stabil fås resultatet n = 11, som er den ønskede stikprøvestørrelse. 5.3.3 Hvor stort et n? Følgende tabel kan være nyttig til valg af stikprøvestørrelse: n 1/ n t 0.05(2),n 1 t 0.05(2),n 1 / n 1 1.000 2 0.707 12.706 8.983 3 0.577 4.303 2.483 4 0.500 3.182 1.591 10 0.316 2.262 0.715 50 0.141 2.010 0.283 100 0.100 1.984 0.198 Der kræves et n på mindst 2 for at udregne s x. Bemærk den store forbedring ved at gå fra n = 2 til n = 3. Yderligere forbedringer kræver væsentlig større n.
5.4 Rapportering af usikkerhed 9 5.4 Rapportering af usikkerhed F.eks. i rapport, speciale osv. (numerisk eller grafisk). Givet: n, X, sx, s X og evt. range (mindste og største data). Hovedregel: der skal rapporteres 3 ting: 1. Gennemsnittet X 2. Et spredningsmål. 3. Stikprøvestørrelsen n. Ofte angives usikkerheden som X± spredningsmål, efterfulgt af (n). Valg af spredningsmål: ±s x angiver populationsvariationen. ±s x angiver SE, altså hvor godt X bestemmer µ. ±d angiver også SE. Ovenstående kan evt. kombineres med range. Eksempler: Zar afsnit 7.4.