Konfidensintervaller og Hypotesetest

Transkript

1 Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele

2 Repetition fra sidst: Konfidensintervaller Et punkt-estimat estimerer værdien af en ukendt populations parameter ved en enkelt værdi. Fx: Middelhøjden blandt oecon studernde x =17,73. Et konfidens interval er et interval, der estimerer værdien af en ukendt populations parameter. Kaldes også et interval estimat. Sammen med intervallet gives et mål for, hvor sikker man er på, at den sande populations parameter ligger i intervallet. Dette mål kaldes for konfidens niveauet. Et punkt estimat indeholder ikke meget information om den faktiske værdi af μ fx hvor sikkert er vores punkt estimat? Et interval estimat indeholder flere informationer, for eksempel: Vi er 95% sikre på, at intervallet [164,8 ; 18,7] indeholde den sande middelværdi μ. Eller vi er 9% sikre på, at intervallet [166,1 ; 179,3] indeholder den sande middelværdi μ.

3 Repetition fra sidst (1-α)1% konfidens interval for: Populations middelværdi μ, når X er normal fordelt (eller stikprøven er stor) og σ er kendt: x ± z α σ n α Populations middelværdi μ, når X er normal fordelt og σ er ukendt: s x ± t α n α z α Husk: n-1 frihedsgrader t α

4 Konfidensinterval for andele Estimatet af populations-andelen, p, er stikprøve-andelen,,dvs. andelen af succeser i stikprøven. pˆ Hvis np>5 og n(1-p)>5, så er stikprøve-fordelingen af stikprøve-andelen ca normalfordelt: p p Pˆ (1 ) ~ N p, n Et (1-α)1% konfidensinterval for p er pˆ ± z α pˆ(1 n pˆ)

5 Eksempel 6-4 For For en en given produkttype: Hvor stor stor en en andel af af det det amerikanske marked er er besat af af udenlandske virksomheder? En En stikprøve på på1 forbrugere udtages og og af af disse bruger et et udenlandske produkt; resten bruger et et amerikanske produkt. Giv Giv et et 95% 95% konfidensinterval for for andelen af af brugere af af udenlandske produkter. pˆ ± z α pq ˆ ˆ n (.34)(.66) =.34 ± =.34 ± (1.96)(.4737) =.34 ±.98 = [.47,.438]

6 χ -fordelingen χ -fordelingen [ki-i-anden] er asymmetrisk og kun defineret for positive tal. χ -fordelingen er (li som t-fordelingen) specificeret ved antal frihedsgrader (df). Notation: X~χ (n) [X følger en χ - fordelingenmed n frihedsgrader]. Chi-Square D istrib ution: df=1, df=3, df=5 χ 5 -fordelingen er sandsynligheds χ fordelingen for en sum af uafhængige kvadrerede standard normal fordelte stokastiske variable. Hvis X~χ (df) gælder: Middelværdien er lig med antallet af frihedsgraden, E(X)=df Variansen er lig med to gange antallet af frihedsgrader, V(X)=df df = 1 df = 3 df = 5 1

7 χ -fordelingen og stikprøvevariansen Stikprøve variansen, S n n ( X X ) n 1 X i= i i= 1 i = = n 1 n 1 er en central estimator for populations variansen σ². Hvis stikprøven er taget fra en normal-fordeling, så er den stokastiske variabel: ( n 1) S χ = σ χ -fordelt med n-1 frihedsgrader. ( ) n X i= 1 Konfidensintervaller for populations-variansen er baseret på χ -fordelingen. i

8 Sandsynligheder i χ fordelingen Tabel 4 s778 α Areal i højre hale (α) χ α

9 Konfidens interval for populations variansen, σ Et (1-α)1% konfidens interval for populations variansen σ (hvis populationen er normal fordelt) er givet som: ( n ) s 1, ( n 1 ) s χ α χ α 1 α hvor er fraktilen i χ fordelingen og χ α χ α 1 er 1 α fraktilen. Bemærk: Fordi Fordi χ fordelingen er er skæv, skæv, er er konfidens-intervallet for for populations-variansen ikke ikke symmetrisk omkring s..

10 Eksempel 6-5 En En maskine fylder kaffekander (med kaffe ;-) ;-) Hvis Hvis det det gennemsnitlige indhold er er forskellig fra fra hvad det det skal skal være, kan kan maskinen justeres. Hvis Hvis variansen er er for for høj, høj, skal skal maskinen sendes til til reparation. En En stikprøve på på3 3 kander giver et et varians estimat på påss = 18,54. Giv Giv et et 95% 95% konfidens interval for for populations variansen, σ.. ( n 1) s ( n 1) s, χ α α χ 1 =

11 Eksempel 6-5 Chi-Square Distribution: df = 9 ( n 1) s ( n 1) s, χ α α χ 1 f(χ ) χ χ 4 = 16 5 χ = Areal i højre hale df

12 Hypoteser og hypotesetest. En hypotese er et udsagn om nogle karakteristika af en variabel eller mængde af variable Fx Er middelhøjden af de Oecon studerende lig 175cm? I en hypotesetest testes værdier, der er opstillet i en hypotese, ved at sammenligne med værdier beregnet fra data. For eksempel kan gennemsnittet af en stikprøve af jeres vægte beregnes til 17,7 cm. Er det (signifikant) forskellig fra 175? Det er forskellig fra 175, men kan vi derfra konkludere, at det ikke bare skyldes tilfældig variation, afhængig af eksempelvis stikprøvestørrelsen? En hypotesetest består af 5 elementer: I. Antagelser II. Hypoteser III. Teststørrelser IV. p-værdi V. Beslutning/konklusion

13 I: Antagelser Type af data: Se på om det er diskrete eller kontinuerte data. Populationsfordeling: Se på hvilken fordeling populationen har. Stikprøve: Hvilken metode er brugt til at indsamle data. Skal være en simpel stikprøve i de test vi bruger. Stikprøvestørrelse: Hvor stor er den stikprøve vi har til at beregne test størrelsen?

14 II: Hypoteser Nul hypotesen H : En påstand om en populationsparameter. Er sand indtil vi statistisk er bevist at den er sand. Den alternative hypotese H 1 : En påstand om alle situationer, der ikke er dækket af H, dvs. det modsatte af H. Nul hypotesen er sand indtil det modsatte er bevist. Eksempel: Nul- og alternativ-hypoteser for middelværdien H : μ = 5 H : μ 5 1 H : μ 5 H : μ < 5 1 H : μ 5 H : μ > 5 1 Oecon eksempel: H : μ = 175 vs H 1 : μ 175

15 III: Test størrelsen Teststørrelsen beregnes fra stikprøve data og bruges til at vurdere nul-hypotesen H. Den indeholder typisk et punktestimat for den parameter, der indgår i nul hypotesen for eksempel stikprøve gennemsnittet som punktestimat for middelværdien. Oecon eksempel: Stikprøvegennemsnittet er teststørrelsen til test af H hypotesen μ = 175. Konkret x = , hvilket er ufavorabelt for H, men er det bevis nok til at afvise H eller er det bare tilfældighedernes spil? x

16 IV: p-værdi p-værdien er et mål for troværdigheden af H set i lyset af den aktuelle stikprøve. Formelt er p-værdien af en test, er sandsynligheden for at observere en ny teststørrelse, der er mindst lige så ufarvorabel for H som den observerede teststørrelse, når nul hypotesen er sand. Jo mindre p-værdi jo mere signifikant siger man testet er. Bemærk: Selvom H er sand kan man godt få en lille p- værdi og omvendt.

17 V: Konklusion/beslutnings regel En beslutningsregel for en hypotese test, er en regel for under hvilke betingelse nul hypotesen kan forkastes. Betragt H : μ=175. Beslutnings reglen kan her være at forkaste H, når stikprøve gennemsnittet er under 17. Typisk bruges dog p-værdien for testen. Så en beslutningsregel er for eksempel at forkaste H, når p-værdien er mindre end.5. Vi accepterer/beviser aldrig, at nul hypotesen er sand. Hvis vi ikke kan forkaste nul hypotesen, siger vi, at der ikke er nok beviser til at forkaste den. Hvis vi forkaster nul hypotesen, kan vi konkludere, at der er beviser nok til at sige, at den alternative hypotese er sand.

18 Signifikansniveau α Signifikansniveauet α er et tal, således at H forkastes, hvis p- værdien er mindre end α. α er normalvis.5 eller.1. Vælges før analysen foretages. Konklusion p-værdi H H 1 p < α Forkast Accepter p > α Forkast ikke Accepter ikke Hvor lille et signifikans niveau man vælger, afhænger af hvilke konsekvenser beslutningen om at forkaste H har. Hvis det er et spørgsmål om liv eller død, for eksempel i medicinske forsøg, vælges α meget lille. Men hvis det bare er at teste om et folketingsparti er større end et andet, kan man godt α større.

19 Test af middelværdi (to-sidet test) Antagelse: Test af μ, X kvantitativ variabel og n>3. Hypoteser: H H 1 : μ = μ : μ μ Stikprøvefordeling af X når H er sand er approksimativ normal med middelværdi μ og standard afvigelse σ n standardisering Teststørrelse: Z = μ x X μ σ n z

20 Beregning af p-værdi Når H er sand, er fordelingen af Z approksimativt standard normal fordelt (dvs. normal fordelt med middelværdi og standard afvigelse 1). p-værdien er sandsynligheden for at observere en teststørrelse mindst så ufavorabel, som den observerede, givet at H er sand. I formler: P( Z > beregnet z værdi), svarende til sandsynligheden for at observere et gennemsnit der er længere fra μ end, hvis H er sand. Sansynligheden ovenfor bestemmes ved tabelopslag (det er derfor vi standardiserer). x Meget nemmere at se ved hjælp af et eksempel

21 Eksempel Hypoteser: H : μ = 3 H 1 : μ 3 Stikprøve: n = 5 x = 31.5 σ = 5 p-værdi: p = p( Z >,1) = p( Z >,1) =.17 =.34 Lille p-værdi, så H forkastes. Fordeling: Teststørrelse: Z = =, z =.1 z =. 1

22 Summe opgave H: μ = 3 H1: μ 3 H: μ = 3 H1: μ 3 Stikprøve: n = x = 31.5 σ = 5 Stikprøve: n = 1 x = 31.5 σ = 5 Beregn værdien af test størrelsen og p-værdien. Beregn værdien af test størrelsen og p-værdien

23 Relation til konfidens intervaller 95% konfidensinterval for μ, dvs. α =.5: σ 5 x± 1.96 = 31.5 ± 1.96 n 5 Middelværdi under H 95% konfidensinterval omkring observeret middelværdi μ = x = 31.5 Da (1 α)1% konfidensintervallet ikke overlapper μ er p-værdien mindre end α=.5, dvs. vi forkaster H.

24 Hvorfor = i nul hypotesen H : μ μ H1 : μ > μ H skrives i det H : μ = μ H : μ > μ 1 følgende som : Grunden til dette er, at man på denne måde "lader tvivlen komme H til gode". Desuden er vi kun interesseret i, om μ er større ( eller mindre, hvis < ) end en givet værdi, ikke hvor meget den evt. er mindre.

25 Højresidet test (et en-sidet test) Antagelse: Test af μ, X kontinuert variabel og n>3. Hypoteser: H H 1 : μ = μ : μ > μ Stikprøve fordeling af X når H er sand er approksimativ normal med middelværdi μ og standard afvigelse σ n Teststørrelse: Z = X μ σ n P-værdien: p( Z > observeret z værdi)

26 Eksempel højresidet test H: μ = 3 H1: μ > 3 Stikprøve: n = 5 x = 31.5 σ = 5 Test størrelse: P-værdi: p = p( z >,1) =.17 Lille p-værdi, så H forkastes Fordeling: Z=,1.17 Z = =, μ =3 x=31.5

27 Venstresidet test Antagelse: Test af μ, X kvantitativ variabel og n>3. Hypoteser: H H 1 : μ = μ : μ < μ Stikprøve fordeling af X når H er sand er approksimativ normal med middelværdi μ og standard afvigelse σ n Teststørrelse: Z = X μ σ n P-værdien: p( Z < observeret z værdi)

28 Eksempel venstresidet test H: μ = 3 H1: μ < 3 Stikprøve: n = 5 x = 31.5 σ = 5 Test størrelse: Z = 5 5 =,1 P-værdi: Stor p-værdi, så H forkastes ikke Fordeling: p = p( z <,1) = 1.17 μ =3 Z=,1 x=31.5

29 Test af middelværdi for ukendt varians Antagelse: Test af μ, X normalfordelt variabel og σ² ukendt (estimeret ved s²). Hypoteser: H H 1 : μ = μ : μ μ Teststørrelse t er t-fordelt med (n-1) frihedsgrader: p-værdien: p( t > observeret t værdi) kan ikke bestemmes ved tabel opslag, men SPSS gør det! Venstre og højre sidet test efter samme princip som før. X t = s μ n

30 Eksempel H: μ = 3 H1: μ 3 Stikprøve: n = 5 x = 31.5 s = 5 P-værdi: p = p( t >,1) = p( t >,1) =. =.4 Lille p-værdi, så H forkastes. Fordeling: Test størrelse: t = =,1 5 5 Svært at slå op i tabel. Ligger mellem.5 og μ =3 x= 31.5 x=31.5

31 Eksempel - fortsat H : μ = 3 H 1 : μ 3 Stikprøve: n = 5 x = 31.5 s = 5 Test størrelse: t = =,1 5 5 Svært at slå op i tabel. Ligger mellem.5 og.1. I stedet for p-værdi, vælges signifikans niveau α, for eksempel α=,5. Slå op i t-tabellen med 49 frihedsgrader under,5, da det er en -sidet test. t-værdien er cirka lig med.1. Da,1 er større end,1, forkastes H. Hvis t=-,1 skulle vi have sagt, da -,1 er mindre end -.1, forkastes H.

32 Hypotesetest for middelværdi i SPSS SPSS: Analyze > Compare Means > One Sample T-Test Angiver (1 α)1% konfidensinterval μ i H hypotesen (1 α)1% konfidensinterval for μ μ Typisk output af spss One-Sample Statistics N Mean Std. Deviation Std. Error Mean Højde 4 17,79 18, ,8519 Højde One-Sample Test Test Value = % Confidence Interval of the Mean Difference t df Sig. (-tailed) Difference Lower Upper -,59 3,561 -,783-1,378 5,696 p-værdi for to-sidet t-test, dvs. H n x s s n 1 : μ μ

33 Test af en andel Antagelse: Test af populations andel p, når np>5 og n(1-p)>5. Hypoteser: Stikprøve fordeling af når H er sand er approksimativ normal med middelværdi og standard afvigelse p 1 p ) / n Teststørrelse: p P-værdien: p( Z > beregnet z værdi) pˆ Z = p H H 1 pˆ (1 : p = p : p p p p ) / n ( Højresidet og venstresidet test efter samme princip som før.

34 Test af variansen Antagelse: Test af populations variansen σ², X normal fordelt. Hypoteser: H H 1 : σ : σ = σ σ Teststørrelse: ( n 1) s χ = σ ( χ fordelt med(n -1) frihedsgrader) P-værdi: p( Χ² > beregnet Χ² værdi) kan ikke beregnes ved tabel opslag. Højresidet og venstresidet test efter samme princip som før.

35 Test af varians - eksempel H : σ =1 H 1 : σ <1 α=.5, s =.8659, n=5 χ ( n 1) s = σ (5 1).8659 = 1 =.78 Venstre sidet test, så H forkastes, hvis χ < χ1 α ( n 1). Da χ > χ1 α ( n 1) kan vi ikke forkaste H χ α 1 ( n 1) = χ.95(4) = 13.85