Kapitel 7 Forskelle mellem centraltendenser

Relaterede dokumenter
Kapitel 8 Chi-i-anden (χ 2 ) prøven

Kapitel 1 Statistiske grundbegreber

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Vejledende besvarelser til opgaver i kapitel 14

Kapitel 10 Simpel korrelation

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Program. Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering. Test for ens spredninger

Kursus Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, ( , ) Per Bruun Brockhoff

Konfidensintervaller og Hypotesetest

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Løsninger til kapitel 9

Note til styrkefunktionen

Kapitel 4 Sandsynlighed og statistiske modeller

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...

Matematik A. Studentereksamen. Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet

Kapitel 3 Centraltendens og spredning

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Kapitel 4 Sandsynlighed og statistiske modeller

Kapitel 11 Lineær regression

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup)

Vejledende besvarelse af eksamen i Statistik for biokemikere, blok

Eksamen i Statistik for biokemikere. Blok

Vejledende løsninger kapitel 8 opgaver

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007

Forelæsning 9: Inferens for andele (kapitel 10)

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Løsning til eksamen d.27 Maj 2010

PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006

Modul 12: Regression og korrelation

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

1 Hb SS Hb Sβ Hb SC = , (s = )

Tema. Dagens tema: Indfør centrale statistiske begreber.

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Kapitel 3 Centraltendens og spredning

Løsning eksamen d. 15. december 2008

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

To-sidet varians analyse

Personlig stemmeafgivning

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j

Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ 2 -test og Goodness of Fit test.

MPH specialmodul Epidemiologi og Biostatistik

Løsning til eksaminen d. 14. december 2009

Supplement til kapitel 7: Approksimationen til normalfordelingen, s. 136

Opgaver til kapitel 3

Konfidensinterval for µ (σ kendt)

Kvantitative Metoder 1 - Efterår Dagens program

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se

Module 4: Ensidig variansanalyse

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet

MATEMATIK A-NIVEAU. Anders Jørgensen & Mark Kddafi. Vejledende eksempler på eksamensopgaver og eksamensopgaver i matematik, 2012

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Eks. 1: Kontinuert variabel som i princippet kan måles med uendelig præcision. tid, vægt,

Ovenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm.

2 -test. Fordelingen er særdeles kompleks at beskrive med matematiske formler. 2 -test blev opfundet af Pearson omkring år 1900.

Kvantitative Metoder 1 - Forår Dagens program

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

a) Har måleresultaterne for de 2 laboranter samme varians? b) Tyder resultaterne på, at nogen af laboranterne måler med en systematisk fejl?

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Forsøgsplanlægning Stikprøvestørrelse

02402 Løsning til testquiz02402f (Test VI)

c) For, er, hvorefter. Forklar.

Vejledende eksamensopgaver vedr. hypotesetest (stx B og stx A)

Opgave I II III IV V VI Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar

En Introduktion til SAS. Kapitel 5.

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Kvantitative Metoder 1 - Forår 2007

Transkript:

Kapitel 7 Forskelle mellem centraltendenser Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 29 Indledning 1. z-test for ukorrelerede data 2. t-test for ukorrelerede data med ens varianser 3. t-test for ukorrelerede data med uens varianser 4. z-test for korrelerede data 5. t-test for korrelerede data 6. Mann-Whitney U-test for ukorrelerede data 7. Wilcoxons rangtest for korrelerede data 2 / 29

Parametriske tests Vi starter med at opstille nulhypotesen H 0 og en relevant alternativhypotese H 1 Vi beregner en teststørrelse med kendt fordeling på baggrund af data Ved opslag i tabel omsættes teststørrelsen til en signifikanssandsynlighed kaldet p For n mindre end 30 foretrækkes t-fordelingen, og ellers z-fordelingen På baggrund af p konkluderes det, om H 0 kan antages eller bør forkastes 3 / 29 Ikke-parametriske tests De ikke-parametriske tests benyttes når data er målt på en ordinalskala, altså når de kan ordnes i en rækkefølge men differensen mellem observationer ikke tillægges nogen speciel betydning Et centralt begreb er rangværdi, der udtrykker placeringen når observationerne ordnes i rækefølge Som ved de parametriske tests opstilles der et hypotesesæt og der beregnes en teststørrelse, men omsætningen til en signifikanssandsynlighed p må ske ved hjælp af testspecifikke tabeller 4 / 29

Parametriske tests for ukorrelerede data Disse tests er aktuelle når data er målt på en ratio- eller intervalskala ukorrelerede, dvs. hænger ikke naturligt sammen i par Når n 30 kan vi anvende et z-test Når n < 30 anvender vi et t-test, idet vi dog først skal teste, om der kan antages ens varians 5 / 29 1. z-test for ukorrelerede data: Læsescore Vi starter med z-testet for ukorrelerede data på det eksempel, der omhandler (opdigtede) læsescores for 30 piger og 30 drenge i tredje klasse Vi kan opstille følgende summariske beskrivelse af data: Køn i n i x i s i piger 1 30 59,83 16,58 drenge 2 30 51,90 19,24 6 / 29

1. z-test for ukorrelerede data: Hypoteser Første trin er at opstille en relevant hypotese. I dette tilfælde kan vi se, at stikprøvegennemsnittet er højst for pigerne, hvilket vi vælger at bruge til at formulere et retningsbestemt alternativ: H 0 : H 1 : µ piger = µ drenge µ piger > µ drenge Vi vender tilbage til betydningen af alternativhypotesen H 1 ift. bestemmelsen af signifikanssandsynligheden p 7 / 29 1. z-test for ukorrelerede data: Teststørrelse Teststørrelsen z beregnes som forskellen på de to stikprøvegennemsnit normeret med spredningen på denne Forskellen beregnes let til x 1 x 2 = 59, 83 51, 90 = 7, 93 Variansen på forskellen beregnes som s1 2 s x1 x 2 = + s2 2 16, 58 2 = + n 1 n 2 30 19, 242 30 = 4, 636 Endelig kan teststørrelsen z beregnes som z = x 1 x 2 s x1 x 2 = 7, 93 4, 636 = 1, 711 8 / 29

1. z-test for ukorrelerede data: Signifikanssandsynlighed Nu skal teststørrelsen z omsættes til en signifikanssandsynlighed p, idet vi tager hensyn til vores sæt af hypoteser Alternativhypotesen er µ piger > µ drenge, så vi skal finde sandsynligheden for en teststørrelse på 1,711 eller mere i standardnormalfordelingen: p = P(Z > 1, 711) = 1 P(Z < 1, 711) = 1 Φ(1, 711) = 1 0, 956 = 0, 044 9 / 29 1. z-test for ukorrelerede data: Signifikanssandsynlighed Sandsynlighed kan også illustreres grafisk ved hjælp af det skraverede areal i følgende figur: ϕ(x) 0.0 0.1 0.2 0.3 0.4 3 2 1 0 1 2 3 Sandsynligheden for en teststørrelsen på mere end 1,711 er altså 4,4% under den antagelse at H 0 er sand 10 / 29

1. z-test for ukorrelerede data: Konklusion Med signifikanssandsynligheden p = 0, 044 vælger vi at forkaste vores nulhypotese, µ piger = µ drenge, og i stedet overgå til alternativhypotesen, µ piger > µ drenge Vi skal dog være opmærksomme på, at selvom µ piger = µ drenge faktisk er sandt, så vil vi have en sandsynlighed på 4,4% for at observere en forskel x 1 x 2 på 7,93 eller mere Signifikanssandsynligheden p udtrykker altså også risikoen for at lave en fejl af Type I 11 / 29 1. z-test for ukorrelerede data: Tosidet alternativ Med alternativhypotesen µ piger µ drenge får vi p = 2 P(Z > z ) = 2(1 Φ(z)) = 2(1 0, 956) = 0, 088 ϕ(x) 0.0 0.1 0.2 0.3 0.4 3 2 1 0 1 2 3 Dette er det dobbelte af den oprindelige p så det bliver sværere at afvise H 0 og grunden til at et retningsbestemt alternativ ofte foretrækkes 12 / 29

1. z-test for ukorrelerede data: Forkert alternativ Med alternativhypotesen µ piger < µ drenge får vi p = P(Z < z) = Φ(z) = 0, 956 ϕ(x) 0.0 0.1 0.2 0.3 0.4 3 2 1 0 1 2 3 Dette er meget højt fordi nulhypotesen er meget attraktiv sammenlignet med alternativet, der jo er i direkte modstrid med vores observationer 13 / 29 Sammenhæng mellem de parametriske tests De forskellige tests z-test for ukorrelerede data t-test for ukorrelerede data med ens varianser t-test for ukorrelerede data med uens varianser z-test for korrelerede data t-test for korrelerede data er alle bygget op over samme ide: teststørrelse = forskel spredning på forskel Signifikanssandsynligheden p beregnes ud fra teststørrelsen (med kendt fordeling) og de opstillede hypoteser 14 / 29

Præ 2 og 3: F -test for ens varians Eksempel i Tabel 7.2 Starter med at beregne stikprøvevarianserne s1 2 s2 2 = 2, 2 idet n 1 = 4 og n 2 = 5 Dernæst beregnes F som = 3, 0 og F = s2 max s 2 min = 3, 0 2, 2 = 1, 36 der følger en F -fordelingen med 4-1 = 3 frihedsgrader i tæller og 5-1 = 4 frihedsgrader i nævner Vi finder kritisk værdi for α = 0, 05 til 6,59 hvilket betyder at p > 0, 05 og at H 0 (s1 2 = s2 2 ) derfor ikke kan forkastes 15 / 29 2. t-test for ukorrelerede data med ens varians Samme princip som i z-testet men nu beregnes teststørrelsen t som x 1 x 2 t = s 2 (1/n 1 + 1/n 2 ) hvor s 2 = s2 1 (n 1 1) + s 2 2 (n 2 1) n 1 + n 2 2 t-værdien vurderes i en t-fordeling med antal frihedsgrader svarende til n 1 + n 2 2 16 / 29

3. t-test for ukorrelerede data med uens varians Nu beregnes teststørrelsen t som t = x 1 x 2 s1 2/n 1 + s2 2/n 2 t-værdien vurderes i en t-fordeling med antal frihedsgrader svarende til df = (n 1 1)(n 2 1) (n 2 1)c 2 + (n 1 1)(1 c) 2 hvor c = s 2 1 /n 1 s 2 1 /n 1 + s 2 2 /n 2 17 / 29 Parametriske tests for korrelerede data Disse tests er aktuelle når data er målt på en ratio- eller intervalskala korrelerede, dvs. hænger naturligt sammen i par Når n 30 kan vi anvende et z-test Når n < 30 anvender vi et t-test I begge tilfælde regnes på differenserne d i = x i y i 18 / 29

4. z-test for korrelerede data Først bestemmes spredningen på differenserne som s 2 d = n i=1 (d i d) 2 n 1 Herefter beregnes teststørrelsen z som z = d s d / n Signifikanssandsynligheden p bestemmes ved opslag i Tabel A 19 / 29 5. t-test for korrelerede data Når n < 30 benyttes et t-test i stedet for z-testet Teststørrelsen t beregnes præcist som ved z-testet, men p bestemmes ved opslag i en t-fordeling med n 1 frihedsgrader 20 / 29

t-test med regneark Regnearksfunktionen ttest(...) kræver fire argumenter: Første datavektor Anden datavektor Formulering af alternativhypotese (1=ensidig, 2=tosidig) Testtype (1=korreleret, 2=ukorreleret men med ens varians, 3=ukorreleret med uens varians) Regnearksfunktionen ztest(...) testet tosidet for en bestemt middelværdi og kræver tre argumenter: Datavektor Middelværdi under nulhypotesen Eventuelt kendt spredning og er altså ikke den samme z-test som vi kender fra kompendiet... 21 / 29 De ikke-parametriske test Mann-Whitney U-testet svarer til t- og z-test for ukorrelerede data Wilcoxons rangtest svarer til t- og z-test for korrelerede data Begge test benytter rangværdier, der udtrykker placeringen af en observation i en ordnet stikprøve - hvis stikprøven f.eks. er har vi følgende rangværdier X = {7, 9, 13, 5} R(7) = 2, R(9) = 3, R(13) = 4, R(5) = 1 22 / 29

Mann-Whitney U-test Svarer til t- og z-test for ukorrelerede data Fælles rangordning af observationer i to stikprøver (1 og 2) Dernæst summeres antallet af 1 ere før hver 2 er og omvendt, og det mindste tal anvendes som teststørrelse Optælling kan erstattes af følgende formler: hvor U 1 = n 1 n 2 + n 1(n 1 + 1) 2 U = min(u 1, U 2 ) R 1 og U 2 = n 1 n 2 + n 2(n 2 + 1) R 2 2 og R i er summen af rangværdierne for observationerne i stikprøve i 23 / 29 Mann-Whitney eksempel Stikprøve Observationer 1 3,6,6,7 2 1,3,3,4,5 Stikprøve 1 Stikprøve 2 Score Rang Score Rang 3 3 1 1 6 7,5 3 3 6 7,5 3 3 7 9 4 5 5 6 R 1 27 R 2 18 U 1 4(4 + 1) = 4 5 + 27 = 3 2 U 2 5(5 + 1) = 4 5 + 18 = 17 2 Teststørrelsen kan nu bestemmes som U = min(3, 17) = 3 Kritiske værdier fra Tabel D idet (n 1, n 2 ) = (4, 5): α (enkelt) Kritisk værdi 0,050 2 0,025 1 0,010 0 0,001 n/a Vi kan altså ikke afvise, at stikprøve 1 og 2 er trukket fra ens populationer 24 / 29

Mann-Whitney U for store stikprøver For n 1 eller n 2 større end 20 erstattes opslag af kritisk værdi i Tabel D med beregning af z-værdi, der sammenlignes med standardnormalfordelingen (Tabel A): z = U n 1n 2 2 n 1 n 2 (n 1 +n 2 +1) 12 25 / 29 Wilcoxons rangtest Svarer til t- og z-test for korrelerede data Vurderer sum af rangværdier for numeriske ændringer fordelt til stigninger T (+) og fald T ( ) For små stikprøver (højst 15 gyldige sammenligninger) benyttes Tabel E med kritiske værdier For større stikprøver benyttes en skaleret teststørrelse og opslag i normalfordeling 26 / 29

Wilcoxon eksempel Person Før Efter d R( d ) R (+) ( d ) R ( ) ( d ) A 9 4 5 4,5 4,5 B 8 2 6 6,5 6,5 C 7 9 +2 1,5 1,5 D 8 3 5 4,5 4,5 E 10 3 7 8 8 F 7 7 0. G 6 10 +4 3 3 H 9 1 8 9 9 I 5 3 2 1,5 1,5 J 8 2 6 6,5 6,5 T (+) = 4, 5 T ( ) = 40, 5 27 / 29 Wilcoxon eksempel (fortsat) I eksemplet er altså teststørrelsen T = min(t (+), T ( ) ) = min(4, 5; 40, 5) = 4, 5 Kritiske værdier er givet i Tabel E, og for n = 9 (vi udelod en observation med d = 0) findes følgende α (énsidet) 0,050 0,010 0,001 T krit 8 3 n/a Vi kan altså konkludere, at efter-scoren er signifikant lavere end før-scoren (0, 01 < p < 0, 05, n = 9) 28 / 29

Wilcoxon for store stikprøver For større stikprøver (n > 15) skaleres teststørrelsen til en z-værdi, der sammenlignes med standardnormalfordelingen (Tabel A): z = T n(n+1) 4 n(n+1)(2n+1) 24 29 / 29