Ikke-parametriske tests

Relaterede dokumenter
Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Besvarelse af vitcap -opgaven

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Generelle lineære modeller

Program. Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering. Test for ens spredninger

Chi-i-anden Test. Repetition Goodness of Fit Uafhængighed i Kontingenstabeller

Mantel-Haenszel analyser. Stratificerede epidemiologiske analyser

Løsning til eksaminen d. 14. december 2009

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression

Log-lineære modeller. Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres.

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet

Faculty of Health Sciences. SPSS appendix. Basal Statistik: Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 22.

Postoperative komplikationer

Løsning til eksaminen d. 29. maj 2009

Overlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere.

En Introduktion til SAS. Kapitel 5.

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Analysestrategi. Lektion 7 slides kompileret 27. oktober :24 p.1/17

Løsning eksamen d. 15. december 2008

Logistisk Regression - fortsat

Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Forelæsning 11: Envejs variansanalyse, ANOVA

OR stiger eksponentielt med forskellen i BMI komplicet model svær at forstå og analysere simpel model

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

Konfidensintervaller og Hypotesetest

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

OR stiger eksponentielt med forskellen i BMI. kompliceret model svær at forstå og analysere

Besvarelse af opgave om Vital Capacity

To-sidet varians analyse

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Reeksamen i Statistik for Biokemikere 6. april 2009

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge

Opgavebesvarelse, Basalkursus, uge 3

Multipel Lineær Regression

02402 Vejledende løsninger til hjemmeopgaver og øvelser i uge 5

Kausalitet. Introduktion til samfundsvidenskabelig metode. Samfundsvidenskabelig metode. Hvad er metode? Hvad er kausalitet.

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer.

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Opgavebesvarelse, Basalkursus, uge 3

Løsning til eksamen d.27 Maj 2010

24. februar Analyse af overlevelsesdata (ventetidsdata) Ikke parametrisk statistiske test : Det statistiske modelbegreb Modelselektion

Epidemiologi og Biostatistik

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Basic statistics for experimental medical researchers

Statistik kommandoer i Stata opdateret 22/ Erik Parner

Basal Statistik. En- og to-stikprøve problemer. Eksempel på parrede data. Eksempel på parrede data. Faculty of Health Sciences

Kapitel 7 Forskelle mellem centraltendenser

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6

Generalized Probit Model in Design of Dose Finding Experiments. Yuehui Wu Valerii V. Fedorov RSU, GlaxoSmithKline, US

Reexam questions in Statistics and Evidence-based medicine, august sem. Medis/Medicin, Modul 2.4.

Statistik Lektion 17 Multipel Lineær Regression

Skriftlig eksamen Science statistik- ST501

Phd-kursus i Basal Statistik, Opgaver til 1. uge Opgave 1: Sundby

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Kapitel 10 Simpel korrelation

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Transkript:

Ikke-parametriske tests

2 Dagens menu t testen Hvordan var det nu lige det var? Wilcoxson Mann Whitney U Kruskall Wallis Friedman Kendalls og Spearmans correlation

3 t-testen Patient Drug Placebo difference 1,00 19,00 22,00-3,00 2,00 11,00 18,00-7,00 3,00 14,00 17,00-3,00 4,00 17,00 19,00-2,00 5,00 23,00 22,00 1,00 6,00 11,00 12,00-1,00 7,00 15,00 14,00 1,00 8,00 19,00 11,00 8,00 9,00 11,00 19,00-8,00 10,00 8,00 7,00 1,00

4 t-testen Men er data normal fordelte? Vi spørger SPSS! Table 4-1 Armitage

5 t-testen. Er data normalfordelte? Tests of Normality Kolmogorov-Smirnov a Shapiro-Wilk Statistic df Sig. Statistic df Sig. drug,191 10,200 *,954 10,715 placebo,172 10,200 *,936 10,509 a. Lilliefors Significance Correction *. This is a lower bound of the true significance.

6 t-testens begrænsninger Hvis vi tvivler på normalfordeling Hvis vores outcome (dependent variable) er ordinal (ordnet kategorisk) fx --, -, 0, +, ++ Hvis vi kan nøjes med en simpel metode

7 The sign test Den non-parametriske version af one-sample t-test H 0 for One-sample t-test: Middelværdien er 0 H 0 for sign testen: Fordelingen er symmetrisk omkring 0

8 The sign test Er der lige mange plusser og minusser? Der er 4 plusser og 6 minusser. Binomial fordelingen fortæller om sandsynligheden for at få 4 plusser ud af 10 mulige. p r, n = n! 1 r 1 n r r! n r! 2 2 p 4,10 = 10! 1 4 1 6 4! 6! = 0.21 2 2 p = p 4,10 + p 3,10 + p 2,10 + p 1,10 + p 0,10 = 0.21 + 0.12 + 0.04 + 0.01 + 0.001 = 0.38 (One sided!) Patient Drug Placebo difference Sign 1,00 19,00 22,00-3,00-2,00 11,00 18,00-7,00-3,00 14,00 17,00-3,00-4,00 17,00 19,00-2,00-5,00 23,00 22,00 1,00 + 6,00 11,00 12,00-1,00-7,00 15,00 14,00 1,00 + 8,00 19,00 11,00 8,00 + 9,00 11,00 19,00-8,00-10,00 8,00 7,00 1,00 +

The sign test in SPSS 9

The sign test in SPSS the fancy dialog 10

11 The sign test Binomial Test Observed Exact Sig. (2- Category N Prop. Test Prop. tailed) difference Group 1 <= 0 6,60,50,754 Group 2 > 0 4,40 Total 10 1,00 Det er altså ikke særligt usandsynligt at observere 4 eller mindre minusser ud af 10 mulige

12 Men fortegnet beskriver jo ikke hele forskellen Hvis fx de negative værdier er større end de positive Wilcoxon s signed rank sum test Tager højde for det Patient Drug Placebo difference 1,00 19,00 22,00-3,00 2,00 11,00 18,00-7,00 3,00 14,00 17,00-3,00 4,00 17,00 19,00-2,00 5,00 23,00 22,00 1,00 6,00 11,00 12,00-1,00 7,00 15,00 14,00 1,00 8,00 19,00 11,00 8,00 9,00 11,00 19,00-8,00 10,00 8,00 7,00 1,00

13 Wilcoxon s signed rank sum test Opstil tallene efter størrelse uden at tage hensyn til fortegnet, men noter det blot Hvis flere tal har samme rank, bruges den gennemsnitlige rank Plussernes hhv. minussernes rank summeres 1 2 3 4 5 6 7 8 9 10 Rank 2.5 5 6.5 8 9.5 Numerical value 1 1 1 1 2 3 3 7 8 8 sign + - + + - - - - + - T+ = 2,5+2,5+2,5+9,5 = 17 T- = 2,5+5+6,5+6,5+8+9,5 = 38 difference -3,00-7,00-3,00-2,00 1,00-1,00 1,00 8,00-8,00 1,00

14 Wilcoxon s signed rank sum test Der slås op i tabel for at se om ranken af den mindste er lille.

Wilcoxon s signed rank sum test 15

Wilcoxon s signed rank sum test the fancy version 16

17 Wilcoxon s signed rank sum test Ranks N Mean Rank Sum of Ranks placebo - drug Negative Ranks 4 a 4,25 17,00 Z Test Statistics b placebo - drug -1,079 a Positive Ranks 6 b 6,33 38,00 Asymp. Sig. (2-tailed),281 Ties 0 c a. Based on negative ranks. Total 10 b. Wilcoxon Signed Ranks Test a. placebo < drug b. placebo > drug c. placebo = drug

18 Pause Opgave Use Wilcoxon s signed rank sum test to test if there is a statistical difference between the number of attacks in the placebo and the Pronethaol groups Patient number # attack on placebo Pronethaol 1 71 29 2 323 348 3 8 1 4 14 7 5 23 16 6 34 25 7 79 65 8 60 41 9 2 0 10 3 0 11 17 15 12 7 2

19 Sammenligning mellem to uafhængige grupper Mann Whitney U test Eller Wilcoxon s rank sum test Eller Kendall s S test t-testen for ikke-parametrisk data

20 Mann Whitney U (Wilcoxon s metode) test H 0 : Fordelingerne som de to grupper stammer fra er identiske Sådan gør man: ovnen tændes på 200C 1. Opstil tallene fra begge grupper i rækkefølge (Ranking) 2. Beregn summen af rank ene for hver gruppe 3. Tæl antallet af tal i hver gruppe 4. Se om den mindste rank sum er mindre end den der er opgivet i tabel A8

21 Mann Whitney U test (Wilcoxon s metode) - I hånden High Low Protein Protein 134,00 70,00 146,00 118,00 104,00 101,00 119,00 85,00 124,00 107,00 161,00 132,00 107,00 94,00 83,00 113,00 129,00 97,00 123,00

Mann Whitney U test (Wilcoxon s metode) - I hånden 22

23 Mann Whitney U test (Wilcoxon s metode) - I SPSS Tabel 4-2 Armitage Bemærk opsætningen af data!

24 Mann Whitney U test (Wilcoxon s metode) - I SPSS Bemærk at man skal definere gruppe inddelingen!

Mann Whitney U test - I SPSS 25

26 Mann Whitney U test - I SPSS Ranks group N Mean Rank Sum of Ranks Weight low 7 7,07 49,50 high 12 11,71 140,50 Total 19 Test Statistics b Weight Mann-Whitney U 21,500 Wilcoxon W 49,500 Z -1,733 Asymp. Sig. (2-tailed),083 Exact Sig. [2*(1-tailed Sig.)],083 a a. Not corrected for ties. b. Grouping Variable: group

28 Sammenligning af flere usammenhængende grupper Kruskal-Wallis test H 0 : Fordelingerne som gruppere stammer fra er identiske En-vejs ANOVA for parametrisk data

29 Kruskal-Wallis test Et par definitioner: k er antallet af grupper n i antallet af observationer i den i te gruppe N er det samlede antal observationer R i summen af ranks i den i te gruppe Sådan gør man: Rank alle observationer Beregn rank summen for hver gruppe Beregn H (Det der i bogen kaldes T) Dette H er en chi-kvadrat fordeling med k-1 frihedsgræder Slå p-værdien op i en tabel H 2 Ti 12 ni = 3 N N ( N + 1) ( + 1)

Kruskal-Wallis test Et eksampel fra Armitage 30

31 Kruskal-Wallis test Et eksampel De rå data rankes

32 Kruskal-Wallis test Et eksampel De rå data rankes H beregnes H 2 Ti 12 ni = 3 N N ( N + 1) ( + 1) 12 H = 2 2 2 2 ( 42 + 53 + 36 + 79 ) 20 ( 20 + 1) 3 12 2422 = 3 21 = 69,2 63 = 6,2 20 21 5 ( 20 + 1)

33 Kruskal-Wallis test Et eksampel De rå data rankes H = 6,2 Antallet af frihedsgrader = k-1 = 3

Kruskal-Wallis test i SPSS 34

Kruskal-Wallis test i SPSS 35

Kruskal-Wallis test i SPSS 36

37 Kruskal-Wallis test i SPSS Ranks group N Mean Rank count 1,00 5 8,40 2,00 5 10,60 3,00 5 7,20 4,00 5 15,80 Total 20 Test Statistics a,b count Chi-Square 6,205 df 3 Asymp. Sig.,102 a. Kruskal Wallis Test b. Grouping Variable: group

38 Sammenligning af flere sammenhængende grupper Friedman s test Repeated ANOVA for parametrisk data

Friedman s test Table 8.3 from Armitage 39

40 Friedman s test Ranks Mean Rank T1 1,38 T2 2,00 T3 2,94 T4 3,69 Test Statistics a N 8 Chi-Square 15,152 df 3 Asymp. Sig.,002 a. Friedman Test

Friedman s test 41

42 Pause opgave? Er der forskel på grisebassernes vægt i de forskellige fodergrupper?

43 Ranked Correlation Kendall s τ Spearman s r s Korrelation koefficienten er mellem -1 og 1. Hvor -1 er perfekt omvendt korrelation, 0 betyder ingen korrelation, og 1 betyder perfekt korrelation. Pearson is the correlation method for normal data Remember the assumptions: 1. Dependent variable must be metric continuous 2. Independent must be continuous or ordinal 3. Linear relationship between dependent and all independent variables 4. Residuals must have a constant spread. 5. Residuals are normal distributed

Kendall s τ - Et eksempel 44

45 Kendall s τ - Et eksempel τ = S ( n 1) 1 2 n S = P Q

46 Spearman det samme eksempel d 2 1 4 9 1 1 1 9 9 1 16 r s 6 d = 3 n n 2 6 52 = 1 10 10 1 3 = 0.6848

Korrelation i SPSS 47

48 Korrelation i SPSS Correlations Correlations a b a b a Pearson 1,685 * Kendall's tau_b a Correlation 1,000,511 * Correlation Coefficient Sig. (2-tailed),029 N 10 10 b Pearson,685 * 1 Correlation Sig. (2-tailed),029 N 10 10 *. Correlation is significant at the 0.05 level (2-tailed). Sig. (2-tailed).,040 N 10 10 b Correlation,511 * 1,000 Coefficient Sig. (2-tailed),040. N 10 10 Spearman's rho a Correlation Coefficient 1,000,685 * Sig. (2-tailed).,029 N 10 10 b Correlation Coefficient,685 * 1,000 *. Correlation is significant at the 0.05 level (2-tailed). Sig. (2-tailed),029. N 10 10