Ikke-parametriske tests

Relaterede dokumenter
Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

Besvarelse af vitcap -opgaven

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Generelle lineære modeller

Program. Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering. Test for ens spredninger

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1

Chi-i-anden Test. Repetition Goodness of Fit Uafhængighed i Kontingenstabeller

Mantel-Haenszel analyser. Stratificerede epidemiologiske analyser

KA 4.2 Kvantitative Forskningsmetoder Forår 2010

Variansanalyse i SAS 1. Institut for Matematiske Fag December 2007

Løsning til eksaminen d. 14. december 2009

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression

Log-lineære modeller. Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres.

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet

Kvant Eksamen December timer med hjælpemidler. 1 Hvad er en continuous variable? Giv 2 illustrationer.

SPSS appendix SPSS APPENDIX. Box plots. Indlæsning. Faculty of Health Sciences. Basal Statistik: Sammenligning af grupper, Variansanalyse

Faculty of Health Sciences. SPSS appendix. Basal Statistik: Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 22.

SPSS appendix SPSS APPENDIX. Box plots. Indlæsning. Faculty of Health Sciences. Basal Statistik: Sammenligning af grupper, Variansanalyse

Postoperative komplikationer

Løsning til eksaminen d. 29. maj 2009

CLASS temp medie; MODEL rate=temp medie/solution; RUN;

Overlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere.

En Introduktion til SAS. Kapitel 5.

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Analysestrategi. Lektion 7 slides kompileret 27. oktober :24 p.1/17

Løsning eksamen d. 15. december 2008

Logistisk Regression - fortsat

Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004

k UAFHÆNGIGE grupper Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen 4 Hypotesetest (F-test)

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

Afdeling for Anvendt Matematik og Statistik December 2006

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Forelæsning 11: Envejs variansanalyse, ANOVA

OR stiger eksponentielt med forskellen i BMI komplicet model svær at forstå og analysere simpel model

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

Konfidensintervaller og Hypotesetest

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

OR stiger eksponentielt med forskellen i BMI. kompliceret model svær at forstå og analysere

Besvarelse af opgave om Vital Capacity

To-sidet varians analyse

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Reeksamen i Statistik for Biokemikere 6. april 2009

Anvendt Statistik Lektion 7. Simpel Lineær Regression

2 Epidemiologi og biostatistik. Uge 5, mandag 26. september 2005 Michael Væth, Institut for Biostatistik

Opgavebesvarelse, brain weight

Klasseøvelser dag 2 Opgave 1

Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge

Opgavebesvarelse, Basalkursus, uge 3

Opgavebesvarelse, Basalkursus, uge 3

Multipel Lineær Regression

Basal statistik. 16. september 2008

Øvelser i epidemiologi og biostatistik, 6. april 2010 Baseline-informationer fra Ebeltoft datasættet Eksempel på besvarelse

Basal statistik. 30. oktober 2007

Basal statistik. 30. oktober Den generelle lineære model

02402 Vejledende løsninger til hjemmeopgaver og øvelser i uge 5

Kausalitet. Introduktion til samfundsvidenskabelig metode. Samfundsvidenskabelig metode. Hvad er metode? Hvad er kausalitet.

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer.

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

"There are three kinds of lies: lies, damned lies and statistics. - Mark Twain

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Opgavebesvarelse, Basalkursus, uge 3

Løsning til eksamen d.27 Maj 2010

24. februar Analyse af overlevelsesdata (ventetidsdata) Ikke parametrisk statistiske test : Det statistiske modelbegreb Modelselektion

Opgavebesvarelse, Basalkursus, uge 2

Epidemiologi og Biostatistik

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Variansanalyse i SAS. Institut for Matematiske Fag December 2007

k normalfordelte observationsrækker (ensidet variansanalyse)

Basic statistics for experimental medical researchers

Opgavebesvarelse, Basalkursus, uge 3

Statistik kommandoer i Stata opdateret 22/ Erik Parner

Basal statistik. 18. september 2007

Basal Statistik. En- og to-stikprøve problemer. Eksempel på parrede data. Eksempel på parrede data. Faculty of Health Sciences

Faculty of Health Sciences. Basal Statistik. T-tests. Lene Theil Skovgaard. 17. september 2013

Kapitel 7 Forskelle mellem centraltendenser

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6

Generalized Probit Model in Design of Dose Finding Experiments. Yuehui Wu Valerii V. Fedorov RSU, GlaxoSmithKline, US

Reexam questions in Statistics and Evidence-based medicine, august sem. Medis/Medicin, Modul 2.4.

Statistik Lektion 17 Multipel Lineær Regression

Reeksamen i Statistik for biokemikere. Blok

Indhold. 2 Tosidet variansanalyse Additive virkninger Vekselvirkning... 9

Skriftlig eksamen Science statistik- ST501

Phd-kursus i Basal Statistik, Opgaver til 1. uge Opgave 1: Sundby

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Kapitel 10 Simpel korrelation

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Øvelser i epidemiologi og biostatistik, 12. april 2010 Ebeltoft-projektet: Analyse af alkoholrelaterede data mm. Eksempel på besvarelse

Basal statistik. 18. september 2007

Eksempel: To metoder, som forventes at skulle give samme resultat: MF: Transmitral volumetric flow, bestemt ved Doppler ekkokardiografi

DATA PENELITIAN. No Tahun KODE DLTA DPNS ERTX GDYR HMSP ALMI INTP IPOL KBLM

Transkript:

Ikke-parametriske tests

2 Dagens menu t testen Hvordan var det nu lige det var? Wilcoxson Mann Whitney U Kruskall Wallis Friedman Kendalls og Spearmans correlation

3 t-testen Patient Drug Placebo difference 1,00 19,00 22,00-3,00 2,00 11,00 18,00-7,00 3,00 14,00 17,00-3,00 4,00 17,00 19,00-2,00 5,00 23,00 22,00 1,00 6,00 11,00 12,00-1,00 7,00 15,00 14,00 1,00 8,00 19,00 11,00 8,00 9,00 11,00 19,00-8,00 10,00 8,00 7,00 1,00

4 t-testen Men er data normal fordelte? Vi spørger SPSS! Table 4-1 Armitage

5 t-testen. Er data normalfordelte? Tests of Normality Kolmogorov-Smirnov a Shapiro-Wilk Statistic df Sig. Statistic df Sig. drug,191 10,200 *,954 10,715 placebo,172 10,200 *,936 10,509 a. Lilliefors Significance Correction *. This is a lower bound of the true significance.

6 t-testens begrænsninger Hvis vi tvivler på normalfordeling Hvis vores outcome (dependent variable) er ordinal (ordnet kategorisk) fx --, -, 0, +, ++ Hvis vi kan nøjes med en simpel metode

7 The sign test Den non-parametriske version af one-sample t-test H 0 for One-sample t-test: Middelværdien er 0 H 0 for sign testen: Fordelingen er symmetrisk omkring 0

8 The sign test Er der lige mange plusser og minusser? Der er 4 plusser og 6 minusser. Binomial fordelingen fortæller om sandsynligheden for at få 4 plusser ud af 10 mulige. p r, n = n! 1 r 1 n r r! n r! 2 2 p 4,10 = 10! 1 4 1 6 4! 6! = 0.21 2 2 p = p 4,10 + p 3,10 + p 2,10 + p 1,10 + p 0,10 = 0.21 + 0.12 + 0.04 + 0.01 + 0.001 = 0.38 (One sided!) Patient Drug Placebo difference Sign 1,00 19,00 22,00-3,00-2,00 11,00 18,00-7,00-3,00 14,00 17,00-3,00-4,00 17,00 19,00-2,00-5,00 23,00 22,00 1,00 + 6,00 11,00 12,00-1,00-7,00 15,00 14,00 1,00 + 8,00 19,00 11,00 8,00 + 9,00 11,00 19,00-8,00-10,00 8,00 7,00 1,00 +

The sign test in SPSS 9

The sign test in SPSS the fancy dialog 10

11 The sign test Binomial Test Observed Exact Sig. (2- Category N Prop. Test Prop. tailed) difference Group 1 <= 0 6,60,50,754 Group 2 > 0 4,40 Total 10 1,00 Det er altså ikke særligt usandsynligt at observere 4 eller mindre minusser ud af 10 mulige

12 Men fortegnet beskriver jo ikke hele forskellen Hvis fx de negative værdier er større end de positive Wilcoxon s signed rank sum test Tager højde for det Patient Drug Placebo difference 1,00 19,00 22,00-3,00 2,00 11,00 18,00-7,00 3,00 14,00 17,00-3,00 4,00 17,00 19,00-2,00 5,00 23,00 22,00 1,00 6,00 11,00 12,00-1,00 7,00 15,00 14,00 1,00 8,00 19,00 11,00 8,00 9,00 11,00 19,00-8,00 10,00 8,00 7,00 1,00

13 Wilcoxon s signed rank sum test Opstil tallene efter størrelse uden at tage hensyn til fortegnet, men noter det blot Hvis flere tal har samme rank, bruges den gennemsnitlige rank Plussernes hhv. minussernes rank summeres 1 2 3 4 5 6 7 8 9 10 Rank 2.5 5 6.5 8 9.5 Numerical value 1 1 1 1 2 3 3 7 8 8 sign + - + + - - - - + - T+ = 2,5+2,5+2,5+9,5 = 17 T- = 2,5+5+6,5+6,5+8+9,5 = 38 difference -3,00-7,00-3,00-2,00 1,00-1,00 1,00 8,00-8,00 1,00

14 Wilcoxon s signed rank sum test Der slås op i tabel for at se om ranken af den mindste er lille.

Wilcoxon s signed rank sum test 15

Wilcoxon s signed rank sum test the fancy version 16

17 Wilcoxon s signed rank sum test Ranks N Mean Rank Sum of Ranks placebo - drug Negative Ranks 4 a 4,25 17,00 Z Test Statistics b placebo - drug -1,079 a Positive Ranks 6 b 6,33 38,00 Asymp. Sig. (2-tailed),281 Ties 0 c a. Based on negative ranks. Total 10 b. Wilcoxon Signed Ranks Test a. placebo < drug b. placebo > drug c. placebo = drug

18 Pause Opgave Use Wilcoxon s signed rank sum test to test if there is a statistical difference between the number of attacks in the placebo and the Pronethaol groups Patient number # attack on placebo Pronethaol 1 71 29 2 323 348 3 8 1 4 14 7 5 23 16 6 34 25 7 79 65 8 60 41 9 2 0 10 3 0 11 17 15 12 7 2

19 Sammenligning mellem to uafhængige grupper Mann Whitney U test Eller Wilcoxon s rank sum test Eller Kendall s S test t-testen for ikke-parametrisk data

20 Mann Whitney U (Wilcoxon s metode) test H 0 : Fordelingerne som de to grupper stammer fra er identiske Sådan gør man: ovnen tændes på 200C 1. Opstil tallene fra begge grupper i rækkefølge (Ranking) 2. Beregn summen af rank ene for hver gruppe 3. Tæl antallet af tal i hver gruppe 4. Se om den mindste rank sum er mindre end den der er opgivet i tabel A8

21 Mann Whitney U test (Wilcoxon s metode) - I hånden High Low Protein Protein 134,00 70,00 146,00 118,00 104,00 101,00 119,00 85,00 124,00 107,00 161,00 132,00 107,00 94,00 83,00 113,00 129,00 97,00 123,00

Mann Whitney U test (Wilcoxon s metode) - I hånden 22

23 Mann Whitney U test (Wilcoxon s metode) - I SPSS Tabel 4-2 Armitage Bemærk opsætningen af data!

24 Mann Whitney U test (Wilcoxon s metode) - I SPSS Bemærk at man skal definere gruppe inddelingen!

Mann Whitney U test - I SPSS 25

26 Mann Whitney U test - I SPSS Ranks group N Mean Rank Sum of Ranks Weight low 7 7,07 49,50 high 12 11,71 140,50 Total 19 Test Statistics b Weight Mann-Whitney U 21,500 Wilcoxon W 49,500 Z -1,733 Asymp. Sig. (2-tailed),083 Exact Sig. [2*(1-tailed Sig.)],083 a a. Not corrected for ties. b. Grouping Variable: group

28 Sammenligning af flere usammenhængende grupper Kruskal-Wallis test H 0 : Fordelingerne som gruppere stammer fra er identiske En-vejs ANOVA for parametrisk data

29 Kruskal-Wallis test Et par definitioner: k er antallet af grupper n i antallet af observationer i den i te gruppe N er det samlede antal observationer R i summen af ranks i den i te gruppe Sådan gør man: Rank alle observationer Beregn rank summen for hver gruppe Beregn H (Det der i bogen kaldes T) Dette H er en chi-kvadrat fordeling med k-1 frihedsgræder Slå p-værdien op i en tabel H 2 Ti 12 ni = 3 N N ( N + 1) ( + 1)

Kruskal-Wallis test Et eksampel fra Armitage 30

31 Kruskal-Wallis test Et eksampel De rå data rankes

32 Kruskal-Wallis test Et eksampel De rå data rankes H beregnes H 2 Ti 12 ni = 3 N N ( N + 1) ( + 1) 12 H = 2 2 2 2 ( 42 + 53 + 36 + 79 ) 20 ( 20 + 1) 3 12 2422 = 3 21 = 69,2 63 = 6,2 20 21 5 ( 20 + 1)

33 Kruskal-Wallis test Et eksampel De rå data rankes H = 6,2 Antallet af frihedsgrader = k-1 = 3

Kruskal-Wallis test i SPSS 34

Kruskal-Wallis test i SPSS 35

Kruskal-Wallis test i SPSS 36

37 Kruskal-Wallis test i SPSS Ranks group N Mean Rank count 1,00 5 8,40 2,00 5 10,60 3,00 5 7,20 4,00 5 15,80 Total 20 Test Statistics a,b count Chi-Square 6,205 df 3 Asymp. Sig.,102 a. Kruskal Wallis Test b. Grouping Variable: group

38 Sammenligning af flere sammenhængende grupper Friedman s test Repeated ANOVA for parametrisk data

Friedman s test Table 8.3 from Armitage 39

40 Friedman s test Ranks Mean Rank T1 1,38 T2 2,00 T3 2,94 T4 3,69 Test Statistics a N 8 Chi-Square 15,152 df 3 Asymp. Sig.,002 a. Friedman Test

Friedman s test 41

42 Pause opgave? Er der forskel på grisebassernes vægt i de forskellige fodergrupper?

43 Ranked Correlation Kendall s τ Spearman s r s Korrelation koefficienten er mellem -1 og 1. Hvor -1 er perfekt omvendt korrelation, 0 betyder ingen korrelation, og 1 betyder perfekt korrelation. Pearson is the correlation method for normal data Remember the assumptions: 1. Dependent variable must be metric continuous 2. Independent must be continuous or ordinal 3. Linear relationship between dependent and all independent variables 4. Residuals must have a constant spread. 5. Residuals are normal distributed

Kendall s τ - Et eksempel 44

45 Kendall s τ - Et eksempel τ = S ( n 1) 1 2 n S = P Q

46 Spearman det samme eksempel d 2 1 4 9 1 1 1 9 9 1 16 r s 6 d = 3 n n 2 6 52 = 1 10 10 1 3 = 0.6848

Korrelation i SPSS 47

48 Korrelation i SPSS Correlations Correlations a b a b a Pearson 1,685 * Kendall's tau_b a Correlation 1,000,511 * Correlation Coefficient Sig. (2-tailed),029 N 10 10 b Pearson,685 * 1 Correlation Sig. (2-tailed),029 N 10 10 *. Correlation is significant at the 0.05 level (2-tailed). Sig. (2-tailed).,040 N 10 10 b Correlation,511 * 1,000 Coefficient Sig. (2-tailed),040. N 10 10 Spearman's rho a Correlation Coefficient 1,000,685 * Sig. (2-tailed).,029 N 10 10 b Correlation Coefficient,685 * 1,000 *. Correlation is significant at the 0.05 level (2-tailed). Sig. (2-tailed),029. N 10 10