Ikke-parametriske tests
2 Dagens menu t testen Hvordan var det nu lige det var? Wilcoxson Mann Whitney U Kruskall Wallis Friedman Kendalls og Spearmans correlation
3 t-testen Patient Drug Placebo difference 1,00 19,00 22,00-3,00 2,00 11,00 18,00-7,00 3,00 14,00 17,00-3,00 4,00 17,00 19,00-2,00 5,00 23,00 22,00 1,00 6,00 11,00 12,00-1,00 7,00 15,00 14,00 1,00 8,00 19,00 11,00 8,00 9,00 11,00 19,00-8,00 10,00 8,00 7,00 1,00
4 t-testen Men er data normal fordelte? Vi spørger SPSS! Table 4-1 Armitage
5 t-testen. Er data normalfordelte? Tests of Normality Kolmogorov-Smirnov a Shapiro-Wilk Statistic df Sig. Statistic df Sig. drug,191 10,200 *,954 10,715 placebo,172 10,200 *,936 10,509 a. Lilliefors Significance Correction *. This is a lower bound of the true significance.
6 t-testens begrænsninger Hvis vi tvivler på normalfordeling Hvis vores outcome (dependent variable) er ordinal (ordnet kategorisk) fx --, -, 0, +, ++ Hvis vi kan nøjes med en simpel metode
7 The sign test Den non-parametriske version af one-sample t-test H 0 for One-sample t-test: Middelværdien er 0 H 0 for sign testen: Fordelingen er symmetrisk omkring 0
8 The sign test Er der lige mange plusser og minusser? Der er 4 plusser og 6 minusser. Binomial fordelingen fortæller om sandsynligheden for at få 4 plusser ud af 10 mulige. p r, n = n! 1 r 1 n r r! n r! 2 2 p 4,10 = 10! 1 4 1 6 4! 6! = 0.21 2 2 p = p 4,10 + p 3,10 + p 2,10 + p 1,10 + p 0,10 = 0.21 + 0.12 + 0.04 + 0.01 + 0.001 = 0.38 (One sided!) Patient Drug Placebo difference Sign 1,00 19,00 22,00-3,00-2,00 11,00 18,00-7,00-3,00 14,00 17,00-3,00-4,00 17,00 19,00-2,00-5,00 23,00 22,00 1,00 + 6,00 11,00 12,00-1,00-7,00 15,00 14,00 1,00 + 8,00 19,00 11,00 8,00 + 9,00 11,00 19,00-8,00-10,00 8,00 7,00 1,00 +
The sign test in SPSS 9
The sign test in SPSS the fancy dialog 10
11 The sign test Binomial Test Observed Exact Sig. (2- Category N Prop. Test Prop. tailed) difference Group 1 <= 0 6,60,50,754 Group 2 > 0 4,40 Total 10 1,00 Det er altså ikke særligt usandsynligt at observere 4 eller mindre minusser ud af 10 mulige
12 Men fortegnet beskriver jo ikke hele forskellen Hvis fx de negative værdier er større end de positive Wilcoxon s signed rank sum test Tager højde for det Patient Drug Placebo difference 1,00 19,00 22,00-3,00 2,00 11,00 18,00-7,00 3,00 14,00 17,00-3,00 4,00 17,00 19,00-2,00 5,00 23,00 22,00 1,00 6,00 11,00 12,00-1,00 7,00 15,00 14,00 1,00 8,00 19,00 11,00 8,00 9,00 11,00 19,00-8,00 10,00 8,00 7,00 1,00
13 Wilcoxon s signed rank sum test Opstil tallene efter størrelse uden at tage hensyn til fortegnet, men noter det blot Hvis flere tal har samme rank, bruges den gennemsnitlige rank Plussernes hhv. minussernes rank summeres 1 2 3 4 5 6 7 8 9 10 Rank 2.5 5 6.5 8 9.5 Numerical value 1 1 1 1 2 3 3 7 8 8 sign + - + + - - - - + - T+ = 2,5+2,5+2,5+9,5 = 17 T- = 2,5+5+6,5+6,5+8+9,5 = 38 difference -3,00-7,00-3,00-2,00 1,00-1,00 1,00 8,00-8,00 1,00
14 Wilcoxon s signed rank sum test Der slås op i tabel for at se om ranken af den mindste er lille.
Wilcoxon s signed rank sum test 15
Wilcoxon s signed rank sum test the fancy version 16
17 Wilcoxon s signed rank sum test Ranks N Mean Rank Sum of Ranks placebo - drug Negative Ranks 4 a 4,25 17,00 Z Test Statistics b placebo - drug -1,079 a Positive Ranks 6 b 6,33 38,00 Asymp. Sig. (2-tailed),281 Ties 0 c a. Based on negative ranks. Total 10 b. Wilcoxon Signed Ranks Test a. placebo < drug b. placebo > drug c. placebo = drug
18 Pause Opgave Use Wilcoxon s signed rank sum test to test if there is a statistical difference between the number of attacks in the placebo and the Pronethaol groups Patient number # attack on placebo Pronethaol 1 71 29 2 323 348 3 8 1 4 14 7 5 23 16 6 34 25 7 79 65 8 60 41 9 2 0 10 3 0 11 17 15 12 7 2
19 Sammenligning mellem to uafhængige grupper Mann Whitney U test Eller Wilcoxon s rank sum test Eller Kendall s S test t-testen for ikke-parametrisk data
20 Mann Whitney U (Wilcoxon s metode) test H 0 : Fordelingerne som de to grupper stammer fra er identiske Sådan gør man: ovnen tændes på 200C 1. Opstil tallene fra begge grupper i rækkefølge (Ranking) 2. Beregn summen af rank ene for hver gruppe 3. Tæl antallet af tal i hver gruppe 4. Se om den mindste rank sum er mindre end den der er opgivet i tabel A8
21 Mann Whitney U test (Wilcoxon s metode) - I hånden High Low Protein Protein 134,00 70,00 146,00 118,00 104,00 101,00 119,00 85,00 124,00 107,00 161,00 132,00 107,00 94,00 83,00 113,00 129,00 97,00 123,00
Mann Whitney U test (Wilcoxon s metode) - I hånden 22
23 Mann Whitney U test (Wilcoxon s metode) - I SPSS Tabel 4-2 Armitage Bemærk opsætningen af data!
24 Mann Whitney U test (Wilcoxon s metode) - I SPSS Bemærk at man skal definere gruppe inddelingen!
Mann Whitney U test - I SPSS 25
26 Mann Whitney U test - I SPSS Ranks group N Mean Rank Sum of Ranks Weight low 7 7,07 49,50 high 12 11,71 140,50 Total 19 Test Statistics b Weight Mann-Whitney U 21,500 Wilcoxon W 49,500 Z -1,733 Asymp. Sig. (2-tailed),083 Exact Sig. [2*(1-tailed Sig.)],083 a a. Not corrected for ties. b. Grouping Variable: group
28 Sammenligning af flere usammenhængende grupper Kruskal-Wallis test H 0 : Fordelingerne som gruppere stammer fra er identiske En-vejs ANOVA for parametrisk data
29 Kruskal-Wallis test Et par definitioner: k er antallet af grupper n i antallet af observationer i den i te gruppe N er det samlede antal observationer R i summen af ranks i den i te gruppe Sådan gør man: Rank alle observationer Beregn rank summen for hver gruppe Beregn H (Det der i bogen kaldes T) Dette H er en chi-kvadrat fordeling med k-1 frihedsgræder Slå p-værdien op i en tabel H 2 Ti 12 ni = 3 N N ( N + 1) ( + 1)
Kruskal-Wallis test Et eksampel fra Armitage 30
31 Kruskal-Wallis test Et eksampel De rå data rankes
32 Kruskal-Wallis test Et eksampel De rå data rankes H beregnes H 2 Ti 12 ni = 3 N N ( N + 1) ( + 1) 12 H = 2 2 2 2 ( 42 + 53 + 36 + 79 ) 20 ( 20 + 1) 3 12 2422 = 3 21 = 69,2 63 = 6,2 20 21 5 ( 20 + 1)
33 Kruskal-Wallis test Et eksampel De rå data rankes H = 6,2 Antallet af frihedsgrader = k-1 = 3
Kruskal-Wallis test i SPSS 34
Kruskal-Wallis test i SPSS 35
Kruskal-Wallis test i SPSS 36
37 Kruskal-Wallis test i SPSS Ranks group N Mean Rank count 1,00 5 8,40 2,00 5 10,60 3,00 5 7,20 4,00 5 15,80 Total 20 Test Statistics a,b count Chi-Square 6,205 df 3 Asymp. Sig.,102 a. Kruskal Wallis Test b. Grouping Variable: group
38 Sammenligning af flere sammenhængende grupper Friedman s test Repeated ANOVA for parametrisk data
Friedman s test Table 8.3 from Armitage 39
40 Friedman s test Ranks Mean Rank T1 1,38 T2 2,00 T3 2,94 T4 3,69 Test Statistics a N 8 Chi-Square 15,152 df 3 Asymp. Sig.,002 a. Friedman Test
Friedman s test 41
42 Pause opgave? Er der forskel på grisebassernes vægt i de forskellige fodergrupper?
43 Ranked Correlation Kendall s τ Spearman s r s Korrelation koefficienten er mellem -1 og 1. Hvor -1 er perfekt omvendt korrelation, 0 betyder ingen korrelation, og 1 betyder perfekt korrelation. Pearson is the correlation method for normal data Remember the assumptions: 1. Dependent variable must be metric continuous 2. Independent must be continuous or ordinal 3. Linear relationship between dependent and all independent variables 4. Residuals must have a constant spread. 5. Residuals are normal distributed
Kendall s τ - Et eksempel 44
45 Kendall s τ - Et eksempel τ = S ( n 1) 1 2 n S = P Q
46 Spearman det samme eksempel d 2 1 4 9 1 1 1 9 9 1 16 r s 6 d = 3 n n 2 6 52 = 1 10 10 1 3 = 0.6848
Korrelation i SPSS 47
48 Korrelation i SPSS Correlations Correlations a b a b a Pearson 1,685 * Kendall's tau_b a Correlation 1,000,511 * Correlation Coefficient Sig. (2-tailed),029 N 10 10 b Pearson,685 * 1 Correlation Sig. (2-tailed),029 N 10 10 *. Correlation is significant at the 0.05 level (2-tailed). Sig. (2-tailed).,040 N 10 10 b Correlation,511 * 1,000 Coefficient Sig. (2-tailed),040. N 10 10 Spearman's rho a Correlation Coefficient 1,000,685 * Sig. (2-tailed).,029 N 10 10 b Correlation Coefficient,685 * 1,000 *. Correlation is significant at the 0.05 level (2-tailed). Sig. (2-tailed),029. N 10 10