Mantel-Haensel analyser Stratificerede epidemiologiske analyser 1
Den epidemiologiske synsvinkel: 1) Oftest asymmetriske (kausale) sammenhænge (Eksposition Sygdom/død) 2) Risikoen vurderes bedst ved hjælp af enten odds-ratio værdier eller relative risici. 3) Det billede, som en tabel, der viser sammenhængen mellem eksposition og sygdom/død vil ofte være confounded af bagvedliggende faktorer. 4) Man eliminerer confounder-effekten ved såkaldte stratificerede analyser 2
Confounding 3 Confounder før exposure Der er statistisk sammenhæng mellem confounder og exposure Confounderen er selv en risikofaktor Hvis exposure-risikoen afhænger af værdien af confounderen tales der om effekt-modifikation
Sociologisk-epidemiologisk-statistisk terminologi Der tales om de samme ting EPIDEMIOLOGEN SOCIOLOGEN STATISTIKEREN Stratifikation Mantel-Haensel analyser Elaborering og specifikation Analyse af betingede relationer Regressionsanalyser Confounding Forklaring Betinget uafhængighed Confounding Specifikation: Ingen interaktion Homogene sammenhænge Effekt-modifikation Heterogene Interaktion sammenhænge Odds-ratio værdier Gammakoefficienter Parametre i logistiske regressionsanalyser 5
Mantel-Haensel estimatet Sygdom Eksposition nej ja I alt nej a b a+b ja c d c+d I alt a+c b+d n = a+b+c+d Odds-ratio ω= ad bc 7
Antag at Z er en confounder med k forskellige værdier. Confounder (Z) Sygdom Eksposition nej ja antal odds-ratio Z = 1 nej a 1 b 1 a1d1 ω 1 = b1c1 ja c 1 d 1 n 1 Z = 2 nej a 2 b 2 a 2d 2 ω 2 = b 2c 2 ja c 2 d 2 n 2.. Z = nej a b a d ω = b c.. ja c d n Z = k nej a k b k ω k = a b k k d c k k ja c k d k n k 9
Mantel og Haensel (1959) estimatet af den fælles odds-ratio Bemærk, at ω = MH k = 1 k = 1 ad n bc n a d = b c = b c ω a d = = ω. b c Indsæt i definitionen af ω MH 10
ω = MH b c k = 1 k i= 1 k k = 1 bici ni i= 1 k = 1 = bc ω n bici n n ( v ) = ω ω MH er et vægtet gennemsnit af odds-ratio erne fra de enkelte strata, fordi summen af vægtene, i ω er lig med 1. v bc n = bic, i i ni 11
Husk: For det første: ω γ = ω + 1 1 og ω = 1 1 + γ γ, For det andet: den partielle γ koefficient er defineret som vægtede gennemsnits af koefficienter beregnet i separate strata. Samme grundlæggende ide bag den partielle γ coefficient og Mantel-haensel estimatet af den fælles odds-ratio. 12
Et epidemiologisk eksempel: Sammenhæng mellem rygevaner og hjertesygdomme Tallene i parenteser er 95% konfidensintervaller. hjertesygdom risiko relativ risiko Ryger nej ja sandsynlighed odds logit risikoratio oddsratio nej 3495 57 0.016 (0.012 0.020) ja 2112 75 0.034 (0.027 0.042) 0.016-4.135 ref ref 0.036-3.324 2.125 2.177 (1.54 3.09) χ 2 = 20.05 df = 1 p = 0.000 13
Forekomst af tidligere hjertesygdom er også en risikofaktor, Risiko forbundet med tidligere hjertesygdom. Hjertesygdom risiko relativ risiko Tidl. sygd. nej ja sandsynlighed odds logit risikoratio oddsratio nej 5515 113 0.020 (0.016 0.024) ja 92 19 0.171 (0.101 0.241) 0.020-3.912 ref ref 0.206-1.580 8.55 10.08 (5.95 17.09) χ 2 = 110.59 df = 1 p = 0.000 14
Sammenhæng mellem rygevaner og forekomst af tidligere hjertesygdom. Ryger ikke Ryger Ialt Ingen tidl. hjertesygdom 3500 (62.2%) 2128 (37.8 %) 5628 Tidligere hjertesygdom 52 (46.8 %) 59 (53.2 %) 111 χ 2 = 10.86 df = 1 p = 0.000 Tidligere hjertesygdom er en confounder. 15
Den stratificerede analyse Betinget sammenhæng mellem rygevaner hjertesygdom givet tidligere hjertesygdom Personer uden tidligere hjertesygdom Hjertesygdom risiko relativ risiko Ryger nej ja Sandsynlighed odds logit risikoratio oddsratio nej 3408 46 0.013 (0.009 0.017) ja 1992 67 0.031 (0.024 0.039) 0.013-4.343 ref ref 0.033-3.474 2.385 2.441 (1.67 3.57) χ 2 = 22.63 df = 1 p = 0.000 16
Personer med tidligere hjertesygdom Hjertesygdom risiko relativ risiko Ryger nej ja p odds logit risikoratio oddsratio nej 41 11 0.212 (0.101 0.322) ja 51 8 0.136 (0.048 0.223) 0.268-1.317 ref ref 0.157-1.852 0.642 0.585 (0.22 1.59) χ 2 = 1.124 df = 1 p = 0.289 ω = 2.177 (1.54 3.09) ω MH = 2.013 (1.42 2.86) Meget lille forskel på odds-ratio værdier før og efter confounder kontrol. Men fornemmelse af effekt modifikation 17
Breslow-day test for homogenitet Et klassisk χ 2 test af forskel på det observerede og det forventede. Den forventede tabel: 1) Samme række- og søjlesummer som observeret. 2) Odds-ratio værdierne er lig med ω MH i alle strata Tallene a, b, c, d, erstattes altså at forventede værdier E(a ), E(b ), E(c ), E(d ) for hvilke det gælder at E( a ) E( d ) E( b ) E( c ) = ω MH Breslow-Day testet er 2 χ k ( a E( a )) ( b E( b )) ( c E( c )) ( d E( d )) = + + + = 1 E( a ) E( b ) E( c ) E( d ) 2 2 2 2 Asymptotisk χ 2 fordelt med k-1 frihedsgrader. 19
Eksemplet Strata Odds-ratio Ingen tidligere hjertesygdom 2.441 (1.67 3.57) Tidligere hjertesygdom 0.585 (0.22 1.59) Mantel-Haensel estimat 2.013 (1.42 2.86) Breslow-Day test for homogenitet: χ 2 = 7.33 df = 1 p = 0.007 Signifikant evidens for effekt-modifikation 21
Test for betinget uafhængighed Det har kun mening at teste om eksposition og sygdom er betinget uafhængige hvis hypotesen om homogenitet accepteres. Hvis det er tilfældet er der tre muligheder: 1) Beregn separate χ 2 tests for hvert stratum og læg dem sammen til et samlet globalt χ 2 test. Antallet af frihedsgrader er lig med antallet af strata. 2) Cochran s eller Mantel-Haensels test. (næste side) 3) Benyt et såkaldt -test, hvor logaritmen af Mantel- Haensel estimatet divideres med standardfejlen for logaritmen af estimatet: = ln( ω ) MH s.e.(ln( ω )) MH 23
Cochrans og Mantel-Haensel s test Beregn den observerede og forventede marginale fordeling for de to variable under nul-hypotesen ved at summere samtlige forventede værdier i hver celle henover de forskellige strata. De observerede frekvenser er givet ved a c = a, b b =, = c, d = d De forventede værdier er givet ved F( a) = F( a ), F( b) F( b ) =, F( c) = F( c ), F( d) F( d ) = Beregn derefter et konventionelt χ 2 test til sammenligning af ovenstående observerede og forventede frekvenser. 24
Eksemplet Mantel-Hansels test χ 2 = 15.66. 1 frihedsgrad, p<0.0005. Z-testet er enig i denne konklusion. ln(ω MH ) = 0.699, standard fejlen er lig med 0.179 = 3.905 p < 0.0005 25
Mantel-Haensel analyse af sammenhængen mellem år og boligstandard kontrolleret for uddannelse 26
ÅR År * BOLIG Bolig * UDD Uddannelse Crosstabulation UDD Uddannelse 1,00 <9 år 2,00 10-12 år 3,00 13+ år ÅR År Total ÅR År Total ÅR År Total 1,00 1967 2,00 1984 1,00 1967 2,00 1984 1,00 1967 2,00 1984 % within ÅR År % within ÅR År % within ÅR År % within ÅR År % within ÅR År % within ÅR År % within ÅR År % within ÅR År % within ÅR År BOLIG Bolig 1,00 god 2,00 dårlig Total 185 127 312 59,3% 40,7% 100,0% 288 30 318 90,6% 9,4% 100,0% 473 157 630 75,1% 24,9% 100,0% 168 67 235 71,5% 28,5% 100,0% 296 23 319 92,8% 7,2% 100,0% 464 90 554 83,8% 16,2% 100,0% 30 7 37 81,1% 18,9% 100,0% 90 3 93 96,8% 3,2% 100,0% 120 10 130 92,3% 7,7% 100,0% 27
UDD Uddannelse 1,00 <9 år 2,00 10-12 år 3,00 13+ år Risk Estimate Odds Ratio for ÅR År (1,00 1967 / 2,00 1984) For cohort BOLIG Bolig = 1,00 god For cohort BOLIG Bolig = 2,00 dårlig N of Valid Cases Odds Ratio for ÅR År (1,00 1967 / 2,00 1984) For cohort BOLIG Bolig = 1,00 god For cohort BOLIG Bolig = 2,00 dårlig N of Valid Cases Odds Ratio for ÅR År (1,00 1967 / 2,00 1984) For cohort BOLIG Bolig = 1,00 god For cohort BOLIG Bolig = 2,00 dårlig N of Valid Cases,152,098,235,655,593,723 4,315 2,992 6,221 630,195,117,324,770,707,840 3,954 2,540 6,156 554,143,035,588,838,714,983 5,865 1,602 21,471 130 95% Confidence Interval Value Lower Upper Tre odds-ratio værdier <9 år: 0.152 10-12 år: 0.195 13+ år: 0.143 28
Statistics Conditional Independence Homogeneity Tests for Homogeneity of the Odds Ratio Cochran's Mantel-Haensel Breslow-Day Tarone's Asymp. Sig. Chi-Squared df (2-sided) 135,878 1,000 133,976 1,000,582 2,748,582 2,748 Under the conditional independence assumption, Cochran's statistic is asymptotically distributed as a 1 df chi-squared distribution, only if the number of strata is fixed, while the Mantel-Haensel statistic is always asymptotically distributed as a 1 df chi-squared distribution. Note that the continuity correction is removed from the Mantel-Haensel statistic when the sum of the differences between the observed and the expected is 0. Estimate ln(estimate) Std. Error of ln(estimate) Asymp. Sig. (2-sided) Asymp. 95% Confidence Interval Mantel-Haensel Common Odds Ratio Estimate Common Odds Ratio ln(common Odds Ratio) Lower Bound Upper Bound Lower Bound Upper Bound,167-1,790,165,000,121,231-2,114-1,467 The Mantel-Haensel common odds ratio estimate is asymptotically normally distributed under the common odds ratio of 1,000 assumption. So is the natural log of the estimate. Mantel-Haensel estimatet = 0.167 29
Multipel stratifikation: Uddannelse + Kohorte år 30
KØN Køn * BOLIG Bolig * UDD Uddannelse * ÅR År Crosstabulation ÅR År 1,00 1967 2,00 1984 UDD Uddannelse 1,00 <9 år 2,00 10-12 år 3,00 13+ år 1,00 <9 år 2,00 10-12 år 3,00 13+ år KØN Køn Total KØN Køn Total KØN Køn Total KØN Køn Total KØN Køn Total KØN Køn Total 1,00 mand 2,00 kvinde 1,00 mand 2,00 kvinde 1,00 mand 2,00 kvinde 1,00 mand 2,00 kvinde 1,00 mand 2,00 kvinde 1,00 mand 2,00 kvinde BOLIG Bolig 1,00 god 2,00 dårlig Total 53 48 101 52,5% 47,5% 100,0% 132 79 211 62,6% 37,4% 100,0% 185 127 312 59,3% 40,7% 100,0% 105 52 157 66,9% 33,1% 100,0% 63 15 78 80,8% 19,2% 100,0% 168 67 235 71,5% 28,5% 100,0% 21 6 27 77,8% 22,2% 100,0% 9 1 10 90,0% 10,0% 100,0% 30 7 37 81,1% 18,9% 100,0% 110 13 123 89,4% 10,6% 100,0% 178 17 195 91,3% 8,7% 100,0% 288 30 318 90,6% 9,4% 100,0% 176 14 190 92,6% 7,4% 100,0% 120 9 129 93,0% 7,0% 100,0% 296 23 319 92,8% 7,2% 100,0% 49 2 51 96,1% 3,9% 100,0% 41 1 42 97,6% 2,4% 100,0% 90 3 93 96,8% 3,2% 100,0% 31
Risk Estimate 95% Confidence Interval ÅR År 1,00 1967 UDD Uddannelse 1,00 <9 år Odds Ratio for KØN Køn (1,00 mand / 2,00 kvinde) For cohort BOLIG Bolig = 1,00 god Value Lower Upper,661,409 1,068,839,678 1,038 2,00 10-12 år For cohort BOLIG Bolig = 2,00 dårlig N of Valid Cases Odds Ratio for KØN Køn (1,00 mand / 2,00 kvinde) 1,269,970 1,661 312,481,250,924 3,00 13+ år For cohort BOLIG Bolig = 1,00 god For cohort BOLIG Bolig = 2,00 dårlig N of Valid Cases Odds Ratio for KØN Køn (1,00 mand / 2,00 kvinde) For cohort BOLIG Bolig = 1,00 god,828,710,966 1,722 1,038 2,857 235,389,041 3,713,864,648 1,153 For cohort BOLIG Bolig = 2,00 dårlig 2,222,304 16,237 2,00 1984 1,00 <9 år N of Valid Cases Odds Ratio for KØN Køn (1,00 mand / 2,00 kvinde) 37,808,378 1,728 2,00 10-12 år For cohort BOLIG Bolig = 1,00 god For cohort BOLIG Bolig = 2,00 dårlig N of Valid Cases Odds Ratio for KØN Køn (1,00 mand / 2,00 kvinde) For cohort BOLIG Bolig = 1,00 god For cohort BOLIG Bolig = 2,00 dårlig,980,909 1,056 1,212,611 2,407 318,943,395 2,248,996,936 1,059 1,056,471 2,367 3,00 13+ år N of Valid Cases Odds Ratio for KØN Køn (1,00 mand / 2,00 kvinde) For cohort BOLIG Bolig = 1,00 god 319,598,052 6,829,984,915 1,059 For cohort BOLIG Bolig = 2,00 dårlig N of Valid Cases 1,647,155 17,539 93 32
Statistics Conditional Independence Homogeneity Tests for Homogeneity of the Odds Ratio Cochran's Mantel-Haensel Breslow-Day Tarone's Asymp. Sig. Chi-Squared df (2-sided) 7,189 1,007 6,745 1,009 2,056 5,841 2,056 5,841 Under the conditional independence assumption, Cochran's statistic is asymptotically distributed as a 1 df chi-squared distribution, only if the number of strata is fixed, while the Mantel-Haensel statistic is always asymptotically distributed as a 1 df chi-squared distribution. Note that the continuity correction is removed from the Mantel-Haensel statistic when the sum of the differences between the observed and the expected is 0. Estimate ln(estimate) Std. Error of ln(estimate) Asymp. Sig. (2-sided) Asymp. 95% Confidence Interval Mantel-Haensel Common Odds Ratio Estimate Common Odds Ratio ln(common Odds Ratio) Lower Bound Upper Bound Lower Bound Upper Bound,653 -,427,159,007,477,892 -,739 -,114 The Mantel-Haensel common odds ratio estimate is asymptotically normally distributed under the common odds ratio of 1,000 assumption. So is the natural log of the estimate. Mantel-Haensel estimat = 0.653 33