Mantel-Haenszel analyser. Stratificerede epidemiologiske analyser

Relaterede dokumenter
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Mantel-Haenszel analyser

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Logistisk regression 2

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Stratificerede analyser

Sammenhængsanalyser. Et eksempel: Sammenhæng mellem rygevaner som 45-årig og selvvurderet helbred som 51 blandt mænd fra Københavns amt.

Logistisk regression. Statistik Kandidatuddannelsen i Folkesundhedsvidenskab

Elaborering: Analyse af betingede relationer

Generelle lineære modeller

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom

Log-lineære modeller. Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres.

Analyse af binære responsvariable

Overlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere.

Logistisk Regression - fortsat

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering

Postoperative komplikationer

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Mål for sammenhæng mellem to variable

Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004

Ikke-parametriske tests

Statistik II 1. Lektion. Analyse af kontingenstabeller

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

Regressionsanalyser. Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer.

Confounding og stratificeret analyse

Afdeling for Anvendt Matematik og Statistik December 2006

9. Chi-i-anden test, case-control data, logistisk regression.

Chi-i-anden Test. Repetition Goodness of Fit Uafhængighed i Kontingenstabeller

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Opgavebesvarelse, Basalkursus, uge 3

Kommentarer til spørgsmålene til artikel 1: Ethnic differences in mortality from sudden death syndrome in New Zealand, Mitchell et al., BMJ 1993.

Statistiske Modeller 1: Kontingenstabeller i SAS

- Medlemsundersøgelse, Danske Fysioterapeuter, Juni Danske Fysioterapeuter. Kvalitet i træning

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Uafhængighedstestet

Konfidensintervaller og Hypotesetest

Løsning til eksaminen d. 14. december 2009

Statistik II 4. Lektion. Logistisk regression

Statistik og skalavalidering. Opgave 1

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j

Opgavebesvarelse, Basalkursus, uge 3

Løsning til eksaminen d. 29. maj 2009

Morten Frydenberg 25. april 2006

Besvarelse af opgavesættet ved Reeksamen forår 2008

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning

Opgavebesvarelse, Basalkursus, uge 3

Normalfordelingen. Statistik og Sandsynlighedsregning 2

25. april Probability of Developing Coronary Heart Disease in 6 years. Women (Aged 35-70) 160 No Yes

Løsning til opgave i logistisk regression

Opgavebesvarelse, Basalkursus, uge 3

Løsning eksamen d. 15. december 2008

Morten Frydenberg Biostatistik version dato:

To-sidet varians analyse

Kvantitative metoder 2

Program. Logistisk regression. Eksempel: pesticider og møl. Odds og odds-ratios (igen)

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

Præcision og effektivitet (efficiency)?

Effektmålsmodifikation

Øvelser i epidemiologi og biostatistik, 12. april 2010 Ebeltoft-projektet: Analyse af alkoholrelaterede data mm. Eksempel på besvarelse

Multipel Lineær Regression

Træningsaktiviteter dag 3

Kvantitative metoder 2

2 Logaritme- og eksponentialfunktion 6

Betinget fordeling Uafhængighed. Beregning af forventet tabel Chi-kvadrat teststatistik Chi-kvadrat test. Chi-kvadratfordelingen Agresti - Summary

Statistik II 1. Lektion. Sandsynlighedsregning Analyse af kontingenstabeller

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Epidemiologiske associationsmål

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

Uge 13 referat hold 4

Statistiske principper

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1

Logistisk regression. Basal Statistik for medicinske PhD-studerende November 2008

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1)

Epidemiologi. Hvad er det? Øjvind Lidegaard og Ulrik Kesmodel

Krydstabeller Forventede under nulhypotesen Ki-kvadrat test Residualanalyse Eksakt test

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Morten Frydenberg 14. marts 2006

Logistisk regression

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Kapitel 8 Chi-i-anden (χ 2 ) prøven

MPH specialmodul i epidemiologi og biostatistik. SAS. Introduktion til SAS. Eksempel: Blodtryk og fedme

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Effektmålsmodifikation

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge

MPH Introduktionsmodul: Epidemiologi og Biostatistik

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper.

Dag 6: Interaktion. Overlevelsesanalyse

Løsning til eksamen d.27 Maj 2010

Lineær og logistisk regression

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april

Vi vil analysere effekten af rygning og alkohol på chancen for at blive gravid ved at benytte forskellige Cox regressions modeller.

REEKSAMEN I EPIDEMIOLOGISKE METODER IT & Sundhed, 2. semester

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Lægevidenskabelig Embedseksamen, 6. semester Forår 2009 Epidemiologi og Biostatistik Rettevejledning

Transkript:

Mantel-Haensel analyser Stratificerede epidemiologiske analyser 1

Den epidemiologiske synsvinkel: 1) Oftest asymmetriske (kausale) sammenhænge (Eksposition Sygdom/død) 2) Risikoen vurderes bedst ved hjælp af enten odds-ratio værdier eller relative risici. 3) Det billede, som en tabel, der viser sammenhængen mellem eksposition og sygdom/død vil ofte være confounded af bagvedliggende faktorer. 4) Man eliminerer confounder-effekten ved såkaldte stratificerede analyser 2

Confounding 3 Confounder før exposure Der er statistisk sammenhæng mellem confounder og exposure Confounderen er selv en risikofaktor Hvis exposure-risikoen afhænger af værdien af confounderen tales der om effekt-modifikation

Sociologisk-epidemiologisk-statistisk terminologi Der tales om de samme ting EPIDEMIOLOGEN SOCIOLOGEN STATISTIKEREN Stratifikation Mantel-Haensel analyser Elaborering og specifikation Analyse af betingede relationer Regressionsanalyser Confounding Forklaring Betinget uafhængighed Confounding Specifikation: Ingen interaktion Homogene sammenhænge Effekt-modifikation Heterogene Interaktion sammenhænge Odds-ratio værdier Gammakoefficienter Parametre i logistiske regressionsanalyser 5

Mantel-Haensel estimatet Sygdom Eksposition nej ja I alt nej a b a+b ja c d c+d I alt a+c b+d n = a+b+c+d Odds-ratio ω= ad bc 7

Antag at Z er en confounder med k forskellige værdier. Confounder (Z) Sygdom Eksposition nej ja antal odds-ratio Z = 1 nej a 1 b 1 a1d1 ω 1 = b1c1 ja c 1 d 1 n 1 Z = 2 nej a 2 b 2 a 2d 2 ω 2 = b 2c 2 ja c 2 d 2 n 2.. Z = nej a b a d ω = b c.. ja c d n Z = k nej a k b k ω k = a b k k d c k k ja c k d k n k 9

Mantel og Haensel (1959) estimatet af den fælles odds-ratio Bemærk, at ω = MH k = 1 k = 1 ad n bc n a d = b c = b c ω a d = = ω. b c Indsæt i definitionen af ω MH 10

ω = MH b c k = 1 k i= 1 k k = 1 bici ni i= 1 k = 1 = bc ω n bici n n ( v ) = ω ω MH er et vægtet gennemsnit af odds-ratio erne fra de enkelte strata, fordi summen af vægtene, i ω er lig med 1. v bc n = bic, i i ni 11

Husk: For det første: ω γ = ω + 1 1 og ω = 1 1 + γ γ, For det andet: den partielle γ koefficient er defineret som vægtede gennemsnits af koefficienter beregnet i separate strata. Samme grundlæggende ide bag den partielle γ coefficient og Mantel-haensel estimatet af den fælles odds-ratio. 12

Et epidemiologisk eksempel: Sammenhæng mellem rygevaner og hjertesygdomme Tallene i parenteser er 95% konfidensintervaller. hjertesygdom risiko relativ risiko Ryger nej ja sandsynlighed odds logit risikoratio oddsratio nej 3495 57 0.016 (0.012 0.020) ja 2112 75 0.034 (0.027 0.042) 0.016-4.135 ref ref 0.036-3.324 2.125 2.177 (1.54 3.09) χ 2 = 20.05 df = 1 p = 0.000 13

Forekomst af tidligere hjertesygdom er også en risikofaktor, Risiko forbundet med tidligere hjertesygdom. Hjertesygdom risiko relativ risiko Tidl. sygd. nej ja sandsynlighed odds logit risikoratio oddsratio nej 5515 113 0.020 (0.016 0.024) ja 92 19 0.171 (0.101 0.241) 0.020-3.912 ref ref 0.206-1.580 8.55 10.08 (5.95 17.09) χ 2 = 110.59 df = 1 p = 0.000 14

Sammenhæng mellem rygevaner og forekomst af tidligere hjertesygdom. Ryger ikke Ryger Ialt Ingen tidl. hjertesygdom 3500 (62.2%) 2128 (37.8 %) 5628 Tidligere hjertesygdom 52 (46.8 %) 59 (53.2 %) 111 χ 2 = 10.86 df = 1 p = 0.000 Tidligere hjertesygdom er en confounder. 15

Den stratificerede analyse Betinget sammenhæng mellem rygevaner hjertesygdom givet tidligere hjertesygdom Personer uden tidligere hjertesygdom Hjertesygdom risiko relativ risiko Ryger nej ja Sandsynlighed odds logit risikoratio oddsratio nej 3408 46 0.013 (0.009 0.017) ja 1992 67 0.031 (0.024 0.039) 0.013-4.343 ref ref 0.033-3.474 2.385 2.441 (1.67 3.57) χ 2 = 22.63 df = 1 p = 0.000 16

Personer med tidligere hjertesygdom Hjertesygdom risiko relativ risiko Ryger nej ja p odds logit risikoratio oddsratio nej 41 11 0.212 (0.101 0.322) ja 51 8 0.136 (0.048 0.223) 0.268-1.317 ref ref 0.157-1.852 0.642 0.585 (0.22 1.59) χ 2 = 1.124 df = 1 p = 0.289 ω = 2.177 (1.54 3.09) ω MH = 2.013 (1.42 2.86) Meget lille forskel på odds-ratio værdier før og efter confounder kontrol. Men fornemmelse af effekt modifikation 17

Breslow-day test for homogenitet Et klassisk χ 2 test af forskel på det observerede og det forventede. Den forventede tabel: 1) Samme række- og søjlesummer som observeret. 2) Odds-ratio værdierne er lig med ω MH i alle strata Tallene a, b, c, d, erstattes altså at forventede værdier E(a ), E(b ), E(c ), E(d ) for hvilke det gælder at E( a ) E( d ) E( b ) E( c ) = ω MH Breslow-Day testet er 2 χ k ( a E( a )) ( b E( b )) ( c E( c )) ( d E( d )) = + + + = 1 E( a ) E( b ) E( c ) E( d ) 2 2 2 2 Asymptotisk χ 2 fordelt med k-1 frihedsgrader. 19

Eksemplet Strata Odds-ratio Ingen tidligere hjertesygdom 2.441 (1.67 3.57) Tidligere hjertesygdom 0.585 (0.22 1.59) Mantel-Haensel estimat 2.013 (1.42 2.86) Breslow-Day test for homogenitet: χ 2 = 7.33 df = 1 p = 0.007 Signifikant evidens for effekt-modifikation 21

Test for betinget uafhængighed Det har kun mening at teste om eksposition og sygdom er betinget uafhængige hvis hypotesen om homogenitet accepteres. Hvis det er tilfældet er der tre muligheder: 1) Beregn separate χ 2 tests for hvert stratum og læg dem sammen til et samlet globalt χ 2 test. Antallet af frihedsgrader er lig med antallet af strata. 2) Cochran s eller Mantel-Haensels test. (næste side) 3) Benyt et såkaldt -test, hvor logaritmen af Mantel- Haensel estimatet divideres med standardfejlen for logaritmen af estimatet: = ln( ω ) MH s.e.(ln( ω )) MH 23

Cochrans og Mantel-Haensel s test Beregn den observerede og forventede marginale fordeling for de to variable under nul-hypotesen ved at summere samtlige forventede værdier i hver celle henover de forskellige strata. De observerede frekvenser er givet ved a c = a, b b =, = c, d = d De forventede værdier er givet ved F( a) = F( a ), F( b) F( b ) =, F( c) = F( c ), F( d) F( d ) = Beregn derefter et konventionelt χ 2 test til sammenligning af ovenstående observerede og forventede frekvenser. 24

Eksemplet Mantel-Hansels test χ 2 = 15.66. 1 frihedsgrad, p<0.0005. Z-testet er enig i denne konklusion. ln(ω MH ) = 0.699, standard fejlen er lig med 0.179 = 3.905 p < 0.0005 25

Mantel-Haensel analyse af sammenhængen mellem år og boligstandard kontrolleret for uddannelse 26

ÅR År * BOLIG Bolig * UDD Uddannelse Crosstabulation UDD Uddannelse 1,00 <9 år 2,00 10-12 år 3,00 13+ år ÅR År Total ÅR År Total ÅR År Total 1,00 1967 2,00 1984 1,00 1967 2,00 1984 1,00 1967 2,00 1984 % within ÅR År % within ÅR År % within ÅR År % within ÅR År % within ÅR År % within ÅR År % within ÅR År % within ÅR År % within ÅR År BOLIG Bolig 1,00 god 2,00 dårlig Total 185 127 312 59,3% 40,7% 100,0% 288 30 318 90,6% 9,4% 100,0% 473 157 630 75,1% 24,9% 100,0% 168 67 235 71,5% 28,5% 100,0% 296 23 319 92,8% 7,2% 100,0% 464 90 554 83,8% 16,2% 100,0% 30 7 37 81,1% 18,9% 100,0% 90 3 93 96,8% 3,2% 100,0% 120 10 130 92,3% 7,7% 100,0% 27

UDD Uddannelse 1,00 <9 år 2,00 10-12 år 3,00 13+ år Risk Estimate Odds Ratio for ÅR År (1,00 1967 / 2,00 1984) For cohort BOLIG Bolig = 1,00 god For cohort BOLIG Bolig = 2,00 dårlig N of Valid Cases Odds Ratio for ÅR År (1,00 1967 / 2,00 1984) For cohort BOLIG Bolig = 1,00 god For cohort BOLIG Bolig = 2,00 dårlig N of Valid Cases Odds Ratio for ÅR År (1,00 1967 / 2,00 1984) For cohort BOLIG Bolig = 1,00 god For cohort BOLIG Bolig = 2,00 dårlig N of Valid Cases,152,098,235,655,593,723 4,315 2,992 6,221 630,195,117,324,770,707,840 3,954 2,540 6,156 554,143,035,588,838,714,983 5,865 1,602 21,471 130 95% Confidence Interval Value Lower Upper Tre odds-ratio værdier <9 år: 0.152 10-12 år: 0.195 13+ år: 0.143 28

Statistics Conditional Independence Homogeneity Tests for Homogeneity of the Odds Ratio Cochran's Mantel-Haensel Breslow-Day Tarone's Asymp. Sig. Chi-Squared df (2-sided) 135,878 1,000 133,976 1,000,582 2,748,582 2,748 Under the conditional independence assumption, Cochran's statistic is asymptotically distributed as a 1 df chi-squared distribution, only if the number of strata is fixed, while the Mantel-Haensel statistic is always asymptotically distributed as a 1 df chi-squared distribution. Note that the continuity correction is removed from the Mantel-Haensel statistic when the sum of the differences between the observed and the expected is 0. Estimate ln(estimate) Std. Error of ln(estimate) Asymp. Sig. (2-sided) Asymp. 95% Confidence Interval Mantel-Haensel Common Odds Ratio Estimate Common Odds Ratio ln(common Odds Ratio) Lower Bound Upper Bound Lower Bound Upper Bound,167-1,790,165,000,121,231-2,114-1,467 The Mantel-Haensel common odds ratio estimate is asymptotically normally distributed under the common odds ratio of 1,000 assumption. So is the natural log of the estimate. Mantel-Haensel estimatet = 0.167 29

Multipel stratifikation: Uddannelse + Kohorte år 30

KØN Køn * BOLIG Bolig * UDD Uddannelse * ÅR År Crosstabulation ÅR År 1,00 1967 2,00 1984 UDD Uddannelse 1,00 <9 år 2,00 10-12 år 3,00 13+ år 1,00 <9 år 2,00 10-12 år 3,00 13+ år KØN Køn Total KØN Køn Total KØN Køn Total KØN Køn Total KØN Køn Total KØN Køn Total 1,00 mand 2,00 kvinde 1,00 mand 2,00 kvinde 1,00 mand 2,00 kvinde 1,00 mand 2,00 kvinde 1,00 mand 2,00 kvinde 1,00 mand 2,00 kvinde BOLIG Bolig 1,00 god 2,00 dårlig Total 53 48 101 52,5% 47,5% 100,0% 132 79 211 62,6% 37,4% 100,0% 185 127 312 59,3% 40,7% 100,0% 105 52 157 66,9% 33,1% 100,0% 63 15 78 80,8% 19,2% 100,0% 168 67 235 71,5% 28,5% 100,0% 21 6 27 77,8% 22,2% 100,0% 9 1 10 90,0% 10,0% 100,0% 30 7 37 81,1% 18,9% 100,0% 110 13 123 89,4% 10,6% 100,0% 178 17 195 91,3% 8,7% 100,0% 288 30 318 90,6% 9,4% 100,0% 176 14 190 92,6% 7,4% 100,0% 120 9 129 93,0% 7,0% 100,0% 296 23 319 92,8% 7,2% 100,0% 49 2 51 96,1% 3,9% 100,0% 41 1 42 97,6% 2,4% 100,0% 90 3 93 96,8% 3,2% 100,0% 31

Risk Estimate 95% Confidence Interval ÅR År 1,00 1967 UDD Uddannelse 1,00 <9 år Odds Ratio for KØN Køn (1,00 mand / 2,00 kvinde) For cohort BOLIG Bolig = 1,00 god Value Lower Upper,661,409 1,068,839,678 1,038 2,00 10-12 år For cohort BOLIG Bolig = 2,00 dårlig N of Valid Cases Odds Ratio for KØN Køn (1,00 mand / 2,00 kvinde) 1,269,970 1,661 312,481,250,924 3,00 13+ år For cohort BOLIG Bolig = 1,00 god For cohort BOLIG Bolig = 2,00 dårlig N of Valid Cases Odds Ratio for KØN Køn (1,00 mand / 2,00 kvinde) For cohort BOLIG Bolig = 1,00 god,828,710,966 1,722 1,038 2,857 235,389,041 3,713,864,648 1,153 For cohort BOLIG Bolig = 2,00 dårlig 2,222,304 16,237 2,00 1984 1,00 <9 år N of Valid Cases Odds Ratio for KØN Køn (1,00 mand / 2,00 kvinde) 37,808,378 1,728 2,00 10-12 år For cohort BOLIG Bolig = 1,00 god For cohort BOLIG Bolig = 2,00 dårlig N of Valid Cases Odds Ratio for KØN Køn (1,00 mand / 2,00 kvinde) For cohort BOLIG Bolig = 1,00 god For cohort BOLIG Bolig = 2,00 dårlig,980,909 1,056 1,212,611 2,407 318,943,395 2,248,996,936 1,059 1,056,471 2,367 3,00 13+ år N of Valid Cases Odds Ratio for KØN Køn (1,00 mand / 2,00 kvinde) For cohort BOLIG Bolig = 1,00 god 319,598,052 6,829,984,915 1,059 For cohort BOLIG Bolig = 2,00 dårlig N of Valid Cases 1,647,155 17,539 93 32

Statistics Conditional Independence Homogeneity Tests for Homogeneity of the Odds Ratio Cochran's Mantel-Haensel Breslow-Day Tarone's Asymp. Sig. Chi-Squared df (2-sided) 7,189 1,007 6,745 1,009 2,056 5,841 2,056 5,841 Under the conditional independence assumption, Cochran's statistic is asymptotically distributed as a 1 df chi-squared distribution, only if the number of strata is fixed, while the Mantel-Haensel statistic is always asymptotically distributed as a 1 df chi-squared distribution. Note that the continuity correction is removed from the Mantel-Haensel statistic when the sum of the differences between the observed and the expected is 0. Estimate ln(estimate) Std. Error of ln(estimate) Asymp. Sig. (2-sided) Asymp. 95% Confidence Interval Mantel-Haensel Common Odds Ratio Estimate Common Odds Ratio ln(common Odds Ratio) Lower Bound Upper Bound Lower Bound Upper Bound,653 -,427,159,007,477,892 -,739 -,114 The Mantel-Haensel common odds ratio estimate is asymptotically normally distributed under the common odds ratio of 1,000 assumption. So is the natural log of the estimate. Mantel-Haensel estimat = 0.653 33