Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Mantel-Haenszel analyser

Relaterede dokumenter
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Stratificerede analyser

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Uafhængighedstestet

Mantel-Haenszel analyser. Stratificerede epidemiologiske analyser

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom

Analyse af binære responsvariable

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Lineær og logistisk regression

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Estimation

Statistik II 1. Lektion. Analyse af kontingenstabeller

Morten Frydenberg 26. april 2004

Morten Frydenberg 14. marts 2006

Logistisk regression. Statistik Kandidatuddannelsen i Folkesundhedsvidenskab

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004

Vurdering af epidemiologiske undersøgelser igen

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Konfidensintervaller og Hypotesetest

Effektmålsmodifikation

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse

Statistik II 4. Lektion. Logistisk regression

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

En teoretisk årsagsmodel: Operationalisering: Vurdering af epidemiologiske undersøgelser. 1. Informationsproblemer Darts et eksempel på målefejl

Statistik og skalavalidering. Opgave 1

Program. Logistisk regression. Eksempel: pesticider og møl. Odds og odds-ratios (igen)

9. Chi-i-anden test, case-control data, logistisk regression.

Besvarelse af opgavesættet ved Reeksamen forår 2008

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression

Statistik II 1. Lektion. Sandsynlighedsregning Analyse af kontingenstabeller

Logistisk Regression - fortsat

Effektmålsmodifikation

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Confounding og stratificeret analyse

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse

Morten Frydenberg Biostatistik version dato:

Vurdering af epidemiologiske undersøgelser igen

Lægevidenskabelig Embedseksamen, 6. semester Forår 2009 Epidemiologi og Biostatistik Rettevejledning

1 Hb SS Hb Sβ Hb SC = , (s = )

Vejledende eksamensopgaver vedr. hypotesetest (stx B og stx A)

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk

En teoretisk årsagsmodel: Operationalisering: Vurdering af epidemiologiske undersøgelser. 1. Informationsproblemer Eksempler på målefejl

Epidemiologiske associationsmål

Postoperative komplikationer

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

Faculty of Health Sciences. Logistisk regression: Kvantitative forklarende variable

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

MATEMATIK A-NIVEAU. Anders Jørgensen & Mark Kddafi. Vejledende eksempler på eksamensopgaver og eksamensopgaver i matematik, 2012

Tema. Dagens tema: Indfør centrale statistiske begreber.

Krydstabeller Forventede under nulhypotesen Ki-kvadrat test Residualanalyse Eksakt test

Vi vil analysere effekten af rygning og alkohol på chancen for at blive gravid ved at benytte forskellige Cox regressions modeller.

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

1 Multipel lineær regression

Synopsis til eksamen i Statistik

Normalfordelingen og Stikprøvefordelinger

2 Logaritme- og eksponentialfunktion 6

Kapitel 11 Lineær regression

1 Multipel lineær regression

Vejledende løsninger kapitel 9 opgaver

Eks. 1: Kontinuert variabel som i princippet kan måles med uendelig præcision. tid, vægt,

Intern validitet: Fejlkilder og tolkningsproblemer i epidemiologiske undersøgelser

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Vejledende besvarelse af eksamen i Statistik for biokemikere, blok

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se

Analysestrategi. Lektion 7 slides kompileret 27. oktober :24 p.1/17

Epidemiologiske associationsmål

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Dag 6: Interaktion. Overlevelsesanalyse

Confounding. Mads Kamper-Jørgensen, lektor, Afdeling for Social Medicin, Institut for Folkesundhedsvidenskab

Løsning til eksaminen d. 14. december 2009

REEKSAMEN I EPIDEMIOLOGISKE METODER IT & Sundhed, 2. semester

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Kapitel 8 Chi-i-anden (χ 2 ) prøven

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Forelæsning 9: Inferens for andele (kapitel 10)

1. februar Lungefunktions data fra tirsdags Gennemsnit l/min

Basal Statistik Kategoriske Data

Module 3: Statistiske modeller

OR stiger eksponentielt med forskellen i BMI. kompliceret model svær at forstå og analysere

Transkript:

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Mantel-Haenszel analyser

Mantel-Haenszel analyser Sidst lærte vi om stratificerede analyser. I dag kigger vi på et specialtilfælde: både exposure og outcome er dikotome. Vi skal forstå hvad der menes med en confounder-justeret OR. og vi skal forbedre metoderne fra sidst 1. test for ingen effektmodifikation 2. bedre test for betinget uafhængighed 1

Generel stratificeret analyse Confounder Z kan antage k forskellige værdier Z = 1 Z = z Z = k Outcome exp Ja Nej ja a 1 b 1... Outcome exp Ja Nej ja a z b z... Outcome exp Ja Nej ja a k b k nej c 1 d 1 nej c z d z nej c k d k ÔR 1 ÔR z ÔR k 2

Betinget uafhængighed Betyder: OR=1 i alle del-tabeller. Dvs hvis der bare findes en tabel med OR 1, så er exposure og outcome ikke betinget uafhængige. Naiv testprocedure: 1. udfør χ 2 -test i hver tabel 2. hvis et (eller flere) test er signifikante forkastes hypotesen om betinget uafhænigighed 3

Multipel testning Hvad er risiko for type I fejl? Antag H 0 er sand og at vi har 2 strata P (forkast) = 1 P ({accept i stratum 1} {accept i stratum 2}) = 1 P ({accept i stratum 1}) P ({accept i stratum 2}) = 1 0.95 0.95 = 0.098 > 0.05 k strata: P (forkast) = 1 0.95 k, k = 10 P (forkast) = 0.40 Når vi har mange strata er der stor risiko for en type 1 fejl. (se også resultater fra øvelse 2, opgave 2) Det bedre at kombinere information fra forskellige strata i et samlet test - f.eks globalt χ 2 -test 4

Program Odds-ratio (OR) stratificerede analyser confounding og effektmodifikation Mantel Haenszel OR estimatet Breslow-Day test for homogene OR Mantel Haenszel test for betinget uafhængighed 5

Effekt af DTP vaccination i Bissau-data Død DTP ja nej total ja 93 2079 2172 4.28% 95.72% nej 128 2973 3101 4.13% 95.87% total 221 5052 5273 Odds Ratio: 1.04, 95%-CI (0.79, 1.37), p = 0.78 Effekten er ikke statistisk signifikant 6

Er BCG-vaccination en confounder? DTP BCG DØD Vi har tidligere set at BCG forbedrer overlevelsen 7

Sammenhæng mellem DTP og BCG BCG DTP ja nej total ja 2141 31 2172 98.6% 1.4% nej 1159 1942 3101 37.4% 62.6% total 3300 1973 5273 χ 2 = 2043, df = 1, p < 0.0001 Børn med DTP har med stor sandsynlighed også fået BCG 8

Konklusion BCG-vaccination er en confounder OK, vi stratificerer efter BCG - no problem 9

Effekt af DTP for børn med BCG Død DTP ja nej total ja 91 2050 2141 4.25% 95.75% nej 33 1126 1159 2.85% 97.15% total 124 3176 3300 Odds Ratio: 1.51, 95%-CI (1.01; 2.27), p = 0.043 10

Effekt af DTP for børn uden BCG Død DTP ja nej total ja 2 29 31 6.45% 93.55% nej 95 1847 1942 4.89% 95.11% total 97 1876 1973 Odds Ratio: 1.34, 95%-CI (0.31; 5.70), p = 0.69 11

Hvad så vi? Efter stratifikation for BCG blev den skadelige DTP effekt stærkere Ukorrigeret: 1.04, 95%-CI (0.79, 1.37) Stratificeret: stratum odds-ratio med BCG ÔR 1 = 1.51(1.01 2.27) uden BCG ÔR 2 = 1.34(0.31 5.70) Næste skridt er at teste om BCG modificerer effekten af DTP Ingen effektmodifikation H 0 : OR 1 = OR 2 12

Generel stratificeret analyse Variabel Z kan antage k forskellige værdier Z = 1 Z = z Z = k Outcome exp Ja Nej ja a 1 b 1... Outcome exp Ja Nej ja a z b z... Outcome exp Ja Nej ja a k b k nej c 1 d 1 nej c z d z nej c k d k ÔR 1 ÔR z ÔR k 13

Hypotesen om ingen effektmodifikation Under hypotesen er OR homogene over strata H 0 : OR 1 = OR 2 =... = OR k Hypotesen testes ved det såkaldte Breslow-Day test. Her sammenlignes celle-antal i hver af de k del-tabeller med forventede celle-antal under hypotesen. De forventede celletal under hypotesen? De forventede celletal beregnes ved at kræve at OR er den samme i alle del-tabeller. Hvilken fælles værdi? Mantel-Haenszel løste problemet i 1959 14

Mantel-Haenszel estimat af fælles odds-ratio Mantel-Haenszel estimatet er et vægtet gennemsnit over odds-ratio værdierne i de forskellige strata: ÔR mh = w 1 ÔR 1 + w 2 ÔR 1 +... + w k ÔR k hvor w 1 + w 2 +... + w k = 1 Mantel-Hanszel vægte er proportinale med b zc z n z 15

Mantel-Haenszel estimat i Bissau data Mantel-Hanszel vægte er proportinale med b zc z n z med BCG-vaccination: 33 2050 3300 = 20.5 uden BCG-vaccination: 95 29 1973 = 1.3 vægte: w med = 0.93 og w uden = 0.06 Samlet estimat er derfor: ÔR mh = 0.93 1.51 + 0.06 1.34 = 1.50 16

Breslow-Day test for ingen effektmodifikation Er Odds-ratio værdierne de samme i de forskellige strata? Observerede celletal (a z, b z, c z, d z ) sammenlignes med forventede celletal under hypotesen [E(a z ), E(b z ), E(c z ), E(d z )] De forventede celletal beregnes ved at kræve at 1. samme række- og søjlesummer som observeret 2. odds ratio skal være lig med ÔR mh i alle strata Beregn et χ 2 -test, der sammenligner de observerede og de forventede værdier χ 2 = k [ [a z E(a z )] 2 E(a z ) z=1 + [b z E(b z )] 2 E(b z ) + [c z E(c z )] 2 E(c z ) + [d z E(d z )] 2 E(d z ) ] Under H 0 : χ 2 -fordelt med k 1 frihedsgrader 17

Bissau data - Breslow-Day test Breslow-Day test strata odds-ratio med BCG 1.51 (1.01-2.27) uden BCG 1.34 (0.31-5.70) Mantel-Haenszel 1.50 (1.02-2.22) χ 2 = 0.025, df = 2 1 = 1, p = 0.87 Tendens til effektmodifikation er insignifikant. Effekten af DTP afhænger ikke af BCG. 18

Ingen effektmodifikation Confounder Z kan antage k forskellige værdier Z = 1 Z = z Z = k Outcome exp Ja Nej ja a 1 b 1 nej c 1 d 1... Outcome exp Ja Nej ja a z b z nej c z d z... Outcome exp Ja Nej ja a k b k nej c k d k OR 1 = a OR z = a OR k = a Der er den samme odds-ratio i hver tabel (her kaldet a) 19

Næste skridt - test for betinget uafhængighed Confounder Z kan antage k forskellige værdier Z = 1 Z = z Z = k Outcome exp Ja Nej ja a 1 b 1 nej c 1 d 1... Outcome exp Ja Nej ja a z b z nej c z d z... Outcome exp Ja Nej ja a k b k nej c k d k OR 1 = a OR z = a OR k = a Der er den samme odds-ratio i hver tabel (her kaldet a) Næste skridt er at teste om den fælles odds ratio er 1 (H 0 : a = 1) Svarer til at exposure og outcome er betinget uafhængige givet Z 20

Test for betinget uafhængighed Hvis effektmodifikationen ikke er signifikant er næste skridt at teste om outcome er betinget uafhængig af exposure givet confounder Dvs om den fælles OR er 1. Vi har Mantel-Haenszel: ÔR mh = 1.50 (1.02 2.22) Et formeldt test kan opnåes ved: Under hypotesen følger Wald-teststørrelsen: z = en standardiseret normalfordeling. log ÔR mh s.e[log ÔR mh] Vi får z = log ÔR mh s.e[log ÔR mh] = 0.408 0.199 = 2.05, p = 0.040 Konklusion: Efter korrektion for BCG er der afhængighed mellem DTP og dødelighed. 21

Mantel-Haenszel test for betinget uafhængighed 1. Opstil 2X2-tabel for sammenhæng mellem exposure og outcome 2. Beregn de forventede celletal - hvis exposure ikke har effekt, men under hensyntagen til at Z kan have en effekt. 3. Beregn forskel mellem observeret og forventet 4. Vurder signifikansen i χ 2 1-fordeling Proceduren er altså den samme som i χ 2 -testet for uafhængighed det eneste der anderledes er beregningen af de forventede celletal. 22

Forventede celletal under betinget uafhængighed Død DTP ja nej total ja F 11 F 12 2172 nej F 21 F 22 3101 total 221 5052 5273 Forventede celletal hvis DTP ikke har effekt, men under hensyntagen til at BCG kan have en effekt: Ud af de 2172 DTP-børn har 2141 fået BCG og 31 har ikke fået BCG: F 11 = 2141 P (død BCG) + 31 P (død uden BCG) = 2141 0.038 + 31 0.049 = 82.8 (se næste slide) Hvis jeg glemmer at korrigere for BCG: F 11 = 2172 P (død) = 2172 221 5273 = 91.0 Det forventede antal døde i DTP-gruppen bliver lavere når jeg tager højde for at en stor andel har fået den gode BCG-vaccine. 23

Dødssandsynligheder i de to BCG-grupper Udfra data hvad er da vores bedste bud på dødssandsynlighederne? død BCG ja nej total ja 124 3176 3300 nej 97 1876 1973 total 221 5052 5273 p 1 =124/3300=3.76% p 2 = 97/1973=4.92% 24

χ 2 -test uden og med korrektion for BCG Observeret død DTP ja nej total ja 93 2079 2172 nej 128 2973 3101 total 221 5052 5273 Forventet uden BCG Forventet med BCG død død DTP ja nej total DTP ja nej total ja 91 2081 2172 ja 82.8 2089.2 2172 nej 130 2971 3101 nej 138.2 2962.8 3101 total 221 5052 5273 total 221 5052 5273 p = 0.78 p = 0.049 25

Er DTP og Død uafhængige givet BCG? To tests af hypotesen om ingen sammenhæng: 1. Wald-test z = log ÔR mh s.e[log ÔR mh ] = 0.408 0.199 = 2.05, p = 0.040 2. Mantel-Haenszel test χ 2 = 3.87, df = 1, p = 0.049 DTP har en signifikant effekt efter korrektion for BCG. 26

Fortolkning: Unadjusted vs Mantel-Haenszel Resultater om effekten af DTP: 1. Unadjusted: ÔR = 1.04 95%-CI: 0.79-1.37, p > 0.78 2. Mantel-Haenszel: ÔR = 1.50 95%-CI: 1.02-2.22, p = 0.04 Fortolkning: 1. Unadjusted OR sammenligner tilfældige DTP-vaccinerede med tilfældige ikke DTP-vaccinerede - her så vi kun en meget lille overdødelighed blandt DTP-vaccinerede (fordi disse børn oftere har den gavnlige BCG-vaccination) 2. Mantel-Haenszel OR sammenligner DTP vaccinerede med ikke DTP-vaccinerede der har samme BCG-status - her så vi en signifikant overdødelighed i DTP-gruppen 27

Stratificerede analyser: arbejdsgang 1. Beregn OR for sammenhængen mellem eksponering og outcome for hver værdi af stratificeringsvariabelen (confounderen) 2. Test for ingen effektmodifikation (Breslow-Day test). Forkast: Effekt af eksponering på outcome afhænger af stratificeringsvariabel. Analysen stopper. Angiv OR i hvert stratum Ikke forkast: fortsæt til næste trin 3. Beregn fælles OR (Mantel-Haenszel) 4. Test for betinget uafhængighed - er den fælles OR signifikant forskellig fra 1 (f.eks Mantel Haenszel s test) 28

Bogen: rygning og hjertesydom rygning tidl. syg. hjertesygd. 29

Eksemplet - Breslow-Day test Breslow-Day test strata odds-ratio ingen tidligere sygdom 2.441 (1.67-3.57) tidligere sygdom 0.585 (0.22-1.59) χ 2 = 7.33, df = 1, p = 0.007 Signifikant evidens for effektmodifikation. Effekten af rygning afhænger af tidligere hjertesygdom. Det giver nu ikke mening at angive en fælles OR. 30

Mantel-Haenszel: Begrænsninger? Hvad nu hvis jeg har en kontinuert confounder? Mantel-Haenszel kan ikke være med - brug logistisk regression som også kan klare en kontinuert exposure variabel Logistisk regression er emnet resten af kurset 31