Intern validitet: Fejlkilder og tolkningsproblemer i epidemiologiske undersøgelser

Relaterede dokumenter
En teoretisk årsagsmodel: Operationalisering: Vurdering af epidemiologiske undersøgelser. 1. Informationsproblemer Eksempler på målefejl

En teoretisk årsagsmodel: Operationalisering: Vurdering af epidemiologiske undersøgelser. 1. Informationsproblemer Darts et eksempel på målefejl

Måleproblemer. Fejlkilder og tolkningsproblemer. Usikkerhed og bias. Stikprøveusikkerhed. Epidemiologi og Biostatistik (version

Epidemiologi og Biostatistik (version )

Vurdering af epidemiologiske undersøgelser. Epidemiologisk forskning

Målsætning. Vurdering af epidemiologiske undersøgelser

Vurdering af epidemiologiske undersøgelser igen

Fejlkilder. Ulrik Schiøler Kesmodel. Rikke Guldberg Øjvind Lidegaard

Selektionsbias. Mads Kamper-Jørgensen, lektor, Afdeling for Social Medicin, Institut for Folkesundhedsvidenskab

Besvarelse af opgavesættet ved Reeksamen forår 2008

Confounding. Mads Kamper-Jørgensen, lektor, Afdeling for Social Medicin, Institut for Folkesundhedsvidenskab

Effektmålsmodifikation

Effektmålsmodifikation

Fejlkilder. Kim Overvad Afdeling for Epidemiologi Institut for Folkesundhed Aarhus Universitet Marts 2011

Vurdering af epidemiologiske undersøgelser igen

Confounding. Mads Kamper-Jørgensen, lektor, Afdeling for Social Medicin, Institut for Folkesundhedsvidenskab

Lægevidenskabelig Embedseksamen, 6. semester Forår 2009 Epidemiologi og Biostatistik Rettevejledning

Mads Kamper-Jørgensen, lektor, Afdeling for Social Medicin, Institut for Folkesundhedsvidenskab

2. Hvilke(t) epidemiologisk(e) design(s) anvender forfatterne til at belyse problemstillingen? (7 point)

Analyse af binære responsvariable

Præcision og effektivitet (efficiency)?

Mads Kamper-Jørgensen, lektor, Afdeling for Social Medicin, Institut for Folkesundhedsvidenskab

Kursus i Epidemiologi og Biostatistik, forår Epidemiologiske mål. Studiedesign. Svend Juul, manan.dk

Population attributable fraction

SKRIFTLIG EKSAMEN I BIOSTATISTIK OG EPIDEMIOLOGI Cand.Scient.San, 2. semester 20. februar 2015 (3 timer)

Kursus i Epidemiologi og Biostatistik. Epidemiologiske mål. Studiedesign. Svend Juul

Epidemiologiske mål Studiedesign

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Mantel-Haenszel analyser

Epidemiologiske associationsmål

Eksperimenter. Kim Overvad Afdeling for Epidemiologi Institut for Folkesundhed Aarhus Universitet Marts 2011

Epidemiologiske associationsmål

BIAS Kursus i basal farmakoepidemiologi 2018 Maja Hellfritzsch Poulsen

Eks. 1: Kontinuert variabel som i princippet kan måles med uendelig præcision. tid, vægt,

Epidemiologi og Biostatistik. Mogens Erlandsen, Institut for Biostatistik Uge 1, tirsdag d. 5. februar 2002

ORDINÆR EKSAMEN I EPIDEMIOLOGISKE METODER IT & Sundhed, 2. semester

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Uafhængighedstestet

REEKSAMEN I EPIDEMIOLOGISKE METODER IT & Sundhed, 2. semester

Vurdering af det Randomiserede kliniske forsøg RCT

Studiedesigns: Randomiserede kontrollerede undersøgelser

Noter til SfR checkliste 4 - Casekontrolundersøgelser

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom

Studiedesigns: Alternative designs

Tillæg til studieordningen for bacheloruddannelsen i Sundhedsteknologi

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Stratificerede analyser

3 typer. Case-kohorte. Nested case-kontrol. Case-non case (klassisk case-kontrol us.)

ORDINÆR EKSAMEN I EPIDEMIOLOGISKE METODER IT & Sundhed, 2. semester

ORDINÆR EKSAMEN I EPIDEMIOLOGISKE METODER IT & Sundhed, 2. semester

Hyppigheds- og associationsmål. Kim Overvad Afdeling for Epidemiologi Institut for Folkesundhed Aarhus Universitet Februar 2011

Epidemiologi og Biostatistik

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse

Noter til SfR checkliste 3 Kohorteundersøgelser

Sommereksamen Bacheloruddannelsen i Medicin/Medicin med industriel specialisering

Kommentarer til spørgsmålene til artikel 1: Ethnic differences in mortality from sudden death syndrome in New Zealand, Mitchell et al., BMJ 1993.

Korrelation Pearson korrelationen

ORDINÆR EKSAMEN I EPIDEMIOLOGISKE METODER IT & Sundhed, 2. semester

Udarbejdelse af kliniske retningslinjer: Systematisk og kritisk læsning

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse

Studiedesigns: Kohorteundersøgelser

Kritisk læsning af kohorte studie Oversat efter: Critical Appraisal skills Programme (CASP) Making sense of evidence

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Introduktion

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk

S4-S5 statistik Facitliste til opgaver

Workshop 6 Sundhedsprofilen metode og muligheder. Anne Helms Andreasen, Forskningscenter for Forebyggelse og Sundhed

Overvejelser vedr. outcomes i (farmako)epidemiologiske studier Kursus i basal farmakoepidemiologi 2018 Maja Hellfritzsch Poulsen

Interviewereffekter på spørgsmål om sort arbejde. Rockwool Fondens Forskningsenhed Oktober 2008

1. februar Lungefunktions data fra tirsdags Gennemsnit l/min

Træningsaktiviteter dag 3

MPH Introduktionsmodul: Epidemiologi og Biostatistik

Mikro-kursus i statistik 1. del Mikrokursus i biostatistik 1

Studiedesigns: Kohorteundersøgelser

CENTER FOR KLINISKE RETNINGSLINJER

OR stiger eksponentielt med forskellen i BMI. kompliceret model svær at forstå og analysere

Studiedesigns: Case-kontrolundersøgelser

CENTER FOR KLINISKE RETNINGSLINJER - CLEARINGHOUSE

Epidemiologisk design I. Eksperimentelle undersøgelser. Epidemiologisk design II. Randomiserede undersøgelser. Randomisering II

Lineær og logistisk regression

RE-EKSAMEN I EPIDEMIOLOGISKE METODER IT & Sundhed, 2. semester

Epidemiologi og Biostatistik

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Estimation

Resultater vedrørende risikofaktorer for hjertekarsygdom og dødelighed i relation til social ulighed - 15 års opfølgning i Sundhedsprojekt Ebeltoft

Epidemiologi og biostatistik. Diagnostik og screening. Forelæsning, uge 5, Svend Juul. Hvordan stiller man en diagnose? Diagnostiske kriterier

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

Module 1: Data og Statistik

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression

8.2 Statistiske analyse af hver enkelt indikator

OR stiger eksponentielt med forskellen i BMI komplicet model svær at forstå og analysere simpel model

Sammenhængsanalyser. Et eksempel: Sammenhæng mellem rygevaner som 45-årig og selvvurderet helbred som 51 blandt mænd fra Københavns amt.

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 4: 2. marts

Eksempel: PEFR. Epidemiologi og biostatistik. Uge 1, tirsdag. Erik Parner, Institut for Biostatistik.

Epidemiologi. Hvad er det? Øjvind Lidegaard og Ulrik Kesmodel

Program. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data

EPIDEMIOLOGI MODUL 7. April Søren Friis Institut for Epidemiologisk Kræftforskning Kræftens Bekæmpelse DAGENS PROGRAM

Morten Frydenberg Biostatistik version dato:

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

Anne Illemann Christensen Seniorrådgiver Region Syddanmark

Statistik kommandoer i Stata opdateret 16/ Erik Parner

Epidemiologisk design I. Eksperimentelle undersøgelser. Epidemiologisk design II. Randomiserede undersøgelser. Randomisering I.

Statistik II 1. Lektion. Analyse af kontingenstabeller

Årsager. Øjvind Lidegaard, RH Rikke Guldberg, Skejby Ulrik Kesmodel, Herlev

Transkript:

Intern validitet: Fejlkilder og tolkningsproblemer i epidemiologiske undersøgelser Jørn Attermann 23. september 2009 Vurdering af den interne validitet af en epidemiologisk undersøgelse: Informationsproblemer Selektionsproblemer Ikke-erkendt effektmodifikation Confounding 1 2 En model Eksempel: Alkohol og larynxcancer For meningsfuldt at kunne diskutere fejlkilder og fortolkningsproblemer må vi have en model for det, som vi diskuterer! Krav til modellen: Omfatter næsten alle de variable og begreber, som vi vil bruge Afspejler virkeligheden Simpel nok til at kunne forstås og fortolkes Alkohol Effekt Køn, rygning, socialgruppe Larynxcancer 3 4 En generel model: Eksponering Effekt Udfald Eksempel: Alkohol og larynxcancer Alkohol Effekt Larynxcancer Andre faktorer Køn, rygning, socialgruppe Mere præcist: Eksponeringsmål Effektmål Udfaldsmål Antal genstande pr. uge (selvrapporteret) Relativ risiko Larynxcancerdiagnose (Cancerregisteret) Mål for andre faktorer 5 Køn, antal cigaretter pr. dag (selvrapporteret), socialgruppe (Danmarks Statistik) 6 1

Fejl i fortolkningen af eksponeringens effekt på udfaldet kan skyldes bl.a. 1. Informationsproblemer (målefejl eller misklassifikation af variable) 2. Selektionsproblemer 3. Effektmodifikation (interaktion) 4. Confounding 1. Informationsproblemer Eksempler på målefejl A B C D I det følgende vil vi undersøge hvert af disse begreber. 7 8 Præcision (eng.: precision), sikkerhed, reproducerbarhed, ryster ikke på hånden (modsat måleusikkerhed). Korrekthed (eng.: trueness), nøjagtighed, korrekt indstillet (modsat målebias). Måleusikkerhed kan der ofte kompenseres for ved at foretage flere målinger. Målebias er en systematisk skævhed, som der ofte kan korrigeres for ved korrekt indstilling af måleinstrumentet. A C B D Eksempler på årsager til måleusikkerhed Dårligt apparatur Inter- og intraindividuel biologisk variation (fx blodtryk) Inter- og intraobservatørvariation (fx scoring af helbred eller diagnosticering) Eksempler på årsager til målebias Forkert kalibrering af måleinstrument (fx blodtryksmåling, klinisk-biokemisk analyse, spørgeskema) 9 10 Normalfordelte variable Sand fordeling Målt fordeling uden bias Målt fordeling med bias Måleusikkerhed bevirker, at De observerede værdier får større spredning (SD) end de faktiske værdier. Det betyder, at middelværdien bliver bestemt med større usikkerhed (bredere sikkerhedsinterval). Ved sammenligninger overser man derfor lettere en reel forskel (type 2 fejl). Måleusikkerhed svarer til støj eller tåge: Tåge slører kontraster, den skaber dem ikke. 11 12 2

Målebias bevirker I beskrivende undersøgelser: Middelværdiestimatet bliver bias ed I sammenlignende undersøgelser: Det kommer an på... Dikotome variable Graden af misklassifikation kan karakteriseres ved: Sensitivitet: Evnen til at identificere de syge Specificitet: Evnen til at identificere de ikke-syge Børn af Sandt Målt Ikke-rygere 3500 g 3400 g Rygere 3350 g 3250 g Differens 150 g 150 g Klassificeret som Syg Ikke-syg Syg Sandt positiv Falsk negativ Sandheden Ikke-syg Falsk positiv Sandt negativ 13 14 Eksempel: Estimation af sensitivitet og specificitet Sandheden Klassifikation Syg Ikke-syg Syg 95 10 Ikke-syg 5 90 I alt 100 100 Sensitivitet: 95% (95% CI: 89%; 98%) Specificitet: 90% (95% CI: 82%; 95%) Misklassifikation bevirker I beskrivende undersøgelser: Fejlagtigt hyppighedsestimat I sammenlignende undersøgelser: Det kommer an på... om misklassifikationen er differentieret 15 16 Ikke-differentieret misklassifikation: Samme grad af misklassifikation af sygdomsstatus blandt eksponerede og ueksponerede Samme grad af misklassifikation af eksponering blandt syge og ikke-syge 17 Eksempel: Case-kontrol-undersøgelse: Ikkedifferentieret misklassifikation af eksponeringen Sand eksponeringsfordeling Målt eksponeringsfordeling Eksponeret Cases Kontroller Eksponeret Cases Kontroller Ja 100 60 Ja 50 30 Nej 60 100 Nej 110 130 I alt 160 160 I alt 160 160 OR = 2,8 OR = 2,0 Både i case- og kontrolgruppen har 50% af de eksponerede glemt eksponeringen Der er altså samme grad af misklassifikation i de to grupper (ikke-differentieret misklassifikation) Det fører til en undervurdering af associationen (risiko for type 2 fejl). 18 3

Eksempel: Case-kontrol-undersøgelse: Differentieret misklassifikation af eksponeringen Sand eksponeringsfordeling Rapporteret eksponeringsfordeling Eksponeret Cases Kontroller Eksponeret Cases Kontroller Ja 20 40 Ja 20 20 Nej 100 200 Nej 100 220 I alt 120 240 I alt 120 240 OR = 1,0 OR = 2,2 50% af kontrollerne havde glemt eksponeringen Det førte til en overvurdering af associationsestimatet Differentieret (dobbelt-skæv) misklassifikation fører til bias. 19 Ikke differentieret misklassifikation svækker mulighederne for at se associationer (fx OR). Det fører altså altid til bias af associationsestimater i en bestemt retning (ind mod den neutrale værdi). Differentieret misklassifikation kan føre til bias af associationsestimater i begge retninger. 20 Eksempel: Kostoplysninger Kostoplysninger er meget usikre. Det betyder, at det er svært at studere effekten af kosten; vi kommer til at undervurdere effekten - med mindre der er tale om differentieret målefejl: At dem, der blev syge, rapporterer anderledes end dem, der forblev raske. Læseren må forsøge at vurdere, hvad der kan være sket. 21 Målpopulation: Udvalgte: Studiepopulation: 2. Selektionsproblemer Eksempel: Sundheds- og sygdomsundersøgelsen 2000 Danske statsborgere 16 år N = 4.294.000 Inviterede N = 22.486 (100%) Interview gennemført N = 16.690 (74%) Tilfældig, stratificeret stikprøve (0,52%) Deltagelse afvist. N = 5.042 Sygdom mv. N=754 22 Eksempel: Danskernes vægtfordeling Hvis vi vil udtale os om danskernes vægtfordeling, er det billigere at undersøge en stikprøve end at undersøge alle danskerne. En tilfældig stikprøve er det ideelle. Det forudsætter en liste over alle danskere (CPRregisteret). Estimatet ud fra stikprøven af danskernes vægtfordeling er behæftet med usikkerhed. Denne usikkerhed er veldefineret og kan kvantificeres (SE, 95% CI). Hvis ikke alle udvalgte medvirker, er der et bortfald. Bortfaldet kan medføre bias i vores estimat af danskernes vægtfordeling. Som læser: Er der gjort klart rede for stikprøvetagning, deltagelse og bortfald? Sensitivitetsanalyse: Hvad er den sande prævalens af fedme, hvis ikke-deltagerne: har halvt så stor prævalens som deltagerne? har dobbelt så stor prævalens som deltagerne? 23 24 4

Studiepopulationen skal være repræsentativ for målpopulationen med hensyn til det, vi vil undersøge. Repræsentativiteten kan trues af: forkert stikprøve skævt bortfald En selektionsbias kan ikke korrigeres med statistiske metoder. En selektionsbias konsekvenser kan vurderes ved en sensitivitetsanalyse. I sammenlignende undersøgelser: Et bortfald uden sammenhæng med eksponering eller udfald medfører ikke bias i associationsmålet. Et bortfald, som kun hænger sammen med eksponeringen, medfører ikke bias i associationsmålet. Et bortfald, som hænger sammen med både eksponering og udfald (dobbelt-skævt), medfører bias. 25 26 Eksempel: Case-kontrol undersøgelse. Bortfald associeret med eksponeringen, men ikke med udfaldet. Eksempel: Case-kontrol undersøgelse. Bortfald associeret med både eksponeringen og udfaldet. Udvalgte Deltagere Eksponering Cases Kontroller Eksponering Cases Kontroller + 100 60 + 100 60 0 60 100 0 30 50 I alt 160 160 I alt 130 110 OR = 2,8 OR = 2,8 Udvalgte Deltagere Eksponering Case Kontrol Eksponering Case Kontrol + 100 60 + 100 60 0 60 100 0 60 50 I alt 160 160 I alt 160 110 OR = 2,8 OR = 1,4 27 28 3. Effektmodifikation Eksempel: Lægemiddel A påvirker effekten af lægemiddel B. Vi taler om effektmodifikation (interaktion). Eksponeringsmål (B) Effektmål Effektmålsmodifikator (A) Mål for udfald Bemærk, at effektmodifikationen afhænger af de valgte mål. Derfor er effektmålsmodifikation et bedre udtryk. 29 Effektmodifikation er det fænomen, at en eksponering eller behandling ikke virker ens på alle. Eksempler på faktorer, som kan modificere effekten af eksponeringen: køn arvelige faktorer livsstilsfaktorer Hvis vi kan identificere grupper, som er særligt modtagelige, er det nyttig viden: planlægning af forebyggelse differentieret behandling 30 5

Eksempel 8-1: Mæslingevaccine En ny mæslingevaccine var forbundet med øget generel dødelighed i forhold til den hidtidige: MRR = 1,33 (95% CI: 1,02; 1,73) Imidlertid var der stor forskel på effekten hos drenge og piger: Drenge: MRR = 0,91 (95% CI: 0,61; 1,35) Piger: MRR = 1,86 (95% CI: 1,28; 2,70) Fundet er interessant, men mekanismen endnu ikke forstået. Eksempel: Forskellig sammenhæng mellem højde og lungefunktion hos mænd og kvinder FVC, ml 7000 6000 5000 4000 3000 160 170 180 190 200 Højde, cm Mænd Kvinder 31 32 4. Confounding FVC, liter Eksempel: Lungefunktion og højde (andre data) 7 6 5 4 3 2 150 160 170 180 190 200 Højde, cm FVC, liter 7 6 5 4 3 2 Mænd Kvinder 150 160 170 180 190 200 Højde, cm 33 Confounding betyder sammenblanding eller forveksling Confounding er en fortolkningsfejl Risiko for confounding: Hvis en anden årsag er associeret med den årsag, vi studerer. Confoundertrekanten : Hypotese Eksponering Udfald Confounder 34 Eksempel: Case-control undersøgelse af alkohol og larynxkræft Alkohol Cases Kontroller Ja 131 340 Nej 179 690 I alt 310 1030 OR = 1,49 (1,15; 1,93) Rygere Alkohol Cases Kontroller Ja 116 230 Nej 124 240 I alt 240 470 OR = 0,98 (0,72; 1,33) Ikke-rygere Alkohol Cases Kontroller Ja 15 110 Nej 55 450 I alt 70 560 OR = 1,12 (0,61; 2,05) 35 En faktor, som er et led i årsagskæden fra eksponering til udfald, er ikke en confounder: Eksponering Faktor Udfald F.eks.: Kost S-kolesterol Åreforkalkning 36 6

Forebyggelse af confounding: restriktion Hvis vi kun ser på sammenhængen mellem alkoholindtagelse og larynxcancer blandt ikkerygere, kan der ikke opstå confounding på grund af rygning. Til gengæld ved vi ikke noget om sammenhængen blandt rygere. 37 Forebyggelse af confounding: matchning I follow-up undersøgelser: For hver eksponeret, rygende, 50-årige fraskilte mand kunne man finde en ueksponeret, rygende, 50-årig fraskilt mand til den ueksponerede kontrolgruppe. Det kræver en stor, velkarakteriseret gruppe at trække kontrollerne fra. I case-control undersøgelser: Man kan ikke studere effekten af det, der er matchet på. Man komplicerer den statistiske analyse (betinget logistisk regression). 38 Forebyggelse af confounding: randomisering I behandlingsforsøg kan man ved lodtrækning fordele patienterne tilfældigt til de behandlinger, hvis effekt skal sammenlignes. Herved sikres en ligelig fordeling af kendte og ukendte confoundere mellem grupperne. Det kan ikke anvendes ved potentielt skadelige eksponeringer. Forebyggelse af confounding: Stratificeret analyse Ved restriktion kan man undersøge associationen (alkohol/cancer), dels hos rygere, dels hos ikke-rygere. Er associationen (alkohol/cancer) væsentligt forskellig hos rygere og ikke rygere, er der effektmodifikation. Der må laves to beskrivelser, en for rygere og en for ikkerygere. Er associationerne ikke væsentligt forskellige, beregnes et fornuftigt vægtet gennemsnit. 39 40 Eksempel: Stratificeret analyse alkohol/larynxkræft. Ujusteret og justeret estimat Ujusteret Rygere Ikke-rygere Justeret,5 1 1,5 2 Odds ratio 41 Ved regressionsanalyse kan man undersøge den samtidige effekt af flere faktorer, f.eks. alkohol, rygning, køn m.m. Eksponering OR 95% CI Alkohol 1,00 0,76; 1,32 Rygning 4,08 3,01; 5,53 Køn osv. 42 7

Effektmodifikation vs. confounding Effektmodifikation er noget virkeligt: Den skal erkendes og beskrives; den kan være værdifuld viden af betydning for differentieret forebyggelse og behandling. Confounding (forveksling af årsager) er en fejltolkning, som man skal søge at undgå. 43 8