En model Fejlkilder og tolkningsproblemer i epidemiologiske undersøgelser Jørn Attermann. september 008 For meningsfuldt at kunne diskutere fejlkilder og fortolkningsproblemer må vi have en model for det, som vi diskuterer! Krav til modellen: Omfatter næsten alle de variable og begreber, som vi vil bruge Afspejler virkeligheden Simpel nok til at kunne forstås og fortolkes 1 Eksempel: Alkohol og larynxcancer Alkohol Effekt Køn, rygning, socialgruppe Larynxcancer En generel model: Eksponering Effekt Andre faktorer Mere præcist: Eksponeringsmål Effektmål Udfald Udfaldsmål Mål for andre faktorer Eksempel: Alkohol og larynxcancer Alkohol Antal genstande pr. uge (selvrapporteret) Effekt Køn, rygning, socialgruppe Relativ risiko Larynxcancer Larynxcancerdiagnose (Cancerregisteret) Køn, antal cigaretter pr. dag (selvrapporteret), socialgruppe (Danmarks Statistik) Fejl i fortolkningen af eksponeringens effekt på udfaldet kan skyldes bl.a. 1. Informationsproblemer (målefejl eller misklassifikation af variable). Selektionsproblemer. Effektmodifikation (interaktion). Confounding I det følgende vil vi undersøge hvert af disse begreber. 1
1. Informationsproblemer Eksempler på målefejl A B Præcision (eng.: precision), sikkerhed, reproducerbarhed, ryster ikke på hånden (modsat måleusikkerhed). Korrekthed (eng.: trueness), nøjagtighed, korrekt indstillet (modsat målebias). A C B D C D Måleusikkerhed kan der ofte kompenseres for ved at foretage flere målinger. Målebias er en systematisk skævhed, som der ofte kan korrigeres for ved korrekt indstilling af måleinstrumentet. 8 Normalfordelte variable Eksempler på årsager til måleusikkerhed Dårligt apparatur Inter- og intraindividuel biologisk variation (fx blodtryk) Inter- og intraobservatørvariation (fx scoring af helbred eller diagnosticering) Eksempler på årsager til målebias Forkert kalibrering af måleinstrument (fx blodtryksmåling, klinisk-biokemisk analyse, spørgeskema) Sand fordeling Målt fordeling uden bias Målt fordeling med bias 9 10 Måleusikkerhed bevirker, at De observerede værdier får større spredning (SD) end de faktiske værdier. Det betyder, at middelværdien bliver bestemt med større usikkerhed (bredere sikkerhedsinterval). Ved sammenligninger overser man derfor lettere en reel forskel (type fejl). Måleusikkerhed svarer til støj eller tåge: Tåge slører kontraster, den skaber dem ikke. 11 Målebias bevirker I beskrivende undersøgelser: Middelværdiestimatet bliver bias ed I sammenlignende undersøgelser: Det kommer an på... Børn af Sandt Målt Ikke-rygere 00 g 00 g Rygere 0 g 0 g Differens 10 g 10 g 1
Dikotome variable Graden af misklassifikation kan karakteriseres ved: Sensitivitet: Evnen til at identificere de syge Specificitet: Evnen til at identificere de ikke-syge Klassificeret som Syg Ikke-syg Syg Sandt positiv Falsk negativ Sandheden Ikke-syg Falsk positiv Sandt negativ Eksempel: Estimation af sensitivitet og specificitet Sandheden Klassifikation Syg Ikke-syg Syg 9 10 Ikke-syg 90 I alt 100 100 Sensitivitet: 9% (9% CI: 89%; 98%) Specificitet: 90% (9% CI: 8%; 9%) 1 1 Misklassifikation bevirker I beskrivende undersøgelser: Fejlagtigt hyppighedsestimat I sammenlignende undersøgelser: Det kommer an på... om misklassifikationen er differentieret Ikke-differentieret misklassifikation: Samme grad af misklassifikation af sygdomsstatus blandt eksponerede og ueksponerede Samme grad af misklassifikation af eksponering blandt syge og ikke-syge 1 1 Eksempel: Case-kontrol-undersøgelse: Ikkedifferentieret misklassifikation af eksponeringen Sand eksponeringsfordeling Målt eksponeringsfordeling Eksponeret Cases Kontroller Eksponeret Cases Kontroller Ja 100 0 Ja 0 0 Nej 0 100 Nej 110 10 I alt 10 10 I alt 10 10 OR =,8 OR =,0 Både i case- og kontrolgruppen har 0% af de eksponerede glemt eksponeringen Der er altså samme grad af misklassifikation i de to grupper (ikke-differentieret misklassifikation) Det fører til en undervurdering af associationen Eksempel: Case-kontrol-undersøgelse: Differentieret misklassifikation af eksponeringen Sand eksponeringsfordeling Rapporteret eksponeringsfordeling Eksponeret Cases Kontroller Eksponeret Cases Kontroller Ja 0 0 Ja 0 0 Nej 100 00 Nej 100 0 I alt 10 0 I alt 10 0 OR = 1,0 OR =, 0% af kontrollerne havde glemt eksponeringen Det førte til en overvurdering af associationsestimatet Differentieret (dobbelt-skæv) misklassifikation fører til bias. (risiko for type fejl). 1 18
Eksempel: Kostoplysninger Ikke differentieret misklassifikation svækker mulighederne for at se associationer (fx OR). Det fører altså altid til bias af associationsestimater i en bestemt retning (ind mod den neutrale værdi). Differentieret misklassifikation kan føre til bias af associationsestimater i begge retninger. Kostoplysninger er meget usikre. Det betyder, at det er svært at studere effekten af kosten; vi kommer til at undervurdere effekten - med mindre der er tale om differentieret målefejl: At dem, der blev syge, rapporterer anderledes end dem, der forblev raske. Læseren må forsøge at vurdere, hvad der kan være sket. 19 0 Målpopulation: Udvalgte: Studiepopulation:. Selektionsproblemer Eksempel: Sundheds- og sygdomsundersøgelsen 000 Danske statsborgere 1 år N =.9.000 Inviterede N =.8 (100%) Interview gennemført N = 1.90 (%) Tilfældig, stratificeret stikprøve (0,%) Deltagelse afvist. N =.0 Sygdom mv. N= 1 Eksempel: Danskernes vægtfordeling Hvis vi vil udtale os om danskernes vægtfordeling, er det billigere at undersøge en stikprøve end at undersøge alle danskerne. En tilfældig stikprøve er det ideelle. Det forudsætter en liste over alle danskere (CPRregisteret). Estimatet ud fra stikprøven af danskernes vægtfordeling er behæftet med usikkerhed. Denne usikkerhed er veldefineret og kan kvantificeres (SE, 9% CI). Hvis ikke alle udvalgte medvirker, er der et bortfald. Bortfaldet kan medføre bias i vores estimat af danskernes vægtfordeling. Som læser: Er der gjort klart rede for stikprøvetagning, deltagelse og bortfald? Sensitivitetsanalyse: Hvad er den sande prævalens af fedme, hvis ikke-deltagerne: har halvt så stor prævalens som deltagerne? har dobbelt så stor prævalens som deltagerne? Studiepopulationen skal være repræsentativ for målpopulationen med hensyn til det, vi vil undersøge. Repræsentativiteten kan trues af: forkert stikprøve skævt bortfald En selektionsbias kan ikke korrigeres med statistiske metoder. En selektionsbias konsekvenser kan vurderes ved en sensitivitetsanalyse.
I sammenlignende undersøgelser: Et bortfald uden sammenhæng med eksponering eller udfald medfører ikke bias i associationsmålet. Et bortfald, som kun hænger sammen med eksponeringen, medfører ikke bias i associationsmålet. Et bortfald, som hænger sammen med både eksponering og udfald (dobbelt-skævt), medfører bias. Eksempel: Case-kontrol undersøgelse. Bortfald associeret med eksponeringen, men ikke med udfaldet. Udvalgte Deltagere Eksponering Cases Kontroller Eksponering Cases Kontroller + 100 0 + 100 0 0 0 100 0 0 0 I alt 10 10 I alt 10 110 OR =,8 OR =,8 Eksempel: Case-kontrol undersøgelse. Bortfald associeret med både eksponeringen og udfaldet. Udvalgte Deltagere Eksponering Case Kontrol Eksponering Case Kontrol + 100 0 + 100 0 0 0 100 0 0 0 I alt 10 10 I alt 10 110 OR =,8 OR = 1,. Effektmodifikation Eksempel: Lægemiddel A påvirker effekten af lægemiddel B. Vi taler om effektmodifikation (interaktion). Eksponeringsmål (B) Effektmål Effektmålsmodifikator (A) Mål for udfald Bemærk, at effektmodifikationen afhænger af de valgte mål. Derfor er effektmålsmodifikation et bedre udtryk. 8 Effektmodifikation er det fænomen, at en eksponering eller behandling ikke virker ens på alle. Eksempler på faktorer, som kan modificere effekten af eksponeringen: køn arvelige faktorer livsstilsfaktorer Hvis vi kan identificere grupper, som er særligt modtagelige, er det nyttig viden: planlægning af forebyggelse differentieret behandling Eksempel 8-1: Mæslingevaccine En ny mæslingevaccine var forbundet med øget generel dødelighed i forhold til den hidtidige: MRR = 1, (9% CI: 1,0; 1,) Imidlertid var der stor forskel på effekten hos drenge og piger: Drenge: MRR = 0,91 (9% CI: 0,1; 1,) Piger: MRR = 1,8 (9% CI: 1,8;,0) Fundet er interessant, men mekanismen endnu ikke forstået. 9 0
Eksempel: Forskellig sammenhæng mellem højde og lungefunktion hos mænd og kvinder 000. Confounding Eksempel: Lungefunktion og højde (andre data) FVC, ml 000 000 000 FVC, liter FVC, liter 000 10 10 180 190 00 Højde, cm Mænd Kvinder 10 10 10 180 190 00 Højde, cm Mænd Kvinder 10 10 10 180 190 00 Højde, cm 1 Confounding betyder sammenblanding eller forveksling Confounding er en fortolkningsfejl Risiko for confounding: Hvis en anden årsag er associeret med den årsag, vi studerer. Confoundertrekanten : Hypotese Eksponering Udfald Confounder Eksempel: Case-control undersøgelse af alkohol og larynxkræft Alkohol Cases Kontroller Ja 11 0 Nej 19 90 I alt 10 100 OR = 1,9 (1,1; 1,9) Rygere Alkohol Cases Kontroller Ja 11 0 Nej 1 0 I alt 0 0 Ikke-rygere OR = 0,98 (0,; 1,) Alkohol Cases Kontroller Ja 1 110 Nej 0 I alt 0 0 OR = 1,1 (0,1;,0) Forebyggelse af confounding: restriktion En faktor, som er et led i årsagskæden fra eksponering til udfald, er ikke en confounder: Eksponering Faktor Udfald Hvis vi kun ser på sammenhængen mellem alkoholindtagelse og larynxcancer blandt ikkerygere, kan der ikke opstå confounding på grund af rygning. Til gengæld ved vi ikke noget om sammenhængen blandt rygere. F.eks.: Kost S-kolesterol Åreforkalkning
Forebyggelse af confounding: matchning I follow-up-undersøgelser: For hver eksponeret, rygende, 0-årige fraskilte mand kunne man finde en ueksponeret, rygende, 0-årig fraskilt mand til den ueksponerede kontrolgruppe. Det kræver en stor, velkarakteriseret gruppe at trække kontrollerne fra. I case-kontrol-undersøgelser: Man kan ikke studere effekten af det, der er matchet på. Man komplicerer den statistiske analyse (betinget logistisk regression). Forebyggelse af confounding: randomisering I behandlingsforsøg kan man ved lodtrækning fordele patienterne tilfældigt til de behandlinger, hvis effekt skal sammenlignes. Herved sikres en ligelig fordeling af kendte og ukendte confoundere mellem grupperne. Det kan ikke anvendes ved potentielt skadelige eksponeringer. Mere herom næste mandag. 8 Forebyggelse af confounding: Stratificeret analyse Ved restriktion kan man undersøge associationen (alkohol/cancer), dels hos rygere, dels hos ikke-rygere. Er associationen (alkohol/cancer) væsentligt forskellig hos rygere og ikke rygere, er der effektmodifikation. Der må laves to beskrivelser, en for rygere og en for ikkerygere. Er associationerne ikke væsentligt forskellige, beregnes et fornuftigt vægtet gennemsnit. 9 Eksempel: Stratificeret analyse alkohol/larynxkræft. Ujusteret og justeret estimat Ujusteret Rygere Ikke-rygere Justeret, 1 1, Odds ratio 0 Effektmodifikation vs. confounding Ved regressionsanalyse kan man undersøge den samtidige effekt af flere faktorer, f.eks. alkohol, rygning, køn m.m. Eksponering OR 9% CI Alkohol 1,00 0,; 1, Rygning,08,01;, Køn osv. Effektmodifikation er noget virkeligt: Den skal erkendes og beskrives; den kan være værdifuld viden af betydning for differentieret forebyggelse og behandling. Confounding (forveksling af årsager) er en fejltolkning, som man skal søge at undgå. 1