Evaluering af det norske mammografiprogram Dødelighed af brystkræft Niels Keiding Biostatistisk Afdeling Københavns Universitet Norges Forskningsråd Lysaker, 7. september 2015
Opgaven Sammenlign dødeligheden af brystkræft for kvinder som har fået tilbudt screening* med den dødelighed af brystkræft for de samme kvinder, som ville gælde, hvis de ikke havde fået tilbudt screening Mere specifikt: er der en reduktion på 30%? Dødelighed af brystkræft for kvinder i alder a: antal dødsfald pga. brystkræft i et år for kvinder i alder a antal leveår for kvinder i alder a *Inden diagnosen
Studier indenfor evalueringen: kohortestudier Breast cancer mortality in Norway after the introduction of mammography screening. Olsen AH, Lynge E, Njor SH, Kumle M, Waaseth M, Braaten T, Lund E. Int J Cancer. 2013 Jan 1;132(1):208-14. Modern mammography screening and breast cancer mortality: population study. Weedon-Fekjær H, Romundstad PR, Vatten LJ. BMJ. 2014 Jun 17;348:g3701. Research-based evaluation of the Norwegian mammography screening programme; effectiveness, side-effects and cost-effectiveness van Luijt PA, Heijnsdijk EAM, de Koning HJ Final project report to the Research Council of Norway, 2014 Supplerende undersøgelse af mammografi udenfor programmet Mammography activity in Norway 1983 to 2008. Lynge E, Braaten T, Njor SH, Olsen AH, Kumle M, Waaseth M, Lund E. Acta Oncol. 2011 Oct;50(7):1062-7.
Studier udenfor evalueringen Kohortestudier fra Kreftregisteret Breast Cancer Mortality in Participants of the Norwegian Breast Cancer Screening Program Hofvind S, Ursin G, Tretli S, Sebuødegård S, Møller B Cancer 2013;119:3106-12 Effect of Screening Mammography on Breast-Cancer Mortality in Norway Kalager M, Zelen M, Langmark F, Adami HO N Engl J Med 2010;363:1203-10
Studier udenfor evalueringen: Trend-studier Breast cancer mortality in neighbouring European countries with different levels of screening but similar access to treatment: trend analysis of WHO mortality database. Autier P, Boniol M, Gavin A, Vatten LJ. BMJ. 2011 Jul 28;343:d4411 Disparities in breast cancer mortality trends between 30 European countries: retrospective trend analysis of WHO mortality database Autier P, Boniol M, La Vecchia C, Vatten L, Gavin A, Héry C, Heanue M BMJ. 2010 Aug 11;341:c3620 Changes in breast cancer incidence and mortality in middle-aged and elderly women in 28 countries with Caucasian majority populations. Ann Oncol 2008;19:1009-18. Héry C, Ferlay J, Boniol M, Autier P. Quantification of changes in breast cancer incidence and mortality since 1990 in 35 countries with Caucasian-majority populations. Héry C, Ferlay J, Boniol M, Autier P. Ann Oncol. 2008 Jun;19(6):1187-94.
Dobbeltkvotientmetoden Olsen et al., Kalager et al. Udnyt den gradvise introduktion af mammografiprogrammet. Sammenlign Dødelighed i screeningsfylke / dødelighed i kontrolfylke med Historisk dødelighed i screeningsfylke /Historisk dødelighed i kontrolfylke Altså dobbeltkvotient af dødsrater: (død scree. / død kontrol) / (historisk død scree. / historisk død kontrol) Udviklet af Lynge og Olsen i Danmark, svarer til veletableret dif-dif-metode i økonometri. Forudsætter ingen interaktion mellem tidsmæssige og regionale forskelle.
Breast cancer mortality in Norway after the introduction of mammography screening. Olsen AH, Lynge E, Njor SH, Kumle M, Waaseth M, Braaten T, Lund E. Int J Cancer. 2013 Jan 1;132(1):208-14. Sammenligner brystkræft-dødelighed i pilot-fylkerne (Oslo, Akershus, Rogaland, Hordaland) med kontrol-fylker (Oppland, Hedmark, Vestfold, Møre og Romsdal, Sogn og Fjordane). To forskellige valg af incidens- og follow-up perioder giver rate ratios 0.93 og 0.89, dvs. at screeningstilbudet nedsætter brystkræft-dødeligheden med 7% henholdsvis 11%. Disse reduktioner er ikke statistisk signifikante; 95% konfidensintervaller er (- 12%, 23%) henholdsvis (- 12%, 29%).
Olsen et al. (2013): Styrker Individbaseret (dog er tidspunkt for første screeningsinvitation kun tilgængeligt på kommuneniveau). Kontrol for geografi og tids-trends via dobbeltkvotientmetoden.
Olsen et al. (2013): Svagheder Kort follow-up. Tvivl om incidens- og follow-up perioder. Mulig fortynding fra vild-screening (mammografi udenfor programmet). Forudsætningen om ingen interaktion mellem tidsmæssige og regionale forskelle er tvivlsom, da pilot-fylkerne var de mest urbaniserede og veludviklede, og havde større forbrug af hormonbehandling (som dels selv er brystkræft-risikofaktor, dels medfører rekommandation om mammografi). En eventuel effekt af selve screeningen kan vanskeligt skelnes fra effekten af de flerfaglige teams i de brystdiagnostiske centre etableret i forbindelse med mammografiprogrammet.
Effect of Screening Mammography on Breast-Cancer Mortality in Norway Kalager M, Zelen M, Langmark F, Adami HO N Engl J Med 2010;363:1203-10 Dobbeltkvotientmetoden. Inddrager alle fylker som studiefylker eller kontrolfylker afhængigt af om screeningsprogrammet er startet. Studieperiode 1996-2005, kontrolperiode 1986-1995. Resultat: brystkræftdødeligheden i screeningsfylkerne, korrigeret for historiske trends, er 10% lavere end i kontrolfylkerne. Dette er ikke statistisk signifikant, 95% konf.iv. (- 4%, 24%).
Kalager et al. (2010): Styrker Landsdækkende Individbaseret (dog er screenings-start kun på fylkeniveau, hvilket medfører en del fejlklassifikation) Kontrol for tidstrends ved dobbeltkvotientmetoden
Kalager et al. (2010): Svagheder For kort follow-up. Middel-follow-up for kvinder med brystkræft 2.2 år (mediantid til død for nydiagnosticerede brystkræftpatienter uden screning 5.5 år) Problematisk håndtering af dødsfald i aldersgruppe 70-84 år (tæller ikke med i screeningseffekt-vurderingen, men kun i trend-vurderingen) Mulig fortynding fra vild-screening (mammografi udenfor programmet, anses ikke af forfatterne at være væsentligt problem). Forudsætningen om ingen interaktion mellem tidsmæssige og regionale forskelle er tvivlsom, da pilot-fylkerne var de mest urbaniserede og veludviklede, og havde større forbrug af hormonbehandling (som dels selv er brystkræft-risikofaktor, dels medfører rekommandation om mammografi). En eventuel effekt af selve screeningen kan vanskeligt skelnes fra effekten af de flerfaglige teams i de brystdiagnostiske centre etableret i forbindelse med mammografiprogrammet.
Modern mammography screening and breast cancer mortality: population study. Weedon-Fekjær H, Romundstad PR, Vatten LJ. BMJ. 2014 Jun 17;348:g3701. Udvikler en original analysemetode som går direkte til den stillede opgave: Sammenlign dødeligheden af brystkræft for kvinder som har fået tilbudt screening med den dødelighed af brystkræft for de samme kvinder, som ville gælde, hvis de ikke havde fået tilbudt screening. Brystkræftdødsfald efter introduktion af screening opdeles i dem, der svarer til diagnoser før screening og dem, der svarer til diagnoser efter screeningsprogrammet startede. Dette opnås ved at beregne Den forventede andel af brystkræftdødsfald som skyldes diagnoser efter screening, forudsat screeningstilbuddet ikke ændrer brystkræftdødeligheden og sammenligne med den faktisk observerede dødelighed.
Weedon-Fekjær et al. (2014): resultat Relativ reduktion i brystkræftdødelighed efter tilbud om screening: 28% 95% konf.iv. (21%, 36%) altså klart statistisk signifikant. Absolut gevinst udtrykkes ved number needed to invite dvs. antal kvinder som skal inviteres for at forebygge 1 brystkræftdødsfald som 368 95% konf.iv. (266,508).
Weedon-Fekjær et al. (2014): Styrker Original direkte metode, som er grundigt valideret og dokumenteret Individbaseret Udnytter alle data, herunder lang follow-up Analysemodellen var detaljeret udarbejdet og deponeret hos Norges Forskningsråd inden forfatterne fik adgang til data Weedon-Fekjær et al. (2014): Svagheder Mulig fortynding fra vild-screening (mammografi udenfor programmet, anses ikke af forfatterne at være væsentligt problem). En eventuel effekt af selve screeningen kan vanskeligt skelnes fra effekten af de flerfaglige teams i de brystdiagnostiske centre etableret i forbindelse med mammografiprogrammet.
Breast Cancer Mortality in Participants of the Norwegian Breast Cancer Screening Program Hofvind S, Ursin G, Tretli S, Sebuødegård S, Møller B Cancer 2013;119:3106-12 Blandt alle inviterede til screening sammenlignes brystkræftdødeligheden mellem deltagere og ikke-deltagere. Efter korrektion for alder, kalendertid og follow-up-længde blev deltagernes brystkræftdødelighed estimeret til 39% af ikke-deltagernes, eller med andre ord: en reduktion af dødeligheden med 61%. En betydelig selv-selektion af raske deltagere kan forventes, og en korrektionsfaktor blev beregnet ud fra erfaringer i de svenske randomiserede undersøgelser af mammografiscreening i 1980 erne. Herefter beregnedes reduktionen i deltagernes dødelighed til af ikke-deltagernes. 43% ; 95% konf.iv. (36%, 49%)
Hofvind et al. (2013): Styrker Individbaseret med detaljeret konfounderkontrol Lang follow-up Hofvind et al. (2013): Svagheder Tvivlsomt om korrektionen for selv-selektion er adækvat. Fx er mange ting ændret siden 1980erne (såsom hormonterapi) Mange af deltagerne oplyste, at de var blevet mammograferet kort inden studiestart, hvilket kan have påvirket resultatet i flere retninger
Research-based evaluation of the Norwegian mammography screening programme; effectiveness, side-effects and cost-effectiveness van Luijt PA, Heijnsdijk EAM, de Koning HJ Final project report to the Research Council of Norway, 2014 Modelstudie baseret på mikrosimuleringsmodellen MISCAN udviklet i Nederland i 1980erne med fokus på helseøkonomiske beregninger. På vej til disse estimeredes effekt af screening på brystkræftdødeligheden. Forskellige input af norske data blev benyttet, men ikke fylke-specifikke data. Tre forskellige modeller blev forsøgt, men for at opnå nogenlunde overensstemmelse med det observerede incidens-forløb måtte der gøres ganske grove antagelser såsom en særlig ikke nærmere forklaret Norgefaktor som forøgede incidensen med 75% i 1997-2006. Vild-screening blev forsøgt inddraget i modelkørslerne. Afhængig af modelforudsætningerne estimeredes reduktion i brystkræftdødelighed på op til 25-30%.
van Luijt et al. (2014): Diskussion For at få modellerne til at passe til de observerede incidensforløb, måtte der gøres voldsomme antagelser, der ikke kan verificeres. Det drejer sig dels om særlige Norge-risikofaktorer, dels om fordelingen af lead times (tiden fra en tumor opdages ved screening til den bliver klinisk manifest).
Autier et al.: Trend-studier Breast cancer mortality in neighbouring European countries with different levels of screening but similar access to treatment: trend analysis of WHO mortality database. Autier P, Boniol M, Gavin A, Vatten LJ. BMJ. 2011 Jul 28;343:d4411 Disparities in breast cancer mortality trends between 30 European countries: retrospective trend analysis of WHO mortality database Autier P, Boniol M, La Vecchia C, Vatten L, Gavin A, Héry C, Heanue M BMJ. 2010 Aug 11;341:c3620 Changes in breast cancer incidence and mortality in middle-aged and elderly women in 28 countries with Caucasian majority populations. Ann Oncol 2008;19:1009-18. Héry C, Ferlay J, Boniol M, Autier P. Quantification of changes in breast cancer incidence and mortality since 1990 in 35 countries with Caucasian-majority populations. Héry C, Ferlay J, Boniol M, Autier P. Ann Oncol. 2008 Jun;19(6):1187-94.
Autier et al.: Trend-studier: Resultater Disse deskriptive økologiske studier fokuserer på generelle trends i brystkræftincidenser uden at gå ind i mammografiprogrammets betydning for disse tendenser. Analyserne baseres ikke på individdata, men på nationale optællinger, og er dårligt egnede til at vurdere effekten af screeningstilbuddet.
Supplerende undersøgelse af omfanget af mammografi udenfor programmet Mammography activity in Norway 1983 to 2008. Lynge E, Braaten T, Njor SH, Olsen AH, Kumle M, Waaseth M, Lund E. Acta Oncol. 2011 Oct;50(7):1062-7. Dette studie ligger formelt inden for rammerne af evalueringen. Det forsøger at kvantificere omfanget af vild-screening, altså mammografiscreening udenfor programmet. Datakilderne er dels summariske årlige opgørelser fra Statens Strålevern, dels spørgeskemabesvarelser (1996, 1997-98, 2002) fra NOrwegian Women And Cancer (NOWAC)-studiet med ca. 120 000 deltagere, hvoraf 70% oplyste om mulige tidligere mammografier. Disse sidste oplysninger kunne opdeles på fylker. Forfatterne beregner, at hvis det organiserede screeningstilbud nedsætter brystkræftdødeligheden med 25%, og hvis mammografi udenfor programmet er ligeså effektiv som indenfor programmet, så ville effekten tilsyneladende kun være 11%.
Der er to problemer med disse data: Lynge et al. (2011): Kritik Det er ikke klart, hvor mange af mammogrammerne udenfor programmet som kan anses for at erstatte program-screening NOWAC-deltagernes angivelser af tidligere mammografi må anses som et usikkert estimat Disse vanskeligheder betyder, at den foretagne modelberegning må anses for ganske usikker.
Opgaven var: Konklusion Sammenlign dødeligheden af brystkræft for kvinder, som har fået tilbudt screening, med den dødelighed af brystkræft for de samme kvinder, som ville gælde, hvis de ikke havde fået tilbudt screening. De mest pålidelige resultater fås af studier med individuel information, som sammenligner kvinder som har fået tilbudt screening med kvinder, som ikke har fået tilbudt screening. Omfanget af vild-screening er vanskeligt at vurdere, og dens betydning kan være forskellig i de forskellige studier. Nogle studier belastes af forventelige sociale og helsetjeneste-forskelle mellem studie- og kontrol-fylker. Disse kriterier fører til nærmere vurdering af følgende fire studier Olsen et al. (2013); Kalager et al. (2010); Weedon-Fekjær et al. (2014); van Luijt et al. (2014).
Konklusion (fortsat) De fire udvalgte studier har følgende skøn over den procentvise reduktion i brystkræftdødeligheden for kvinder, som har fået tilbudt screening: Olsen et al. (2013): 7% Kalager et al. (2010): 10% Weedon-Fekjær et al. (2014): 28% van Luijt et al. (2014): 15%-30%. Estimaterne af van Luijt et al. bygger på antagelser om ukendte risikofaktorer og ikke verificerbare lead times, og vi er betænkelige ved dem. Studierne af Olsen et al. og Kalager et al. har ikke individbaserede starttidspunkter og har så kort follow-up, at effekten af screening ikke har nået at slå igennem. De er desuden sandsynligvis særligt udsatte for effekt af forskelle mellem studiefylker og kontrolfylker.
Konklusion (fortsat) Studiet af Weedon-Fekjær et al. omfatter de fleste eksisterende data, har individbaserede oplysninger om dato for invitation til screeningsprogrammet, har længere follow-up end de andre studier og har meget detaljerede sensitivitetsanalyser af den anvendte statistiske teknik. Dette studie anser vi for det mest pålidelige. Vores konklusion er derfor: Implementeringen af det norske mammografiprogram nedsætter brystkræftdødeligheden med mellem 20% og 30% for kvinder i aldrene 50-79 år. Programmet giver således resultater svarende til de fleste oversigter over de internationale randomiserede trials af brystkræftscreening.
Summary table of the identified publications and research reports on mortality following NBCSP implementation Study Design Exposure Outcome Population Period Age group Adjustments In evaluation portfolio Effect measure Estimate Olsen et al [105] Cohort/ Dif-dif 1 NBCSP implementation (municipality) Incidence based breast cancer mortality Pilot counties vs latest counties 1990-2008 50 Age, period, region Rate ratio 0.93 (95% CI 0.77-1.12 ) Weedon-Fekjær et al [120] Open cohort Screening invitation (individual) Incidence based breast cancer mortality Nation-wide 1986-2009 50-79 Age, period, cohort, county Rate ratio 0.72 (95% CI 0.64-0.79) van Luijt et al Simulation study Screening invitation (individual, simulated) Incidence based breast cancer mortality 10 million women simulated 1970-2009 2005-2055 50 Not relevant Reduction in % 25-30 13-16 Not in evaluation portfolio Kalager et al [119] Hofvind et al [122] Autier et al [125] Autier et al [124] Héry et al [126] Héry et al [123] Open cohort/ Dif-dif 1 Cohort Ecologic trend Ecologic trend Ecologic trend Ecologic trend NBCSP implementation (county) Screening attendance (individual) NBCSP implementation (national) Incidence based breast cancer mortality Incidence based breast cancer mortality Nation-wide 1986-2005 50-69 Period, region Nation-wide 1996-2010 50 Breast cancer mortality Nation-wide 1980-2006 Calendar year Breast cancer mortality Nation-wide 1980-2006 Calendar year Breast cancer mortality Nation-wide 1960-2003 Calendar year Breast cancer mortality Nation-wide 1990-2002 All ages, 40-49, 50-69, 70-79 All ages, <50, 50-69, 70 50-69, 70 35-49, 50-69, 70 Age, period, self-selection, county - - - - Rate ratio difference 10 (95% CI -4-24) Rate ratio 0.57 (95% CI 0.51-0.64) TPC 2, APC 3, join-point TPC, APC, join-point TPC, APC, join-point TPC, APC, join-point - - - - 1 Dif-dif design: A design where the effect measure is a double ratio of rates 2 TPC: Total percent change, 3 APC: Annual percent change