Faculty of Health Sciences. Miscellaneous: Styrkeberegninger Overlevelsesanalyse Analyse af matchede studier

Transkript

1 Faculty of Health Sciences Miscellaneous: Styrkeberegninger Overlevelsesanalyse Analyse af matchede studier

2 Forsøgsplanlægning Sammenligning af to grupper : Hvor mange personer skal vi bruge? Det kommer an på hvor store effekter man leder efter hvor sikker man vil være på at finde dem 2 / 32

3 Hypoteseprøvning Et test af en hypotese H 0 kan give to typer af fejl: Type I: Forkaste nulhypotesen selvom den er sand. Type II: Acceptere nulhypotesen selvom den er falsk. Sandsynlighed for type I fejl: α = signifikansniveau. Sandsynligheden for type II fejl: β. 1 β = styrke. Virkelighed Konklusion Hypotese sand Hypotese falsk Accept Korrekt konklusion Type II fejl 1 α β Afvis Type I fejl Korrekt konklusion α 1 β 3 / 32

4 Sammenligning af to grupper Bestemmer antal individer n i hver gruppe. Binær respons: Fastsæt p 1, p 2, α og β. Sæt = p 1 p 2. n = p 1(1 p 1 ) + p 2 (1 p 2 ) 2 f (α, β) Kvantitativ respons: Fastsæt µ 1, µ 2, SD, α og β. Sæt = µ 1 µ 2. n = 2 SD2 f (α, β) 2 Bemærk at vi kan nøjes med at fastsætte isf. µ 1 og µ 2. 4 / 32

5 Hvad bestemmer stikprøvestørrelsen? Ud over signifikansniveauet (α) og styrken (1 β) afhænger den nødvendige stikprøvestørrelse af forskellen mellem grupper ( ) : jo større forskel, jo mindre er det nødvendige antal observationer variationen (SD) : jo større variation, jo større er det nødvendige antal observationer 5 / 32

6 En nyttig tabel Funktionen f (α, β) er en sum af fraktiler, f (α, β) = (z 1 α/2 + z 1 β ) 2 hvor z p er fraktilerne i en normalfordeling, e.g. z = 1.96 etc. Nyttige værdier: β α / 32

7 Eksempel Antag vi vil finde en forskel i blodtryk på 10 ( = 10) for kvinder randomiseret til placebo / behandling. Vi vil være 90% sikre på at finde forskellen (1 β = 0.90) når vi tester på et 5% s-niveau (α = 0.05). I Framingham data er spredningen på SBP lig 25 (SD=25). Indsæt i formel n = 2 f (0.05, 0.10) ( = )2 Det vil sige at vi skal bruge kvinder i hver gruppe. 7 / 32

8 Styrkeberegninger i SAS I SAS kan styrkeberegninger udføres vha. proc power. Sammenligning af to grupper med binær respons: proc power; twosamplefreq test=pchi groupproportions= alpha=0.05 power=0.9 npergroup=.; run; Sammenligning af to grupper med kvantitativ respons: proc power; twosamplemeans test=diff meandiff=10 stddev=25 alpha=0.05 power=0.9 npergroup=.; run; proc power er meget fleksibel idet proceduren også kan benyttes til regressionsanalyse, levetidsdata, tillader forskellige gruppestørrelser,... 8 / 32

9 Grupper af forskellig størrelse Hvis grupperne ikke skal have samme størrelse kan det totale antal bestemmes ved følgende fremgangsmåde: 1) beregn først N = 2n som hvis grupperne skulle være lige store 2) beregn dernæst k = n 1 /n 2 som forholdet mellem gruppestørrelserne 3) beregn endelig det totale antal observationer som N = N (1+k)2 4k. Eksempel: Hvis, i eksemplet ovenfor, vi vil have gruppe 1 dobbelt så stor som gruppe 2: 9 / 32 1) N = = 264 2) k = 2 3) N = N (1+k)2 4k = = 297, dvs. n 1 = 198 og n 2 = 99.

10 Levetidsdata Responsvariablen er en levetid, dvs. tid til en hændelse indtræffer Tid fra exposure til sygdom Tid fra start behandling til recidiv (eller død) Tid fra tandfyldning til fyldningen falder ud Levetidsdata er specielt ved at være skævt mod højre ufuldstændigt observeret: Censurering 10 / 32

11 Censurering Højre censurering hvor kun den nedre grænse for levetiden er kendt er hyppigst forekommende pga at : - studietiden udløber - individet udgår af studiet (loss to follow up) 0 Slut studie Standardmetoder for kvantitative data kan derfor ikke benyttes. I stedet fokuserer man på overlevelsesfunktionen Prob(Survival Time > t) som estimeres ved den ikke-parametriske Kaplan-Meier-estimator. 11 / 32

12 Remissionstid for patienter med akut leukæmi 42 patienter med akut leukæmi i randomiseret til: 1) Behandling: 21 patienter, 9 tilbagefald: Tid (uger) 2) Placebo: 21 patienter, 21 tilbagefald: Tid (uger) 12 / 32

13 Datasættet Første 7 observationer: log Obs time event female WBC treatment Responsen består af tid (time) og en event-indikator (event) (0/1). 13 / 32

14 Kaplan-Meier overlevelseskurver Placebo Treatment Time (weeks) 14 / 32

15 Ikke-parametrisk overlevelsesanalyse i SAS Kaplan-Meier-estimatoren og log-rank-testet findes vha. proc lifetest: proc lifetest data=remission; time weeks*event(0); strata placebo; run; 15 / 32

16 Hazardfunktionen Hazardfunktionen (eller hazard raten / intensitet): λ(t) P(t T < t + h T t) h hvor sandsynligheden i tælleren læses: Den betingede sandsynlighed for at dø i det næste lille tidsinterval (t + h) givet i live ved begyndelsen af intervallet (t). 0 t t + h Hazardfunktion giver en lokal beskrivelse af risikoen for død. 16 / 32

17 Cox-modellen Cox modellen specificerer hazarden for individ i ved λ i (t) = λ 0 (t) exp(b treatment i ) hvor treatment = 0/1 er indikator for behandling. Dvs modellen er λ i (t) = { λ0 (t) exp(b) i fik behandling λ 0 (t) i fik placebo Hazard ratio for behandling vs placebo HR = λ 0(t) exp(b) λ 0 (t) = exp(b) 17 / 32

18 Eksempel på hazardkurve og HR er Børn med Akut Lymfoblastær Leukæmi i vedligeholdelsesbehandling diagnosticeret (Schmiegelow et al., JCO 2003). Hazard for intermediær risikogruppe, tid til recidiv: hazard rate HR=2 HR=0.5 HR=3 Baseline hazard / 32 Years since cessation of therapy

19 Den multiple Cox regressions model Vi kan inkludere kategoriske forklarende variable (køn) kvantitative forklarende variable (logwbc) og teste for linearitet ved kvadratledstest interaktioner i den multiple Cox model λ i (t) = λ 0 (t) exp(b treatment i + c logwbc i + d female i ). og får justeret HR for behandlingseffekten HR = λ 0(t) exp(b + c logwbc + d) λ 0 (t) exp(c logwbc + d) = exp(b) hvis vi sammenligner to kvinder med samme WBC, den ene behandlet, den anden placebo. 19 / 32

20 Matchning Matchning er en design metode til at justere for confounding og / eller øge efficiens. Eksempel: BCG vaccine og leprosy (spedalskhed). Eksponeringen (vaccine) bedømt ved tilstedeværelse af ar. BCG Leprosy Rask population Ar Intet ar OR = 0.48 (0.37, 0.61) 20 / 32

21 Reduktion af antal kontroller Vi udvælger 1040 (4 260) tilfældige kontroller blandt den raske population: BCG Leprosy Kontrol Ar Intet ar OR = 0.52 (0.40, 0.69) Bemærk at præcisionen ikke bliver væsentligt dårligere af at vi reducerer antalet af kontroller. 21 / 32

22 Stratificering på alder Rask Odds Leprosy population ratio BCG + + estimat Alder Total OR MH = 0.59 (0.45, 0.77) 22 / 32

23 Aldersstratifikation med reduceret antal kontroller Leprosy Kontrol BCG + + Alder OR MH = 0.60 (0.44, 0.81) Her er nogle af kontrollerne spildte : Der er langt flere kontroller per case for de yngste. 23 / 32

24 Matchning på alder Ved at matche på alder bliver aldersfordelingen identisk for cases og kontroller. Her er valgt 4 kontroller per case fra samme aldersgruppe: Cases Controls BCG + + Age OR MH = 0.57 (0.42, 0.77). Bemærk at konfidensintervallet er (lidt) smallere idet (frekvens) matchningen bruger kontrollerne mere effektivt. 24 / 32

25 Logistisk regression I det oprindelige studie fås forskelle i log-odds: OR= exp( 0.547) = Parameter Estimate SE Intercept Age Age Age Age Age Age BCG / 32

26 Logistic regression i matchede data Her får man Parameter Estimate SE Intercept Age Age Age Age Age Age BCG OR= exp( 0.572) = NB: Besynderlig alderseffekt! Det skyldes at vi ikke kan estimere alderseffekten når vi har matchet på alder (aldersfordelingen er den samme hos cases og kontroller). 26 / 32

27 Justering for match-variablen Hvorfor ikke udelade alder helt af analysen? Cases Controls Odds Stratum + + ratio Total Justér ALTID for alder i en case-kontrol analyse i et alders-matched design. Ved at ignorere match-variablen opnås en bias mod / 32

28 Individuel matchning Hver kontrol (eller flere kontroller) matches til en specifik case. Eksempler: familie, skole, naboområde, kalenderår,... Det simpleste tilfælde opnås ved 1:1 matchning (matched pairs). Eksempel fra McNeil (p. 238): Cases: 223 kvinder med for tidlig fødsel Kontroller: 223 kvinder med fuldbåren fødsel på det samme hospital i Thailand i samme perode ( ), matched på alder og paritet. Eksponering: Overvejende arbejdsform i løbet af første trimester (stående vs ikke-stående). 28 / 32

29 Data For disse data er der fire mulige kombinationer for hvert par Kontrol Case stående ikke-stående Stående Ikke-stående 14 1 NB: Tabellen består af 223 par og ikke af 446 kvinder. 29 / 32

30 De fire muligheder for hvert par Konkordante par (strata) Case Control Case Control +Exp Exp Diskordante par (strata) Case Control Case Control +Exp Exp / 32

31 Analyse af matched case-kontrol studier I en Mantel-Haenszel-analyse stratificeret på par bidrager kun de diskordante par: MH-test bliver OR MH = = 2.21, 1 SE(ln(OR MH )) = X 2 MH = (31 14) = 6.42, P = og er også kendt som McNemar s test. Almindelig (unconditional) logistisk regression kan ikke benyttes for individuelt matchede case-control-studier. I stedet skal man benytte betinget (conditional) logistisk 31 / 32 regression.

32 Fordele og ulemper ved matchning Fordele intuitivt simpelt vi kan klare os med færre individer Ulemper vi kan ikke estimere effekten af match-variablene komplicerer analysen - der skal justeres for matchvariablene risiko for over-matchning hvis eksponering er stærkt relateret til en matchvariabel (e.g. matchning på familie i ernæringsmæssig epidemiologi). 32 / 32