Overlevelsesfunktion. Vi kalder S(t) for overlevelsesfunktionen.

Størrelse: px

Starte visningen fra side:

Download "Overlevelsesfunktion. Vi kalder S(t) for overlevelsesfunktionen."

Christen Carstensen
5 år siden
Visninger:

1 1 Levetidsanalyse Overlevelsesfunktionen Censurering Kaplan-Meier estimatoren Hazard funktionen Proportionale hazards Multipel regression PSE (I17) FSV1 Statistik - 5. lektion 1 / 19

2 Overlevelsesfunktionen Overlevelsesfunktion Vi skal følge en gruppe af patienter over en given tidsperiode, hvor vi for hver patient vil observe om en given begivenhed - fex død - indtræffer, og i givet fald til hvilket tidspunkt. Vi vil snakke om død selv om hændelsen fex kunne være tilbagefald. Lad t betegne et vilkårligt tidspunkt. Vi er da interesseret i S(t): Sandsynligheden for at en tilfældig patient er i live til tid t. Vort starttidspunkt er t = 0, hvor S(0) = 1. Når t vokser bliver S(t) gradvist mindre og nærmer sig nul. Vi kalder S(t) for overlevelsesfunktionen. Vi skal som sædvanligt tænke på S(t) som andelen i en (måske hypotetisk) population, som overlever til tid t. Hvis ingen patienter i vores stikprøve dropper ud af undersøgelsen, så estimeres S(t) naturligt ved den observerede andel af stikprøven, som er i live til tid t. PSE (I17) FSV1 Statistik - 5. lektion 2 / 19

3 Censurering Censurering Hvis en patient dropper ud af undersøgelsen vil vi tale om en censureret observation. Det betyder at vi ud over hændelsestidspunktet også registrerer en Status variabel Status=0, hvis censurering Status=1, hvis død Der kan være mange grunde til censurering: bliver sur på sygeplejersken og melder fra, flytter til den anden ende af landet, dør af anden årsag, osv. De efterfølgende analyser er baseret på en vigtig forudsætning: Censurering og levetid er uafhængige hændelser. Hvis de personer som er disponeret for kort levetid ofte trækker sig fra studiet, så får vi et falsk(biased) billede med for høj overlevelse. PSE (I17) FSV1 Statistik - 5. lektion 3 / 19

4 Kaplan-Meier estimatoren Antag at vi registrerer følgende tidspunkter for hændelser og status. tid(år) status Lad t 1 < t 2 <... < t m betegne de ordnede dødstidspunkter. Aktuelt er m = 5 med tidspunkterne t 1 = 4, t 2 = 8, t 3 = 13, t 4 = 16, t 5 = 19. Til et givet tidspunkt t i, i = 1, 2..., m kan vi bestemme: Risikomængden: De personer som er i live umiddelbart før t i, dvs de er hverken døde eller censureret. Antallet i risikomængden kaldes n i. d i : antal døde til tid t i PSE (I17) FSV1 Statistik - 5. lektion 4 / 19

5 Kaplan-Meier estimatoren Indsat i en tabel bliver disse t i dødstid(år) n i antal under risiko d i antal døde Vores bedste bud på overlevelsen indtil 4 år er Ŝ(t) = 1 når t < 4 år. Til tid 4 år har vi 2 dødsfald ud af 10, dvs vi estimerer overlevelsen til tid 4 år Ŝ(4) = = 0.8. Fra 4 år fastholder vi risikoen Ŝ(t) = 0.8 indtil t = 8 år. På dette tidspunkt er 8 (2 døde) under risiko og 1 dør, dvs chancen for at overleve dette tidspunt er = Vores estimat bliver så Ŝ(8) = Ŝ(4) = 0.7. PSE (I17) FSV1 Statistik - 5. lektion 5 / 19

6 Kaplan-Meier estimatoren Fra 8 år fastholder vi Ŝ(t) = 0.7 indtil t = 13 år. På dette tidspunkt er 5(3 døde, 2 censureret) under risiko og 1 dør, dvs chancen for at overleve dette tidspunt er = 0.8. Vores estimat bliver så Ŝ(13) = 0.8 Ŝ(8) = Fra 13 år fastholder vi Ŝ(t) = 0.56 indtil t = 16 år. På dette tidspunkt er 4(4 døde, 2 censureret) under risiko og 2 dør, dvs chancen for at overleve dette tidspunt er = 0.5. Vores estimat bliver så Ŝ(16) = 0.5 Ŝ(13) = Fra 16 år fastholder vi Ŝ(t) = 0.28 indtil t = 19 år. Herefter er ingen i live, så vi estimerer Ŝ(t) = 0, når t 19 år. PSE (I17) FSV1 Statistik - 5. lektion 6 / 19

7 Vi har data - tid(eksponeringstid) og stat(status: død/levende) på 10 personer. Først fortælles at vi ønsker at udføre levetidsanalyse. Statistics Survival... Setup... Declare data to be survival... PSE (I17) FSV1 Statistik - 5. lektion 7 / 19

8 Stata tilføjer diverse hjælpevariable til vores data. PSE (I17) FSV1 Statistik - 5. lektion 8 / 19

9 Graphics Survival... Kaplan-Meier survivor... PSE (I17) FSV1 Statistik - 5. lektion 9 / 19

10 Overlevelsestabel Statistics Survival... Summary... Life... PSE (I17) FSV1 Statistik - 5. lektion 10 / 19

11 Hazard funktionen Hazard Et alternativ til overlevelsesfunktionen S(t) er hazard funktionen h(t), som er den øjeblikkelige(dvs over MEGET KORT TID) incidensrate. Den tilsvarende kumulerede hazard funktion betegnes H(t) og det kan vises at H(t) = log(s(t)) S(t) = e H(t) Et naturligt estimat for H(t) er Ĥ(t) = d i n i : sum over alle dødstidspunkter før og inklusive t Dette kaldes Nelson-Aalen estimatet for den kumulative hazard. PSE (I17) FSV1 Statistik - 5. lektion 11 / 19

12 Proportionale hazards sammenligning af 2 grupper Vi skal sammenligne dødeligheden i 2 delpopulationer, hvor vi snakker om gruppe 0: baseline. gruppe 1: typisk eksponeret/behandlet, men der kunne fex også være tale om kønssammenligning. H i (t) i = 0, 1, som er kumuleret hazard i gruppe nr. i. Vi skal kigge på modellen som specificerer proportionale hazards H 1 (t) H 0 (t) = konstant Hvis fex konstant = 1.5 betyder det at gruppe 1 har en incidensrate, som hele tiden ligger 50% over baseline. På log-skala får vi relationen log(h 1 (t)) = log(h 0 (t)) + β 1 PSE (I17) FSV1 Statistik - 5. lektion 12 / 19

13 Proportionale hazards Proportionale hazards Når vi indfører x 1 som dummykode for gruppevariablen kan dette skrives hvilket læses loghaz(t) = log(h 0 (t)) + β 1 x 1 For gruppe0(x 1 = 0) er loghaz(t) = log(h 0 (t)) For gruppe1(x 1 = 1) er loghaz(t) = log(h 0 (t)) + β 1 dvs β 1 er ændringen i logaritmen til hazard, når vi går fra baseline til gruppe1. Hvis vi transformerer tilbage til kumuleret hazard H 1 (t) = e β 1 H 0 (t) hvilket betyder af hvis elsempelvis e β 1 = 2, så har gruppe1 altid en incidensrate, som er dobbelt så høj som baseline. PSE (I17) FSV1 Statistik - 5. lektion 13 / 19

14 Vi skal kigge på et studie af patienter med primær biliær cirrose. Studiet er nærmere beskrevet i bogen. Vi skal fokusere på overlevelse ift Central cholestasis at entry, der PSE (I17) FSV1 Statistik - 5. lektion 14 / 19

15 Vi starter med at plotte de 2 kumulerede hazards stratificeret efter Central Cholestasis... Graphics Survival... Nelson... PSE (I17) FSV1 Statistik - 5. lektion 15 / 19

Vi skal lægge vægt på det midterste stykke(1-4 år), hvor vi har information. Her ser det ud til at forholdet mellem de to hazards er nogenlunde konstant over 2 (eller omvendt under 0.

16 Vi skal lægge vægt på det midterste stykke(1-4 år), hvor vi har information. Her ser det ud til at forholdet mellem de to hazards er nogenlunde konstant over 2 (eller omvendt under 0.5), hvilket er forudsætningen i vores model. Hvis de 2 kurver krydser hinanden:stop!!!! Så er det meningsløst at snakke om at hazard til enhver tid altid er fex dobbelt så stort i den ene gruppe forholdsmæssigt til den anden gruppe. PSE (I17) FSV1 Statistik - 5. lektion 16 / 19

17 Statistics Survival... Regression... Cox... Under Model-fanen: cenc0 skal være under Independent variables:. Under Reporting-fanen: Vælg Report coefficients,... PSE (I17) FSV1 Statistik - 5. lektion 17 / 19

18 Cox regressionen giver estimatet ˆβ 1 = 1.32 for forskellen β 1 mellem de 2 log hazard kurver. Denne er meget signifikant positiv med en pværdi under Estimatet for hazardratio e β 1 = viser at dødeligheden er næsten 4 gange højere i eksponeringsgruppen end i baseline. Konfidensinterval for hazardratio: e = 2.3 til e = 6.1. Vi er mao sikre på at incidensraten er mere end 2 gange højere i eksponeringsgruppen end i baseline. PSE (I17) FSV1 Statistik - 5. lektion 18 / 19

19 Multipel regression Multiple eksponeringsvariable Ift det aktuelle eksempel er der flere prediktorer for dødsintensiteten. Lad os vælge 3 af disse som kaldes x 1, x 2, x 3. Enten er de dummykodet(fex køn) eller interval(fex alder). I lighed med tidligere skal vi lave en model for effekt af prediktorerne - denne gang på log hazard skala ift baseline: loghaz(t) = log(h 0 (t)) + β 1 x 1 + β 2 x 2 + β 3 x 3 + β 4 x 1 x 2 Aktuelt kunne vi fex have x 1 : Dummy for cenc0. x 2 : Dummy for behandling(treat) x 3 : logb0, som er logaritmen til bilirubin koncentrationen ved studiets start. x 1 x 2 : Effekten af behandling modificeres af cenc0. I skal arbejde videre med datasættet til øvelserne. PSE (I17) FSV1 Statistik - 5. lektion 19 / 19

Relaterede dokumenter

Krydstabeller Forventede under nulhypotesen Ki-kvadrat test Residualanalyse Eksakt test

1 Kontingenstabeller Krydstabeller Forventede under nulhypotesen Ki-kvadrat test Residualanalyse Eksakt test 2 Logaritme- og eksponentialfunktion 3 Logistisk regression Sammenligning af odds for 2 grupper