Øvelse 7: Aktuar-tabeller, Kaplan-Meier kurver og log-rank test Formålet med øvelsen er at analysere risikoen for død forbundet med forskelligt alkoholforbrug. I denne øvelse skal analyserne foretages dels ved hjælp af såkaldte aktuarmetoder (Life tables) og dels ved hjælp af Kaplan-Meiers estimator af overlevelses-funktionen. For at gennemføre disse analyser skal I benytte nogle dele af SPSS, som I ikke tidligere har arbejdet med. De sidste sider af denne øvelse indeholder derfor en brugervejledning til disse dele. Filen HCPB1, der downlades fra hjemmesiden, indeholder oplysninger om 16.397 mænd og kvinder i alderen 50-93 år, der enten er blevet undersøgt i Østerbroundersøgelsen, Glostrupundersøgelserne eller Copenhagen Male Study. Alle personer er blevet fulgt i CPR-registret fra den første undersøgelse og indtil død, afgang fra CPR-registret af anden årsag, eller indtil den 31.12.1993. Materialet indeholder følgende variable: ALDER KON ALKO RYGER SKOLE KOHORTE STATUS TID - målt i hele år på det tidspunkt, hvor undersøgelsen startede. - køn kodet med 0 = kvinde og 1 = mand - alkoholforbrug (genstande/uge) i syv ordinale kategorier - angivet i fem ordinale kategorier - almen skoleuddannelse i tre niveauer (1 = <8 år, 2 = 8-11 år, 3= 12+ år) - angiver hvilken undersøgelse personen har deltaget i - angiver om personen var død (1) eller i live (0) på det tidspunkt, hvor der sidste gang er oplysninger om personen - angiver follow-up tiden målt i år (som decimaltal) Der opgaver, der skal løses er følgende: 0) Husk databeskrivelsen. Det er bl.a. vigtigt at vide noget om den maksimale follow-up tid og at vide, præcis hvordan variablene er kodet. 1) Lav et par aktuar-tabeller ( life tables ) med tilhørende plots af overlevelseskurven, (Analyze /Survival /Life Tables TID), der viser risikoen for at dø i forskellige tidsintervaller for hele HCPB-materialet. Prøv med flere forskellige tidsintervaller, så I kan se den betydning, som størrelsen af tidsintervallerne har for resultaterne. Det er 1
vigtigt, at I bruger noget tid på at studere indholdet af tabellen, så I er fuldstændig sikre på, hvad det er, der bliver beregnet. I skal f.eks. kunne svare på Hvor mange personer er der tilbage i undersøgelsen efter 10 år? Hvor mange personer bliver censureret mellem det 10. og 11. år? Hvor mange person-perioder er derfor i risiko? Hvor mange dødsfald registreres der mellem det 10. og 11. år? Hvad er risikoen for at dø mellem det 10. og 11. år, hvis man var i live efter 10 år? Hvor stor en andel af dem, der var i live efter 10 år overlever det næste år? Hvor stor en andel af den samlede population overlever 10 år? Hvor stor en andel af den samlede population overlever 11 år? 2) Lav aktuar-tabeller og overlevelseskurver for mænd og kvinder hver for sig og sammenlign risikoen i de to grupper (Placer variablen KON i Factor feltet). 3) Undersøg hvorledes risikoen for død afhænger af alkoholforbruget ved hjælp af aktuartabeller og overlevelseskurver. (Placer variablen ALKO i Factor feltet). 4) Undersøg hvorledes risikoen for død afhænger af alkoholforbruget for mænd og kvinder hver for sig. (Placer variablen KON i By factor feltet) 5) Undersøg hvorledes risikoen for død afhænger af alkoholforbruget for mænd over og under 65 år og for kvinder over og under 65 år hver for sig. (Udover at have ALKO som factor og KON som By Factor er I nødt til at beregne en dikotomiseret alders variabel og bruge Split file med denne variabel.) Ovenstående fire opgaver skal herefter løses ved hjælp af Kaplan-Meier kurver og log-rank tests: 6) Beskriv dødeligheden i hele materialet ved hjælp af Kaplan-Meier kurver og sammenlign kurverne med de kurver, der blev plottet i pkt. 1). 7) Beskriv dødeligheden blandt mænd og kvinder ved hjælp af Kaplan-Meier kurver og undersøg ved hjælp af et log-rank test, om der er signifikant forskel på dødeligheden i de to grupper. 2
8) Beskriv, hvorledes dødeligheden afhænger af alkoholforbruget ved hjælp af Kaplan-Meier kurver og undersøg ved hjælp af et log-rank test, om der er signifikant forskel på dødeligheden i de to grupper. Hvis forskellen er signifikant skal I gentage analysen og bede om parvise sammenligninger mellem alkohol-grupperne. I skal selv Bonferroni korrigere p-værdierne. 9) Beskriv på samme måde, hvorledes dødeligheden afhænger af alkoholforbruget for mænd og kvinder hver for sig. 10) Beskriv på samme måde, hvorledes dødeligheden afhænger af alkoholforbruget for mænd og kvinder, der er under 65 år gamle og mænd og kvinder, der er 65 år eller ældre. Brugen af SPSS til disse analyser er beskrevet på de følgende sider Life Tables (Aktuar-tabeller) Programmet kræver, at I angiver en øvre tidsgrænse og et interval for tidsvariablen. Figuren lægger op til en analyse af tiden op til 20 år med tiden opdelt i 5-års intervaller. Status-variablen anbringes i Status feltet. I skal selv angive hvilken status-værdi, der betyder at der er tale om et dødsfald. Bemærk Factor feltet og By factor feltet. Anbring variable i dette felt, hvis I vil have stratificerede analyser for hver kombination af værdier af disse variable. I skal selv angive største og mindste værdi for 3
Brug Options til at angive om I ønsker en udskrift af tabellen (default) og hvilke plots I vil have SPSS til at tegne. Overlevelsesfunktionen må være et minimum og burde være default. Kaplan Meier Definer tid, status og stratifikationsvariable på samme måde som i forbindelse med life tables. Bemærk at køn er valgt som faktor. Derfor er Compare Factor knappen blevet aktiveret. Brug den, hvis I vil have foretaget log rank tests af forskel på mænd og kvinders dødelighed. I Option dialog-vinduet skal I slå Survival tables fra, fordi de bliver meget lange (en række for hvert tidspunkt, hvor der er sket noget), med mindre I altså lige vil se, hvad det er programmet beregner. Til gengæld skal I som minimum vælge survival kurverne. Dem vil man altid se. 4
I Compare-Factor feltet skal I vælge log-rank testet, og derefter vælge mellem de fire forskellige muligheder for test. Hvis Factor variablen indeholder mere end 2 kategorier kan I enten vælge et samlet test eller flere parvise sammenligninger af kategorierne. Hvis der ikke er defineret nogen By-factor variabel er mulighederne for each stratum meningsløse. Ellers kan I vælge at få test summeret over alle strata eller test for hvert stratum for sig. SPSS tillader desværre ikke at man vælger mere end en form for analyse. Hvis I derfor vil foretage flere forskellige log rank analyser må I foretage analyserne flere gange. Bemærk, at der ikke foretages nogen Bonferroni korrektion i forbindelse med de parvise sammenligninger. Det bør I derfor selv gøre ved at beregne hvor mange parvise sammenligninger, der foretages, og ved derefter at gange alle p-værdierne med dette antal. 5