Øvelse 7: Aktuar-tabeller, Kaplan-Meier kurver og log-rank test

Relaterede dokumenter
Morten Frydenberg Biostatistik version dato:

Overlevelsesfunktion. Vi kalder S(t) for overlevelsesfunktionen.

Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004

Faculty of Health Sciences. Basal Statistik. Overlevelsesanalyse. Lene Theil Skovgaard. 12. marts 2018

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)

Statistik kommandoer i Stata opdateret 22/ Erik Parner

Statistik kommandoer i Stata opdateret 16/ Erik Parner

Dag 6: Interaktion. Overlevelsesanalyse

Program dag 2 (11. april 2011)

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

OR stiger eksponentielt med forskellen i BMI. kompliceret model svær at forstå og analysere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

REEKSAMEN I EPIDEMIOLOGISKE METODER IT & Sundhed, 2. semester

Resultater vedrørende risikofaktorer for hjertekarsygdom og dødelighed i relation til social ulighed - 15 års opfølgning i Sundhedsprojekt Ebeltoft

2 Epidemiologi og biostatistik. Uge 5, mandag 26. september 2005 Michael Væth, Institut for Biostatistik

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Vi vil analysere effekten af rygning og alkohol på chancen for at blive gravid ved at benytte forskellige Cox regressions modeller.

SKRIFTLIG EKSAMEN I BIOSTATISTIK OG EPIDEMIOLOGI Cand.Scient.San, 2. semester 20. februar 2015 (3 timer)

Baggrund. < 1 % af alle nye brystkræft tilfælde. Årligt godt 30 nye tilfælde

Overlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere.

OR stiger eksponentielt med forskellen i BMI komplicet model svær at forstå og analysere simpel model

Øvelser til basalkursus, 2. uge

Introduktion til SPSS

Statistik II 1. Lektion. Analyse af kontingenstabeller

Normalfordelingen og Stikprøvefordelinger

Kommentarer til spørgsmålene til artikel 1: Ethnic differences in mortality from sudden death syndrome in New Zealand, Mitchell et al., BMJ 1993.

Kapitel 7. Ophobning af KRAM-faktorer

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

Øvelser i epidemiologi og biostatistik, 6. april 2010 Baseline-informationer fra Ebeltoft datasættet Eksempel på besvarelse

Statistik og skalavalidering. Opgave 1

Introduktion til overlevelsesanalyse

Det fri indland. 23. mar 2015

Introduktion til overlevelsesanalyse

Population attributable fraction

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Mantel-Haenszel analyser. Stratificerede epidemiologiske analyser

Det fri indland. 23. mar 2015

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Mantel-Haenszel analyser

Analyse af binære responsvariable

Generelle lineære modeller

Øvelse i SurveyBanken: Traditionelle værdier

Det fri indland. 23. mar 2015

24. februar Analyse af overlevelsesdata (ventetidsdata) Ikke parametrisk statistiske test : Det statistiske modelbegreb Modelselektion

Workshop 6 Sundhedsprofilen metode og muligheder. Anne Helms Andreasen, Forskningscenter for Forebyggelse og Sundhed

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet

Faktaark: Studiemiljø

Ved undervisningen i epidemiologi/statistik den 8. og 10. november 2011 vil vi lægge hovedvægten på en fælles diskussion af følgende fire artikler:

Hvad skal vi lave? Model med hovedvirkninger Model med vekselvirkning F-test for ingen vekselvirkning. 1 Kovariansanalyse. 2 Sammenligning af modeller

Kirsten Avlund Prisen Dansk Gerontologisk Selskab DARC

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Sommermåling - Indland. Danmarks Radio. 29. jun 2015

Kapitel 12 Variansanalyse

SPSS appendix SPSS APPENDIX. Box plots. Indlæsning. Faculty of Health Sciences. Basal Statistik: Sammenligning af grupper, Variansanalyse

Faculty of Health Sciences. SPSS appendix. Basal Statistik: Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 22.

SPSS appendix SPSS APPENDIX. Box plots. Indlæsning. Faculty of Health Sciences. Basal Statistik: Sammenligning af grupper, Variansanalyse

Kapitel 12 Variansanalyse

Log-lineære modeller. Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres.

MPH specialmodul i biostatistik og epidemiologi SAS-øvelser vedr. case-control studie af malignt melanom.

23. februar Epidemiologi og biostatistik. Uge 5, mandag 27. februar 2006 Michael Væth, Institut for Biostatistik.

Nøgletal for kræft august 2008

Kapitel 8 Chi-i-anden (χ 2 ) prøven

Øvelser i epidemiologi og biostatistik, 12. april 2010 Ebeltoft-projektet: Analyse af alkoholrelaterede data mm. Eksempel på besvarelse

Optimering af stikprøver vha. registre. Peter Linde, DST Survey

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Stratificerede analyser

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering

Vurdering af Helle Thorning Schmidts og Lars Løkke Rasmussens egenskaber i forhold til en række politiske områder. Danmarks Radio. 19.

Mobning på arbejdspladsen. En undersøgelse af oplevelser med mobning blandt STEM-ansatte

Nye tal fra Sundhedsstyrelsen. Dødsårsager i de nordiske lande :9

Indvandrere og efterkommere i foreninger er frivillige i samme grad som danskere

Statistik for Biokemikere Projekt

Konfidensintervaller og Hypotesetest

KURSUS I ANALYSEPORTALEN (AP) DANSK PALLIATIV DATABASE 3 1. ÅBNING AF ANALYSEPORTALEN 3 2. OPRETTELSE AF EN RAPPORT DVS. START AF DATAANALYSE 4

Supplerende opgaver til TRIP s matematiske GRUNDBOG. Forlaget TRIP. Opgaverne må frit benyttes i undervisningen.

Opgaver til kapitel 3

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

25. april Probability of Developing Coronary Heart Disease in 6 years. Women (Aged 35-70) 160 No Yes

Kursus i anvendt onkologisk statistik og forskningsmetodik Dag 2. Jon K. Bjerregaard

Lineær og logistisk regression

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

Hvor lang tid bor man alene efter partnerens

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

Statistik FSV 4. semester 2014 Øvelser Uge 2: 11. februar

Juni Borgere med multisygdom

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

Spørgeskema til FSV-studerende

Skriftlig eksamen i samfundsfag

Kvantitative metoder 2

Udbrændthed og brancheskift

Ovenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm.

Basal Statistik - SPSS

Dokumentation af interviewundersøgelser

HOFTEALLOPLASTIK - DATAUDTRÆK OG IMPORT TIL EXCEL

Økonometri 1. Kvalitative variabler. Kvalitative variabler. Dagens program. Kvalitative variable 8. marts 2006

Jobgruppe, kombineret DISCO og funktionskode fra Danmarks Statistik

Epidemiologiske associationsmål

Transkript:

Øvelse 7: Aktuar-tabeller, Kaplan-Meier kurver og log-rank test Formålet med øvelsen er at analysere risikoen for død forbundet med forskelligt alkoholforbrug. I denne øvelse skal analyserne foretages dels ved hjælp af såkaldte aktuarmetoder (Life tables) og dels ved hjælp af Kaplan-Meiers estimator af overlevelses-funktionen. For at gennemføre disse analyser skal I benytte nogle dele af SPSS, som I ikke tidligere har arbejdet med. De sidste sider af denne øvelse indeholder derfor en brugervejledning til disse dele. Filen HCPB1, der downlades fra hjemmesiden, indeholder oplysninger om 16.397 mænd og kvinder i alderen 50-93 år, der enten er blevet undersøgt i Østerbroundersøgelsen, Glostrupundersøgelserne eller Copenhagen Male Study. Alle personer er blevet fulgt i CPR-registret fra den første undersøgelse og indtil død, afgang fra CPR-registret af anden årsag, eller indtil den 31.12.1993. Materialet indeholder følgende variable: ALDER KON ALKO RYGER SKOLE KOHORTE STATUS TID - målt i hele år på det tidspunkt, hvor undersøgelsen startede. - køn kodet med 0 = kvinde og 1 = mand - alkoholforbrug (genstande/uge) i syv ordinale kategorier - angivet i fem ordinale kategorier - almen skoleuddannelse i tre niveauer (1 = <8 år, 2 = 8-11 år, 3= 12+ år) - angiver hvilken undersøgelse personen har deltaget i - angiver om personen var død (1) eller i live (0) på det tidspunkt, hvor der sidste gang er oplysninger om personen - angiver follow-up tiden målt i år (som decimaltal) Der opgaver, der skal løses er følgende: 0) Husk databeskrivelsen. Det er bl.a. vigtigt at vide noget om den maksimale follow-up tid og at vide, præcis hvordan variablene er kodet. 1) Lav et par aktuar-tabeller ( life tables ) med tilhørende plots af overlevelseskurven, (Analyze /Survival /Life Tables TID), der viser risikoen for at dø i forskellige tidsintervaller for hele HCPB-materialet. Prøv med flere forskellige tidsintervaller, så I kan se den betydning, som størrelsen af tidsintervallerne har for resultaterne. Det er 1

vigtigt, at I bruger noget tid på at studere indholdet af tabellen, så I er fuldstændig sikre på, hvad det er, der bliver beregnet. I skal f.eks. kunne svare på Hvor mange personer er der tilbage i undersøgelsen efter 10 år? Hvor mange personer bliver censureret mellem det 10. og 11. år? Hvor mange person-perioder er derfor i risiko? Hvor mange dødsfald registreres der mellem det 10. og 11. år? Hvad er risikoen for at dø mellem det 10. og 11. år, hvis man var i live efter 10 år? Hvor stor en andel af dem, der var i live efter 10 år overlever det næste år? Hvor stor en andel af den samlede population overlever 10 år? Hvor stor en andel af den samlede population overlever 11 år? 2) Lav aktuar-tabeller og overlevelseskurver for mænd og kvinder hver for sig og sammenlign risikoen i de to grupper (Placer variablen KON i Factor feltet). 3) Undersøg hvorledes risikoen for død afhænger af alkoholforbruget ved hjælp af aktuartabeller og overlevelseskurver. (Placer variablen ALKO i Factor feltet). 4) Undersøg hvorledes risikoen for død afhænger af alkoholforbruget for mænd og kvinder hver for sig. (Placer variablen KON i By factor feltet) 5) Undersøg hvorledes risikoen for død afhænger af alkoholforbruget for mænd over og under 65 år og for kvinder over og under 65 år hver for sig. (Udover at have ALKO som factor og KON som By Factor er I nødt til at beregne en dikotomiseret alders variabel og bruge Split file med denne variabel.) Ovenstående fire opgaver skal herefter løses ved hjælp af Kaplan-Meier kurver og log-rank tests: 6) Beskriv dødeligheden i hele materialet ved hjælp af Kaplan-Meier kurver og sammenlign kurverne med de kurver, der blev plottet i pkt. 1). 7) Beskriv dødeligheden blandt mænd og kvinder ved hjælp af Kaplan-Meier kurver og undersøg ved hjælp af et log-rank test, om der er signifikant forskel på dødeligheden i de to grupper. 2

8) Beskriv, hvorledes dødeligheden afhænger af alkoholforbruget ved hjælp af Kaplan-Meier kurver og undersøg ved hjælp af et log-rank test, om der er signifikant forskel på dødeligheden i de to grupper. Hvis forskellen er signifikant skal I gentage analysen og bede om parvise sammenligninger mellem alkohol-grupperne. I skal selv Bonferroni korrigere p-værdierne. 9) Beskriv på samme måde, hvorledes dødeligheden afhænger af alkoholforbruget for mænd og kvinder hver for sig. 10) Beskriv på samme måde, hvorledes dødeligheden afhænger af alkoholforbruget for mænd og kvinder, der er under 65 år gamle og mænd og kvinder, der er 65 år eller ældre. Brugen af SPSS til disse analyser er beskrevet på de følgende sider Life Tables (Aktuar-tabeller) Programmet kræver, at I angiver en øvre tidsgrænse og et interval for tidsvariablen. Figuren lægger op til en analyse af tiden op til 20 år med tiden opdelt i 5-års intervaller. Status-variablen anbringes i Status feltet. I skal selv angive hvilken status-værdi, der betyder at der er tale om et dødsfald. Bemærk Factor feltet og By factor feltet. Anbring variable i dette felt, hvis I vil have stratificerede analyser for hver kombination af værdier af disse variable. I skal selv angive største og mindste værdi for 3

Brug Options til at angive om I ønsker en udskrift af tabellen (default) og hvilke plots I vil have SPSS til at tegne. Overlevelsesfunktionen må være et minimum og burde være default. Kaplan Meier Definer tid, status og stratifikationsvariable på samme måde som i forbindelse med life tables. Bemærk at køn er valgt som faktor. Derfor er Compare Factor knappen blevet aktiveret. Brug den, hvis I vil have foretaget log rank tests af forskel på mænd og kvinders dødelighed. I Option dialog-vinduet skal I slå Survival tables fra, fordi de bliver meget lange (en række for hvert tidspunkt, hvor der er sket noget), med mindre I altså lige vil se, hvad det er programmet beregner. Til gengæld skal I som minimum vælge survival kurverne. Dem vil man altid se. 4

I Compare-Factor feltet skal I vælge log-rank testet, og derefter vælge mellem de fire forskellige muligheder for test. Hvis Factor variablen indeholder mere end 2 kategorier kan I enten vælge et samlet test eller flere parvise sammenligninger af kategorierne. Hvis der ikke er defineret nogen By-factor variabel er mulighederne for each stratum meningsløse. Ellers kan I vælge at få test summeret over alle strata eller test for hvert stratum for sig. SPSS tillader desværre ikke at man vælger mere end en form for analyse. Hvis I derfor vil foretage flere forskellige log rank analyser må I foretage analyserne flere gange. Bemærk, at der ikke foretages nogen Bonferroni korrektion i forbindelse med de parvise sammenligninger. Det bør I derfor selv gøre ved at beregne hvor mange parvise sammenligninger, der foretages, og ved derefter at gange alle p-værdierne med dette antal. 5