MPH specialmodul i biostatistik og epidemiologi SAS-øvelser vedr. case-control studie af malignt melanom.



Relaterede dokumenter
Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april

Lineær og logistisk regression

Morten Frydenberg 26. april 2004

Morten Frydenberg 14. marts 2006

Kommentarer til spørgsmålene til artikel 1: Ethnic differences in mortality from sudden death syndrome in New Zealand, Mitchell et al., BMJ 1993.

Vi vil analysere effekten af rygning og alkohol på chancen for at blive gravid ved at benytte forskellige Cox regressions modeller.

MPH specialmodul Epidemiologi og Biostatistik

Faculty of Health Sciences. Logistisk regression: Kvantitative forklarende variable

Logistisk regression

MAT A HHX FACITLISTE TIL KAPITEL 8. Øvelser. Øvelse 1 Graf tegnes med CAS. Øvelse 2. Bedste rette linie: Øvelse 3. Øvelse 4.

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom

Morten Frydenberg 25. april 2006

Dag 6: Interaktion. Overlevelsesanalyse

25. april Probability of Developing Coronary Heart Disease in 6 years. Women (Aged 35-70) 160 No Yes

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

9. Chi-i-anden test, case-control data, logistisk regression.

Logistisk regression

Opgavebesvarelse, logistisk regression

Indvandrere og efterkommere i foreninger er frivillige i samme grad som danskere

Besvarelse af juul2 -opgaven

Overlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere.

Postoperative komplikationer

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression

Statistik kommandoer i Stata opdateret 16/ Erik Parner

Løsning til opgave i logistisk regression

Appendiks A. Entreprenørskabsundervisning i befolkningen, specielt blandt unge

Eksamen Efterår 2013

Logistisk Regression - fortsat

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge

Basal statistik for lægevidenskabelige forskere, forår 2014 Udleveret 4. marts, afleveres senest ved øvelserne i uge 13 (25.

Øvelser til basalkursus, 2. uge

ØVELSER Statistik, Logistikøkonom Lektion 8 og 9: Simpel og multipel lineær regression

Logistisk regression. Statistik Kandidatuddannelsen i Folkesundhedsvidenskab

Logistisk regression. Basal Statistik for medicinske PhD-studerende November 2008

Afdeling for Anvendt Matematik og Statistik December 2006

Statistik II 4. Lektion. Logistisk regression

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper.

Faculty of Health Sciences. Basal Statistik. Logistisk regression mm. Lene Theil Skovgaard. 5. marts 2018

Statistik II 1. Lektion. Analyse af kontingenstabeller

Morten Frydenberg Biostatistik version dato:

Mantel-Haenszel analyser. Stratificerede epidemiologiske analyser

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1


Betinget fordeling Uafhængighed. Beregning af forventet tabel Chi-kvadrat teststatistik Chi-kvadrat test. Chi-kvadratfordelingen Agresti - Summary

MPH specialmodul i epidemiologi og biostatistik. SAS. Introduktion til SAS. Eksempel: Blodtryk og fedme

Basal Statistik Kategoriske Data

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk

PATIENTOPLEVETKVALITET 2013

enige i, at der er et godt psykisk arbejdsmiljø. For begge enige i, at arbejdsmiljøet er godt. Hovedparten af sikkerhedsrepræsentanterne

Synopsis til eksamen i Statistik

Log-lineære modeller. Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres.

Øvelse 7: Aktuar-tabeller, Kaplan-Meier kurver og log-rank test

En teoretisk årsagsmodel: Operationalisering: Vurdering af epidemiologiske undersøgelser. 1. Informationsproblemer Darts et eksempel på målefejl

PATIENTOPLEVETKVALITET 2013

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse

PATIENTOPLEVETKVALITET 2013

Statistik FSV 4. semester 2014 Øvelser Uge 2: 11. februar

Man indlæser en såkaldt frequency-table i SAS ved følgende kommandoer:

Træningsaktiviteter dag 3

Har du været på sol-ferie? Nævn 3 sammen-satte ord, som starter med sol! Fx sol-hat. Er en kasket god i solen? Hvorfor? Hvorfor ikke?

PATIENTOPLEVETKVALITET 2013

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse

PATIENTOPLEVETKVALITET 2013

PATIENTOPLEVETKVALITET 2013

Introduktion til overlevelsesanalyse

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

PATIENTOPLEVETKVALITET 2013

PATIENTOPLEVETKVALITET 2013

PATIENTOPLEVETKVALITET 2013

Morten Frydenberg Biostatistik version dato:

Nyt i Analyseportalen og Web Report Studio. Analyseportalen

Analyse af binære responsvariable

Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004

Vi ønsker at konstruere normalområder for stofskiftet, som funktion af kropsvægten.

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Stratificerede analyser

Reeksamen i Statistik for biokemikere. Blok

Kursus i anvendt onkologisk statistik og forskningsmetodik Dag 2. Jon K. Bjerregaard

Opgavebesvarelse, brain weight

ØVELSER Statistik, Logistikøkonom Lektion 8 og 9: Simpel og multipel lineær regression

Introduktion til SPSS

Basal statistik for lægevidenskabelige forskere, forår Udleveret 12. marts, afleveres senest ved øvelserne i uge 14 (2.-4.

Præcision og effektivitet (efficiency)?

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

Opgavebesvarelse, Basalkursus, uge 3

Statistik for MPH: oktober Attributable risk, bestemmelse af stikprøvestørrelse (Silva: , )

Multipel Lineær Regression

Generelle lineære modeller

Unge afgiver rask væk personlige oplysninger for at få adgang til sociale medier

Velkommen til kurset. Teoretisk Statistik. Lærer: Niels-Erik Jensen

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Hver anden vil benytte øget åbningstid i dagtilbud

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

Stastistik og Databehandling på en TI-83

KURSUS I ANALYSEPORTALEN (AP) DANSK PALLIATIV DATABASE 3 1. ÅBNING AF ANALYSEPORTALEN 3 2. OPRETTELSE AF EN RAPPORT DVS. START AF DATAANALYSE 4

Test nr. 6 af centrale elementer 02402

Korrelation Pearson korrelationen

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model

Øvelser i epidemiologi og biostatistik, 12. april 2010 Ebeltoft-projektet: Analyse af alkoholrelaterede data mm. Eksempel på besvarelse

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

Transkript:

MPH specialmodul i biostatistik og epidemiologi SAS-øvelser vedr. case-control studie af malignt melanom. For at I skal kunne regne på tallene fra undersøgelsen har vi taget en delmængde af variablene fra undersøgelsen ud, som findes i filen melanom.txt på kursushjemmesiden. casecon case-kontrol status: 1:case, 0:kontrol sex køn: 1:mand, 2:kvinde brevald alder ved interview i år agr grupperet alder: 10:10 19, 20:20 29,... hudfarve hudfarve: 0:mørk, 1:medium, 2:lys hair hårfarve: 0:mørkebrun/sort, 1:lys brun, 2:blond, 3:rød eyes øjenfarve: 0:brun, 1:grå,grøn, 2:blå fregner fregner: 1:mange, 2:nogen, 3:ingen akutrea akut reaktion på sol: 1:vabler, 2:alvorlig solskoldning, 3:mild solskoldning, 4:ingen solskoldning kronrea solbrændthed ved soleksponering: 1:stærk, 2:moderat, 3:mild, 4:ingen nvsmall antal naevi < 5mm nvlarge antal naevi 5mm nvtot totalt antal naevi ant15 antal solskoldninger før 15 års alderen 1

I filen er der 1 linie for hver person i studiet, og første linie indeholder variabelnavnene beskrevet ovenfor. Visse variable har manglende værdier, som er angivet ved.. Øvelse 1. Indlæs filen i SAS (evt. ved hjælp af programmet melanom.sas), lav en krydstabel af casecontrol status over for hudfarve og test om der er forskellig risiko i de 3 kategorier af hudfarve. Øvelse 2. Da SAS PROC FREQ kun kan beregne odds ratio i 2 2 tabeller, må man mase lidt for at få estimeret disse for kategorierne lys og medium over for mørk. En mulighed er at at lave to nye variable ud fra hudfarve: en hvor alle med hudfarve=medium sættes til missing og en, hvor alle med hudfarve=lys sættes til missing. For hver af disse, kan man estimere OR mht. casecontrol status. Gør det - og sammenlign med AØ s tabel 9. NB: Det er meget enklere at estimere disse ORr ved hjælp af logistisk regression, se Øvelse 5. nedenfor. Øvelse 3. Lav en ny variabel ud fra datafilensnvtot, som er 0, hvisnvtot=0 og 1, hvis nvtot>0. NB - hvis nvtot=., skal den nye variabel også være missing. Estimer OR mht. casecontrol status med og uden stratifikation for fregner og sammenlign resultaterne. Øvelse 4. Lad nvtot og fregner bytte rolle i opgave 4, dvs. lav en ny variabel ud fra fregner med kun to niveauer og estimer OR for denne uden og med stratifikation efter (en passende grupperet udgave af) nvtot. Øvelse 5. Udfør logistisk regressionsanalyse af case-kontrol status med den forklarende variabel hudfarve. Genfind derved estimaterne øverst til venstre i AØ s Tabel 9. NB! Revideret udgave af Tabel 9 og 10 findes nedenfor. Øvelse 6. Udfør de øvrige analyser i AØ s Tabel 9 (venstre del), hvor faktorerne hair, eyes, fregner, akutrea, kronrea studeres en ad gangen. Øvelse 7. Udfør analysen svarende til Tabel 9 (højre del), hvor flere variable er inddraget samtidigt (se tabelteksten). 2

Øvelse 8. Rekonstruer resultaterne fra AØ s Tabel 10, som vedrører det totale antal naevi. NB: her må defineres en ny variabel, nynaevi, ud fra datafilens nvtot. Øvelse 9. I de hidtidige analyser er alle variable blevet betragtet som kategoriske variable, mens variablene ved alle tests i Tabel 9 og 10 er betragtet som lineære (såkaldte trend tests ). Prøv at udføre analyserne, der giver P-værdierne for hudfarve og fregner i Tabel 9 (højre del). Øvelse 10. Er det tilladeligt at score fregner lineært (0, 1, 2), når denne variabel studeres separat? (Udfør et test for linearitet). Øvelse 11. I AØ s Tabel 11 analyseres fregner og det totale antal naevi (grupperet passende, nynaevi, som i spm. 9 ovenfor). Undersøg om der er interaktion mellem de to variable. Rekonstruer estimaterne i marginalerne i Tabel 11, dvs. i modellen uden interaktion Resultaterne i det indre af Tabel 11 kan rekonstrueres ved hjælp af modellen: model casecon=fregner*nynaevi 3

Corrected Table 9. Factor Category OR (crude) OR (adjusted) Skin colour Dark (1.0) (1.0) Medium 1.4 (1.0-1.9) 1.3 (1.0-1.8) Light 1.7 (1.2-2.3) 1.3 (0.9-1.9) trend test p < 0.01 p =0.15 Hair colour Dark-brown/black (1.0) (1.0) Light-brown 1.5 (1.2-1.9) 1.5 (1.2-1.9) Blond/fair 1.7 (1.0-2.9) 1.6 (0.9-2.8) Red 1.7 (1.1-2.7) 1.3 (0.8-2.0) p = 0.04 Eye colour Brown (1.0) (1.0) Grey/green 0.9 (0.6-1.2) 0.7 (0.5-1.1) Blue 1.1 (0.8-1.5) 0.9 (0.6-1.3) trend test p =0.32 p =0.98 Freckles None (1.0) (1.0) Some 1.5 (1.2-1.9) 1.5 (1.2-2.0) Many 3.0 (2.2-4.1) 3.0 (2.1-4.1) p < 0.001 Acute reaction No sunburn (1.0) (1.0) to sunlight Mild sunburn 1.3 (1.0-1.6) 1.1 (0.8-1.4) Painful sunburn 1.6 (1.0-2.6) 1.3 (0.8-2.1) Blisters 2.2 (0.9-5.0) 1.6 (0.7-3.9) trend test p =0.005 p =0.15 Chronic reaction Deep tan (1.0) (1.0) to sunlight Moderate tan 1.4 (1.1-1.8) 1.2 (0.9-1.6) Mild tan 1.8 (1.3-2.6) 1.4 (1.0-2.1) No tan 2.0 (1.0-3.7) 1.2 (0.6-2.5) p =0.10 4

Corrected Table 10. Factor Category OR (crude) OR (adjusted) Number of raised None (1.0) (1.0) naevi on arms, 1 1.5 (1.1-2.1) 1.5 (1.1-2.0) total 2-4 2.3 (1.6-3.1) 2.2 (1.6-3.1) 5+ 5.4 (3.5-8.1) 4.9 (3.2-7.5) Number of raised None (1.0) (1.0) naevi on arms, 1 1.6 (1.1-2.2) 1.6 (1.1-2.2) < 5mm (diameter) 2-4 2.5 (1.8-3.4) 2.4 (1.7-3.4) 5+ 5.0 (3.3-7.7) 4.7 (3.0-7.4) Numner of raised None (1.0) (1.0) naevi on arms, 1 1.8 (1.2-2.8) 1.6 (1.1-2.5) 5mm (diameter) 2+ 3.6 (1.8-7.2) 2.7 (1.3-5.5) 5