MPH specialmodul i biostatistik og epidemiologi SAS-øvelser vedr. case-control studie af malignt melanom. For at I skal kunne regne på tallene fra undersøgelsen har vi taget en delmængde af variablene fra undersøgelsen ud, som findes i filen melanom.txt på kursushjemmesiden. casecon case-kontrol status: 1:case, 0:kontrol sex køn: 1:mand, 2:kvinde brevald alder ved interview i år agr grupperet alder: 10:10 19, 20:20 29,... hudfarve hudfarve: 0:mørk, 1:medium, 2:lys hair hårfarve: 0:mørkebrun/sort, 1:lys brun, 2:blond, 3:rød eyes øjenfarve: 0:brun, 1:grå,grøn, 2:blå fregner fregner: 1:mange, 2:nogen, 3:ingen akutrea akut reaktion på sol: 1:vabler, 2:alvorlig solskoldning, 3:mild solskoldning, 4:ingen solskoldning kronrea solbrændthed ved soleksponering: 1:stærk, 2:moderat, 3:mild, 4:ingen nvsmall antal naevi < 5mm nvlarge antal naevi 5mm nvtot totalt antal naevi ant15 antal solskoldninger før 15 års alderen 1
I filen er der 1 linie for hver person i studiet, og første linie indeholder variabelnavnene beskrevet ovenfor. Visse variable har manglende værdier, som er angivet ved.. Øvelse 1. Indlæs filen i SAS (evt. ved hjælp af programmet melanom.sas), lav en krydstabel af casecontrol status over for hudfarve og test om der er forskellig risiko i de 3 kategorier af hudfarve. Øvelse 2. Da SAS PROC FREQ kun kan beregne odds ratio i 2 2 tabeller, må man mase lidt for at få estimeret disse for kategorierne lys og medium over for mørk. En mulighed er at at lave to nye variable ud fra hudfarve: en hvor alle med hudfarve=medium sættes til missing og en, hvor alle med hudfarve=lys sættes til missing. For hver af disse, kan man estimere OR mht. casecontrol status. Gør det - og sammenlign med AØ s tabel 9. NB: Det er meget enklere at estimere disse ORr ved hjælp af logistisk regression, se Øvelse 5. nedenfor. Øvelse 3. Lav en ny variabel ud fra datafilensnvtot, som er 0, hvisnvtot=0 og 1, hvis nvtot>0. NB - hvis nvtot=., skal den nye variabel også være missing. Estimer OR mht. casecontrol status med og uden stratifikation for fregner og sammenlign resultaterne. Øvelse 4. Lad nvtot og fregner bytte rolle i opgave 4, dvs. lav en ny variabel ud fra fregner med kun to niveauer og estimer OR for denne uden og med stratifikation efter (en passende grupperet udgave af) nvtot. Øvelse 5. Udfør logistisk regressionsanalyse af case-kontrol status med den forklarende variabel hudfarve. Genfind derved estimaterne øverst til venstre i AØ s Tabel 9. NB! Revideret udgave af Tabel 9 og 10 findes nedenfor. Øvelse 6. Udfør de øvrige analyser i AØ s Tabel 9 (venstre del), hvor faktorerne hair, eyes, fregner, akutrea, kronrea studeres en ad gangen. Øvelse 7. Udfør analysen svarende til Tabel 9 (højre del), hvor flere variable er inddraget samtidigt (se tabelteksten). 2
Øvelse 8. Rekonstruer resultaterne fra AØ s Tabel 10, som vedrører det totale antal naevi. NB: her må defineres en ny variabel, nynaevi, ud fra datafilens nvtot. Øvelse 9. I de hidtidige analyser er alle variable blevet betragtet som kategoriske variable, mens variablene ved alle tests i Tabel 9 og 10 er betragtet som lineære (såkaldte trend tests ). Prøv at udføre analyserne, der giver P-værdierne for hudfarve og fregner i Tabel 9 (højre del). Øvelse 10. Er det tilladeligt at score fregner lineært (0, 1, 2), når denne variabel studeres separat? (Udfør et test for linearitet). Øvelse 11. I AØ s Tabel 11 analyseres fregner og det totale antal naevi (grupperet passende, nynaevi, som i spm. 9 ovenfor). Undersøg om der er interaktion mellem de to variable. Rekonstruer estimaterne i marginalerne i Tabel 11, dvs. i modellen uden interaktion Resultaterne i det indre af Tabel 11 kan rekonstrueres ved hjælp af modellen: model casecon=fregner*nynaevi 3
Corrected Table 9. Factor Category OR (crude) OR (adjusted) Skin colour Dark (1.0) (1.0) Medium 1.4 (1.0-1.9) 1.3 (1.0-1.8) Light 1.7 (1.2-2.3) 1.3 (0.9-1.9) trend test p < 0.01 p =0.15 Hair colour Dark-brown/black (1.0) (1.0) Light-brown 1.5 (1.2-1.9) 1.5 (1.2-1.9) Blond/fair 1.7 (1.0-2.9) 1.6 (0.9-2.8) Red 1.7 (1.1-2.7) 1.3 (0.8-2.0) p = 0.04 Eye colour Brown (1.0) (1.0) Grey/green 0.9 (0.6-1.2) 0.7 (0.5-1.1) Blue 1.1 (0.8-1.5) 0.9 (0.6-1.3) trend test p =0.32 p =0.98 Freckles None (1.0) (1.0) Some 1.5 (1.2-1.9) 1.5 (1.2-2.0) Many 3.0 (2.2-4.1) 3.0 (2.1-4.1) p < 0.001 Acute reaction No sunburn (1.0) (1.0) to sunlight Mild sunburn 1.3 (1.0-1.6) 1.1 (0.8-1.4) Painful sunburn 1.6 (1.0-2.6) 1.3 (0.8-2.1) Blisters 2.2 (0.9-5.0) 1.6 (0.7-3.9) trend test p =0.005 p =0.15 Chronic reaction Deep tan (1.0) (1.0) to sunlight Moderate tan 1.4 (1.1-1.8) 1.2 (0.9-1.6) Mild tan 1.8 (1.3-2.6) 1.4 (1.0-2.1) No tan 2.0 (1.0-3.7) 1.2 (0.6-2.5) p =0.10 4
Corrected Table 10. Factor Category OR (crude) OR (adjusted) Number of raised None (1.0) (1.0) naevi on arms, 1 1.5 (1.1-2.1) 1.5 (1.1-2.0) total 2-4 2.3 (1.6-3.1) 2.2 (1.6-3.1) 5+ 5.4 (3.5-8.1) 4.9 (3.2-7.5) Number of raised None (1.0) (1.0) naevi on arms, 1 1.6 (1.1-2.2) 1.6 (1.1-2.2) < 5mm (diameter) 2-4 2.5 (1.8-3.4) 2.4 (1.7-3.4) 5+ 5.0 (3.3-7.7) 4.7 (3.0-7.4) Numner of raised None (1.0) (1.0) naevi on arms, 1 1.8 (1.2-2.8) 1.6 (1.1-2.5) 5mm (diameter) 2+ 3.6 (1.8-7.2) 2.7 (1.3-5.5) 5