Øvelser til basalkursus, 2. uge Opgave 1 Vi betragter igen Sundby95-materialet, og skal nu forbedre nogle af de ting, vi gjorde sidste gang. 1. Gå ind i ANALYST vha. Solutions/Analysis/Analyst. 2. Filen er der formentlig fra sidste uge i sasuser (brug File/Open By SAS Name), ellers må den hentes fra T:\sundby. Husk i så tilfælde at gemme i sasuser, inden I går videre (Save as By SAS Name) 3. Lav ligesom sidst et scatterplot af vægt (v75) overfor højde (v76), med forskellige symboler for mænd og kvinder (Graph/Scatter med KON som Class-variabel). I stedet for kun at have forskellige symboler, vil vi også gerne have forskellige farver, men det kan ikke lade sig gøre i ANALYST. 4. Sørg for, at I står i Browse-mode i ANALYST. Dobbeltklik nu på Code i projekttræet og studer det fremkomne SASprogram. Diskuter hvad de enkelte ting mon kan betyde og ignorer, at I ikke kan forstå det hele (det kan vi heller ikke). 5. Lav nu forskelligt farvede symboler for de to køn ved at ændre i koden (klik Edit/Copy to Program Editor for at få lov til dette) og kør derefter programmet ved at klikke på løbende-mand-ikon eller trykke F8. 6. Gå tilbage til Program Editor med den modificerede kode (tryk F4, hvis den er forsvundet) og læg nu også regressionslinier ind for hvert køn (interpol=rl). 7. Lav en tabel med gennemsnit og medianer af bmi, opdelt (samtidigt) efter køn og de 4 kategorier af variablen fysisk 1
aktivitet (v17). Forestil jer, at tabellen skal bruges i en publikation og prøv nu at lave den pænere ved at benytte Reports/Tables. 8. Slå nogen af de 4 grupper iv17 sammen (brugdata/transform/ Recode Values), tilføj passende navne til de enkelte kategorier og opstil igen tabellen som ovenfor med denne nye opdeling. Opgave 2 I tabellen nedenfor ses målinger af hjertevægt (i g) og total kropsvægt (målt i kg) for 10 normale mænd og 11 mænd med hjertesvigt. Målingerne er taget ved obduktion. 2
Data er lagt i den skitserede rækkefølge i filen T:\hjerte.tal (eller T:\hjerte.txt), med 2 kolonner af tal og med variabelnavnene hjerte og total i første linie. Filen ligger også på hjemmesiden. Indlæs data i Analyst ved at vælge File/Open og svare på de relevante spørgsmål. Gem i sasuser! (f.eks. under navnet hjerte). Tilføj en ekstra variabel, der angiver sygdomsstatus (brug f.eks. Edit/Insert Columns) og gem igen. Sammenlign fordelingerne i de to grupper grafisk og numerisk. Tegn hjertevægt op mod kropsvægt for hver af de to grupper. Er der sammenhæng? Angiv et normalområde for hjertevægt for normale mænd. Angiv et konfidensinterval for middelværdien af hjertevægt for hhv. normale og hjertesyge mænd. Opgave 3 (som ikke kræver brug af SAS) Vedlagt findes to tabeller, hentet fra artiklen Helge Brunborg(1987): Gutt eller jente? Tidsskr. Nor. Lægeforen. nr. 14. Data stammer fra Statistisk Sentalbyrå og beskriver kønsfordelingen blandt i alt 1.3 mill. børn (født 1950-1985) af 618000 mødre. I tabel 2 er der opdelt efter familiestørrelse. Bemærk, at familierne godt kan indgå flere steder, således at forstå, at familier med 3 børn figurerer både som 1-barns familie (med det ældste barn), 2-barns familie (med de to ældste børn) og 3-barns familie (med alle børn). 3
1. Læs og forstå de vedlagte tabeller. 2. Giv et løseligt estimat (uden at regne) for sandsynligheden for at en nyfødt i Norge er af hankøn. Tror I, at der er evidens for en overhyppighed af drengefødsler? (I skal ikke give jer til at lave et formelt test, i hvert fald ikke, før I er færdig med alt andet.) 4
3. Baseret på ovenstående skøn og binomialfordelingen, hvad er så sandsynligheden for hhv. 0,1,2,3 og 4 drenge i en 4- barns familie? 4. Sammenlign denne forventede sandsynlighedsfordeling med den observerede fordeling af antal drenge i 4-barnsfamilier. Kommenter afvigelsernes størrelse og retning og overvej mulige årsager hertil (se f.eks. tabel 1). 5
Opgave 4 (til dem, der ikke kan få nok) I SundBy materialet findes en variabel, der angiver evt. begrænsninger i ens aktiviteter som følge af et dårligt helbred (variabel nummer 7). Kan man på baggrund af denne variabel sige noget om, hvor begrænsningerne først sætter ind? Er det f.eks. typisk sådan, at man først får svært ved gå flere etager op ad trapper (d i skemaet) og først på et senere tidspunkt får svært ved at bøje sig eller gå ned i knæ (f i skemaet)? 6