Institut for Folkesundhed Afdeling for Biostatistik Afdeling for Epidemiologi. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag) Opgave 1 Udgangspunktet for de følgende spørgsmål er artiklen: Ludwig DS, Peterson KE, Gortmaker SL. Relation between consumption of sugar-sweetened drinks and childhood obesity: a prospective, observational analysis. Lancet 1; 357: 55-5. Det er ikke nødvendigt at læse hele artiklen igennem for at besvare de følgende spørgsmål, man kan nøjes med at læse frem til afsnittet Statistical Analysis, s. 5. 1. Beskriv kort undersøgelsens formål og design (men ikke flow-diagram, rekruttering af deltagere etc.).. Hvad er de anvendte mål for eksponering og udfald? Er disse mål fornuftige i forhold til formålet? 3. Hvad bidrager til variationen dels i den målte eksponering og dels i det målte udfald? Opgave Se Essential Medical Statistics s.1, Fig. 11.1. Se kun på figuren, der illustrerer sammenhængen mellem FEV 1 og Alder/Højde hos 3 peruvianske børn. Lad være med at bruge tid på de statistiske ord og beregninger (lineær regression), der i øvrigt anvendes på disse sider i bogen, - det vender vi tilbage til senere i kurset. Lav 1- overheads, der omhandler: 1. Vil man forvente, at børn, der enten er lige høje eller lige gamle, har samme FEV 1? Samme spørgsmål hvis de både er lige høje og lige gamle? Diskutér kilderne til variationen i FEV 1 og klassificér dem som inter- eller intraindividuelle eller evt. målefejl.. Kan man fra disse figurer slutte noget om, hvor meget FEV 1 øges hos et barn, der vokser fra 1 cm til 1 cm (lav f.eks. en tegning) eller bliver et 1 år ældre? Formålet med opgave 3 og er, at få erfaring med fortolkning af sikkerhedsintervaller og prædiktionsintervaller. Opgaverne illustrerer desuden vigtigheden af, at checke antagelserne bag den statistiske analyse. Opgave 3 De følgende data vedrører serum triglycerid målinger i navlestrengsblod hos nyfødte børn. (M. Bland: An Introduction to Medical Statistics, Tabel.). På de næste sider findes x histogrammer med angivelse af gennemsnit ( Mean = x ), spredning (Std. Dev. = s = sd) og stikprøvestørrelse (n). Histogrammerne () er dels lavet på alle data (n = ) og dels 3 mindre stikprøver (n = 1, n = 3 og n = 3). Desuden er der histogrammer () for de naturlig logaritme-transformerede data (det vil sige, at der først beregnes naturlig logaritme til samtlige tal, og dernæst laves histogrammer på disse transformerede tal for 1
de samme grupper). I Essential Medical Statistics står der noget om transformation af data i Kapitel 13.1-13.3. Hver gruppe finder de relevante histogrammer på de næste sider. I skal ikke lave overheads, vi vil sætte tallene ind i et fælles skema. 1. Beregn et 95% sikkerhedsinterval for middelværdi og et 95% prediktionsinterval for både de utransformerede tal (oprindelig skala) og de naturlig logaritme transformerede tal (log-skala).. Brug exponential-funktionen til at omsætte intervallerne for de transformerede data til intervaller på den oprindelige skala, se bogens Eksempel 13., s. 11-3 i bogen. Bemærkning: Hvis de naturlig logaritme-transformerede tal kan beskrives ved en normalfordeling gælder der, at de intervaller, der fremkommer efter (tilbage-) transformation med exponential-funktion, svarer til et 95% konfidensinterval for medianen hhv. et 95% prediktionsinterval på den oprindelige skala. Opgave Figuren nederst på siden viser den kumulerede fordeling på alle triglycerid-data fra Opgave 3 (se Essential Medical Statistics, Afsnit 3.3, s. 1-3). 1. Prøv at vurdere ved hjælp af denne figur eller histogrammet for de børn, hvor mange observationer (udtrykt som procent), der ligger under hhv. over de prediktionsintervaller beregnet i spørgsmål?. Benyt figuren til at give et skøn over medianen og sammenlign dette skøn med svaret og bemærkningen til spørgsmål ovenfor. Giv også et skøn over 1- og 9 percentilen, og andelen af børn med en triglycerid-koncentration større en 1. 3. Kan man ud fra figuren aflæse median samt 1- og 9-percentilen på de logaritmetransformerede data? Kumuleret frekvens.... 1.5 1 1.5 Triglycerid Kumuleret fordeling på alle data (N=)
15 N= Gruppe A 9 75 5 3 15 Std. Dev =. Mean =.51 N =.....5.7.9 1.1 1.3 1. 1..13.31.9.7.5 1.3 1.1 1.39 1.57 1.75 Gruppe N= A 7 5 1.3.9.1.7 -.7 -.1 -.9 -.3-1.5-1.7-1.1-1.9 -.3 Std. Dev =.39 Mean = -.7 N =. 3 3
15 N=1 Gruppe B 1 9 3 Std. Dev =.19 Mean =.7 N = 1.....5.7.9 1.1 1.3 1. 1..13.31.9.7.5 1.3 1.1 1.39 1.57 1.75 1 Gruppe N=1 B 1.3.9.1.7 -.7 -.1 -.9 -.3-1.5-1.7-1.1-1.9 -.3 Std. Dev =.39 Mean = -.3 N = 1.
Gruppe N=3 C 1 1 Std. Dev =.3 Mean =.5 N = 3.....5.7.9 1.1 1.3 1. 1..13.31.9.7.5 1.3 1.1 1.39 1.57 1.75 1 Gruppe N=3 C.3.9.1.7 -.7 -.1 -.9 -.3-1.5-1.7-1.1-1.9 -.3 Std. Dev =.3 Mean = -.7 N = 3. 5
1 Gruppe N=3 D 1 1 1 Std. Dev =. Mean =.9 N = 3.....5.7.9 1.1 1.3 1. 1..13.31.9.7.5 1.3 1.1 1.39 1.57 1.75 1 N=3 Gruppe D 1.3.9.1.7 -.7 -.1 -.9 -.3-1.5-1.7-1.1-1.9 -.3 Std. Dev =.37 Mean = -.7 N = 3.