Københavns Universitet Det Naturvidenskabelige Fakultet Reeksamen i Statistik for biokemikere. Blok 3 2007. Opgave 1. 3 timers skriftlig prøve. Alle hjælpemidler - også blyant - er tilladt. Opgavesættet er på 5 sider. En persons prothrombinindeks er en markør for leversvigt. 40 personer fik prothrombinindekset målt til to tidspunkter. For hver person udregnedes ændringen over den betragtede periode. For ændringerne fandt man x = 1 40 40 r=1 x r = 16.55 og s 2 = 1 40 39 r=1(x r x) 2 = 394.7667. Ændringerne i prothrombinindeks kan i det følgende antages at være indbyrdes uafhængige og identisk normalfordelte. (a) Udfør et test for hypotesen om, at ændringerne har middelværdien 0. For yderligere 20 personer fra samme population måltes ændringen i prothrombinindeks. Her fandt man x = 1 20 20 r=1 x r = 9.00 og s 2 = 1 20 19 r=1(x r x) 2 = 412.7368. (b) Gør rede for, at de to grupper kan antages at have samme varians. (c) Kan de to grupper antages at have samme ændring i prothrombinindeks? Opgave 2. I visse undersøgelser af tumorer indgår en bestemmelse af cellekinetiske parametre i tumorvævet, heriblandt den såkaldte G 1 -fraktion. Ved hjælp af en kanyle tages en prøve (aspirat) fra tumoren og G 1 -fraktionen i aspiratet bestemmes. Tumorvæv kan opbevares ved enten at nedfryse aspirater fra frisk tumor eller ved nedfrysning af et helt vævsstykke, som derefter kan optøes og aspireres. Fra hver af fire tumorer er der nedfrosset to aspirater og to tumorstykker. Efter en uge er aspirater og vævsstykker fra tumor nr. 1 og 2 tøet op og analyseret, og efter en måned er aspirater og vævsstykker fra tumor nr. 3 og 4 tøet op og analyseret. Resultaterne er angivet i tabellen nedenfor. 1
G 1 -fraktion i tumorvæv ved forskellige behandlinger Behandling Tumor nr. Frysetid Frosset aspirat Frosset vævsstykke 1 1 uge 69.29 66.45 74.24 71.44 2 1 uge 68.10 69.21 72.12 69.73 3 1 måned 67.15 70.36 72.59 74.56 4 1 måned 67.90 66.60 67.33 66.35 (a) Vis på grundlag af dette materiale, at G 1 -fraktionen for hver behandling ikke påvirkes forskelligt hverken af tumor eller af frysetid. Brug eventuelt resultaterne fra SAS-udskriften. (b) Undersøg, om behandling påvirker målingerne. Brug eventuelt resultaterne fra SAS-udskriften. (c) Gør rede for forudsætningerne for analysen. Bilag: Data antages at ligge i et SAS-datasæt med de fire variable tumor, tid, behand og g1, der angiver henholdsvis tumor, frysetid, behandling og måling af G 1 -fraktion. PROGRAM: UDSKRIFT: CLASS tumor frysetid behand; MODEL g1=frysetid behand tumor behand; Dependent Variable: g1 Model 7 91.5857750 13.0836821 5.27 0.0161 Error 8 19.8426000 2.4803250 Corrected Total 15 111.4283750 R-Square Coeff Var Root MSE g1 Mean 0.821925 2.263160 1.574905 69.58875 frysetid 1 3.74422500 3.74422500 1.51 0.2541 behand 1 33.93062500 33.93062500 13.68 0.0061 frysetid*behand 1 2.00222500 2.00222500 0.81 0.3952 tumor 2 34.58725000 17.29362500 6.97 0.0177 tumor*behand 2 17.32145000 8.66072500 3.49 0.0813 2
Opgave 3 For at sammenligne visuel og automatisk scoring af granolocyt/macrofag kolonier blev 7 dage gamle celle-aggregater scoret med begge metoder. Både mikroskopi og automatisk tælling blev foretaget på kodede museknoglemarvskulturer i methycellulose, stimuleret med behandlet medium indeholdende cellekulturer fra musemilt. Ikke-kolonier var defineret som celle-aggregater indeholdende mindre end 50 celler. Data er fra Benestad et.al. Universitetet i Oslo. (a) Er der sammenhæng mellem de to scoringsmetoder? (b) Estimer andelen af celle-aggregater, der bliver scoret ens ved de to metoder. Visuel og automatisk scoring af granolocyt/macrofag kolonier Antal og rækkeprocenter Visuel Automatisk scoring scoring Ikke-kolonier Kolonier Ialt Ikke-kolonier 67 6 73 91.78 8.22 Tvivlsomme kolonier 28 28 56 50.0 50.0 Kolonier 6 205 211 2.84 97.16 I alt 101 239 340 Bilag: Data antages at ligge i datasættet koloni med de tre variable visuel, automat og antal, hvor sidstnævnte angiver antal celle-aggregater med den pågældende kombination af baggrundsvariable. PROGRAM: PROC FREQ DATA=koloni; TABLES visuel*automat/nopct NOCOL CHISQ; WEIGHT antal; UDSKRIFT (redigeret): The FREQ Procedure Statistics for Table of visuel by automat Statistic DF Value Prob Chi-Square 2 218.6665 <.0001 Likelihood Ratio Chi-Square 2 240.0205 <.0001 Sample Size = 340 3
Opgave 4. Fedtsyreprocenten er den fundamentale kvalitetsegenskab ved sæbe. Den bestemmes sædvanligvis ved langsomme kemiske laboratoriemålinger. Til lettelse af produktionskontrollen i sæbefabrikker har man foreslået at bestemme fedtsyreprocenten ved at måle sæbens elektriske ledningsevne. Ledningsevnen er let at måle, og målingerne kan udføres på produktionsstedet. I nedenstående tabel findes en række uafhængige bestemmelser af ledningsevnen målt i milli-siemens (ms) for en bestemt sæbetype og forskellige fedtsyreprocenter. Sammenhæng mellem fedtsyreprocent og ledningsevne i sæbe Gruppe Fedtsyre- Ledningsevne procent i ms 1 81.3 1.40 1.20 0.90 1.00 1.08 1.03 0.98 0.88 2 82.2 1.75 1.50 1.70 1.80 1.34 1.44 1.49 1.24 3 82.3 1.52 1.52 1.67 1.67 1.35 1.50.1.30.1.45 4 83.0 2.10 1.95 1.85 1.90 2.45 2.35 2.20 2.00 (a) Vis, at det kan antages at ledningsevnen kan udtrykkes ved en lineær funktion af fedtsyreprocenten i det område målingerne dækker og angiv den estimerede regressionslinje. (b) Undersøg, om regressionslinjen kan antages at have hældningen 0. (c) Hvad er forudsætningerne for analysen? For en ny sæbeprøve måler man ledningsevnen 5 gange, hvilket giver målingerne: 1.36, 1.74, 1.65, 1.54, 1.32 (d) Beregn, på basis af den estimerede regressionslinje, en prediktion for sæbens fedtsyreprocent og angiv et 95% konfidensinterval for den predikterede værdi af fedtsyreprocenten. Bilag: Data antages at ligge i et SAS-datasæt med de tre variable fedtsyre og ledning, der angiver sammenhørende værdier af fedtsyreprocent og ledningsevne, samt variablen gruppe, med værdierne 1,2,3,4 svarende til de fire værdier af fedtsyreprocent. PROGRAM 1: CLASS gruppe; MODEL ledning= fedtsyre gruppe; 4
UDSKRIFT 1: Dependent Variable: ledning Model 3 4.37485937 1.45828646 43.49 <.0001 Error 28 0.93898750 0.03353527 Corrected Total 31 5.31384688 R-Square Coeff Var Root MSE ledning Mean 0.823294 11.83608 0.183126 1.547188 fedtsyre 1 4.21320420 4.21320420 125.64 <.0001 gruppe 2 0.16165518 0.08082759 2.41 0.1082 PROGRAM2: UDSKRIFT 2: CLASS gruppe; MODEL ledning= fedtsyre/solution; Dependent Variable: ledning Model 1 4.21320420 4.21320420 114.84 <.0001 Error 30 1.10064268 0.03668809 Corrected Total 31 5.31384688 R-Square Coeff Var Root MSE ledning Mean 0.792873 12.37997 0.191541 1.547188 fedtsyre 1 4.21320420 4.21320420 114.84 <.0001 Standard Parameter Estimate Error t Value Pr > t Intercept -47.82207620 4.60706854-10.38 <.0001 fedtsyre 0.60059932 0.05604555 10.72 <.0001 5