Københavns Universitet Det Naturvidenskabelige Fakultet Eksamen i Statistik for Biokemikere, Blok 2 2008 09 19. januar 2009 Alle hjælpemidler er tilladt, og besvarelsen må gerne skrives med blyant. Opgavesættet er på 7 sider. Det består af tre opgaver med i alt 13 delspørgsmål. Opgave 1 (3 delspørgsmål) Ved tælling af en bestemt type celler i blodet hos svin kan man anvende to metoder, en manuel eller en automatisk. For 10 svin har de to metoder givet følgende resultater (i procent af totalt antal celler): Svin nr. 1 2 3 4 5 6 7 8 9 10 Manuel 29.0 55.0 35.0 44.0 58.5 44.5 52.5 55.5 55.0 38.0 Automatisk 27.0 39.0 26.0 34.0 52.0 44.0 41.0 57.0 46.0 21.0 1. Angiv et estimat samt et konfidensinterval for forskellen mellem tælleresultaterne for de to metoder. 2. Kan der på basis af resultaterne påvises systematisk forskel på de to metoder? 3. Antag nu at at man ønsker at sammenligne tre metoder, og at der for hvert svin foreligger celletællinger fra alle tre metoder. Hvilken type analyse ville du bruge til at undersøge om der er forskel på metoderne? Angiv desuden en stump SAS-kode som kan bruges til analysen. SAS-programmer og output er givet nedenfor til to analyser. Du skal kun bruge den ene. Bemærk at data ligger på to måder, i SAS-datasættene svin1 henholdsvis svin2. Print af SAS-datasættet svin1 Obs celler metode 1 29.0 manuel 2 55.0 manuel...... [Flere linier med data] 19 46.0 auto 20 21.0 auto
Print af SAS-datasættet svin2 Obs manuel auto 1 29.0 27 2 55.0 39...... [Flere linier med data] 10 38.0 21 SAS-program 1 med output (en smule redigeret) proc ttest data=svin1 alpha=0.05; class metode; var celler; Statistics Lower CL Upper CL Lower CL Upper CL Variable metode N Mean Mean Mean Std Dev Std Dev Std Dev Std Err celler auto 10 30.33 38.7 47.07 8.048 11.7 21.36 3.7 celler manuel 10 39.443 46.7 53.957 6.9774 10.144 18.519 3.2078 celler Diff (1-2) -18.29-8 2.2881 8.2739 10.95 16.193 4.8969 T-Tests Variable Method Variances DF t Value Pr > t celler Pooled Equal 18-1.63 0.1197 celler Satterthwaite Unequal 17.6-1.63 0.1200 Equality of Variances Variable Method Num DF Den DF F Value Pr > F celler Folded F 9 9 1.33 0.6775 SAS-program 2 med output (en smule redigeret) proc ttest data=svin2 alpha=0.05; paired auto*manuel; Statistics Lower CL Upper CL Lower CL Upper CL Difference N Mean Mean Mean Std Dev Std Dev Std Dev Std Err auto - manuel 10-12.45-8 -3.552 4.2771 6.2183 11.352 1.9664 T-Tests Difference DF t Value Pr > t auto - manuel 9-4.07 0.0028 2
Opgave 2 (5 delspørgsmål) Som del af et større oxidationsforsøg med lipider blev en linolsyreopløsning tilsat drueekstrakt med en koncentration på 0.2%. Efter 10 minutter nedenfor angivet som tid 0 blev den relative oxygenkoncentration (i procent af startniveauet) målt 14 gange med 20 sekunders mellemrum. Data er vist i tabellen og figuren nedenfor. Tid 0 20 40 60 80 100 120 Oxygenkonc. 93.8 93.5 93.2 92.8 92.5 92.4 92.0 Tid 140 160 180 200 220 240 260 Oxygenkonc. 91.8 91.4 91.2 90.8 90.6 90.4 90.1 Oxygenkonc. 90 91 92 93 0 50 100 150 200 250 Tid 1. Opskriv en statistisk model hvor oxygenkoncentrationen afhænger lineært af tiden (regnet fra 10 minutter efter tilsætning af drueekstrakt). 2. Bestem estimater for parametrene i modellen. Bestem også et 95%-konfidensinterval for hældningsparameteren. 3. Bestem det forventede fald i oxygenkoncentration over en periode på 2 minutter. Bestem også et 95%-konfidensinterval for det forventede fald. 4. Oxygenkoncentrationen i linolsyre kan antages at falde med 15 procentpoint over en periode på 2 minutter hvis der ikke tilsættes drueekstrakt. Tyder data på at oxidationsprocessen påvirkes af drueekstrakt? 5. I eksperimentet måltes også værdien 91.0 til tid 150 sekunder, men målingen blev sorteret fra af personen der lavede eksperimentet fordi han syntes den var for lav og derfor måtte være forkert. Var det en rimelig beslutning? 3
Data er indlæst i SAS-datasættet linol med variablene tid og oxygen. SAS-program 1 med output (en smule redigeret) proc reg data=linol; model oxygen = tid; The REG Procedure Model: MODEL1 Dependent Variable: oxygen Analysis of Variance Sum of Mean Source DF Squares Square F Value Pr > F Model 1 18.37197 18.37197 3846.28 <.0001 Error 12 0.05732 0.00478 Corrected Total 13 18.42929 Root MSE 0.06911 R-Square 0.9969 Dependent Mean 91.89286 Adj R-Sq 0.9966 Coeff Var 0.07521 Parameter Estimates Parameter Standard Variable DF Estimate Error t Value Pr > t Intercept 1 93.74000 0.03505 2674.73 <.0001 tid 1-0.01421 0.00022911-62.02 <.0001 SAS-program 2 med output (en smule redigeret) proc means data=linol n mean css; var tid oxygen; The MEANS Procedure Variable N Mean Corrected SS tid 14 130.0000000 91000.00 oxygen 14 91.8928571 18.4292857 4
Opgave 3 (5 delspørgsmål) For at undersøge den antioxidative effekt af alfatocopherol og betacaroten på mælkelignende emulsioner lavede man følgende forsøg med 16 emulsionsprøver: Fire prøver blev tilsat både alfatocopherol og betacaroten, fire prøver blev tilsat alfatocopherol men ikke betacaroten, fire prøver blev tilsat betacaroten men ikke både alfatocopherol, og endelig blev fire prøver hverken tilsat alfatocopherol eller betacaroten. Efter cirka to døgn blev et mål for den relative oxidationsproces opgjort i form af peroxidværdier. Data er givet i følgende tabel. kontrol kun alfatoc. kun betacar. begge 0.54 0.26 0.60 0.36 0.53 0.27 0.56 0.34 0.61 0.28 0.59 0.34 0.64 0.30 0.66 0.37 Data er indlæst i datasættet perox der er vist nedenfor. Variablen atoco har værdien 1 hvis der er tilsat alfatocopherol og 0 ellers. Variablen bcaro har værdien 1 hvis der er tilsat betacaroten og 0 ellers. I de tre første spørgsmål behøver du ikke overveje om antagelserne for analysen er rimelige. 1. Undersøg om vekselvirkningen mellem tilsætning af alfatocopherol og betacaroten er signifikant. 2. Undersøg om tilsætning af alfatocopherol påvirker peroxidtallet og om tilsætning af betacaroten påvirker peroxidtallet. 3. Bestem den forventede ændring i peroxidtallet ved tilsætning af alfatocopherol. Afhænger denne forskel af om der er tilsat betacaroten? Figuren nedenfor viser residualplottet for modellen med vekselvirkning. Standardiseret residual 2 1 0 1 2 0.30 0.35 0.40 0.45 0.50 0.55 0.60 Forventet værdi 5
4. Giver residualplotttet anledning til bekymring (svaret skal begrundes). I givet fald, overvej hvordan man måske kunne løse problemet. I forsøget indgik også stoffet ascorbinsyre, og vi skal i det sidste spørgsmål undersøge kombinationseffekten ved tilsætning af alfatocopherol og ascorbinsyre. De relevante data er givet i tabellen nedenfor. De to første søjler kopieret fra tabellen med alfatocopherol-betacaroten data. Den sidste række angiver gennemsnittet af de fire værdier for den pågældende gruppe. kontrol kun alfatoc. kun ascorbinsyre begge 0.54 0.26 3.48 0.42 0.53 0.27 3.75 0.28 0.61 0.28 4.13 0.25 0.64 0.30 4.45 0.35 0.58 0.28 3.95 0.33 I den tosidede variansanalyse med hovedeffekter af alfatocopherol og ascorbinsyre samt deres vekselvirkning, er vekselvirkningen signifikant (p < 0.0001). SAS-analysen er ikke vist og skal ikke bruges i det følgende. 5. Forklar hvad vekselvirkningen betyder, for eksempel ved at lave en passende figur/skitse over de fire gennemsnit. Print af SAS-datasættet perox Obs atoco bcaro perox 1 0 0 0.54 2 0 0 0.53 3 0 0 0.61 4 0 0 0.64 5 1 0 0.26 6 1 0 0.27 7 1 0 0.28 8 1 0 0.30 9 0 1 0.60 10 0 1 0.56 11 0 1 0.59 12 0 1 0.66 13 1 1 0.36 14 1 1 0.34 15 1 1 0.34 16 1 1 0.37 SAS-program 1 med output (en smule redigeret) proc glm data=perox; class atoco bcaro; model perox = atoco bcaro atoco*bcaro; 6
Sum of Source DF Squares Mean Square F Value Pr > F Model 3 0.31751875 0.10583958 82.34 <.0001 Error 12 0.01542500 0.00128542 Corrected Total 15 0.33294375 R-Square Coeff Var Root MSE perox Mean 0.953671 7.912322 0.035853 0.453125 Source DF Type I SS Mean Square F Value Pr > F atoco 1 0.30525625 0.30525625 237.48 <.0001 bcaro 1 0.00950625 0.00950625 7.40 0.0186 atoco*bcaro 1 0.00275625 0.00275625 2.14 0.1688 Source DF Type III SS Mean Square F Value Pr > F atoco 1 0.30525625 0.30525625 237.48 <.0001 bcaro 1 0.00950625 0.00950625 7.40 0.0186 atoco*bcaro 1 0.00275625 0.00275625 2.14 0.1688 SAS-program 2 med output (en smule redigeret) proc glm data=perox; class atoco bcaro; model perox = atoco bcaro; means atoco / tukey cldiff; Sum of Source DF Squares Mean Square F Value Pr > F Model 2 0.31476250 0.15738125 112.53 <.0001 Error 13 0.01818125 0.00139856 Corrected Total 15 0.33294375 R-Square Coeff Var Root MSE perox Mean 0.945392 8.253196 0.037397 0.453125 Source DF Type I SS Mean Square F Value Pr > F atoco 1 0.30525625 0.30525625 218.27 <.0001 bcaro 1 0.00950625 0.00950625 6.80 0.0217 Source DF Type III SS Mean Square F Value Pr > F atoco 1 0.30525625 0.30525625 218.27 <.0001 bcaro 1 0.00950625 0.00950625 6.80 0.0217 Tukey s Studentized Range (HSD) Test for perox NOTE: This test controls the Type I experimentwise error rate. Comparisons significant at the 0.05 level are indicated by ***. Difference atoco Between Simultaneous 95% Comparison Means Confidence Limits 0-1 0.27625 0.23585 0.31665 *** 1-0 -0.27625-0.31665-0.23585 *** 7