Eksamen i Statistik for Biokemikere, Blok januar 2009

Relaterede dokumenter
Reeksamen i Statistik for Biokemikere 6. april 2009

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1

Variansanalyse i SAS 1. Institut for Matematiske Fag December 2007

Eksamen i Statistik for biokemikere. Blok

Besvarelse af vitcap -opgaven

Reeksamen i Statistik for biokemikere. Blok

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved

CLASS temp medie; MODEL rate=temp medie/solution; RUN;

Variansanalyse i SAS. Institut for Matematiske Fag December 2007

Lineær regression i SAS. Lineær regression i SAS p.1/20

Eksamen i Statistik for biokemikere. Blok

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model

Afdeling for Anvendt Matematik og Statistik Januar Regressionsanalyse i SAS 2. Regressionsanalyse med GLM Sammenligning af regressionslinier

Reeksamen i Statistik for biokemikere. Blok

En Introduktion til SAS. Kapitel 5.

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger

Skriftlig eksamen Science statistik- ST501

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper.

β = SDD xt SSD t σ 2 s 2 02 = SSD 02 f 02 i=1

Vejledende besvarelse af hjemmeopgave

Besvarelse af juul2 -opgaven

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013

Kursus i varians- og regressionsanalyse Data med detektionsgrænse. Birthe Lykke Thomsen H. Lundbeck A/S

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer.

k normalfordelte observationsrækker (ensidet variansanalyse)

Vi ønsker at konstruere normalområder for stofskiftet, som funktion af kropsvægten.

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6

Opgavebesvarelse, Basalkursus, uge 2

Regressionsanalyse i SAS

Vejledende besvarelse af hjemmeopgave, efterår 2018

Basal statistik. 30. oktober 2007

Tovejs-ANOVA (Faktoriel) Regler og problemer kan generaliseres til mere end to hovedfaktorer med tilhørende interaktioner

Basal statistik. 30. oktober Den generelle lineære model

n r x rs x r = 1 n r s=1 (x rs x r ) 2, s=1

Generelle lineære modeller

Vejledende besvarelse af hjemmeopgave, efterår 2017

Vejledende besvarelse af hjemmeopgave, forår 2017

Vejledende besvarelse af hjemmeopgave i Basal Statistik, forår 2014

Basal statistik. 21. oktober 2008

Vejledende besvarelse af hjemmeopgave, forår 2018

Vejledende besvarelse af hjemmeopgave, forår 2015

Vejledende besvarelse af hjemmeopgave, efterår 2016

2. januar 2015 Proj.nr Version 1 LRK/EHBR/EVO/CCM/MT. Rapport

Restsaltmængdernes afhængighed af trafikken,

Vejledende besvarelse af hjemmeopgave, forår 2016

Phd-kursus i Basal Statistik, Opgaver til 2. uge

Opgavebesvarelse, korrelerede målinger

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j

Modul 11: Simpel lineær regression

Opgavebesvarelse, Basalkursus, uge 3

CIVILINGENIØREKSAMEN Side 1 af 23 sider. Skriftlig prøve, den: 17. december 2001 Kursus nr : (navn) (underskrift) (bord nr)

Statistiske Modeller 1: Kontingenstabeller i SAS

Besvarelse af opgave om Vital Capacity

Referat : af Gruppearbejde Økonometri1 øvelsestime ugeseddel 7 dato 26/3 2003, Hold 4

Skriftlig eksamen Science statistik- ST501

En Introduktion til SAS. Kapitel 6.

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

Multipel Lineær Regression

Opgavebesvarelse, brain weight

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Afdeling for Anvendt Matematik og Statistik December 2006

Køn. Holdning Mænd Kvinder Ialt JA NEJ VED IKKE

Klasseøvelser dag 2 Opgave 1

Opgavebesvarelse, brain weight

Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge

To-sidet varians analyse

Basal Statistik. Sammenligning af grupper. Vitamin D eksemplet. Praktisk håndtering af data. Faculty of Health Sciences

Overlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere.

Faculty of Health Sciences. Basal Statistik. Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 7. februar 2017

Kvant Eksamen December timer med hjælpemidler. 1 Hvad er en continuous variable? Giv 2 illustrationer.

Besvarelse af opgave om Vital Capacity

Basal statistik. Logaritmer og kovariansanalyse. Nyt eksempel vedr. sammenligning af målemetoder. Scatter plot af de to metoder

Faculty of Health Sciences. Basal statistik. Logaritmer. Kovariansanalyse. Lene Theil Skovgaard. 29. september 2015

Eksamen i Statistik for biokemikere. Blok

Vejledende besvarelse af hjemmeopgave, efterår 2015

Skriftlig Eksamen ST501: Science Statistik Mandag den 11. juni 2007 kl

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

Postoperative komplikationer

Man indlæser en såkaldt frequency-table i SAS ved følgende kommandoer:

Model. (m separate analyser). I vores eksempel er m = 2, n 1 = 13 (13 journalister) og

Løsning eksamen d. 15. december 2008

Side 1 af 19 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402

Øvelser i epidemiologi og biostatistik, 6. april 2010 Baseline-informationer fra Ebeltoft datasættet Eksempel på besvarelse

Logistisk Regression - fortsat

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning

Løsning til eksaminen d. 14. december 2009

(studienummer) (underskrift) (bord nr)

Opgave I.1 II.1 II.2 II.3 III.1 IV.1 IV.2 IV.3 V.1 VI.1 Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar

Epidemiologi og Biostatistik

Skriftlig Eksamen ST501: Science Statistik Tirsdag den 8. juni 2010 kl

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression

Program. Residualanalyse Flersidet variansanalyse. Opgave BK.15. Modelkontrol: residualplot

Supplerende opgaver. 2. Beregn gennemsnit og median for variablen Serum Creatinine. 3. Beregn gennemsnit og varians for BMI delt op efter Sex.

Løsning til opgave i logistisk regression

MPH specialmodul Epidemiologi og Biostatistik

Transkript:

Københavns Universitet Det Naturvidenskabelige Fakultet Eksamen i Statistik for Biokemikere, Blok 2 2008 09 19. januar 2009 Alle hjælpemidler er tilladt, og besvarelsen må gerne skrives med blyant. Opgavesættet er på 7 sider. Det består af tre opgaver med i alt 13 delspørgsmål. Opgave 1 (3 delspørgsmål) Ved tælling af en bestemt type celler i blodet hos svin kan man anvende to metoder, en manuel eller en automatisk. For 10 svin har de to metoder givet følgende resultater (i procent af totalt antal celler): Svin nr. 1 2 3 4 5 6 7 8 9 10 Manuel 29.0 55.0 35.0 44.0 58.5 44.5 52.5 55.5 55.0 38.0 Automatisk 27.0 39.0 26.0 34.0 52.0 44.0 41.0 57.0 46.0 21.0 1. Angiv et estimat samt et konfidensinterval for forskellen mellem tælleresultaterne for de to metoder. 2. Kan der på basis af resultaterne påvises systematisk forskel på de to metoder? 3. Antag nu at at man ønsker at sammenligne tre metoder, og at der for hvert svin foreligger celletællinger fra alle tre metoder. Hvilken type analyse ville du bruge til at undersøge om der er forskel på metoderne? Angiv desuden en stump SAS-kode som kan bruges til analysen. SAS-programmer og output er givet nedenfor til to analyser. Du skal kun bruge den ene. Bemærk at data ligger på to måder, i SAS-datasættene svin1 henholdsvis svin2. Print af SAS-datasættet svin1 Obs celler metode 1 29.0 manuel 2 55.0 manuel...... [Flere linier med data] 19 46.0 auto 20 21.0 auto

Print af SAS-datasættet svin2 Obs manuel auto 1 29.0 27 2 55.0 39...... [Flere linier med data] 10 38.0 21 SAS-program 1 med output (en smule redigeret) proc ttest data=svin1 alpha=0.05; class metode; var celler; Statistics Lower CL Upper CL Lower CL Upper CL Variable metode N Mean Mean Mean Std Dev Std Dev Std Dev Std Err celler auto 10 30.33 38.7 47.07 8.048 11.7 21.36 3.7 celler manuel 10 39.443 46.7 53.957 6.9774 10.144 18.519 3.2078 celler Diff (1-2) -18.29-8 2.2881 8.2739 10.95 16.193 4.8969 T-Tests Variable Method Variances DF t Value Pr > t celler Pooled Equal 18-1.63 0.1197 celler Satterthwaite Unequal 17.6-1.63 0.1200 Equality of Variances Variable Method Num DF Den DF F Value Pr > F celler Folded F 9 9 1.33 0.6775 SAS-program 2 med output (en smule redigeret) proc ttest data=svin2 alpha=0.05; paired auto*manuel; Statistics Lower CL Upper CL Lower CL Upper CL Difference N Mean Mean Mean Std Dev Std Dev Std Dev Std Err auto - manuel 10-12.45-8 -3.552 4.2771 6.2183 11.352 1.9664 T-Tests Difference DF t Value Pr > t auto - manuel 9-4.07 0.0028 2

Opgave 2 (5 delspørgsmål) Som del af et større oxidationsforsøg med lipider blev en linolsyreopløsning tilsat drueekstrakt med en koncentration på 0.2%. Efter 10 minutter nedenfor angivet som tid 0 blev den relative oxygenkoncentration (i procent af startniveauet) målt 14 gange med 20 sekunders mellemrum. Data er vist i tabellen og figuren nedenfor. Tid 0 20 40 60 80 100 120 Oxygenkonc. 93.8 93.5 93.2 92.8 92.5 92.4 92.0 Tid 140 160 180 200 220 240 260 Oxygenkonc. 91.8 91.4 91.2 90.8 90.6 90.4 90.1 Oxygenkonc. 90 91 92 93 0 50 100 150 200 250 Tid 1. Opskriv en statistisk model hvor oxygenkoncentrationen afhænger lineært af tiden (regnet fra 10 minutter efter tilsætning af drueekstrakt). 2. Bestem estimater for parametrene i modellen. Bestem også et 95%-konfidensinterval for hældningsparameteren. 3. Bestem det forventede fald i oxygenkoncentration over en periode på 2 minutter. Bestem også et 95%-konfidensinterval for det forventede fald. 4. Oxygenkoncentrationen i linolsyre kan antages at falde med 15 procentpoint over en periode på 2 minutter hvis der ikke tilsættes drueekstrakt. Tyder data på at oxidationsprocessen påvirkes af drueekstrakt? 5. I eksperimentet måltes også værdien 91.0 til tid 150 sekunder, men målingen blev sorteret fra af personen der lavede eksperimentet fordi han syntes den var for lav og derfor måtte være forkert. Var det en rimelig beslutning? 3

Data er indlæst i SAS-datasættet linol med variablene tid og oxygen. SAS-program 1 med output (en smule redigeret) proc reg data=linol; model oxygen = tid; The REG Procedure Model: MODEL1 Dependent Variable: oxygen Analysis of Variance Sum of Mean Source DF Squares Square F Value Pr > F Model 1 18.37197 18.37197 3846.28 <.0001 Error 12 0.05732 0.00478 Corrected Total 13 18.42929 Root MSE 0.06911 R-Square 0.9969 Dependent Mean 91.89286 Adj R-Sq 0.9966 Coeff Var 0.07521 Parameter Estimates Parameter Standard Variable DF Estimate Error t Value Pr > t Intercept 1 93.74000 0.03505 2674.73 <.0001 tid 1-0.01421 0.00022911-62.02 <.0001 SAS-program 2 med output (en smule redigeret) proc means data=linol n mean css; var tid oxygen; The MEANS Procedure Variable N Mean Corrected SS tid 14 130.0000000 91000.00 oxygen 14 91.8928571 18.4292857 4

Opgave 3 (5 delspørgsmål) For at undersøge den antioxidative effekt af alfatocopherol og betacaroten på mælkelignende emulsioner lavede man følgende forsøg med 16 emulsionsprøver: Fire prøver blev tilsat både alfatocopherol og betacaroten, fire prøver blev tilsat alfatocopherol men ikke betacaroten, fire prøver blev tilsat betacaroten men ikke både alfatocopherol, og endelig blev fire prøver hverken tilsat alfatocopherol eller betacaroten. Efter cirka to døgn blev et mål for den relative oxidationsproces opgjort i form af peroxidværdier. Data er givet i følgende tabel. kontrol kun alfatoc. kun betacar. begge 0.54 0.26 0.60 0.36 0.53 0.27 0.56 0.34 0.61 0.28 0.59 0.34 0.64 0.30 0.66 0.37 Data er indlæst i datasættet perox der er vist nedenfor. Variablen atoco har værdien 1 hvis der er tilsat alfatocopherol og 0 ellers. Variablen bcaro har værdien 1 hvis der er tilsat betacaroten og 0 ellers. I de tre første spørgsmål behøver du ikke overveje om antagelserne for analysen er rimelige. 1. Undersøg om vekselvirkningen mellem tilsætning af alfatocopherol og betacaroten er signifikant. 2. Undersøg om tilsætning af alfatocopherol påvirker peroxidtallet og om tilsætning af betacaroten påvirker peroxidtallet. 3. Bestem den forventede ændring i peroxidtallet ved tilsætning af alfatocopherol. Afhænger denne forskel af om der er tilsat betacaroten? Figuren nedenfor viser residualplottet for modellen med vekselvirkning. Standardiseret residual 2 1 0 1 2 0.30 0.35 0.40 0.45 0.50 0.55 0.60 Forventet værdi 5

4. Giver residualplotttet anledning til bekymring (svaret skal begrundes). I givet fald, overvej hvordan man måske kunne løse problemet. I forsøget indgik også stoffet ascorbinsyre, og vi skal i det sidste spørgsmål undersøge kombinationseffekten ved tilsætning af alfatocopherol og ascorbinsyre. De relevante data er givet i tabellen nedenfor. De to første søjler kopieret fra tabellen med alfatocopherol-betacaroten data. Den sidste række angiver gennemsnittet af de fire værdier for den pågældende gruppe. kontrol kun alfatoc. kun ascorbinsyre begge 0.54 0.26 3.48 0.42 0.53 0.27 3.75 0.28 0.61 0.28 4.13 0.25 0.64 0.30 4.45 0.35 0.58 0.28 3.95 0.33 I den tosidede variansanalyse med hovedeffekter af alfatocopherol og ascorbinsyre samt deres vekselvirkning, er vekselvirkningen signifikant (p < 0.0001). SAS-analysen er ikke vist og skal ikke bruges i det følgende. 5. Forklar hvad vekselvirkningen betyder, for eksempel ved at lave en passende figur/skitse over de fire gennemsnit. Print af SAS-datasættet perox Obs atoco bcaro perox 1 0 0 0.54 2 0 0 0.53 3 0 0 0.61 4 0 0 0.64 5 1 0 0.26 6 1 0 0.27 7 1 0 0.28 8 1 0 0.30 9 0 1 0.60 10 0 1 0.56 11 0 1 0.59 12 0 1 0.66 13 1 1 0.36 14 1 1 0.34 15 1 1 0.34 16 1 1 0.37 SAS-program 1 med output (en smule redigeret) proc glm data=perox; class atoco bcaro; model perox = atoco bcaro atoco*bcaro; 6

Sum of Source DF Squares Mean Square F Value Pr > F Model 3 0.31751875 0.10583958 82.34 <.0001 Error 12 0.01542500 0.00128542 Corrected Total 15 0.33294375 R-Square Coeff Var Root MSE perox Mean 0.953671 7.912322 0.035853 0.453125 Source DF Type I SS Mean Square F Value Pr > F atoco 1 0.30525625 0.30525625 237.48 <.0001 bcaro 1 0.00950625 0.00950625 7.40 0.0186 atoco*bcaro 1 0.00275625 0.00275625 2.14 0.1688 Source DF Type III SS Mean Square F Value Pr > F atoco 1 0.30525625 0.30525625 237.48 <.0001 bcaro 1 0.00950625 0.00950625 7.40 0.0186 atoco*bcaro 1 0.00275625 0.00275625 2.14 0.1688 SAS-program 2 med output (en smule redigeret) proc glm data=perox; class atoco bcaro; model perox = atoco bcaro; means atoco / tukey cldiff; Sum of Source DF Squares Mean Square F Value Pr > F Model 2 0.31476250 0.15738125 112.53 <.0001 Error 13 0.01818125 0.00139856 Corrected Total 15 0.33294375 R-Square Coeff Var Root MSE perox Mean 0.945392 8.253196 0.037397 0.453125 Source DF Type I SS Mean Square F Value Pr > F atoco 1 0.30525625 0.30525625 218.27 <.0001 bcaro 1 0.00950625 0.00950625 6.80 0.0217 Source DF Type III SS Mean Square F Value Pr > F atoco 1 0.30525625 0.30525625 218.27 <.0001 bcaro 1 0.00950625 0.00950625 6.80 0.0217 Tukey s Studentized Range (HSD) Test for perox NOTE: This test controls the Type I experimentwise error rate. Comparisons significant at the 0.05 level are indicated by ***. Difference atoco Between Simultaneous 95% Comparison Means Confidence Limits 0-1 0.27625 0.23585 0.31665 *** 1-0 -0.27625-0.31665-0.23585 *** 7