Reeksamen i Statistik for biokemikere. Blok 3 2007.



Relaterede dokumenter
Reeksamen i Statistik for biokemikere. Blok

Eksamen i Statistik for biokemikere. Blok

Eksamen i Statistik for biokemikere. Blok

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1

Reeksamen i Statistik for Biokemikere 6. april 2009

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

Eksamen i Statistik for Biokemikere, Blok januar 2009

Variansanalyse i SAS. Institut for Matematiske Fag December 2007

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6

Variansanalyse i SAS 1. Institut for Matematiske Fag December 2007

Eksamen i Statistik for biokemikere. Blok

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

CLASS temp medie; MODEL rate=temp medie/solution; RUN;

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge

Afdeling for Anvendt Matematik og Statistik December 2006

Afdeling for Anvendt Matematik og Statistik Januar Regressionsanalyse i SAS 2. Regressionsanalyse med GLM Sammenligning af regressionslinier

Regressionsanalyse i SAS

k normalfordelte observationsrækker (ensidet variansanalyse)

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013

β = SDD xt SSD t σ 2 s 2 02 = SSD 02 f 02 i=1

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer.

Lineær regression i SAS. Lineær regression i SAS p.1/20

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j

Vejledende besvarelse af eksamen i Statistik for biokemikere, blok

Besvarelse af vitcap -opgaven

Tovejs-ANOVA (Faktoriel) Regler og problemer kan generaliseres til mere end to hovedfaktorer med tilhørende interaktioner

Besvarelse af juul2 -opgaven

Skriftlig eksamen Science statistik- ST501

Kursus i varians- og regressionsanalyse Data med detektionsgrænse. Birthe Lykke Thomsen H. Lundbeck A/S

Vi ønsker at konstruere normalområder for stofskiftet, som funktion af kropsvægten.

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

Postoperative komplikationer

Vejledende besvarelse af hjemmeopgave, forår 2015

Opgavens formålet er at undersøge variationen mellem to laboratoriers bestemmelse af po 2 i blod.

Model. (m separate analyser). I vores eksempel er m = 2, n 1 = 13 (13 journalister) og

En Introduktion til SAS. Kapitel 5.

Ovenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm.

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model

Skriftlig Eksamen ST501: Science Statistik Tirsdag den 8. juni 2010 kl

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning

Forelæsning 11: Kapitel 11: Regressionsanalyse

Skriftlig Eksamen ST501: Science Statistik Mandag den 11. juni 2007 kl

Løsning eksamen d. 15. december 2008

Skriftlig Eksamen ST501: Science Statistik Torsdag den 4. januar 2007 kl

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Dagens Emner. Likelihood teori. Lineær regression (intro) p. 1/22

Muligheder: NB: test for µ 1 = µ 2 i model med blocking ækvivalent med parret t-test! Ide: anskue β j som stikprøve fra normalfordeling.

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

En Introduktion til SAS. Kapitel 6.

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

n r x rs x r = 1 n r s=1 (x rs x r ) 2, s=1

Indhold. 2 Tosidet variansanalyse Additive virkninger Vekselvirkning... 9

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Opgavebesvarelse, brain weight

MPH specialmodul i epidemiologi og biostatistik. SAS. Introduktion til SAS. Eksempel: Blodtryk og fedme

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

Vejledende besvarelse af hjemmeopgave, efterår 2018

Skriftlig Eksamen ST501: Science Statistik Mandag den 11. juni 2007 kl

Opgavebesvarelse, brain weight

Vejledende besvarelse af hjemmeopgave, forår 2018

To-sidet varians analyse

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger

Program. 1. Flersidet variansanalyse 1/11

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

MPH specialmodul i epidemiologi og biostatistik. SAS. Introduktion til SAS. Eksempel: Blodtryk og fedme

Program. 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. 1/12

Statistiske Modeller 1: Kontingenstabeller i SAS

To-sidet variansanalyse

Løsning til eksaminen d. 14. december 2009

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper.

Vejledende besvarelse af hjemmeopgave

Dagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

Restsaltmængdernes afhængighed af trafikken,

Man indlæser en såkaldt frequency-table i SAS ved følgende kommandoer:

Konfidensintervaller og Hypotesetest

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

(studienummer) (underskrift) (bord nr)

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

Multipel Lineær Regression

Køn. Holdning Mænd Kvinder Ialt JA NEJ VED IKKE

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Referat : af Gruppearbejde Økonometri1 øvelsestime ugeseddel 7 dato 26/3 2003, Hold 4

Modul 6: Regression og kalibrering

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Vejledende besvarelse af hjemmeopgave i Basal Statistik, forår 2014

Basal Statistik Kategoriske Data

Modelkontrol i Faktor Modeller

To samhørende variable

Et firma tuner biler. Antallet af en bils cylindere er givet ved den stokastiske variabel X med massetæthedsfunktionen

Normalfordelingen og Stikprøvefordelinger

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger

Logistisk Regression - fortsat

ELISA. ELISA (enzyme-linked immunosorbent assay) forsøg bruges til at detektere og kvantificere stoffer såsom proteiner, peptider, antistoffer o.lig.

Transkript:

Københavns Universitet Det Naturvidenskabelige Fakultet Reeksamen i Statistik for biokemikere. Blok 3 2007. Opgave 1. 3 timers skriftlig prøve. Alle hjælpemidler - også blyant - er tilladt. Opgavesættet er på 5 sider. En persons prothrombinindeks er en markør for leversvigt. 40 personer fik prothrombinindekset målt til to tidspunkter. For hver person udregnedes ændringen over den betragtede periode. For ændringerne fandt man x = 1 40 40 r=1 x r = 16.55 og s 2 = 1 40 39 r=1(x r x) 2 = 394.7667. Ændringerne i prothrombinindeks kan i det følgende antages at være indbyrdes uafhængige og identisk normalfordelte. (a) Udfør et test for hypotesen om, at ændringerne har middelværdien 0. For yderligere 20 personer fra samme population måltes ændringen i prothrombinindeks. Her fandt man x = 1 20 20 r=1 x r = 9.00 og s 2 = 1 20 19 r=1(x r x) 2 = 412.7368. (b) Gør rede for, at de to grupper kan antages at have samme varians. (c) Kan de to grupper antages at have samme ændring i prothrombinindeks? Opgave 2. I visse undersøgelser af tumorer indgår en bestemmelse af cellekinetiske parametre i tumorvævet, heriblandt den såkaldte G 1 -fraktion. Ved hjælp af en kanyle tages en prøve (aspirat) fra tumoren og G 1 -fraktionen i aspiratet bestemmes. Tumorvæv kan opbevares ved enten at nedfryse aspirater fra frisk tumor eller ved nedfrysning af et helt vævsstykke, som derefter kan optøes og aspireres. Fra hver af fire tumorer er der nedfrosset to aspirater og to tumorstykker. Efter en uge er aspirater og vævsstykker fra tumor nr. 1 og 2 tøet op og analyseret, og efter en måned er aspirater og vævsstykker fra tumor nr. 3 og 4 tøet op og analyseret. Resultaterne er angivet i tabellen nedenfor. 1

G 1 -fraktion i tumorvæv ved forskellige behandlinger Behandling Tumor nr. Frysetid Frosset aspirat Frosset vævsstykke 1 1 uge 69.29 66.45 74.24 71.44 2 1 uge 68.10 69.21 72.12 69.73 3 1 måned 67.15 70.36 72.59 74.56 4 1 måned 67.90 66.60 67.33 66.35 (a) Vis på grundlag af dette materiale, at G 1 -fraktionen for hver behandling ikke påvirkes forskelligt hverken af tumor eller af frysetid. Brug eventuelt resultaterne fra SAS-udskriften. (b) Undersøg, om behandling påvirker målingerne. Brug eventuelt resultaterne fra SAS-udskriften. (c) Gør rede for forudsætningerne for analysen. Bilag: Data antages at ligge i et SAS-datasæt med de fire variable tumor, tid, behand og g1, der angiver henholdsvis tumor, frysetid, behandling og måling af G 1 -fraktion. PROGRAM: UDSKRIFT: CLASS tumor frysetid behand; MODEL g1=frysetid behand tumor behand; Dependent Variable: g1 Model 7 91.5857750 13.0836821 5.27 0.0161 Error 8 19.8426000 2.4803250 Corrected Total 15 111.4283750 R-Square Coeff Var Root MSE g1 Mean 0.821925 2.263160 1.574905 69.58875 frysetid 1 3.74422500 3.74422500 1.51 0.2541 behand 1 33.93062500 33.93062500 13.68 0.0061 frysetid*behand 1 2.00222500 2.00222500 0.81 0.3952 tumor 2 34.58725000 17.29362500 6.97 0.0177 tumor*behand 2 17.32145000 8.66072500 3.49 0.0813 2

Opgave 3 For at sammenligne visuel og automatisk scoring af granolocyt/macrofag kolonier blev 7 dage gamle celle-aggregater scoret med begge metoder. Både mikroskopi og automatisk tælling blev foretaget på kodede museknoglemarvskulturer i methycellulose, stimuleret med behandlet medium indeholdende cellekulturer fra musemilt. Ikke-kolonier var defineret som celle-aggregater indeholdende mindre end 50 celler. Data er fra Benestad et.al. Universitetet i Oslo. (a) Er der sammenhæng mellem de to scoringsmetoder? (b) Estimer andelen af celle-aggregater, der bliver scoret ens ved de to metoder. Visuel og automatisk scoring af granolocyt/macrofag kolonier Antal og rækkeprocenter Visuel Automatisk scoring scoring Ikke-kolonier Kolonier Ialt Ikke-kolonier 67 6 73 91.78 8.22 Tvivlsomme kolonier 28 28 56 50.0 50.0 Kolonier 6 205 211 2.84 97.16 I alt 101 239 340 Bilag: Data antages at ligge i datasættet koloni med de tre variable visuel, automat og antal, hvor sidstnævnte angiver antal celle-aggregater med den pågældende kombination af baggrundsvariable. PROGRAM: PROC FREQ DATA=koloni; TABLES visuel*automat/nopct NOCOL CHISQ; WEIGHT antal; UDSKRIFT (redigeret): The FREQ Procedure Statistics for Table of visuel by automat Statistic DF Value Prob Chi-Square 2 218.6665 <.0001 Likelihood Ratio Chi-Square 2 240.0205 <.0001 Sample Size = 340 3

Opgave 4. Fedtsyreprocenten er den fundamentale kvalitetsegenskab ved sæbe. Den bestemmes sædvanligvis ved langsomme kemiske laboratoriemålinger. Til lettelse af produktionskontrollen i sæbefabrikker har man foreslået at bestemme fedtsyreprocenten ved at måle sæbens elektriske ledningsevne. Ledningsevnen er let at måle, og målingerne kan udføres på produktionsstedet. I nedenstående tabel findes en række uafhængige bestemmelser af ledningsevnen målt i milli-siemens (ms) for en bestemt sæbetype og forskellige fedtsyreprocenter. Sammenhæng mellem fedtsyreprocent og ledningsevne i sæbe Gruppe Fedtsyre- Ledningsevne procent i ms 1 81.3 1.40 1.20 0.90 1.00 1.08 1.03 0.98 0.88 2 82.2 1.75 1.50 1.70 1.80 1.34 1.44 1.49 1.24 3 82.3 1.52 1.52 1.67 1.67 1.35 1.50.1.30.1.45 4 83.0 2.10 1.95 1.85 1.90 2.45 2.35 2.20 2.00 (a) Vis, at det kan antages at ledningsevnen kan udtrykkes ved en lineær funktion af fedtsyreprocenten i det område målingerne dækker og angiv den estimerede regressionslinje. (b) Undersøg, om regressionslinjen kan antages at have hældningen 0. (c) Hvad er forudsætningerne for analysen? For en ny sæbeprøve måler man ledningsevnen 5 gange, hvilket giver målingerne: 1.36, 1.74, 1.65, 1.54, 1.32 (d) Beregn, på basis af den estimerede regressionslinje, en prediktion for sæbens fedtsyreprocent og angiv et 95% konfidensinterval for den predikterede værdi af fedtsyreprocenten. Bilag: Data antages at ligge i et SAS-datasæt med de tre variable fedtsyre og ledning, der angiver sammenhørende værdier af fedtsyreprocent og ledningsevne, samt variablen gruppe, med værdierne 1,2,3,4 svarende til de fire værdier af fedtsyreprocent. PROGRAM 1: CLASS gruppe; MODEL ledning= fedtsyre gruppe; 4

UDSKRIFT 1: Dependent Variable: ledning Model 3 4.37485937 1.45828646 43.49 <.0001 Error 28 0.93898750 0.03353527 Corrected Total 31 5.31384688 R-Square Coeff Var Root MSE ledning Mean 0.823294 11.83608 0.183126 1.547188 fedtsyre 1 4.21320420 4.21320420 125.64 <.0001 gruppe 2 0.16165518 0.08082759 2.41 0.1082 PROGRAM2: UDSKRIFT 2: CLASS gruppe; MODEL ledning= fedtsyre/solution; Dependent Variable: ledning Model 1 4.21320420 4.21320420 114.84 <.0001 Error 30 1.10064268 0.03668809 Corrected Total 31 5.31384688 R-Square Coeff Var Root MSE ledning Mean 0.792873 12.37997 0.191541 1.547188 fedtsyre 1 4.21320420 4.21320420 114.84 <.0001 Standard Parameter Estimate Error t Value Pr > t Intercept -47.82207620 4.60706854-10.38 <.0001 fedtsyre 0.60059932 0.05604555 10.72 <.0001 5