CLASS temp medie; MODEL rate=temp medie/solution; RUN;

Relaterede dokumenter
Supplerende opgaver. 2. Beregn gennemsnit og median for variablen Serum Creatinine. 3. Beregn gennemsnit og varians for BMI delt op efter Sex.

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1

Eksamen i Statistik for biokemikere. Blok

Eksamen i Statistik for Biokemikere, Blok januar 2009

Eksamen i Statistik for biokemikere. Blok

Variansanalyse i SAS 1. Institut for Matematiske Fag December 2007

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved

Reeksamen i Statistik for biokemikere. Blok

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Variansanalyse i SAS. Institut for Matematiske Fag December 2007

En Introduktion til SAS. Kapitel 5.

Reeksamen i Statistik for Biokemikere 6. april 2009

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j

Reeksamen i Statistik for biokemikere. Blok

Besvarelse af vitcap -opgaven

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper.

Regressionsanalyse i SAS

Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger

Opgavebesvarelse, Basalkursus, uge 2

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer.

Afdeling for Anvendt Matematik og Statistik Januar Regressionsanalyse i SAS 2. Regressionsanalyse med GLM Sammenligning af regressionslinier

Vejledende besvarelse af hjemmeopgave

Basal statistik. 30. oktober 2007

Basal statistik. 30. oktober Den generelle lineære model

Eksamen i Statistik for biokemikere. Blok

Vejledende besvarelse af hjemmeopgave, efterår 2018

k normalfordelte observationsrækker (ensidet variansanalyse)

Kursus i varians- og regressionsanalyse Data med detektionsgrænse. Birthe Lykke Thomsen H. Lundbeck A/S

Vejledende besvarelse af hjemmeopgave i Basal Statistik, forår 2014

β = SDD xt SSD t σ 2 s 2 02 = SSD 02 f 02 i=1

Afdeling for Anvendt Matematik og Statistik December 2006

Ikke-parametriske tests

Vejledende besvarelse af hjemmeopgave, forår 2018

Phd-kursus i Basal Statistik, Opgaver til 2. uge

Opgavebesvarelse, Basalkursus, uge 3

Generelle lineære modeller

Besvarelse af opgave om Vital Capacity

Vejledende besvarelse af hjemmeopgave, forår 2017

Restsaltmængdernes afhængighed af trafikken,

Vejledende besvarelse af hjemmeopgave, efterår 2017

2. januar 2015 Proj.nr Version 1 LRK/EHBR/EVO/CCM/MT. Rapport

n r x rs x r = 1 n r s=1 (x rs x r ) 2, s=1

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering

Basal Statistik. En- og to-stikprøve problemer. Eksempel på parrede data. Eksempel på parrede data. Faculty of Health Sciences

Basal statistik. 21. oktober 2008

Faculty of Health Sciences. Basal Statistik. T-tests. Lene Theil Skovgaard. 17. september 2013

Postoperative komplikationer

Vejledende besvarelse af hjemmeopgave, forår 2015

Model. (m separate analyser). I vores eksempel er m = 2, n 1 = 13 (13 journalister) og

Vejledende besvarelse af hjemmeopgave, efterår 2016

Opgavebesvarelse, brain weight

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Vejledende besvarelse af eksamen i Statistik for biokemikere, blok

Vejledende besvarelse af hjemmeopgave, forår 2016

Lineær regression i SAS. Lineær regression i SAS p.1/20

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression

Tovejs-ANOVA (Faktoriel) Regler og problemer kan generaliseres til mere end to hovedfaktorer med tilhørende interaktioner

Øvelser i epidemiologi og biostatistik, 6. april 2010 Baseline-informationer fra Ebeltoft datasættet Eksempel på besvarelse

MPH specialmodul Epidemiologi og Biostatistik

Basal Statistik. Sammenligning af grupper. Vitamin D eksemplet. Praktisk håndtering af data. Faculty of Health Sciences

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

Program. Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering. Test for ens spredninger

Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge

Besvarelse af juul2 -opgaven

Skriftlig eksamen Science statistik- ST501

Faculty of Health Sciences. Basal Statistik. Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 7. februar 2017

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Besvarelse af opgave om Vital Capacity

Køn. Holdning Mænd Kvinder Ialt JA NEJ VED IKKE

Opgavebesvarelse, brain weight

Vejledende besvarelse af hjemmeopgave, efterår 2015

Side 1 af 19 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402

Øvelser i epidemiologi og biostatistik, 12. april 2010 Ebeltoft-projektet: Analyse af alkoholrelaterede data mm. Eksempel på besvarelse

Basal statistik. 16. september 2008

Basal statistik. Logaritmer og kovariansanalyse. Nyt eksempel vedr. sammenligning af målemetoder. Scatter plot af de to metoder

Faculty of Health Sciences. Basal statistik. Logaritmer. Kovariansanalyse. Lene Theil Skovgaard. 29. september 2015

MPH specialmodul i epidemiologi og biostatistik. SAS. Introduktion til SAS. Eksempel: Blodtryk og fedme

En Introduktion til SAS. Kapitel 6.

Dagens Temaer. Test for lineær regression. Test for lineær regression - via proc glm. k normalfordelte obs. rækker i proc glm. p. 1/??

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge

Statistiske Modeller 1: Kontingenstabeller i SAS

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april

Overlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere.

Vi ønsker at konstruere normalområder for stofskiftet, som funktion af kropsvægten.

k UAFHÆNGIGE grupper Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen 4 Hypotesetest (F-test)

Kvant Eksamen December timer med hjælpemidler. 1 Hvad er en continuous variable? Giv 2 illustrationer.

Forelæsning 11: Envejs variansanalyse, ANOVA

Klasseøvelser dag 2 Opgave 1

Normalfordelingen og Stikprøvefordelinger

Statistik i løb Supplerende opgaver

Basal statistik. 18. september 2007

Mantel-Haenszel analyser. Stratificerede epidemiologiske analyser

Eksempel: To metoder, som forventes at skulle give samme resultat: MF: Transmitral volumetric flow, bestemt ved Doppler ekkokardiografi

Basal statistik 19. september Eksempel: To metoder, som forventes at skulle give samme resultat:

Filen indeholder 45 linier, først en linie med variabelnavnene (bw og rmr) og derefter 44 datalinier, hver med disse to oplysninger.

Transkript:

Ugeopgave 2.1 Bakterieprøver fra patienter transporteres ofte til laboratoriet ved stuetemperatur samt mere eller mindre udsat for luftens ilt. Dette er især uheldigt for prøver som indeholder anaerobe bakterier. Nedenstående talmateriale er hentet fra et større projekt, der har til formål at undersøge transportmetodens indvirkning på forskellige anaerobe bakteriestammers overlevelse. Her sal vi kun interessere for en enkelt bakteriestamme, to temperaturer (4 o og 22 o ) og tre transportmedier (agar, tør, stuart). For hver kombination af temperatur og medie er der foretaget to forsøg. Målingerne i tabellen er log 10 (-log 10 (overlevelsesraten)), hvor overlevelsesraten er defineret ved hjælp af den brøkdel af bakterierne til tid 0, der overlever et døgn, idet denne transformation erfaringsmæssigt gør observationerne tilnærmet normalfordelte med samme varians. Temperatur Medie agar tør Stuart 4 o 0.662 0.778-0.473 0.568 0.591-0.173 22 o 1.303 1.434 0.605 1.243 1.632 0.583 (a) Afhænger overlevelsesraten af transporttemperatur og transportmedie? Bilag: Data antages at ligge i datasættet bakterie med de tre variable temp, medie og rate. PROGRAM1: PROGRAM2 UDSKRIFT1 PROC GLM; CLASS temp medie; MODEL rate=temp medie; PROC GLM; CLASS temp medie; MODEL rate=temp medie/solution; The GLM Procedure Class Level Information Class Levels Values temp 2 4 22 medie 3 agar stuart tor Number of observations 12 Dependent Variable: rate Sum of Source DF Squares Mean Square F Value Pr > F 1

Model 5 4.16031500 0.83206300 57.32 <.0001 Error 6 0.08709300 0.01451550 Corrected Total 11 4.24740800 R-Square Coeff Var Root MSE rate Mean 0.979495 16.48157 0.120480 0.731000 Source DF Type I SS Mean Square F Value Pr > F temp 1 1.94246533 1.94246533 133.82 <.0001 medie 2 2.17892150 1.08946075 75.05 <.0001 temp*medie 2 0.03892817 0.01946408 1.34 0.3301 1, 2002 8 UDSKRIFT2 The GLM Procedure Sum of Source DF Squares Mean Square F Value Pr > F Model 3 4.12138683 1.37379561 87.21 <.0001 Error 8 0.12602117 0.01575265 Corrected Total 11 4.24740800 Source DF Type I SS Mean Square F Value Pr > F temp 1 1.94246533 1.94246533 123.31 <.0001 medie 2 2.17892150 1.08946075 69.16 <.0001 Standard Parameter Estimate Error t Value Pr > t Intercept 1.511083333 B 0.07246297 20.85 <.0001 temp 4-0.804666667 B 0.07246297-11.10 <.0001 temp 22 0.000000000 B... medie agar -0.160000000 B 0.08874865-1.80 0.1091 medie stuart -0.973250000 B 0.08874865-10.97 <.0001 medie tor 0.000000000 B... Ugeopgave 2.2 For 23 bilmotorer har man målt sammenhørende værdier af HC, CO og NOX i udstødningsgassen (enhed: gram pr mile). Nedenfor findes en udskrift fra SASprogrammet PROC CORR. (a) Hvilke af de tre variable er positivt og hvilke er negativt korrelede?. (b) Er der nogle af de tre variable der kan antages at være ukorrelerede? For 23 andre motorer havde man målt HC i udstødningen. Disse målinger havde et gennemsnit på 0.563 og en empirisk spredning givet ved s = 0.1862. 2

(c) Kan disse nye målinger antages at ligge på samme niveau som de 23 første. Bilag: Data antages at ligge i datasættet motor med de fire variable gruppe, der angiver om det er første eller anden gruppe, og HC, CO og NOX. PROGRAM DATA corr; SET motor; IF gruppe=1; PROC CORR; VAR HC CO NOX; PROC TTEST DATA=motor; CLASS gruppe; VAR HC; UDSKRIFT The CORR Procedure (for gruppe 1) 3 Variables: HC CO NOX Simple Statistics Variable N Mean Std Dev Sum Minimum Maximum HC 23 0.54043 0.15158 12.43000 0.34000 0.87000 CO 23 7.38391 4.27194 169.83000 2.03000 19.00000 NOX 23 1.23957 0.41727 28.51000 0.49000 2.20000 Pearson Correlation Coefficients, N = 23, Prob > r under H0: Rho=0 HC CO NOX HC 1.00000 0.88345-0.53503 <.0001 0.0085 CO 0.88345 1.00000-0.72604 <.0001 <.0001 NOX -0.53503-0.72604 1.00000 0.0085 <.0001 The TTEST Procedure. Statistics Lower CL Upper CL Lower CL Upper CL Variable GRUPPE N Mean Mean Mean Std Dev Std Dev Std Dev Std Err HC 1 23 0.4749 0.5404 0.606 0.1172 0.1516 0.2145 0.0316 HC 2 23 0.4825 0.563 0.6436 0.144 0.1862 0.2635 0.0388 HC Diff (1-2) -0.124-0.023 0.0783 0.1405 0.1698 0.2145 0.0501 T-Tests Variable Method Variances DF t Value Pr > t HC Pooled Equal 44-0.45 0.6538 HC Satterthwaite Unequal 42.3-0.45 0.6539 3

Equality of Variances Variable Method Num DF Den DF F Value Pr > F HC Folded F 22 22 1.51 0.3419 Ugeopgave 2.3 Ved en undersøgelse af kosttilskuds indflydelse på vægt deltes 7 uger gamle rotter i 4 grupper med samme gennemsnitsvægt. Disse fik 4 forskellige kombinationer af kosttilskud. Ved forsøgets afslutning måltes rotternes vægt. I tabellen er vist antal, n, gennemsnit, x, og empirisk varians, s 2 for vægten af rotterne i de fire grupper. For x 1, x 2,..., x n er disse størrelser defineret ved x = 1 n n r=1 x r, s 2 = 1 n 1 n (x r x) 2. r=1 I det følgende kan det antages, at vægten af rotterne er normalfordelt og at rotter i samme gruppe stammer fra samme fordeling. Bemærk, at den vedlagte SASudskrift kan anvendes ved opgavebesvarelsen. Antal, gennemsnit og empirisk varians for vægt af rotter Gruppe 1 2 3 4 n 16 15 16 14 x 309.38 343.13 302.50 321.43 s 2 554.1167 350.1238 257.6000 471.8022 (a) Undersøg om de fire grupper kan antages at have samme varians. (b) Vis, at de fire grupper ikke kan antages at have samme middelværdi. Gruppe 1 og 3 havde fået samme kosttilskud, bortset fra at gruppe 3 også havde fået calciumtilsætning. (c) Vis, at gruppe 1 og gruppe 3 kan antages at have samme middelværdi. Også gruppe 2 og gruppe 4 havde fået samme kosttilskud, bortset fra at gruppe 4 også her havde fået calciumtilsætning. (d) Kan gruppe 2 og gruppe 4 antages at have samme middelværdi? Bilag: Data antages at ligge i datasættet rotte med de to variable gruppe, der angiver gruppe, og vgt, der angiver slutvægt. 4

PROGRAM: PROC GLM DATA=rotte; CLASS gruppe; MODEL vgt= gruppe /SS1 SOLUTION; MEANS gruppe/hovtest=bartlett; UDSKRIFT: General Linear Models Procedure Class Level Information Class Levels Values GRUPPE 4 1 2 3 4 Number of observations in data set = 61 Dependent Variable: VGT Source DF Sum of Squares F Value Pr > F Model 3 14649.1536690 11.99 0.0001 Error 57 23210.9119048 Corrected Total 60 37860.0655738 R-Square C.V. VGT Mean 0.386929 6.332997 318.639344 T for H0: Pr > T Std Error of Parameter Estimate Parameter=0 Estimate INTERCEPT 321.4285714 B 59.60 0.0001 5.39317678 GRUPPE 1-12.0535714 B -1.63 0.1082 7.38491145 2 21.7047619 B 2.89 0.0054 7.49890800 3-18.9285714 B -2.56 0.0130 7.38491145 4 0.0000000 B... 5

Bartlett s Test for Homogeneity of vgt Variance Source DF Chi-Square Pr > ChiSq gruppe 3 2.3788 0.4976 Kilde: W.W. Daniel: Biostatistics, Wiley, 1999 Ugeopgave 2.4 I et laboratorieeksperiment, hvor man ønskede at studere virkningen af bestråling på livslængde, blev to grupper af RFM hanmus udsat for en stråledosis på 300 rad i en alder af 5-6 uger. Den først gruppe levede i almindelige laboratorieomgivelser, mens den anden gruppe levede i bakteriefrie omgivelser. Efter deres død blev musene obducerede. og det blev afgjort om de var døde af lymfom i skjoldbruskkirtlen, celle sarkom eller af andre årsager. I tabellen nedenfor er angivet overlevelsestiderne for de to grupper af mus. Dødsårsag Tid til død i dage Almindelige laboratorieomgivelser (95) Lymfom 159 189 191 198 200 207 220 235 245 250 256 261 265 266 280 343 356 383 403 414 428 432 Sarkom 317 318 399 495 525 536 549 552 554 557 558 571 586 594 596 605 612 621 628 631 636 643 647 648 649 661 663 666 670 695 697 700 705 712 713 738 748 753 Andre 163 179 206 222 228 249 252 282 324 333 341 366 385 407 420 431 441 årsager 461 462 482 517 517 524 564 567 586 619 620 621 622 647 651 686 761 763 Bakteriefrie omgivelser (82) Lymfom 158 192 193 194 195 202 212 215 229 230 237 240 244 247 259 300 301 321 337 415 434 444 485 496 529 537 624 707 800 Sarkom 430 590 606 638 655 679 691 693 696 747 752 760 778 821 986 Andre 136 246 255 376 421 565 616 617 652 655 658 660 662 675 681 734 736 årsager 737 757 769 777 800 807 825 855 857 864 868 870 870 873 882 895 910 934 942 1015 1019 (a) I SAS-udskriften nedenfor er overlevelsestiden for de mus, der er døde af lymfom i skjoldbruskirtlen sammenlignet for de to musegrupper ved et Wilcoxontest. Hvad er testets konklusion. Forklar hvorfor det ikke ville være rimeligt at bruge et t-test. (b) Diskuter om forudsætningerne for meningsfuldt at anvende Wilcoxontestet er opfyldt i den betragtede situation. 6

Bilag: Data antages at ligge i datasættet mus2 med de tre variable sygdom, der angiver dødsårsag, mus, der angiver hvilke omgivelser musene har levet i og tid, der angiver levetid i dage. PROGRAM: DATA temp; SET mus2; IF sygdom= lymfom ; PROC NPAR1WAY; CLASS mus; VAR tid; UDSKRIFT: The NPAR1WAY Procedure Wilcoxon Scores (Rank Sums) for Variable tid Classified by Variable mus Sum of Expected Std Dev Mean mus N Scores Under H0 Under H0 Score laboratorie 22 526.0 572.0 52.580098 23.909091 bakteriefri 29 800.0 754.0 52.580098 27.586207 Wilcoxon Two-Sample Test Statistic 526.0000 Normal Approximation Z -0.8653 One-Sided Pr < Z 0.1934 Two-Sided Pr > Z 0.3868 Opgave 13 I et forsøg interesserer man sig for den såkaldte syntesefraktion i kindposevæv hos hamstre. En del af dette forsøg kan beskrives på følgende måde. På samme tidspunkt (kl 10.00) injiceres et radioaktivt sporstof i en gruppe hamstre. Kl 10.50 slås samtlige hamstre ned, og ved hjælp af det radioaktive sporstof bestemmes syntesefraktionen for højre og venstre kindpose for hver hamster. 7

(a) Undersøg ved et parret t-test, om der kan antages at være samme niveau for syntesefraktionen i højre og venstre kindpose. Diskuter testet i forhold til analysen i bilaget. Syntesefraktion i højre og venstre kindpose hos hamstre. Hamster Syntesefraktion højre venstre 1 2.22 2.31 2 2.22 2.12 3 2.24 3.14 4 1.89 1.81 5 1.80 2.77 Bilag: Data antages at ligge i datasættet hamster med de tre variable hamster, side og fraktion. PROGRAM; UDSKRIFT PROC GLM DATA=hamster; CLASS hamster side; MODEL fraktion=hamster side; The GLM Procedure Class Level Information Class Levels Values hamster 5 1 2 3 4 5 side 2 h v Number of observations 10 Dependent Variable: fraktion Sum of Source DF Squares Mean Square F Value Pr > F Model 5 1.03970000 0.20794000 1.46 0.3685 Error 4 0.57086000 0.14271500 Corrected Total 9 1.61056000 R-Square Coeff Var Root MSE fraktion Mean 0.645552 16.77515 0.377776 2.252000 Source DF Type I SS Mean Square F Value Pr > F hamster 4 0.72286000 0.18071500 1.27 0.4123 side 1 0.31684000 0.31684000 2.22 0.2105 8

Opgave 1 Data i denne opgave stammer fra to eksperimenter, hvor man målte fluers reaktionstid efter de var blevet udsat for nervegas. Målingen for den enkelte flue består i den tid - reaktionstiden - der går fra fluen bringes i kontakt med giften og indtil den ikke længere kan stå på benene. I det første eksperiment blev fluerne udsat for giften i 30 sekunder og i det andet i 60 sekunder. Målingerne af reaktionstiden ses nendenfor. Reaktionstider for 31 fluer udsat for nervegas Reaktionstid i sekunder kontakttid 3 5 5 7 9 9 10 12 30 sekunder 20 24 24 34 43 46 58 140 kontakttid 2 5 5 7 8 9 14 18 60 sekunder 24 26 26 34 37 42 90 Det kan antages, at observationerne er uafhængige, og at logaritmen til observationstiderne er normalfordelte. (a) Vis, at fordelingen for reaktionstiden ikke afhænger af om kontakttiden er 30 eller 60 sekunder. (b) Angiv konfidensintervaller for de logaritmetransformerede observationers middelværdi og varians. (c) Angiv et skøn for reaktionstidens middelværdi. Kilde Blæsild P. og Granfeldt J. Statistik for biologer og geologer, Århus universitet 1995 Ved besvarelsen kan nedenstående SAS-udskrifter anvendes: Her antages data at ligge i datasættet reak med de to variable gruppe, der angiver kontakttid og lnreakt, der angiver logaritmen til reaktionstiden. PROGRAM1: PROC TTEST DATA=reak; CLASS gruppe; VAR lnreakt; PROGRAM2: UDSKRIFT1: PROC TTEST DATA=reak; VAR lnreakt; The TTEST Procedure Statistics 9

Lower CL Upper CL Lower CL Upper CL Variable gruppe N Mean Mean Mean Std Dev Std Dev Std Dev Std Err lnreakt 30 16 2.2477 2.8072 3.3668 0.7757 1.0501 1.6252 0.2625 lnreakt 60 15 2.1553 2.7155 3.2758 0.7407 1.0117 1.5955 0.2612 lnreakt Diff (1-2) -0.667 0.0917 0.8501 0.8217 1.0317 1.387 0.3708 T-Tests Variable Method Variances DF t Value Pr > t lnreakt Pooled Equal 29 0.25 0.8065 lnreakt Satterthwaite Unequal 29 0.25 0.8062 Equality of Variances Variable Method Num DF Den DF F Value Pr > F lnreakt Folded F 15 14 1.08 0.8940 UDSKRIFT2: The TTEST Procedure Statistics Lower CL Upper CL Lower CL Upper CL Variable N Mean Mean Mean Std Dev Std Dev Std Dev Std Err lnreakt 31 2.3904 2.7629 3.1353 0.8115 1.0155 1.3573 0.1824 T-Tests Variable DF t Value Pr > t lnreakt 30 15.15 <.0001 10