Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

Relaterede dokumenter
Eksamen Bacheloruddannelsen i Medicin med industriel specialisering

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

Multipel Lineær Regression

Generelle lineære modeller

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression

Løsning til eksaminen d. 14. december 2009

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Statistik Lektion 17 Multipel Lineær Regression

Konfidensintervaller og Hypotesetest

Statistik Lektion 16 Multipel Lineær Regression

Sidste gang: One-way(ensidet)/one-factor ANOVA I dag: Two-factor ANOVA (Analysis of variance) Two-factor ANOVA med interaktion

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

k UAFHÆNGIGE grupper Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen 4 Hypotesetest (F-test)

Appendices. Appendix 2: Questionnaire in StudSurvey. Appendix 3: Text presenting the electronic questionnaire. Appendix 4: Outputs from regressions

Analysestrategi. Lektion 7 slides kompileret 27. oktober :24 p.1/17

Løsning eksamen d. 15. december 2008

Forelæsning 11: Envejs variansanalyse, ANOVA

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet

Økonometri lektion 5 Multipel Lineær Regression. Inferens Modelkontrol Prædiktion

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model

02402 Løsning til testquiz02402f (Test VI)

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper.

Logistisk Regression - fortsat

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Besvarelse af vitcap -opgaven

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

a) Har måleresultaterne for de 2 laboranter samme varians? b) Tyder resultaterne på, at nogen af laboranterne måler med en systematisk fejl?

Sommereksamen Bacheloruddannelsen i Medicin/Medicin med industriel specialisering

Reeksamen i Statistik for Biokemikere 6. april 2009

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup)

Overlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere.

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Kursus Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, ( , ) Per Bruun Brockhoff

Eksamen i Statistik for Biokemikere, Blok januar 2009

Klasseøvelser dag 2 Opgave 1

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se

Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff

Besvarelse af opgavesættet ved Reeksamen forår 2008

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom

(studienummer) (underskrift) (bord nr)

Oversigt. Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff. Envejs variansanalyse - eksempel

Multipel Lineær Regression. Polynomiel regression Ikke-lineære modeller og transformation Multi-kolinearitet Auto-korrelation og Durbin-Watson test

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge

Eksamen i statistik 2009-studieordning

EVALUERINGSENHEDEN. Analyse af karaktereffekten af. deltagelse i manuduktion på HA 2. år. Copenhagen Business School

Reeksamen i Statistik for biokemikere. Blok

Ikke-parametriske tests

Test nr. 6 af centrale elementer 02402

Kvant Eksamen December timer med hjælpemidler. 1 Hvad er en continuous variable? Giv 2 illustrationer.

KA 4.2 Kvantitative Forskningsmetoder Forår 2010

RE-EKSAMEN I EPIDEMIOLOGISKE METODER IT & Sundhed, 2. semester

ORDINÆR EKSAMEN I EPIDEMIOLOGISKE METODER IT & Sundhed, 2. semester

To-sidet varians analyse

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model

Epidemiologi og Biostatistik

Anvendt Statistik Lektion 7. Simpel Lineær Regression

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer.

(studienummer) (underskrift) (bord nr)

Øvelser i epidemiologi og biostatistik, 12. april 2010 Ebeltoft-projektet: Analyse af alkoholrelaterede data mm. Eksempel på besvarelse

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff

Side 1 af 19 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402

1 Hb SS Hb Sβ Hb SC = , (s = )

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

Indhold. 2 Tosidet variansanalyse Additive virkninger Vekselvirkning... 9

Opgave I.1 II.1 II.2 II.3 III.1 IV.1 IV.2 IV.3 V.1 VI.1 Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

Løsning til eksaminen d. 29. maj 2009

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

Sommereksamen Bacheloruddannelsen i Medicin/Medicin med industriel specialisering

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Stratificerede analyser

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april

Statistik II 1. Lektion. Analyse af kontingenstabeller

Analyse af binære responsvariable

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Lineær og logistisk regression

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j

Skriftlig eksamen Science statistik- ST501

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Statistik og skalavalidering. Opgave 1

Regressionsanalyser. Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer.

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Forelæsning 11: Kapitel 11: Regressionsanalyse

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

Vi vil analysere effekten af rygning og alkohol på chancen for at blive gravid ved at benytte forskellige Cox regressions modeller.

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse

Transkript:

Reeksamen 2018 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 13-08-2018 Tid: kl. 09.00-11.00 Bedømmelsesform 7-trin Vigtige oplysninger: Side 1 af 9

Eksamenssættet indeholder 4 opgaver. Opgaverne kan indeholde underopgaver angivet med bogstaver som f.eks. a) til c). Sørg for at angive, hvilket spørgsmål du besvarer. Opgaverne er vægtet som angivet i procent i parentes. Husk at begrunde dine svar, beskrive din vej til svaret samt vise eventuelle beregninger. Opgave 1 (25%) En hospitalsafdeling vil undersøge om deres nyindkøbte hospitalssenge med indbygget vægt kan måle kropsvægt lige så godt som den gamle anerkendte men mere besværlige metode. Derfor har afdelingen målt kropsvægt på 5 patienter, hvor begge apparater målte patienternes kropsvægt umiddelbart efter hinanden. Data kan findes i tabellen nedenfor. Forskellen mellem måleværdier (ny metode gammel metode) viste sig at være normalfordelt. Afdelingen ønsker statistisk at teste om de to metoder havde systematiske måleforskelle, altså om den gennemsnitlige forskel mellem målingerne var forskellig fra nul. Testens signifikansniveau skal være α = 0.05. a) Udvælg en statistisk test til at afprøve om de to metoder i gennemsnit målte forskelligt. Hvorfor er den valgte statistiske test den mest hensigtsmæssige? 6%: 3%: Paired t-test; 3% Vælger testen da: - interesseret i forskellen mellem 2 afhængige sæt målinger, - metrisk, - forskellen er normalt distribueret. b) Hvad er H 0 og H A for testen? 4%: H 0 : µ d = 0, H a : µ d 0 c) Hvad er din konklusion, og hvordan er du nået frem til den? Kropsvægt målt med den nye og gamle metode (i kg), samt forskel imellem de to: Gammel Ny Ny - gammel 58 62 4 70 65-5 83 89 6 148 141-7 98 102 4 15%: 2%: Data indtastet i SPSS, en kolonne med gammel, en med ny Side 2 af 9

Testen valgt under Analyze Compare Means Paired samples t-test 8%: Two-tailed p=0,888 (p>0,05) Altså er testen ikke alpha 0,05 signifikant og så afvises H0 ikke 5%: Gammel Ny 95% CI er [-7,78 6,98] kg Altså måler den nye metode ikke systematisk forskelligt fra den gamle, men forskellen er op til ca +/- 7 kg. Resultater fra SPSS: Side 3 af 9

Opgave 2 (25%) Som en del af deres undersøgelse af livsstilssygdomme blandt forskellige socioøkonomiske grupper, ville en forskergruppe undersøge om serum koncentrationen af Leptin (målt i ng/ml) var forskellig imellem tre uddannelsesgrupper med stigende uddannelsesniveau indenfor byggebranchen (grp I:ufaglærte, II:faglærte og III:videregående uddannelse). Forskergruppen udtog tilfældigt nogle virksomheder, hvorfra de efter etisk godkendelse og skriftlig samtykke foretog målinger af serum Leptin blandt ansatte tilhørende de tre uddannelsesgrupper. Data i de tre grupper blev fundet normalfordelte. Forskergruppen ville undersøge deres forskningsspørgsmål ved at bruge en one-way ANOVA, med et signifikansniveau på α = 0.05. SPSS output for testen på dette opfundne eksempel kan ses herunder og på næste side. Svar på spørgsmålene ud fra det viste output fra SPSS. Husk at begrunde dine svar: a) Hvorfor er one-way ANOVA den korrekte statistiske test at anvende? 6%: 1% Sammenligner gns fra 2+ grupper af observationer ifht en nominal/ordinal faktor 1% Grupper uafhængige 1% Grupper normalfordelte 3% Grupper har ens varians (p>0.05 for Levene s homogeneity of variance test, SD under faktor 2 forskellige) b) Hvad er H 0 og H A for testen? 4%: H 0 : µ 1 = µ 2 = µ 3 H A : not all µ are equal c) Hvad er din konklusion, og hvordan er du nået frem til den? 15%: 8% ANOVA p < 0.001 (p<0.05) H0 afvises: der er forskel blandt means. Derfor post hoc tests (Bonferroni korrigeret) 5% p < 0.001 (<0.05) for Grp I vs Grp II, 95% CI (Grp I - II) > 0. p < 0.001 (<0.05) for Grp I vs Grp III, 95% CI (Grp I - III) > 0. P > 0.05 for Grp II vs Grp III, 95% CI (Grp II III) indeholder 0. 2% Altså er Serum Leptin koncentrationen større for uddannelsesgruppe I (de ufaglærte) med en 95% CI for gns. forskel på 0,7-2,3 ng/ml i forhold til grp II og 0,7-2,5 ng/ml i forhold til grp III. Der fandtes ingen signifikant forskel imellem uddannelsesgrupper II og III. Side 4 af 9

Side 5 af 9

Opgave 3 (25%) I en artikel (Hulsegge et al, International Journal of Cardiology, 2018, p. 109-14) fandtes følgende oplysninger i tabel 1: Arbejdstidssystem (n (procent)) Dagarbejde Nat-skift arbejde Ikke nat-skift arbejde Køn (mænd) 292 (54%) 57 (77%) 24 (50%) Tabellen har ikke angivet antal kvinder. a) Opsæt en tabel over sammenhæng mellem arbejdstidssystem og køn, og beregn på baggrund heraf om der findes en statistisk signifikant forskel mellem køn og typen af system ved hjælp af en chisquare test. 7% i alt 3% tegner tabellen dag nat Ikke nat I alt Mænd 292 57 24 373 Kvinder 249 17 24 290 I alt 541 74 48 663 4% beregner forventede som (række*kolonne/total) og derefter chi-kvadrat som 14,88 med (3-1)*(2-1) = 2 df og en p-værdi opslået i tabel til mindre end 0,001 (tabel A5) b) Angiv betingelserne for at bruge chi-square test og vurder om de er opfyldt i det konkrete tilfælde. Fortolk resultatet af chi-square testen. 6% i alt 2% angiver at n er større end 40 og at hvis n er mellem 20 og 40 skal forventede værdi være mindst 5 i hver celle 2% angiver at n er større end 40 (663) 2% angiver at en nulhypotese om at der ikke er sammenhæng mellem type af skiftsystem og køn må forkastes c) Beregn odds ratio for at være mand, hvis man har nat-skift arbejde med dagarbejde som reference. 6% Opstiller evt tabellen Nat Mænd 57 292 Dag (reference) Side 6 af 9

Kvinder 17 249 Beregner OR = (57*249)/(17*292) = 2,86 d) Beregn 95% konfidensinterval for denne odds ratio og fortolk resultatet. 7% i alt 5% Beregner SE på ln(or) som = 0,29 og derefter exp(ln(or) - 1,96*SE); exp(ln(or) + 1,96*SE) exp(ln(2,86) - 1,96*0,29); exp(ln(2,86) + 1,96*0,29); (1,62; 5,05) 2% Statistisk signifikant resultat fordi 1 ikke er indeholdt, hvis udtræk blev foretaget 100 x ville estimatet være placeret mellem 1,6 og 5 Opgave 4 (25%) I en undersøgelse af 170 fødsler, hvor barnet ved fødslen vejede over 2 kg, ønskedes undersøgt om rygning under graviditeten (angivet som 0=ikke ryger og 1=ryger) havde betydning for barnets fødselsvægt. I SPSS dannedes følgende output fra en regressionsanalyse: Model R R Square Model Summary Adjusted R Square Std. Error of the Estimate 1,238 a,057,051 589,619 a. Predictors: (Constant), rygning under graviditet ANOVA a Model Sum of Squares df Mean Square F Sig. 1 Regression 3500136,177 1 3500136,177 10,068,002 b Residual 58405296,176 168 347650,572 Total 61905432,353 169 a. Dependent Variable: fødselsvægt (grams) b. Predictors: (Constant), rygning under graviditet Coefficients a Standardized Unstandardized Coefficients Coefficients Model B Std. Error Beta t Sig. 1 (Constant) 3203,837 57,817 55,413,000 rygning under graviditet -294,427 92,791 -,238-3,173,002 a. Dependent Variable: fødselsvægt (grams) Side 7 af 9

a) Angiv hvilken type regressionsanalyse der er der tale om. 5% da outcome variablen er målt på ratio-interval skala må det være en lineær regression b) Har rygning betydning for fødselsvægten? 5% Rygning er statistisk signifikant prædiktor for fødselsvægt med en p-værdi på 0,002 c) Angiv et estimat for hvor stor forskel i vægt der er mellem børn af mødre der ryger og mødre der ikke ryger? 5% rygeres børn vejer i gennemsnit 294,4 gram mindre end ikke-rygeres børn Udover rygning kan moderens alder og moderens vægt betyde noget for barnets fødselsvægt og der blev derfor foretaget en yderligere analyse med følgende resultat: Model R R Square Model Summary Adjusted R Square Std. Error of the Estimate 1,359 a,129,113 569,860 a. Predictors: (Constant), moders vægt inden graviditet, rygning under graviditet, moders alder ANOVA a Model Sum of Squares df Mean Square F Sig. 1 Regression 7998565,359 3 2666188,453 8,210,000 b Residual 53906866,994 166 324740,163 Total 61905432,353 169 a. Dependent Variable: fødselsvægt (grams) b. Predictors: (Constant), moders vægt inden graviditet, rygning under graviditet, moders alder Coefficients a Standardized Unstandardized Coefficients Coefficients Model B Std. Error Beta t Sig. 1 (Constant) 2289,551 253,186 9,043,000 rygning under graviditet -265,928 90,014 -,215-2,954,004 moders alder 17,245 8,307,153 2,076,039 moders vægt inden graviditet 7,467 2,826,195 2,642,009 a. Dependent Variable: fødselsvægt (grams) d) Opstil en regressionsligning, der med brug af relevante oplysninger fra tabellerne ovenfor beskriver hvordan fødselsvægt afhænger af rygning, moderens alder og moderens vægt inden graviditeten. 5% fv = alfa + beta1*rygning + beta2*alder + beta3*vægt Fv = 2289,6 gram 265,9*rygning + 17,3*alder + 7,5* vægt Side 8 af 9

e) Begrund på baggrund af oplysningerne i tabellen om hensyntagen til moders alder og vægt inden graviditet i analysen har betydning for tolkningen af hvorvidt rygning er relateret til fødselsvægt. 5% i den justerede analyse vejer rygernes børn 266 gram mindre end ikke-rygeres børn, hvilket er tæt på de 294 gram som var resultatet af den ujusterede analyse. Modellen med justering for alder og moders vægt er bedre til at forklare data (bedømt på R square) Side 9 af 9