Modul 12: Exercises. 12.1 Sukkersygepatienters vægt



Relaterede dokumenter
a) Har måleresultaterne for de 2 laboranter samme varians? b) Tyder resultaterne på, at nogen af laboranterne måler med en systematisk fejl?

Kursus Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, ( , ) Per Bruun Brockhoff

PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006

Modul 7: Eksempler. 7.1 Beskrivende dataanalyse Diagrammer. Bent Jørgensen. Forskningsenheden for Statistik ST501: Science Statistik

Konfidensinterval for µ (σ kendt)

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup)

To samhørende variable

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

(studienummer) (underskrift) (bord nr)

02402 Løsning til testquiz02402f (Test VI)

Normalfordelingen. Statistik og Sandsynlighedsregning 2

DANMARKS TEKNISKE UNIVERSITET Side 1 af 17 sider. Skriftlig prøve, den: 19. december 2012 Kursus nr : (navn) (underskrift) (bord nr)

Følgende tabel (fra Fisher) giver forøgelsen af sovetiden i timer fra et eksperiment med 10 patienter vedrørende 2 sovemidler A og B.


Løsning eksamen d. 15. december 2008

Matematik B. Studentereksamen

(studienummer) (underskrift) (bord nr)

13.1 Substrat Polynomiel regression Biomasse Kreatinin Læsefærdighed Protein og højde...

13.1 Substrat Polynomiel regression Biomasse Kreatinin Læsefærdighed Protein og højde...

Matematik B. Højere handelseksamen

Ovenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm.

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Repetition Stokastisk variabel

Test nr. 6 af centrale elementer 02402

Skriftlig Eksamen ST501: Science Statistik Torsdag den 4. januar 2007 kl

Reeksamen i Statistik for Biokemikere 6. april 2009

Hypotese test. Repetition fra sidst Hypoteser Test af middelværdi Test af andel Test af varians Type 1 og type 2 fejl Signifikansniveau

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering

Statistik II 4. Lektion. Logistisk regression

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

Modul 12: Regression og korrelation

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Vi kalder nu antal prøverør blandt de 20, hvor der ikke ses vækst for X.

Modul 6: Regression og kalibrering

Modul 11: Simpel lineær regression

Et firma tuner biler. Antallet af en bils cylindere er givet ved den stokastiske variabel X med massetæthedsfunktionen

Opgave I II III IV V VI Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i.

Program. 1. Repetition: konfidens-intervaller. 2. Hypotese test, type I og type II fejl, signifikansniveau, styrke, en- og to-sidede test.

Konfidensintervaller og Hypotesetest

Forelæsning 11: Kapitel 11: Regressionsanalyse

Skriftlig eksamen Science statistik- ST501

Modul 5: Test for én stikprøve

Eksamen i Statistik for biokemikere. Blok

Matematik A. Studentereksamen. Digital eksamensopgave med adgang til internettet

Normalfordelingen og Stikprøvefordelinger

UNDERVISNINGS MINISTERIET KVALITETS- OG TI LSYNSSTYRELSEN. Maten1atik A. Studenterel<sam.en. Fredag den 22. maj 2015 kl

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Analysestrategi. Lektion 7 slides kompileret 27. oktober :24 p.1/17

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Løsning til eksamen d.27 Maj 2010

Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model

Løsninger til kapitel 14

Susanne Ditlevsen Institut for Matematiske Fag susanne

ØVELSER Statistik, Logistikøkonom Lektion 6: Hypotesetest 1

Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration

Evaluering af Soltimer

Test nr. 5 af centrale elementer 02402

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

4. september π B = Lungefunktions data fra tirsdags Gennemsnit l/min

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

Note til styrkefunktionen

Matematik A. Studentereksamen. Digital eksamensopgave med adgang til internettet

Kvantitative Metoder 1 - Forår Dagens program

Kvantitative Metoder 1 - Forår Dagens program

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse

Opgave 11.4 side 316 (7ed: 11.4, side 352 og 6ed: 11.2, side 345)

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Kvantitative Metoder 1 - Forår Dagens program

Matematik B. Studentereksamen. Onsdag den 7. december 2016 kl stx163-mat/b

Forelæsning 8: Inferens for varianser (kap 9)

Sandsynlighedsregning 12. forelæsning Bo Friis Nielsen

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse

Matematik A. Studentereksamen. Fredag den 5. december 2014 kl stx143-mat/a

Opgavens formålet er at undersøge variationen mellem to laboratoriers bestemmelse af po 2 i blod.

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet

STUDENTEREKSAMEN MAJ 2009 MATEMATIK A-NIVEAU. Mandag den 11. maj Kl STX091-MAA. Undervisningsministeriet

Generelt er korrelationen mellem elevens samlede vurdering i forsøg 1 og forsøg 2 på 0,79.

Module 9: Residualanalyse

Matematik A. Studentereksamen. Digital eksamensopgave med adgang til internettet

Opgave 6. Opgave 7. Peter Harremoës Matematik A med hjælpemidler 26 maj a) Se Bilag 2! b) Variablen n isoleres. L = 2 z 1 α. L = 2 z 1 α L = n =

TEKNIK. BSc05-ID1B PROJEKT: INTERAKTIVT FYSISK PRODUKT 5. SEMESTER INDUSTRIEL DESIGN JAN. 2016

(studienummer) (underskrift) (bord nr)

Side 1 af 19 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402

Matematik A. Studentereksamen

Vejledende besvarelse af eksamen i Statistik for biokemikere, blok

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6

Matematik B. Studentereksamen

6. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag)

Undervisningsbeskrivelse

Hvad er danskernes gennemsnitshøjde? N = 10. X 1 = 169 cm. X 2 = 183 cm. X 3 = 171 cm. X 4 = 113 cm. X 5 = 174 cm

Matematisk Modellering 1 Cheat Sheet

Transkript:

Modul 12: Exercises 12.1 Sukkersygepatienters vægt............... 1 12.2 Newfoundlandske kvinders blodtryk.......... 4 12.3 Korrelationskoefficient.................. 6 12.4 Højde og vægt...................... 6 12.5 Højde og skinnebenslængde............... 8 12.6 Opløsninger af I 8..................... 12 12.1 Sukkersygepatienters vægt Under forskellige behandlinger af sukkersygepatienter studerer man bl.a. vægtændringer. De følgende data viser vægttab i pounds efter 1

et års behandling med phenformin (DBI) af 16 voksne sukkersygepatienter, og også deres vægt i pounds ved behandlingens begyndelse. 2

Startvægt Vægttab efter et år pounds (x) pounds (y) 242 44 235 44 225 15 223 39 200 6 199 16 195 19 185 24 173 31 156 12 155 10 150 3 149 10 146 3 140 5 129 21 3

a) Man ønsker at beskrive data med lineær regression af y på x. Er denne model rimelig (en tegning og en kort diskussion)? Find skøn for modellens parametre. b) Lad β betegne vægttab i pounds svarende til en øgning af startvægt på 1 pound. Test nulhypotesen om, at β = 0 imod modhypotesen om, at β > 0 på et 5% signifikansniveau. Find et 90% konfidensinterval for β. 4

12.2 Newfoundlandske kvinders blodtryk Systolisk Alder blodtryk Alder Blodtryk Alder Blodtryk (år) (mm Hg) 22 131 41 139 52 128 23 128 41 171 54 105 24 116 46 137 56 145 27 106 47 111 57 141 28 114 48 115 58 153 29 123 49 133 59 157 30 117 49 128 63 155 32 122 50 183 67 176 33 99 51 130 71 172 35 121 51 133 77 178 40 147 51 144 81 217 Alder i år og systolisk blodtryk i mm Hg for 33 voksne kvinder: En 5

tilfældig stikprøve af 20% af kvinder i en fiskerby på Newfoundland (Colton p. 189). a) Find korrelationskoefficienten r. b) Test H 0 : ρ = 0 imod H 1 : ρ 0. c) Lav en orienterende tegning. d) Find den bedste lineære regressionslinje y = a+bx, hvor x = alder og y = blodtryk. e) Test H 0 : β = 0 imod H 1 : β > 0. f) Test H 0 : β = 1 imod H 1 : β 1. g) Find et 95% konfidensinterval for β. h) Tegn forskellene z i = y i a bx i i et normalfordelingsdiagram. Passer en normalfordeling? 6

12.3 Korrelationskoefficient Find for følgende data korrelationskoefficienten r, og diskuter resultatet. x 2 1 0 1 2 y 4 1 0 1 4 12.4 Højde og vægt De følgende data angiver højde (x i inches ) og vægt (y i pounds ) for 356 mænd. 7

y: vægt x: højde (inches) (pounds) 60 62 64 66 68 70 72 74 230 1 1 3 220 4 4 3 210 5 1 2 1 200 2 1 3 9 1 7 1 190 1 3 8 16 3 5 180 1 5 8 15 12 1 170 2 8 18 26 8 1 160 19 40 20 4 150 5 15 26 9 2 140 1 4 6 5 1 130 2 3 1 1 120 1 1 a) Vis, at x j = 23.814, y j = 60.730, x j y j = 4075360, x 2 j = 1595628 og y 2 j = 10522500. 8

b) Tegn et scatterdiagram. c) Find korrelationskoefficient r. d) Test nulhypotesen for at populationskorrelationskoefficient ρ = 0, (α = 0.05). e) Find de bedste lineære regressionslinjer y = a + bx og x = a + b y, og tegn dem på diagrammet. Diskuter antagelser for lineær regression i dette problem. 12.5 Højde og skinnebenslængde I retsmedicin er det ofte et vigtigt led i identifikationen af dødfundne personer at finde ud af hvor høj personen var i levende live. Blandt de metoder, der anvendes, er analyser af sammenhængen mellem skinnebenslængde og højde. I det følgende er angivet mellemregninger osv for to undersøgelser af denne sammenhæng. Der er 9

tale om en stikprøve bestående af finske mænd, og en stikprøve bestående af franske mænd. Data er dels højde i levende live og dels længden af skinnebensknoglen, målt efter død og skelettering. 10

Data for stikprøven af finske mænd Antal: 61 mean SD varians range Skinnebenslængde 36.16 2.18 4.75 29 42 Højde i live 169.2 6.50 42.25 Kovarians skinnebenslængde højde: 10.06 Data for stikprøven af franske mænd Antal: 38 mean SD varians Skinnebenslængde 36.81 1.80 3.24 Højde i live 168.8 5.50 30.25 Kovarians skinnebenslængde højde: 7.72 11

a) Hvad er korrelationskoefficienten mellem skinnebenslængde og højde i de to stikprøver? Tabel med SS-værdier y 2 xy x 2 Finske mænd 2535 603.6 285 Franske mænd 1119 285.7 120 Summer (c) 3654 889.3 405 b) Test om det er formålstjenligt at anvende lineær regression med skinnebenslængde som prædiktor for at nå frem til et estimat for højde. c) Opskriv regressionsformler for de to stikprøver. Antag nu, at s 2 Y X ikke er forskellig i de to stikprøver. 12

d) Test om de to stikprøver kan antages at komme fra samme population. e) Hvad kan man konkludere ud fra resultatet af testene i spørgsmål d)? f) Hvad er den prædikterede højde for en finsk mand med et skinneben på 35 cm? Hvad er den prædikterede højde for en finsk mand med et skinneben på 45 cm? Er der noget, der maner til forsigtighed ved forsøg på at besvare det andet spørgsmål? Begrund svaret. 12.6 Opløsninger af I 8 For nogle væsker er følgende målt: Procentdelen af I 8 i basisopløsningen og det punkt hvor væsken blev uklar (cloud point). 13

I 8 % cloud point I 8 % cloud point 0 21.9 5 28.9 0 22.1 6 29.8 0 22.8 6 30.0 1 24.5 6 30.3 2 26.0 7 30.4 2 26.1 8 31.4 3 26.8 8 31.5 3 27.3 9 31.8 4 28.2 10 33.1 4 28.5 Er der korrelation mellem disse 2 variable eller kan man antage, at korrelationen er 0? Følgende udregninger kan benyttes: 14

Xi = 84 X 2 i = 550 Yi = 531.4 Y 2 i = 15066.9 Xi Y i = 2536.1 15