Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger

Størrelse: px
Starte visningen fra side:

Download "Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger"

Transkript

1 Øvelser til basalkursus, 5. uge Opgavebesvarelse: Knogledensitet hos unge piger I alt 112 piger har fået målt knogledensitet (bone mineral density, bmd) i 11-års alderen (baseline værdi). Pigerne er herefter randomiseret til enten at få et calciumtilskud eller en placebopille. Efter ca. 2 år er de fleste genundersøgt, og bmd er målt igen. Data indeholder 112 linier (foruden en overskriftslinie), med angivelse af en personidentifikation (id), behandlingsgruppe (treat, angivet som enten C for calciumtilskud eller P for placebo), det eksakte antal dage, der er imellem de to målinger (dage), samt bone mineral density ved hhv. 1. og 2. måling (bmd1 hhv. bmd5). g cm 2. De stammer fra neden- Målingerne af knogledensitet (bmd) har enheden stående reference, men er let modificerede. Opgaven går ud på at vurdere effekten af calciumtilskuddet på fornuftig vis, og kandidaterne er nedenstående sammenligninger af de to grupper: Follow-up målingerne efter 2 år (spm. 3), med korrektion for forskelle i baseline (spm.4) Ændringerne fra start til slut (spm. 6) med korrektion for forskelle i baseline (spm.7) 1. Lav en (eller flere) passende illustrationer/arbejdstegninger for at få en fornemmelse af data. Bemærk, at der er mange muligheder her, men prøv jer lidt frem uden at bruge alt for meget tid på det. En oplagt mulighed er et simpelt scatterplot af 2. måling mod 1. måling, gerne med forskellige symboler for grupperne: proc sgplot data=calcium; scatter Y=bmd5 X=bmd1 / group=treat; 1

2 Her ses (som forventet) en oplagt sammenhæng mellem de to målinger, med en tendens til, at de blå punkter (gruppe C) ligger øverst, svarende til, at Calcium virker efter hensigten. Hvis dagene skal med på tegningen, kan vi i stedet afbilde tilvæksten i bmd (delta_bmd=bmd5-bmd1) overfor tidsintervallet (dage), igen med symboler svarende til de to grupper: proc sgplot data=calcium; scatter Y=delta_bmd X=dage / group=treat; Her ses ingen oplagt sammenhæng, men hvis der er nogen, er den (som forventet) positiv. 2

3 Endelig kunne vi afbilde observationerne, som man gør med gentagne målinger (repeated measurements), dvs. overfor en tidsakse. Dette er lidt vanskeligere og kræver omformning af data til såkaldt lang facon. Dette plot går også under navnet et spaghettiplot : data lang; set calcium; bmd=bmd1; tidspunkt=1; tid=0; output; bmd=bmd5; tidspunkt=5; tid=dage; output; proc sgpanel data=lang; panelby treat; series X=tid Y=bmd / group=id; Her ses individuelle stigninger, opdelt efter gruppe. Der anes en tendens til større hældninger i figuren til højre, som svarer til Calcium-gruppen. 2. Udregn summary statistics (gennemsnit, spredning og andre relevante størrelser), opdelt på de to grupper. Ser det ud som om randomiseringen har været korrekt udført? 3

4 Den letteste metode til at lave summary statistics er ved at benytte proc means: proc means data=calcium; var dage bmd1 bmd5 delta_bmd; og få det (forhåbentligt rimeligt velkendte) output The MEANS Procedure N treat Obs Variable N Mean Std Dev Minimum C 55 dage bmd bmd delta_bmd P 57 dage bmd bmd delta_bmd N treat Obs Variable Maximum C 55 dage bmd bmd delta_bmd P 57 dage bmd bmd delta_bmd Vi ser her, at Calcium-gruppen starter lidt højere end Placebo-gruppen (bmd1), slutter en del højere (bmd5), og at antallet af dage mellem de to målinger er ret ens i de to grupper. Et bedre overblik over de samme tal kan fås ved hjælp af proceduren tabulate, der dog er lidt sværere at se logikken i rent programmeringsteknisk (men så må man bruge gemte kodebidder fra gang til gang): 4

5 proc tabulate data=calcium; var bmd1 bmd5; table treat,(bmd1 bmd5)*(n*(f=4.0) mean*(f=6.4) std*(f=6.4)); som giver tabellen nedenfor (som givetvis bliver en del pænere som Word-output) bmd1 bmd N Mean Std N Mean Std treat C P Men summa summarum mht dette spørgsmål er, at udgangspunktet bmd1 ser rimeligt ens ud i de to grupper, sådan som det burde gøre. Man burde ikke teste, om der er samme middelværdi, da man ved, at dette er tilfældet på grund af randomiseringen. Men vi kan da i hvert fald se på et Box plot: og hvis vi alligevel tester, om middelværdierne er ens, får vi heldigvis heller ikke nogen forkastelse: 5

6 proc ttest data=calcium; var bmd1; The TTEST Procedure Variable: bmd1 treat N Mean Std Dev Std Err Minimum Maximum C P Diff (1-2) treat Method Mean 95% CL Mean Std Dev C P Diff (1-2) Pooled Diff (1-2) Satterthwaite treat Method 95% CL Std Dev C P Diff (1-2) Pooled Diff (1-2) Satterthwaite Method Variances DF t Value Pr > t Pooled Equal Satterthwaite Unequal Equality of Variances Method Num DF Den DF F Value Pr > F Folded F Gør behandlingen en forskel for slutmålingerne? Er det fornuftigt at foretage denne sammenligning uden at tage hensyn til baseline værdierne? Her ser vi bort fra de små forskelle, der var i baseline målingerne og sammenligner blot follow-up målingerne foretaget efter 2 år. Denne sammenligning er tilladt og fornuftig, da der er tale om et randomiseret studie. Det betyder dog ikke, at det er den eneste måde, man kan sammenligne grupperne på, og det er heller ikke nødvendigvis den bedste. Der er jo tale om et forholdsvis lille studie... Først checker vi løseligt forudsætningerne for et T-test ved at se på et Box plot: 6

7 Og derefter foretager vi T-testet proc ttest data=calcium; var bmd5; The TTEST Procedure Variable: bmd5 treat N Mean Std Dev Std Err Minimum Maximum C P Diff (1-2) treat Method Mean 95% CL Mean Std Dev C P Diff (1-2) Pooled Diff (1-2) Satterthwaite Method Variances DF t Value Pr > t Pooled Equal Satterthwaite Unequal Equality of Variances Method Num DF Den DF F Value Pr > F Folded F Vi ser, at der er en signifikant forskel på grupperne ved follow-up (P=0.04). Forskellen er i Calcium gruppens favør, og estimeres til , 7

8 med et 95% konfidensinterval på (0.0013, ). Men noget af denne forskel var jo allerede til stede ved starten af undersøgelsen, så måske skulle man tage hensyn til det? Det gør vi nedenfor. 4. Inkluder nu baseline værdierne som kovariat i sammenligningen fra spørgsmål 3: Den lille forskel i baseline værdier kan bevirke, at bmd5-sammenligningen er lidt urimelig. Det vi gerne vil er jo at sammenligne to individer, der starter fra samme udgangspunkt, men som får forskellige behandlinger. Dette kunne illusteres ved forskellen på de to linier nedenfor, idet disse er regressionslinier af bmd5 mod udgangsværdien bmd1. Hvis disse to linier havde været helt parallelle, ville de svare til kovariansanalysemodellen nedenfor (en additiv model med to kovariater, uden interaktion). De to estimate-sætninger benyttes i spørgsmål 4a og kommenteres nedenfor. proc glm data=calcium; model bmd5=bmd1 treat / solution clparm; estimate "bmd5 for C-pige med bmd1=0.8" intercept 1 treat 1 0 bmd1 0.8; estimate "bmd5 for P-pige med bmd1=0.8" intercept 1 treat 0 1 bmd1 0.8; 8

9 Vi får outputtet The GLM Procedure Class Level Information Class Levels Values treat 2 C P Number of Observations Read 112 Number of Observations Used 91 Dependent Variable: bmd5 Sum of Source DF Squares Mean Square F Value Pr > F Model <.0001 Error Corrected Total R-Square Coeff Var Root MSE bmd5 Mean Source DF Type I SS Mean Square F Value Pr > F bmd <.0001 treat Source DF Type III SS Mean Square F Value Pr > F bmd <.0001 treat Standard Parameter Estimate Error t Value Pr > t bmd5 for C-pige med bmd1= <.0001 bmd5 for P-pige med bmd1= <.0001 Parameter 95% Confidence Limits bmd5 for C-pige med bmd1= bmd5 for P-pige med bmd1= Standard Parameter Estimate Error t Value Pr > t Intercept B <.0001 bmd <.0001 treat C B treat P B... Parameter 95% Confidence Limits Intercept bmd treat C treat P.. (a) Hvilken knogledensitet vil vi prediktere en pige fra C-gruppen til at have i 13-års alderen (bmd5), hvis hun har en densitet på 0.8 g cm 2 i 11-års alderen (bmd1)? 9

10 Vil det være usædvanligt, hvis hun er nået helt op på 1 g cm 2? For at besvare dette spørgsmål, inkluderede vi ovenfor en (ja, faktisk to) estimate-sætninger: estimate "bmd5 for C-pige med bmd1=0.8" intercept 1 treat 1 0 bmd1 0.8; estimate "bmd5 for P-pige med bmd1=0.8" intercept 1 treat 0 1 bmd1 0.8; Bemærk, at den eneste forskel på de to estimate-sætninger er, hvilket treat-estimat, der lægges til. Fra disse fik vi outputtet Standard Parameter Estimate Error t Value Pr > t bmd5 for C-pige med bmd1= <.0001 bmd5 for P-pige med bmd1= <.0001 Parameter 95% Confidence Limits bmd5 for C-pige med bmd1= bmd5 for P-pige med bmd1= og den forventede værdi for en C-pige er altså 0.926, med konfidensgrænser (0.910, 0.942). Når man skal svare på, om det er usædvanligt for en pige at nå helt op på et bmd på 1 g, er det imidlertid ikke konfidensgrænserne, cm 2 vi skal bruge, men derimod prediktionsgrænserne. Disse får ved at lægge ±2s til estimatet, og da vores spredningsestimat (Root MSE) er s = 0.041, finder vi prediktionsintervallet ± = (0.844, 1.008) altså netop inkluderende 1 g cm 2, hvormed vi må konkludere, at dette ikke ville være så usædvanligt endda. (b) Kvantificer den forventede forskel på de to grupper i knogledensitet ved 13-års alderen, under forudsætning af, at disse starter fra samme udgangspunktet (bmd1=0.8). Dette er lidt af et trick-spørgsmål, idet det konkrete udgangspunkt er ligegyldigt, når man arbejder med en model uden interaktion. 10

11 Her er linierne jo parallelle (se figuren nedenfor) og har dermed samme afstand, uanset hvad kovariaten (her bmd1) måtte være, og lig med den lodrette afstand mellem linierne, altså netop estimatet for treat. Fra ovenstående output ses således, at der stadig er en signifikant forskel på grupperne ved follow-up, og at P-værdien er blevet en del mindre (P=0.007 mod før 0.04). Forskellen er stadig i Calcium gruppens favør, og estimeres nu til lidt mindre, nemlig , med med et 95% konfidensinterval på (0.0065, ). Sammenligner vi med intervallet fra spm. 3, ser vi, at det nu er blevet en del smallere. Vi har altså vundet styrke ved at inddrage baseline værdien i modellen (fordi vi har nedbragt den uforklarede biologiske variation ved at forklare en del af den med bmd1). 5. Udregn ændringen (tilvæksten) i knogledensitet for hver enkelt pige og kvantificer middelværdien af denne, for hver gruppe for sig. Husk konfidensinterval. Er der evidens for en reel forøgelse af bone mineral density i placebogruppen? Denne differens er beregnet som delta_bmd=bmd5-bmd1; 11

12 og vi skaffer os som sædvanlig lige et overblik ved at se på et Box plot: For at kvantificere middelværdi, med konfidensinterval, samt at vurdere testet for middelværdi 0, behøver vi faktisk ikke bruge andet end proc means, når bare vi tilføjer de relevante keywords: proc means N mean stderr clm t probt data=calcium; var delta_bmd; og vi finder så The MEANS Procedure Analysis Variable : delta_bmd N Lower 95% Upper 95% treat Obs N Mean Std Error CL for Mean CL for Mean C P Analysis Variable : delta_bmd N treat Obs t Value Pr > t C <.0001 P <

13 som viser, at der sker en reel forøgelse i bmd i begge grupper (P < for begge). Tilvæksten er noget større i Calcium-gruppen, men konfidensgrænserne er overlappende. 6. Sammenlign tilvæksten i knogledensitet for de 2 grupper. Kvantificer forskellen på disse ændringer, og husk igen konfidensinterval. Man kan ikke slutte ud fra ovenstående overlappende konfidensgrænser, at der ikke er forskel på tilvæksterne i de to grupper! Man er nødt til at undersøge det, nedenfor ved hjælp af et T-test: proc ttest data=calcium; var delta_bmd; som giver The TTEST Procedure Variable: delta_bmd treat N Mean Std Dev Std Err Minimum Maximum C P Diff (1-2) treat Method Mean 95% CL Mean Std Dev C P Diff (1-2) Pooled Diff (1-2) Satterthwaite Method Variances DF t Value Pr > t Pooled Equal Satterthwaite Unequal Equality of Variances Method Num DF Den DF F Value Pr > F Folded F Vi ser, at ændringerne faktisk er signifikant forskellige, idet Calciumgruppen har en større tilvækst end Placebo-gruppen. Forskellen estimeres til , med 95% konfidensinterval på (0.0042, ). 13

14 Forklar forskellen til spørgsmål 3 og 4b (lav evt. en lille tabel med resultater i form af estimater med tilhørende konfidensintervaller). En sammenfattende tabel over sammenligningen af gruppe C og P (der tillige medtager resultater fra spørgsmål 7 nedenfor) kunne være Forskel Calcium vs. Placebo Spm. nr. Metode Estimat 95% konfidensgrænser P-værdi 3 Y:bmd (0.0013, ) b Y:bmd (0.0065, ) X:bmd1 6 Y:delta_bmd (0.0042, ) Y:delta_bmd (0.0065, ) X:bmd1 Her ses, at alle analyserne er ret enige om selve estimatet for behandlingseffekten, og det skyldes, at randomiseringen er gået fint (måske endda overordentlig=suspekt fint). Konfidensgrænserne for estimatet (og derved også P-værdierne) varierer dog lidt, idet vi vinder præcision ved at inddrage baseline værdien i analysen, enten ved at fratrække denne (spm. 6) eller ved at inddrage den som kovariat (smp. 4 og 7). Den sidste metode ses at give det smalleste konfidensinterval, og vi udtrykker dette ved at sige, at den er mest efficient, altså at den udnytter data bedst muligt. Desuden eliminerer den den bias, der kunne komme ved regression to the mean. Bemærk, at spørgsmål 4 og 7 (nedenfor) giver helt identiske resultater. 7. Har udgangsværdien i knogledensitet nogen betydning for den efterfølgende tilvækst? Kvantificer den forventede ekstra tilvækst for en person i C-gruppen i forhold til en person i P-gruppen, under forudsætning af, at disse begge starter fra udgangspunktet (bmd1=0.8). 14

15 Nu gør vi ligesom i spm. 4 og inkluderer baseline værdien bmd1 som kovariat: Bemærk, at sammenhængen nu er negativ, dvs. hvis man starter lavt, får man den største tilvækst. proc glm data=calcium; model delta_bmd=bmd1 treat / solution clparm; Outputtet bliver The GLM Procedure Class Level Information Class Levels Values treat 2 C P Number of Observations Read 112 Number of Observations Used 91 The GLM Procedure Dependent Variable: delta_bmd Sum of Source DF Squares Mean Square F Value Pr > F Model Error

16 Corrected Total R-Square Coeff Var Root MSE delta_bmd Mean Source DF Type I SS Mean Square F Value Pr > F bmd treat Source DF Type III SS Mean Square F Value Pr > F bmd treat Standard Parameter Estimate Error t Value Pr > t Intercept B <.0001 bmd treat C B treat P B... Parameter 95% Confidence Limits Intercept bmd treat C treat P.. Vi ser, at der stadig er en signifikant forskel på tilvæksterne i grupperne, og at P-værdien er den samme som i spm. 4.. Dette er ikke et tilfælde, det er helt generelt. Forskellen i Calcium gruppens favør estimeres også til helt den samme værdi, dvs , med med et 95% konfidensinterval på (0.0065, ). Vi ser, at hældningen svarende til effekten af bmd1 er negativ, svarende til det ovenfor nævnte faktum, at der er størst tilvækst for de, der ligger lavt fra starten (regression to the mean). 8. Har det nogen betydning for konklusionen, at der ikke er lige lang tid mellem målingerne for alle individerne? Her kan man vælge enten at omdefinere sit outcome til ændring pr. år eller at inddrage tidsforskellen direkte i modellen. Det er langt det letteste at forstå blot at omregne outcome til ændring pr. år: delta_pr_aar=delta_bmd*365/dage; 16

17 og så udføre et T-test på dette nye outcome: proc ttest data=calcium; var delta_pr_aar; hvorved vi får The TTEST Procedure Variable: delta_pr_aar treat N Mean Std Dev Std Err Minimum Maximum C P Diff (1-2) treat Method Mean 95% CL Mean Std Dev C P Diff (1-2) Pooled Diff (1-2) Satterthwaite Method Variances DF t Value Pr > t Pooled Equal Satterthwaite Unequal Equality of Variances Method Num DF Den DF F Value Pr > F Folded F Der er ikke de store ændringer i resultaterne her, bortset fra, at tallene nu er blevet halveret, fordi vi ser på ændringer pr. år, og ikke over hele perioden, som jo er 2 år. Det kunne vi selvfølgelig bare ændre ved at gange med 2... En anden mulighed er blot at tilføje antallet af dage mellem målingerne som kovariat, enten med eller uden bmd1 som kovariat, altså i en af modellerne proc glm data=calcium; model delta_bmd=dage treat / solution clparm; 17

18 proc glm data=calcium; model delta_bmd=dage bmd1 treat / solution clparm; hvorved vi får (output meget beskåret) Standard Parameter Estimate Error t Value Pr > t Intercept B dage treat C B treat P B... Parameter 95% Confidence Limits Intercept dage treat C treat P.. eller Standard Parameter Estimate Error t Value Pr > t Intercept B dage bmd treat C B treat P B... Parameter 95% Confidence Limits Intercept dage bmd treat C treat P.. Vi ser, at forskellen i grupperne nu estimeres til hhv , med 95% konfidensinterval på (0.0046, ) hhv. (0.0070, ). 18

19 Vi sammenfatter alle resultaterne nedenfor: Forskel Calcium vs. Placebo Spm. nr. Metode Estimat 95% konfidensgrænser P-værdi 3 Y:bmd (0.0013, ) b Y:bmd (0.0065, ) X:bmd1 6 Y:delta_bmd (0.0042, ) Y:delta_bmd (0.0065, ) X:bmd1 8a Y:delta_pr_aar* (0.0046, ) b Y:delta_bmd (0.0046, ) X:dage 8c Y:delta_bmd (0.0070, ) X:dage bmd1 Der er imidlertid et lille problem med hensyn til forståelsen af de sidst udførte modeller. Interceptet i model 8b skulle således svare til tilvæksten i bmd i referencegruppen Placebo, på 0 dage, så denne burde måske sættes til 0. På den anden side er der her tale om en ganske overordentlig vild ekstrapolation (da vi aldrig kommer i nærheden af 0 dage med forskellen på de to målinger), så indvendingen er næppe relevant. Noget helt andet er, at der i virkeligheden er 5 målinger for hver pige, og vi kommer tilbage til disse data i kursets sidste uge. 9. Et antal piger har kun fået målt bmd en enkelt gang. Beskriv bortfaldet (gerne grafisk) og kommenter dets mulige betydning for konklusionerne. Først skal vi have defineret en variabel, der angiver, om der er tale om en pige, der har begge målinger (bortfald=0) eller en, der kun har måling ved baseline (bortfald=1). Dette kan f.eks. gøres ved at tilføje nedenstående sætning inden første : 19

20 if bmd5<0 then bortfald=1; else bortfald=0; Herefter kan vi bruge bortfald til at opdele materialet. Nedenfor ses Box plot af bmd1 for bortfaldsgruppen i forhold til ikke-bortfaldsgruppen, for hver behandlingsgruppe for sig: proc sort data=calcium; by treat; proc sgplot data=calcium; by treat; vbox bmd1 / category=bortfald; Det ser ikke ud som om der er nogen voldsomme skævheder, altså ikke tegn på, at bortfaldsgruppen ligger helt anderledes end resten ved baseline. Dette er jo af gode grunde det eneste, vi kan undersøge, da vi ikke har follow-up målingen bmd5 og dermed heller ikke tilvæksten. Vi kunne lige lave en tabel over gennemsnit og spredninger: 20

21 proc tabulate data=calcium; class treat bortfald; var bmd1; table treat*bortfald,bmd1*(n*(f=4.0) mean*(f=6.4) std*(f=6.4)); bmd N Mean Std treat bortfald C P Af denne tabel ses, at bortfaldsgruppen i placebogruppen ligger noget højere end de øvrige. Da sådanne personer med høje niveauer forventes at have en lavere tilvækst (på grund af regression to the mean-effekten), kan der altså være en tendens til at overvurdere tilvæksten i placebogruppen og derved at undervurdere effekten af calcium. På den anden side kan personer med et højt niveau også tænkes at være nogle, der har en hurtig tilvækst i knogledensitet, hvorved effekten vil gå i den modsatte retning. Det ses, at der på ingen måde tale om signifikante forskelle, men så igen: Det er vanskeligt at finde signifikante forskelle med så små grupper, og en manglende signifikans er ikke det samme som ingen grund til bekymring. Reference: Vonesh, F & Chinchilli, V.M. (1997): Linear and nonlinear models for the analysis of repeated measurements. Chapman & Hall. 21

Hjemmeopgave, efterår 2009

Hjemmeopgave, efterår 2009 Hjemmeopgave, efterår 2009 Basal statistik for sundhedsvidenskabelige forskere Udleveret 29. september, afleveres senest ved øvelserne i uge 44 (27.-29. oktober) I alt 112 piger har fået målt bone mineral

Læs mere

Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013

Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013 Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013 I forbindelse med reagensglasbehandling blev 100 par randomiseret til to forskellige former for hormonstimulation.

Læs mere

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1 Københavns Universitet Afdeling for Anvendt Matematik og Statistik Statistik for biokemikere Inge Henningsen Michael Sørensen Oktober 2003 Opgaver til ZAR II Opgave 1 Et datasæt består af 20 observationer.

Læs mere

Vejledende besvarelse af hjemmeopgave, forår 2015

Vejledende besvarelse af hjemmeopgave, forår 2015 Vejledende besvarelse af hjemmeopgave, forår 2015 En stikprøve bestående af 65 mænd og 65 kvinder er blevet undersøgt med henblik på at se på en evt. sammenhæng mellem kropstemperatur og puls. På hjemmesiden

Læs mere

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper.

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper. 1. Indlæs data. * HUSK at angive din egen placering af filen; data framing; infile '/home/sro00/mph2016/framing.txt' firstobs=2; input id sex age frw sbp sbp10 dbp chol cig chd yrschd death yrsdth cause;

Læs mere

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer.

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer. Vejledende besvarelse af hjemmeopgave Basal statistik, efterår 2008 En gruppe bestående af 45 patienter med reumatoid arthrit randomiseres til en af 6 mulige behandlinger, nemlig placebo, aspirin eller

Læs mere

Vejledende besvarelse af hjemmeopgave

Vejledende besvarelse af hjemmeopgave Vejledende besvarelse af hjemmeopgave Basal statistik, efterår 2013 Udleveret 1. oktober, afleveres senest ved øvelserne i uge 44 (29. oktober-1. november) I forbindelse med en undersøgelse af vitamin

Læs mere

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved Matematisk Modellering 1 (reeksamen) Side 1 Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved { 1 hvis x {1, 2, 3}, p X (x) = 3 0 ellers,

Læs mere

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Lineær regression. Simpel regression. Model. ofte bruges følgende notation: Lineær regression Simpel regression Model Y i X i i ofte bruges følgende notation: Y i 0 1 X 1i i n i 1 i 0 Findes der en linie, der passer bedst? Metode - Generel! least squares (mindste kvadrater) til

Læs mere

Vejledende besvarelse af hjemmeopgave, forår 2016

Vejledende besvarelse af hjemmeopgave, forår 2016 Vejledende besvarelse af hjemmeopgave, forår 2016 Udleveret 1. marts, afleveres senest ved øvelserne i uge 13 (29. marts-1. april) Denne opgave fokuserer på at beskrive niveauet af hormonet AMH (højt niveau

Læs mere

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Multipel regression M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Y j 1 X 1j 2 X 2j... m X mj j eller m Y j 0 i 1 i X ij j BEMÆRK! j svarer til individ

Læs mere

k normalfordelte observationsrækker (ensidet variansanalyse)

k normalfordelte observationsrækker (ensidet variansanalyse) k normalfordelte observationsrækker (ensidet variansanalyse) Lad x ij, i = 1,...,k, j = 1,..., n i, være udfald af stokastiske variable X ij og betragt modellen M 1 : X ij N(µ i, σ 2 ). Estimaterne er

Læs mere

Reeksamen i Statistik for Biokemikere 6. april 2009

Reeksamen i Statistik for Biokemikere 6. april 2009 Københavns Universitet Det Naturvidenskabelige Fakultet Reeksamen i Statistik for Biokemikere 6. april 2009 Alle hjælpemidler er tilladt, og besvarelsen må gerne skrives med blyant. Opgavesættet er på

Læs mere

Opgavebesvarelse, brain weight

Opgavebesvarelse, brain weight Opgavebesvarelse, brain weight (Matthews & Farewell: Using and Understanding Medical Statistics, 2nd. ed.) Spørgsmål 1 Data er indlagt på T:/Basalstatistik/brain.txt og kan indlæses direkte i Analyst med

Læs mere

Variansanalyse i SAS. Institut for Matematiske Fag December 2007

Variansanalyse i SAS. Institut for Matematiske Fag December 2007 Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Institut for Matematiske Fag December 2007 Variansanalyse i SAS 2 Tosidet variansanalyse Residualplot Tosidet variansanalyse

Læs mere

Phd-kursus i Basal Statistik, Opgaver til 2. uge

Phd-kursus i Basal Statistik, Opgaver til 2. uge Phd-kursus i Basal Statistik, Opgaver til 2. uge Opgave 1: Sædkvalitet Filen oeko.txt på hjemmesiden indeholder datamateriale til belysning af forskellen i sædkvalitet mellem SAS-ansatte og mænd, der lever

Læs mere

Opgavebesvarelse, Basalkursus, uge 3

Opgavebesvarelse, Basalkursus, uge 3 Opgavebesvarelse, Basalkursus, uge 3 Opgave 1: Udskrivning af astma patienter (DGA s. 273) I en randomiseret undersøgelse foretaget af Storr et. al. (Lancet, i, 1987) sammenlignes effekten af en enkelt

Læs mere

Tovejs-ANOVA (Faktoriel) Regler og problemer kan generaliseres til mere end to hovedfaktorer med tilhørende interaktioner

Tovejs-ANOVA (Faktoriel) Regler og problemer kan generaliseres til mere end to hovedfaktorer med tilhørende interaktioner Tovejs-ANOVA (Faktoriel) Regler og problemer kan generaliseres til mere end to hovedfaktorer med tilhørende interaktioner I modsætning til envejs-anova kan flervejs-anova udføres selv om der er kun én

Læs mere

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1 Matematisk Modellering 1 Side 1 I nærværende opgavesæt er der 16 spørgsmål fordelt på 4 opgaver. Ved bedømmelsen af besvarelsen vægtes alle spørgsmål lige. Endvidere lægges der vægt på, at det af besvarelsen

Læs mere

Basal statistik. Logaritmer og kovariansanalyse. Nyt eksempel vedr. sammenligning af målemetoder. Scatter plot af de to metoder

Basal statistik. Logaritmer og kovariansanalyse. Nyt eksempel vedr. sammenligning af målemetoder. Scatter plot af de to metoder Faculty of Health Sciences Logaritmer og kovariansanalyse Basal statistik Logaritmer. Kovariansanalyse Lene Theil Skovgaard 29. september 2015 Parret sammenligning, målemetoder med logaritmer Tosidet variansanalyse

Læs mere

Faculty of Health Sciences. Basal statistik. Logaritmer. Kovariansanalyse. Lene Theil Skovgaard. 29. september 2015

Faculty of Health Sciences. Basal statistik. Logaritmer. Kovariansanalyse. Lene Theil Skovgaard. 29. september 2015 Faculty of Health Sciences Basal statistik Logaritmer. Kovariansanalyse Lene Theil Skovgaard 29. september 2015 1 / 84 Logaritmer og kovariansanalyse Parret sammenligning, målemetoder med logaritmer Tosidet

Læs mere

En Introduktion til SAS. Kapitel 5.

En Introduktion til SAS. Kapitel 5. En Introduktion til SAS. Kapitel 5. Inge Henningsen Afdeling for Statistik og Operationsanalyse Københavns Universitet Marts 2005 6. udgave Kapitel 5 T-test og PROC UNIVARIATE 5.1 Indledning Dette kapitel

Læs mere

Kommentarer til øvelser i basalkursus, 2. uge

Kommentarer til øvelser i basalkursus, 2. uge Kommentarer til øvelser i basalkursus, 2. uge Opgave 2. Vi betragter målinger af hjertevægt (i g) og total kropsvægt (målt i kg) for 10 normale mænd og 11 mænd med hjertesvigt. Målingerne er taget ved

Læs mere

Basal statistik. 21. oktober 2008

Basal statistik. 21. oktober 2008 Basal statistik 21. oktober 2008 Den generelle lineære model Repetition af variansanalyse og multipel regression Interaktion Parametriseringer Kovariansanalyse Esben Budtz-Jørgensen, Biostatistisk Afdeling

Læs mere

Filen indeholder 45 linier, først en linie med variabelnavnene (bw og rmr) og derefter 44 datalinier, hver med disse to oplysninger.

Filen indeholder 45 linier, først en linie med variabelnavnene (bw og rmr) og derefter 44 datalinier, hver med disse to oplysninger. Opgavebesvarelse, Resting metabolic rate I filen rmr.txt findes sammenhørende værdier af kropsvægt (bw, i kg) og hvilende stofskifte (rmr, kcal pr. døgn) for 44 kvinder (Altman, 1991 og Owen et.al., Am.

Læs mere

Model. (m separate analyser). I vores eksempel er m = 2, n 1 = 13 (13 journalister) og

Model. (m separate analyser). I vores eksempel er m = 2, n 1 = 13 (13 journalister) og Model M 0 : X hi N(α h + β h t hi,σ 2 h ), h = 1,...,m, i = 1,...,n h. m separate regressionslinjer. Behandles som i afsnit 3.3. (m separate analyser). I vores eksempel er m = 2, n 1 = 13 (13 journalister)

Læs mere

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j Hypoteser om mere end to stikprøver ANOVA k stikprøver: (ikke ordinale eller højere) H 0 : 1 2... k gælder også for k 2! H 0ij : i j H 0ij : i j simpelt forslag: k k 1 2 t-tests: i j DUER IKKE! Bonferroni!!

Læs mere

Restsaltmængdernes afhængighed af trafikken,

Restsaltmængdernes afhængighed af trafikken, Restsaltmængdernes afhængighed af trafikken, Thomas Glue, marts 2. Trafikintensitet...2 Indledende definitioner...2 Regressionsanalyser på trafikintensiteten...6 Justering af restsaltmængder i henhold

Læs mere

Besvarelse af opgave om Vital Capacity

Besvarelse af opgave om Vital Capacity Besvarelse af opgave om Vital Capacity hentet fra P. Armitage & G. Berry: Statistical methods in medical research. 2nd ed. Blackwell, 1987. Spørgsmål 1: Indlæs data og konstruer en faktor (klassevariabel)

Læs mere

Variansanalyse i SAS 1. Institut for Matematiske Fag December 2007

Variansanalyse i SAS 1. Institut for Matematiske Fag December 2007 Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Institut for Matematiske Fag December 2007 Variansanalyse i SAS 1 Ensidet variansanalyse Bartlett s test Tukey s test PROC

Læs mere

Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge

Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge Opgave 1. Data indlæses i 3 kolonner, som f.eks. kaldessalt,pre ogpost. Der er således i alt tale om 26 observationer, idet de to grupper lægges

Læs mere

Basal Statistik. Sammenligning af grupper. Vitamin D eksemplet. Praktisk håndtering af data. Faculty of Health Sciences

Basal Statistik. Sammenligning af grupper. Vitamin D eksemplet. Praktisk håndtering af data. Faculty of Health Sciences Faculty of Health Sciences Sammenligning af grupper Basal Statistik Sammenligning af grupper, Variansanalyse Lene Theil Skovgaard 7. februar 2017 Sammenligning af to grupper: T-test Dimensionering af undersøgelser

Læs mere

Faculty of Health Sciences. Basal Statistik. Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 7. februar 2017

Faculty of Health Sciences. Basal Statistik. Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 7. februar 2017 Faculty of Health Sciences Basal Statistik Sammenligning af grupper, Variansanalyse Lene Theil Skovgaard 7. februar 2017 1 / 96 Sammenligning af grupper Sammenligning af to grupper: T-test Dimensionering

Læs mere

n r x rs x r = 1 n r s=1 (x rs x r ) 2, s=1

n r x rs x r = 1 n r s=1 (x rs x r ) 2, s=1 (a) Denne opgave bygger på resultaterne fra 2 forsøg med epo-behandling af for tidligt fødte børn, idet gruppe 1 og 3 stammer fra første forsøg, mens gruppe 2 og 4 stammer fra det andet. Det må antages,

Læs mere

Postoperative komplikationer

Postoperative komplikationer Løsninger til øvelser i kategoriske data, oktober 2008 1 Postoperative komplikationer Udgangspunktet for vurdering af den ny metode må være en nulhypotese om at der er samme komplikationshyppighed, 20%.

Læs mere

Eksamen i Statistik for biokemikere. Blok

Eksamen i Statistik for biokemikere. Blok Københavns Universitet Det Naturvidenskabelige Fakultet Eksamen i Statistik for biokemikere. Blok 2 2006. 3 timers skriftlig prøve. Alle hjælpemidler - også blyant - er tilladt. Opgavesættet er på 6 sider.

Læs mere

Løsning til opgave i logistisk regression

Løsning til opgave i logistisk regression Løsning til øvelser i logistisk regression, november 2008 1 Løsning til opgave i logistisk regression 1. Først indlæses data, og vi kan lige sørge for at danne en dummy-variable for cml, som indikator

Læs mere

Modul 11: Simpel lineær regression

Modul 11: Simpel lineær regression Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 11: Simpel lineær regression 11.1 Regression uden gentagelser............................. 1 11.1.1 Oversigt....................................

Læs mere

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april Århus 8. april 2011 Morten Frydenberg Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april Opgave 1 ( gruppe 1: sp 1-4, gruppe 5: sp 5-9 og gruppe 6: 10-14) I denne opgaveser vi på et

Læs mere

2. januar 2015 Proj.nr. 2001474 Version 1 LRK/EHBR/EVO/CCM/MT. Rapport

2. januar 2015 Proj.nr. 2001474 Version 1 LRK/EHBR/EVO/CCM/MT. Rapport Rapport Projekt: Fedtkvalitet i moderne svineproduktion Betdning af jodtal for udbtter af kogeskinker Lars Kristensen, Eva Honnens de Lichtenberg Broge, Eli Vibeke Olsen, Chris Claudi- Magnussen 2. januar

Læs mere

Løsning til øvelsesopgaver dag 4 spg 5-9

Løsning til øvelsesopgaver dag 4 spg 5-9 Løsning til øvelsesopgaver dag 4 spg 5-9 5: Den multiple model Vi tilføjer nu yderligere to variable til vores model : Køn og kolesterol SBP = a + b*age + c*chol + d*mand hvor mand er 1 for mænd, 0 for

Læs mere

Logistisk Regression - fortsat

Logistisk Regression - fortsat Logistisk Regression - fortsat Likelihood Ratio test Generel hypotese test Modelanalyse Indtil nu har vi set på to slags modeller: 1) Generelle Lineære Modeller Kvantitav afhængig variabel. Kvantitative

Læs mere

Overlevelsesanalyse. Faculty of Health Sciences

Overlevelsesanalyse. Faculty of Health Sciences Faculty of Health Sciences Overlevelsesanalyse Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Program Overlevelsesdata Kaplan-Meier estimatoren

Læs mere

Epidemiologi og Biostatistik

Epidemiologi og Biostatistik Kapitel 1, Kliniske målinger Epidemiologi og Biostatistik Introduktion til skilder (varianskomponenter) måleusikkerhed sammenligning af målemetoder Mogens Erlandsen, Institut for Biostatistik Uge, torsdag

Læs mere

Reeksamen i Statistik for biokemikere. Blok 3 2007.

Reeksamen i Statistik for biokemikere. Blok 3 2007. Københavns Universitet Det Naturvidenskabelige Fakultet Reeksamen i Statistik for biokemikere. Blok 3 2007. Opgave 1. 3 timers skriftlig prøve. Alle hjælpemidler - også blyant - er tilladt. Opgavesættet

Læs mere

Man indlæser en såkaldt frequency-table i SAS ved følgende kommandoer:

Man indlæser en såkaldt frequency-table i SAS ved følgende kommandoer: 1 IHD-Lexis 1.1 Spørgsmål 1 Man indlæser en såkaldt frequency-table i SAS ved følgende kommandoer: data ihdfreq; input eksp alder pyrs cases; lpyrs=log(pyrs); cards; 0 2 346.87 2 0 1 979.34 12 0 0 699.14

Læs mere

Konfidensintervaller og Hypotesetest

Konfidensintervaller og Hypotesetest Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller

Læs mere

Statistiske Modeller 1: Kontingenstabeller i SAS

Statistiske Modeller 1: Kontingenstabeller i SAS Statistiske Modeller 1: Kontingenstabeller i SAS Jens Ledet Jensen October 31, 2005 1 Indledning Som vist i Notat 1 afsnit 13 er 2 log Q for et test i en multinomialmodel ækvivalent med et test i en poissonmodel.

Læs mere

Vejledende besvarelse af hjemmeopgave, forår 2017

Vejledende besvarelse af hjemmeopgave, forår 2017 Vejledende besvarelse af hjemmeopgave, forår 2017 På hjemmesiden http://publicifsv.sund.ku.dk/~lts/basal17_1/hjemmeopgave/hjemmeopgave.txt ligger data fra 400 fødende kvinder. Der er tale om et uddrag

Læs mere

1 Hb SS Hb Sβ Hb SC = , (s = )

1 Hb SS Hb Sβ Hb SC = , (s = ) PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.

Læs mere

To-sidet varians analyse

To-sidet varians analyse To-sidet varians analyse Repetition En-sidet ANOVA Parvise sammenligninger, Tukey s test Model begrebet To-sidet ANOVA Tre-sidet ANOVA Blok design SPSS ANOVA - definition ANOVA (ANalysis Of VAriance),

Læs mere

Dagens Temaer. Test for lineær regression. Test for lineær regression - via proc glm. k normalfordelte obs. rækker i proc glm. p. 1/??

Dagens Temaer. Test for lineær regression. Test for lineær regression - via proc glm. k normalfordelte obs. rækker i proc glm. p. 1/?? Dagens Temaer k normalfordelte obs. rækker i proc glm. Test for lineær regression Test for lineær regression - via proc glm p. 1/?? Proc glm Vi indlæser data i datasættet stress, der har to variable: areal,

Læs mere

Multipel Lineær Regression

Multipel Lineær Regression Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer

Læs mere

Køn. Holdning Mænd Kvinder Ialt JA NEJ VED IKKE

Køn. Holdning Mænd Kvinder Ialt JA NEJ VED IKKE Økonomisk Kandidateksamen Teoretisk Statistik Eksamenstermin: Sommer 2004, dato: 3. juni 4 timers prøve med alle hjælpemidler, besvarelse på Dansk Opgave En simpel tilfældig stikprøve på 500 udtrukket

Læs mere

Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004

Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004 Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004 Formål med Øvelsen: Formålet med øvelsen er at analysere om risikoen for død er forbundet med to forskellige vacciner BCG (mod

Læs mere

Basal Statistik. Simpel lineær regression. Simpel lineær regression. Data. Faculty of Health Sciences

Basal Statistik. Simpel lineær regression. Simpel lineær regression. Data. Faculty of Health Sciences Faculty of Health Sciences Simpel lineær regression Basal Statistik Regressionsanalyse. Lene Theil Skovgaard 21. februar 2017 Regression og korrelation Simpel lineær regression Todimensionale normalfordelinger

Læs mere

Opgavebesvarelse, Basalkursus, uge 3

Opgavebesvarelse, Basalkursus, uge 3 Opgavebesvarelse, Basalkursus, uge 3 Opgave 1: Udskrivning af astma patienter (DGA s. 273) I en randomiseret undersøgelse foretaget af Storr et. al. (Lancet, i, 1987) sammenlignes effekten af en enkelt

Læs mere

Vi vil analysere effekten af rygning og alkohol på chancen for at blive gravid ved at benytte forskellige Cox regressions modeller.

Vi vil analysere effekten af rygning og alkohol på chancen for at blive gravid ved at benytte forskellige Cox regressions modeller. Løsning til øvelse i TTP dag 3 Denne øvelse omhandler tid til graviditet. Et studie vedrørende tid til graviditet (Time To Pregnancy = TTP) inkluderede 423 par i alderen 20-35 år. Parrene blev fulgt i

Læs mere

Øvelser til basalkursus, 2. uge

Øvelser til basalkursus, 2. uge Øvelser til basalkursus, 2. uge Opgave 1 Vi betragter igen Sundby95-materialet, og skal nu forbedre nogle af de ting, vi gjorde sidste gang. 1. Gå ind i ANALYST vha. Solutions/Analysis/Analyst. 2. Filen

Læs mere

MPH specialmodul Epidemiologi og Biostatistik

MPH specialmodul Epidemiologi og Biostatistik MPH specialmodul Epidemiologi og Biostatistik Kvantitative udfaldsvariable 23. maj 2011 www.biostat.ku.dk/~sr/mphspec11 Susanne Rosthøj (Per Kragh Andersen) 1 Kapitelhenvisninger Andersen & Skovgaard:

Læs mere

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17 nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse

Læs mere

Program. Forsøgsplanlægning og tosidet variansanalyse. Eksempel: fuldstændigt randomiseret forsøg. Forsøgstyper

Program. Forsøgsplanlægning og tosidet variansanalyse. Eksempel: fuldstændigt randomiseret forsøg. Forsøgstyper Program Forsøgsplanlægning og tosidet variansanalyse Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Forsøgstyper og forsøgsplanlægning Analyse af data fra fuldstændigt randomiseret blokforsøg: tosidet

Læs mere

Faculty of Health Sciences. Basal Statistik. Begreber. Parrede sammenligninger. Lene Theil Skovgaard. 6. september 2016

Faculty of Health Sciences. Basal Statistik. Begreber. Parrede sammenligninger. Lene Theil Skovgaard. 6. september 2016 Faculty of Health Sciences Basal Statistik Begreber. Parrede sammenligninger. Lene Theil Skovgaard 6. september 2016 1 / 88 APPENDIX Programbidder svarende til diverse slides: Indlæsning af vitamin D datasæt,

Læs mere

Basal statistik for sundhedsvidenskabelige forskere, efterår 2015 Udleveret 29. september, afleveres senest ved øvelserne i uge 44 (27.-30.

Basal statistik for sundhedsvidenskabelige forskere, efterår 2015 Udleveret 29. september, afleveres senest ved øvelserne i uge 44 (27.-30. Hjemmeopgave Basal statistik for sundhedsvidenskabelige forskere, efterår 2015 Udleveret 29. september, afleveres senest ved øvelserne i uge 44 (27.-30. oktober) En undersøgelse blandt fødende kvinder

Læs mere

En Introduktion til SAS. Kapitel 6.

En Introduktion til SAS. Kapitel 6. En Introduktion til SAS. Kapitel 6. Inge Henningsen Afdeling for Statistik og Operationsanalyse Københavns Universitet Marts 2005 6. udgave Kapitel 6 Regressionsanalyse i SAS 6.1 Indledning Dette kapitel

Læs mere

Basal statistik. Logaritmer og kovariansanalyse. Sammenligning af målemetoder. Scatter plot af de to metoder. Faculty of Health Sciences

Basal statistik. Logaritmer og kovariansanalyse. Sammenligning af målemetoder. Scatter plot af de to metoder. Faculty of Health Sciences Faculty of Health Sciences Logaritmer og kovariansanalyse Basal statistik Logaritmer, Repetition, Kovariansanalyse, Interaktion Lene Theil Skovgaard 4. oktober 2016 Parret sammenligning, målemetoder med

Læs mere

Epidemiologi og Biostatistik

Epidemiologi og Biostatistik Epidemiologi og Biostatistik Kliniske målinger (Kapitel. +.1 + 11.-11 + 1.1-) Introduktion til skilder (varianskomponenter) måleusikkerhed sammenligning af målemetoder Mogens Erlandsen, Institut for Biostatistik

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Løsning til eksaminen d. 14. december 2009

Løsning til eksaminen d. 14. december 2009 DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,

Læs mere

Basal statistik for lægevidenskabelige forskere, forår 2014 Udleveret 4. marts, afleveres senest ved øvelserne i uge 13 (25.

Basal statistik for lægevidenskabelige forskere, forår 2014 Udleveret 4. marts, afleveres senest ved øvelserne i uge 13 (25. Hjemmeopgave Basal statistik for lægevidenskabelige forskere, forår 2014 Udleveret 4. marts, afleveres senest ved øvelserne i uge 13 (25.-27 marts) Garvey et al. interesserer sig for sammenhængen mellem

Læs mere

Filen indeholder variablenavne i første linie, og de ligger i rækkefølgen

Filen indeholder variablenavne i første linie, og de ligger i rækkefølgen Opgavebesvarelse, Resting metabolic rate I filen T:\Basalstatistik\rmr.txt findes sammenhørende værdier af kropsvægt (bw, i kg) og hvilende stofskifte (rmr, kcal pr. døgn) for 44 kvinder (Altman, 1991

Læs mere

Skriftlig eksamen Science statistik- ST501

Skriftlig eksamen Science statistik- ST501 SYDDANSK UNIVERSITET INSTITUT FOR MATEMATIK OG DATALOGI Skriftlig eksamen Science statistik- ST501 Torsdag den 21. januar Opgavesættet består af 5 opgaver, med i alt 13 delspørgsmål, som vægtes ligeligt.

Læs mere

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Anvendt Statistik Lektion 7. Simpel Lineær Regression Anvendt Statistik Lektion 7 Simpel Lineær Regression 1 Er der en sammenhæng? Plot af mordraten () mod fattigdomsraten (): Scatterplot Afhænger mordraten af fattigdomsraten? 2 Scatterplot Et scatterplot

Læs mere

Skriftlig Eksamen ST501: Science Statistik Mandag den 11. juni 2007 kl. 15.00 18.00

Skriftlig Eksamen ST501: Science Statistik Mandag den 11. juni 2007 kl. 15.00 18.00 Skriftlig Eksamen ST501: Science Statistik Mandag den 11. juni 2007 kl. 15.00 18.00 Forskningsenheden for Statistik IMADA Syddansk Universitet Alle skriftlige hjælpemidler samt brug af lommeregner er tilladt.

Læs mere

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Normalfordelingen. Statistik og Sandsynlighedsregning 2 Normalfordelingen Statistik og Sandsynlighedsregning 2 Repetition og eksamen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige fejl på

Læs mere

Klasseøvelser dag 2 Opgave 1

Klasseøvelser dag 2 Opgave 1 Klasseøvelser dag 2 Opgave 1 1.1. Vi sætter først working directory og data indlæses: library( foreign ) d

Læs mere

Opgavebesvarelse, korrelerede målinger

Opgavebesvarelse, korrelerede målinger Opgavebesvarelse, korrelerede målinger I 18 familier bestående af far, mor og 3 børn (i veldefinerede aldersintervaller, med child1 som det ældste barn og child3 som det yngste) har man registreret antallet

Læs mere

MPH specialmodul i epidemiologi og biostatistik. SAS. Introduktion til SAS. Eksempel: Blodtryk og fedme

MPH specialmodul i epidemiologi og biostatistik. SAS. Introduktion til SAS. Eksempel: Blodtryk og fedme MPH specialmodul i epidemiologi og biostatistik. SAS Introduktion til SAS. Display manager (programmering) Vinduer: program editor (med syntaks-check) log output reproducerbart (program teksten kan gemmes

Læs mere

Program. 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. 1/12

Program. 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. 1/12 Program 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. 1/12 Ensidet variansanalyse: analyse af grupperede data Nedbrydningsrate for tre typer af opløsningsmidler (opgave 13.8 side 523) Sorption

Læs mere

Basal Statistik - SPSS

Basal Statistik - SPSS Faculty of Health Sciences Basal Statistik - SPSS Kovariansanalyse. Lene Theil Skovgaard 3. oktober 2017 1 / 12 APPENDIX med instruktioner til SPSS-analyse svarende til nogle af slides Bland-Altman plot,

Læs mere

Øvelser i epidemiologi og biostatistik, 12. april 2010 Ebeltoft-projektet: Analyse af alkoholrelaterede data mm. Eksempel på besvarelse

Øvelser i epidemiologi og biostatistik, 12. april 2010 Ebeltoft-projektet: Analyse af alkoholrelaterede data mm. Eksempel på besvarelse Øvelser i epidemiologi og biostatistik, 12. april 21 Ebeltoft-projektet: Analyse af alkoholrelaterede data mm. Eksempel på besvarelse 1. Belys ud fra data ved 5 års follow-up den fordom, at der er flere

Læs mere

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større

Læs mere

Program. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data

Program. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data Faculty of Life Sciences Program t-test Hypoteser, teststørrelser og p-værdier Claus Ekstrøm E-mail: ekstrom@life.ku.dk Resumé og hængepartier fra sidst. Eksempel: effekt af foder på hormonkoncentration

Læs mere

Hvad skal vi lave? Model med hovedvirkninger Model med vekselvirkning F-test for ingen vekselvirkning. 1 Kovariansanalyse. 2 Sammenligning af modeller

Hvad skal vi lave? Model med hovedvirkninger Model med vekselvirkning F-test for ingen vekselvirkning. 1 Kovariansanalyse. 2 Sammenligning af modeller Hvad skal vi lave? 1 Kovariansanalyse Model med hovedvirkninger Model med vekselvirkning F-test for ingen vekselvirkning 2 Sammenligning af modeller 3 Mere generelle modeller PSE (I17) ASTA - 14. lektion

Læs mere

Side 1 af 19 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402

Side 1 af 19 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402 Danmarks Tekniske Universitet Side 1 af 19 sider. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Introduktion til GLIMMIX

Introduktion til GLIMMIX Introduktion til GLIMMIX Af Jens Dick-Nielsen jens.dick-nielsen@haxholdt-company.com 21.08.2008 Proc GLIMMIX GLIMMIX kan bruges til modeller, hvor de enkelte observationer ikke nødvendigvis er uafhængige.

Læs mere

Morten Frydenberg Biostatistik version dato:

Morten Frydenberg Biostatistik version dato: Caerphilly studiet Design og Data Biostatistik uge 14 mandag Morten Frydenberg, Afdeling for Biostatistik Poisson regression En primær tidsakse og ikke stykkevise konstante rater Cox proportional hazard

Læs mere

Basal statistik. 30. januar 2007

Basal statistik. 30. januar 2007 Basal statistik 30. januar 2007 Deskriptiv statistik Typer af data Tabeller Grafik Summary statistics Lene Theil Skovgaard, Biostatistisk Afdeling Institut for Folkesundhedsvidenskab, Københavns Universitet

Læs mere

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge Statistik og Sandsynlighedsregning 2 Repetition og eksamen Overheads til forelæsninger, mandag 7. uge 1 Normalfordelingen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange

Læs mere

Ikke-parametriske tests

Ikke-parametriske tests Ikke-parametriske tests 2 Dagens menu t testen Hvordan var det nu lige det var? Wilcoxson Mann Whitney U Kruskall Wallis Friedman Kendalls og Spearmans correlation 3 t-testen Patient Drug Placebo difference

Læs mere

Modelkontrol i Faktor Modeller

Modelkontrol i Faktor Modeller Modelkontrol i Faktor Modeller Julie Lyng Forman Københavns Universitet Afdeling for Anvendt Matematik og Statistik Statistik for Biokemikere 2003 For at konklusionerne på en ensidet, flersidet eller hierarkisk

Læs mere

Kvant Eksamen December 2010 3 timer med hjælpemidler. 1 Hvad er en continuous variable? Giv 2 illustrationer.

Kvant Eksamen December 2010 3 timer med hjælpemidler. 1 Hvad er en continuous variable? Giv 2 illustrationer. Kvant Eksamen December 2010 3 timer med hjælpemidler 1 Hvad er en continuous variable? Giv 2 illustrationer. What is a continuous variable? Give two illustrations. 2 Hvorfor kan man bedre drage konklusioner

Læs mere

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Anvendt Statistik Lektion 8. Multipel Lineær Regression Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke

Læs mere

Udleveret 1. oktober, afleveres senest ved øvelserne i uge 44 (29. oktober-1. november)

Udleveret 1. oktober, afleveres senest ved øvelserne i uge 44 (29. oktober-1. november) Hjemmeopgave Basal statistik, efterår 2013 Udleveret 1. oktober, afleveres senest ved øvelserne i uge 44 (29. oktober-1. november) I forbindelse med en undersøgelse af vitamin D status i Europa, har man

Læs mere

Økonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol

Økonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol Økonometri: Lektion 5 Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol 1 / 35 Veksekvirkning: Motivation Vi har set på modeller som Price

Læs mere

Lav efterspørgsel forklarer det faldende bankudlån men udlånet forventes at stige igen

Lav efterspørgsel forklarer det faldende bankudlån men udlånet forventes at stige igen n o t a t Lav efterspørgsel forklarer det faldende bankudlån men udlånet forventes at stige igen 8. december 29 Kort resumé Henover året har der været megen fokus på faldet i bankernes udlån til virksomhederne.

Læs mere

Statistik Lektion 16 Multipel Lineær Regression

Statistik Lektion 16 Multipel Lineær Regression Statistik Lektion 6 Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 18 sider. Skriftlig prøve: 14. december 2009 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Institut for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression Regressionsanalyse Regressionsanalyser

Læs mere