Opgavebesvarelse vedr. overlevelsesanalyse

Størrelse: px
Starte visningen fra side:

Download "Opgavebesvarelse vedr. overlevelsesanalyse"

Transkript

1 Opgavebesvarelse vedr. overlevelsesanalyse Opgaven går ud på at vurdere effekten af azathioprine på overlevelsen hos 216 patienter med primær biliær cirrhose (PBC), ref. Christensen et al. (1985). Data stammer fra en clinical trial, hvor de 216 patienter er randomiseret til behandling med azathioprine eller placebo, hvorefter de følges over tid indtil død eller censurering. Filen pbc.txt indeholder følgende variable: dead: Indikator for død (0: Censurering, 1: Død) months: Antal måneder fra randomisering til udgang (død eller censurering) azathiop: Behandling (0: Placebo, 1: Azathioprine) bilirubin: Serum bilirubin måling ved baseline Først må vi indlæse data, og samtidlig tilføjer vi nogle labels, som gør vores udskrifter mere umiddelbart forståelige: data pbc; infile " URL firstobs=2; INPUT Dead Months Azathiop Bilirubin; LABEL Dead = "Død (0=censur, 1=død)" Months = "Måneder fra randomisering" Azathiop = "Azathioprine (0~Placebo, 1~Azathioprine)" Bilirubin = "Baseline serum bilirubin" ; RUN; 1. Da der er tale om et randomiseret studie, vurderes behandlingseffekten først uden inddragelse af diverse kovariater. Vurder effekten af azathioprine ud fra 1

2 (a) Kaplan-Meier kurver Kaplan-Meier kurver er nonparametriske estimater for overlevelseskurverne (nonparametrisk = ingen antagelser om fordelingen af dødstidspunkterne). proc phreg plots(overlay=row cl)=survival data=pbc; model months*dead(0)= ; strata azathiop; De er her tegnet med punktvise konfidensgrænser, fordi det oftest er nødvendigt at have konfidensgrænserne med for at kunne vurdere, om der er klar forskel på grupperne... Vi ser, at der er adskillige overkrydsninger mellem de to overlevelseskurver og ingen iøjnefaldende forskelle undtagen, at de måske divergerer lidt mod slut. (b) et passende test Vi skal se på tid til død, under hensyntagen til, at der forekommer censureringer (dead=0), og vi skal sammenligne to grupper. Det relevante test er et log-rank test: 2

3 proc phreg data=pbc; class azathiop(ref="0") / param=glm; model months*dead(0)=azathiop / ties=discrete rl; estimate "placebo vs azathiop" azathiop -1 1 / exp cl; estimate "azathiop vs placebo" azathiop 1-1 / exp cl; Vi finder nedenstående output, der ikke viser nogen signifikant forskel på de to grupper (P= for log-rank test, fundet under Testing Global Null Hypothesis: BETA=0 ud for Score). The PHREG Procedure Model Information Data Set WORK.PBC Dependent Variable months Måneder fra randomisering Censoring Variable dead Død (0=censur, 1=død) Censoring Value(s) 0 Ties Handling DISCRETE Number of Observations Read 216 Number of Observations Used 216 Summary of the Number of Event and Censored Values Percent Total Event Censored Censored Testing Global Null Hypothesis: BETA=0 Test Chi-Square DF Pr > ChiSq Likelihood Ratio Score Wald Analysis of Maximum Likelihood Estimates Parameter Standard Parameter DF Estimate Error Chi-Square Pr > ChiSq azathiop azathiop Hazard 95% Hazard Ratio Parameter Ratio Confidence Limits azathiop azathiop 0... Analysis of Maximum Likelihood Estimates Parameter Label azathiop 1 Azathioprine (0~Placebo, 1~Azathioprine) 1 azathiop 0 Azathioprine (0~Placebo, 1~Azathioprine) 0 Estimate 3

4 Standard Label Estimate Error z Value Pr > z Alpha placebo vs azathiop azathiop vs placebo Label Lower Upper Exponentiated placebo vs azathiop azathiop vs placebo Exponentiated Exponentiated Label Lower Upper placebo vs azathiop azathiop vs placebo (c) et estimat for hazard ratioen for azathiop-behandlede vs. placebobehandlede, med konfidensinterval Da vi havde valgt placebo som reference (azathiop=0), fik vi hazard ratio for de azathioprine-behandlede vs de placebo-behandlede direkte skrevet ud i outputtet ovenfor som 0.873, med konfidensgrænser (0.592, 1.288). Hvis vi i stedet vil beskrive den øgede hazard for de placebobehandlede, skal vi udregne exp( ) = 1.145, og tilsvarende med konfidensgrænserne. I stedet har vi tilføjet en estimatesætning til at foretage denne udregning for os, og vi ser, at konfidensgrænserne bliver (0.776, 1.690). I begge tilfælde er der tale om konfidensgrænser, der indeholder 1, svarende til, at der ikke er signifikant forskel på dødeligheden i de to grupper. 2. Serum bilirubin niveauet er generelt en meget stærk prognostisk faktor for patienter med leversygdom. Det er derfor relevant at undersøge betydningen af baseline serum bilirubin for prognosen hos patienter med primær biliær cirrhose. Vurder først ud fra nedenstående kriterier, om serum bilirubin bør transformeres: 4

5 (a) ved at se på fordelingen af serum bilirubin er der ekstreme observationer? Et histogram over alle værdierne set for bilirubin viser tydeligt, at der er tale om en meget skæv fordeling: proc sgplot data=pbc; histogram bilirubin; Denne skævhed er ikke noget problem i sig selv, da der ikke er nogetsomhelst krav til fordelingen af en kovariat. Men: I en så skæv fordeling kan der være meget indflydelsesrige observationer blandt de få, meget høje værdier, og det kan derfor være meget ustabilt at bibeholde denne skala. Logaritmetransformation kan bruges til at trække ekstremt høje værdier ind mod midten. Vi ser derfor også på en logaritmetransformeret bilirubin. Her er valgt logaritmen med grundtal 2: log2bili=log2(bilirubin); proc sgplot data=pbc; histogram log2bili; 5

6 Her ser vi en meget mere jævn fordeling uden meget ekstreme værdier. Det er derfor relevant at undersøge, om utransformeret bilirubin eller logaritmetransformeret bilirubin er mest relevant som prognostisk variabel for det vigtigste er jo, at det er en passende model for sammenhængen mellem bilirubin og dødsraten. (b) ved at inkludere serum bilirubin både utransformeret og passende transformeret på samme tid Dette kan gøres enten med eller uden behandlingen som kovariat, og vi ser på begge muligheder nedenfor. Først uden behandlingseffekt: proc phreg data=pbc; model months*dead(0)=bilirubin log2bili; der giver os outputtet The PHREG Procedure Model Information Data Set WORK.PBC Dependent Variable months Måneder fra randomisering Censoring Variable dead Død (0=censur, 1=død) 6

7 Censoring Value(s) 0 Ties Handling BRESLOW Number of Observations Read 216 Number of Observations Used 216 Summary of the Number of Event and Censored Values Percent Total Event Censored Censored Analysis of Maximum Likelihood Estimates Parameter Standard Parameter DF Estimate Error Chi-Square Pr > ChiSq bilirubin log2bili <.0001 Hazard Parameter Ratio Label bilirubin Baseline serum bilirubin log2bili Ovenstående output viser klart, at den logaritmetransformerede version af bilirubin er den med stærkest statistisk signifikans, mens den utransformerede kan udelades sammenhængen flader en smule mere ud end logaritme-transformationen (koefficienten til bilirubin er negativ) Og så til analysen med behandlingseffekt: proc phreg data=pbc; class azathiop(ref="0") / param=glm; model months*dead(0)=azathiop bilirubin log2bili; der giver outputtet The PHREG Procedure Analysis of Maximum Likelihood Estimates Parameter Standard Parameter DF Estimate Error Chi-Square Pr > ChiSq azathiop azathiop

8 bilirubin log2bili <.0001 Hazard Parameter Ratio Label azathiop Azathioprine (0~Placebo, 1~Azathioprine) 1 azathiop 0. Azathioprine (0~Placebo, 1~Azathioprine) 0 bilirubin Baseline serum bilirubin log2bili der ses at vise stort set det samme, forsåvidt angår effekten af bilirubin. Vi noterer os dog, at behandlingseffekten nu er blevet signifikant - hvilket vi skal komme tilbage til nedenfor. (c) ved at modellere effekten af serum bilirubin ved hjælp af en lineær spline Dette er svært... Først skal vi have fundet nogle fornuftige steder til opdeling af splinen, altså nogle steder (værdier af bilirubin), hvor vi tillader kurven at knække. I mangel af bedre viden om forløbet, kan man argumentere for at opdele efter kvartiler af bilirubin, men for at skaffe ca lige mange dødsfald i hver gruppe, vil vi benytte kvartilerne udregnet udelukkende blandt de døde. Disse findes først ved at skrive: proc means N Q1 median Q3 data=pbc; where dead=1; var bilirubin; hvorved vi får Analysis Variable : bilirubin Baseline serum bilirubin Lower Upper N Quartile Median Quartile

9 Vi vælger altså tærskelværdierne 30, 54 og 125 for bilirubin, og oppe øverst i programmet (inden første ) skriver vi de 3 definitioner ind: bili25=(bilirubin-30)*(bilirubin>30); bili50=(bilirubin-54)*(bilirubin>54); bili75=(bilirubin-125)*(bilirubin>125); hvorefter vi er klar til at benytte disse ekstra 3 variable sammen med selve bilirubin. Vi tilføjer en TEST-sætning, der undersøger, om de 3 ekstra variable kan undværes på en gang, idet dette er et test for linearitet af selve bilirubin: proc phreg data=pbc; class azathiop(ref="0") / param=glm; model months*dead(0)=azathiop bilirubin bili25 bili50 bili75; output out=tegn2 xbeta=spline; Testlinearitet: TEST bili25=bili50=bili75=0; Herved får vi outputtet: The PHREG Procedure Analysis of Maximum Likelihood Estimates Parameter Standard Parameter DF Estimate Error Chi-Square Pr > ChiSq azathiop azathiop bilirubin bili bili bili Analysis of Maximum Likelihood Estimates Hazard Parameter Ratio Label azathiop Azathioprine (0~Placebo, 1~Azathioprine) 1 azathiop 0. Azathioprine (0~Placebo, 1~Azathioprine) 0 bilirubin Baseline serum bilirubin bili bili bili

10 Linear Hypotheses Testing Results Wald Label Chi-Square DF Pr > ChiSq Testlinearitet <.0001 Output fra PHREG viser, at der ikke er en lineær sammenhæng med baseline serum bilirubin! Testet for linearitet (Testlinearitet) giver P < Det numeriske test bør dog aldrig stå alene man skal altid tegne den lineære spline. Hvis P -værdien er lav, men det er sammen med en meget savtakket kurve omkring en generelt lineær trend, så kan en lineær sammenhæng stadig være den mest relevante model at bruge. Vi har i koden ovenfor dannet et nyt datasæt, kaldet tegn, som indeholder de predikterede værdier på log hazard skala, kaldet spline (xbeta=spline). Vi kan tegne disse op som funktion af bilirubin og behandling ved at skrive: proc sort data=tegn; by azathiop bilirubin; proc sgplot data=tegn; series Y=spline X=bilirubin / group=azathiop markers; hvorved vi får figuren: 10

11 Vi ser her en påfaldende lighed med en logaritmefunktion. Hvis man kørte hele proceduren med en lineær spline igennem med log2bili som variabel i stedet for bilirubin, ville man faktisk finde en næsten perfekt lineær sammmenhæng. 3. Estimer og fortolk baseline serum bilirubins betydning for dødsraten. Alt under spørgsmål 2 viser, at vi bør se på logaritmetransformeret bilirubin. Vi vælger log 2 -transformeret bilirubin, fordi så får vi i outputtet vist effekten af en fordobling af serum bilirubin direkte som effektestimatet. proc phreg data=pbc; model months*dead(0)=azathiop log2bili / rl; Vi finder så outputtet: The PHREG Procedure Analysis of Maximum Likelihood Estimates Parameter Standard Parameter DF Estimate Error Chi-Square Pr > ChiSq 11

12 azathiop azathiop log2bili <.0001 Hazard 95% Hazard Ratio Parameter Ratio Confidence Limits azathiop azathiop 0... log2bili Analysis of Maximum Likelihood Estimates Parameter Label azathiop 1 Azathioprine (0~Placebo, 1~Azathioprine) 1 azathiop 0 Azathioprine (0~Placebo, 1~Azathioprine) 0 En dobbelt så høj baseline serum bilirubin giver en 2.10 (95% kofidensinterval: 1.81 til 2.45) gange større dødsrate, altså ca. en fordobling af dødsraten. 4. Estimer og fortolk effekten af azathioprine, justeret for effekten af bilirubin. Vi ser nu på det andet aspekt af analysen ovenfor, nemlig effekten af behandling med azathiprin. Vi konstaterede allerede tidligere, at denne var blevet signifikant efter justering med bilirubin, og P-værdien i analysen ovenfor er Vi skal nu kvantificere effekten. Konklusionen ses at være, at den estimerede effekt af behandling med azathioprine er en dødsrate på kun 59.4% (95% konfidensinterval fra 39.7% til 89.0%) af dødsraten blandt placebo-behandlede med samme baseline serum bilirubin. Det var lidt af en forskel fra den ujusterede analyse...! 5. Hvordan ville du afrapportere resultaterne i en artikel? Her bør man tage i betragtning, (a) at Cochrane centeret har vist, at justerede analyser i gennemsnit overestimerer de faktiske behandlingseffekter (sikkert fordi folk 12

13 tror på behandlingseffekten og derfor tror, at nu har de fundet den rigtige model, når den estimerede effekt tilfældigvis bliver stærkere). (b) at randomisering ikke sikrer, at man får helt ens fordelinger af confoundere, kun at der ikke er nogen systematiske forskelle til fordel for en bestemt behandlingsgruppe (c) hvad man selv skrev i protokollen (så man undgår fisketure) 6. Lav modelkontrol for Cox modellen, primært for effekten af den randomiserede behandling, men hvis der er tid, også for effekten af bilirubin. Modelkontrollen indbefatter: (a) Grafisk modelkontrol af proportionale rater for behandling Vi skal her se på antagelsen om proportionale intensiteter, hvilket gøres ved at tegne log minus log af overlevelseskurverne. Hvis der er proportionale intensiteter, skal disse kurver være parallelle. Vi ser først på behandlingseffekten, som er den nemmeste, fordi der kun er to niveauer (azathioprin eller placebo). Vi benytter den automatiske tegning i SAS af de kumulerede rater ved at skrive det kryptiske PLOTS(OVERLAY=ROW CL)=CUMHAZ i PHREGkaldet. Desværre giver dette dog ikke de kumulerede rater på logskala, og der skal derfor her vurderes proportionalitet, og ikke parallellitet. Derfor gemmes også logaritmen af de kumulerede rater i det nye datasæt ud1 under navnet logcumrate, som vi så siden kan benytte til egne figurer. Totalt set skriver vi: proc phreg plots(overlay=row cl)=cumhaz data=pbc; model months*dead(0)=log2bili; strata azathiop; baseline out=ud1 loglogs=logcumrate; og får den automatiske figur 13

14 Det er svært ud fra denne at vurdere proportionalitet, men det ser ud som om kurverne er mere eller mindre ens i starten, for først at divergere omkring 60 måneder. Dette tyder ikke på god proportionalitet. I stedet tegner vi så de kumulerede rater på logaritmisk skala ved at benytte koden: proc sgplot data=ud1; series Y=logCumrate X=months / group=azathiop; hvorved vi får figuren 14

15 De to kurver ses at krydse over hinanden flere gange i det første 1 1 år. I perioden fra 1 1 til 5 år er der lidt variende lodret afstand 2 2 mellem kurverne, mens kurverne og bliver mere og mere forskellige efter 5 år. Ofte kan det være næsten umuligt at bedømme den lodrette afstand mellem kurverne i den først del af perioden, fordi raterne ofte er særligt høje i begyndelsen, så kurverne er meget stejle. I så fald er man nødt til også at tegne med eksempelvis en logaritmisk tidsakse. Det er ikke nødvendigt her, fordi kurverne krydser frem og tilbage over hinanden, og overkrydsningerne kan stadig ses, selvom kurverne er relativt stejle. (b) Grafisk modelkontrol af proportionale rater bilirubin For at checke antagelsen om proportionale intensiteter for bilirubin, er vi nødt til at foretage en inddeling i et par intervaller (vi kan jo ikke checke proportionalitet af kurver svarende til hver enkelt forekommende værdi af bilirubin). Vi vælger her at opdele i 3 intervaller, svarende til fraktilerne 33.33% og 66.67%, igen kun for de døde. Disse findes således: proc univariate data=pbc; where dead=1; var bilirubin; output out=regn pctlpre=p_ pctlpts=33.33, 66.67; proc print data=regn; Obs P_33_33 P_66_ Vi opdeler altså efter bilirubin-værdierne 37 og 92, og det kan gøres direkte i PHREG-kaldet, hvor vi med det samme tilføjer plottet af de kumulerede rater på logaritmisk skala, som forklaret ovenfor: 15

16 proc phreg plots(overlay=row cl)=cumhaz data=pbc; model months*dead(0)=azathiop; strata bilirubin(37,92); baseline out=ud2 loglogs=logcumrate; proc sgplot data=ud2; series Y=logCumrate X=months / group=bilirubin; Herved får vi to figurer 16

17 Bortset fra det første års tid synes proportionaliteten at være vældig god for bilirubin. De næste 3 punkter tager vi under et: (c) Numerisk test af proportionale rater for behandling (d) Numerisk test af proportionale rater for bilirubin (e) Check af linearitetsantagelsen for bilirubin (på den valgte skala) Vi kan udnytte automatiske tests i SAS ved at skrive en ekstra sætning, kaldet assess. Her betyder keyword PH, at der ønskes test for proportional hazards, mens VAR=(log2bili) skrives for at få en vurdering af lineariteten for log2bili. Den totale kode bliver proc phreg data=pbc; class azathiop(ref="0") / param=glm; model months*dead(0)=azathiop log2bili / rl; assess var=(log2bili) ph / resample seed=106165; Denne kode frembringer det ekstra output: 17

18 Supremum Test for Functional Form Maximum Absolute Pr > Variable Value Replications Seed MaxAbsVal log2bili Supremum Test for Proportionals Hazards Assumption Maximum Absolute Pr > Variable Value Replications Seed MaxAbsVal azathiop log2bili Her ses ingen tegn på problemer med hverken antagelsen om proportionale rater (P=0.29 hhv P=0.24 for azathiop hhv bilirubin), eller med linearitetsantagelsen for bilirubin på log-skala (P=0.82). Man får i tilgift figurer, som kan give fingerpeg om, hvordan afvigelserne fra antagelserne evt kunne se ud. Først for antagelsen om proportionale rater: 18

19 Den øverset figur, for behandlingseffekten, viser, at personer med høje værdier af azathiop1 (dvs. de behandlede) dør lidt for hurtigt til at starte med (det var jo også her, de kumulerede rater var nærmest ens). Det kan jo være, at behandlingseffekten først sætter ind efter et stykke tid... For bilirubin ser vi ligeledes, at dem med høj værdi af bilirubin dør for hurtigt til at starte med, hvilket kunne være en effekt af, at det drejer sig om en værdi målt ved baseline, og denne har formentlig større prognostisk værdi i starten (da den kan ændre sig hen ad vejen). Vi ser dernæst på figuren svarende til linearitetsantagelsen for log2bili: 19

20 Denne figur viser kun ukarakteristiske svingninger, svarende til en rigtig god linearitetsantagelse, som vi også fandt ud af i spørgsmål 3c, hvor vi modellerede effekten som en lineær spline. Ovenstående er en nem metode til at lave modelkontrol, men man kan supplere med mere specifikke tests, i form af tidsvarierende effekter. Man kan så vælge nogle passende tidspunkter, hvor proportionalitetsfaktoren kan få lov til at ændre sig. En god måde at vælge disse opdelingstidspunkter er at undersøge, om de kumulerede rater er nogenlunde lineære i nogle intervaller. Hvis de kumulerede rater er nogenlunde lineære, så er raterne nogenlunde konstante i de samme intervaller. Hvis raterne er konstante i begge grupper i et interval, er de selvfølgelig også proportionale i hele det interval. Hvis vi f.eks. ikke antager proportionale intensiteter for behandling i hele tidsrummet, men tillader proportionalitetskonstanten at variere mellem f.eks. 3 tidsintervaller (her valgt med tærskelværdier 12 og 56 måneder, baseret på figuren fra spørgsmål 6a), kan vi skrive: proc phreg data=pbc; model months*dead(0)=log2bili az1 az2 az3 / rl; 20

21 if months<=12 then az1=azathiop; else az1=0; if 12<months<=56 then az2=azathiop; else az2=0; if 56<months then az3=azathiop; else az3=0; NumCheckAza: test az1=az2=az3; og vi finder herved: Analysis of Maximum Likelihood Estimates Parameter Standard Parameter DF Estimate Error Chi-Square Pr > ChiSq log2bili <.0001 az az az Linear Hypotheses Testing Results Wald Label Chi-Square DF Pr > ChiSq NumCheckAza Her finder vi altså heller ikke nogen indikation af, at proportionalitetskonstanterne skulle afvige væsentligt fra hinanden. I stedet for at basere opdelingen på det visuelle indtryk af stykkevis linearitet for den kumulerede rate, kan man eksempelvis vælge at opdele tidsintervallerne, så der bliver ca. lige mange døde i hvert tidsinterval, fordi så er der ca. lige stor statistisk styrke i hvert interval. Dette prøver vi for effekten af bilirubin: proc univariate data=pbc; where dead=1; var months; output out=regn pctlpre=p_ pctlpts=33.33, 66.67; proc print data=regn; Obs P_33_33 P_66_

22 Benytter vi således 19 og 50 måneder som tærskelværdier, skriver vi: proc phreg data=pbc; model months*dead(0)=azathiop log2bili1 log2bili2 log2bili3 / rl; if months<=19 then log2bili1=log2bili; else log2bili1=0; if 19<months<=50 then log2bili2=log2bili; else log2bili2=0; if 50<months then log2bili3=log2bili; else log2bili3=0; NumCheckBili: test log2bili1=log2bili2=log2bili3; ods graphics off; hvorved vi finder The PHREG Procedure Analysis of Maximum Likelihood Estimates Parameter Standard Parameter DF Estimate Error Chi-Square Pr > ChiSq azathiop log2bili <.0001 log2bili <.0001 log2bili <.0001 Linear Hypotheses Testing Results Wald Label Chi-Square DF Pr > ChiSq NumCheckBili Det ser således ud til, at proportionalitetsantagelsen (=konstant effekt) for serum bilirubin holder rimeligt godt henover hele perioden. Reference: Christensen E, Neuberger J, Crowe J, Altman DG, Popper H, Portmann B, et al. Beneficial effect of azathioprine and prediction of prognosis in primary biliary cirrhosis. Final results of an international trial. Gastroenterology 1985;89(5):

Opgavebesvarelse vedr. overlevelsesanalyse

Opgavebesvarelse vedr. overlevelsesanalyse Opgavebesvarelse vedr. overlevelsesanalyse Opgaven går ud på at vurdere effekten af azathioprine på overlevelsen hos 216 patienter med primær biliær cirrhose (PBC), ref. Christensen et al. (1985). Data

Læs mere

Faculty of Health Sciences. Basal statistik. Overlevelsesanalyse. Lene Theil Skovgaard. 1. april 2019

Faculty of Health Sciences. Basal statistik. Overlevelsesanalyse. Lene Theil Skovgaard. 1. april 2019 Faculty of Health Sciences Basal statistik Overlevelsesanalyse Lene Theil Skovgaard 1. april 2019 1 / 92 Overlevelsesanalyse Levetider og censurerede observationer Kaplan-Meier kurver Log-rank test Cox

Læs mere

Basal statistik. Overlevelsesanalyse. Eksempel: Lungecancer blandt krigsveteraner. Faculty of Health Sciences

Basal statistik. Overlevelsesanalyse. Eksempel: Lungecancer blandt krigsveteraner. Faculty of Health Sciences Faculty of Health Sciences Overlevelsesanalyse Basal statistik Overlevelsesanalyse Lene Theil Skovgaard 5. november 2018 Levetider og censurerede observationer Kaplan-Meier kurver Log-rank test Cox regression

Læs mere

Løsning til opgave i logistisk regression

Løsning til opgave i logistisk regression Løsning til øvelser i logistisk regression, november 2008 1 Løsning til opgave i logistisk regression 1. Først indlæses data, og vi kan lige sørge for at danne en dummy-variable for cml, som indikator

Læs mere

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper.

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper. 1. Indlæs data. * HUSK at angive din egen placering af filen; data framing; infile '/home/sro00/mph2016/framing.txt' firstobs=2; input id sex age frw sbp sbp10 dbp chol cig chd yrschd death yrsdth cause;

Læs mere

Dag 6: Interaktion. Overlevelsesanalyse

Dag 6: Interaktion. Overlevelsesanalyse Dag 6: Interaktion. Overlevelsesanalyse How does CHD depend on gender and hypertension? Males: hypertension chd01 Females: Frequency Row Pct 0 1 Total ---------+--------+--------+ 0 352 95 447 78.75 21.25

Læs mere

Faculty of Health Sciences. Basal Statistik. Overlevelsesanalyse. Lene Theil Skovgaard. 12. marts 2018

Faculty of Health Sciences. Basal Statistik. Overlevelsesanalyse. Lene Theil Skovgaard. 12. marts 2018 Faculty of Health Sciences Basal Statistik Overlevelsesanalyse Lene Theil Skovgaard 12. marts 2018 1 / 12 APPENDIX vedr. SPSS svarende til diverse slides: Kaplan-Meier kurver, s. 3 Kumulerede incidenser

Læs mere

Kursus i varians- og regressionsanalyse Data med detektionsgrænse. Birthe Lykke Thomsen H. Lundbeck A/S

Kursus i varians- og regressionsanalyse Data med detektionsgrænse. Birthe Lykke Thomsen H. Lundbeck A/S Kursus i varians- og regressionsanalyse Data med detektionsgrænse Birthe Lykke Thomsen H. Lundbeck A/S 1 Data med detektionsgrænse Venstrecensurering: Baggrundsstøj eller begrænsning i måleudstyrets følsomhed

Læs mere

Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004

Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004 Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004 Formål med Øvelsen: Formålet med øvelsen er at analysere om risikoen for død er forbundet med to forskellige vacciner BCG (mod

Læs mere

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger Øvelser til basalkursus, 5. uge Opgavebesvarelse: Knogledensitet hos unge piger I alt 112 piger har fået målt knogledensitet (bone mineral density, bmd) i 11-års alderen (baseline værdi). Pigerne er herefter

Læs mere

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger Øvelser til basalkursus, 5. uge Opgavebesvarelse: Knogledensitet hos unge piger I alt 112 piger har fået målt knogledensitet (bone mineral density, bmd) i 11-års alderen (baseline værdi). Pigerne er herefter

Læs mere

Introduktion til overlevelsesanalyse

Introduktion til overlevelsesanalyse Faculty of Health Sciences Introduktion til overlevelsesanalyse Cox regression III Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Kursushjemmeside:

Læs mere

Overlevelsesanalyse. Faculty of Health Sciences

Overlevelsesanalyse. Faculty of Health Sciences Faculty of Health Sciences Overlevelsesanalyse Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Program Overlevelsesdata Kaplan-Meier estimatoren

Læs mere

Overlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere.

Overlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere. Overlevelse efter AMI Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Diabetes VF (Venticular fibrillation) WMI (Wall motion index) CHF (Cardiac Heart Failure) Køn og alder betragtes

Læs mere

Morten Frydenberg Biostatistik version dato:

Morten Frydenberg Biostatistik version dato: Caerphilly studiet Design og Data Biostatistik uge 14 mandag Morten Frydenberg, Afdeling for Biostatistik Poisson regression En primær tidsakse og ikke stykkevise konstante rater Cox proportional hazard

Læs mere

Man indlæser en såkaldt frequency-table i SAS ved følgende kommandoer:

Man indlæser en såkaldt frequency-table i SAS ved følgende kommandoer: 1 IHD-Lexis 1.1 Spørgsmål 1 Man indlæser en såkaldt frequency-table i SAS ved følgende kommandoer: data ihdfreq; input eksp alder pyrs cases; lpyrs=log(pyrs); cards; 0 2 346.87 2 0 1 979.34 12 0 0 699.14

Læs mere

Overlevelsesfunktion. Vi kalder S(t) for overlevelsesfunktionen.

Overlevelsesfunktion. Vi kalder S(t) for overlevelsesfunktionen. 1 Levetidsanalyse Overlevelsesfunktionen Censurering Kaplan-Meier estimatoren Hazard funktionen Proportionale hazards Multipel regression PSE (I17) FSV1 Statistik - 5. lektion 1 / 19 Overlevelsesfunktionen

Læs mere

Vejledende besvarelse af hjemmeopgave, efterår 2016

Vejledende besvarelse af hjemmeopgave, efterår 2016 Vejledende besvarelse af hjemmeopgave, efterår 2016 Udleveret 4. oktober, afleveres senest ved øvelserne i uge 44 (1.-4. november) Normal aktivitet af enzymet plasma kolinesterase er en forudsætning for

Læs mere

Vi vil analysere effekten af rygning og alkohol på chancen for at blive gravid ved at benytte forskellige Cox regressions modeller.

Vi vil analysere effekten af rygning og alkohol på chancen for at blive gravid ved at benytte forskellige Cox regressions modeller. Løsning til øvelse i TTP dag 3 Denne øvelse omhandler tid til graviditet. Et studie vedrørende tid til graviditet (Time To Pregnancy = TTP) inkluderede 423 par i alderen 20-35 år. Parrene blev fulgt i

Læs mere

Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge

Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge Opgave 1. Data indlæses i 3 kolonner, som f.eks. kaldessalt,pre ogpost. Der er således i alt tale om 26 observationer, idet de to grupper lægges

Læs mere

Løsning til øvelsesopgaver dag 4 spg 5-9

Løsning til øvelsesopgaver dag 4 spg 5-9 Løsning til øvelsesopgaver dag 4 spg 5-9 5: Den multiple model Vi tilføjer nu yderligere to variable til vores model : Køn og kolesterol SBP = a + b*age + c*chol + d*mand hvor mand er 1 for mænd, 0 for

Læs mere

Vi ønsker at konstruere normalområder for stofskiftet, som funktion af kropsvægten.

Vi ønsker at konstruere normalområder for stofskiftet, som funktion af kropsvægten. Opgavebesvarelse, Resting metabolic rate I filen T:\rmr.txt findes sammenhørende værdier af kropsvægt (bw, i kg) og hvilende stofskifte (rmr, kcal pr. døgn) for 44 kvinder (Altman, 1991 og Owen et.al.,

Læs mere

Besvarelse af vitcap -opgaven

Besvarelse af vitcap -opgaven Besvarelse af -opgaven Spørgsmål 1 Indlæs data Dette gøres fra Analyst med File/Open, som sædvanlig. Spørgsmål 2 Beskriv fordelingen af vital capacity og i de 3 grupper ved hjælp af summary statistics.

Læs mere

Vejledende besvarelse af hjemmeopgave i Basal Statistik, forår 2014

Vejledende besvarelse af hjemmeopgave i Basal Statistik, forår 2014 Vejledende besvarelse af hjemmeopgave i Basal Statistik, forår 2014 Garvey et al. interesserer sig for sammenhængen mellem anæstesi og allergiske reaktioner (se f.eks. nedenstående reference, der dog ikke

Læs mere

Faculty of Health Sciences. Basal Statistik. Logistisk regression mm. Lene Theil Skovgaard. 5. marts 2018

Faculty of Health Sciences. Basal Statistik. Logistisk regression mm. Lene Theil Skovgaard. 5. marts 2018 Faculty of Health Sciences Basal Statistik Logistisk regression mm. Lene Theil Skovgaard 5. marts 2018 1 / 22 APPENDIX vedr. SPSS svarende til diverse slides: To-gange-to tabeller, s. 3 Plot af binære

Læs mere

Basal statistik for lægevidenskabelige forskere, forår 2012 Udleveret 6.marts, afleveres senest ved øvelserne i uge 15 (

Basal statistik for lægevidenskabelige forskere, forår 2012 Udleveret 6.marts, afleveres senest ved øvelserne i uge 15 ( Hjemmeopgave Basal statistik for lægevidenskabelige forskere, forår 2012 Udleveret 6.marts, afleveres senest ved øvelserne i uge 15 (10.-12. april) I et randomiseret forsøg sammenlignes vitamin D behandling

Læs mere

Logistisk regression. Basal Statistik for medicinske PhD-studerende November 2008

Logistisk regression. Basal Statistik for medicinske PhD-studerende November 2008 Logistisk regression Basal Statistik for medicinske PhD-studerende November 2008 Bendix Carstensen Steno Diabetes Center, Gentofte & Biostatististisk afdeling, Københavns Universitet bxc@steno.dk www.biostat.ku.dk/~bxc

Læs mere

Lineær og logistisk regression

Lineær og logistisk regression Faculty of Health Sciences Lineær og logistisk regression Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Dagens program Lineær regression

Læs mere

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Afdeling for Biostatistik Bo Martin Bibby 23. november 2006 Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Vi betragter 4699 personer fra Framingham-studiet. Der er oplysninger om follow-up

Læs mere

Opgavebesvarelse, logistisk regression

Opgavebesvarelse, logistisk regression Opgavebesvarelse, logistisk regression Data ligger i rop.xls på kursushjemmesiden: http://staff.pubhealth.ku.dk/ jufo/courses/logistic/ Når du har gemt data på din computer, kan det indlæses i SAS med

Læs mere

MPH specialmodul i epidemiologi og biostatistik. SAS. Introduktion til SAS. Eksempel: Blodtryk og fedme

MPH specialmodul i epidemiologi og biostatistik. SAS. Introduktion til SAS. Eksempel: Blodtryk og fedme MPH specialmodul i epidemiologi og biostatistik. SAS Introduktion til SAS. Display manager (programmering) Vinduer: program editor (med syntaks-check) log output reproducerbart (program teksten kan gemmes

Læs mere

Logistisk Regression - fortsat

Logistisk Regression - fortsat Logistisk Regression - fortsat Likelihood Ratio test Generel hypotese test Modelanalyse Indtil nu har vi set på to slags modeller: 1) Generelle Lineære Modeller Kvantitav afhængig variabel. Kvantitative

Læs mere

Opgavebesvarelse, brain weight

Opgavebesvarelse, brain weight Opgavebesvarelse, brain weight (Matthews & Farewell: Using and Understanding Medical Statistics, 2nd. ed.) For 20 nyfødte mus er der i tabellen nedenfor anført oplysning om kuldstørrelsen (fra 3 til 12

Læs mere

Postoperative komplikationer

Postoperative komplikationer Løsninger til øvelser i kategoriske data, oktober 2008 1 Postoperative komplikationer Udgangspunktet for vurdering af den ny metode må være en nulhypotese om at der er samme komplikationshyppighed, 20%.

Læs mere

Reeksamen i Statistik for Biokemikere 6. april 2009

Reeksamen i Statistik for Biokemikere 6. april 2009 Københavns Universitet Det Naturvidenskabelige Fakultet Reeksamen i Statistik for Biokemikere 6. april 2009 Alle hjælpemidler er tilladt, og besvarelsen må gerne skrives med blyant. Opgavesættet er på

Læs mere

Opgavebesvarelse, korrelerede målinger

Opgavebesvarelse, korrelerede målinger Opgavebesvarelse, korrelerede målinger I 18 familier bestående af far, mor og 3 børn (i veldefinerede aldersintervaller, med child1 som det ældste barn og child3 som det yngste) har man registreret antallet

Læs mere

Kommentarer til øvelser i basalkursus, 2. uge

Kommentarer til øvelser i basalkursus, 2. uge Kommentarer til øvelser i basalkursus, 2. uge Opgave 2. Vi betragter målinger af hjertevægt (i g) og total kropsvægt (målt i kg) for 10 normale mænd og 11 mænd med hjertesvigt. Målingerne er taget ved

Læs mere

Reeksamen i Statistik for biokemikere. Blok

Reeksamen i Statistik for biokemikere. Blok Københavns Universitet Det Naturvidenskabelige Fakultet Reeksamen i Statistik for biokemikere. Blok 2 2007-2008. 3 timers skriftlig prøve. Alle hjælpemidler - også blyant - er tilladt. Opgavesættet er

Læs mere

Vejledende besvarelse af hjemmeopgave, forår 2017

Vejledende besvarelse af hjemmeopgave, forår 2017 Vejledende besvarelse af hjemmeopgave, forår 2017 På hjemmesiden http://publicifsv.sund.ku.dk/~lts/basal17_1/hjemmeopgave/hjemmeopgave.txt ligger data fra 400 fødende kvinder. Der er tale om et uddrag

Læs mere

6. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag)

6. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag) Institut for Epidemiologi og Socialmedicin Institut for Biostatistik. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag) Opgave 1 Læs afsnit.1 i An Introduction to Medical Statistics, specielt

Læs mere

Hjemmeopgave, efterår 2009

Hjemmeopgave, efterår 2009 Hjemmeopgave, efterår 2009 Basal statistik for sundhedsvidenskabelige forskere Udleveret 29. september, afleveres senest ved øvelserne i uge 44 (27.-29. oktober) I alt 112 piger har fået målt bone mineral

Læs mere

Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013

Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013 Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013 I forbindelse med reagensglasbehandling blev 100 par randomiseret til to forskellige former for hormonstimulation.

Læs mere

Faculty of Health Sciences. Logistisk regression: Kvantitative forklarende variable

Faculty of Health Sciences. Logistisk regression: Kvantitative forklarende variable Faculty of Health Sciences Logistisk regression: Kvantitative forklarende variable Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Sammenhæng

Læs mere

β = SDD xt SSD t σ 2 s 2 02 = SSD 02 f 02 i=1

β = SDD xt SSD t σ 2 s 2 02 = SSD 02 f 02 i=1 Lineær regression Lad x 1,..., x n være udfald af stokastiske variable X 1,..., X n og betragt modellen M 2 : X i N(α + βt i, σ 2 ) hvor t i, i = 1,..., n, er kendte tal. Konkret analyseres (en del af)

Læs mere

Vejledende besvarelse af hjemmeopgave, efterår 2018

Vejledende besvarelse af hjemmeopgave, efterår 2018 Vejledende besvarelse af hjemmeopgave, efterår 2018 Udleveret 1. oktober, afleveres senest ved øvelserne i uge 44 (30. oktober.-1. november). Der er foretaget en del undersøgelser af krigsveteraner og

Læs mere

Opgavebesvarelse, brain weight

Opgavebesvarelse, brain weight Opgavebesvarelse, brain weight (Matthews & Farewell: Using and Understanding Medical Statistics, 2nd. ed.) Spørgsmål 1 Data er indlagt på T:/Basalstatistik/brain.txt og kan indlæses direkte i Analyst med

Læs mere

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Multipel regression M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Y j 1 X 1j 2 X 2j... m X mj j eller m Y j 0 i 1 i X ij j BEMÆRK! j svarer til individ

Læs mere

Eksamen i Statistik for Biokemikere, Blok januar 2009

Eksamen i Statistik for Biokemikere, Blok januar 2009 Københavns Universitet Det Naturvidenskabelige Fakultet Eksamen i Statistik for Biokemikere, Blok 2 2008 09 19. januar 2009 Alle hjælpemidler er tilladt, og besvarelsen må gerne skrives med blyant. Opgavesættet

Læs mere

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl Reeksamen 2018 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 13-08-2018 Tid: kl. 09.00-11.00 Bedømmelsesform

Læs mere

Statistiske Modeller 1: Kontingenstabeller i SAS

Statistiske Modeller 1: Kontingenstabeller i SAS Statistiske Modeller 1: Kontingenstabeller i SAS Jens Ledet Jensen October 31, 2005 1 Indledning Som vist i Notat 1 afsnit 13 er 2 log Q for et test i en multinomialmodel ækvivalent med et test i en poissonmodel.

Læs mere

6. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag)

6. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag) Institut for Folkesundhed Afdeling for Biostatistik Afdeling for Epidemiologi. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag) Opgave 1 Udgangspunktet for de følgende spørgsmål er artiklen:

Læs mere

Faculty of Health Sciences. Basal Statistik. Begreber. Parrede sammenligninger. Lene Theil Skovgaard. 6. september 2016

Faculty of Health Sciences. Basal Statistik. Begreber. Parrede sammenligninger. Lene Theil Skovgaard. 6. september 2016 Faculty of Health Sciences Basal Statistik Begreber. Parrede sammenligninger. Lene Theil Skovgaard 6. september 2016 1 / 88 APPENDIX Programbidder svarende til diverse slides: Indlæsning af vitamin D datasæt,

Læs mere

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j Hypoteser om mere end to stikprøver ANOVA k stikprøver: (ikke ordinale eller højere) H 0 : 1 2... k gælder også for k 2! H 0ij : i j H 0ij : i j simpelt forslag: k k 1 2 t-tests: i j DUER IKKE! Bonferroni!!

Læs mere

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Lineær regression. Simpel regression. Model. ofte bruges følgende notation: Lineær regression Simpel regression Model Y i X i i ofte bruges følgende notation: Y i 0 1 X 1i i n i 1 i 0 Findes der en linie, der passer bedst? Metode - Generel! least squares (mindste kvadrater) til

Læs mere

Variansanalyse i SAS. Institut for Matematiske Fag December 2007

Variansanalyse i SAS. Institut for Matematiske Fag December 2007 Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Institut for Matematiske Fag December 2007 Variansanalyse i SAS 2 Tosidet variansanalyse Residualplot Tosidet variansanalyse

Læs mere

CLASS temp medie; MODEL rate=temp medie/solution; RUN;

CLASS temp medie; MODEL rate=temp medie/solution; RUN; Ugeopgave 2.1 Bakterieprøver fra patienter transporteres ofte til laboratoriet ved stuetemperatur samt mere eller mindre udsat for luftens ilt. Dette er især uheldigt for prøver som indeholder anaerobe

Læs mere

Multipel Lineær Regression

Multipel Lineær Regression Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer

Læs mere

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved Matematisk Modellering 1 (reeksamen) Side 1 Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved { 1 hvis x {1, 2, 3}, p X (x) = 3 0 ellers,

Læs mere

Vejledende besvarelse af hjemmeopgave, forår 2016

Vejledende besvarelse af hjemmeopgave, forår 2016 Vejledende besvarelse af hjemmeopgave, forår 2016 Udleveret 1. marts, afleveres senest ved øvelserne i uge 13 (29. marts-1. april) Denne opgave fokuserer på at beskrive niveauet af hormonet AMH (højt niveau

Læs mere

Phd-kursus i Basal Statistik, Opgaver til 1. uge

Phd-kursus i Basal Statistik, Opgaver til 1. uge Phd-kursus i Basal Statistik, Opgaver til 1. uge Opgave 1: Wright For 17 patienter er der målt peak expiratory flow rate (maksimal udåndingshastighed, i l/min) på to forskellige måder, dels ved at anvende

Læs mere

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven. PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve

Læs mere

Basal statistik. Logaritmer og kovariansanalyse. Nyt eksempel vedr. sammenligning af målemetoder. Scatter plot af de to metoder

Basal statistik. Logaritmer og kovariansanalyse. Nyt eksempel vedr. sammenligning af målemetoder. Scatter plot af de to metoder Faculty of Health Sciences Logaritmer og kovariansanalyse Basal statistik Logaritmer. Kovariansanalyse Lene Theil Skovgaard 29. september 2015 Parret sammenligning, målemetoder med logaritmer Tosidet variansanalyse

Læs mere

Faculty of Health Sciences. Basal statistik. Logaritmer. Kovariansanalyse. Lene Theil Skovgaard. 29. september 2015

Faculty of Health Sciences. Basal statistik. Logaritmer. Kovariansanalyse. Lene Theil Skovgaard. 29. september 2015 Faculty of Health Sciences Basal statistik Logaritmer. Kovariansanalyse Lene Theil Skovgaard 29. september 2015 1 / 84 Logaritmer og kovariansanalyse Parret sammenligning, målemetoder med logaritmer Tosidet

Læs mere

Phd-kursus i Basal Statistik, Opgaver til 2. uge

Phd-kursus i Basal Statistik, Opgaver til 2. uge Phd-kursus i Basal Statistik, Opgaver til 2. uge Opgave 1: Sædkvalitet Filen oeko.txt på hjemmesiden indeholder datamateriale til belysning af forskellen i sædkvalitet mellem SAS-ansatte og mænd, der lever

Læs mere

Eksamen i Statistik for biokemikere. Blok

Eksamen i Statistik for biokemikere. Blok Københavns Universitet Det Naturvidenskabelige Fakultet Eksamen i Statistik for biokemikere. Blok 2 2007. 3 timers skriftlig prøve. Alle hjælpemidler - også blyant - er tilladt. Opgavesættet er på 8 sider.

Læs mere

Opgavebesvarelse, Basalkursus, uge 3

Opgavebesvarelse, Basalkursus, uge 3 Opgavebesvarelse, Basalkursus, uge 3 Opgave 1: Udskrivning af astma patienter (DGA s. 273) I en randomiseret undersøgelse foretaget af Storr et. al. (Lancet, i, 1987) sammenlignes effekten af en enkelt

Læs mere

Vejledende besvarelse af hjemmeopgave

Vejledende besvarelse af hjemmeopgave Vejledende besvarelse af hjemmeopgave Basal statistik, efterår 2013 Udleveret 1. oktober, afleveres senest ved øvelserne i uge 44 (29. oktober-1. november) I forbindelse med en undersøgelse af vitamin

Læs mere

OR stiger eksponentielt med forskellen i BMI. kompliceret model svær at forstå og analysere

OR stiger eksponentielt med forskellen i BMI. kompliceret model svær at forstå og analysere Epidemiologi og biostatistik. Uge 5, torsdag 5. september 003 Morten Frydenberg, Institut for Biostatistik. 1 Analyse af overlevelsesdata (ventetidsdata) Censurering (højre + andet) Kaplan-Meyer kurver

Læs mere

Vejledende besvarelse af hjemmeopgave, efterår 2017

Vejledende besvarelse af hjemmeopgave, efterår 2017 Vejledende besvarelse af hjemmeopgave, efterår 2017 Udleveret 3. oktober 2017, afleveres senest ved øvelserne i uge 44 (31. okt.-2. nov. 2017) På hjemmesiden http://publicifsv.sund.ku.dk/~lts/basal17_2/hjemmeopgave/hjemmeopgave.txt

Læs mere

Basal Statistik - SPSS

Basal Statistik - SPSS Faculty of Health Sciences Basal Statistik - SPSS Regressionsanalyse. Lene Theil Skovgaard 5. februar 2018 1 / 12 APPENDIX med instruktioner til SPSS-analyse svarende til nogle af slides Indlæsning og

Læs mere

Vejledende besvarelse af hjemmeopgave, forår 2015

Vejledende besvarelse af hjemmeopgave, forår 2015 Vejledende besvarelse af hjemmeopgave, forår 2015 En stikprøve bestående af 65 mænd og 65 kvinder er blevet undersøgt med henblik på at se på en evt. sammenhæng mellem kropstemperatur og puls. På hjemmesiden

Læs mere

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17 nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse

Læs mere

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1 Københavns Universitet Afdeling for Anvendt Matematik og Statistik Statistik for biokemikere Inge Henningsen Michael Sørensen Oktober 2003 Opgaver til ZAR II Opgave 1 Et datasæt består af 20 observationer.

Læs mere

Basal Statistik - SPSS

Basal Statistik - SPSS Faculty of Health Sciences APPENDIX med instruktioner til SPSS-analyse svarende til nogle af slides Basal Statistik - SPSS Den generelle lineære model. Lene Theil Skovgaard 24. oktober 2017 Biokemisk iltforbrug,

Læs mere

Basal Statistik - SPSS

Basal Statistik - SPSS Faculty of Health Sciences Basal Statistik - SPSS Den generelle lineære model. Lene Theil Skovgaard 26. februar 2018 1 / 28 APPENDIX med instruktioner til SPSS-analyse svarende til nogle af slides Biokemisk

Læs mere

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression Multipel Linear Regression Repetition Partiel F-test Modelsøgning Logistisk Regression Test for en eller alle parametre I jagten på en god statistisk model har vi set på følgende to hypoteser og tilhørende

Læs mere

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering Eksamen 2016 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 17-02-2015 Tid: kl. 09.00-11.00 Bedømmelsesform

Læs mere

Opgavebesvarelse, Basalkursus, uge 3

Opgavebesvarelse, Basalkursus, uge 3 Opgavebesvarelse, Basalkursus, uge 3 Opgave 1: Udskrivning af astma patienter (DGA s. 273) I en randomiseret undersøgelse foretaget af Storr et. al. (Lancet, i, 1987) sammenlignes effekten af en enkelt

Læs mere

En Introduktion til SAS. Kapitel 5.

En Introduktion til SAS. Kapitel 5. En Introduktion til SAS. Kapitel 5. Inge Henningsen Afdeling for Statistik og Operationsanalyse Københavns Universitet Marts 2005 6. udgave Kapitel 5 T-test og PROC UNIVARIATE 5.1 Indledning Dette kapitel

Læs mere

Vejledende besvarelse af hjemmeopgave, forår 2018

Vejledende besvarelse af hjemmeopgave, forår 2018 Vejledende besvarelse af hjemmeopgave, forår 2018 Udleveret 12. februar, afleveres senest ved øvelserne i uge 10 (6.-9.marts) I forbindelse med reagensglasbehandling blev 100 par randomiseret til to forskellige

Læs mere

OR stiger eksponentielt med forskellen i BMI komplicet model svær at forstå og analysere simpel model

OR stiger eksponentielt med forskellen i BMI komplicet model svær at forstå og analysere simpel model Epidemiologi og biostatistik. Uge 5, torsdag. marts 1 Morten Frydenberg, Institut for Biostatistik. 1 Analyse af overlevelsesdata (ventetidsdata) Censurering (højre + andet) Kaplan-Meyer kurver Det statistiske

Læs mere

Basal Statistik - SPSS

Basal Statistik - SPSS Faculty of Health Sciences Basal Statistik - SPSS Multipel regression. Lene Theil Skovgaard 10. oktober 2017 1 / 12 APPENDIX med instruktioner til SPSS-analyse svarende til nogle af slides Figurer: s.

Læs mere

2 Epidemiologi og biostatistik. Uge 5, mandag 26. september 2005 Michael Væth, Institut for Biostatistik

2 Epidemiologi og biostatistik. Uge 5, mandag 26. september 2005 Michael Væth, Institut for Biostatistik ... september 1 Epidemiologi og biostatistik. Uge, mandag. september Michael Væth, Institut for Biostatistik. Ikke parametrisk statistiske test : Analyse af overlevelsesdata (ventetidsdata) Censurering

Læs mere

Statistik Lektion 17 Multipel Lineær Regression

Statistik Lektion 17 Multipel Lineær Regression Statistik Lektion 7 Multipel Lineær Regression Polynomiel regression Ikke-lineære modeller og transformation Multi-kolinearitet Auto-korrelation og Durbin-Watson test Multipel lineær regression x,x,,x

Læs mere

Basal statistik. 30. januar 2007

Basal statistik. 30. januar 2007 Basal statistik 30. januar 2007 Deskriptiv statistik Typer af data Tabeller Grafik Summary statistics Lene Theil Skovgaard, Biostatistisk Afdeling Institut for Folkesundhedsvidenskab, Københavns Universitet

Læs mere

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter Program Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Øvelse: effekt af diæter. Repetition fra sidst... Parrede og ikke-parrede

Læs mere

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer.

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer. Vejledende besvarelse af hjemmeopgave Basal statistik, efterår 2008 En gruppe bestående af 45 patienter med reumatoid arthrit randomiseres til en af 6 mulige behandlinger, nemlig placebo, aspirin eller

Læs mere

Introduktion til overlevelsesanalyse

Introduktion til overlevelsesanalyse Faculty of Health Sciences Introduktion til overlevelsesanalyse Cox regression Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Kursushjemmeside:

Læs mere

Faculty of Health Sciences. Basal statistik. Lille SAS Manual. Lene Theil Skovgaard. 31. januar 2017

Faculty of Health Sciences. Basal statistik. Lille SAS Manual. Lene Theil Skovgaard. 31. januar 2017 Faculty of Health Sciences Basal statistik Lille SAS Manual Lene Theil Skovgaard 31. januar 2017 1 / 42 Selve sproget Siderne 9-18 Indlæsning (9-12) Definition af nye variable (13) Missing values / Manglende

Læs mere

Basal statistik. Selve sproget. Grafik. Basale procedurer. Faculty of Health Sciences. Lille SAS Manual

Basal statistik. Selve sproget. Grafik. Basale procedurer. Faculty of Health Sciences. Lille SAS Manual Faculty of Health Sciences Selve sproget Basal statistik Lille SAS Manual Lene Theil Skovgaard 5. september 2017 Siderne 9-18 Indlæsning (9-12) Definition af nye variable (13) Missing values / Manglende

Læs mere

Uge 13 referat hold 4

Uge 13 referat hold 4 Uge 13 referat hold 4 Gruppearbejde 1a: Er variablen kvotient inkluderet på en hensigtsmæssig måde? Der er to problemer med kvotient: 1) Den er trunkeret ved 6.9 og 10.0, løsningen er at indføre dummyer

Læs mere

Opgavebesvarelse, Basalkursus, uge 2

Opgavebesvarelse, Basalkursus, uge 2 Opgavebesvarelse, Basalkursus, uge 2 Opgave 1. Filen "space.txt" fra hjemmesiden ser således ud: salt pre post 1 71 61 1 65 59 1 52 47 1 68 65......... 0 52 77 0 54 80 0 52 79 Data indlæses i 3 kolonner,

Læs mere

Filen indeholder 45 linier, først en linie med variabelnavnene (bw og rmr) og derefter 44 datalinier, hver med disse to oplysninger.

Filen indeholder 45 linier, først en linie med variabelnavnene (bw og rmr) og derefter 44 datalinier, hver med disse to oplysninger. Opgavebesvarelse, Resting metabolic rate I filen rmr.txt findes sammenhørende værdier af kropsvægt (bw, i kg) og hvilende stofskifte (rmr, kcal pr. døgn) for 44 kvinder (Altman, 1991 og Owen et.al., Am.

Læs mere

Besvarelse af opgave om Vital Capacity

Besvarelse af opgave om Vital Capacity Besvarelse af opgave om Vital Capacity I filen cadmium.txt ligger observationer fra et eksempel omhandlende lungefunktionen hos arbejdere i cadmium industrien (hentet fra P. Armitage & G. Berry: Statistical

Læs mere

Lineær regression i SAS. Lineær regression i SAS p.1/20

Lineær regression i SAS. Lineær regression i SAS p.1/20 Lineær regression i SAS Lineær regression i SAS p.1/20 Lineær regression i SAS Simpel lineær regression Grafisk modelkontrol Multipel lineær regression SAS-procedurer: PROC REG PROC GPLOT Lineær regression

Læs mere

Træningsaktiviteter dag 3

Træningsaktiviteter dag 3 Træningsaktiviteter dag 3 I træningsaktiviteterne skal I arbejde videre med Framingham data og risikoen for hjertesygdom. I skal dels lave MH-analyser som vi gjorde i timerne og dels lave en multipel logistisk

Læs mere

Besvarelse af juul2 -opgaven

Besvarelse af juul2 -opgaven Besvarelse af juul2 -opgaven Spørgsmål 1 Indlæs data Dette gøres fra Analyst med File/Open, som sædvanlig. Spørgsmål 2 Lav regressionsanalyser for hvert køn af igf1 vs. alder for præpubertale (Tanner stadium

Læs mere

Basal statistik. 16. september 2008

Basal statistik. 16. september 2008 Basal statistik 16. september 2008 En- og to-stikprøve problemer sammenligning af to situationer: parret t-test Wilcoxon signed rank test logaritmetransformation sammenligning af to grupper uparret t-test

Læs mere

1 Hb SS Hb Sβ Hb SC = , (s = )

1 Hb SS Hb Sβ Hb SC = , (s = ) PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.

Læs mere

Opgavebesvarelse, Basalkursus, uge 3

Opgavebesvarelse, Basalkursus, uge 3 Opgavebesvarelse, Basalkursus, uge 3 Opgave 1: Udskrivning af astma patienter (DGA s. 273) I en randomiseret undersøgelse foretaget af Storr et. al. (Lancet, i, 1987) sammenlignes effekten af en enkelt

Læs mere