Opgavebesvarelse vedr. overlevelsesanalyse

Størrelse: px
Starte visningen fra side:

Download "Opgavebesvarelse vedr. overlevelsesanalyse"

Transkript

1 Opgavebesvarelse vedr. overlevelsesanalyse Opgaven går ud på at vurdere effekten af azathioprine på overlevelsen hos 216 patienter med primær biliær cirrhose (PBC), ref. Christensen et al. (1985). Data stammer fra en clinical trial, hvor de 216 patienter er randomiseret til behandling med azathioprine eller placebo, hvorefter de følges over tid indtil død eller censurering. Filen pbc.txt indeholder følgende variable: dead: Indikator for død (0: Censurering, 1: død) months: Antal måneder fra randomisering til udgang (død eller censurering) azathiop: Behandling (0: Placebo, 1: Azathioprine) bilirubin: Serum bilirubin måling ved baseline Data indlæses direkte fra hjemmesiden og vi tager et hurtigt kig pde første seks linier: wr <- read.table( " header=t) head(wr) dead months azathiop bilirubin Vi kan vælge at lave azathiop til en faktor med labels ja for de som har fået azathiop, nej for de som har fået placebo: wr$azathiop <- factor( wr$azathiop, labels = c('nej','ja')) Vi vil benytte fire pakker som installeres med: install.packages('survival') install.packages('prodlim') install.packages('timereg') install.packages('car') og derefter skal indholdet af disse pakker gøres tilgængeligt med

2 library('survival') library('prodlim') library('timereg') library('car') Nogle af de funktioner vi benytter nedenfor er beskrevet i denne tutorial om overlevelsesanalyse i R. 1 Da der er tale om et randomiseret studie, vurderes behandlingseffekten først uden inddragelse af diverse kovariater. a) Effekten af azathioprine ud fra Kaplan-Meier kurver Kaplan-Meier kurver er nonparametriske estimater for overlevelseskurverne (nonparametrisk = ingen antagelser om fordelingen af dødstidspunkterne). Et plot med skravering af konfidensintervallerne kan man få ved brug af funktionen prodlim() fra prodlim-pakken: km1 <- prodlim( Hist(months,dead) ~ azathiop, data=wr ) plot(km1, legend.cex=.75, legend.inset=.01) De er her tegnet med punktvise konfidensgrænser, fordi det oftest er nødvendigt at have konfidensgrænserne med for at kunne vurdere, om der er klar forskel på grupperne.

3 Vi ser, at der er adskillige overkrydsninger mellem de to overlevelseskurver og ingen iøjnefaldende forskelle undtagen, at de måske divergerer lidt mod slut. Tag eventuelt et kig pden tutorial jeg linker til ovenfor for at se, hvordan man kan tilpasse plottet yderligere med farver, titel, legend mm. b) Et passende test Vi skal se på tid til død, under hensyntagen til, at der forekommer censureringer (dead=0), og vi skal sammenligne to grupper. Det relevante test er et log-rank test. Vi finder nedenstående, der ikke viser nogen signifikant forskel på de to grupper (P=0.494). Call: survdiff(formula = Surv(months, dead) ~ azathiop, data = wr) N Observed Expected (O-E)^2/E (O-E)^2/V azathiop=nej azathiop=ja Chisq= 0.5 on 1 degrees of freedom, p= c) et estimat for hazard ratioen for azathiop-behandlede vs. placebobehandlede med konfidensinterval cox1 <- coxph( Surv(months,dead) ~ azathiop, data=wr) summary(cox1) Call: coxph(formula = Surv(months, dead) ~ azathiop, data = wr) n= 216, number of events= 103 coef exp(coef) se(coef) z Pr(> z ) azathiopja exp(coef) exp(-coef) lower.95 upper.95 azathiopja Concordance= (se = ) Rsquare= (max possible= ) Likelihood ratio test= 0.47 on 1 df, p= Wald test = 0.47 on 1 df, p= Score (logrank) test = 0.47 on 1 df, p= Idet R automatisk vælger det laveste niveau af den forklarende variabel som reference (her azathiop=0 (=nej)), fik vi hazard ratio for de azathioprine-behandlede vs de placebobehandlede direkte skrevet ud i outputtet ovenfor som (under exp(coef)). Konfidensgrænser finder vi til (0.592, 1.288).

4 Bemærk at vi i vores summary ovenfor også får HR for de placebo-behandlede vs de azathiopbehandlede (under exp(-coef)). Vi kan dog også ændre referencegruppen til ja i selve analysen: cox2 <- coxph( Surv(months,dead) ~ relevel( azathiop, 'ja'), data=wr) summary(cox2) Call: coxph(formula = Surv(months, dead) ~ relevel(azathiop, "ja"), data = wr) n= 216, number of events= 103 coef exp(coef) se(coef) z Pr(> z ) relevel(azathiop, "ja")nej exp(coef) exp(-coef) lower.95 upper.95 relevel(azathiop, "ja")nej Concordance= (se = ) Rsquare= (max possible= ) Likelihood ratio test= 0.47 on 1 df, p= Wald test = 0.47 on 1 df, p= Score (logrank) test = 0.47 on 1 df, p= Vi ser, at konfidensgrænserne bliver (0.776, 1.690). I begge tilfælde er der tale om konfidensgrænser, der indeholder 1, svarende til, at der ikke er signifikant forskel på dødeligheden i de to grupper. 2 Serum bilirubin niveauet er generelt en meget stærk prognostisk faktor for patienter med leversygdom. Det er derfor relevant at undersøge betydningen af baseline serum bilirubin for prognosen hos patienter med primær biliær cirrhose. Vurdér først ud fra nedenstående kriterier, om serum bilirubin bør transformeres: a) ved at se på fordelingen af serum bilirubin er der ekstreme observationer? Et histogram over alle værdierne set for bilirubin viser tydeligt, at der er tale om en meget skæv fordeling: par( las=1 ) hist( wr$bilirubin, main = 'Histogram af bilirubin', xlab = 'Bilirubin' )

5 Bemærk at jeg her satte grafik-option par( las=1 ) som sikrer, at tallene på y-aksen står horisontalt i stedet for vertikalt. Kommandoen skal bare køres à n gang, så gælder den for alle plots vi laver fra nu af. Den kan rettes tilbage ved at køre par( las=0 ) (las er en skør forkortelse af AxiS Label orientation ). Skævheden er ikke noget problem i sig selv, da der ikke er noget som helst krav til fordelingen af en kovariat. Men: I en så skæv fordeling kan der være meget indflydelsesrige observationer blandt de få, meget høje værdier, og det kan derfor være meget ustabilt at bibeholde denne skala. Logaritmetransformation kan bruges til at trykke ekstremt høje værdier ind mod midten. Vi ser derfor også på n logaritmetransformeret bilirubin. Her er valgt logaritmen med grundtal 2: wr$log2bili <- log2( wr$bilirubin ) hist( wr$log2bili, main = 'Histogram af logaritmetransformeret bilirubin', xlab = 'log2( Bilirubin )' )

6 Her ser vi en meget mere jævn fordeling uden meget ekstreme værdier. Det er derfor relevant at undersøge, om utransformeret bilirubin eller logaritmetransformeret bilirubin er mest relevant som prognostisk variabel for det vigtigste er jo, at det er en passende model for sammenhængen mellem bilirubin og dødsraten. b) ved at inkludere serum bilirubin både utransformeret og passende transformeret på samme tid Dette kan gøres enten med eller uden behandlingen som kovariat, og vi ser på begge muligheder nedenfor. først uden behandlingseffekt: cox2 <- coxph( Surv(months,dead) ~ bilirubin + log2bili, data=wr) summary(cox2) Call: coxph(formula = Surv(months, dead) ~ bilirubin + log2bili, data = wr) n= 216, number of events= 103 coef exp(coef) se(coef) z Pr(> z ) bilirubin log2bili e-09 *** --- Signif. codes: 0 '***' '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 exp(coef) exp(-coef) lower.95 upper.95

7 bilirubin log2bili Concordance= (se = ) Rsquare= (max possible= ) Likelihood ratio test= on 2 df, p=0 Wald test = 83.4 on 2 df, p=0 Score (logrank) test = on 2 df, p=0 Ovenstående output viser klart, at den logaritmetransformerede version af bilirubin er den med stærkest statistisk signifikans, mens den utransformerede kan udelades sammenhængen flader en smule mere ud end logaritme-transformationen (koefficienten til bilirubin er negativ). Og så til analysen med behandlingseffekt: cox3 <- coxph( Surv(months,dead) ~ azathiop + bilirubin + log2bili, data=wr) summary(cox3) Call: coxph(formula = Surv(months, dead) ~ azathiop + bilirubin + log2bili, data = wr) n= 216, number of events= 103 coef exp(coef) se(coef) z Pr(> z ) azathiopja * bilirubin log2bili e-09 *** --- Signif. codes: 0 '***' '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 exp(coef) exp(-coef) lower.95 upper.95 azathiopja bilirubin log2bili Concordance= (se = ) Rsquare= (max possible= ) Likelihood ratio test= on 3 df, p=0 Wald test = on 3 df, p=0 Score (logrank) test = on 3 df, p=0 der ses at vise stort set det samme, for så vidt angår effekten af bilirubin.

8 Vi noterer os dog, at behandlingseffekten nu er blevet signifikant - hvilket vi skal komme tilbage til nedenfor. c) ved at modellere effekten af serum bilirubin ved hjælp af en lineær spline Dette er svært først skal vi have fundet nogle fornuftige steder til opdeling af splinen, altså nogle steder (værdier af bilirubin), hvor vi tillader kurven at knække. I mangel af bedre viden om forløbet, kan man argumentere for at opdele efter kvartiler af bilirubin, men for at skaffe ca lige mange dødsfald i hver gruppe, vil vi benytte kvartilerne udregnet udelukkende blandt de døde. Vi definerer derfor et sub-datasæt bestående af de døde og bestemmer kvartilerne: wr1 <- subset( wr, dead==1 ) quantile( wr1$bilirubin, probs=c(.25,.5,.75) ) 25% 50% 75% Vi vælger altså tærskelværdierne 31, 54 og for bilirubin og tilføjer 3 splinevariable baseret på disse værdier til datasættet: wr$bili25 = (wr$bilirubin-31)*(wr$bilirubin>31); wr$bili50 = (wr$bilirubin-54)*(wr$bilirubin>54); wr$bili75 = (wr$bilirubin-119.5)*(wr$bilirubin>119.5); Vi er dermed klar til at benytte disse ekstra 3 variable sammen med selve bilirubin. Vi laver samtidigt et test for om vi kan undvære alle 3 spline variable ved at køre modellen uden disse og sammenligne de to modeller vha anova(): cox4 <- coxph( Surv(months,dead) ~ azathiop + bilirubin + bili25+bili50+bili75, data=wr) cox5 <- coxph( Surv(months,dead) ~ azathiop + bilirubin, data=wr) anova(cox4,cox5) Analysis of Deviance Table Cox model: response is Surv(months, dead) Model 1: ~ azathiop + bilirubin + bili25 + bili50 + bili75 Model 2: ~ azathiop + bilirubin loglik Chisq Df P(> Chi ) e-09 *** --- Signif. codes: 0 '***' '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Output viser, at der ikke er en lineær sammenhæng med baseline serum bilirubin! Testet for linearitet giver P<.0001.

9 **Det numeriske test bør dog aldrig stå alene man skal altid tegne den lineære spline.* *Hvis P- værdien er lav, men det er sammen med en meget savtakket kurve omkring en generelt lineær trend, kan en lineær sammenhæng stadig være den mest relevante model at bruge. Når vi skal tegne den lineære spline bestemmer vi først de prædikterede værdier på log-hazardskala i en ny variabel med navn spline: wr$spline <- predict( cox4, newdata= wr, type='lp' ) Dernæst sorterer vi datasættet efter bilirubin værdierne wr <- wr[ order(wr$bilirubin), ] inden vi plotter de prædikterede værdier som funktion af bilirubin for hver behandling: plot( wr$bilirubin, wr$spline, col=wr$azathiop, xlab='bilirubin', ylab='spline' ) # Tegner linien for placebo w0 <- subset(wr, azathiop=='nej' ) lines( w0$bilirubin, w0$spline ) # Tegner linien for azathiop w1 <- subset(wr, azathiop=='ja' ) lines( w1$bilirubin, w1$spline, col='red' ) legend( 'bottomright', c('placebo','azathiop'), inset=.05, lty=1, col=c(1,2), pch=1 )

10 Vi ser her en påfaldende lighed med en logaritmefunktion. Hvis man kørte hele proceduren med en lineær spline igennem med log2bili som variabel i stedet for bilirubin, ville man faktisk finde en næsten perfekt lineær sammmenhæng. 3 Estimer og fortolk baseline serum bilirubins betydning for dødsraten. Alt under spørgsmål 2 viser, at vi bør se på logaritmetransformeret bilirubin. Vi vælger - transformeret bilirubin, fordi så får vi i outputtet vist effekten af en fordobling af serum bilirubin direkte som effektestimatet. cox6 <- coxph( Surv(months,dead) ~ azathiop + log2bili, data=wr) summary(cox6) Call: coxph(formula = Surv(months, dead) ~ azathiop + log2bili, data = wr) n= 216, number of events= 103 coef exp(coef) se(coef) z Pr(> z ) azathiopja * log2bili <2e-16 *** ---

11 Signif. codes: 0 '***' '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 exp(coef) exp(-coef) lower.95 upper.95 azathiopja log2bili Concordance= (se = ) Rsquare= (max possible= ) Likelihood ratio test= on 2 df, p=0 Wald test = on 2 df, p=0 Score (logrank) test = on 2 df, p=0 En dobbelt så høj baseline serum bilirubin giver en 2.10 (95% kofidensinterval: 1.81 til 2.44) gange større dødsrate, altså ca. en fordobling af dødsraten. 4 Estimer og fortolk effekten af azathioprine, justeret for effekten af bilirubin. Vi ser nu på det andet aspekt af analysen ovenfor, nemlig effekten af behandling med azathiprin. Vi konstaterede allerede tidligere, at denne var blevet signifikant efter justering med bilirubin, og P-værdien i analysen ovenfor er Vi skal nu kvantificere effekten. Konklusionen ses at være, at den estimerede effekt af behandling med azathioprine er en dødsrate på kun 59.5% (95% konfidensinterval fra 39.7% til 89.0%) af dødsraten blandt placebo-behandlede med samme baseline serum bilirubin. Det var lidt af en forskel fra den ujusterede analyse! 5 Hvordan ville du afrapportere resultaterne i en artikel? Her bør man tage i betragtning, a) at Cochrane centeret har vist, at justerede analyser i gennemsnit overestimerer de faktiske behandlingseffekter (sikkert fordi folk tror på behandlingseffekten og derfor tror, at nu har de fundet den rigtige model, når den estimerede effekt tilfældigvis bliver stærkere). b) at randomisering ikke sikrer, at man får helt ens fordelinger af confoundere, kun at der ikke er nogen systematiske forskelle til fordel for en bestemt behandlingsgruppe c) hvad man selv skrev i protokollen (så man undgår fisketure) 6 Lav modelkontrol for Cox modellen, primært for effekten af den randomiserede behandling, men hvis der er tid, også for effekten af bilirubin. Modelkontrollen indbefatter

12 a) Grafisk modelkontrol af proportionale rater for behandling Vi skal her se på antagelsen om proportionale intensiteter, hvilket gøres ved at tegne log minus log af overlevelseskurverne. Hvis der er proportionale intensiteter, skal disse kurver være parallelle. Vi ser først på behandlingseffekten, som er den nemmeste, fordi der kun er to niveauer (azathioprin eller placebo). Overlevelseskurverne fandt vi i opgave 1 vha prodlim men når vi skal bestemme log-minus-log må vi gøre det vha survfit(). Denne er standardfunktionen til at tegne Kaplan-Meier plot i survival pakken, de bliver bare ikke så pæne som i prodlim: km1 <- survfit( Surv(months,dead) ~ azathiop, data=wr) plot( km1, col=c(1,2) ) Til gengæld er det nemt at tegne log-minus-log-kurverne: plot( km1, col=c(1,2), fun='cloglog', cex.axis=.75)

13 Bemærk her, at R vælger at benytte en logaritmisk tidsakse. Ofte kan det være næsten umuligt at bedømme den lodrette afstand mellem kurverne i den første del af perioden, fordi raterne ofte er særligt høje i begyndelsen, så kurverne er meget stejle. Det afhjælper man med den logaritmiske tidsakse. De to kurver ses at krydse over hinanden flere gange frem til 5 år (60 måneder). Derefter er der lidt varierende lodret afstand mellem kurverne, hvorefter de bliver mere forskellige. b) Grafisk modelkontrol af proportionale rater for bilirubin For at checke antagelsen om proportionale intensiteter for bilirubin, er vi nødt til at foretage en inddeling i et par intervaller (vi kan jo ikke checke proportionalitet af kurver svarende til hver enkelt forekommende værdi af bilirubin). Vi vælger her at opdele i 3 intervaller, svarende til fraktilerne 33.33% og 66.67%, igen kun for de døde. Disse findes ud fra datasættet wr1 bestående af de døde benyttet ovenfor: quantile( wr1$bilirubin, probs=c(.3333,.6667) ) 33.33% 66.67% Vi vil altså opdele efter bilirubin-værdierne 37 og 92 og får brug for en ny variabel svarende til denne inddeling. Hertil vil vi benytte funktionen cut(), som skærer en kvantitativ variabel i bidder. Her skal man dog også angive en øvre og nedre grænse for ydergrupperne og vælger man

14 den nedre/øvre grænse for højt/lavt i forhold de værdier man har observeret, sættes værdierne uden for disse grænser til manglende. Vi checker derfor først hvilke værdier bilirubin antager: range( wr$bilirubin ) [1] og prøver at bruge funktionen og laver samtidigt et check af, at inddelingen ser fornuftig ud (som man altid bør gøre når man laver nye variable): wr$biligrp <- cut( wr$bilirubin, c( 5,37,92,528 )) table( wr$biligrp, usena='ifany' ) (5,37] (37,92] (92,528] <NA> Vi ser, at vi her har en manglende værdi. Det skyldes at det nederste skæringspunkt ikke indgår i intervallet (til at illustrere dette benytter R ( i definitionen af grupperne, hvorimod ] betyder at værdien er med i intervallet ). Vi må derfor modificere vores variabel ved at sætte den laveste værdi feks 1 lavere end vi har observeret: wr$biligrp <- cut( wr$bilirubin, c( 5-1,37,92,528 )) table( wr$biligrp, usena='ifany' ) (4,37] (37,92] (92,528] Vi udfører nu Cox-regressionsmodellen, hvor vi stratificerer på bilirubin i grupper frem for at have den som en kvantitativ variabel: cox7 <- coxph( Surv(months,dead) ~ azathiop + strata( biligrp ), data=wr ) Til modelkontrol vil vi igen benytte log-minus-log kurverne. Disse kan vi få frem ved at benytte funktionen basehaz() som beregner den kumulerede baseline hazard i hvert strata - og disse værdier skal vi så tage logaritmen til for at opnå log-minus-log survival (nu er det ved at være lidt teknisk ) b <- basehaz( cox7 ) head( b ) hazard time strata (4,37] (4,37] (4,37] (4,37] (4,37] (4,37]

15 Vi skal altså plotte log(hazard) som funktion af time for hvert strata. Dette kan vi feks gøre ved først at splitte datasættet b i de tre strata, og så tegne en linie i hvert strata i et fælles plot: s1 <- subset( b, strata == '(4,37]' ) s2 <- subset( b, strata == '(37,92]' ) s3 <- subset( b, strata == '(92,528]' ) plot( s1$time, log(s1$hazard), type='s', col=1, ylim=c(-5,2), xlab='months',ylab='log-minus-log survival' ) lines( s2$time, log(s2$hazard), type='s', col=2 ) lines( s3$time, log(s3$hazard), type='s', col=3 ) legend( 'bottomright', c('<=37','37-92','>92'), inset=0.05, lty=1, col=1:3, title='bilirubin', cex=.75) Bortset fra det første års tid synes proportionaliteten at være vældig god for bilirubin. De næste 3 punkter tager vi under et: c) Numerisk test af proportionale rater for behandling d) Numerisk test af proportionale rater for bilirubin e) Check af linearitetsantagelsen for bilirubin (på den valgte skala) I R kan disse tests laves ved hjælp af cox.aalen()-funktionen i timereg-pakken. Først skal Cox modellen køres endnu en gang ved brug af cox.aalen(), og her er man nødt til at fortælle at vi

16 ønsker at arbejde med Cox modellen hvor alle kovariater har proportionale effekter (cox.aalen() kan håndtere modeller, hvor effekterne ikke er proportionale). Det gør man ved at skrive prop() (PROPortional) omkring hver kovariat. Da metoden er baseret på simulation, er det en god idé at vælge et seed som udgangspunkt for beregningerne, så man får præcis samme p-værdi hver gang man laver beregningen: set.seed( 1234 ) # vælg et hvilket som helst tal ca1 <- cox.aalen( Surv(months,dead) ~ prop( azathiop ) + prop( log2bili ), weighted.test=0, data=wr) summary( ca1 ) Cox-Aalen Model Test for Aalen terms Test not computed, sim=0 Proportional Cox terms : Coef. SE Robust SE D2log(L)^-1 z P-val prop(azathiop)ja prop(log2bili) lower2.5% upper97.5% prop(azathiop)ja prop(log2bili) Test of Proportionality sup hat U(t) p-value H_0 prop(azathiop)ja prop(log2bili) P-værdien for test af proportionale rater aflæses under p-value H_0. Her ses ingen tegn på problemer med antagelsen om proportionale rater (P=0.236 hhv P=0.216 for azathiop hhv bilirubin) Man kan i tilgift få figurer, som kan give fingerpeg om, hvordan afvigelserne fra antagelserne evt kunne se ud: plot( ca1, score=t )

17 Den øverste figur, for behandlingseffekten, viser, at personer med høje værdier af azathiop1 (dvs. de behandlede) dør lidt for hurtigt til at starte med (det var jo også her, de kumulerede

18 rater var nærmest ens). Det kan jo være, at behandlingseffekten først sætter ind efter et stykke tid. For bilirubin ser vi ligeledes, at dem med høj værdi af bilirubin dør for hurtigt til at starte med, hvilket kunne være en effekt af, at det drejer sig om en værdi målt ved baseline, og denne har formentlig større prognostisk værdi i starten (da den kan åndre sig hen ad vejen). Vi undersøger dernæst linearitetsantagelsen for log2bili ved et formelt test. Igen kan vi benytte cox.aalen() dog med lidt andre specifikationer: set.seed( 2345 ) # vã lg et hvilket som helst tal ca2 <- cox.aalen( Surv(months,dead) ~ prop( azathiop ) + prop( log2bili ), residuals=1, n.sim=0, data=wr) resids <- cum.residuals( ca2, cum.resid=1, data=wr ) summary(resids) Test for cumulative MG-residuals Grouped cumulative residuals not computed, you must provide modelmatrix to get these (see help) Residual versus covariates consistent with model sup hat B(t) p-value H_0: B(t)=0 prop(log2bili) Her får vi en P-værdi på 0.79 og derfor intet tegn på at der skulle være problemer med lineariteten. Igen kan vi lave et plot: plot( resids, score=2 )

19 Denne figur viser kun ukarakteristiske svingninger, svarende til en rigtig god linearitetsantagelse, som vi også fandt ud af i spørgsmål 3c, hvor vi modellerede effekten som en lineær spline. Ovenstående er en nem metode til at lave modelkontrol, men man kan supplere med mere specifikke tests, i form af tidsvarierende effekter. Man kan så vælge nogle passende tidspunkter, hvor proportionalitetsfaktoren kan få lov til at åndre sig. En god måde at vælge disse opdelingstidspunkter er at undersøge, om de kumulerede rater er nogenlunde lineære i nogle intervaller. Hvis de kumulerede rater er nogenlunde lineære, så er raterne nogenlunde konstante i de samme intervaller. Hvis raterne er konstante i begge grupper i et interval, er de selvfølgelig også proportionale i hele det interval. Hvis vi f.eks. ikke antager proportionale intensiteter for behandling i hele tidsrummet, men tillader proportionalitetskonstanten at variere mellem f.eks. 3 tidsintervaller (her valgt med tærskelværdier 12 og 56 måneder, baseret på figuren fra spørgsmål 6a), kan vi skrive: cox8 <- coxph( Surv(months, dead) ~ tt(azathiop)+log2bili, data=wr, tt=function(x, t,...) { cbind(az1=(x=='ja')*(t<=12), az2= (x=='ja')*(12<t&t<=56), az3= (x=='ja')*(t>56) ) }) Funktionen tt (Time Transform) hjælper med at lave en dummy-variabel for hver tidsperiode svarende til at vi får estimeret effekten af azathiop for hver periode separat.

20 Vi får output summary(cox8) Call: coxph(formula = Surv(months, dead) ~ tt(azathiop) + log2bili, data = wr, tt = function(x, t,...) { cbind(az1 = (x == "ja") * (t <= 12), az2 = (x == "ja") * (12 < t & t <= 56), az3 = (x == "ja") * (t > 56)) }) n= 216, number of events= 103 coef exp(coef) se(coef) z Pr(> z ) tt(azathiop)az tt(azathiop)az tt(azathiop)az ** log2bili < 2e-16 *** --- Signif. codes: 0 '***' '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 exp(coef) exp(-coef) lower.95 upper.95 tt(azathiop)az tt(azathiop)az tt(azathiop)az log2bili Concordance= (se = ) Rsquare= (max possible= ) Likelihood ratio test= on 4 df, p=0 Wald test = on 4 df, p=0 Score (logrank) test = on 4 df, p=0 hvoraf vi ser, at vi har en hazardratio på 0.95 i det første år, 0.65 i anden periode og 0.31 i tredie. Vi kan undersøge ved et formelt test om disse tre hazardratioer faktisk er forskellige: linearhypothesis( cox8, c("tt(azathiop)az1=tt(azathiop)az2", "tt(azathiop)az2=tt(azathiop)az3")) Linear hypothesis test Hypothesis: tt(azathiop)az1 - tt(azathiop)az2 = 0 tt(azathiop)az2 - tt(azathiop)az3 = 0 Model 1: restricted model Model 2: Surv(months, dead) ~ tt(azathiop) + log2bili

21 Res.Df Df Chisq Pr(>Chisq) Her finder vi altså heller ikke nogen indikation af, at proportionalitetskonstanterne skulle afvige væsentligt fra hinanden. I stedet for at basere opdelingen på det visuelle indtryk af stykkevis linearitet for den kumulerede rate, kan man eksempelvis vælge at opdele tidsintervallerne, så der bliver ca. lige mange døde i hvert tidsinterval, fordi der så er ca. lige stor statistisk styrke i hvert interval. Dette prøver vi for effekten af bilirubin: quantile( wr1$months, probs=c(.3333,.6667) ) 33.33% 66.67% Benytter vi således 19 og 50 måneder som tærskelværdier, skriver vi: cox9 <- coxph( Surv(months, dead) ~ azathiop+tt(log2bili), data=wr, tt=function(x, t,...) { cbind(lb1=x*(t<=19), lb2= x*(19<t&t<=50), lb3= x*(t>50) ) }) linearhypothesis( cox9, c("tt(log2bili)lb1=tt(log2bili)lb2", "tt(log2bili)lb2=tt(log2bili)lb3")) Linear hypothesis test Hypothesis: tt(log2bili)lb1 - tt(log2bili)lb2 = 0 tt(log2bili)lb2 - tt(log2bili)lb3 = 0 Model 1: restricted model Model 2: Surv(months, dead) ~ azathiop + tt(log2bili) Res.Df Df Chisq Pr(>Chisq) Det ser således ud til, at proportionalitetsantagelsen (=konstant effekt) for serum bilirubin holder rimeligt godt henover hele perioden. Reference: Christensen E, Neuberger J, Crowe J, Altman DG, Popper H, Portmann B, et al. Beneficial effect of azathioprine and prediction of prognosis in primary biliary cirrhosis. Final results of an international trial. Gastroenterology 1985;89(5):

Opgavebesvarelse vedr. overlevelsesanalyse

Opgavebesvarelse vedr. overlevelsesanalyse Opgavebesvarelse vedr. overlevelsesanalyse Opgaven går ud på at vurdere effekten af azathioprine på overlevelsen hos 216 patienter med primær biliær cirrhose (PBC), ref. Christensen et al. (1985). Data

Læs mere

Introduktion til overlevelsesanalyse

Introduktion til overlevelsesanalyse Faculty of Health Sciences Introduktion til overlevelsesanalyse Cox regression III Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet [email protected] Kursushjemmeside:

Læs mere

Introduktion til overlevelsesanalyse

Introduktion til overlevelsesanalyse Faculty of Health Sciences Introduktion til overlevelsesanalyse Cox regression Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet [email protected] Kursushjemmeside:

Læs mere

Vi vil analysere effekten af rygning og alkohol på chancen for at blive gravid ved at benytte forskellige Cox regressions modeller.

Vi vil analysere effekten af rygning og alkohol på chancen for at blive gravid ved at benytte forskellige Cox regressions modeller. Løsning til øvelse i TTP dag 3 Denne øvelse omhandler tid til graviditet. Et studie vedrørende tid til graviditet (Time To Pregnancy = TTP) inkluderede 423 par i alderen 20-35 år. Parrene blev fulgt i

Læs mere

Faculty of Health Sciences. Basal Statistik. Overlevelsesanalyse. Lene Theil Skovgaard. 12. marts 2018

Faculty of Health Sciences. Basal Statistik. Overlevelsesanalyse. Lene Theil Skovgaard. 12. marts 2018 Faculty of Health Sciences Basal Statistik Overlevelsesanalyse Lene Theil Skovgaard 12. marts 2018 1 / 12 APPENDIX vedr. SPSS svarende til diverse slides: Kaplan-Meier kurver, s. 3 Kumulerede incidenser

Læs mere

Dag 6: Interaktion. Overlevelsesanalyse

Dag 6: Interaktion. Overlevelsesanalyse Dag 6: Interaktion. Overlevelsesanalyse How does CHD depend on gender and hypertension? Males: hypertension chd01 Females: Frequency Row Pct 0 1 Total ---------+--------+--------+ 0 352 95 447 78.75 21.25

Læs mere

Overlevelsesfunktion. Vi kalder S(t) for overlevelsesfunktionen.

Overlevelsesfunktion. Vi kalder S(t) for overlevelsesfunktionen. 1 Levetidsanalyse Overlevelsesfunktionen Censurering Kaplan-Meier estimatoren Hazard funktionen Proportionale hazards Multipel regression PSE (I17) FSV1 Statistik - 5. lektion 1 / 19 Overlevelsesfunktionen

Læs mere

Løsning til opgave i logistisk regression

Løsning til opgave i logistisk regression Løsning til øvelser i logistisk regression, november 2008 1 Løsning til opgave i logistisk regression 1. Først indlæses data, og vi kan lige sørge for at danne en dummy-variable for cml, som indikator

Læs mere

Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004

Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004 Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004 Formål med Øvelsen: Formålet med øvelsen er at analysere om risikoen for død er forbundet med to forskellige vacciner BCG (mod

Læs mere

Introduktion til overlevelsesanalyse

Introduktion til overlevelsesanalyse Faculty of Health Sciences Introduktion til overlevelsesanalyse Cox regression II Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet [email protected] Kursushjemmeside:

Læs mere

Morten Frydenberg Biostatistik version dato:

Morten Frydenberg Biostatistik version dato: Caerphilly studiet Design og Data Biostatistik uge 14 mandag Morten Frydenberg, Afdeling for Biostatistik Poisson regression En primær tidsakse og ikke stykkevise konstante rater Cox proportional hazard

Læs mere

Faculty of Health Sciences. Basal Statistik. Logistisk regression mm. Lene Theil Skovgaard. 5. marts 2018

Faculty of Health Sciences. Basal Statistik. Logistisk regression mm. Lene Theil Skovgaard. 5. marts 2018 Faculty of Health Sciences Basal Statistik Logistisk regression mm. Lene Theil Skovgaard 5. marts 2018 1 / 22 APPENDIX vedr. SPSS svarende til diverse slides: To-gange-to tabeller, s. 3 Plot af binære

Læs mere

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Afdeling for Biostatistik Bo Martin Bibby 23. november 2006 Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Vi betragter 4699 personer fra Framingham-studiet. Der er oplysninger om follow-up

Læs mere

Faculty of Health Sciences. Basal statistik. Overlevelsesanalyse. Lene Theil Skovgaard. 1. april 2019

Faculty of Health Sciences. Basal statistik. Overlevelsesanalyse. Lene Theil Skovgaard. 1. april 2019 Faculty of Health Sciences Basal statistik Overlevelsesanalyse Lene Theil Skovgaard 1. april 2019 1 / 92 Overlevelsesanalyse Levetider og censurerede observationer Kaplan-Meier kurver Log-rank test Cox

Læs mere

Overlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere.

Overlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere. Overlevelse efter AMI Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Diabetes VF (Venticular fibrillation) WMI (Wall motion index) CHF (Cardiac Heart Failure) Køn og alder betragtes

Læs mere

Lineær og logistisk regression

Lineær og logistisk regression Faculty of Health Sciences Lineær og logistisk regression Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet [email protected] Dagens program Lineær regression

Læs mere

Postoperative komplikationer

Postoperative komplikationer Løsninger til øvelser i kategoriske data, oktober 2008 1 Postoperative komplikationer Udgangspunktet for vurdering af den ny metode må være en nulhypotese om at der er samme komplikationshyppighed, 20%.

Læs mere

Overlevelsesanalyse. Faculty of Health Sciences

Overlevelsesanalyse. Faculty of Health Sciences Faculty of Health Sciences Overlevelsesanalyse Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet [email protected] Program Overlevelsesdata Kaplan-Meier estimatoren

Læs mere

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper.

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper. 1. Indlæs data. * HUSK at angive din egen placering af filen; data framing; infile '/home/sro00/mph2016/framing.txt' firstobs=2; input id sex age frw sbp sbp10 dbp chol cig chd yrschd death yrsdth cause;

Læs mere

Faculty of Health Sciences. Logistisk regression: Kvantitative forklarende variable

Faculty of Health Sciences. Logistisk regression: Kvantitative forklarende variable Faculty of Health Sciences Logistisk regression: Kvantitative forklarende variable Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet [email protected] Sammenhæng

Læs mere

Løsning til øvelsesopgaver dag 4 spg 5-9

Løsning til øvelsesopgaver dag 4 spg 5-9 Løsning til øvelsesopgaver dag 4 spg 5-9 5: Den multiple model Vi tilføjer nu yderligere to variable til vores model : Køn og kolesterol SBP = a + b*age + c*chol + d*mand hvor mand er 1 for mænd, 0 for

Læs mere

1 Hb SS Hb Sβ Hb SC = , (s = )

1 Hb SS Hb Sβ Hb SC = , (s = ) PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.

Læs mere

Øvelse 7: Aktuar-tabeller, Kaplan-Meier kurver og log-rank test

Øvelse 7: Aktuar-tabeller, Kaplan-Meier kurver og log-rank test Øvelse 7: Aktuar-tabeller, Kaplan-Meier kurver og log-rank test Formålet med øvelsen er at analysere risikoen for død forbundet med forskelligt alkoholforbrug. I denne øvelse skal analyserne foretages

Læs mere

Introduktion til overlevelsesanalyse

Introduktion til overlevelsesanalyse Faculty of Health Sciences Introduktion til overlevelsesanalyse Kaplan-Meier estimatoren Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet [email protected]

Læs mere

Opgavebesvarelse, logistisk regression

Opgavebesvarelse, logistisk regression Opgavebesvarelse, logistisk regression Data ligger i rop.xls på kursushjemmesiden: http://staff.pubhealth.ku.dk/ jufo/courses/logistic/ Når du har gemt data på din computer, kan det indlæses i SAS med

Læs mere

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17 nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse

Læs mere

6. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag)

6. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag) Institut for Folkesundhed Afdeling for Biostatistik Afdeling for Epidemiologi. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag) Opgave 1 Udgangspunktet for de følgende spørgsmål er artiklen:

Læs mere

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 1 Regressionsproblemet 2 Simpel lineær regression Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 3

Læs mere

Basal Statistik - SPSS

Basal Statistik - SPSS Faculty of Health Sciences Basal Statistik - SPSS Kovariansanalyse. Lene Theil Skovgaard 3. oktober 2017 1 / 12 APPENDIX med instruktioner til SPSS-analyse svarende til nogle af slides Bland-Altman plot,

Læs mere

Basal Statistik - SPSS

Basal Statistik - SPSS Faculty of Health Sciences Basal Statistik - SPSS Kovariansanalyse. Lene Theil Skovgaard 1. oktober 2018 1 / 12 APPENDIX med instruktioner til SPSS-analyse svarende til nogle af slides Bland-Altman plot,

Læs mere

Økonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol

Økonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol Økonometri: Lektion 5 Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol 1 / 35 Veksekvirkning: Motivation Vi har set på modeller som Price

Læs mere

Logistisk Regression - fortsat

Logistisk Regression - fortsat Logistisk Regression - fortsat Likelihood Ratio test Generel hypotese test Modelanalyse Indtil nu har vi set på to slags modeller: 1) Generelle Lineære Modeller Kvantitav afhængig variabel. Kvantitative

Læs mere

Program. Logistisk regression. Eksempel: pesticider og møl. Odds og odds-ratios (igen)

Program. Logistisk regression. Eksempel: pesticider og møl. Odds og odds-ratios (igen) Faculty of Life Sciences Program Logistisk regression Claus Ekstrøm E-mail: [email protected] Odds og odds-ratios igen Logistisk regression Estimation og inferens Modelkontrol Slide 2 Statistisk Dataanalyse

Læs mere

Statistik kommandoer i Stata opdateret 16/3 2009 Erik Parner

Statistik kommandoer i Stata opdateret 16/3 2009 Erik Parner Statistik kommandoer i Stata opdateret 16/3 2009 Erik Parner Indledning... 1 Hukommelse... 1 Simple beskrivelser... 1 Data manipulation... 2 Estimation af proportioner... 2 Estimation af rater... 2 Estimation

Læs mere

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Multipel regression M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Y j 1 X 1j 2 X 2j... m X mj j eller m Y j 0 i 1 i X ij j BEMÆRK! j svarer til individ

Læs mere

Basal Statistik - SPSS

Basal Statistik - SPSS Faculty of Health Sciences APPENDIX med instruktioner til SPSS-analyse svarende til nogle af slides Basal Statistik - SPSS Den generelle lineære model. Lene Theil Skovgaard 24. oktober 2017 Biokemisk iltforbrug,

Læs mere

6. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag)

6. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag) Institut for Epidemiologi og Socialmedicin Institut for Biostatistik. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag) Opgave 1 Læs afsnit.1 i An Introduction to Medical Statistics, specielt

Læs mere

UNDERVISNINGSEFFEKT-MODELLEN 2006 METODE OG RESULTATER

UNDERVISNINGSEFFEKT-MODELLEN 2006 METODE OG RESULTATER UNDERVISNINGSEFFEKT-MODELLEN 2006 METODE OG RESULTATER Undervisningseffekten udregnes som forskellen mellem den forventede og den faktiske karakter i 9. klasses afgangsprøve. Undervisningseffekten udregnes

Læs mere

Multipel Lineær Regression

Multipel Lineær Regression Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer

Læs mere

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ Indhold 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) 2 1.1 Variation indenfor og mellem grupper.......................... 2 1.2 F-test for ingen

Læs mere

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Lineær regression. Simpel regression. Model. ofte bruges følgende notation: Lineær regression Simpel regression Model Y i X i i ofte bruges følgende notation: Y i 0 1 X 1i i n i 1 i 0 Findes der en linie, der passer bedst? Metode - Generel! least squares (mindste kvadrater) til

Læs mere

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller Type I og type II fejl Type I fejl: forkast når hypotese sand. α = signifikansniveau= P(type I fejl) Program (8.15-10): Hvis vi forkaster når Z < 2.58 eller Z > 2.58 er α = P(Z < 2.58) + P(Z > 2.58) =

Læs mere

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven. PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve

Læs mere

Statistik kommandoer i Stata opdateret 22/ Erik Parner

Statistik kommandoer i Stata opdateret 22/ Erik Parner Statistik kommandoer i Stata opdateret 22/4 2008 Erik Parner Indledning... 1 Simple beskrivelser... 1 Data manipulation... 1 Estimation af proportioner... 2 Estimation af rater... 2 Estimation af Relativ

Læs mere

REEKSAMEN I EPIDEMIOLOGISKE METODER IT & Sundhed, 2. semester

REEKSAMEN I EPIDEMIOLOGISKE METODER IT & Sundhed, 2. semester D E T S U N D H E D S V I D E N S K A B E L I G E F A K U L T E T K Ø B E N H A V N S U N I V E R S I T E T B l e g d a m s v e j 3 B 2 2 0 0 K ø b e n h a v n N REEKSAMEN I EPIDEMIOLOGISKE METODER IT

Læs mere

Basal Statistik - SPSS

Basal Statistik - SPSS Faculty of Health Sciences Basal Statistik - SPSS Regressionsanalyse. Lene Theil Skovgaard 5. februar 2018 1 / 12 APPENDIX med instruktioner til SPSS-analyse svarende til nogle af slides Indlæsning og

Læs mere

OR stiger eksponentielt med forskellen i BMI. kompliceret model svær at forstå og analysere

OR stiger eksponentielt med forskellen i BMI. kompliceret model svær at forstå og analysere Epidemiologi og biostatistik. Uge 5, torsdag 5. september 003 Morten Frydenberg, Institut for Biostatistik. 1 Analyse af overlevelsesdata (ventetidsdata) Censurering (højre + andet) Kaplan-Meyer kurver

Læs mere

Besvarelse af vitcap -opgaven

Besvarelse af vitcap -opgaven Besvarelse af -opgaven Spørgsmål 1 Indlæs data Dette gøres fra Analyst med File/Open, som sædvanlig. Spørgsmål 2 Beskriv fordelingen af vital capacity og i de 3 grupper ved hjælp af summary statistics.

Læs mere

Morten Frydenberg 26. april 2004

Morten Frydenberg 26. april 2004 Introduktion til Logistisk Regression Morten Frydenberg, Inst. f. Biostatistik RESUME: 2 2. gang: 2002 Institut for Biostatistik, Århus Universitet MPH. studieår Specialmodul 4 Cand. San. uddannelsen.

Læs mere

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

Læs mere

Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013

Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013 Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013 I forbindelse med reagensglasbehandling blev 100 par randomiseret til to forskellige former for hormonstimulation.

Læs mere

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Institut for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression Regressionsanalyse Regressionsanalyser

Læs mere

Man indlæser en såkaldt frequency-table i SAS ved følgende kommandoer:

Man indlæser en såkaldt frequency-table i SAS ved følgende kommandoer: 1 IHD-Lexis 1.1 Spørgsmål 1 Man indlæser en såkaldt frequency-table i SAS ved følgende kommandoer: data ihdfreq; input eksp alder pyrs cases; lpyrs=log(pyrs); cards; 0 2 346.87 2 0 1 979.34 12 0 0 699.14

Læs mere

Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration

Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration Faculty of Life Sciences Program Modelkontrol og prædiktion Claus Ekstrøm E-mail: [email protected] Test af hypotese i ensidet variansanalyse F -tests og F -fordelingen. Multiple sammenligninger. Bonferroni-korrektion

Læs mere

OR stiger eksponentielt med forskellen i BMI komplicet model svær at forstå og analysere simpel model

OR stiger eksponentielt med forskellen i BMI komplicet model svær at forstå og analysere simpel model Epidemiologi og biostatistik. Uge 5, torsdag. marts 1 Morten Frydenberg, Institut for Biostatistik. 1 Analyse af overlevelsesdata (ventetidsdata) Censurering (højre + andet) Kaplan-Meyer kurver Det statistiske

Læs mere

Statistik Lektion 17 Multipel Lineær Regression

Statistik Lektion 17 Multipel Lineær Regression Statistik Lektion 7 Multipel Lineær Regression Polynomiel regression Ikke-lineære modeller og transformation Multi-kolinearitet Auto-korrelation og Durbin-Watson test Multipel lineær regression x,x,,x

Læs mere

Modelkontrol i Faktor Modeller

Modelkontrol i Faktor Modeller Modelkontrol i Faktor Modeller Julie Lyng Forman Københavns Universitet Afdeling for Anvendt Matematik og Statistik Statistik for Biokemikere 2003 For at konklusionerne på en ensidet, flersidet eller hierarkisk

Læs mere

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression Multipel Linear Regression Repetition Partiel F-test Modelsøgning Logistisk Regression Test for en eller alle parametre I jagten på en god statistisk model har vi set på følgende to hypoteser og tilhørende

Læs mere

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge Statistik og Sandsynlighedsregning 2 IH kapitel 12 Overheads til forelæsninger, mandag 6. uge 1 Fordelingen af én (1): Regressionsanalyse udfaldsvariabel responsvariabel afhængig variabel Y variabel 2

Læs mere

Kursus i varians- og regressionsanalyse Data med detektionsgrænse. Birthe Lykke Thomsen H. Lundbeck A/S

Kursus i varians- og regressionsanalyse Data med detektionsgrænse. Birthe Lykke Thomsen H. Lundbeck A/S Kursus i varians- og regressionsanalyse Data med detektionsgrænse Birthe Lykke Thomsen H. Lundbeck A/S 1 Data med detektionsgrænse Venstrecensurering: Baggrundsstøj eller begrænsning i måleudstyrets følsomhed

Læs mere

Morten Frydenberg 14. marts 2006

Morten Frydenberg 14. marts 2006 Introduktion til Logistisk Regression Morten Frydenberg, Inst. f. Biostatistik 1 RESUME: 2 2. gang: 2006 Institut for Biostatistik, Århus Universitet MPH 1. studieår Specialmodul 4 Cand. San. uddannelsen

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2 -test [ki-i-anden-test] 1 Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination

Læs mere

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Normalfordelingen. Statistik og Sandsynlighedsregning 2 Normalfordelingen Statistik og Sandsynlighedsregning 2 Repetition og eksamen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige fejl på

Læs mere

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger Øvelser til basalkursus, 5. uge Opgavebesvarelse: Knogledensitet hos unge piger I alt 112 piger har fået målt knogledensitet (bone mineral density, bmd) i 11-års alderen (baseline værdi). Pigerne er herefter

Læs mere

Vejledende besvarelse af hjemmeopgave, forår 2018

Vejledende besvarelse af hjemmeopgave, forår 2018 Vejledende besvarelse af hjemmeopgave, forår 2018 Udleveret 12. februar, afleveres senest ved øvelserne i uge 10 (6.-9.marts) I forbindelse med reagensglasbehandling blev 100 par randomiseret til to forskellige

Læs mere

Logistisk regression. Basal Statistik for medicinske PhD-studerende November 2008

Logistisk regression. Basal Statistik for medicinske PhD-studerende November 2008 Logistisk regression Basal Statistik for medicinske PhD-studerende November 2008 Bendix Carstensen Steno Diabetes Center, Gentofte & Biostatististisk afdeling, Københavns Universitet [email protected] www.biostat.ku.dk/~bxc

Læs mere

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet Eksamen ved Københavns Universitet i Kvantitative forskningsmetoder Det Samfundsvidenskabelige Fakultet 14. december 2011 Eksamensnummer: 5 14. december 2011 Side 1 af 6 1) Af boxplottet kan man aflæse,

Læs mere

Basal Statistik - SPSS

Basal Statistik - SPSS Faculty of Health Sciences APPENDIX Basal Statistik - SPSS Korrelerede målinger. Lene Theil Skovgaard 8. april 2019 med instruktioner til SPSS-analyse svarende til nogle af slides Plots: s. 3, 4, 7, 11-12

Læs mere

Basal Statistik - SPSS

Basal Statistik - SPSS Faculty of Health Sciences Basal Statistik - SPSS Multipel regression. Lene Theil Skovgaard 10. oktober 2017 1 / 12 APPENDIX med instruktioner til SPSS-analyse svarende til nogle af slides Figurer: s.

Læs mere

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter Program Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve Helle Sørensen E-mail: [email protected] I formiddag: Øvelse: effekt af diæter. Repetition fra sidst... Parrede og ikke-parrede

Læs mere

Opgavebesvarelse, brain weight

Opgavebesvarelse, brain weight Opgavebesvarelse, brain weight (Matthews & Farewell: Using and Understanding Medical Statistics, 2nd. ed.) For 20 nyfødte mus er der i tabellen nedenfor anført oplysning om kuldstørrelsen (fra 3 til 12

Læs mere

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering Eksamen 2016 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 17-02-2015 Tid: kl. 09.00-11.00 Bedømmelsesform

Læs mere

Eksamen i Statistik og skalavalidering

Eksamen i Statistik og skalavalidering Eksamen i Statistik og skalavalidering 2009-studieordning Til aflevering d. 22. december 2010 Efterårssemestret 2010, Kandidatuddannelsen i Folkesundhedsvidenskab Opgaven er udarbejdet af: Eksamensnummer

Læs mere

Statistiske Modeller 1: Kontingenstabeller i SAS

Statistiske Modeller 1: Kontingenstabeller i SAS Statistiske Modeller 1: Kontingenstabeller i SAS Jens Ledet Jensen October 31, 2005 1 Indledning Som vist i Notat 1 afsnit 13 er 2 log Q for et test i en multinomialmodel ækvivalent med et test i en poissonmodel.

Læs mere

Vejledende besvarelse af hjemmeopgave, efterår 2018

Vejledende besvarelse af hjemmeopgave, efterår 2018 Vejledende besvarelse af hjemmeopgave, efterår 2018 Udleveret 1. oktober, afleveres senest ved øvelserne i uge 44 (30. oktober.-1. november). Der er foretaget en del undersøgelser af krigsveteraner og

Læs mere

Generelle lineære modeller

Generelle lineære modeller Generelle lineære modeller Regressionsmodeller med én uafhængig intervalskala variabel: Y en eller flere uafhængige variable: X 1,..,X k Den betingede fordeling af Y givet X 1,..,X k antages at være normal

Læs mere

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer.

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer. Vejledende besvarelse af hjemmeopgave Basal statistik, efterår 2008 En gruppe bestående af 45 patienter med reumatoid arthrit randomiseres til en af 6 mulige behandlinger, nemlig placebo, aspirin eller

Læs mere

Vejledende besvarelse af hjemmeopgave i Basal Statistik, forår 2014

Vejledende besvarelse af hjemmeopgave i Basal Statistik, forår 2014 Vejledende besvarelse af hjemmeopgave i Basal Statistik, forår 2014 Garvey et al. interesserer sig for sammenhængen mellem anæstesi og allergiske reaktioner (se f.eks. nedenstående reference, der dog ikke

Læs mere

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Anvendt Statistik Lektion 7. Simpel Lineær Regression Anvendt Statistik Lektion 7 Simpel Lineær Regression 1 Er der en sammenhæng? Plot af mordraten () mod fattigdomsraten (): Scatterplot Afhænger mordraten af fattigdomsraten? 2 Scatterplot Et scatterplot

Læs mere