Introduktion til overlevelsesanalyse

Størrelse: px
Starte visningen fra side:

Download "Introduktion til overlevelsesanalyse"

Transkript

1 Faculty of Health Sciences Introduktion til overlevelsesanalyse Cox regression Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet Kursushjemmeside:

2 Program for dag 2 Hazard funktionen Cox Proportional Hazards model En binær variabel En kategorisk variabel To kategoriske variable Interaktion mellem to kategoriske variable Gennemgående eksempel: Leukæmi patienter i remission. Dagens gennemgang svarer til Kleinbaum & Klein kapitel 3 (som dog ser på en binær og en kontinuert variabel). 2 / 43

3 Remission data Freirich et al. (1963). The effect of 6-mercaptopurine on the duration of remission time of steroid induced remission in acute leukaemia. Blood. Vi har set, at der er forskel på remissionstid afhængigt af behandling logwbc ved baseline køn. Vi så sidst, at logwbc var højere for patienter i placebogruppen end behandlingsgruppen. Kan dette forklare forskellen på de to de to behandlingsgrupper? 3 / 43

4 Hazardfunktionen Hazardfunktionen (eller hazard raten / intensitet): λ(t) P(t T < t + h T t) h hvor sandsynligheden i tælleren læses: Den betingede sandsynlighed for at dø i det næste lille tidsinterval (t + h) givet i live ved begyndelsen af intervallet (t). 0 t t + h Hazardfunktion giver en lokal beskrivelse af risikoen for død. 4 / 43

5 Sammenhæng mellem overlevelses- og hazardfkt. Der er en en-til-en relation mellem overlevelses- og hazardfunktionen: hvor S(t) = exp( Λ(t)) Λ(t) = t 0 λ(s)ds er den integrerede hazard funktion (kumulativ hazard eller kumulativ intensitet). Overlevelsesfunktionen giver en kumulativ beskrivelse af risikoen for død. Den integrerede hazard funktion har ikke nogen simpel fortolkning, men er nyttig i forbindelse med modelkontrol. 5 / 43

6 Konstant hazard funktion Den simpleste model for overlevelsesdata er modellen med konstant hazard, λ(t) = λ for λ > 0. Den kumulative hazard er Λ(t) = t 0 λ(s)ds = t 0 λds = λ t og dermed er overlevelsesfunktionen S(t) = exp( λt). Denne model kaldes den eksponentielle overlevelsesmodel. 6 / 43

7 Den eksponentielle overlevelsesmodel Eksponentialfordelingen, e.g. tid til død for rask population. λ(t) = λ S(t) = exp( λt) Hazard Overlevelsessandsynlighed Tid Tid Λ(t) = λt Integreret hazard / 43 Tid

8 Andre eksempler på hazardfunktioner Non responderende leukæmipatienter At komme sig efter operation Tid (t) Tid (t) Død af tuberkulose 8 / 43 Tid (t)

9 Cox regression Regressionsmodeller er nyttige når vi ønsker at beskrive effekten af flere variable på levetiden. Regressionsmodeller for overlevelsesdata formuleres typisk via hazard funktionen. Langt den vigtigste er Cox modellen. Lad X i = (X i1, X i2,..., X ip ) være en liste af kovariatværdier for individ i. Cox modellen specificerer hazarden for individ i ved λ i (t) = λ 0 (t) exp(β 1 X i1 + β 2 X i2 + + β p X ip ). Når alle kovariater (X er) er 0 får vi baseline hazard λ i (t) = λ 0 (t). Fortolkning: Baseline hazarden er hazarden for et individ med alle kovariatværdier lig 0. 9 / 43

10 Proportional Hazards (PH) Cox modellen: λ i (t) = λ 0 (t) exp(β 1 X i1 + β 2 X i2 + + β p X ip ). For to individer, i og j, er forholdet mellem hazards (hazard ratio (HR) eller relativ risiko) λ i (t) λ j (t) = exp(β 1 (X i1 X j1 ) + + β p (X ip X jp )) dvs. denne afhænger ikke af t. Dette er PH-antagelsen. Ingen antagelser på λ 0 (t) - det primære er regressionsparametrene (β 1,..., β p ). Modellen siges derfor at være semiparametrisk. 10 / 43

11 Eksempel på hazardkurve og HR er Børn med Akut Lymfoblastær Leukæmi i vedligeholdelsesbehandling diagnosticeret (Schmiegelow et al., JCO 2003). Hazard for intermediær risikogruppe, tid til recidiv: hazard rate HR=2 HR=0.5 HR=3 Baseline hazard / 43 Years since cessation of therapy

12 Endnu en egenskab ved Cox modellen Cox modellen er λ i (t) = λ 0 (t) exp(β 1 X i1 + β 2 X i2 + + β p X ip ) og kan derfor skrives på (naturlig) log-skala log(λ i (t)) = log(λ 0 (t) exp(β 1 X i1 + β 2 X i2 + + β p X ip )) = log(λ 0 (t)) + β 1 X i1 + β 2 X i2 + + β p X ip. Det betyder, at Cox-modellen forudsætter at effekten af kovariaterne er additiv og lineær på log-hazard-skalaen. 12 / 43

13 Antagelser for Cox-modellen En opsummering af de antagelser som ligger til grund for Cox modellen λ i (t) = λ 0 (t) exp(β 1 X i1 + β 2 X i2 + + β p X ip ) : baseline hazard kan variere frit, dvs. ikke-parametrisk kun baseline hazard afhænger af tiden t effekten af kovariater er additiv og lineær på log-hazard-skalaen den relative risiko imellem to individer er konstant over tid (proportional hazards). Vi er nødt til at kontrollere om disse antagelser er rimelige. Meget mere om dette senere. 13 / 43

14 KM-plot for begge behandlingsgrupper Behandling Placebo Tid (uger) Hvad er HR mellem placebo og behandling? 14 / 43

15 Simpel Cox-model for remissionsdata Én binær kovariat for remissionsdata: X i = { 0 hvis individ i får placebo 1 hvis individ i får behandling. Cox modellen er λ i (t) = λ 0 (t) exp(βx i ) = { λ0 (t) hvis i får placebo λ 0 (t) exp(β) hvis i får behandling. Hazard ratio (relativ risiko) mellem placebo og behandling er λ 0 (t) exp(β) λ 0 (t) = exp(β). 15 / 43

16 Fortolkning af regressionsparameteren Hazard ratio: λ 0 (t) exp(β) λ 0 (t) = exp(β). Sandsynligheden for at en behandlet patient får tilbagefald er exp(β) gange sandsynligheden for at en ubehandlet patient får tilbagefald til ethvert tidspunkt. HR < 1 (β < 0) : Behandlede får sjældnere tilbagefald end ubehandlede HR = 1 (β = 0) : Behandlede og ubehandlede har samme risiko HR > 1 (β > 0) : Behandlede får oftere tilbagefald end ubehandlede. Fortolkningsmæssigt er vi interesserede i HR=exp(β). Vi har brug for et estimat af β for at få et estimat af HR. 16 / 43

17 Cox s (partielle) Likelihood Funktion Lad t 1,..., t k være de ordnede observerede levetider. Det kan vises, at vi får det bedste bud på β ved at finde det β som maksimaliserer den partielle likelihood L(β) = k exp(βx j ) h R(t j ) exp(βx h) j=1 hvor R(t j ) er risikomængden til tid t j, dvs. mængden af individer under risiko for død umiddelbart før tid t i (jvf Y(t j ) som var antallet under risiko umiddelbart før t i ). Vi har brug for et statistikprogram for at maksimere likelihoodfunktionen. Det tilhørende estimat β kaldes maximum likelihood estimatet for β. 17 / 43

18 Cox-regression i R Cox-regression i R laves med pakken survival. Vi får brug for følgende funktioner: Surv : Laver survivalobjekter (=responsen). coxph : Fitter Cox-regression. summary : Giver output for den fittede Cox-model. 18 / 43

19 Remissionsdata Data: > head(rdata) time event sex logwbc placebo > table(placebo) placebo / 43

20 Simpel Cox-model i R for remissionsdata > cox1<-coxph(surv(time,event) ~ placebo) > summary(cox1) Call: coxph(formula = Surv(time, event) ~ placebo) n= 42, number of events= 30 coef exp(coef) se(coef) z Pr(> z ) placebo *** --- Signif. codes: 0 *** ** 0.01 * exp(coef) exp(-coef) lower.95 upper.95 placebo Concordance= 0.69 (se = ) Rsquare= (max possible= ) Likelihood ratio test= on 1 df, p=5.261e-05 Wald test = on 1 df, p= Score (logrank) test = on 1 df, p=3.283e-05 Her er coef = β = HR=exp(coef)=exp( β) = Dvs den estimerede model er λ i (t) = λ 0 (t) exp( X i ). 20 / 43

21 Konfidensinterval og test Et 95% konfidensinterval (KI) for β får vi som β ± 1.96 SE( β), hvor SE( β) = Standard Error af β. Fra R-output finder vi ± = (0.76, 2.38). Et 95%-KI for HR=exp( β) = får vi ved at tage eksponentialfunktionen til dette, (2.15, 10.81). Et Wald test for hypotesen H 0 : β = 0 (HR=1) er: Z = β = SE( β) = 3.81 approx N (0, 1). 21 / 43

22 Alternativ Cox-model i R for remissionsdata Ønsker vi i stedet placebogruppen som baselinegruppe: > treatment<-1-placebo > cox2<-coxph(surv(time,event) ~ treatment) > summary(cox2) Call: coxph(formula = Surv(time, event) ~ treatment) n= 42, number of events= 30 coef exp(coef) se(coef) z Pr(> z ) treatment *** --- Signif. codes: 0 *** ** 0.01 * exp(coef) exp(-coef) lower.95 upper.95 treatment Concordance= 0.69 (se = ) Rsquare= (max possible= ) Likelihood ratio test= on 1 df, p=5.261e-05 Wald test = on 1 df, p= Score (logrank) test = on 1 df, p=3.283e-05 Her er coef = β = HR=exp(coef)=exp(β) = / 43

23 Kategoriske variable Til øvelserne så vi på en kategoriseret version af logwbc for remissionsdata, f.eks. 1 logwbc i < 2.37 Z i = logwbc i < logwbc i > table(logwbc3) logwbc / 43

24 KM-kurver for kategoriseret logwbc Vi så en monoton sammenhæng: Lav Mellem Høj LogRank-testet viste en signifikant forskel på grupperne (p<.0001). Kan vi kvantificere forskellen mellem grupperne? 24 / 43

25 Cox-model for kategoriseret logwbc Det er nyttigt at definere dummy -variable: V i = { 1 hvis Xi = 2 0 ellers og W i = { 1 hvis Xi = 3 0 ellers. Vi kan formulere Cox-modellen vha. dummy-variablene: λ i (t) = λ 0 (t) exp(β 1 V i + β 2 W i ) dvs. λ i (t) = λ 0 (t) logwbc i < 2.37 λ 0 (t) exp(β 1 ) logwbc i [2.37; 3.23) λ 0 (t) exp(β 2 ) logwbc i Hvad er HR for gruppe 2 vs 1? Gruppe 3 vs 1? Gruppe 3 vs 2? 25 / 43

26 Cox med kategoriseret logwbc i R > v<-ifelse(logwbc3==2,1,0) > w<-ifelse(logwbc3==3,1,0) > > cox3<-coxph(surv(time,event)~v+w) > summary(cox3) Call: coxph(formula = Surv(time, event) ~ v + w) n= 42, number of events= 30 coef exp(coef) se(coef) z Pr(> z ) v w e-06 *** --- Signif. codes: 0 *** ** 0.01 * exp(coef) exp(-coef) lower.95 upper.95 v w Concordance= (se = ) Rsquare= (max possible= ) Likelihood ratio test= on 2 df, p=1.275e-05 Wald test = on 2 df, p=1.56e-05 Score (logrank) test = on 2 df, p=6.979e / 43

27 Kategoriske variable i R En klassevariabel kaldes også en faktor. R kan også håndtere faktorer, dvs. vi behøver ikke at definere dummy-variable for at fitte modellen: > cox4<-coxph(surv(time,event)~factor(logwbc3)) > summary(cox4) Call: coxph(formula = Surv(time, event) ~ factor(logwbc3)) n= 42, number of events= 30 coef exp(coef) se(coef) z Pr(> z ) factor(logwbc3) factor(logwbc3) e-06 *** --- Signif. codes: 0 *** ** 0.01 * exp(coef) exp(-coef) lower.95 upper.95 factor(logwbc3) factor(logwbc3) Concordance= (se = ) Rsquare= (max possible= ) Likelihood ratio test= on 2 df, p=1.275e-05 Wald test = on 2 df, p=1.56e-05 Score (logrank) test = on 2 df, p=6.979e / 43

28 Mere om kategoriske variable i R Bemærk at R vælger det laveste niveau af variablen som baselinegruppe. Når variablen består af tekst (f.eks køn som pige, dreng ) sorterer R alfabetisk. Vi kan selv definere baselinegruppen med relevel(): > logwbc3r<-relevel(factor(logwbc3),3) > cox4n<-coxph(surv(time,event)~logwbc3r) > summary(cox4n) Call: coxph(formula = Surv(time, event) ~ logwbc3r) n= 42, number of events= 30 coef exp(coef) se(coef) z Pr(> z ) logwbc3r e-06 *** logwbc3r *** / 43

29 Parameterisering Den første model lød (når I() er en indikatorfunktion (0/1)) og den anden model λ i (t) = λ 0 (t) exp(β 1 I(Z i = 2) + β 2 I(Z i = 3)) (1) λ i (t) = λ 0 (t) exp( β 1 I(Z i = 1) + β 2 I(Z i = 2)). (2) Den anden model er en omparameterisering af den første. De estimerede effekter for hvert niveau af X: X Model (1) Model (2) 1. 0 β β β β HR(3 vs 1) = exp(β 2 0) = exp(0 β 1 ), HR(2 vs 1) = exp(β 1 0) = exp( β 2 β 1 ) etc. 29 / 43

30 (Partielt) Likelihood Ratio test R giver Wald-tests for hver enkelt parameter samt et overall test for alle parametre på en gang. Nogle gange ønsker vi at lave andre tests, f.eks. H 0 : β 1 = β 2 > 0. Når en model er en simplificering af en anden, kan vi udføre et Likelihood Ratio test: LLR = -2log-likelihood(reduceret)-(-2log-likelihood(fuld)). Denne teststørrelse følger en χ 2 -fordeling med df= parametre (fuld) - parametre (reduceret). 30 / 43

31 Likelihood Ratio test i R Når vi har fittet en Cox-regression i R, kan vi hente log-likelihood ud vha $loglik: > cox4$loglik [1] Her er første element log-likelihood (LL) for modellen helt uden kovariater, andet element for den fulde model. Vi slår gruppe 2 og 3 sammen (svarende til H 0 ) og henter LL: > logwbc2<-logwbc3; logwbc2[logwbc3==3]<-2 > cox4r<-coxph(surv(time,event)~factor(logwbc2)) > cox4r$loglik [1] Beregner nu LLR og tilhørende p-værdi: > LLR<--2*(cox4r$loglik[2]-cox4$loglik[2]) > LLR [1] > p<-1-pchisq(llr,df=1) > p [1] / 43

32 To kategoriske variable Vi ønsker at beskrive effekten af behandling justeret for (kategoriseret) logwbc. Cox modellen bliver λ i (t) = λ 0 (t) exp(β 1 X i + β 2 I(Z i = 2) + β 3 I(Z i = 3)) Fortolkning af regressionparametrene: β 1 er effekten af behandling for fastholdt (givet) logwbc-gruppe. Effekten af behandling er den samme for alle niveauer af logwbc-gruppe. Tilsvarende er effekten af logwbc-gruppen den samme uanset behandlingsgruppe. HR for behandling vs placebo er exp(β 1 ) uanset logwbc-gruppe. HR for logwbc-gruppe 2 vs 1 er exp(β 2 ) uanset behandling. HR for logwbc-gruppe 3 vs 1 er exp(β 3 ) uanset behandling. 32 / 43

33 Den additive model Vi kan illustrere modellen i følgende tabel: Kategoriseret logwbc Z = 1 Z = 2 Z = 3 Placebo 0 β 2 β 3 Behandling β 1 β 1 + β 2 β 1 + β 3 Forskellen mellem placebo og behandling er den samme for hvert niveau af logwbc-gruppe (β 1 ). Forskellen mellem logwbc-grupperne er den samme for hver behandlingsgruppe. Denne model kaldes også den additive model. 33 / 43

34 Den additive model i R På højre side af ~ i survfit inkluderes begge variable adskilt af +: > cox5<-coxph(surv(time,event)~treatment+factor(logwbc3)) > summary(cox5) Call: coxph(formula = Surv(time, event) ~ treatment + factor(logwbc3)) n= 42, number of events= 30 coef exp(coef) se(coef) z Pr(> z ) treatment *** factor(logwbc3) factor(logwbc3) e-05 *** --- Signif. codes: 0 *** ** 0.01 * exp(coef) exp(-coef) lower.95 upper.95 treatment factor(logwbc3) factor(logwbc3) Concordance= (se = ) Rsquare= (max possible= ) Likelihood ratio test= 34.8 on 3 df, p=1.341e-07 Wald test = on 3 df, p=1.604e-06 Score (logrank) test = 39.9 on 3 df, p=1.12e / 43

35 Interaktion mellem kategoriske variable Den additive model forudsætter, at der ikke er interaktion (vekselvirkning). Dette er en antagelse vi skal kontrollere. Vi definerer to interaktionsled ved V i = W i = { 1 Xi = 1 og Z i = 2 0 ellers { 1 Xi = 1 og Z i = 3 0 ellers Cox modellen med interaktionsled er λ i (t) = λ 0 (t) exp(β 1 X i + β 2 I(Z i = 2) + β 3 I(Z i = 3) + β 4 V i + β 5 W i ) 35 / 43

36 Parameterisering af interaktionsmodel Vi kan illustrere modellen i følgende tabel: Kategoriseret logwbc Z = 1 Z = 2 Z = 3 Placebo 0 β 2 β 3 Behandling β 1 β 1 + β 2 + β 4 β 1 + β 3 + β 5 Bemærk at denne tabel svarer til omparameteriseringen Kategoriseret logwbc Z = 1 Z = 2 Z = 3 Placebo 0 β 2 β 3 Behandling β 1 β4 β5 dvs. en model hvor parametrene varierer fuldstændigt frit. 36 / 43

37 Test for interaktion Hypotesen om manglende interaktion lyder: H 0 : β 4 = β 5 = 0. Hypotesen kan testes ved et likelihood-ratio test, hvor teststørrelsen følger en χ 2 -fordeling med 2 frihedsgrader. 37 / 43

38 Interaktionsmodellen i R Interaktioner mellem 2 variable angives med en *: > cox6<-coxph(surv(time,event)~factor(treatment)*factor(logwbc3)) > summary(cox6) Call: coxph(formula = Surv(time, event) ~ factor(treatment) * factor(logwbc3)) n= 42, number of events= 30 coef exp(coef) se(coef) z Pr(> z ) factor(treatment) * factor(logwbc3) factor(logwbc3) ** factor(treatment)1:factor(logwbc3) factor(treatment)1:factor(logwbc3) Signif. codes: 0 *** ** 0.01 * exp(coef) exp(-coef) lower.95 upper.95 factor(treatment) factor(logwbc3) factor(logwbc3) factor(treatment)1:factor(logwbc3) factor(treatment)1:factor(logwbc3) Concordance= (se = ) Rsquare= (max possible= ) Likelihood ratio test= on 5 df, p=8.557e-07 Wald test = 27.1 on 5 df, p=5.444e-05 Score (logrank) test = on 5 df, p=1.09e / 43

39 Øvelser Remissionsdata: Lav et LLR test for hypotesen H 0 : β 1 = 0 i Cox-modellen indeholdende logwbc kategoriseret i tre grupper (cox4 slide 27). Sammenlign med Wald-testet. Forklar i ord hvad det er for en hypotese, der testes. Udregn HR for kategoriset logwbc i den additive model på slide 34: gruppe 1 vs 3, 2 vs 3 og 1 vs 2. Bestem også konfidensintervallerne. Lav et test for interaktion mellem behandlingsgruppe og kategoriseret logwbc. 39 / 43

40 Maligne melanomer: 1. Et datasæt om maligne melanomer er tilgængeligt i pakken timereg. Installér og aktivér pakken. Datasættet melanoma gøres tilgængeligt med kommandoen data(melanoma). 2. Dan et overblik over data med tabeller og histogrammer. Info om kodningen af variablene kan findes på: (Kan findes ved at google R timereg melanoma ). 3. Vi vil fokusere på død pga melanomer, dvs. død af andre årsager skal betragtes som censurering. Er der forskel på risikoen for død af maligne melanomer for mænd og kvinder? Lav et Kaplan-Meier plot og et LogRank-test. Kvantificer og beskriv forskellen. 40 / 43

41 4. Lav et hurtigt grafisk check af, om den estimerede Cox-model er rimelig til at beskrive forskellen på mænd og kvinder. Dette kan gøres ved at bruge R til at estimere overlevelseskurverne for hhv. mænd og kvinder baseret på Cox-modellen. Disse sammenlignes med Kaplan-Meier-kurverne. Vi beder R om at beregne overlevelsessandsynlighederne med surv1<-survfit(cox1,newdata=data.frame(sex=c(0,1))) hvor cox1 er den fittede Cox-model med sex som forklarende variabel. Med newdata fortæller vi R for hvilke værdier vi ønsker kurverne beregnet. Vi kan nu lave et plot med plot(surv1) Vi vil gerne sammenligne disse kurver med KM-kurverne og kan derfor vælge at lave to sidestillede plots: par(mfrow=c(1,2)); plot(km1); plot(surv1) Ser Cox-modellen ud til at være rimelig? 41 / 43

42 Sammenligningen bliver lettere, hvis vi lægger graferne oven i hinanden. Dette gøres med par(mfrow=c(1,1)) # 1 plot pr vindue igen plot(km1); lines(surv1) Fjern mærkerne fra kurverne, sæt farver og legend på. Hvad tror du der sker, hvis vi i surv1 erstatter c(0,1) med f.eks c(2,3) - giver det mening? 42 / 43

43 5. Er der forskel på tumortykkelsen for mænd og kvinder? 6. Definér en kategoriset version af tumortykkelse med mindst 3 grupper. Hvad sker der med effekten af køn, når vi tager højde for tumortykkelsen? 7. Fit modellen indholdende alle tre forklarende variable. Test for alle parvise interaktioner. 43 / 43

Introduktion til overlevelsesanalyse

Introduktion til overlevelsesanalyse Faculty of Health Sciences Introduktion til overlevelsesanalyse Cox regression III Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Kursushjemmeside:

Læs mere

Introduktion til overlevelsesanalyse

Introduktion til overlevelsesanalyse Faculty of Health Sciences Introduktion til overlevelsesanalyse Cox regression II Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Kursushjemmeside:

Læs mere

Overlevelsesanalyse. Faculty of Health Sciences

Overlevelsesanalyse. Faculty of Health Sciences Faculty of Health Sciences Overlevelsesanalyse Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Program Overlevelsesdata Kaplan-Meier estimatoren

Læs mere

Introduktion til overlevelsesanalyse

Introduktion til overlevelsesanalyse Faculty of Health Sciences Introduktion til overlevelsesanalyse Kaplan-Meier estimatoren Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk

Læs mere

Vi vil analysere effekten af rygning og alkohol på chancen for at blive gravid ved at benytte forskellige Cox regressions modeller.

Vi vil analysere effekten af rygning og alkohol på chancen for at blive gravid ved at benytte forskellige Cox regressions modeller. Løsning til øvelse i TTP dag 3 Denne øvelse omhandler tid til graviditet. Et studie vedrørende tid til graviditet (Time To Pregnancy = TTP) inkluderede 423 par i alderen 20-35 år. Parrene blev fulgt i

Læs mere

Dag 6: Interaktion. Overlevelsesanalyse

Dag 6: Interaktion. Overlevelsesanalyse Dag 6: Interaktion. Overlevelsesanalyse How does CHD depend on gender and hypertension? Males: hypertension chd01 Females: Frequency Row Pct 0 1 Total ---------+--------+--------+ 0 352 95 447 78.75 21.25

Læs mere

Faculty of Health Sciences. Miscellaneous: Styrkeberegninger Overlevelsesanalyse Analyse af matchede studier

Faculty of Health Sciences. Miscellaneous: Styrkeberegninger Overlevelsesanalyse Analyse af matchede studier Faculty of Health Sciences Miscellaneous: Styrkeberegninger Overlevelsesanalyse Analyse af matchede studier Forsøgsplanlægning Sammenligning af to grupper : Hvor mange personer skal vi bruge? Det kommer

Læs mere

Lineær og logistisk regression

Lineær og logistisk regression Faculty of Health Sciences Lineær og logistisk regression Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Dagens program Lineær regression

Læs mere

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Statistik II Lektion 3 Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Setup: To binære variable X og Y. Statistisk model: Konsekvens: Logistisk regression: 2 binære var. e e X Y P

Læs mere

Faculty of Health Sciences. Logistisk regression: Kvantitative forklarende variable

Faculty of Health Sciences. Logistisk regression: Kvantitative forklarende variable Faculty of Health Sciences Logistisk regression: Kvantitative forklarende variable Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Sammenhæng

Læs mere

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Statikstik II 2. Lektion Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Sandsynlighedsregningsrepetition Antag at Svar kan være Ja og Nej. Sandsynligheden for at Svar Ja skrives

Læs mere

Statistik II 4. Lektion. Logistisk regression

Statistik II 4. Lektion. Logistisk regression Statistik II 4. Lektion Logistisk regression Logistisk regression: Motivation Generelt setup: Dikotom(binær) afhængig variabel Kontinuerte og kategoriske forklarende variable (som i lineær reg.) Eksempel:

Læs mere

Opgavebesvarelse vedr. overlevelsesanalyse

Opgavebesvarelse vedr. overlevelsesanalyse Opgavebesvarelse vedr. overlevelsesanalyse Opgaven går ud på at vurdere effekten af azathioprine på overlevelsen hos 216 patienter med primær biliær cirrhose (PBC), ref. Christensen et al. (1985). Data

Læs mere

Program. Logistisk regression. Eksempel: pesticider og møl. Odds og odds-ratios (igen)

Program. Logistisk regression. Eksempel: pesticider og møl. Odds og odds-ratios (igen) Faculty of Life Sciences Program Logistisk regression Claus Ekstrøm E-mail: ekstrom@life.ku.dk Odds og odds-ratios igen Logistisk regression Estimation og inferens Modelkontrol Slide 2 Statistisk Dataanalyse

Læs mere

Introduktion til R. Faculty of Health Sciences

Introduktion til R. Faculty of Health Sciences Faculty of Health Sciences Introduktion til R Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Kursushjemmeside: www.biostat.ku.dk/~sr/forskningsaar/survival2011

Læs mere

Overlevelsesfunktion. Vi kalder S(t) for overlevelsesfunktionen.

Overlevelsesfunktion. Vi kalder S(t) for overlevelsesfunktionen. 1 Levetidsanalyse Overlevelsesfunktionen Censurering Kaplan-Meier estimatoren Hazard funktionen Proportionale hazards Multipel regression PSE (I17) FSV1 Statistik - 5. lektion 1 / 19 Overlevelsesfunktionen

Læs mere

Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004

Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004 Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004 Formål med Øvelsen: Formålet med øvelsen er at analysere om risikoen for død er forbundet med to forskellige vacciner BCG (mod

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Morten Frydenberg Biostatistik version dato:

Morten Frydenberg Biostatistik version dato: Caerphilly studiet Design og Data Biostatistik uge 14 mandag Morten Frydenberg, Afdeling for Biostatistik Poisson regression En primær tidsakse og ikke stykkevise konstante rater Cox proportional hazard

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Morten Frydenberg 26. april 2004

Morten Frydenberg 26. april 2004 Introduktion til Logistisk Regression Morten Frydenberg, Inst. f. Biostatistik RESUME: 2 2. gang: 2002 Institut for Biostatistik, Århus Universitet MPH. studieår Specialmodul 4 Cand. San. uddannelsen.

Læs mere

Introduktion til overlevelsesanalyse

Introduktion til overlevelsesanalyse Faculty of Health Sciences Introduktion til overlevelsesanalyse Cox regression IV. Competing risks. Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk

Læs mere

Morten Frydenberg 14. marts 2006

Morten Frydenberg 14. marts 2006 Introduktion til Logistisk Regression Morten Frydenberg, Inst. f. Biostatistik 1 RESUME: 2 2. gang: 2006 Institut for Biostatistik, Århus Universitet MPH 1. studieår Specialmodul 4 Cand. San. uddannelsen

Læs mere

Faculty of Health Sciences. Basal Statistik. Overlevelsesanalyse. Lene Theil Skovgaard. 12. marts 2018

Faculty of Health Sciences. Basal Statistik. Overlevelsesanalyse. Lene Theil Skovgaard. 12. marts 2018 Faculty of Health Sciences Basal Statistik Overlevelsesanalyse Lene Theil Skovgaard 12. marts 2018 1 / 12 APPENDIX vedr. SPSS svarende til diverse slides: Kaplan-Meier kurver, s. 3 Kumulerede incidenser

Læs mere

24. februar Analyse af overlevelsesdata (ventetidsdata) Ikke parametrisk statistiske test : Det statistiske modelbegreb Modelselektion

24. februar Analyse af overlevelsesdata (ventetidsdata) Ikke parametrisk statistiske test : Det statistiske modelbegreb Modelselektion . februar 00 Ikke parametrisk statistiske test : Ideen bag Epidemiologi og biostatistik. Uge, mandag. februar 00 Morten Frydenberg, Institut for Biostatistik. To grupper: Mann-Whitney / Wilcoxon testet

Læs mere

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Anvendt Statistik Lektion 8. Multipel Lineær Regression Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke

Læs mere

Multipel Lineær Regression

Multipel Lineær Regression Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer

Læs mere

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge Statistik og Sandsynlighedsregning 2 IH kapitel 12 Overheads til forelæsninger, mandag 6. uge 1 Fordelingen af én (1): Regressionsanalyse udfaldsvariabel responsvariabel afhængig variabel Y variabel 2

Læs mere

Eksamen Efterår 2013

Eksamen Efterår 2013 Eksamen Efterår 2013 Opgave En måde at sammenlægge svarene fra de fem EQ-5D items er igennem et indeks, der angiver værdien samfundet giver en bestemt svarkombination. EURV = 1-0.081*(D=1) 0.069*(MOVE=2)

Læs mere

Analyse af binære responsvariable

Analyse af binære responsvariable Analyse af binære responsvariable Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet 23. november 2012 Har mænd lettere ved at komme ind på Berkeley? UC Berkeley

Læs mere

Logistisk regression

Logistisk regression Logistisk regression Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Kursushjemmeside: www.biostat.ku.dk/~sr/forskningsaar/regression2012/

Læs mere

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Afdeling for Biostatistik Bo Martin Bibby 23. november 2006 Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Vi betragter 4699 personer fra Framingham-studiet. Der er oplysninger om follow-up

Læs mere

Regressionsanalyser. Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer.

Regressionsanalyser. Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer. Regressionsanalyser Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer. Hvilke faglige problemer kan man løse vha. regressionsanalyser? 1 Regressionsanalyser Det primære problem

Læs mere

MPH specialmodul Epidemiologi og Biostatistik

MPH specialmodul Epidemiologi og Biostatistik MPH specialmodul Epidemiologi og Biostatistik Kvantitative udfaldsvariable 23. maj 2011 www.biostat.ku.dk/~sr/mphspec11 Susanne Rosthøj (Per Kragh Andersen) 1 Kapitelhenvisninger Andersen & Skovgaard:

Læs mere

Faculty of Health Sciences. Styrkeberegninger Poisson regression Overlevelsesanalyse

Faculty of Health Sciences. Styrkeberegninger Poisson regression Overlevelsesanalyse Faculty of Health Sciences Styrkeberegninger Poisson regression Overlevelsesanalyse Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Forsøgsplanlægning

Læs mere

2 Epidemiologi og biostatistik. Uge 5, mandag 26. september 2005 Michael Væth, Institut for Biostatistik

2 Epidemiologi og biostatistik. Uge 5, mandag 26. september 2005 Michael Væth, Institut for Biostatistik ... september 1 Epidemiologi og biostatistik. Uge, mandag. september Michael Væth, Institut for Biostatistik. Ikke parametrisk statistiske test : Analyse af overlevelsesdata (ventetidsdata) Censurering

Læs mere

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven. PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Eksamensopgave E05 Socialklasse og kronisk sygdom Data: Tværsnitsundersøgelse fra 1986 Datamaterialet indeholder: Køn, alder, Højest opnåede

Læs mere

Økonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol

Økonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol Økonometri: Lektion 5 Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol 1 / 35 Veksekvirkning: Motivation Vi har set på modeller som Price

Læs mere

Logistisk Regression - fortsat

Logistisk Regression - fortsat Logistisk Regression - fortsat Likelihood Ratio test Generel hypotese test Modelanalyse Indtil nu har vi set på to slags modeller: 1) Generelle Lineære Modeller Kvantitav afhængig variabel. Kvantitative

Læs mere

Statistiske Modeller 1: Kontingenstabeller i SAS

Statistiske Modeller 1: Kontingenstabeller i SAS Statistiske Modeller 1: Kontingenstabeller i SAS Jens Ledet Jensen October 31, 2005 1 Indledning Som vist i Notat 1 afsnit 13 er 2 log Q for et test i en multinomialmodel ækvivalent med et test i en poissonmodel.

Læs mere

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression Multipel Linear Regression Repetition Partiel F-test Modelsøgning Logistisk Regression Test for en eller alle parametre I jagten på en god statistisk model har vi set på følgende to hypoteser og tilhørende

Læs mere

OR stiger eksponentielt med forskellen i BMI. kompliceret model svær at forstå og analysere

OR stiger eksponentielt med forskellen i BMI. kompliceret model svær at forstå og analysere Epidemiologi og biostatistik. Uge 5, torsdag 5. september 003 Morten Frydenberg, Institut for Biostatistik. 1 Analyse af overlevelsesdata (ventetidsdata) Censurering (højre + andet) Kaplan-Meyer kurver

Læs mere

OR stiger eksponentielt med forskellen i BMI komplicet model svær at forstå og analysere simpel model

OR stiger eksponentielt med forskellen i BMI komplicet model svær at forstå og analysere simpel model Epidemiologi og biostatistik. Uge 5, torsdag. marts 1 Morten Frydenberg, Institut for Biostatistik. 1 Analyse af overlevelsesdata (ventetidsdata) Censurering (højre + andet) Kaplan-Meyer kurver Det statistiske

Læs mere

Logistisk regression

Logistisk regression Logistisk regression Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk 21. marts 2013 Dagens program Chi-i-anden (χ 2 )-testet Sandsynligheder,

Læs mere

Opgavebesvarelse, logistisk regression

Opgavebesvarelse, logistisk regression Opgavebesvarelse, logistisk regression Data ligger i rop.xls på kursushjemmesiden: http://staff.pubhealth.ku.dk/ jufo/courses/logistic/ Når du har gemt data på din computer, kan det indlæses i SAS med

Læs mere

Faculty of Health Sciences. Basal Statistik. Logistisk regression mm. Lene Theil Skovgaard. 5. marts 2018

Faculty of Health Sciences. Basal Statistik. Logistisk regression mm. Lene Theil Skovgaard. 5. marts 2018 Faculty of Health Sciences Basal Statistik Logistisk regression mm. Lene Theil Skovgaard 5. marts 2018 1 / 22 APPENDIX vedr. SPSS svarende til diverse slides: To-gange-to tabeller, s. 3 Plot af binære

Læs mere

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17 nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse

Læs mere

Økonometri 1. Dummyvariabler 13. oktober Økonometri 1: F10 1

Økonometri 1. Dummyvariabler 13. oktober Økonometri 1: F10 1 Økonometri 1 Dummyvariabler 13. oktober 2006 Økonometri 1: F10 1 Dagens program Dummyvariabler i den multiple regressionsmodel (Wooldridge kap. 7.3-7.6) Dummy variabler for kvalitative egenskaber med flere

Læs mere

Uge 13 referat hold 4

Uge 13 referat hold 4 Uge 13 referat hold 4 Gruppearbejde 1a: Er variablen kvotient inkluderet på en hensigtsmæssig måde? Der er to problemer med kvotient: 1) Den er trunkeret ved 6.9 og 10.0, løsningen er at indføre dummyer

Læs mere

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet

Læs mere

Statistik Lektion 16 Multipel Lineær Regression

Statistik Lektion 16 Multipel Lineær Regression Statistik Lektion 6 Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk

Læs mere

Overlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere.

Overlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere. Overlevelse efter AMI Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Diabetes VF (Venticular fibrillation) WMI (Wall motion index) CHF (Cardiac Heart Failure) Køn og alder betragtes

Læs mere

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller Type I og type II fejl Type I fejl: forkast når hypotese sand. α = signifikansniveau= P(type I fejl) Program (8.15-10): Hvis vi forkaster når Z < 2.58 eller Z > 2.58 er α = P(Z < 2.58) + P(Z > 2.58) =

Læs mere

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Motiverende eksempel Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning

Læs mere

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Motiverende eksempel Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning

Læs mere

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logisitks Regression: Repetition Y {0,} binær afhængig variabel X skala forklarende variabel π P( Y X x) Odds(Y X x) π /(-π

Læs mere

Sandsynlighedsregning 6. forelæsning Bo Friis Nielsen

Sandsynlighedsregning 6. forelæsning Bo Friis Nielsen Sandsynlighedsregning 6. forelæsning Bo Friis Nielsen Matematik og Computer Science Danmarks Tekniske Universitet 2800 Kgs. Lyngby Danmark Email: bfn@dtu.dk Dagens emner: Afsnit 4.2, 4.3 og 4.4 Poissonprocessen/eksponentialfordelingen

Læs mere

Logistisk regression. Statistik Kandidatuddannelsen i Folkesundhedsvidenskab

Logistisk regression. Statistik Kandidatuddannelsen i Folkesundhedsvidenskab Logistis regression Statisti Kandidatuddannelsen i Folesundhedsvidensab Multipel logistis regression Antagelser: Binære observationer (Y i, i=,.,n) f.es Ja/Nej Høj/Lav Død/Levende Kodet: / 0 Y i uafhængige

Læs mere

Postoperative komplikationer

Postoperative komplikationer Løsninger til øvelser i kategoriske data, oktober 2008 1 Postoperative komplikationer Udgangspunktet for vurdering af den ny metode må være en nulhypotese om at der er samme komplikationshyppighed, 20%.

Læs mere

Opgavebesvarelse vedr. overlevelsesanalyse

Opgavebesvarelse vedr. overlevelsesanalyse Opgavebesvarelse vedr. overlevelsesanalyse Opgaven går ud på at vurdere effekten af azathioprine på overlevelsen hos 216 patienter med primær biliær cirrhose (PBC), ref. Christensen et al. (1985). Data

Læs mere

Øvelse 7: Aktuar-tabeller, Kaplan-Meier kurver og log-rank test

Øvelse 7: Aktuar-tabeller, Kaplan-Meier kurver og log-rank test Øvelse 7: Aktuar-tabeller, Kaplan-Meier kurver og log-rank test Formålet med øvelsen er at analysere risikoen for død forbundet med forskelligt alkoholforbrug. I denne øvelse skal analyserne foretages

Læs mere

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Multipel regression M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Y j 1 X 1j 2 X 2j... m X mj j eller m Y j 0 i 1 i X ij j BEMÆRK! j svarer til individ

Læs mere

Skriftlig eksamen Science statistik- ST501

Skriftlig eksamen Science statistik- ST501 SYDDANSK UNIVERSITET INSTITUT FOR MATEMATIK OG DATALOGI Skriftlig eksamen Science statistik- ST501 Torsdag den 21. januar Opgavesættet består af 5 opgaver, med i alt 13 delspørgsmål, som vægtes ligeligt.

Læs mere

Logistisk regression. Basal Statistik for medicinske PhD-studerende November 2008

Logistisk regression. Basal Statistik for medicinske PhD-studerende November 2008 Logistisk regression Basal Statistik for medicinske PhD-studerende November 2008 Bendix Carstensen Steno Diabetes Center, Gentofte & Biostatististisk afdeling, Københavns Universitet bxc@steno.dk www.biostat.ku.dk/~bxc

Læs mere

Basal statistik. Overlevelsesanalyse. Eksempel: Lungecancer blandt krigsveteraner. Faculty of Health Sciences

Basal statistik. Overlevelsesanalyse. Eksempel: Lungecancer blandt krigsveteraner. Faculty of Health Sciences Faculty of Health Sciences Overlevelsesanalyse Basal statistik Overlevelsesanalyse Lene Theil Skovgaard & Susanne Rosthøj 1. april 2019 Levetider og censurerede observationer Kaplan-Meier kurver Log-rank

Læs mere

Løsning til øvelsesopgaver dag 4 spg 5-9

Løsning til øvelsesopgaver dag 4 spg 5-9 Løsning til øvelsesopgaver dag 4 spg 5-9 5: Den multiple model Vi tilføjer nu yderligere to variable til vores model : Køn og kolesterol SBP = a + b*age + c*chol + d*mand hvor mand er 1 for mænd, 0 for

Læs mere

MPH specialmodul Epidemiologi og Biostatistik

MPH specialmodul Epidemiologi og Biostatistik MPH specialmodul Epidemiologi og Biostatistik Repetition af variansanalyse Overlevelsesanalyse Bestemmelse af stikprøvestørrelse Matchning 30. maj 2011 www.biostat.ku.dk/~sr/mphspec11 Susanne Rosthøj (Per

Læs mere

Løsning til opgave i logistisk regression

Løsning til opgave i logistisk regression Løsning til øvelser i logistisk regression, november 2008 1 Løsning til opgave i logistisk regression 1. Først indlæses data, og vi kan lige sørge for at danne en dummy-variable for cml, som indikator

Læs mere

Lineær regression i SAS. Lineær regression i SAS p.1/20

Lineær regression i SAS. Lineær regression i SAS p.1/20 Lineær regression i SAS Lineær regression i SAS p.1/20 Lineær regression i SAS Simpel lineær regression Grafisk modelkontrol Multipel lineær regression SAS-procedurer: PROC REG PROC GPLOT Lineær regression

Læs mere

Statistik og skalavalidering. Opgave 1

Statistik og skalavalidering. Opgave 1 Statistik og skalavalidering Opgave 1 Opgavens formål: Denne opgave har, ligesom det vil være tilfældet for de fleste andre øvelsesopgaver på dette kursus, flere forskellige formål. For det første et praktisk/teknisk

Læs mere

Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration

Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration Faculty of Life Sciences Program Modelkontrol og prædiktion Claus Ekstrøm E-mail: ekstrom@life.ku.dk Test af hypotese i ensidet variansanalyse F -tests og F -fordelingen. Multiple sammenligninger. Bonferroni-korrektion

Læs mere

Synopsis til eksamen i Statistik

Synopsis til eksamen i Statistik Synopsis til eksamen i Statistik Kandidatuddannelsen i Folkesundhedsvidenskab Københavns Universitet december 2010 Eksamensnummer: 12 Antal anslag: 23.839 (svarende til 9,9 normalsider) - 1 - Indholdsfortegnelse

Læs mere

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse

Læs mere

Dagens Emner. Likelihood teori. Lineær regression (intro) p. 1/22

Dagens Emner. Likelihood teori. Lineær regression (intro) p. 1/22 Dagens Emner Likelihood teori Lineær regression (intro) p. 1/22 Likelihood-metoden M : X i N(µ,σ 2 ) hvor µ og σ 2 er ukendte Vi har, at L(µ,σ 2 ) = ( 1 2πσ 2)n/2 e 1 2σ 2 P n (x i µ) 2 er tætheden som

Læs mere

Statistik Lektion 4. Variansanalyse Modelkontrol

Statistik Lektion 4. Variansanalyse Modelkontrol Statistik Lektion 4 Variansanalyse Modelkontrol Eksempel Spørgsmål: Er der sammenhæng mellem udetemperaturen og forbruget af gas? Y : Forbrug af gas (gas) X : Udetemperatur (temp) Scatterplot SPSS: Estimerede

Læs mere

Adgangsgivende eksamen (udeladt kategori: Matematisk student med matematik på niveau A)

Adgangsgivende eksamen (udeladt kategori: Matematisk student med matematik på niveau A) Økonometri 1 Forår 2003 Ugeseddel 13 Program for øvelserne: Gruppearbejde Opsamling af gruppearbejdet og introduktion af SAS SAS-øvelser i computerkælderen Øvelsesopgave 6: Hvem består første årsprøve

Læs mere

Konfidensintervaller og Hypotesetest

Konfidensintervaller og Hypotesetest Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller

Læs mere

Statistik II 1. Lektion. Analyse af kontingenstabeller

Statistik II 1. Lektion. Analyse af kontingenstabeller Statistik II 1. Lektion Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller Logistisk regression

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Mantel-Haenszel analyser

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Mantel-Haenszel analyser Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Mantel-Haenszel analyser Mantel-Haenszel analyser Sidst lærte vi om stratificerede analyser. I dag kigger vi på et specialtilfælde: både exposure

Læs mere

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl Eksamen 2018 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 20-02-2018 Tid: kl. 09.00-11.00 Bedømmelsesform

Læs mere

1 Regressionsproblemet 2

1 Regressionsproblemet 2 Indhold 1 Regressionsproblemet 2 2 Simpel lineær regression 3 2.1 Mindste kvadraters tilpasning.............................. 3 2.2 Prædiktion og residualer................................. 5 2.3 Estimation

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af

Læs mere

1 Multipel lineær regression

1 Multipel lineær regression Indhold 1 Multipel lineær regression 2 1.1 Regression med 2 eksponeringsvariable......................... 2 1.2 Fortolkning og estimation................................ 3 1.3 AnovaTabel og multipel R

Læs mere

Dynamisk statistisk modellering af vedligeholdelsesbehandling af børn med akut lymfoblastær leukæmi

Dynamisk statistisk modellering af vedligeholdelsesbehandling af børn med akut lymfoblastær leukæmi Dynamisk statistisk modellering af vedligeholdelsesbehandling af børn med akut lymfoblastær leukæmi Susanne Rosthøj 2. oktober 2009 Akut Lymfoblastær Leukæmi (ALL) Årlig forekomst på ca 35 tilfælde i Danmark.

Læs mere

Basal statistik for lægevidenskabelige forskere, forår 2014 Udleveret 4. marts, afleveres senest ved øvelserne i uge 13 (25.

Basal statistik for lægevidenskabelige forskere, forår 2014 Udleveret 4. marts, afleveres senest ved øvelserne i uge 13 (25. Hjemmeopgave Basal statistik for lægevidenskabelige forskere, forår 2014 Udleveret 4. marts, afleveres senest ved øvelserne i uge 13 (25.-27 marts) Garvey et al. interesserer sig for sammenhængen mellem

Læs mere

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 1 Regressionsproblemet 2 Simpel lineær regression Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 3

Læs mere

Forelæsning 11: Kapitel 11: Regressionsanalyse

Forelæsning 11: Kapitel 11: Regressionsanalyse Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

β = SDD xt SSD t σ 2 s 2 02 = SSD 02 f 02 i=1

β = SDD xt SSD t σ 2 s 2 02 = SSD 02 f 02 i=1 Lineær regression Lad x 1,..., x n være udfald af stokastiske variable X 1,..., X n og betragt modellen M 2 : X i N(α + βt i, σ 2 ) hvor t i, i = 1,..., n, er kendte tal. Konkret analyseres (en del af)

Læs mere

Opgavebesvarelse, Basalkursus, uge 3

Opgavebesvarelse, Basalkursus, uge 3 Opgavebesvarelse, Basalkursus, uge 3 Opgave 1: Udskrivning af astma patienter (DGA s. 273) I en randomiseret undersøgelse foretaget af Storr et. al. (Lancet, i, 1987) sammenlignes effekten af en enkelt

Læs mere

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning 1 Multipel regressions model Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning PSE (I17) ASTA - 11. lektion

Læs mere

8.2 Statistiske analyse af hver enkelt indikator

8.2 Statistiske analyse af hver enkelt indikator 8.2 Statistiske analyse af hver enkelt indikator Basale ideer De avancerede statistiske metoder, som anvendes i denne rapport, fokuserer primært på vurdering af eventuel geografisk heterogenitet på regions-,

Læs mere

Basal statistik. Overlevelsesanalyse. Eksempel: Lungecancer blandt krigsveteraner. Faculty of Health Sciences

Basal statistik. Overlevelsesanalyse. Eksempel: Lungecancer blandt krigsveteraner. Faculty of Health Sciences Faculty of Health Sciences Overlevelsesanalyse Basal statistik Overlevelsesanalyse Lene Theil Skovgaard 5. november 2018 Levetider og censurerede observationer Kaplan-Meier kurver Log-rank test Cox regression

Læs mere

1 Multipel lineær regression

1 Multipel lineær regression 1 Multipel lineær regression Regression med 2 eksponeringsvariable Fortolkning og estimation AnovaTabel og multipel R 2 Ensidet variansanalyse: Dummy kodning Kovariansanalyse og effektmodifikation Tosidet

Læs mere

Kvantitative metoder 2

Kvantitative metoder 2 Kvalitative egenskaber og dummyvariabler Kvantitative metoder 2 Dummyvariabler 28. marts 2007 Vi har (hovedsagligt) set på kvantitative variabler (løn, priser, forbrug, indkomst, )... Men hvad med kvalitative

Læs mere

Log-lineære modeller. Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres.

Log-lineære modeller. Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres. Log-lineære modeller Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres. Kontingenstabel Contingency: mulighed/tilfælde Kontingenstabel: antal observationer (frekvenser)

Læs mere

Kursus i anvendt onkologisk statistik og forskningsmetodik Dag 2. Jon K. Bjerregaard

Kursus i anvendt onkologisk statistik og forskningsmetodik Dag 2. Jon K. Bjerregaard Kursus i anvendt onkologisk statistik og forskningsmetodik Dag 2 Jon K. Bjerregaard Dag 2 09.00 12.00 Opfriskning fra sidst Gennemgang af artikler Sammenligning af en eller flere grupper Overlevelsesanalyse

Læs mere

Epidemiologi og Biostatistik. Mogens Erlandsen, Institut for Biostatistik Uge 1, tirsdag d. 5. februar 2002

Epidemiologi og Biostatistik. Mogens Erlandsen, Institut for Biostatistik Uge 1, tirsdag d. 5. februar 2002 Epidemiologi og Biostatistik Mogens Erlandsen, Institut for Biostatistik Uge 1, tirsdag d. 5. februar 2002 1 Statestik Det hedder det ikke! Statistik 2 Streptomycin til behandling af lunge-tuberkulose?

Læs mere

Tema. Dagens tema: Indfør centrale statistiske begreber.

Tema. Dagens tema: Indfør centrale statistiske begreber. Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i

Læs mere

Logistisk regression

Logistisk regression Logistisk regression Test af antagelsen om lineære effekter Modelkonstruktion og modelsøgning Hvilke variable og hvilke interaktioner skal inkluderes i regressionsmodellerne? 1 Logistiske regressionsmodeller

Læs mere