Introduktion til overlevelsesanalyse

Størrelse: px
Starte visningen fra side:

Download "Introduktion til overlevelsesanalyse"

Transkript

1 Faculty of Health Sciences Introduktion til overlevelsesanalyse Cox regression III Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet Kursushjemmeside:

2 Program for dag 4 Repetition to kategoriske variable: Den additive model Interaktion En kontinuert variabel Interaktion mellem en kategorisk og en kontinuert variabel Forsinket indgang Proportional hazards antagelsen Stratificering Modelkontrol : Simple grafiske metoder Gennemgående eksempel: Leukæmi patienter i remission. Dagens gennemgang svarer til Kleinbaum & Klein rest kapitel 3, kapitel 4 (I-V) og kapitel 5. 2 / 44

3 To kategoriske variable Vi ønsker at beskrive effekten af behandling justeret for (kategoriseret) logwbc. Cox modellen bliver 1 placebo, logwbc i < 2.37 exp(β 2 ) placebo, logwbc i [2.37; 3.23) exp(β 3 ) placebo, logwbc i λ i (t) = λ 0 (t) exp(β 1 ) behandling, logwbc i < 2.37 exp(β 1 + β 2 ) behandling, logwbc i [2.37; 3.23) exp(β 1 + β 3 ) behandling, logwbc i = λ 0 (t) exp(β 1 behandling i + β 2 {WBC-grp 2} i + β 3 {WBC-grp 3} i ) Fortolkning af regressionsparametrene: exp(β 1 ) er HR for behandling vs placebo for fastholdt WBC. exp(β 2 ) er HR for WBC-gruppe 2 vs WBC-gruppe 1 for fastholdt behandling. Tilsvarende for exp(β 3 ). 3 / 44

4 Den additive model Vi kan illustrere modellen i følgende tabel på log-hazard-skalaen: Kategoriseret logwbc Z = 1 Z = 2 Z = 3 Placebo 0 β 2 β 3 Behandling β 1 β 1 + β 2 β 1 + β 3 Forskellen mellem placebo og behandling er den samme for hvert niveau af logwbc-gruppe. Forskellen mellem logwbc-grupperne er den samme for hver behandlingsgruppe. Denne model kaldes også den additive model. 4 / 44

5 Interaktion mellem kategoriske variable Den additive model Kategoriseret logwbc Z = 1 Z = 2 Z = 3 Placebo 0 β 2 β 3 Behandling β 1 β 1 + β 2 β 1 + β 3 forudsætter, at der ikke er interaktion (vekselvirkning). Interaktionsmodellen tillader at effekten af behandling afhænger af logwbc: Kategoriseret logwbc Z = 1 Z = 2 Z = 3 Placebo 0 β 2 β 3 Behandling β 1 β 1 + β 2 + β 4 β 1 + β 3 + β 5 dvs. en model hvor parametrene varierer fuldstændigt frit. 5 / 44

6 En kontinuert forklarende variabel Cox-modellen med WBC som kontinuert forklarende variabel er λ i (t) = λ 0 (t) exp(βwbc i ). Sammenlignes to patienter med en forskel på 1 i WBC, når det laveste er referencen, fås HR = λ 0(t) exp(β(wbc + 1) λ 0 (t) exp(βwbc) = exp(β). Dvs fortolkningen er : for hver gang WBC øges med 1, skal HR ganges med exp(β). 6 / 44

7 Log-hazard for en kontinuert variabel Cox-modellen på log-hazard-skala lyder log(λ i (t)) = log(λ 0 (t)) + βwbc i dvs. effekten af WBC er lineær på log-hazard-funktionen: baseline log hazard WBC 7 / 44

8 logwbc som forklarende variabel Sidst nåede vi frem til Cox modellen som inkluderer WBC på log-skala. Vi fandt: > cox10<-coxph(surv(time,event) ~ logwbc) > summary(cox10) Call: coxph(formula = Surv(time, event) ~ logwbc) n= 42, number of events= 30 coef exp(coef) se(coef) z Pr(> z ) logwbc e-08 *** --- Signif. codes: 0 *** ** 0.01 * exp(coef) exp(-coef) lower.95 upper.95 logwbc Concordance= (se = ) Rsquare= (max possible= ) Likelihood ratio test= on 1 df, p=3.577e-09 Wald test = on 1 df, p=3.294e-08 Score (logrank) test = on 1 df, p=1.433e-09 8 / 44

9 Fortolkning af effekten af WBC på log-skala HR øges med en faktor for hver gang logwbc øges med 1. Hvad betyder det? det vil sige at 1 = log(wbc 1 ) log(wbc 2 ) = log( WBC 1 WBC 2 ) WBC 1 WBC 2 = exp(1) = Dermed er fortolkningen, at HR øges med en faktor for hver gang WBC øges med en faktor Løsning: Brug logaritme med base 2 i stedet. 9 / 44

10 Cox-modellen med log 2 (WBC) > log2wbc<-log2(exp(logwbc)) > cox11<-coxph(surv(time,event) ~ log2wbc) > summary(cox11) Call: coxph(formula = Surv(time, event) ~ log2wbc) n= 42, number of events= 30 coef exp(coef) se(coef) z Pr(> z ) log2wbc e-08 *** --- Signif. codes: 0 *** ** 0.01 * exp(coef) exp(-coef) lower.95 upper.95 log2wbc Concordance= (se = ) Rsquare= (max possible= ) Likelihood ratio test= on 1 df, p=3.577e-09 Wald test = on 1 df, p=3.294e-08 Score (logrank) test = on 1 df, p=1.433e-09 Ved en fordobling af WBC øges HR med en faktor 3.13 (95% KI ). Eller : risikoen for tilbagefald mere end 3-dobles ved en fordobling af WBC. Bemærk at teststørrelserne og p-værdierne er uændrede. 10 / 44

11 En binær og en kontinuert forklarende variabel Vi kan nu vurdere effekten af behandling justeret for log 2 WBC. Modellen lyder på log-hazard skalaen log(λ i (t)) = log(λ 0 (t)) + β 1 behandling i + β 2 log 2 (WBC i ) dvs. effekten af log 2 WBC er lineær på log-hazard-funktionen, men vi tillader forskelligt niveau (intercept) afhængigt af behandlingsgruppe: baseline log hazard Placebo Behandling log2wbc 11 / 44

12 En binær og en kontinuert forklarende variabel i R > treatment<-1-placebo > cox12<-coxph(surv(time,event) ~ factor(treatment)+log2wbc) > summary(cox12) Call: coxph(formula = Surv(time, event) ~ factor(treatment) + log2wbc) n= 42, number of events= 30 coef exp(coef) se(coef) z Pr(> z ) factor(treatment) ** log2wbc e-07 *** --- Signif. codes: 0 *** ** 0.01 * exp(coef) exp(-coef) lower.95 upper.95 factor(treatment) log2wbc Concordance= (se = ) Rsquare= (max possible= ) Likelihood ratio test= on 2 df, p=7.187e-11 Wald test = 33.6 on 2 df, p=5.061e-08 Score (logrank) test = on 2 df, p=9.921e / 44

13 Interaktion mellem binær og kontinuert variabel Interaktionsmodellen lyder (med placebo som baseline) λ i (t) = { λ0 (t) exp(β 1 + β 2 log 2 WBC i ) hvis i får 6MP λ 0 (t) exp( β 3 log 2 WBC i ) hvis i får placebo svarende til at vi har to ikke-parallelle linier på log-hazard-skalaen: baseline log hazard Placebo Behandling log2wbc 13 / 44

14 Fortolkning af interaktionen λ i (t) = { λ0 (t) exp(β 1 + β 2 log 2 WBC i ) hvis i får 6MP λ 0 (t) exp( β 3 log 2 WBC i ) hvis i får placebo I denne model er HR for behandling vs placebo: exp(β 1+β 2log 2 WBC) exp(β 3log 2 WBC) log 2 WBC+1 vs log 2 WBC: exp(β 1+β 2(log 2 WBC+1)) exp(β 1+β 2log 2 WBC) exp(β 3(log 2 WBC+1)) exp(β 3log 2 WBC) = exp(β 1 + (β 2 β 3 )log 2 WBC) = exp(β 2 ) hvis behandlet = exp(β 3 ) hvis placebo. Dvs: Effekten af behandling afhænger af WBC. Effekten af WBC afhænger af behandlingsgruppe. 14 / 44

15 Interaktion mellem binær og kontinuert variabel I interaktionsmodellen λ i (t) = { λ0 (t) exp(β 1 + β 2 log 2 WBC i ) hvis i får 6MP λ 0 (t) exp( β 3 log 2 WBC i ) hvis i får placebo (1) lyder hypotesen om manglende interaktion H 0 : β 2 = β 3. Vi kan omparameterisere modellen til λ i (t) = { λ0 (t) exp(β 1 + β 2 log 2 WBC i ) hvis i får 6MP λ 0 (t) exp( (β 2 + β 3 ) log 2 WBC i ) hvis i får placebo (2) hvorved hypotesen lyder H 0 : β 3 = / 44

16 Illustration af interaktion vs den additive model baseline log hazard Placebo Behandling Placebo H_0 Behandling H_ logwbc På log-hazard-skalaen svarer manglende interaktion (H 0 ) til parallelle linier. 16 / 44

17 Interaktionsmodellen i R Model (1): > cox13<-coxph(surv(time,event) ~ factor(treatment)+factor(treatment):log2wbc) > summary(cox13) Call: coxph(formula = Surv(time, event) ~ factor(treatment) + factor(treatment):log2wbc) n= 42, number of events= 30 coef exp(coef) se(coef) z Pr(> z ) factor(treatment) factor(treatment)0:log2wbc e-05 *** factor(treatment)1:log2wbc e-05 *** --- Model (2): > cox14<-coxph(surv(time,event) ~ factor(treatment)+log2wbc+factor(treatment)*log2wbc) > summary(cox14) Call: coxph(formula = Surv(time, event) ~ factor(treatment) + log2wbc + factor(treatment) * log2wbc) n= 42, number of events= 30 coef exp(coef) se(coef) z Pr(> z ) factor(treatment) log2wbc e-05 *** factor(treatment)1:log2wbc / 44

18 Flere variable Vi kan vurdere effekten af behandling justeret for køn og logwbc: > cox15<-coxph(surv(time,event) ~ factor(treatment)+log2wbc+factor(female)) > summary(cox15) Call: coxph(formula = Surv(time, event) ~ factor(treatment) + log2wbc + factor(female)) n= 42, number of events= 30 coef exp(coef) se(coef) z Pr(> z ) factor(treatment) ** log2wbc e-07 *** factor(female) Hvad er baselinegruppen i denne model? Hvilken model skal vi vælge som den endelige model? 18 / 44

19 Forsinket indgang Kun de individer, for hvilken en hændelse er indtruffet, bliver observeret. Eksempel: Vedligeholdelsesbehandling af børn med leukæmi. 0 Start VB Tid 0 er diagnosedatoen, men patienterne starter ikke vedligeholdelsesbehandlingen samtidigt. 19 / 44

20 Illustration af forsinket indgang Vedligeholdelsesbehandling af ALL Patient År siden diagnose 20 / 44

21 Håndtering af forsinket indgang For hvert dødstidspunkt t i holdes øje med risikomængden R(t i ) (mængden af patienter under risiko for død umiddelbart før t i ). Udtrykket for den partielle likelihood for Cox-modellen er uændret L(β) = k i=1 exp(βx i ) j R(t i ) exp(βx j), men forskellen er, at patienterne tillades at træde ind og ikke kun ud af studiet på forskellige tidspunkter. Tilsvarende for Kaplan-Meier-estimatoren. Forsinket indgang er let at styre i R, idet vi definerer vores respons ved: Surv(indgang,udgang,event). 21 / 44

22 Cox modellens antagelser Den generelle Cox model er λ i (t) = λ 0 (t) exp(β 1 X i1 + β 2 X i2 + + β p X ip ) når vi inkluderer p forklarende variable i modellen. Antagelserne er 1) effekten af de forklarende variable er additiv og lineær på log-hazard-skalaen 2) kun baseline hazard afhænger af tiden t, dvs. at den relative risiko imellem to individer er konstant over tid (proportional hazards). Vi er nødt til at kontrollere om disse antagelser er rimelige. Sidst så vi på 1) og vi vil nu gå videre med 2). 22 / 44

23 Proportionale hazards med én forklarende variabel For Cox-modellen indeholdende én forklarende variabel λ i (t) = λ 0 (t) exp(βi(patient i behandlet)) er proportionalitetsantagelsen at hazard ratio for i behandlet vs j placebo λ i (t) λ j (t) = exp(β) ikke afhænger af tiden t dvs. at λ i (t) λ j (t) med mindre f er en konstant. f (t) 23 / 44

24 PH med flere forklarende variable For den generelle Cox-model indeholdende flere forklarende variable λ i (t) = λ 0 (t) exp(β 1 X i1 + β 2 X i β p X ip ) er proportionalitetsantagelsen at hazard ratio mellem individ i og j er konstant λ i (t) λ j (t) = exp(β 1 (X i1 X j1 ) β p (X ip X jp )), dvs. ikke afhænger af tiden t. Bemærk at dette svarer til at vi skal have PH mellem grupper for de kategoriske variable. 24 / 44

25 Et eksempel på en stratificeret model Vedligeholdelsesbehandling af børn med ALL, stratificeret på risikogruppe. Intermediær risiko Standard risiko hazard rate År siden ophør af vedligeholdelsesbehandling 25 / 44

26 Hvorfor bekymre sig om PH-antagelsen? Det er vigtigt at undersøge proportionalitetsantagelsen: Hvis PH ikke er opfyldt vil estimatet fra Cox regressionen være en gennemsnitlig effekt over tid. Hvis vi ikke tager højde for en eventuel tidsafhængig effekt kan der opstå bias for nogle af de øvrige estimerede effekter i modellen. Det kan være vigtigt at forstå, hvordan effekten varierer over tid, idet det kan gøre os klogere på de mekanismer, som genererer data. I nogle sammenhænge kan den gennemsnitlige effekt dog være en interessant / acceptabel beskrivelse af effekten - men det er vigtigt at kende til konkvenserne af at ignorere en tidsafhængig effekt. 26 / 44

27 Manglende PH med en forklarende variabel Når Cox-modellen indeholdende én forklarende variabel λ i (t) = { λ0 (t) hvis i får placebo λ 0 (t) exp(β) hvis i får behandling ikke er rimelig er en mulighed at lade hazarden variere fuldstændigt frit i hver kategori λ i (t) = { λ01 (t) hvis i får placebo λ 02 (t) hvis i får behandling Vi har nu ingen model og må estimere hazarden (snarere overlevelseskurverne) vha Kaplan-Meier metoden. Kategorierne kaldes nu for strata (ental: stratum). 27 / 44

28 Manglende PH med to forklarende variable Cox-modellen med behandling og log 2 WBC lyder λ i (t) = λ 0 (t) exp(β 1 I(patient i behandlet) + β 2 log 2 WBC i ). Antag at PH kun er opfyldt for log 2 WBC, dvs at λ i (t) λ j (t) = exp(β 2 (log 2 WBC i log 2 WBC j )) for fastholdt behandlingsgruppe mens λ i (t) λ j (t) = f (t) exp(β 1 ). for fastholdt WBC. En mulig løsning er at stratificere på behandlingsgruppe: 28 / 44 λ i (t) = { λ01 (t) exp(β log 2 (WBC)) hvis i får placebo λ 02 (t) exp(β log 2 (WBC)) hvis i får behandling

29 Stratificering Den generelle stratificerede model lyder λ i (t) = λ 0k (t) exp(β 1 X i1 + β p X ip ) hvor hvert strata k = 1,..., K har sin egen baseline hazard. Bemærk at der ikke er interaktion mellem strata-variablen og de øvrige variable (bør undersøges). Fordele og ulemper ved stratificering: 29 / 44 Nyttigt når vi er nødt til at inkludere nuisance variable i modellen og er ligeglade med at beskrive effekten af variablene. Ikke hensigtsmæssigt hvis variablen er af primær interesse (eg. behandling). Vi kan ikke teste om strata-variablen har en effekt på overlevelsen.

30 Den stratificerede Cox-model i R I R angives en strata-variabel vha strata: > cox14<-coxph(surv(time,event) ~ strata(treatment)+log2wbc) > summary(cox14) Call: coxph(formula = Surv(time, event) ~ strata(treatment) + log2wbc) n= 42, number of events= 30 coef exp(coef) se(coef) z Pr(> z ) log2wbc e-06 *** --- Signif. codes: 0 *** ** 0.01 * exp(coef) exp(-coef) lower.95 upper.95 log2wbc Concordance= (se = ) Rsquare= (max possible= ) Likelihood ratio test= on 1 df, p=2.71e-07 Wald test = on 1 df, p=2.32e-06 Score (logrank) test = on 1 df, p=3.152e / 44

31 Simpel grafisk modelkontrol Observeret (KM) vs forventet (Cox) overlevelse: Behandling Grupperet WBC Køn OBS! Jævnfør øvelserne dag / 44

32 Grafisk modelkontrol via log(-log(overlevelse)) For Cox-modellen er overlevelseskurven givet den forklarende variabel X i = I(patient i behandlet) { S(t X i ) = S 0 (t) exp(βx i) S0 (t) = exp(β) hvis i får behandling S 0 (t) hvis i får placebo. Det betyder at log( log(s(t X i ))) = log( log(s 0 (t))) + βx i svarende til at differensen log( log(s(t X i ))) log( log(s(t X j ))) = β(x i X j ) mellem to individer i og j ikke afhænger af tiden t, dvs at overlevelseskurverne er parallelle som funktion af t. log(-log( ))-funktionen kaldes også for cloglog-funktionen. 32 / 44

33 cloglog-kurver for kategoriske variable Med kategoriske forklarende variable kan vi estimere overlevelseskurven for hvert niveau af variablen ved Kaplan-Meier-kurven og plotte log(-log(s))-kurverne i ét plot: Behandling logwbc Placebo Behandling Lav Mellem Høj Køn Mand Kvinde OBS! Bemærk log-skala på x-aksen (default i R) / 44

34 Simultan evaluering af PH-antagelsen Vi bør evaluere PH-antagelsen simultant (samtidigt) når vi har flere forklarende variable. Kategoriser de kontinuerte og se på cloglog-kurverne for alle kombinationer af de forklarende variable: Uoverskueligt med flere variable. Nogle strata har meget få events, hvorfor det bliver svært at sammenligne kurverne. 34 / 44

35 Simultan evaluering af PH vha Cox-modellen Vi kan kontrollere PH-antagelsen for én variabel i en Cox model, hvor vi har justeret for de øvrige variable: 1) Stratificér Cox-modellen på variablen, for hvilken PH skal kontrolleres. 2) Estimér de justerede overlevelseskurver for hvert stratum. Disse afhænger af de øvrige kovariatværdier vælg eventuelt gennemsnitlige / median værdier. 3) Plot cloglog-kurver for hvert stratum som funktion af t (evt log(t)) og vurdér om linierne er parallelle. Udfør 1)-3) for alle variablene. Derved kan vi vurdere, om der skal stratificeres på en eller flere variable. 35 / 44

36 Justerede cloglog-kurver i R Vi vil vurdere PH for køn i remissionsdata. Den stratificerede model inkluderende alle variable lyder: λ i (t) = { λ01 (t) exp(β 1 beh i + β 2 log 2 WBC i ) hvis i er mand λ 02 (t) exp(β 1 beh i + β 2 log 2 WBC i ) hvis i er kvinde. hvor beh i =1 hvis i er behandlet, 0 ellers. I R fittes modellen, overlevelseskurverne bestemmes og cloglog-kurverne plottes med: cox15<-coxph(surv(time,event) ~ strata(female)+factor(treatment)+log2wbc) surv15<-survfit(cox15,newdata=data.frame(treatment=0,log2wbc=mean(log2wbc))) plot(surv15,fun="cloglog",lty=1:2,lwd=2) 36 / 44

37 Proportionalitetsantagelsen for køn er stadig ikke opfyldt: / 44

38 Mulige løsninger på manglende PH Der kan tages højde for afvigelse fra PH-antagelsen på følgende måder: 1) Stratificering. 2) Benyt en anden model (e.g. Accelerated Failure Time, additiv hazard model). 3) Inddeling af tidsaksen. Måske holder PH-antagelsen over mindre tidsintervaller. Lav separate analyser. 38 / 44

39 4) Vi kan acceptere Cox-modellen med en tidsafhængig effekt λ i (t) = λ 0 (t) exp(β(t)x i ) og forsøge at beskrive denne effekt ved at tilføje en tidsafhængig version af X. F.eks. kan vi formulere en tidsafhængig effekt ved β 1 X 1 + β 2 X 2 (t) = { β1 X 1 t < 1 år (β 1 + β 2 )X 1 t 1 år hvor X 2 (t) = X 1 I(t 1 år) er den tidsafhængige variabel. 39 / 44

40 4) Fortsat: Måske øges / reduceres effekten lineært med tiden svarende til modellen λ i (t) = λ 0 (t) exp(β(t)x i ) = λ 0 (t) exp((β 1 + β 2 t)x i ) som kan beskrives vha. den tidsafhængige variabel X 2 (t) = t X β 1 X + β 2 X 2 (t) = β 1 X + β 2 tx = (β 1 + β 2 t)x. For at kunne formulere en sådan model er vi nødt til at undersøge hvordan den tidsafhængige effekt ser ud. (Vi undersøger dette næste gang vha. residualer). Håndteringen af tidsafhængige variable i R kræver lidt programmering (men er principielt simpelt nok). Se KK kapitel / 44

41 Øvelser PBC-data (Primary Biliary Cirrhosis). Vi vil her forsøge at beskrive risikoen for død (status=2) vha følgende forklarende variable: Alder, køn, edema, bilirubin, prothrombin time, albumin. 1) Aktivér datasættet pbc i survival-pakken. Find eventuelt beskrivelser af dette datasæt ved at søge på nettet. 2) Formulér en passende model: Overvej i hvilken form de kontinuerte variable skal inkluderes. Vurdér hvordan edema skal inkluderes (lav evt. et trendtest). 3) Afhænger effekten af edema af køn? 4) Afhænger effekten af de kontinuerte variable af køn? Kan man forestille sig andre mulige interaktioner? I så fald, udfør et passende test. 41 / 44

42 5) Lav et overall test for effekten af bilirubin, prothrombin og albumin. 6) Prøv at formulere (i ord), hvad modellen fortæller. Når du beskriver effekten af bilirubin, så giv et estimat for HR for en patient med bili=3.4 vs bili=0.8 (ens på de øvrige variable). Disse tal er fundet ved kommandoen quantile(bili,c(.25,.75)) Hvad beskriver denne HR? Find også et KI. (Beregn det selv i hånden. Kan du ikke huske regnereglerne, se evt. vink til øvelserne fra sidste gang, TTP spg 4). Hvor meget større er risikoen for en patient, som er et årti ældre end en anden patient (men sammenlignelig på de øvrige variable)? Bestem et KI. 7) Kontroller PH-antagelsen for alle variablene. 42 / 44

43 Akut Lymfoblastær Leukæmi: I blev 538 nordiske børn med ALL randomiseret til traditionel vedligeholdelsesbehandling (VB) eller pharmakologisk baseret VB. Vi har her nogle data til rådighed for 468 af børnene med oplysninger om st sl recidiv pige kontrol wbc tpmtsnit start på VB EOF i dage 1=recidiv, 0 ellers 1=pige, 0=dreng 1=traditionel, 0=pharmakologi wbc ved diagnose gennemsnit TPMT-værdi (aktivitet af enzym) Data ligger på kursushjemmesiden i ALL.csv. 1) Formuler en model og kontroller den (dvs check PH, linearitet og vekselvirkninger). Er der nogle sammenhænge i disse data, som man ikke umiddelbart ville forvente? 43 / 44

44 2) Kør den model, du er nået frem til, stratificeret på risikogruppe. Test om effekten af tpmtsnit er den samme over de tre strata. 3) Sammenlign resultaterne med Schmiegelow et al., JCO (2003), som kan hentes som pdf fra Fit din model med den samme parameterisering af køn og randomiseringsgruppe. Hvorfor tror du, at man har valgt netop denne parameterisering? 44 / 44

Introduktion til overlevelsesanalyse

Introduktion til overlevelsesanalyse Faculty of Health Sciences Introduktion til overlevelsesanalyse Cox regression II Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Kursushjemmeside:

Læs mere

Introduktion til overlevelsesanalyse

Introduktion til overlevelsesanalyse Faculty of Health Sciences Introduktion til overlevelsesanalyse Cox regression Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Kursushjemmeside:

Læs mere

Vi vil analysere effekten af rygning og alkohol på chancen for at blive gravid ved at benytte forskellige Cox regressions modeller.

Vi vil analysere effekten af rygning og alkohol på chancen for at blive gravid ved at benytte forskellige Cox regressions modeller. Løsning til øvelse i TTP dag 3 Denne øvelse omhandler tid til graviditet. Et studie vedrørende tid til graviditet (Time To Pregnancy = TTP) inkluderede 423 par i alderen 20-35 år. Parrene blev fulgt i

Læs mere

Dag 6: Interaktion. Overlevelsesanalyse

Dag 6: Interaktion. Overlevelsesanalyse Dag 6: Interaktion. Overlevelsesanalyse How does CHD depend on gender and hypertension? Males: hypertension chd01 Females: Frequency Row Pct 0 1 Total ---------+--------+--------+ 0 352 95 447 78.75 21.25

Læs mere

Overlevelsesanalyse. Faculty of Health Sciences

Overlevelsesanalyse. Faculty of Health Sciences Faculty of Health Sciences Overlevelsesanalyse Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Program Overlevelsesdata Kaplan-Meier estimatoren

Læs mere

Introduktion til overlevelsesanalyse

Introduktion til overlevelsesanalyse Faculty of Health Sciences Introduktion til overlevelsesanalyse Kaplan-Meier estimatoren Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk

Læs mere

Lineær og logistisk regression

Lineær og logistisk regression Faculty of Health Sciences Lineær og logistisk regression Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Dagens program Lineær regression

Læs mere

Faculty of Health Sciences. Logistisk regression: Kvantitative forklarende variable

Faculty of Health Sciences. Logistisk regression: Kvantitative forklarende variable Faculty of Health Sciences Logistisk regression: Kvantitative forklarende variable Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Sammenhæng

Læs mere

Faculty of Health Sciences. Miscellaneous: Styrkeberegninger Overlevelsesanalyse Analyse af matchede studier

Faculty of Health Sciences. Miscellaneous: Styrkeberegninger Overlevelsesanalyse Analyse af matchede studier Faculty of Health Sciences Miscellaneous: Styrkeberegninger Overlevelsesanalyse Analyse af matchede studier Forsøgsplanlægning Sammenligning af to grupper : Hvor mange personer skal vi bruge? Det kommer

Læs mere

Faculty of Health Sciences. Basal Statistik. Overlevelsesanalyse. Lene Theil Skovgaard. 12. marts 2018

Faculty of Health Sciences. Basal Statistik. Overlevelsesanalyse. Lene Theil Skovgaard. 12. marts 2018 Faculty of Health Sciences Basal Statistik Overlevelsesanalyse Lene Theil Skovgaard 12. marts 2018 1 / 12 APPENDIX vedr. SPSS svarende til diverse slides: Kaplan-Meier kurver, s. 3 Kumulerede incidenser

Læs mere

Morten Frydenberg Biostatistik version dato:

Morten Frydenberg Biostatistik version dato: Caerphilly studiet Design og Data Biostatistik uge 14 mandag Morten Frydenberg, Afdeling for Biostatistik Poisson regression En primær tidsakse og ikke stykkevise konstante rater Cox proportional hazard

Læs mere

Opgavebesvarelse vedr. overlevelsesanalyse

Opgavebesvarelse vedr. overlevelsesanalyse Opgavebesvarelse vedr. overlevelsesanalyse Opgaven går ud på at vurdere effekten af azathioprine på overlevelsen hos 216 patienter med primær biliær cirrhose (PBC), ref. Christensen et al. (1985). Data

Læs mere

Overlevelsesfunktion. Vi kalder S(t) for overlevelsesfunktionen.

Overlevelsesfunktion. Vi kalder S(t) for overlevelsesfunktionen. 1 Levetidsanalyse Overlevelsesfunktionen Censurering Kaplan-Meier estimatoren Hazard funktionen Proportionale hazards Multipel regression PSE (I17) FSV1 Statistik - 5. lektion 1 / 19 Overlevelsesfunktionen

Læs mere

Introduktion til overlevelsesanalyse

Introduktion til overlevelsesanalyse Faculty of Health Sciences Introduktion til overlevelsesanalyse Cox regression IV. Competing risks. Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk

Læs mere

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Afdeling for Biostatistik Bo Martin Bibby 23. november 2006 Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Vi betragter 4699 personer fra Framingham-studiet. Der er oplysninger om follow-up

Læs mere

Eksamen Efterår 2013

Eksamen Efterår 2013 Eksamen Efterår 2013 Opgave En måde at sammenlægge svarene fra de fem EQ-5D items er igennem et indeks, der angiver værdien samfundet giver en bestemt svarkombination. EURV = 1-0.081*(D=1) 0.069*(MOVE=2)

Læs mere

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge Statistik og Sandsynlighedsregning 2 IH kapitel 12 Overheads til forelæsninger, mandag 6. uge 1 Fordelingen af én (1): Regressionsanalyse udfaldsvariabel responsvariabel afhængig variabel Y variabel 2

Læs mere

Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004

Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004 Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004 Formål med Øvelsen: Formålet med øvelsen er at analysere om risikoen for død er forbundet med to forskellige vacciner BCG (mod

Læs mere

Morten Frydenberg 26. april 2004

Morten Frydenberg 26. april 2004 Introduktion til Logistisk Regression Morten Frydenberg, Inst. f. Biostatistik RESUME: 2 2. gang: 2002 Institut for Biostatistik, Århus Universitet MPH. studieår Specialmodul 4 Cand. San. uddannelsen.

Læs mere

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Statikstik II 2. Lektion Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Sandsynlighedsregningsrepetition Antag at Svar kan være Ja og Nej. Sandsynligheden for at Svar Ja skrives

Læs mere

Statistik II 4. Lektion. Logistisk regression

Statistik II 4. Lektion. Logistisk regression Statistik II 4. Lektion Logistisk regression Logistisk regression: Motivation Generelt setup: Dikotom(binær) afhængig variabel Kontinuerte og kategoriske forklarende variable (som i lineær reg.) Eksempel:

Læs mere

Øvelse 7: Aktuar-tabeller, Kaplan-Meier kurver og log-rank test

Øvelse 7: Aktuar-tabeller, Kaplan-Meier kurver og log-rank test Øvelse 7: Aktuar-tabeller, Kaplan-Meier kurver og log-rank test Formålet med øvelsen er at analysere risikoen for død forbundet med forskelligt alkoholforbrug. I denne øvelse skal analyserne foretages

Læs mere

Opgavebesvarelse vedr. overlevelsesanalyse

Opgavebesvarelse vedr. overlevelsesanalyse Opgavebesvarelse vedr. overlevelsesanalyse Opgaven går ud på at vurdere effekten af azathioprine på overlevelsen hos 216 patienter med primær biliær cirrhose (PBC), ref. Christensen et al. (1985). Data

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Eksamensopgave E05 Socialklasse og kronisk sygdom Data: Tværsnitsundersøgelse fra 1986 Datamaterialet indeholder: Køn, alder, Højest opnåede

Læs mere

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Statistik II Lektion 3 Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Setup: To binære variable X og Y. Statistisk model: Konsekvens: Logistisk regression: 2 binære var. e e X Y P

Læs mere

MPH specialmodul Epidemiologi og Biostatistik

MPH specialmodul Epidemiologi og Biostatistik MPH specialmodul Epidemiologi og Biostatistik Repetition af variansanalyse Overlevelsesanalyse Bestemmelse af stikprøvestørrelse Matchning 30. maj 2011 www.biostat.ku.dk/~sr/mphspec11 Susanne Rosthøj (Per

Læs mere

Multipel Lineær Regression

Multipel Lineær Regression Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer

Læs mere

MPH specialmodul Epidemiologi og Biostatistik

MPH specialmodul Epidemiologi og Biostatistik MPH specialmodul Epidemiologi og Biostatistik Kvantitative udfaldsvariable 23. maj 2011 www.biostat.ku.dk/~sr/mphspec11 Susanne Rosthøj (Per Kragh Andersen) 1 Kapitelhenvisninger Andersen & Skovgaard:

Læs mere

Dynamisk statistisk modellering af vedligeholdelsesbehandling af børn med akut lymfoblastær leukæmi

Dynamisk statistisk modellering af vedligeholdelsesbehandling af børn med akut lymfoblastær leukæmi Dynamisk statistisk modellering af vedligeholdelsesbehandling af børn med akut lymfoblastær leukæmi Susanne Rosthøj 2. oktober 2009 Akut Lymfoblastær Leukæmi (ALL) Årlig forekomst på ca 35 tilfælde i Danmark.

Læs mere

Morten Frydenberg 14. marts 2006

Morten Frydenberg 14. marts 2006 Introduktion til Logistisk Regression Morten Frydenberg, Inst. f. Biostatistik 1 RESUME: 2 2. gang: 2006 Institut for Biostatistik, Århus Universitet MPH 1. studieår Specialmodul 4 Cand. San. uddannelsen

Læs mere

Analyse af binære responsvariable

Analyse af binære responsvariable Analyse af binære responsvariable Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet 23. november 2012 Har mænd lettere ved at komme ind på Berkeley? UC Berkeley

Læs mere

OR stiger eksponentielt med forskellen i BMI. kompliceret model svær at forstå og analysere

OR stiger eksponentielt med forskellen i BMI. kompliceret model svær at forstå og analysere Epidemiologi og biostatistik. Uge 5, torsdag 5. september 003 Morten Frydenberg, Institut for Biostatistik. 1 Analyse af overlevelsesdata (ventetidsdata) Censurering (højre + andet) Kaplan-Meyer kurver

Læs mere

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Anvendt Statistik Lektion 8. Multipel Lineær Regression Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke

Læs mere

Statistik Lektion 16 Multipel Lineær Regression

Statistik Lektion 16 Multipel Lineær Regression Statistik Lektion 6 Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk

Læs mere

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet

Læs mere

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse

Læs mere

Basal statistik. Overlevelsesanalyse. Eksempel: Lungecancer blandt krigsveteraner. Faculty of Health Sciences

Basal statistik. Overlevelsesanalyse. Eksempel: Lungecancer blandt krigsveteraner. Faculty of Health Sciences Faculty of Health Sciences Overlevelsesanalyse Basal statistik Overlevelsesanalyse Lene Theil Skovgaard 5. november 2018 Levetider og censurerede observationer Kaplan-Meier kurver Log-rank test Cox regression

Læs mere

Program. Logistisk regression. Eksempel: pesticider og møl. Odds og odds-ratios (igen)

Program. Logistisk regression. Eksempel: pesticider og møl. Odds og odds-ratios (igen) Faculty of Life Sciences Program Logistisk regression Claus Ekstrøm E-mail: ekstrom@life.ku.dk Odds og odds-ratios igen Logistisk regression Estimation og inferens Modelkontrol Slide 2 Statistisk Dataanalyse

Læs mere

OR stiger eksponentielt med forskellen i BMI komplicet model svær at forstå og analysere simpel model

OR stiger eksponentielt med forskellen i BMI komplicet model svær at forstå og analysere simpel model Epidemiologi og biostatistik. Uge 5, torsdag. marts 1 Morten Frydenberg, Institut for Biostatistik. 1 Analyse af overlevelsesdata (ventetidsdata) Censurering (højre + andet) Kaplan-Meyer kurver Det statistiske

Læs mere

Faculty of Health Sciences. Styrkeberegninger Poisson regression Overlevelsesanalyse

Faculty of Health Sciences. Styrkeberegninger Poisson regression Overlevelsesanalyse Faculty of Health Sciences Styrkeberegninger Poisson regression Overlevelsesanalyse Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Forsøgsplanlægning

Læs mere

Faculty of Health Sciences. Basal statistik. Overlevelsesanalyse. Lene Theil Skovgaard. 1. april 2019

Faculty of Health Sciences. Basal statistik. Overlevelsesanalyse. Lene Theil Skovgaard. 1. april 2019 Faculty of Health Sciences Basal statistik Overlevelsesanalyse Lene Theil Skovgaard 1. april 2019 1 / 92 Overlevelsesanalyse Levetider og censurerede observationer Kaplan-Meier kurver Log-rank test Cox

Læs mere

Effektmålsmodifikation

Effektmålsmodifikation Effektmålsmodifikation Mads Kamper-Jørgensen, lektor, maka@sund.ku.dk Afdeling for Social Medicin, Institut for Folkesundhedsvidenskab It og sundhed l 21. april 2015 l Dias nummer 1 Sidste gang Vi snakkede

Læs mere

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression Multipel Linear Regression Repetition Partiel F-test Modelsøgning Logistisk Regression Test for en eller alle parametre I jagten på en god statistisk model har vi set på følgende to hypoteser og tilhørende

Læs mere

Forelæsning 11: Kapitel 11: Regressionsanalyse

Forelæsning 11: Kapitel 11: Regressionsanalyse Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

24. februar Analyse af overlevelsesdata (ventetidsdata) Ikke parametrisk statistiske test : Det statistiske modelbegreb Modelselektion

24. februar Analyse af overlevelsesdata (ventetidsdata) Ikke parametrisk statistiske test : Det statistiske modelbegreb Modelselektion . februar 00 Ikke parametrisk statistiske test : Ideen bag Epidemiologi og biostatistik. Uge, mandag. februar 00 Morten Frydenberg, Institut for Biostatistik. To grupper: Mann-Whitney / Wilcoxon testet

Læs mere

Logistisk regression

Logistisk regression Logistisk regression http://biostat.ku.dk/ kach/css2 Thomas A Gerds & Karl B Christensen 1 / 18 Logistisk regression I dag 1 Binær outcome variable død : i live syg : rask gravid : ikke gravid etc 1 prædiktor

Læs mere

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april Århus 8. april 2011 Morten Frydenberg Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april Opgave 1 ( gruppe 1: sp 1-4, gruppe 5: sp 5-9 og gruppe 6: 10-14) I denne opgaveser vi på et

Læs mere

Statistik Lektion 4. Variansanalyse Modelkontrol

Statistik Lektion 4. Variansanalyse Modelkontrol Statistik Lektion 4 Variansanalyse Modelkontrol Eksempel Spørgsmål: Er der sammenhæng mellem udetemperaturen og forbruget af gas? Y : Forbrug af gas (gas) X : Udetemperatur (temp) Scatterplot SPSS: Estimerede

Læs mere

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17 nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse

Læs mere

2 Epidemiologi og biostatistik. Uge 5, mandag 26. september 2005 Michael Væth, Institut for Biostatistik

2 Epidemiologi og biostatistik. Uge 5, mandag 26. september 2005 Michael Væth, Institut for Biostatistik ... september 1 Epidemiologi og biostatistik. Uge, mandag. september Michael Væth, Institut for Biostatistik. Ikke parametrisk statistiske test : Analyse af overlevelsesdata (ventetidsdata) Censurering

Læs mere

Økonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol

Økonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol Økonometri: Lektion 5 Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol 1 / 35 Veksekvirkning: Motivation Vi har set på modeller som Price

Læs mere

Overlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere.

Overlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere. Overlevelse efter AMI Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Diabetes VF (Venticular fibrillation) WMI (Wall motion index) CHF (Cardiac Heart Failure) Køn og alder betragtes

Læs mere

Regressionsanalyser. Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer.

Regressionsanalyser. Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer. Regressionsanalyser Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer. Hvilke faglige problemer kan man løse vha. regressionsanalyser? 1 Regressionsanalyser Det primære problem

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Mantel-Haenszel analyser

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Mantel-Haenszel analyser Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Mantel-Haenszel analyser Mantel-Haenszel analyser Sidst lærte vi om stratificerede analyser. I dag kigger vi på et specialtilfælde: både exposure

Læs mere

Faculty of Health Sciences. Basal Statistik. Logistisk regression mm. Lene Theil Skovgaard. 5. marts 2018

Faculty of Health Sciences. Basal Statistik. Logistisk regression mm. Lene Theil Skovgaard. 5. marts 2018 Faculty of Health Sciences Basal Statistik Logistisk regression mm. Lene Theil Skovgaard 5. marts 2018 1 / 22 APPENDIX vedr. SPSS svarende til diverse slides: To-gange-to tabeller, s. 3 Plot af binære

Læs mere

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logisitks Regression: Repetition Y {0,} binær afhængig variabel X skala forklarende variabel π P( Y X x) Odds(Y X x) π /(-π

Læs mere

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Multipel regression M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Y j 1 X 1j 2 X 2j... m X mj j eller m Y j 0 i 1 i X ij j BEMÆRK! j svarer til individ

Læs mere

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Institut for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression Regressionsanalyse Regressionsanalyser

Læs mere

Muligheder: NB: test for µ 1 = µ 2 i model med blocking ækvivalent med parret t-test! Ide: anskue β j som stikprøve fra normalfordeling.

Muligheder: NB: test for µ 1 = µ 2 i model med blocking ækvivalent med parret t-test! Ide: anskue β j som stikprøve fra normalfordeling. Eksempel: dæktyper og brændstofforbrug (opgave 25 side 319) Program: cars 1 2 3 4 5... radial 4.2 4.7 6.6 7.0 6.7... belt 4.1 4.9 6.2 6.9 6.8... Muligheder: 1. vi starter med at gennemgå opgave 7 side

Læs mere

Løsning til opgave i logistisk regression

Løsning til opgave i logistisk regression Løsning til øvelser i logistisk regression, november 2008 1 Løsning til opgave i logistisk regression 1. Først indlæses data, og vi kan lige sørge for at danne en dummy-variable for cml, som indikator

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Logistisk regression

Logistisk regression Logistisk regression Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk 21. marts 2013 Dagens program Chi-i-anden (χ 2 )-testet Sandsynligheder,

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Effektmålsmodifikation

Effektmålsmodifikation Effektmålsmodifikation Mads Kamper-Jørgensen, lektor, maka@sund.ku.dk Afdeling for Social Medicin, Institut for Folkesundhedsvidenskab Sundhed og informatik l 25. april 2017 l Dias nummer 1 Sidste gang

Læs mere

Logistisk regression. Statistik Kandidatuddannelsen i Folkesundhedsvidenskab

Logistisk regression. Statistik Kandidatuddannelsen i Folkesundhedsvidenskab Logistis regression Statisti Kandidatuddannelsen i Folesundhedsvidensab Multipel logistis regression Antagelser: Binære observationer (Y i, i=,.,n) f.es Ja/Nej Høj/Lav Død/Levende Kodet: / 0 Y i uafhængige

Læs mere

Økonometri 1. Dummyvariabler 13. oktober Økonometri 1: F10 1

Økonometri 1. Dummyvariabler 13. oktober Økonometri 1: F10 1 Økonometri 1 Dummyvariabler 13. oktober 2006 Økonometri 1: F10 1 Dagens program Dummyvariabler i den multiple regressionsmodel (Wooldridge kap. 7.3-7.6) Dummy variabler for kvalitative egenskaber med flere

Læs mere

Logistisk regression

Logistisk regression Logistisk regression Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Kursushjemmeside: www.biostat.ku.dk/~sr/forskningsaar/regression2012/

Læs mere

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Lineær regression. Simpel regression. Model. ofte bruges følgende notation: Lineær regression Simpel regression Model Y i X i i ofte bruges følgende notation: Y i 0 1 X 1i i n i 1 i 0 Findes der en linie, der passer bedst? Metode - Generel! least squares (mindste kvadrater) til

Læs mere

REEKSAMEN I EPIDEMIOLOGISKE METODER IT & Sundhed, 2. semester

REEKSAMEN I EPIDEMIOLOGISKE METODER IT & Sundhed, 2. semester D E T S U N D H E D S V I D E N S K A B E L I G E F A K U L T E T K Ø B E N H A V N S U N I V E R S I T E T B l e g d a m s v e j 3 B 2 2 0 0 K ø b e n h a v n N REEKSAMEN I EPIDEMIOLOGISKE METODER IT

Læs mere

Basal statistik. Overlevelsesanalyse. Eksempel: Lungecancer blandt krigsveteraner. Faculty of Health Sciences

Basal statistik. Overlevelsesanalyse. Eksempel: Lungecancer blandt krigsveteraner. Faculty of Health Sciences Faculty of Health Sciences Overlevelsesanalyse Basal statistik Overlevelsesanalyse Lene Theil Skovgaard & Susanne Rosthøj 1. april 2019 Levetider og censurerede observationer Kaplan-Meier kurver Log-rank

Læs mere

Løsning til øvelsesopgaver dag 4 spg 5-9

Løsning til øvelsesopgaver dag 4 spg 5-9 Løsning til øvelsesopgaver dag 4 spg 5-9 5: Den multiple model Vi tilføjer nu yderligere to variable til vores model : Køn og kolesterol SBP = a + b*age + c*chol + d*mand hvor mand er 1 for mænd, 0 for

Læs mere

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller Type I og type II fejl Type I fejl: forkast når hypotese sand. α = signifikansniveau= P(type I fejl) Program (8.15-10): Hvis vi forkaster når Z < 2.58 eller Z > 2.58 er α = P(Z < 2.58) + P(Z > 2.58) =

Læs mere

Module 4: Ensidig variansanalyse

Module 4: Ensidig variansanalyse Module 4: Ensidig variansanalyse 4.1 Analyse af én stikprøve................. 1 4.1.1 Estimation.................... 3 4.1.2 Modelkontrol................... 4 4.1.3 Hypotesetest................... 6 4.2

Læs mere

Statistik II 1. Lektion. Analyse af kontingenstabeller

Statistik II 1. Lektion. Analyse af kontingenstabeller Statistik II 1. Lektion Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller Logistisk regression

Læs mere

Basal statistik for lægevidenskabelige forskere, forår 2014 Udleveret 4. marts, afleveres senest ved øvelserne i uge 13 (25.

Basal statistik for lægevidenskabelige forskere, forår 2014 Udleveret 4. marts, afleveres senest ved øvelserne i uge 13 (25. Hjemmeopgave Basal statistik for lægevidenskabelige forskere, forår 2014 Udleveret 4. marts, afleveres senest ved øvelserne i uge 13 (25.-27 marts) Garvey et al. interesserer sig for sammenhængen mellem

Læs mere

1 Regressionsproblemet 2

1 Regressionsproblemet 2 Indhold 1 Regressionsproblemet 2 2 Simpel lineær regression 3 2.1 Mindste kvadraters tilpasning.............................. 3 2.2 Prædiktion og residualer................................. 5 2.3 Estimation

Læs mere

1 Hb SS Hb Sβ Hb SC = , (s = )

1 Hb SS Hb Sβ Hb SC = , (s = ) PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.

Læs mere

Eksamen i Statistik og skalavalidering

Eksamen i Statistik og skalavalidering Eksamen i Statistik og skalavalidering 2009-studieordning Til aflevering d. 22. december 2010 Efterårssemestret 2010, Kandidatuddannelsen i Folkesundhedsvidenskab Opgaven er udarbejdet af: Eksamensnummer

Læs mere

Logistisk Regression - fortsat

Logistisk Regression - fortsat Logistisk Regression - fortsat Likelihood Ratio test Generel hypotese test Modelanalyse Indtil nu har vi set på to slags modeller: 1) Generelle Lineære Modeller Kvantitav afhængig variabel. Kvantitative

Læs mere

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 1 Regressionsproblemet 2 Simpel lineær regression Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 3

Læs mere

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk Eksempel: Systolisk blodtryk Udgangspunkt: Vi ønsker at prædiktere det systoliske blodtryk hos en gruppe af personer. Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Afdeling for Biostatistik.

Læs mere

Eksamen i statistik 2010 Kandidatuddannelsen i folkesundhedsvidenskab

Eksamen i statistik 2010 Kandidatuddannelsen i folkesundhedsvidenskab D E T S U N D H E D S V I D E N S K A B E L I G E F A K U L T E T K Ø B E N H A V N S U N I V E R S I T E T Eksamen i statistik 2010 Kandidatuddannelsen i folkesundhedsvidenskab Eksamensnummer: 16, 23

Læs mere

Synopsis til eksamen i Statistik

Synopsis til eksamen i Statistik Synopsis til eksamen i Statistik Kandidatuddannelsen i Folkesundhedsvidenskab Københavns Universitet december 2010 Eksamensnummer: 12 Antal anslag: 23.839 (svarende til 9,9 normalsider) - 1 - Indholdsfortegnelse

Læs mere

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser Uge 43 I Teoretisk Statistik,. oktober 3 Simpel lineær regressionsanalyse Forudsigelser Fortolkning af regressionsmodellen Ekstreme observationer Transformationer Sammenligning af to regressionslinier

Læs mere

Økonometri Lektion 1 Simpel Lineær Regression 1/31

Økonometri Lektion 1 Simpel Lineær Regression 1/31 Økonometri Lektion 1 Simpel Lineær Regression 1/31 Simpel Lineær Regression Mål: Forklare variablen y vha. variablen x. Fx forklare Salg (y) vha. Reklamebudget (x). Statistisk model: Vi antager at sammenhængen

Læs mere

Log-lineære modeller. Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres.

Log-lineære modeller. Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres. Log-lineære modeller Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres. Kontingenstabel Contingency: mulighed/tilfælde Kontingenstabel: antal observationer (frekvenser)

Læs mere

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse . september 5 Epidemiologi og biostatistik. Forelæsning Uge, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression

Læs mere

Kommentarer til spørgsmålene til artikel 1: Ethnic differences in mortality from sudden death syndrome in New Zealand, Mitchell et al., BMJ 1993.

Kommentarer til spørgsmålene til artikel 1: Ethnic differences in mortality from sudden death syndrome in New Zealand, Mitchell et al., BMJ 1993. Kommentarer til spørgsmålene til artikel 1: Ethnic differences in mortality from sudden death syndrome in New Zealand, Mitchell et al., BMJ 1993. 1. Det anføres, at OR for maorier vs. ikke-maorier er 3.81.

Læs mere

MPH specialmodul i biostatistik og epidemiologi SAS-øvelser vedr. case-control studie af malignt melanom.

MPH specialmodul i biostatistik og epidemiologi SAS-øvelser vedr. case-control studie af malignt melanom. MPH specialmodul i biostatistik og epidemiologi SAS-øvelser vedr. case-control studie af malignt melanom. For at I skal kunne regne på tallene fra undersøgelsen har vi taget en delmængde af variablene

Læs mere

Opgavebesvarelse, logistisk regression

Opgavebesvarelse, logistisk regression Opgavebesvarelse, logistisk regression Data ligger i rop.xls på kursushjemmesiden: http://staff.pubhealth.ku.dk/ jufo/courses/logistic/ Når du har gemt data på din computer, kan det indlæses i SAS med

Læs mere

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression: Definitioner For en binær (0/) variabel Y antager vi P(Y)p P(Y0)-p Eksempel: Bil til arbejde vs alder

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af

Læs mere

Statistiske Modeller 1: Kontingenstabeller i SAS

Statistiske Modeller 1: Kontingenstabeller i SAS Statistiske Modeller 1: Kontingenstabeller i SAS Jens Ledet Jensen October 31, 2005 1 Indledning Som vist i Notat 1 afsnit 13 er 2 log Q for et test i en multinomialmodel ækvivalent med et test i en poissonmodel.

Læs mere

Multipel regression. Data fra opgave 3 side 453: Multipel regressionsmodel: Y = α + β 1 x 1 + β 2 x 2 + ǫ. hvor ǫ N(0, σ 2 ).

Multipel regression. Data fra opgave 3 side 453: Multipel regressionsmodel: Y = α + β 1 x 1 + β 2 x 2 + ǫ. hvor ǫ N(0, σ 2 ). Program 1. multipel regression 2. polynomiel regression (og andre kurver) 3. kategoriske variable 4. Determinationkoefficient og justeret determinationskoefficient 5. ANOVA-tabel 1/13 Multipel regression

Læs mere

Dagens Emner. Likelihood teori. Lineær regression (intro) p. 1/22

Dagens Emner. Likelihood teori. Lineær regression (intro) p. 1/22 Dagens Emner Likelihood teori Lineær regression (intro) p. 1/22 Likelihood-metoden M : X i N(µ,σ 2 ) hvor µ og σ 2 er ukendte Vi har, at L(µ,σ 2 ) = ( 1 2πσ 2)n/2 e 1 2σ 2 P n (x i µ) 2 er tætheden som

Læs mere

Man indlæser en såkaldt frequency-table i SAS ved følgende kommandoer:

Man indlæser en såkaldt frequency-table i SAS ved følgende kommandoer: 1 IHD-Lexis 1.1 Spørgsmål 1 Man indlæser en såkaldt frequency-table i SAS ved følgende kommandoer: data ihdfreq; input eksp alder pyrs cases; lpyrs=log(pyrs); cards; 0 2 346.87 2 0 1 979.34 12 0 0 699.14

Læs mere

Basal statistik for lægevidenskabelige forskere, forår 2012 Udleveret 6.marts, afleveres senest ved øvelserne i uge 15 (

Basal statistik for lægevidenskabelige forskere, forår 2012 Udleveret 6.marts, afleveres senest ved øvelserne i uge 15 ( Hjemmeopgave Basal statistik for lægevidenskabelige forskere, forår 2012 Udleveret 6.marts, afleveres senest ved øvelserne i uge 15 (10.-12. april) I et randomiseret forsøg sammenlignes vitamin D behandling

Læs mere

Logistisk regression

Logistisk regression Logistisk regression Test af antagelsen om lineære effekter Modelkonstruktion og modelsøgning Hvilke variable og hvilke interaktioner skal inkluderes i regressionsmodellerne? 1 Logistiske regressionsmodeller

Læs mere

Uge 13 referat hold 4

Uge 13 referat hold 4 Uge 13 referat hold 4 Gruppearbejde 1a: Er variablen kvotient inkluderet på en hensigtsmæssig måde? Der er to problemer med kvotient: 1) Den er trunkeret ved 6.9 og 10.0, løsningen er at indføre dummyer

Læs mere

Dagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at

Dagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at Likelihood teori Lineær regression (intro) Dagens Emner Likelihood-metoden M : X i N(µ,σ 2 ) hvor µ og σ 2 er ukendte Vi har, at L(µ,σ 2 1 ) = ( 2πσ 2)n/2 e 1 2 P n (xi µ)2 er tætheden som funktion af

Læs mere