Introduktion til overlevelsesanalyse

Størrelse: px
Starte visningen fra side:

Download "Introduktion til overlevelsesanalyse"

Transkript

1 Faculty of Health Sciences Introduktion til overlevelsesanalyse Cox regression IV. Competing risks. Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet Kursushjemmeside:

2 Program for dag 5 Modelkontrol baseret på residualer Competing risks Kapitel 9 i Kleinbaum & Klein handler om competing risks, men er ikke særligt godt skrevet. Litteraturforslag på slide / 47

3 Grafisk modelkontrol via log(-log(overlevelse)) For Cox-modellen med X i = I(i behandlet) er overlevelsen S(t X i ) = S 0 (t) exp(βx i) Det betyder at = { S0 (t) exp(β) hvis i får behandling S 0 (t) hvis i får placebo. log( log(s(t X i ))) = log( log(s 0 (t))) + βx i svarende til at differensen log( log(s(t X i ))) log( log(s(t X j ))) = β(x i X j ) mellem to individer i og j ikke afhænger af tiden t, dvs at overlevelseskurverne er parallelle som funktion af t. log(-log( ))-funktionen kaldes også for cloglog-funktionen (complementary log log). 3 / 47

4 cloglog-kurver PBC-data Vi så sidste gang på cloglog-kurver for PBC-data. Der var problemer med edema og protime: cloglog kurver for edema (0/1) ( β =.49) Dage Vi ser at effekten aftager over tid. 4 / 47

5 cloglog kurver for kategoriseret protime Dage Vi ser igen at effekten aftager over tid. PH mest problematisk for patienter med lav protime. 5 / 47

6 Ulemper ved cloglog-metoden clogclog-metoden er svær at benytte i praksis fordi vurderingen af om linierne er parallelle er subjektiv. vi ikke kan vurdere, hvor stor afvigelsen er og om den reelt er et problem inddelingen i grupper er mere eller mindre tilfældig for kontinuerte variable Vi vil gerne supplere vurderingen af PH med mere sofistikerede grafiske metoder og en p-værdi. 6 / 47

7 Residualer Residualer bruges til at kontrollere, om en given model passer til data. For hver enkelt patient, er et residual afvigelsen mellem det observerede udfald (respons) og det forventede udfald baseret på modellen. For overlevelsesdata findes ikke nogen umiddelbar pendant til observeret minus forventet værdi som i lineær regression. Derfor findes forskellige typer af residualer: martingal, deviance, score og Schoenfeld. Residualerne kan benyttes i grafik og i teststørrelser, hvorved rimeligheden af modellen kan vurderes. 7 / 47

8 Residualer og software R (og de fleste andre programmer) har implementeret en tilgang baseret på Schoenfeld residualerne. Her kan konklusionen dog afhænge af, hvilken tidsskala man vurderer PH-antagelsen mod og man kan derfor opnå modstridende resultater. Et stærkt værktøj, som ikke afhænger af tidsskalaen, er implementeret i pakken timereg. Metoden er beskrevet i Martinussen & Scheike (2006): Dynamic Regression Models for Survival Data (for statistikere). 8 / 47

9 Martingal residualer Vi definerer en respons for hvert individ i ved og den forventede værdi ved Λ i (t) = N i (t) = I(T i t) t 0 λ 0 (t) exp(β 1 X i1 + + β p X ip ) = Λ 0 (t) exp(β 1 X i1 + + β p X ip ) og sammenligner disse i martingal residualet M i (t) = N i (t) Λ 0 (t) exp(β 1 X i1 + + β p X ip ). Hvis Cox-modellen er korrekt vil disse residualer have middelværdi 0. 9 / 47

10 Det estimerede martingal residual Når vi har estimeret Cox-modellen kan vi estimere residualet ved M i (t) = N i (t) Λ 0 (t) exp( β 1 X i1 + + β p X ip ). Når vi skal kontrollere modellen er ideen at se på forskellige summer af de estimerede residualer. Er modellen korrekt vil disse også have middelværdi 0. Dette kan vi illustrere grafisk og teste. 10 / 47

11 Test for proportionalitet Vha. funktionen cox.aalen i timereg-pakken kan vi udføre et test for proportionalitet baseret på score processen. Modellen vi skal kontrollere er cox3<-coxph(surv(time,status==2)~age+edema01+l2bili+l2pro+albumin) hvilket kan gøres ved syntaksen cox.a1<-cox.aalen(surv(time,status==2)~prop(age)+prop(edema01)+ prop(l2bili)+prop(l2pro)+prop(albumin), weighted.test=0) summary(cox.a1) Her angiver prop() at disse variable skal have en proportional effekt (som i Cox-modellen, men cox.aalen kan også fitte andre modeller). 11 / 47

12 Cox-Aalen Model Test for Aalen terms Test for nonparametric terms Test for non-significant effects Supremum-test of significance p-value H_0: B(t)=0 (Intercept) Test for time invariant effects Kolmogorov-Smirnov test p-value H_0:constant effect (Intercept) Proportional Cox terms : Coef. SE Robust SE D2log(L)^-1 z P-val prop(age) e-05 prop(edema01) e-02 prop(l2bili) e+00 prop(l2pro) e-03 prop(albumin) e-04 Test for Proportionality sup hat U(t) p-value H_0 prop(age) prop(edema01) prop(l2bili) prop(l2pro) prop(albumin) Call: cox.aalen(surv(time, status == 2) ~ prop(age) + prop(edema01) + prop(l2bili) + prop(l2pro) + prop(albumin), weighted.test = 0) 12 / 47

13 Konklusion pba. test for PH Estimaterne i den øverste blok er ikke helt identiske med estimaterne fra coxph. Vi ser, at testene i den nederste blok bekræftiger, at der er problemer med PH-antagelsen for edema og protime. Vi kan undersøge afvigelsen lidt nærmere ved et plot: par(mfrow=c(2,3)) plot(cox.a1,score=t,xlab="dage") Her angiver score=t at vi vil have score-processen. 13 / 47

14 prop(age) prop(edema01) prop(l2bili) Cumulative coefficients Cumulative coefficients Cumulative coefficients Dage Dage Dage prop(l2pro) prop(albumin) Cumulative coefficients Cumulative coefficients Dage Dage 14 / 47

15 Fortolkning af plots Hvert plot indeholder 50 simulerede score-processer, som illustrerer hvordan score-processen ville se ud, hvis Cox-modellen var korrekt. Den sorte linie er den observerede score-proces, de grå er de simulerede. Score-processen er en vægtning af det observerede antal døde minus det forventede antal døde. For edema ligger kurven for højt hvilket illustrerer, at der dør flere patienter end forventet. Konklusion: Problemer med PH for edema og protime. 15 / 47

16 Modelkontrol baseret på kumulative residualer Vha. de kumulative martingal residualer kan vi kontrollere om vi har fået inkluderet de kontinuerte variable i den rette form. I R skriver vi: cox.a2<-cox.aalen(surv(time,status==2)~prop(age)+prop(edema01)+ prop(l2bili)+prop(l2pro)+prop(albumin), residuals=1,n.sim=0) resids<-cum.residuals(cox.a2,cum.resid=1) summary(resids) og får Test for cumulative MG-residuals Grouped cumulative residuals not computed, you must provide modelmatrix to get these (see help) Residual versus covariates consistent with model sup hat B(t) p-value H_0: B(t)=0 prop(age) prop(l2bili) prop(l2pro) prop(albumin) Call: cum.residuals(cox.a2, cum.resid = 1) 16 / 47

17 Plot af kumulerede residualer par(mfrow=c(2,2)) plot(resids,score=2) prop(age) prop(l2bili) Cumulative residuals Cumulative residuals prop(age) prop(l2bili) prop(l2pro) prop(albumin) Cumulative residuals Cumulative residuals prop(l2pro) prop(albumin) Igen angiver de grå linier hvordan de kumulerede residualer ville se ud, hvis modellen var rigtig. 17 / 47

18 Kumulerede residualer, bilirubin ej transformeret Vi prøver at inkludere bilirubin i sin oprindelige form: > cox.a3<-cox.aalen(surv(time,status==2)~prop(age)+prop(edema01) + +prop(bili)+prop(l2pro)+prop(albumin), + residuals=1,n.sim=0) > resids<-cum.residuals(cox.a3,cum.resid=1) > summary(resids) Test for cumulative MG-residuals Grouped cumulative residuals not computed, you must provide modelmatrix to get these (see help) Residual versus covariates consistent with model sup hat B(t) p-value H_0: B(t)=0 prop(age) prop(bili) prop(l2pro) prop(albumin) Call: cum.residuals(cox.a3, cum.resid = 1) > plot(resids,score=2) > 18 / 47

19 prop(age) prop(bili) Cumulative residuals Cumulative residuals prop(age) prop(bili) prop(l2pro) prop(albumin) Cumulative residuals Cumulative residuals prop(l2pro) prop(albumin) Vi ser at der er problemer med bilirubin utransformeret (i overensstemmelse med de tests for linearitet vi lavede til øvelserne sidste gang). 19 / 47

20 Opsummering Med metoderne baseret på residualer kan vi vurdere PH-antagelsen og de kontinuerte variables funktionelle form. Formen på en afvigelse fra PH kan evt. vurderes ved cloglog-plots (som supplement). Når vi vurderer modellen for en variabel forudsætter vi, at modellen er opfyldt for de øvrige variable. Når vi har fundet ud af, hvordan vi skal tage højde for manglende PH / linearitet for en variabel, skal vi derfor kontrollere modellen igen. Vi kan tage højde for manglende PH ved stratificering. Alternative (og ofte mere tilfredsstillende) metoder er beskrevet i KK kapitel / 47

21 Øvelser i modelkontrol Behandling af børn med Akut Lymfoblastær Leukæmi: I blev 538 nordiske børn med ALL randomiseret til traditionel vedligeholdelsesbehandling (VB) eller pharmakologisk baseret VB. Vi har her nogle data til rådighed for 468 af børnene med oplysninger om st sl recidiv pige kontrol wbc tpmtsnit start på VB EOF i dage 1=recidiv, 0 ellers 1=pige, 0=dreng 1=traditionel, 0=pharmakologi wbc ved diagnose gennemsnit TPMT-værdi (aktivitet af enzym) Data ligger på kursushjemmesiden under dag 4 i ALL.csv. Læs data ind med kommandoen ALLdata<-read.table("ALL.csv",header=T,sep=",") 21 / 47

22 Vær opmærksom på forsinket indgang (start VB). 1) Undersøg vha Kaplan-Meier-kurver og log-rank tests effekten af køn og behandlingsgruppe på risikoen for recidiv. Check vekselvirkningen - hvad ser vi? 2) Formuler en model og kontroller den. 3) Test om effekten af tpmtsnit er den samme over de tre strata. 4) Sammenlign resultaterne med Schmiegelow et al., JCO (2003), som kan hentes som pdf fra Fit din model med den samme parameterisering af køn og randomiseringsgruppe. Hvorfor tror du, at man har valgt netop denne parameterisering? 22 / 47

23 Maligne melanomer: 1) Aktivér timereg pakken og gør data tilgængelige med kommandoen data(melanoma). Vi vil fortsat fokusere på død pga melanomer (status=1), dvs. død af andre årsager skal betragtes som censurering. 2) Formuler en model indeholdende ulceration, tykkelse og køn. Kontroller PH for alle variablene. 3) Gentag 2) med log2(tykkelse). Ændrer det noget? 4) Gentag 3) stratificeret på ulceration. 5) Hvilken slutmodel vælger du? 23 / 47

24 Competing Risks 24 / 47

25 Overlevelsesdata Responsen er tid til event (eg. død). Vi kan illustrere data i følgende diagram: I live λ(t) Død hvor λ(t) er hazarden : λ(t) P(t T<t+h T t) h Vi har set på overlevelsesfunktionen for h lille. t S(t) = P(T > t) = exp( λ(s)ds) 0 og estimeret denne ved Kaplan-Meier-kurven eller vha. en Cox-model. 25 / 47

26 Højrecensurering Vi har hidtil set på højrecensurerede data. Eksempler på årsager til højrecensurering for et studie vedr. tid til cancer: ophør på studie emigration, mistet for follow-up død pga trafikulykke død af blodprop Antagelsen er, at censureringen skal være uafhængig af tid til cancer. 26 / 47

27 Competing risks Flere forskellige hændelser er mulige: I live Død af årsag 1 Død af årsag 2... Død af årsag k 27 / 47

28 Forudsætninger for competing risks Typisk er én årsag af primær interesse. Eksempel: Ved behandling af leukæmi-patienter kan følgende hændelser indtræffe Recidiv Sekundær cancer Behandlingsrelateret død Når fokus er på risikoen for recidiv, kan vi ikke betragte sekundær cancer / behandlingsrelateret død som censurering. Forekomsten af disse hændelser ændrer på risikoen for og udelukker recidiv. 28 / 47

29 Kumulativ incidens I competing risks beskriver vi data ved de kumulative incidenser P 1 (t) = P(T t, død af årsag 1) P 2 (t) = P(T t, død af årsag 2) P k (t) = P(T t, død af årsag k) hvorved overlevelsen S bliver S(t) = 1 P 1 (t) P k (t). 29 / 47

30 Data eksempel Knoglemarvstransplantation af 35 leukæmipatienter. Observerer tid til recidiv (n = 15) eller behandlingsrelateret død (TRM, n=9). Kumulative incidenser Sandsynlighed TRM Recidiv Overlevelse År 30 / 47

31 Kumulativ incidens baseret på Kaplan-Meier Illustrativt eksempel: 10 patienter, 2 konkurrerende årsager: Recidiv (R) og behandlingsrelateret død (D): Follow-up (+ er censurering): R + R D + R D D R Tid KM når død betragtes som censurering (antal under risiko / antal recidiver) : = /

32 Alternativ beregning af KM For hvert dødstidspunkt t i er sandsynligheden for død af type 1: P 1 (T t i ) = P 1 (T 1) + P 1 (1 < T 2) P 1 (t i 1 < T t i ) = P 1 (T 1) 1 + P 1 (T 2 T > 1) S(1) P 1 (T t i T > t i 1 ) S(t i 1 ). Hvis vi beregner S ved at censurere de døde fås = dvs. præcis 1 minus KM-estimatoren. 32 / 47

33 Men 1-KM er et estimat for den kumulative incidens i en population, hvor patienterne ikke kan dø! Det generelle udtryk for den kumulative incidens er P 1 (T t i ) = i P 1 (T t j T > t j 1 ) S(t j 1 ). j=1 Vi estimerer i stedet S ved KM baseret på både recidiv (R) og død (D) (i.e. overall survival): (R) 0 1(R) 1(D) 0 1(R) 1(D) 1(D) 1(R) = / 47

34 Sammenligning af 1-KM og den kumulative incidens Kumulativ incidens KM metode CR metode Tid 34 / 47

35 KM vs CR-metoden Konklusion: Ved beregning af kumulativ incidens i en competing risks situation må de konkurrerende events ikke censureres. 1-KM baseret på censurering af de konkurrerende årsager overestimerer sandsynligheden for død af årsag 1. Estimatoren for den kumulative incidens kaldes Aalen-Johansen estimatoren. 35 / 47

36 Sammenligning af kumulative incidenser Vi vil ofte ønske at sammenligne kumulative incidenser mellem grupper (f.eks. for forskellige behandlinger / diagnoser). Dette kan gøres ikke-parametrisk ved Gray s test. Testet undersøger, om den kumulative incidens for én specifik årsag er den samme i alle grupperne (dvs. vi kan lave lige så mange tests, som der er konkurrerende årsager). Princippet bag Gray s test svarer til princippet bag log-rank testet for standard overlevelsesanalyse (uden konkurrerende events er de to test identiske). Teststørrelserne følger en χ 2 -fordeling med antallet af frihedsgrader lig antal grupper minus / 47

37 Sammenligning af kumulative incidenser for BMT Kumulative incidencer for BMT data Sandsynlighed AML, TRM ALL, TRM AML, recidiv ALL, recidiv Årsag teststørrelse df p Gray s test: TRM Recidiv / 47

38 Competing risks i R Competing risks data analyseres i R vha. pakken cmprsk. Knoglemarvsdata kan hentes fra kursushjemmesiden (dag 5). Pakken installeres, loades og data indlæses: install.packages("cmprsk") library(cmprsk) bmtdata<-read.csv("bmt.csv",header=t,sep=";") attach(bmtdata) Data indeholder: ftime (tid i år), status (1=TRM, 2=recidiv), dis (0=AML,1=ALL). > head(bmtdata) dis ftime status > table(dis,status) status dis > 38 / 47

39 Plot af kumulative incidencer Kumulative incidenser beregnes vha cuminc og plottes (total samt opsplittet på diagnose): # total ci1<-cuminc(ftime,status) plot(ci1,curvlab=c("trm","recidiv"),wh=c(50,1),xlab="år", ylab="sandsynlighed",lwd=2,main="kumulative incidenser") box() # opsplittet på diagnose ci2<-cuminc(ftime,status,dis) plot(ci2,curvlab=c("aml, TRM", "ALL, TRM", "AML, recidiv", "ALL, recidiv"), xlab="",col=c("black","black","grey","grey"),lwd=2,ylab="sandsynlighed", main="kumulative incidencer for BMT-data") box() Bemærk at plot her ikke tegner en boks rundt om hele plottet. Denne tilføjes med kommandoen box(). Bemærk også at syntaksen er ændret i forhold til syntaksen i survfit og coxph. 39 / 47

40 Gray s test i R cuminc udfører automatisk Gray s test, når de kumulative incidenser er beregnet for flere grupper: > ci2<-cuminc(ftime,status,dis) > ci2 Tests: stat pv df Estimates and Variances: $est $var > 40 / 47

41 summary virker ikke på et cuminc-objekt! Bemærk at de kumulative incidenser og varianserne på disse estimater beregnes for udvalgte tidspunkter. Vi kan selv få disse frem for andre tidspunkter vha. kommandoen timepoints: > s<-timepoints(ci2,c(10,20,50)) > s $est $var / 47

42 Regressionsmodeller for competing risks Der findes flere metoder, hvoraf de to mest udbredte er: Formulering af en årsagsspecifik (Cox-)model for hver årsag. Fine and Gray model (direkte regression af den kumulative incidens). 42 / 47

43 Årsagsspecifik Cox-regression I live λ 1 (t) Død af årsag 1 λ 2 (t) Død af årsag 2 hvor vi formulerer en Cox-model for begge hazards λ 1 (t) λ 2 (t) P(t T < t + h, årsag = 1 T t) h P(t T < t + h, årsag = 2 T t). h Den kumulative incidens P 1 (t) afhænger af både λ 1 og λ / 47

44 Det er let at formulere og estimere de årsagsspecifikke hazards. I praksis laver man to Cox-analyser: 1: Censurér alle events af årsag 2 og estimér en Cox-model. 2: Censurér alle events af årsag 1 og estimér en Cox-model. Det er svært at vurdere effekten af en kovariat på den kumulative incidens, fordi denne afhænger på kompliceret måde af kovariaterne inkluderet i de to Cox-modeller. I R er en pakke ved navn comprisk på vej. I SAS findes en macro beskrevet i Rosthøj et al. (2004). 44 / 47

45 Direkte regression af den kumulative incidens I Fine and Gray-modellen specificeres en model for den kumulative incidens P 1 (t): log(p 1 (t)) = H 1 (t) exp(β 1 X β p X p ) hvor H 1 (t) er en uspecificeret, voksende, positiv funktion. Modellen giver en direkte relation mellem kovariaterne og risikoen men fortolkningen af regressionsparametrene β 1,... β p er ikke simpel. I R kan denne analyse udføres vha crr i cmprsk-pakken. Til SAS findes diverse macro er på nettet. 45 / 47

46 Litteratur Forslag til litteratur om competing risks: Udførlig beskrivelse af beregning af Aalen-Johansen estimatoren: Kim (2007). Cumulative incidence in competing risks data and competing risks regression analysis. Clinical cancer research. Aalen-Johansen / Gray s test i R (bmtdata): Scrucca et al. (2007). Competing risk analysis using R: an easy guide for clinicians. Bone marrow transplantation Fine and Gray-modellen i R: Scrucca et al. (2010). Regression modeling of competing risk using R: an in depth guide for clinicians. Bone marrow transplantation. SAS-macro til bestemmelse af kum. incidens pba årsagsspecifikke Cox-modeller: Rosthøj et al. (2004). SAS macros for estimation of the cumulative incidence functions based on a Cox regression model for competing risks survival data.computer methods and programs in biomedicine. I øvrigt findes en del oversigtsartikler i den medicinske litteratur. 46 / 47

47 Øvelser i competing risks Maligne melanomer: 1) Aktivér timereg pakken og gør data tilgængelige med kommandoen data(melanoma). 2) Beregn og plot de kumulative incidenser for død af maligne melanomer / andre årsager. Sammenlign den kumulative incidens for død af maligne melanomer med 1-KM for de maligne melanomer (lav gerne et plot hvor du lægger de to kurver oven i hinanden). 3) Beregn og plot de kumulative incidencer splittet op på ulceration. 4) Sammenlign incidenserne ved et test. 5) Beregn 5-års risikoen for død af melanomer / andre årsager splittet op på ulceration. Bestem konfidensintervaller for incidenserne. 47 / 47

Introduktion til overlevelsesanalyse

Introduktion til overlevelsesanalyse Faculty of Health Sciences Introduktion til overlevelsesanalyse Cox regression III Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Kursushjemmeside:

Læs mere

Introduktion til overlevelsesanalyse

Introduktion til overlevelsesanalyse Faculty of Health Sciences Introduktion til overlevelsesanalyse Kaplan-Meier estimatoren Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk

Læs mere

Introduktion til overlevelsesanalyse

Introduktion til overlevelsesanalyse Faculty of Health Sciences Introduktion til overlevelsesanalyse Cox regression Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Kursushjemmeside:

Læs mere

Overlevelsesanalyse. Faculty of Health Sciences

Overlevelsesanalyse. Faculty of Health Sciences Faculty of Health Sciences Overlevelsesanalyse Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Program Overlevelsesdata Kaplan-Meier estimatoren

Læs mere

Lineær og logistisk regression

Lineær og logistisk regression Faculty of Health Sciences Lineær og logistisk regression Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Dagens program Lineær regression

Læs mere

Dag 6: Interaktion. Overlevelsesanalyse

Dag 6: Interaktion. Overlevelsesanalyse Dag 6: Interaktion. Overlevelsesanalyse How does CHD depend on gender and hypertension? Males: hypertension chd01 Females: Frequency Row Pct 0 1 Total ---------+--------+--------+ 0 352 95 447 78.75 21.25

Læs mere

Introduktion til overlevelsesanalyse

Introduktion til overlevelsesanalyse Faculty of Health Sciences Introduktion til overlevelsesanalyse Cox regression II Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Kursushjemmeside:

Læs mere

Overlevelsesfunktion. Vi kalder S(t) for overlevelsesfunktionen.

Overlevelsesfunktion. Vi kalder S(t) for overlevelsesfunktionen. 1 Levetidsanalyse Overlevelsesfunktionen Censurering Kaplan-Meier estimatoren Hazard funktionen Proportionale hazards Multipel regression PSE (I17) FSV1 Statistik - 5. lektion 1 / 19 Overlevelsesfunktionen

Læs mere

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Afdeling for Biostatistik Bo Martin Bibby 23. november 2006 Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Vi betragter 4699 personer fra Framingham-studiet. Der er oplysninger om follow-up

Læs mere

Faculty of Health Sciences. Basal Statistik. Overlevelsesanalyse. Lene Theil Skovgaard. 12. marts 2018

Faculty of Health Sciences. Basal Statistik. Overlevelsesanalyse. Lene Theil Skovgaard. 12. marts 2018 Faculty of Health Sciences Basal Statistik Overlevelsesanalyse Lene Theil Skovgaard 12. marts 2018 1 / 12 APPENDIX vedr. SPSS svarende til diverse slides: Kaplan-Meier kurver, s. 3 Kumulerede incidenser

Læs mere

Faculty of Health Sciences. Logistisk regression: Kvantitative forklarende variable

Faculty of Health Sciences. Logistisk regression: Kvantitative forklarende variable Faculty of Health Sciences Logistisk regression: Kvantitative forklarende variable Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Sammenhæng

Læs mere

Faculty of Health Sciences. Miscellaneous: Styrkeberegninger Overlevelsesanalyse Analyse af matchede studier

Faculty of Health Sciences. Miscellaneous: Styrkeberegninger Overlevelsesanalyse Analyse af matchede studier Faculty of Health Sciences Miscellaneous: Styrkeberegninger Overlevelsesanalyse Analyse af matchede studier Forsøgsplanlægning Sammenligning af to grupper : Hvor mange personer skal vi bruge? Det kommer

Læs mere

Morten Frydenberg Biostatistik version dato:

Morten Frydenberg Biostatistik version dato: Caerphilly studiet Design og Data Biostatistik uge 14 mandag Morten Frydenberg, Afdeling for Biostatistik Poisson regression En primær tidsakse og ikke stykkevise konstante rater Cox proportional hazard

Læs mere

Vi vil analysere effekten af rygning og alkohol på chancen for at blive gravid ved at benytte forskellige Cox regressions modeller.

Vi vil analysere effekten af rygning og alkohol på chancen for at blive gravid ved at benytte forskellige Cox regressions modeller. Løsning til øvelse i TTP dag 3 Denne øvelse omhandler tid til graviditet. Et studie vedrørende tid til graviditet (Time To Pregnancy = TTP) inkluderede 423 par i alderen 20-35 år. Parrene blev fulgt i

Læs mere

MPH specialmodul Epidemiologi og Biostatistik

MPH specialmodul Epidemiologi og Biostatistik MPH specialmodul Epidemiologi og Biostatistik Kvantitative udfaldsvariable 23. maj 2011 www.biostat.ku.dk/~sr/mphspec11 Susanne Rosthøj (Per Kragh Andersen) 1 Kapitelhenvisninger Andersen & Skovgaard:

Læs mere

Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004

Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004 Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004 Formål med Øvelsen: Formålet med øvelsen er at analysere om risikoen for død er forbundet med to forskellige vacciner BCG (mod

Læs mere

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet

Læs mere

1 Hb SS Hb Sβ Hb SC = , (s = )

1 Hb SS Hb Sβ Hb SC = , (s = ) PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.

Læs mere

Faculty of Health Sciences. Basal Statistik. Logistisk regression mm. Lene Theil Skovgaard. 5. marts 2018

Faculty of Health Sciences. Basal Statistik. Logistisk regression mm. Lene Theil Skovgaard. 5. marts 2018 Faculty of Health Sciences Basal Statistik Logistisk regression mm. Lene Theil Skovgaard 5. marts 2018 1 / 22 APPENDIX vedr. SPSS svarende til diverse slides: To-gange-to tabeller, s. 3 Plot af binære

Læs mere

Opgavebesvarelse vedr. overlevelsesanalyse

Opgavebesvarelse vedr. overlevelsesanalyse Opgavebesvarelse vedr. overlevelsesanalyse Opgaven går ud på at vurdere effekten af azathioprine på overlevelsen hos 216 patienter med primær biliær cirrhose (PBC), ref. Christensen et al. (1985). Data

Læs mere

OR stiger eksponentielt med forskellen i BMI komplicet model svær at forstå og analysere simpel model

OR stiger eksponentielt med forskellen i BMI komplicet model svær at forstå og analysere simpel model Epidemiologi og biostatistik. Uge 5, torsdag. marts 1 Morten Frydenberg, Institut for Biostatistik. 1 Analyse af overlevelsesdata (ventetidsdata) Censurering (højre + andet) Kaplan-Meyer kurver Det statistiske

Læs mere

Statistik II 4. Lektion. Logistisk regression

Statistik II 4. Lektion. Logistisk regression Statistik II 4. Lektion Logistisk regression Logistisk regression: Motivation Generelt setup: Dikotom(binær) afhængig variabel Kontinuerte og kategoriske forklarende variable (som i lineær reg.) Eksempel:

Læs mere

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge Statistik og Sandsynlighedsregning 2 IH kapitel 12 Overheads til forelæsninger, mandag 6. uge 1 Fordelingen af én (1): Regressionsanalyse udfaldsvariabel responsvariabel afhængig variabel Y variabel 2

Læs mere

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse

Læs mere

OR stiger eksponentielt med forskellen i BMI. kompliceret model svær at forstå og analysere

OR stiger eksponentielt med forskellen i BMI. kompliceret model svær at forstå og analysere Epidemiologi og biostatistik. Uge 5, torsdag 5. september 003 Morten Frydenberg, Institut for Biostatistik. 1 Analyse af overlevelsesdata (ventetidsdata) Censurering (højre + andet) Kaplan-Meyer kurver

Læs mere

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Anvendt Statistik Lektion 8. Multipel Lineær Regression Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke

Læs mere

Basal statistik. Overlevelsesanalyse. Eksempel: Lungecancer blandt krigsveteraner. Faculty of Health Sciences

Basal statistik. Overlevelsesanalyse. Eksempel: Lungecancer blandt krigsveteraner. Faculty of Health Sciences Faculty of Health Sciences Overlevelsesanalyse Basal statistik Overlevelsesanalyse Lene Theil Skovgaard & Susanne Rosthøj 1. april 2019 Levetider og censurerede observationer Kaplan-Meier kurver Log-rank

Læs mere

Morten Frydenberg 26. april 2004

Morten Frydenberg 26. april 2004 Introduktion til Logistisk Regression Morten Frydenberg, Inst. f. Biostatistik RESUME: 2 2. gang: 2002 Institut for Biostatistik, Århus Universitet MPH. studieår Specialmodul 4 Cand. San. uddannelsen.

Læs mere

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17 nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse

Læs mere

Forelæsning 11: Kapitel 11: Regressionsanalyse

Forelæsning 11: Kapitel 11: Regressionsanalyse Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

24. februar Analyse af overlevelsesdata (ventetidsdata) Ikke parametrisk statistiske test : Det statistiske modelbegreb Modelselektion

24. februar Analyse af overlevelsesdata (ventetidsdata) Ikke parametrisk statistiske test : Det statistiske modelbegreb Modelselektion . februar 00 Ikke parametrisk statistiske test : Ideen bag Epidemiologi og biostatistik. Uge, mandag. februar 00 Morten Frydenberg, Institut for Biostatistik. To grupper: Mann-Whitney / Wilcoxon testet

Læs mere

Økonometri Lektion 1 Simpel Lineær Regression 1/31

Økonometri Lektion 1 Simpel Lineær Regression 1/31 Økonometri Lektion 1 Simpel Lineær Regression 1/31 Simpel Lineær Regression Mål: Forklare variablen y vha. variablen x. Fx forklare Salg (y) vha. Reklamebudget (x). Statistisk model: Vi antager at sammenhængen

Læs mere

1 Regressionsproblemet 2

1 Regressionsproblemet 2 Indhold 1 Regressionsproblemet 2 2 Simpel lineær regression 3 2.1 Mindste kvadraters tilpasning.............................. 3 2.2 Prædiktion og residualer................................. 5 2.3 Estimation

Læs mere

Program. Logistisk regression. Eksempel: pesticider og møl. Odds og odds-ratios (igen)

Program. Logistisk regression. Eksempel: pesticider og møl. Odds og odds-ratios (igen) Faculty of Life Sciences Program Logistisk regression Claus Ekstrøm E-mail: ekstrom@life.ku.dk Odds og odds-ratios igen Logistisk regression Estimation og inferens Modelkontrol Slide 2 Statistisk Dataanalyse

Læs mere

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 1 Regressionsproblemet 2 Simpel lineær regression Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 3

Læs mere

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Institut for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression Regressionsanalyse Regressionsanalyser

Læs mere

Erik Parner Sektion for Biostatistik. Biostatistisk metode et par eksempler

Erik Parner Sektion for Biostatistik. Biostatistisk metode et par eksempler Erik Parner Sektion for Biostatistik Biostatistisk metode et par eksempler 1 Percent Kvantitativ data 60 50 40 30 20 10 1960 1970 1980 1990 2000 Year Er der en trend i proportionerne? 2 Mere informations

Læs mere

2 Epidemiologi og biostatistik. Uge 5, mandag 26. september 2005 Michael Væth, Institut for Biostatistik

2 Epidemiologi og biostatistik. Uge 5, mandag 26. september 2005 Michael Væth, Institut for Biostatistik ... september 1 Epidemiologi og biostatistik. Uge, mandag. september Michael Væth, Institut for Biostatistik. Ikke parametrisk statistiske test : Analyse af overlevelsesdata (ventetidsdata) Censurering

Læs mere

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Statikstik II 2. Lektion Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Sandsynlighedsregningsrepetition Antag at Svar kan være Ja og Nej. Sandsynligheden for at Svar Ja skrives

Læs mere

Program. 1. Varianskomponent-modeller (Random Effects) 2. Transformation af data. 1/12

Program. 1. Varianskomponent-modeller (Random Effects) 2. Transformation af data. 1/12 Program 1. Varianskomponent-modeller (Random Effects) 2. Transformation af data. 1/12 Dæktyper og brændstofforbrug Data fra opgave 10.43, side 360: cars 1 2 3 4 5... radial 4.2 4.7 6.6 7.0 6.7... belt

Læs mere

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller Type I og type II fejl Type I fejl: forkast når hypotese sand. α = signifikansniveau= P(type I fejl) Program (8.15-10): Hvis vi forkaster når Z < 2.58 eller Z > 2.58 er α = P(Z < 2.58) + P(Z > 2.58) =

Læs mere

Logistisk regression

Logistisk regression Logistisk regression Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Kursushjemmeside: www.biostat.ku.dk/~sr/forskningsaar/regression2012/

Læs mere

Basal statistik. Overlevelsesanalyse. Eksempel: Lungecancer blandt krigsveteraner. Faculty of Health Sciences

Basal statistik. Overlevelsesanalyse. Eksempel: Lungecancer blandt krigsveteraner. Faculty of Health Sciences Faculty of Health Sciences Overlevelsesanalyse Basal statistik Overlevelsesanalyse Lene Theil Skovgaard 5. november 2018 Levetider og censurerede observationer Kaplan-Meier kurver Log-rank test Cox regression

Læs mere

Faculty of Health Sciences. Basal statistik. Overlevelsesanalyse. Lene Theil Skovgaard. 1. april 2019

Faculty of Health Sciences. Basal statistik. Overlevelsesanalyse. Lene Theil Skovgaard. 1. april 2019 Faculty of Health Sciences Basal statistik Overlevelsesanalyse Lene Theil Skovgaard 1. april 2019 1 / 92 Overlevelsesanalyse Levetider og censurerede observationer Kaplan-Meier kurver Log-rank test Cox

Læs mere

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven. PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve

Læs mere

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 13: Summary Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Dynamisk statistisk modellering af vedligeholdelsesbehandling af børn med akut lymfoblastær leukæmi

Dynamisk statistisk modellering af vedligeholdelsesbehandling af børn med akut lymfoblastær leukæmi Dynamisk statistisk modellering af vedligeholdelsesbehandling af børn med akut lymfoblastær leukæmi Susanne Rosthøj 2. oktober 2009 Akut Lymfoblastær Leukæmi (ALL) Årlig forekomst på ca 35 tilfælde i Danmark.

Læs mere

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk Eksempel: Systolisk blodtryk Udgangspunkt: Vi ønsker at prædiktere det systoliske blodtryk hos en gruppe af personer. Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Afdeling for Biostatistik.

Læs mere

Lineær regression i SAS. Lineær regression i SAS p.1/20

Lineær regression i SAS. Lineær regression i SAS p.1/20 Lineær regression i SAS Lineær regression i SAS p.1/20 Lineær regression i SAS Simpel lineær regression Grafisk modelkontrol Multipel lineær regression SAS-procedurer: PROC REG PROC GPLOT Lineær regression

Læs mere

Muligheder: NB: test for µ 1 = µ 2 i model med blocking ækvivalent med parret t-test! Ide: anskue β j som stikprøve fra normalfordeling.

Muligheder: NB: test for µ 1 = µ 2 i model med blocking ækvivalent med parret t-test! Ide: anskue β j som stikprøve fra normalfordeling. Eksempel: dæktyper og brændstofforbrug (opgave 25 side 319) Program: cars 1 2 3 4 5... radial 4.2 4.7 6.6 7.0 6.7... belt 4.1 4.9 6.2 6.9 6.8... Muligheder: 1. vi starter med at gennemgå opgave 7 side

Læs mere

Opgavebesvarelse, logistisk regression

Opgavebesvarelse, logistisk regression Opgavebesvarelse, logistisk regression Data ligger i rop.xls på kursushjemmesiden: http://staff.pubhealth.ku.dk/ jufo/courses/logistic/ Når du har gemt data på din computer, kan det indlæses i SAS med

Læs mere

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større

Læs mere

Module 4: Ensidig variansanalyse

Module 4: Ensidig variansanalyse Module 4: Ensidig variansanalyse 4.1 Analyse af én stikprøve................. 1 4.1.1 Estimation.................... 3 4.1.2 Modelkontrol................... 4 4.1.3 Hypotesetest................... 6 4.2

Læs mere

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Statistik II Lektion 3 Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Setup: To binære variable X og Y. Statistisk model: Konsekvens: Logistisk regression: 2 binære var. e e X Y P

Læs mere

Kvantitative metoder 2

Kvantitative metoder 2 Kvantitative metoder Heteroskedasticitet 11. april 007 KM: F18 1 Oversigt: Heteroskedasticitet OLS estimation under heteroskedasticitet (W.8.1-): Konsekvenser af heteroskedasticitet for OLS Gyldige test

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Introduktion til R. Faculty of Health Sciences

Introduktion til R. Faculty of Health Sciences Faculty of Health Sciences Introduktion til R Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Kursushjemmeside: www.biostat.ku.dk/~sr/forskningsaar/survival2011

Læs mere

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Lineær regression. Simpel regression. Model. ofte bruges følgende notation: Lineær regression Simpel regression Model Y i X i i ofte bruges følgende notation: Y i 0 1 X 1i i n i 1 i 0 Findes der en linie, der passer bedst? Metode - Generel! least squares (mindste kvadrater) til

Læs mere

Tema. Dagens tema: Indfør centrale statistiske begreber.

Tema. Dagens tema: Indfør centrale statistiske begreber. Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af

Læs mere

Kapitel 11 Lineær regression

Kapitel 11 Lineær regression Kapitel 11 Lineær regression Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 1 Indledning Vi modellerer en afhængig variabel (responset) på baggrund af en uafhængig variabel (stimulus),

Læs mere

Økonometri: Lektion 6 Emne: Heteroskedasticitet

Økonometri: Lektion 6 Emne: Heteroskedasticitet Økonometri: Lektion 6 Emne: Heteroskedasticitet 1 / 32 Konsekvenser af Heteroskedasticitet Antag her (og i resten) at MLR.1 til MLR.4 er opfyldt. Antag MLR.5 ikke er opfyldt, dvs. vi har heteroskedastiske

Læs mere

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse . september 5 Epidemiologi og biostatistik. Forelæsning Uge, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Mantel-Haenszel analyser

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Mantel-Haenszel analyser Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Mantel-Haenszel analyser Mantel-Haenszel analyser Sidst lærte vi om stratificerede analyser. I dag kigger vi på et specialtilfælde: både exposure

Læs mere

Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration

Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration Faculty of Life Sciences Program Modelkontrol og prædiktion Claus Ekstrøm E-mail: ekstrom@life.ku.dk Test af hypotese i ensidet variansanalyse F -tests og F -fordelingen. Multiple sammenligninger. Bonferroni-korrektion

Læs mere

Økonometri 1. Inferens i den lineære regressionsmodel 2. oktober Økonometri 1: F8 1

Økonometri 1. Inferens i den lineære regressionsmodel 2. oktober Økonometri 1: F8 1 Økonometri 1 Inferens i den lineære regressionsmodel 2. oktober 2006 Økonometri 1: F8 1 Dagens program Opsamling om asymptotiske egenskaber: Asymptotisk normalitet Asymptotisk efficiens Test af flere lineære

Læs mere

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser Uge 43 I Teoretisk Statistik,. oktober 3 Simpel lineær regressionsanalyse Forudsigelser Fortolkning af regressionsmodellen Ekstreme observationer Transformationer Sammenligning af to regressionslinier

Læs mere

Teoretisk Statistik, 13 april, 2005

Teoretisk Statistik, 13 april, 2005 Poissonprocessen Teoretisk Statistik, 13 april, 2005 Setup og antagelser Fordelingen af X(t) og et eksempel Ventetider i poissonprocessen Fordeling af ventetiden T 1 til første ankomst Fortolkning af λ

Læs mere

Simpel Lineær Regression

Simpel Lineær Regression Simpel Lineær Regression Mål: Forklare variablen y vha. variablen x. Fx forklare Salg (y) vha. Reklamebudget (x). Vi antager at sammenhængen mellem y og x er beskrevet ved y = β 0 + β 1 x + u. y: Afhængige

Læs mere

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Anvendt Statistik Lektion 7. Simpel Lineær Regression Anvendt Statistik Lektion 7 Simpel Lineær Regression 1 Er der en sammenhæng? Plot af mordraten () mod fattigdomsraten (): Scatterplot Afhænger mordraten af fattigdomsraten? 2 Scatterplot Et scatterplot

Læs mere

Løsning til opgave i logistisk regression

Løsning til opgave i logistisk regression Løsning til øvelser i logistisk regression, november 2008 1 Løsning til opgave i logistisk regression 1. Først indlæses data, og vi kan lige sørge for at danne en dummy-variable for cml, som indikator

Læs mere

Faculty of Health Sciences. Styrkeberegninger Poisson regression Overlevelsesanalyse

Faculty of Health Sciences. Styrkeberegninger Poisson regression Overlevelsesanalyse Faculty of Health Sciences Styrkeberegninger Poisson regression Overlevelsesanalyse Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Forsøgsplanlægning

Læs mere

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Kursus 02402 Introduktion til Statistik Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Opgavebesvarelse, brain weight

Opgavebesvarelse, brain weight Opgavebesvarelse, brain weight (Matthews & Farewell: Using and Understanding Medical Statistics, 2nd. ed.) Spørgsmål 1 Data er indlagt på T:/Basalstatistik/brain.txt og kan indlæses direkte i Analyst med

Læs mere

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning 1 Multipel regressions model Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning PSE (I17) ASTA - 11. lektion

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Eksamensopgave E05 Socialklasse og kronisk sygdom Data: Tværsnitsundersøgelse fra 1986 Datamaterialet indeholder: Køn, alder, Højest opnåede

Læs mere

MPH specialmodul Epidemiologi og Biostatistik

MPH specialmodul Epidemiologi og Biostatistik MPH specialmodul Epidemiologi og Biostatistik Repetition af variansanalyse Overlevelsesanalyse Bestemmelse af stikprøvestørrelse Matchning 30. maj 2011 www.biostat.ku.dk/~sr/mphspec11 Susanne Rosthøj (Per

Læs mere

Økonometri 1. Den simple regressionsmodel 11. september Økonometri 1: F2

Økonometri 1. Den simple regressionsmodel 11. september Økonometri 1: F2 Økonometri 1 Den simple regressionsmodel 11. september 2006 Dagens program Den simple regressionsmodel SLR : Én forklarende variabel (Wooldridge kap. 2.1-2.4) Motivation for gennemgangen af SLR Definition

Læs mere

Økonometri 1. Dummyvariabler 13. oktober Økonometri 1: F10 1

Økonometri 1. Dummyvariabler 13. oktober Økonometri 1: F10 1 Økonometri 1 Dummyvariabler 13. oktober 2006 Økonometri 1: F10 1 Dagens program Dummyvariabler i den multiple regressionsmodel (Wooldridge kap. 7.3-7.6) Dummy variabler for kvalitative egenskaber med flere

Læs mere

Logistisk regression

Logistisk regression Logistisk regression http://biostat.ku.dk/ kach/css2 Thomas A Gerds & Karl B Christensen 1 / 18 Logistisk regression I dag 1 Binær outcome variable død : i live syg : rask gravid : ikke gravid etc 1 prædiktor

Læs mere

Kvantitative metoder 2

Kvantitative metoder 2 Kvantitative metoder 2 Specifikation og dataproblemer 2. maj 2007 KM2: F22 1 Program Specifikation og dataproblemer, fortsat (Wooldridge kap. 9): Betydning af målefejl Dataudvælgelse: Manglende observationer

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff.

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff. Kursus 242 Introduktion til Statistik Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik Bygning 35/324 Danmarks Tekniske Universitet 28 Lyngby Danmark e-mail:

Læs mere

Logistisk regression

Logistisk regression Logistisk regression Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk 21. marts 2013 Dagens program Chi-i-anden (χ 2 )-testet Sandsynligheder,

Læs mere

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved Matematisk Modellering 1 (reeksamen) Side 1 Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved { 1 hvis x {1, 2, 3}, p X (x) = 3 0 ellers,

Læs mere

Program. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data

Program. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data Faculty of Life Sciences Program t-test Hypoteser, teststørrelser og p-værdier Claus Ekstrøm E-mail: ekstrom@life.ku.dk Resumé og hængepartier fra sidst. Eksempel: effekt af foder på hormonkoncentration

Læs mere

Overlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere.

Overlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere. Overlevelse efter AMI Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Diabetes VF (Venticular fibrillation) WMI (Wall motion index) CHF (Cardiac Heart Failure) Køn og alder betragtes

Læs mere

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

Læs mere

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1 Matematisk Modellering 1 Side 1 I nærværende opgavesæt er der 16 spørgsmål fordelt på 4 opgaver. Ved bedømmelsen af besvarelsen vægtes alle spørgsmål lige. Endvidere lægges der vægt på, at det af besvarelsen

Læs mere

Løsning til eksaminen d. 14. december 2009

Løsning til eksaminen d. 14. december 2009 DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,

Læs mere

2 -test. Fordelingen er særdeles kompleks at beskrive med matematiske formler. 2 -test blev opfundet af Pearson omkring år 1900.

2 -test. Fordelingen er særdeles kompleks at beskrive med matematiske formler. 2 -test blev opfundet af Pearson omkring år 1900. 2 -fordeling og 2 -test Generelt om 2 -fordelingen 2 -fordelingen er en kontinuert fordeling, modsat binomialfordelingen som er en diskret fordeling. Fordelingen er særdeles kompleks at beskrive med matematiske

Læs mere

Kapitel 12 Variansanalyse

Kapitel 12 Variansanalyse Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 / 43 Indledning Sammenligning af middelværdien i to grupper indenfor en stikprøve kan

Læs mere

Vi ønsker at konstruere normalområder for stofskiftet, som funktion af kropsvægten.

Vi ønsker at konstruere normalområder for stofskiftet, som funktion af kropsvægten. Opgavebesvarelse, Resting metabolic rate I filen T:\rmr.txt findes sammenhørende værdier af kropsvægt (bw, i kg) og hvilende stofskifte (rmr, kcal pr. døgn) for 44 kvinder (Altman, 1991 og Owen et.al.,

Læs mere

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression: Definitioner For en binær (0/) variabel Y antager vi P(Y)p P(Y0)-p Eksempel: Bil til arbejde vs alder

Læs mere

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression Multipel Linear Regression Repetition Partiel F-test Modelsøgning Logistisk Regression Test for en eller alle parametre I jagten på en god statistisk model har vi set på følgende to hypoteser og tilhørende

Læs mere

1 Multipel lineær regression

1 Multipel lineær regression 1 Multipel lineær regression Regression med 2 eksponeringsvariable Fortolkning og estimation AnovaTabel og multipel R 2 Ensidet variansanalyse: Dummy kodning Kovariansanalyse og effektmodifikation Tosidet

Læs mere

Opsamling Modeltyper: Tabelanalyse Logistisk regression Generaliserede lineære modeller Log-lineære modeller

Opsamling Modeltyper: Tabelanalyse Logistisk regression Generaliserede lineære modeller Log-lineære modeller Opsamling Modeltyper: Tabelanalyse Logistisk regression Binær respons og kategorisk eller kontinuerte forklarende variable. Generaliserede lineære modeller Normalfordelt respons og kategoriske forklarende

Læs mere

I dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt)

I dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt) I dag Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt) Helle Sørensen Repetition vha eksempel om dagligvarepriser Analyse med R: ttest

Læs mere

Klasseøvelser dag 2 Opgave 1

Klasseøvelser dag 2 Opgave 1 Klasseøvelser dag 2 Opgave 1 1.1. Vi sætter først working directory og data indlæses: library( foreign ) d

Læs mere

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ Indhold 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) 2 1.1 Variation indenfor og mellem grupper.......................... 2 1.2 F-test for ingen

Læs mere