Overlevelsesanalyse. Faculty of Health Sciences

Størrelse: px
Starte visningen fra side:

Download "Overlevelsesanalyse. Faculty of Health Sciences"

Transkript

1 Faculty of Health Sciences Overlevelsesanalyse Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet

2 Program Overlevelsesdata Kaplan-Meier estimatoren Log rank test Cox modellen med én kategorisk forklarende variabel Den multiple Cox model Simpel grafisk modelkontrol Gennemgående eksempel Leukæmi patienter i remission. Forslag til litteratur: Kleinbaum & Klein (2005) : Survival Analysis, A Self-Learning Text. 2 / 53

3 Overlevelsesdata Responsen er en levetid, dvs. tid indtil en hændelse forekommer. Tid fra start på behandling til recidiv (eller død eller begge dele) Tid fra fyldning af en tand til fyldningen falder ud Tid fra ansættelse til arbejdsrelateret sygdom Tid fra graviditet til fødsel... Overlevelsesdata er karakteriseret ved: Fordelingen er højreskæv (ikke et problem). Ufuldstændige data: Censurering og trunkering. De sædvanlige metoder kan ikke benyttes. 3 / 53

4 Censurering Oftest vil data være højre censureret, dvs. kun en nedre grænse for levetiden er kendt pga: Studiet afsluttes Patienten mistes for follow-up under studiet. 0 Studie ophør Venstre censurering forekommer når kun en øvre grænse er kendt, f.eks. Tid til infektion med HIV Alder for hvilken et barn lærer en færdighed Test NB: Censurering skal være uafhængig af levetiden. 4 / 53

5 Trunkering Hvis forudsætningen for at et individ indgår i et studie er bestemt af hvorvidt en hændelse er forekommet, siges data at være trunkeret. Højretrunkering De individer, for hvilken den primære hændelse endnu ikke er indtruffet, observeres ikke. Eksempel: Tid til AIDS for HIV-inficerede patienter. Venstretrunkering Kun de individer, for hvilken en mellemliggende hændelse er indtruffet, bliver observeret. Eksempel: Vedligeholdelsesbehandling af børn med leukæmi. 0 Start VB Venstretrunkering kaldes også forsinket indgang. 5 / 53

6 Overlevelsesfunktionen Lad T betegne en levetid. Overlevelsesfunktionen er S(t) = P(T > t) = sandsynligheden for at være i live til tid t. S(t) 0 for alle t 0. Ej voksende S(0) = 1 S( ) = 0 6 / 53

7 Eksempler på overlevelsesfunktioner Survival probability Time Overlevelsesfunktionen estimeres som regel ved den ikke-parametriske Kaplan-Meier (KM) estimator. 7 / 53

8 Remissionstid for akut leukæmi Eksempel hentet fra Kleinbaum and Klein: Freirich et al. (1963). The effect of 6-mercaptopurine on the duration of remission time of steroid induced remission in acute leukaemia. Blood, : patienter med akut leukæmi rekrutteret og randomiseret til placebo eller 6-MP-behandling. Formål: At studere effekten af behandling, køn og WBC ved diagnose på remissionstid. Data kan downloades fra hjemmesiden (fil: remissionami.csv) 8 / 53

9 Remissionsdata Behandlingsgruppen: 21 patienter, 9 tilbagefald, resten højrecensureret Tid (uger) Placebogruppen: 21 patienter, 21 tilbagefald: Tid (uger) = tilbagefald = censurering 9 / 53

10 KM-estimatoren for behandlingsgruppen Behandlingsgruppen (t 10). Data: 6, 6, 6, 6+, 7, 9+, 10, 10+,... Antal under risiko / /1 1/1 Antal hændelser / Antal censureringer Overlevelsesfunktionen estimeres ved /

11 KM-estimatoren for behandlingsgruppen Tid (uger) Hvad er den mediane levetid? 11 / 53

12 KM med konfidensinterval for behandlingsgruppen Tid (uger) Sandsynligheden for at være i live efter 1/2 år er 0.45 (95% CI ). 12 / 53

13 KM-plot for begge behandlingsgrupper Behandling Placebo Tid (uger) 13 / 53

14 Sammenligning af to (eller flere) grupper Hypotese: H 0 : De to overlevelseskurver er ens (S 1 = S 2 ). Sammenligningen kan foretages ved LogRank-testet. Under H 0 er LR approksimativt χ 2 -fordelt med 1 frihedsgrad (antal grupper -1). For remissionsdata er LogRank teststørrelsen 16.79, p< Vi konkluderer at der er signifikant forskel på de to behandlingsgrupper mht. overlevelse. 14 / 53

15 Videre analyse af remissionsdata Vi vil gerne beskrive og kvantificere effekten af behandlingen. Vi ønsker at beskrive effekten af behandling justeret for relevante kovariater. Vi har brug for en model! I overlevelsesanalyse formuleres modeller typisk via hazardfunktionen. 15 / 53

16 Hazardfunktionen Hazardfunktionen (eller hazard raten / intensitet): h(t) P(t T < t + d T t) d hvor sandsynligheden i tælleren læses: Den betingede sandsynlighed for at dø i det næste lille tidsinterval (t + d) givet i live ved begyndelsen af intervallet (t). 0 t t + d Hazardfunktion giver en lokal beskrivelse af risikoen for død. 16 / 53

17 Sammenhæng mellem overlevelses- og hazardfkt. Der er en en-til-en relation mellem overlevelses- og hazardfunktionen: t S(t) = exp( h(s)ds). 0 Overlevelsesfunktionen giver en kumulativ beskrivelse af risikoen for død. 17 / 53

18 Konstant hazard funktion Den simpleste model for overlevelsesdata er modellen med konstant hazard, for h > 0. h(t) = h Dermed er overlevelsesfunktionen S(t) = exp( t 0 h(s)ds) = exp( t 0 hds) = exp( h t) Denne model kaldes den eksponentielle overlevelsesmodel. 18 / 53

19 Den eksponentielle overlevelsesmodel Eksponentialfordelingen, e.g. tid til død for rask population. h(t) = h S(t) = exp( ht) Hazard (h) Overlevelsessandsynlighed (S(t)) / Tid (t) Tid (t)

20 Andre eksempler på hazardfunktioner Non responderende leukæmipatienter At komme sig efter operation Tid (t) Tid (t) Død af tuberkulose 20 / 53 Tid (t)

21 Hazard ratio Et hyppigt effektmål i overlevelsesanalyse er hazard ratio: For remissionsdata vil vi fokusere på hazard ratio mellem behandlede og ubehandlede h B (t) h P (t) = P(t T < t + d T t, Behandlet) P(t T < t + d T t, Placebo). Fortolkning: Til ethvert tidspunkt angiver HR hvor meget større / mindre sandsynligheden er for at et behandlet individ dør i forhold til et ubehandlet individ. 21 / 53

22 Cox modellen Langt den vigtigste model i overlevelsesanalyse er Cox modellen. Modellen lyder h(t) = (model) = { h B (t) hvis behandlet h P (t) hvis placebo { h P (t) exp(b) hvis behandlet h P (t) hvis placebo hvor b er en konstant. Hazard ratio er HR= exp(b). 22 / 53

23 Cox modellen Modellen kan også skrives h B (t) = h P (t) exp(b). og kaldes derfor for Cox proportionale hazards model. For denne model afhænger hazard ratio exp(b) ikke af tiden t. formulerer vi ikke en model for baseline hazard h P (t) h P (t) kaldes baseline hazard funktionen og placebo-gruppen er reference (baseline) gruppen. 23 / 53

24 Fortolkning af Cox modellen Hazard ratio exp(b) udtrykker risikoen for at en behandlet patient får tilbagefald i forhold til en patient i placebogruppen til ethvert tidspunkt. HR < 1 (b < 0) : Behandlede får sjældnere tilbagefald end ubehandlede HR = 1 (b = 0) : Behandlede og ubehandlede har samme risiko HR > 1 (b > 0) : Behandlede får oftere tilbagefald end ubehandlede. Vi har brug for et estimat af b for at få et estimat af HR. 24 / 53

25 Data I overlevelsesanalyse skal data for hver patient bestå af tre slags variable 1) tid til event / censurering i år / uger / dage / timer. Typisk regnet fra veldefineret tid 0 (eks diagnosetidspunkt, alder). 2) censureringsindikator med to niveauer, f.eks. 0 hvis patienten er censureret, 1 hvis patienten er død. 3) kovariater (f.eks. behandling, alder, bmi). Data for hver enkelt patient skal stå i en linie. 25 / 53

26 Remissionsdata Første 25 linier af data: tid doed WBC kvinde behandling / 53

27 Muligt output fra regressionsanalyse I SAS er output (forkortet) fra PHREG proceduren Summary of the Number of Event and Censored Values Percent Total Event Censored Censored Analysis of Maximum Likelihood Estimates Parameter Standard Parameter DF Estimate Error Chi-Square Pr > ChiSq behandling Analysis of Maximum Likelihood Estimates Hazard 95% Hazard Ratio Parameter Ratio Confidence Limits behandling Her er b = HR=exp(coef)=exp( β) = / 53

28 Konfidensinterval og test Et 95% konfidensinterval (CI) for b får vi som b ± 1.96 SE( b), hvor SE( b) = Standard Error af b. Fra output finder vi ± = ( 2.312, 0.706). Et 95%-CI for HR=exp( b) =0.221 får vi ved at tage eksponentialfunktionen til dette, (0.099, 0.493). Et Wald test for hypotesen H 0 : b = 0 (HR=1) er: Z = b SE( b) = = 3.68 som i en normalfordeling giver p= Bemærk at vi i output får et chi-square test (=Z 2 ). 28 / 53

29 Konklusion om behandlingseffekten Vi ser en gavnlig effekt af behandlingen på risikoen for død med en estimeret hazard ratio på 0.22 (95% CI , p=0.0002) for behandling i forhold til placebo. Hvis vi ønsker effekten af placebo i forhold til behandling finder man (sæt placebo=1-behandling) Analysis of Maximum Likelihood Estimates Parameter Standard Parameter DF Estimate Error Chi-Square Pr > ChiSq placebo Analysis of Maximum Likelihood Estimates Hazard 95% Hazard Ratio Parameter Ratio Confidence Limits placebo Vi ser en øget risiko for død for patienterne i placebogruppen med en hazard ratio på 4.52 (95% CI , p=0.0002) for placebo i forhold til behandling (reciprokværdien). 29 / 53

30 Skyldes behandlingseffekten WBC? Måske skyldes den gavnlige effekt af behandling, at vi har fået en uheldig randomisering, idet patienter med lav WBC (White Blood Count) klarer sig bedre. Behandling Antal WBC Placebo Antal / 53 WBC

31 Er der forskel på niveauet af WBC i de to grupper? Vi laver et t-test på log(wbc). Output fra SAS proc TTEST: Variable: log_wbc behandling N Mean Std Dev Std Err Minimum Maximum Diff (1-2) behandling Method Mean 95% CL Mean Std Dev Diff (1-2) Pooled Diff (1-2) Satterthwaite Method Variances DF t Value Pr > t Pooled Equal Satterthwaite Unequal Dvs der er en mulighed for at behandlingseffekten (eller en del af den) kan tilskrives WBC. 31 / 53

32 Den generelle Cox model Vi ønsker at justere modellen for WBC og har derfor brug for en regressionsmodel. Lad X i = (X i1, X i2,..., X ik ) være en liste af kovariatværdier for patient i. Den multiple Cox model specificerer hazarden for individ i ved h i (t) = h 0 (t) exp(b 1 X i1 + b 2 X i2 + + b k X ip ). Bemærk at der ikke er noget intercept (hvorfor?). Når alle kovariater (X er) er 0 får vi baseline hazard λ i (t) = λ 0 (t). Fortolkning: Baseline hazarden er hazarden for et individ med alle kovariatværdier lig / 53

33 En kontinuert forklarende variabel Cox modellen med WBC som kontinuert forklarende variabel er h i (t) = h 0 (t) exp(b WBC i ). Sammenlignes to patienter med en forskel på 1 i WBC, når det laveste er referencen, fås HR = h 0(t) exp(b (WBC + 1)) h 0 (t) exp(b WBC) = exp(b). Dvs fortolkningen er : for hver gang WBC øges med 1, skal HR ganges med exp(b). 33 / 53

34 log(wbc) som forklarende variabel Fordelingen af WBC er højreskæv (nogle få patienter har meget høje værdier). Det er derfor mere rimeligt at inkludere WBC på en log-skala. Output fra SAS: Analysis of Maximum Likelihood Estimates Parameter Standard Parameter DF Estimate Error Chi-Square Pr > ChiSq log_wbc <.0001 Hazard 95% Hazard Ratio Parameter Ratio Confidence Limits log_wbc / 53

35 Fortolkning af effekten af WBC på log-skala HR øges med en faktor 4.92 for hver gang log(wbc) øges med 1. Hvad betyder det? det vil sige at 1 = log(wbc 1 ) log(wbc 2 ) = log( WBC 1 WBC 2 ) WBC 1 WBC 2 = exp(1) = Dermed er fortolkningen, at HR øges med en faktor 4.92 for hver gang WBC øges med en faktor Løsning: Brug logaritme med base 2 i stedet. 35 / 53

36 Cox modellen med log 2 (WBC) Analysis of Maximum Likelihood Estimates Parameter Standard Parameter DF Estimate Error Chi-Square Pr > ChiSq log2_wbc <.0001 Analysis of Maximum Likelihood Estimates Hazard 95% Hazard Ratio Parameter Ratio Confidence Limits log2_wbc Ved en fordobling af WBC øges HR med en faktor 3.02 (95% KI ). Eller : risikoen for tilbagefald 3-dobles ved en fordobling af WBC. Bemærk at teststørrelserne og p-værdierne er uændrede ifht. den naturlige logaritme. 36 / 53

37 Den multiple Cox model Vi har set, at der er forskel på niveauet af WBC i behandlingsog placebogruppen og at der er en effekt af WBC på overlevelsen. I den multiple Cox model kan vi vurdere effekten af behandling justeret for log 2 (WBC), dvs. h i (t) = h 0 (t) exp(b 1 behandlet i + b 2 log 2 (WBC) i ) = h 0 (t) exp(b 1 behandlet i ) exp(b 2 log 2 (WBC) i ) hvor behandlet=1 i behandlingsgruppen, 0 ellers. På log-hazard-skalaen lyder modellen log(h i (t)) = log(h 0 (t)) + b 1 behandlet i + b 2 log 2 (WBC) i svarende til at vi har parallelle linier. 37 / 53

38 Output fra multipel regressionsanalyse Analysis of Maximum Likelihood Estimates Parameter Standard Parameter DF Estimate Error Chi-Square Pr > ChiSq behandling log2_wbc <.0001 Analysis of Maximum Likelihood Estimates Hazard 95% Hazard Ratio Parameter Ratio Confidence Limits behandling log2_wbc Konklusion: Vi ser at der fortsat er en gavnlig effekt af behandling, idet HR=0.27 (95% CI ) for behandling vs placebo når vi justerer for log 2 (WBC). 38 / 53

39 Cox modellens antagelser Den generelle Cox model er h i (t) = h 0 (t) exp(b 1 X i1 + b 2 X i2 + + b k X ik ) når vi inkluderer k forklarende variable i modellen. Vi har ingen antagelser / restriktioner på baseline hazard h 0 (t). Antagelserne er 1) effekten af de forklarende variable er additiv og lineær på log-hazard-skalaen 2) hazarden for hver enkelt patient afhænger af tiden på samme måde idet hazarden (h i ) er et multiplum af baseline hazard (h 0 ) (proportional hazards). Vi er nødt til at vurdere om disse antagelser er rimelige. 39 / 53

40 Proportionale hazards med én forklarende variabel For Cox-modellen indeholdende én forklarende variabel h i (t) = h 0 (t) exp(b behandlet i ) er proportionalitetsantagelsen at hazard ratio for i behandlet vs j placebo h i (t) h j (t) = exp(b) ikke afhænger af tiden t dvs. at h i (t) h j (t) med mindre f er en konstant. f (t) 40 / 53

41 PH med flere forklarende variable For den generelle Cox-model indeholdende flere forklarende variable h i (t) = h 0 (t) exp(b 1 X i1 + b 2 X i b p X ip ) er proportionalitetsantagelsen at hazard ratio mellem individ i og j er konstant h i (t) h j (t) = exp(b 1 (X i1 X j1 ) b p (X ip X jp )), dvs. ikke afhænger af tiden t. Bemærk at dette svarer til at vi skal have PH mellem grupper for de kategoriske variable. 41 / 53

42 Hvorfor bekymre sig om PH-antagelsen? Det er vigtigt at undersøge proportionalitetsantagelsen: Hvis PH ikke er opfyldt vil estimatet fra Cox regressionen være en gennemsnitlig effekt over tid. Hvis vi ikke tager højde for en eventuel tidsafhængig effekt kan der opstå bias for nogle af de øvrige estimerede effekter i modellen. Det kan være vigtigt at forstå, hvordan effekten varierer over tid, idet det kan gøre os klogere på de mekanismer, som genererer data. I nogle sammenhænge kan den gennemsnitlige effekt dog være en interessant / acceptabel beskrivelse af effekten - men det er vigtigt at kende til konkvenserne af at ignorere en tidsafhængig effekt. 42 / 53

43 Grafisk modelkontrol via log(-log(overlevelse)) For den simple Cox model baseret på behandling er overlevelseskurven for de behandlede patienter S B (t) = S P (t) exp(b) hvor S P er overlevelseskurven i placebogruppen. Det betyder at log( log(s B (t))) = log( log(s P (t))) + b svarende til at differensen log( log(s B (t))) log( log(s P (t))) = b ikke afhænger af tiden t, dvs at overlevelseskurverne er parallelle som funktion af t. log(-log( ))-funktionen kaldes også for cloglog-funktionen. 43 / 53

44 cloglog-kurver for kategoriske variable Med kategoriske forklarende variable kan vi estimere overlevelseskurven for hvert niveau af variablen ved Kaplan-Meier-kurven og plotte cloglog-overlevelseskurverne i ét plot: Placebo Behandling / 53

45 Simultan evaluering af PH-antagelsen Vi bør evaluere PH-antagelsen simultant (samtidigt) når vi har flere forklarende variable. Kategoriser de kontinuerte (her tre WBC-grupper) og se på cloglog-kurverne for alle kombinationer af de forklarende variable: Uoverskueligt med flere variable. Nogle inddelinger har meget få events, hvorfor det bliver svært at sammenligne kurverne. 45 / 53

46 Ulemper ved cloglog-metoden clogclog-metoden er svær at benytte i praksis fordi vurderingen af om linierne er parallelle er subjektiv. vi ikke kan vurdere, hvor stor afvigelsen er og om den reelt er et problem inddelingen i grupper er mere eller mindre tilfældig for kontinuerte variable Proportional hazards antagelsen kan også vurderes med mere sofistikerede metoder baseret på residualer (e.g. Schoenfeld-residualer som er implementeret i de fleste statistikprogrammer). Residualerne kan benyttes i grafik og i teststørrelser. 46 / 53

47 Mulige løsninger på manglende PH Der kan tages højde for afvigelse fra PH-antagelsen på følgende måder: 1) Stratificering hvor vi tillader forskellig baseline i grupper, e.g. h i (t) = { h P (t) exp(b log 2 (WBC i )) hvis i får placebo h B (t) exp(b log 2 (WBC i )) hvis i får behandling 2) Benyt en anden model (e.g. Accelerated Failure Time, additiv hazard model). 3) Inddeling af tidsaksen. Måske holder PH-antagelsen over mindre tidsintervaller. Lav separate analyser. 47 / 53

48 4) Vi kan acceptere Cox-modellen med en tidsafhængig effekt h i (t) = h 0 (t) exp(b(t)x i ) og forsøge at beskrive denne effekt ved at tilføje en tidsafhængig version af X. F.eks. kan vi formulere en tidsafhængig effekt ved b 1 X 1 + b 2 X 2 (t) = { b1 X 1 t < 1 år (b 1 + b 2 )X 1 t 1 år hvor X 2 (t) = X 1 I(t 1 år) er den tidsafhængige variabel. Afhængigt af hvilket program man benytter, kræves mere eller mindre programmering. 48 / 53

49 Mere materiale Mere udførlige slides kan downloades fra: som indeholder materiale til et 5-dages kursus i overlevelsesanalyse. Slides fra dagens gennemgang samt materiale til opgaverne kan downloades fra 49 / 53

50 Opgave 1 Tid til invalidepension: Læs og diskutér artiklen Albertsen et al. (2007). Predictors of disability pension over a 10-year period for men and women. Scandinavian Journal of Public Health. I kan tage udgangspunkt i følgende spørgsmål: 1) Hvilke typer analyser er der lavet? 2) Hvilken type censurering er der tale om? Hvad kan årsagerne til censurering være? Kan alle disse årsager tænkes at være uafhængige af invalidepension (dvs. er der nogle årsager, som kan tænkes at udelukke muligheden for invalidepension)? 50 / 53

51 3) Hvorfor tror I at man har valgt at lave det som en overlevelsesanalyse frem for f.eks. en logistisk regression (vi har jo mulighed for at finde information om alle som får førtidspension i den periode). Vink: Nogle vil have mulighed for at opnå invalidepension efter sidste follow-up (men man kunne dog vælge at fokusere på den 10-årige periode) og derudover har de ikke samme risikotid. F.eks. følges en 59-årig måske kun i 1 år, mens en 20-årig følges i 10 år. 4) Hvad er tidsaksen? Hvad er tid 0? Kunne man have valgt en anden tidsskala - og hvilket spørgsmål kunne man så have besvaret? Vink: kalendertid vs alder. 51 / 53

52 5) Diskutér hvilke Cox-analyser, forfatterne har lavet. 6) På side 82 skriver de, at de har testet for mulige interaktioner med køn baseret på hele datasættet. Hvordan kan de tænkes at have gjort det? Hvilke forudsætninger bygger disse tests på? Hvis de ville sammenligne HR erne som angivet i tabel II, hvordan kunne de så have gjort det? (Jvf slide 47). 7) Diskutér tabel 3. 8) Fra min hjemmeside kan hentes et datasæt indeholdende nogle af de beskrevne risikofaktorer (invalide.csv) for lidt færre personer end analyseret i artiklen. Udfør nogle af de analyser, som er beskrevet i artiklen. Kontrollér om der kan antages at være proportionale hazards mellem mænd og kvinder. 52 / 53

53 Opgave 2 Remissionsdata: Data kan downloades som csv-fil fra min hjemmeside (remissionami.csv). 53 / 53 1) Genskab KM-plots og Cox-analyserne af remissionsdata. I skal under Cox-regressionen være opmærksomme på, at I ikke nødvendigvis får præcis det samme output. Det skyldes at der er ties i data - flere patienter dør på samme dag. Statistikprogrammerne håndterer ties forskelligt (SAS bruger en såkaldt Breslow-metode). 2) Afhænger effekten af behandlingen af WBC? (Lav et test for interaktion mellem behandling og log2(wbc)). 3) Inkludér køn i Cox-modellen. Hvad er konklusionen? 4) Lav et plot indeholdende KM-kurverne for begge køn. Vurdér ud fra dette, om PH-antagelsen er opfyldt (lav evt også et cloglog-plot).

Introduktion til overlevelsesanalyse

Introduktion til overlevelsesanalyse Faculty of Health Sciences Introduktion til overlevelsesanalyse Kaplan-Meier estimatoren Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk

Læs mere

Introduktion til overlevelsesanalyse

Introduktion til overlevelsesanalyse Faculty of Health Sciences Introduktion til overlevelsesanalyse Cox regression Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Kursushjemmeside:

Læs mere

Dag 6: Interaktion. Overlevelsesanalyse

Dag 6: Interaktion. Overlevelsesanalyse Dag 6: Interaktion. Overlevelsesanalyse How does CHD depend on gender and hypertension? Males: hypertension chd01 Females: Frequency Row Pct 0 1 Total ---------+--------+--------+ 0 352 95 447 78.75 21.25

Læs mere

Introduktion til overlevelsesanalyse

Introduktion til overlevelsesanalyse Faculty of Health Sciences Introduktion til overlevelsesanalyse Cox regression III Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Kursushjemmeside:

Læs mere

Vi vil analysere effekten af rygning og alkohol på chancen for at blive gravid ved at benytte forskellige Cox regressions modeller.

Vi vil analysere effekten af rygning og alkohol på chancen for at blive gravid ved at benytte forskellige Cox regressions modeller. Løsning til øvelse i TTP dag 3 Denne øvelse omhandler tid til graviditet. Et studie vedrørende tid til graviditet (Time To Pregnancy = TTP) inkluderede 423 par i alderen 20-35 år. Parrene blev fulgt i

Læs mere

Lineær og logistisk regression

Lineær og logistisk regression Faculty of Health Sciences Lineær og logistisk regression Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Dagens program Lineær regression

Læs mere

Morten Frydenberg Biostatistik version dato:

Morten Frydenberg Biostatistik version dato: Caerphilly studiet Design og Data Biostatistik uge 14 mandag Morten Frydenberg, Afdeling for Biostatistik Poisson regression En primær tidsakse og ikke stykkevise konstante rater Cox proportional hazard

Læs mere

Faculty of Health Sciences. Miscellaneous: Styrkeberegninger Overlevelsesanalyse Analyse af matchede studier

Faculty of Health Sciences. Miscellaneous: Styrkeberegninger Overlevelsesanalyse Analyse af matchede studier Faculty of Health Sciences Miscellaneous: Styrkeberegninger Overlevelsesanalyse Analyse af matchede studier Forsøgsplanlægning Sammenligning af to grupper : Hvor mange personer skal vi bruge? Det kommer

Læs mere

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper.

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper. 1. Indlæs data. * HUSK at angive din egen placering af filen; data framing; infile '/home/sro00/mph2016/framing.txt' firstobs=2; input id sex age frw sbp sbp10 dbp chol cig chd yrschd death yrsdth cause;

Læs mere

Faculty of Health Sciences. Logistisk regression: Kvantitative forklarende variable

Faculty of Health Sciences. Logistisk regression: Kvantitative forklarende variable Faculty of Health Sciences Logistisk regression: Kvantitative forklarende variable Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Sammenhæng

Læs mere

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Afdeling for Biostatistik Bo Martin Bibby 23. november 2006 Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Vi betragter 4699 personer fra Framingham-studiet. Der er oplysninger om follow-up

Læs mere

Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004

Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004 Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004 Formål med Øvelsen: Formålet med øvelsen er at analysere om risikoen for død er forbundet med to forskellige vacciner BCG (mod

Læs mere

Overlevelsesfunktion. Vi kalder S(t) for overlevelsesfunktionen.

Overlevelsesfunktion. Vi kalder S(t) for overlevelsesfunktionen. 1 Levetidsanalyse Overlevelsesfunktionen Censurering Kaplan-Meier estimatoren Hazard funktionen Proportionale hazards Multipel regression PSE (I17) FSV1 Statistik - 5. lektion 1 / 19 Overlevelsesfunktionen

Læs mere

MPH specialmodul Epidemiologi og Biostatistik

MPH specialmodul Epidemiologi og Biostatistik MPH specialmodul Epidemiologi og Biostatistik Kvantitative udfaldsvariable 23. maj 2011 www.biostat.ku.dk/~sr/mphspec11 Susanne Rosthøj (Per Kragh Andersen) 1 Kapitelhenvisninger Andersen & Skovgaard:

Læs mere

OR stiger eksponentielt med forskellen i BMI. kompliceret model svær at forstå og analysere

OR stiger eksponentielt med forskellen i BMI. kompliceret model svær at forstå og analysere Epidemiologi og biostatistik. Uge 5, torsdag 5. september 003 Morten Frydenberg, Institut for Biostatistik. 1 Analyse af overlevelsesdata (ventetidsdata) Censurering (højre + andet) Kaplan-Meyer kurver

Læs mere

Introduktion til overlevelsesanalyse

Introduktion til overlevelsesanalyse Faculty of Health Sciences Introduktion til overlevelsesanalyse Cox regression II Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Kursushjemmeside:

Læs mere

Overlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere.

Overlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere. Overlevelse efter AMI Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Diabetes VF (Venticular fibrillation) WMI (Wall motion index) CHF (Cardiac Heart Failure) Køn og alder betragtes

Læs mere

OR stiger eksponentielt med forskellen i BMI komplicet model svær at forstå og analysere simpel model

OR stiger eksponentielt med forskellen i BMI komplicet model svær at forstå og analysere simpel model Epidemiologi og biostatistik. Uge 5, torsdag. marts 1 Morten Frydenberg, Institut for Biostatistik. 1 Analyse af overlevelsesdata (ventetidsdata) Censurering (højre + andet) Kaplan-Meyer kurver Det statistiske

Læs mere

Program. Logistisk regression. Eksempel: pesticider og møl. Odds og odds-ratios (igen)

Program. Logistisk regression. Eksempel: pesticider og møl. Odds og odds-ratios (igen) Faculty of Life Sciences Program Logistisk regression Claus Ekstrøm E-mail: ekstrom@life.ku.dk Odds og odds-ratios igen Logistisk regression Estimation og inferens Modelkontrol Slide 2 Statistisk Dataanalyse

Læs mere

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved Matematisk Modellering 1 (reeksamen) Side 1 Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved { 1 hvis x {1, 2, 3}, p X (x) = 3 0 ellers,

Læs mere

Faculty of Health Sciences. Basal Statistik. Overlevelsesanalyse. Lene Theil Skovgaard. 12. marts 2018

Faculty of Health Sciences. Basal Statistik. Overlevelsesanalyse. Lene Theil Skovgaard. 12. marts 2018 Faculty of Health Sciences Basal Statistik Overlevelsesanalyse Lene Theil Skovgaard 12. marts 2018 1 / 12 APPENDIX vedr. SPSS svarende til diverse slides: Kaplan-Meier kurver, s. 3 Kumulerede incidenser

Læs mere

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Multipel regression M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Y j 1 X 1j 2 X 2j... m X mj j eller m Y j 0 i 1 i X ij j BEMÆRK! j svarer til individ

Læs mere

Regressionsanalyser. Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer.

Regressionsanalyser. Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer. Regressionsanalyser Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer. Hvilke faglige problemer kan man løse vha. regressionsanalyser? 1 Regressionsanalyser Det primære problem

Læs mere

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger Øvelser til basalkursus, 5. uge Opgavebesvarelse: Knogledensitet hos unge piger I alt 112 piger har fået målt knogledensitet (bone mineral density, bmd) i 11-års alderen (baseline værdi). Pigerne er herefter

Læs mere

Løsning til opgave i logistisk regression

Løsning til opgave i logistisk regression Løsning til øvelser i logistisk regression, november 2008 1 Løsning til opgave i logistisk regression 1. Først indlæses data, og vi kan lige sørge for at danne en dummy-variable for cml, som indikator

Læs mere

Morten Frydenberg 26. april 2004

Morten Frydenberg 26. april 2004 Introduktion til Logistisk Regression Morten Frydenberg, Inst. f. Biostatistik RESUME: 2 2. gang: 2002 Institut for Biostatistik, Århus Universitet MPH. studieår Specialmodul 4 Cand. San. uddannelsen.

Læs mere

24. februar Analyse af overlevelsesdata (ventetidsdata) Ikke parametrisk statistiske test : Det statistiske modelbegreb Modelselektion

24. februar Analyse af overlevelsesdata (ventetidsdata) Ikke parametrisk statistiske test : Det statistiske modelbegreb Modelselektion . februar 00 Ikke parametrisk statistiske test : Ideen bag Epidemiologi og biostatistik. Uge, mandag. februar 00 Morten Frydenberg, Institut for Biostatistik. To grupper: Mann-Whitney / Wilcoxon testet

Læs mere

Kursus i varians- og regressionsanalyse Data med detektionsgrænse. Birthe Lykke Thomsen H. Lundbeck A/S

Kursus i varians- og regressionsanalyse Data med detektionsgrænse. Birthe Lykke Thomsen H. Lundbeck A/S Kursus i varians- og regressionsanalyse Data med detektionsgrænse Birthe Lykke Thomsen H. Lundbeck A/S 1 Data med detektionsgrænse Venstrecensurering: Baggrundsstøj eller begrænsning i måleudstyrets følsomhed

Læs mere

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger Øvelser til basalkursus, 5. uge Opgavebesvarelse: Knogledensitet hos unge piger I alt 112 piger har fået målt knogledensitet (bone mineral density, bmd) i 11-års alderen (baseline værdi). Pigerne er herefter

Læs mere

Opgavebesvarelse vedr. overlevelsesanalyse

Opgavebesvarelse vedr. overlevelsesanalyse Opgavebesvarelse vedr. overlevelsesanalyse Opgaven går ud på at vurdere effekten af azathioprine på overlevelsen hos 216 patienter med primær biliær cirrhose (PBC), ref. Christensen et al. (1985). Data

Læs mere

Logistisk regression

Logistisk regression Logistisk regression Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Kursushjemmeside: www.biostat.ku.dk/~sr/forskningsaar/regression2012/

Læs mere

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet

Læs mere

Basal statistik. Logaritmer og kovariansanalyse. Nyt eksempel vedr. sammenligning af målemetoder. Scatter plot af de to metoder

Basal statistik. Logaritmer og kovariansanalyse. Nyt eksempel vedr. sammenligning af målemetoder. Scatter plot af de to metoder Faculty of Health Sciences Logaritmer og kovariansanalyse Basal statistik Logaritmer. Kovariansanalyse Lene Theil Skovgaard 29. september 2015 Parret sammenligning, målemetoder med logaritmer Tosidet variansanalyse

Læs mere

Faculty of Health Sciences. Basal statistik. Logaritmer. Kovariansanalyse. Lene Theil Skovgaard. 29. september 2015

Faculty of Health Sciences. Basal statistik. Logaritmer. Kovariansanalyse. Lene Theil Skovgaard. 29. september 2015 Faculty of Health Sciences Basal statistik Logaritmer. Kovariansanalyse Lene Theil Skovgaard 29. september 2015 1 / 84 Logaritmer og kovariansanalyse Parret sammenligning, målemetoder med logaritmer Tosidet

Læs mere

Basal statistik. Overlevelsesanalyse. Eksempel: Lungecancer blandt krigsveteraner. Faculty of Health Sciences

Basal statistik. Overlevelsesanalyse. Eksempel: Lungecancer blandt krigsveteraner. Faculty of Health Sciences Faculty of Health Sciences Overlevelsesanalyse Basal statistik Overlevelsesanalyse Lene Theil Skovgaard 5. november 2018 Levetider og censurerede observationer Kaplan-Meier kurver Log-rank test Cox regression

Læs mere

Konfidensintervaller og Hypotesetest

Konfidensintervaller og Hypotesetest Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller

Læs mere

Faculty of Health Sciences. Styrkeberegninger Poisson regression Overlevelsesanalyse

Faculty of Health Sciences. Styrkeberegninger Poisson regression Overlevelsesanalyse Faculty of Health Sciences Styrkeberegninger Poisson regression Overlevelsesanalyse Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Forsøgsplanlægning

Læs mere

Man indlæser en såkaldt frequency-table i SAS ved følgende kommandoer:

Man indlæser en såkaldt frequency-table i SAS ved følgende kommandoer: 1 IHD-Lexis 1.1 Spørgsmål 1 Man indlæser en såkaldt frequency-table i SAS ved følgende kommandoer: data ihdfreq; input eksp alder pyrs cases; lpyrs=log(pyrs); cards; 0 2 346.87 2 0 1 979.34 12 0 0 699.14

Læs mere

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression Multipel Linear Regression Repetition Partiel F-test Modelsøgning Logistisk Regression Test for en eller alle parametre I jagten på en god statistisk model har vi set på følgende to hypoteser og tilhørende

Læs mere

Opgavebesvarelse, Basalkursus, uge 3

Opgavebesvarelse, Basalkursus, uge 3 Opgavebesvarelse, Basalkursus, uge 3 Opgave 1: Udskrivning af astma patienter (DGA s. 273) I en randomiseret undersøgelse foretaget af Storr et. al. (Lancet, i, 1987) sammenlignes effekten af en enkelt

Læs mere

Faculty of Health Sciences. Basal statistik. Overlevelsesanalyse. Lene Theil Skovgaard. 1. april 2019

Faculty of Health Sciences. Basal statistik. Overlevelsesanalyse. Lene Theil Skovgaard. 1. april 2019 Faculty of Health Sciences Basal statistik Overlevelsesanalyse Lene Theil Skovgaard 1. april 2019 1 / 92 Overlevelsesanalyse Levetider og censurerede observationer Kaplan-Meier kurver Log-rank test Cox

Læs mere

Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013

Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013 Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013 I forbindelse med reagensglasbehandling blev 100 par randomiseret til to forskellige former for hormonstimulation.

Læs mere

1 Hb SS Hb Sβ Hb SC = , (s = )

1 Hb SS Hb Sβ Hb SC = , (s = ) PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.

Læs mere

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Lineær regression. Simpel regression. Model. ofte bruges følgende notation: Lineær regression Simpel regression Model Y i X i i ofte bruges følgende notation: Y i 0 1 X 1i i n i 1 i 0 Findes der en linie, der passer bedst? Metode - Generel! least squares (mindste kvadrater) til

Læs mere

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Statistik II Lektion 3 Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Setup: To binære variable X og Y. Statistisk model: Konsekvens: Logistisk regression: 2 binære var. e e X Y P

Læs mere

MPH specialmodul Epidemiologi og Biostatistik

MPH specialmodul Epidemiologi og Biostatistik MPH specialmodul Epidemiologi og Biostatistik Repetition af variansanalyse Overlevelsesanalyse Bestemmelse af stikprøvestørrelse Matchning 30. maj 2011 www.biostat.ku.dk/~sr/mphspec11 Susanne Rosthøj (Per

Læs mere

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1 Københavns Universitet Afdeling for Anvendt Matematik og Statistik Statistik for biokemikere Inge Henningsen Michael Sørensen Oktober 2003 Opgaver til ZAR II Opgave 1 Et datasæt består af 20 observationer.

Læs mere

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering Eksamen 2016 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 17-02-2015 Tid: kl. 09.00-11.00 Bedømmelsesform

Læs mere

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven. PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve

Læs mere

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april Århus 8. april 2011 Morten Frydenberg Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april Opgave 1 ( gruppe 1: sp 1-4, gruppe 5: sp 5-9 og gruppe 6: 10-14) I denne opgaveser vi på et

Læs mere

Postoperative komplikationer

Postoperative komplikationer Løsninger til øvelser i kategoriske data, oktober 2008 1 Postoperative komplikationer Udgangspunktet for vurdering af den ny metode må være en nulhypotese om at der er samme komplikationshyppighed, 20%.

Læs mere

Logistisk regression. Basal Statistik for medicinske PhD-studerende November 2008

Logistisk regression. Basal Statistik for medicinske PhD-studerende November 2008 Logistisk regression Basal Statistik for medicinske PhD-studerende November 2008 Bendix Carstensen Steno Diabetes Center, Gentofte & Biostatististisk afdeling, Københavns Universitet bxc@steno.dk www.biostat.ku.dk/~bxc

Læs mere

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl Eksamen 2018 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 20-02-2018 Tid: kl. 09.00-11.00 Bedømmelsesform

Læs mere

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge Statistik og Sandsynlighedsregning 2 IH kapitel 12 Overheads til forelæsninger, mandag 6. uge 1 Fordelingen af én (1): Regressionsanalyse udfaldsvariabel responsvariabel afhængig variabel Y variabel 2

Læs mere

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Statikstik II 2. Lektion Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Sandsynlighedsregningsrepetition Antag at Svar kan være Ja og Nej. Sandsynligheden for at Svar Ja skrives

Læs mere

2 Epidemiologi og biostatistik. Uge 5, mandag 26. september 2005 Michael Væth, Institut for Biostatistik

2 Epidemiologi og biostatistik. Uge 5, mandag 26. september 2005 Michael Væth, Institut for Biostatistik ... september 1 Epidemiologi og biostatistik. Uge, mandag. september Michael Væth, Institut for Biostatistik. Ikke parametrisk statistiske test : Analyse af overlevelsesdata (ventetidsdata) Censurering

Læs mere

Statistik II 4. Lektion. Logistisk regression

Statistik II 4. Lektion. Logistisk regression Statistik II 4. Lektion Logistisk regression Logistisk regression: Motivation Generelt setup: Dikotom(binær) afhængig variabel Kontinuerte og kategoriske forklarende variable (som i lineær reg.) Eksempel:

Læs mere

Logistisk regression

Logistisk regression Logistisk regression Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk 21. marts 2013 Dagens program Chi-i-anden (χ 2 )-testet Sandsynligheder,

Læs mere

Vejledende besvarelse af hjemmeopgave i Basal Statistik, forår 2014

Vejledende besvarelse af hjemmeopgave i Basal Statistik, forår 2014 Vejledende besvarelse af hjemmeopgave i Basal Statistik, forår 2014 Garvey et al. interesserer sig for sammenhængen mellem anæstesi og allergiske reaktioner (se f.eks. nedenstående reference, der dog ikke

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Eksamensopgave E05 Socialklasse og kronisk sygdom Data: Tværsnitsundersøgelse fra 1986 Datamaterialet indeholder: Køn, alder, Højest opnåede

Læs mere

Basal statistik. 30. oktober 2007

Basal statistik. 30. oktober 2007 Basal statistik 30. oktober 2007 Den generelle lineære model Repetition af variansanalyse og multipel regression Interaktion Kovariansanalyse Parametriseringer Lene Theil Skovgaard, Biostatistisk Afdeling

Læs mere

Kommentarer til spørgsmålene til artikel 1: Ethnic differences in mortality from sudden death syndrome in New Zealand, Mitchell et al., BMJ 1993.

Kommentarer til spørgsmålene til artikel 1: Ethnic differences in mortality from sudden death syndrome in New Zealand, Mitchell et al., BMJ 1993. Kommentarer til spørgsmålene til artikel 1: Ethnic differences in mortality from sudden death syndrome in New Zealand, Mitchell et al., BMJ 1993. 1. Det anføres, at OR for maorier vs. ikke-maorier er 3.81.

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Mantel-Haenszel analyser

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Mantel-Haenszel analyser Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Mantel-Haenszel analyser Mantel-Haenszel analyser Sidst lærte vi om stratificerede analyser. I dag kigger vi på et specialtilfælde: både exposure

Læs mere

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17 nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse

Læs mere

Uge 13 referat hold 4

Uge 13 referat hold 4 Uge 13 referat hold 4 Gruppearbejde 1a: Er variablen kvotient inkluderet på en hensigtsmæssig måde? Der er to problemer med kvotient: 1) Den er trunkeret ved 6.9 og 10.0, løsningen er at indføre dummyer

Læs mere

Morten Frydenberg 14. marts 2006

Morten Frydenberg 14. marts 2006 Introduktion til Logistisk Regression Morten Frydenberg, Inst. f. Biostatistik 1 RESUME: 2 2. gang: 2006 Institut for Biostatistik, Århus Universitet MPH 1. studieår Specialmodul 4 Cand. San. uddannelsen

Læs mere

Statistiske Modeller 1: Kontingenstabeller i SAS

Statistiske Modeller 1: Kontingenstabeller i SAS Statistiske Modeller 1: Kontingenstabeller i SAS Jens Ledet Jensen October 31, 2005 1 Indledning Som vist i Notat 1 afsnit 13 er 2 log Q for et test i en multinomialmodel ækvivalent med et test i en poissonmodel.

Læs mere

Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration

Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration Faculty of Life Sciences Program Modelkontrol og prædiktion Claus Ekstrøm E-mail: ekstrom@life.ku.dk Test af hypotese i ensidet variansanalyse F -tests og F -fordelingen. Multiple sammenligninger. Bonferroni-korrektion

Læs mere

REEKSAMEN I EPIDEMIOLOGISKE METODER IT & Sundhed, 2. semester

REEKSAMEN I EPIDEMIOLOGISKE METODER IT & Sundhed, 2. semester D E T S U N D H E D S V I D E N S K A B E L I G E F A K U L T E T K Ø B E N H A V N S U N I V E R S I T E T B l e g d a m s v e j 3 B 2 2 0 0 K ø b e n h a v n N REEKSAMEN I EPIDEMIOLOGISKE METODER IT

Læs mere

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer.

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer. Vejledende besvarelse af hjemmeopgave Basal statistik, efterår 2008 En gruppe bestående af 45 patienter med reumatoid arthrit randomiseres til en af 6 mulige behandlinger, nemlig placebo, aspirin eller

Læs mere

PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006

PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006 PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006 I dag: To stikprøver fra en normalfordeling, ikke-parametriske metoder og beregning af stikprøvestørrelse Eksempel: Fiskeolie

Læs mere

Basal statistik. 30. oktober Den generelle lineære model

Basal statistik. 30. oktober Den generelle lineære model Basal statistik 30. oktober 2007 Den generelle lineære model Repetition af variansanalyse og multipel regression Interaktion Kovariansanalyse Parametriseringer Lene Theil Skovgaard, Biostatistisk Afdeling

Læs mere

Analyse af binære responsvariable

Analyse af binære responsvariable Analyse af binære responsvariable Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet 23. november 2012 Har mænd lettere ved at komme ind på Berkeley? UC Berkeley

Læs mere

Vejledende besvarelse af hjemmeopgave, forår 2015

Vejledende besvarelse af hjemmeopgave, forår 2015 Vejledende besvarelse af hjemmeopgave, forår 2015 En stikprøve bestående af 65 mænd og 65 kvinder er blevet undersøgt med henblik på at se på en evt. sammenhæng mellem kropstemperatur og puls. På hjemmesiden

Læs mere

Simpel og multipel logistisk regression

Simpel og multipel logistisk regression Faculty of Health Sciences Logistisk regression Simpel og multipel logistisk regression 16. Maj 2012 Analyse af en binær responsvariabel. syg/rask, død/levende, ja/nej... Ud fra en eller flere forklarende

Læs mere

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Motiverende eksempel Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning

Læs mere

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Motiverende eksempel Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Normalfordelingen. Statistik og Sandsynlighedsregning 2 Normalfordelingen Statistik og Sandsynlighedsregning 2 Repetition og eksamen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige fejl på

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Opgavebesvarelse, logistisk regression

Opgavebesvarelse, logistisk regression Opgavebesvarelse, logistisk regression Data ligger i rop.xls på kursushjemmesiden: http://staff.pubhealth.ku.dk/ jufo/courses/logistic/ Når du har gemt data på din computer, kan det indlæses i SAS med

Læs mere

Løsning eksamen d. 15. december 2008

Løsning eksamen d. 15. december 2008 Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Logistisk Regression - fortsat

Logistisk Regression - fortsat Logistisk Regression - fortsat Likelihood Ratio test Generel hypotese test Modelanalyse Indtil nu har vi set på to slags modeller: 1) Generelle Lineære Modeller Kvantitav afhængig variabel. Kvantitative

Læs mere

Basal statistik. 30. januar 2007

Basal statistik. 30. januar 2007 Basal statistik 30. januar 2007 Deskriptiv statistik Typer af data Tabeller Grafik Summary statistics Lene Theil Skovgaard, Biostatistisk Afdeling Institut for Folkesundhedsvidenskab, Københavns Universitet

Læs mere

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test Statistik Lektion 0 Ikkeparametriske metoder Repetition KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

Eksamen i Statistik for Biokemikere, Blok januar 2009

Eksamen i Statistik for Biokemikere, Blok januar 2009 Københavns Universitet Det Naturvidenskabelige Fakultet Eksamen i Statistik for Biokemikere, Blok 2 2008 09 19. januar 2009 Alle hjælpemidler er tilladt, og besvarelsen må gerne skrives med blyant. Opgavesættet

Læs mere

Besvarelse af vitcap -opgaven

Besvarelse af vitcap -opgaven Besvarelse af -opgaven Spørgsmål 1 Indlæs data Dette gøres fra Analyst med File/Open, som sædvanlig. Spørgsmål 2 Beskriv fordelingen af vital capacity og i de 3 grupper ved hjælp af summary statistics.

Læs mere

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Anvendt Statistik Lektion 8. Multipel Lineær Regression Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke

Læs mere

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af

Læs mere

Øvelse 7: Aktuar-tabeller, Kaplan-Meier kurver og log-rank test

Øvelse 7: Aktuar-tabeller, Kaplan-Meier kurver og log-rank test Øvelse 7: Aktuar-tabeller, Kaplan-Meier kurver og log-rank test Formålet med øvelsen er at analysere risikoen for død forbundet med forskelligt alkoholforbrug. I denne øvelse skal analyserne foretages

Læs mere

Faculty of Health Sciences. Basal Statistik. Logistisk regression mm. Lene Theil Skovgaard. 5. marts 2018

Faculty of Health Sciences. Basal Statistik. Logistisk regression mm. Lene Theil Skovgaard. 5. marts 2018 Faculty of Health Sciences Basal Statistik Logistisk regression mm. Lene Theil Skovgaard 5. marts 2018 1 / 22 APPENDIX vedr. SPSS svarende til diverse slides: To-gange-to tabeller, s. 3 Plot af binære

Læs mere

Multipel Lineær Regression

Multipel Lineær Regression Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer

Læs mere

Vi ønsker at konstruere normalområder for stofskiftet, som funktion af kropsvægten.

Vi ønsker at konstruere normalområder for stofskiftet, som funktion af kropsvægten. Opgavebesvarelse, Resting metabolic rate I filen T:\rmr.txt findes sammenhørende værdier af kropsvægt (bw, i kg) og hvilende stofskifte (rmr, kcal pr. døgn) for 44 kvinder (Altman, 1991 og Owen et.al.,

Læs mere

Forelæsning 11: Kapitel 11: Regressionsanalyse

Forelæsning 11: Kapitel 11: Regressionsanalyse Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Løsning til øvelsesopgaver dag 4 spg 5-9

Løsning til øvelsesopgaver dag 4 spg 5-9 Løsning til øvelsesopgaver dag 4 spg 5-9 5: Den multiple model Vi tilføjer nu yderligere to variable til vores model : Køn og kolesterol SBP = a + b*age + c*chol + d*mand hvor mand er 1 for mænd, 0 for

Læs mere

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge Statistik og Sandsynlighedsregning 2 Repetition og eksamen Overheads til forelæsninger, mandag 7. uge 1 Normalfordelingen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange

Læs mere

Opgavebesvarelse, Basalkursus, uge 3

Opgavebesvarelse, Basalkursus, uge 3 Opgavebesvarelse, Basalkursus, uge 3 Opgave 1: Udskrivning af astma patienter (DGA s. 273) I en randomiseret undersøgelse foretaget af Storr et. al. (Lancet, i, 1987) sammenlignes effekten af en enkelt

Læs mere

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j Hypoteser om mere end to stikprøver ANOVA k stikprøver: (ikke ordinale eller højere) H 0 : 1 2... k gælder også for k 2! H 0ij : i j H 0ij : i j simpelt forslag: k k 1 2 t-tests: i j DUER IKKE! Bonferroni!!

Læs mere

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl Reeksamen 2018 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 13-08-2018 Tid: kl. 09.00-11.00 Bedømmelsesform

Læs mere