Logistisk regression

Relaterede dokumenter
9. Chi-i-anden test, case-control data, logistisk regression.

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression

1 Multipel lineær regression

1 Multipel lineær regression

Lineær og logistisk regression

Morten Frydenberg 26. april 2004

Logistisk Regression - fortsat

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april

MPH specialmodul i biostatistik og epidemiologi SAS-øvelser vedr. case-control studie af malignt melanom.

Faculty of Health Sciences. Logistisk regression: Kvantitative forklarende variable

Logistisk regression. Basal Statistik for medicinske PhD-studerende November 2008

25. april Probability of Developing Coronary Heart Disease in 6 years. Women (Aged 35-70) 160 No Yes

Løsning til opgave i logistisk regression

Logistisk regression. Statistik Kandidatuddannelsen i Folkesundhedsvidenskab

Vi vil analysere effekten af rygning og alkohol på chancen for at blive gravid ved at benytte forskellige Cox regressions modeller.

Logistisk regression

Epidemiologiske associationsmål

Eksamen Efterår 2013

Morten Frydenberg 14. marts 2006

Faculty of Health Sciences. Basal Statistik. Logistisk regression mm. Lene Theil Skovgaard. 5. marts 2018

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model

WEEKEND EFFEKT I AKUTAFDELINGEN EKSISTERER DEN OG HVAD KAN ÅRSAGEN VÆRE?

Hvor skal man udføre akutmedicinsk forskning? Finn E. Nielsen Forskningslektor, overlæge, dr.med. MPA, MAppStat

Dag 6: Interaktion. Overlevelsesanalyse

Multipel Lineær Regression

Kommentarer til spørgsmålene til artikel 1: Ethnic differences in mortality from sudden death syndrome in New Zealand, Mitchell et al., BMJ 1993.

Faculty of Health Sciences. Miscellaneous: Styrkeberegninger Overlevelsesanalyse Analyse af matchede studier

Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

MPH specialmodul Epidemiologi og Biostatistik

Epidemiologiske associationsmål

Overlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere.

Morten Frydenberg Biostatistik version dato:

Statistik for MPH: 7

Statistik II 4. Lektion. Logistisk regression

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper.

EPIDEMIOLOGI MODUL 7. April Søren Friis Institut for Epidemiologisk Kræftforskning Kræftens Bekæmpelse DAGENS PROGRAM

Basal Statistik Logistisk Regression. Dagens Tekst E Sædvanlig Linear Regression (Repetition) Basal Statistik - Logistisk regression 1

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Træningsaktiviteter dag 3

Besvarelse af juul2 -opgaven

2 Logaritme- og eksponentialfunktion 6

X M Y. What is mediation? Mediation analysis an introduction. Definition

Besvarelse af opgavesættet ved Reeksamen forår 2008

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression

Krydstabeller Forventede under nulhypotesen Ki-kvadrat test Residualanalyse Eksakt test

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

Confounding og stratificeret analyse

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse

Morten Frydenberg 25. april 2006

Analyse af binære responsvariable

Alkoholforebyggelse blandt danske skoleelever

Simpel og multipel logistisk regression

Regressionsanalyser. Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer.

Selektionsbias. Mads Kamper-Jørgensen, lektor, Afdeling for Social Medicin, Institut for Folkesundhedsvidenskab

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk

Logistisk regression

Opgavebesvarelse, logistisk regression

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Ønsket dødssted for danske cancer patienter

Faculty of Health Sciences. Basal Statistik. Overlevelsesanalyse. Lene Theil Skovgaard. 12. marts 2018

Kvant Eksamen December timer med hjælpemidler. 1 Hvad er en continuous variable? Giv 2 illustrationer.

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Uafhængighedstestet

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Mantel-Haenszel analyser

1 Regressionsproblemet 2

Postoperative komplikationer

applies equally to HRT and tibolone this should be made clear by replacing HRT with HRT or tibolone in the tibolone SmPC.

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse

Det Danske Bloddonorstudie. Kristoffer Burgdorf og Christian Erikstrup

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge

2. Hvilke(t) epidemiologisk(e) design(s) anvender forfatterne til at belyse problemstillingen? (7 point)

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Præcision og effektivitet (efficiency)?

Studiedesign. Rikke Guldberg Ulrik Schiøler Kesmodel Øjvind Lidegaard

Eks. 1: Kontinuert variabel som i princippet kan måles med uendelig præcision. tid, vægt,

HÅNDTERING AF RISIKOFAKTORER FOR SYGDOM Medicinforbrug og selvvurderet helbred

Generelle lineære modeller

24. februar Analyse af overlevelsesdata (ventetidsdata) Ikke parametrisk statistiske test : Det statistiske modelbegreb Modelselektion

Opsamling Modeltyper: Tabelanalyse Logistisk regression Generaliserede lineære modeller Log-lineære modeller

Statistik Lektion 16 Multipel Lineær Regression

Morten Frydenberg Biostatistik version dato:

Epidemiology of Headache

Når giver 3 : Mixed methods inden for sundhedsvidenskabelig forskning

REEKSAMEN I EPIDEMIOLOGISKE METODER IT & Sundhed, 2. semester

OR stiger eksponentielt med forskellen i BMI. kompliceret model svær at forstå og analysere

Hyppigheds- og associationsmål. Kim Overvad Afdeling for Epidemiologi Institut for Folkesundhed Aarhus Universitet Februar 2011

Korrelation Pearson korrelationen

Opgavebesvarelse, Basalkursus, uge 3

Statistik Lektion 4. Variansanalyse Modelkontrol

Overlevelsesfunktion. Vi kalder S(t) for overlevelsesfunktionen.

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Basal statistik for lægevidenskabelige forskere, forår 2014 Udleveret 4. marts, afleveres senest ved øvelserne i uge 13 (25.

OR stiger eksponentielt med forskellen i BMI komplicet model svær at forstå og analysere simpel model

Danish translation of the Foot and Ankle Outcome Score

Forvaltning / Politik og Administration / Socialvidenskab

Opgavebesvarelse, Basalkursus, uge 3

Transkript:

Logistisk regression http://biostat.ku.dk/ kach/css2 Thomas A Gerds & Karl B Christensen 1 / 18

Logistisk regression I dag 1 Binær outcome variable død : i live syg : rask gravid : ikke gravid etc 1 prædiktor variable (enten kategorisk eller kontinuert) Risiko, odds Case-control data Binary logistisk regression 1 Kirkwood & Sterne kapitel 19. 2 / 18

Odds Odds er nødvendigt til case-control studier logistisk regression Kan regne frem og tilbage: odds = p/(1 p) p = odds/(1 + odds) tolke Odds er sværere at forstå, men når p er lille gælder p odds. Anden måde at udtrykke sandsynlighed. Eks.: Sandsynlighed for sygdom Odds for sygdom p odds=p/(1-p) 0,25 0,025 0,0256 0,17 0,2048 0,39 0,6393 3 / 18

Warm-up øvelser Åbne den her artikel 2 (den handler om rygsmerter og benytter logistisk regression): http://publicifsv.sund.ku.dk/~kach/css2/nabe-nielsen% 20et%20al%20(2008).pdf 1. nd ud af: study form denition af response denition af eksponeringsvariabler 2. prevalence (sandsynlighed) af response bland sygeplejersker i studiet 3. beregn odds af response bland sygeplejersker 2 https://www.ncbi.nlm.nih.gov/pmc/articles/pmc2390553/ 4 / 18

Videnskabelig rapport som brugte logistisk regression Nabe-Nielsen K, Fallentin N, Christensen KB, Jensen JN, Diderichsen F BMC Musculoskelet Disord. 2008;9:61 Background Low back pain (LBP) is a frequent health complaint among health care personnel. Methods A questionnaire was distributed to 535 hospital employees in a psychiatric and an orthopedic ward in a Danish hospital. Of these 411 (77%) lled in and returned the questionnaire. Only the 373 respondents who had non-missing values on both measures of physical demands were included in the analyses...., and logistic regression analysis is used to analyze the association between measures of physical demands and LBP. Results... the odds ratio for LBP was 5.38 (95% CI 2.0314.29) in the group performing more than 10 compared to the group performing 0-2 patient handling tasks per day. 5 / 18

6 / 18

Terminologi Prevalence = risiko = sandsynlighed for outcome (respons positiv) Prevalence odds ratio = odds ratio Odds ratio = ændring af odds for en enheds ændring i eksponeringsvariable Crude odds ratio = en eksponeringsvariable af gangen i logistisk regression Adjusted odds ratio = ere eksponeringsvariabler i sammen logistisk regression SPSS logistisk regression = binary logistic regression outcome = dependent variable eksponeringsvariable = covariate 7 / 18

Flere warm-up øvelser Risiko af LBP bland sygeplejersker = 39% Crude odds ratio odds: > 10 patient handling tasks per day odds: 0 2 patient handling tasks = 6.1 Antage at odds for LBP bland sygeplejersker med 0-2 patient handling tasks er 0.5. Beregn odds for LBP bland sygeplejersker med >10 patient handling tasks Beregn risiko i de to grupper Beregn risiko ratio 8 / 18

Case-control studie Data indsamlet ved at man har nogen cases og derefter indsamler data på sammenlignelige kontroller. F.eks., 1 kontrol per case 4 kontroller per case 10 kontroller per case Man kan ikke beregne risiko og risiko ratio, fordi "risiko" er per design (f.eks., 1/2, 1/5, 1/11). Man kan beregne odds ratio præcis som hvis data havde været indsamlet som et kohorte studium. Fordel: nemmere at få mange cases end i kohortestudie Ulemper: kan kun estimere odds ratio odds ratio risiko ratio kun når risiko er lille 9 / 18

Simple logistisk regression For kun en eksponeringsvariable logistisk regressions modellen er givet ved log(odds) = log(baseline) + log(covariate odds ratio) Eksempler Covariate Covariate odds ratio Baseline sex alder patient handling tasks odds(kvinde) odds(mand) odds(alder x+1) odds(alder x+1) odds(>10) odds(0-2) mand alder 0 0-2 odds(3-10) odds(0-2) 10 / 18

Illustration: Lungefunktion hos peruvianske børn Kohorte studie. En linie for hvert barn. En søjle for hver variabel fev1 age height sex respsymptoms 1: 1,56 9,593 124,8 0 0 2: 1,87 9,864 135,7 0 0 3: 1,49 8,588 119,1 0 0 4: 2,11 9,293 134,3 0 1 5: 1,47 8,493 122,6 0 1 --- 632: 1,89 9,807 131,8 1 0 633: 2,11 8,496 136,7 1 0 634: 1,65 10,03 123,9 1 0 635: 2,09 8,488 130,5 1 0 636: 0,64 7,469 118,4 1 1 pige: sex = 0, dreng: sex = 1 11 / 18

Illustration: Lungefunktion hos peruvianske børn Outcome respsymp = { 1 symptomer 0 ingen symptomer Eksposure sex (kategorisk covariate) Videnskabelig spørgsmål Hvor meget afhænger risiko for respiratoriske symptomer barnets køn? 12 / 18

Logistisk regression: kategorisk eksponering Model log(odds) = { β 0 β 0 + β 1 pige dreng Transformation odds(pige) = exp(β 0 ) odds(dreng) = exp(β 0 + β 1 ) = exp(β 0 ) exp(β 1 ) Odds ratio odds(dreng) odds(pige) = exp(β 0) exp(β 1 ) = exp(β 1 ) exp(β 0 ) Nullhypothese β 1 = 0 exp(β 1 ) = 1 (odds for piger = odds for drenge) 13 / 18

SPSS: Logistisk regression med 1 binær eksponering Film http://biostat.ku.dk/~kach/css2/spss_logregr2.gif Resultater Dreng er reference kategori! Søjle B: β0 = Intercept = Constant = log(odds) for drenge = -1,309 β1 = log(odds ratio) = 0,166 Søjle Exp(B): exp(β 0 ) = odds for drenge = 0,27 exp(β 1 ) = odds ratio (piger/drenge) = 1,181 Test af nullhypothese: p-værdi = Sig. = 0,382 ikke signikant Kondensintervallet [0,81;1,71] inkludere nullhypothese (OR =1) hvor piger har ens risiko for respiratoriske symptomer som drenge. Konklusion Piger har højere sandsynlighed for respiratoriske symptomer end drenge men ikke signikant højere (OR=1,18; CI 95 %: [0,81;1.71]; p=0,382). 14 / 18

Illustration: Lungefunktion hos peruvianske børn Outcome respsymp = { 1 symptomer 0 ingen symptomer Eksposure alder (år, kontinuert covariate) Videnskabelig spørgsmål Hvor meget afhænger risiko for respiratoriske symptomer barnets alder? 15 / 18

Logistisk regression: kontinuert eksponeringsvariable Model log(odds) = β 0 + β 1 alder Transformation odds(alder = 8) = exp(β 0 + β 1 8) = exp(β 0 ) exp(β 1 8) odds(alder = 9) = exp(β 0 + β 1 9) = exp(β 0 ) exp(β 1 9) Odds ratio odds(alder 8+1) odds(alder 8) = exp(β 0) exp(β 1 9) exp(β 0 ) exp(β 1 8) = exp(β 1(9 8)) = exp(β 1 ) Nullhypothese β 1 = 0 exp(β 1 ) = 1 (odds for alder x = odds for alder x+1) 16 / 18

SPSS: Logistisk regression med 1 kontinuert eksponeringsvariable Film http://biostat.ku.dk/~kach/css2/spss_logregr.gif Resultater Søjle B: β0 = Intercept = Constant = log(odds) for alder 0 år = 4,034 β 1 = log(odds ratio) = -0,59 Søjle Exp(B): exp(β0 ) = odds for alder 0 = 56,472 (ingen interpretation!) exp(β 1 ) = odds ratio (alder x+1/alder x) = 0,554 Test af nullhypothese: p-værdi = Sig. = 0,000 signikant Kondensintervallet [0,424;0,724] inkludere ikke nullhypothese (OR =1) hvor alder x+1 har ens risiko for respiratoriske symptomer som alder x. Konklusion Sandsynlighed for respiratoriske symptomer fælder signikant med barnets alder (OR=0,554; CI 95 %: [0,424;0,724]; p<0.001). 17 / 18

Prædiktion Generalt Logistisk regression kan prædicere sandsynligheden (risiko) for outcome for given værdier af eksponeringsvariablen. Det giver kun mening hvis: kohorte studie værdierne er repræsenteret i datasæt Eksempel For alder=7,8 er sandsynligheden for respiratoriske symptomer: π 7 = exp(β 0+β 1 7) 1+exp(β 0 +β 1 7) og π 8 = exp(β 0+β 1 8) 1+exp(β 0 +β 1 8). Film http://biostat.ku.dk/~kach/css2/spss_logregr_pred.gif 18 / 18