Logistisk regression http://biostat.ku.dk/ kach/css2 Thomas A Gerds & Karl B Christensen 1 / 18
Logistisk regression I dag 1 Binær outcome variable død : i live syg : rask gravid : ikke gravid etc 1 prædiktor variable (enten kategorisk eller kontinuert) Risiko, odds Case-control data Binary logistisk regression 1 Kirkwood & Sterne kapitel 19. 2 / 18
Odds Odds er nødvendigt til case-control studier logistisk regression Kan regne frem og tilbage: odds = p/(1 p) p = odds/(1 + odds) tolke Odds er sværere at forstå, men når p er lille gælder p odds. Anden måde at udtrykke sandsynlighed. Eks.: Sandsynlighed for sygdom Odds for sygdom p odds=p/(1-p) 0,25 0,025 0,0256 0,17 0,2048 0,39 0,6393 3 / 18
Warm-up øvelser Åbne den her artikel 2 (den handler om rygsmerter og benytter logistisk regression): http://publicifsv.sund.ku.dk/~kach/css2/nabe-nielsen% 20et%20al%20(2008).pdf 1. nd ud af: study form denition af response denition af eksponeringsvariabler 2. prevalence (sandsynlighed) af response bland sygeplejersker i studiet 3. beregn odds af response bland sygeplejersker 2 https://www.ncbi.nlm.nih.gov/pmc/articles/pmc2390553/ 4 / 18
Videnskabelig rapport som brugte logistisk regression Nabe-Nielsen K, Fallentin N, Christensen KB, Jensen JN, Diderichsen F BMC Musculoskelet Disord. 2008;9:61 Background Low back pain (LBP) is a frequent health complaint among health care personnel. Methods A questionnaire was distributed to 535 hospital employees in a psychiatric and an orthopedic ward in a Danish hospital. Of these 411 (77%) lled in and returned the questionnaire. Only the 373 respondents who had non-missing values on both measures of physical demands were included in the analyses...., and logistic regression analysis is used to analyze the association between measures of physical demands and LBP. Results... the odds ratio for LBP was 5.38 (95% CI 2.0314.29) in the group performing more than 10 compared to the group performing 0-2 patient handling tasks per day. 5 / 18
6 / 18
Terminologi Prevalence = risiko = sandsynlighed for outcome (respons positiv) Prevalence odds ratio = odds ratio Odds ratio = ændring af odds for en enheds ændring i eksponeringsvariable Crude odds ratio = en eksponeringsvariable af gangen i logistisk regression Adjusted odds ratio = ere eksponeringsvariabler i sammen logistisk regression SPSS logistisk regression = binary logistic regression outcome = dependent variable eksponeringsvariable = covariate 7 / 18
Flere warm-up øvelser Risiko af LBP bland sygeplejersker = 39% Crude odds ratio odds: > 10 patient handling tasks per day odds: 0 2 patient handling tasks = 6.1 Antage at odds for LBP bland sygeplejersker med 0-2 patient handling tasks er 0.5. Beregn odds for LBP bland sygeplejersker med >10 patient handling tasks Beregn risiko i de to grupper Beregn risiko ratio 8 / 18
Case-control studie Data indsamlet ved at man har nogen cases og derefter indsamler data på sammenlignelige kontroller. F.eks., 1 kontrol per case 4 kontroller per case 10 kontroller per case Man kan ikke beregne risiko og risiko ratio, fordi "risiko" er per design (f.eks., 1/2, 1/5, 1/11). Man kan beregne odds ratio præcis som hvis data havde været indsamlet som et kohorte studium. Fordel: nemmere at få mange cases end i kohortestudie Ulemper: kan kun estimere odds ratio odds ratio risiko ratio kun når risiko er lille 9 / 18
Simple logistisk regression For kun en eksponeringsvariable logistisk regressions modellen er givet ved log(odds) = log(baseline) + log(covariate odds ratio) Eksempler Covariate Covariate odds ratio Baseline sex alder patient handling tasks odds(kvinde) odds(mand) odds(alder x+1) odds(alder x+1) odds(>10) odds(0-2) mand alder 0 0-2 odds(3-10) odds(0-2) 10 / 18
Illustration: Lungefunktion hos peruvianske børn Kohorte studie. En linie for hvert barn. En søjle for hver variabel fev1 age height sex respsymptoms 1: 1,56 9,593 124,8 0 0 2: 1,87 9,864 135,7 0 0 3: 1,49 8,588 119,1 0 0 4: 2,11 9,293 134,3 0 1 5: 1,47 8,493 122,6 0 1 --- 632: 1,89 9,807 131,8 1 0 633: 2,11 8,496 136,7 1 0 634: 1,65 10,03 123,9 1 0 635: 2,09 8,488 130,5 1 0 636: 0,64 7,469 118,4 1 1 pige: sex = 0, dreng: sex = 1 11 / 18
Illustration: Lungefunktion hos peruvianske børn Outcome respsymp = { 1 symptomer 0 ingen symptomer Eksposure sex (kategorisk covariate) Videnskabelig spørgsmål Hvor meget afhænger risiko for respiratoriske symptomer barnets køn? 12 / 18
Logistisk regression: kategorisk eksponering Model log(odds) = { β 0 β 0 + β 1 pige dreng Transformation odds(pige) = exp(β 0 ) odds(dreng) = exp(β 0 + β 1 ) = exp(β 0 ) exp(β 1 ) Odds ratio odds(dreng) odds(pige) = exp(β 0) exp(β 1 ) = exp(β 1 ) exp(β 0 ) Nullhypothese β 1 = 0 exp(β 1 ) = 1 (odds for piger = odds for drenge) 13 / 18
SPSS: Logistisk regression med 1 binær eksponering Film http://biostat.ku.dk/~kach/css2/spss_logregr2.gif Resultater Dreng er reference kategori! Søjle B: β0 = Intercept = Constant = log(odds) for drenge = -1,309 β1 = log(odds ratio) = 0,166 Søjle Exp(B): exp(β 0 ) = odds for drenge = 0,27 exp(β 1 ) = odds ratio (piger/drenge) = 1,181 Test af nullhypothese: p-værdi = Sig. = 0,382 ikke signikant Kondensintervallet [0,81;1,71] inkludere nullhypothese (OR =1) hvor piger har ens risiko for respiratoriske symptomer som drenge. Konklusion Piger har højere sandsynlighed for respiratoriske symptomer end drenge men ikke signikant højere (OR=1,18; CI 95 %: [0,81;1.71]; p=0,382). 14 / 18
Illustration: Lungefunktion hos peruvianske børn Outcome respsymp = { 1 symptomer 0 ingen symptomer Eksposure alder (år, kontinuert covariate) Videnskabelig spørgsmål Hvor meget afhænger risiko for respiratoriske symptomer barnets alder? 15 / 18
Logistisk regression: kontinuert eksponeringsvariable Model log(odds) = β 0 + β 1 alder Transformation odds(alder = 8) = exp(β 0 + β 1 8) = exp(β 0 ) exp(β 1 8) odds(alder = 9) = exp(β 0 + β 1 9) = exp(β 0 ) exp(β 1 9) Odds ratio odds(alder 8+1) odds(alder 8) = exp(β 0) exp(β 1 9) exp(β 0 ) exp(β 1 8) = exp(β 1(9 8)) = exp(β 1 ) Nullhypothese β 1 = 0 exp(β 1 ) = 1 (odds for alder x = odds for alder x+1) 16 / 18
SPSS: Logistisk regression med 1 kontinuert eksponeringsvariable Film http://biostat.ku.dk/~kach/css2/spss_logregr.gif Resultater Søjle B: β0 = Intercept = Constant = log(odds) for alder 0 år = 4,034 β 1 = log(odds ratio) = -0,59 Søjle Exp(B): exp(β0 ) = odds for alder 0 = 56,472 (ingen interpretation!) exp(β 1 ) = odds ratio (alder x+1/alder x) = 0,554 Test af nullhypothese: p-værdi = Sig. = 0,000 signikant Kondensintervallet [0,424;0,724] inkludere ikke nullhypothese (OR =1) hvor alder x+1 har ens risiko for respiratoriske symptomer som alder x. Konklusion Sandsynlighed for respiratoriske symptomer fælder signikant med barnets alder (OR=0,554; CI 95 %: [0,424;0,724]; p<0.001). 17 / 18
Prædiktion Generalt Logistisk regression kan prædicere sandsynligheden (risiko) for outcome for given værdier af eksponeringsvariablen. Det giver kun mening hvis: kohorte studie værdierne er repræsenteret i datasæt Eksempel For alder=7,8 er sandsynligheden for respiratoriske symptomer: π 7 = exp(β 0+β 1 7) 1+exp(β 0 +β 1 7) og π 8 = exp(β 0+β 1 8) 1+exp(β 0 +β 1 8). Film http://biostat.ku.dk/~kach/css2/spss_logregr_pred.gif 18 / 18