Regressonsanalyse Epdemolog og Bostatstk Mogens Erlandsen, Insttut for Bostatstk Uge, torsdag (forelæsnng) 1.Smpel lneær regresson (Kaptel 11) systolsk blodtryk og alder. Multpel lneær regresson (Kaptel 17) systolsk blodtryk, alder og ( grupper). Multpel lneær regresson (Kaptel 17) systolsk blodtryk, alder og kolesterol 1 n = y = 19. sd = 1. Lgner det en normalfordelng??? Blodtryk afhænger af alder responsvarabel afhængge varabel y Kan noget af varatonen blodtryk forklares ved en tlsvarende varaton alderen? forklarende varabel uafhængge varabel x Er der en sammenhæng mellem blodtryk og alder? 9.. 11. 1. 1. 1. 1. 1. 17. 1. Kan noget af varatonen alder forklares ved en tlsvarende varaton blodtryk!? Hver observaton () består af et sammenhørende par af målnger ( x, y ) 1 1 Obs Nr 1 Scatter plot [] Obs Nr [x ] [y ] Blodtryk (år) 1 1 1 1 1 1 1 1 1 1 1
Den bedste rette lne? Smpel lneær afhængghed mellem y og x 1 a b y = a + b x + "tlfældg varaton" Lgnng for en ret lne afskærng eller ntercept hældnng eller regressonskoeffcent a og b er ukendte (parametre) (Statstsk) model Excel, Quattro Pro, SPSS, SAS etc. kan beregne lneær regresson, dvs a og b 1 1 1 1 1 1 y =19. (afhænger kke af alder) 7 Standard 9% CI Estmat error Nedre Øvre Intercept(ˆ α ). 1.. 1. Hældnng ( ˆβ ).99.9.17 1. Den bedste rette lne y=.+.99 x y = x = Fortolknng af hældnngen bˆ : hvs v sammenlgner tlfældge personer, hvor den ndbyrdes aldersforskel er 1 år, vl v forvente, at den ældste har et systolsk blodtryk, der er.99 mm Hg større end den yngste Fortolknng af hældnngen bˆ er kke: Når jeg blver 1 år ældre stger mt blodtryk med.99 mm Hg Fortolknng af nterceptet ( aˆ), se på tl øvelserne 9 Størrelsen af nterceptet spller ofte en mndre rolle. Blodtryk hos en person, der er år gammel!? En enkelt formel: se( bˆ x) = se( bˆ ) x F.eks. hvad er den forventede forskel blodtryk på personer med en aldersforskel på år? bˆ =.99 = 9.9 se( bˆ ) = se( bˆ ) =.9 =.9 1 1 1 1 1 1 1 resdualer = 7 (obs nr) yˆ = aˆ + bˆ 7 =.+.99 = 1. r = y yˆ 7 7 7 = 1. 1. =.7 11 1
1 1 1 1 1 1 1 Predktonsnterval= regressonslne +/- 1.9 sd tlfældg varaton= resdualernes varaton= observatonernes varaton omkrng regressonslnen= sd = 1.1 (før 1.) R ( coeffcent of determnaton, et dansk ord mangler). Størrelsen betegner den procentvse redukton varatonen, der skyldes den lneære regresson, det vl sge ( ) R = 1. 1.1 1. % 1% R : % forklaret varaton af den totale varaton En almndelg msforståelse: Stor Llle R = god model. R = dårlg model. 1 1 Den lneære regressonsanalyse bygger på en række antagelser: Modelkontrol Systolsk blodtryk 1. sammenhængen mellem responsvarabel (y) og forklarende varabel (x) skal være lneær, scatter plot ( y mod x ). Resdualernes varaton skal være konstant, det vl sge uafhængg af x, scatterplot ( r mod x ) Resdualer - - Symmetrsk omkrng ellpse-formet punkt-sky -. Resdualerne skal være normalfordelt, hstogram - 1 1 Eksempel: y Eksempel på Ikke-lneær sammenhæng Resdualer - Resdualernes varaton vokser med x - - 1 -.. 1. 1... x x 17 1
Systolsk blodtryk Er der en (statstsk skker) sammenhæng mellem alder og systolsk blodtryk? Hvs kke må regressons-lnen have hældnng lg, det vl sge Hypotese : b = Hvs hypotesen er sand blver regressonslnen tl y= a + x = a -. -. -. -1. -.. 1.... Resdualer 19 Teststørrelse (som sædvanlg): bˆ z= ˆ ( ˆ).99.9. ( ˆ) = b se b = = se b -sdg vurderng en normalfordelng p @. Altså: Hvs hypotesen er sand, er chancen mndre end.% for at få et datasæt, der strder lgeså meget mod hypotesen som vores data. Det tror v kke på. Og hvad kan det så bruges tl??? Konkluson: V forkaster hypotesen. Skkerhedsnterval: CI9% ( b ) = (.17,1. 7 ) 1 Er en comfounder/effektmodfkator? Eksponerng Respons Systolsk blodtryk GR N mean SD mean SD > 1 17.9.1 9.. - 1. 1..9. < 1. 1... blodtryk Ergo, sammenhæng mellem og blodtryk! Det er da bare ford, at de gamle også er de tykkeste! Confounder/Effekt modfkator
Sammenhæng mellem systolsk blodtryk, alder og bodymass ndex () 1 1 Blodtryk > Obs nr (år) (kg/m ) 1 1. 1 1 1.9 7. 1. gruppe 1 1 1 1 1 Regressonslne pr - gruppe GR < - < < > < Regresson per gruppe: 1 De regressonslner er parallelle! Intercept Hældnng Estmat se estmat se > 11.... -. 1..91. < 11...1. Hypotese: Der er samme aldersafhængghed de grupper. er kke en effekt-modfkator 1 1 1 1 1 1 GR < - > Kan testes, p =.7 7 Antag ngen effekt-modfkaton 9% CI Estmat se Nedre Øvre Intercept 9.7 11.7. 11. >..9 1. 9. <<.9.9 -. 7. <... ALDER.7.1.1 1.1 1. > SystBT= 9.7+.+.7. < < SystBT= 9.7+.9+.7. < SystBT= 9.7+ +.7 Størrelsen af den tlfældge varaton: sd=11.9 Blodtrykket afhænger da også af kolesterol-tallet!?! Blodtryk Ny varabel om gen! Se-total Kolesterol (mmol/l) Obs nr (år) (kg/m ) gruppe 1 1. 1. 1 1.9. 7.. 1..1 9
1 11 1 1 1 1 1 1 estmeret regresonslne Se-total kolesterol (mmol/l) 9 7 estmeret regresonslne 7 9 11 Se-total kolesterol (mmol/l) 1 Systolsk blodtryk afhænger af alder: y = a+ b + " tlfældg varaton" Systolsk blodtryk afhænger af Se-total kolesterol: y = akolest + bkolest Kolest+ " tlfældg varaton" Men afhænger systolsk blodtryk af både og Se-total kolesterol? y= a + b + b Kolest+"tlfældg varaton" 1 Som kke kan forklares Som kke kan forklare! Som Kolest kke kan forklare! Bestem den bedste regressons-plan Standard 9% CI Estmat Error Nedre Øvre Intercept ( α ˆ). 1.. 9.1 ( ˆβ 1 ).99.1.1 1. Kolest ( ˆβ ).7 1.9.. Størrelsen af den tlfældge varaton: sd=1.7 Fttet (predkteret) værd (-årg, Se-total Kol=.): yˆ (Syst-BT) = aˆ + bˆ x() + bˆ x (Kolest) 1 1 =.+.99 +.7. = 1. af og Kolest! Tolknng af estmater: b ˆ 1 =.99 Forskel systolsk blodtryk mellem personer, der har samme kolesterol-tal, men den ene er 1 år ældre end den anden b ˆ =.7 Forskel systolsk blodtryk mellem personer, der er lge gamle, men den enes kolesterol-tal er 1 mmol/l højere end den andens Modelkontrol???, ja men komplceret! Kan blodtrykket afhænge af både, og Kolesterol?