Lineær og logistisk regression
|
|
|
- Frans Ravn
- 7 år siden
- Visninger:
Transkript
1 Faculty of Health Sciences Lineær og logistisk regression Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet
2 Dagens program Lineær regression En binær forklarende variabel En kontinuert forklarende variabel En binær og en kontinuert forklarende variabel Logistisk regression En binær forklarende variabel To binære forklarende variable En kategorisk forklarende variabel. Kirkwood & Sterne: Kapitel , / 38
3 Regressionsanalyse Formålet med en regressionsanalyse er at beskrive fordelingen af én responsvariabel udfaldsvariabel afhængig variabel Y variabel som en funktion af en eller flere forklarende variable uafhængige variable regressionsvariable X variable kovariater. 3 / 38
4 Typer af responsvariable Typen af respons-variablen bestemmer hvilken regressionsmodel man kan benytte: Respons Binær (0/1) Kvantitativ (kontinuert) Levetid (> 0, censurering) Model logistisk regression lineær regression Cox (Poisson) regression. Fortolkningen af effekten af en forklarende variabel afhænger af typen af responsen / regressionsmodellen: Regressionsmodel logistisk lineær Cox (Poisson) Effect OR, ln(or) forskelle mellem middelværdier rate / hazard ratio, ln(rate ratio). 4 / 38
5 Eksempel til lineær regression Framingham data. Ej CHD ved studiestart (n =1406 n =1363). Respons: Systolisk blodtryk, i.e. Y = SBP Forklarende variable: Alder og køn, i.e. alder (år). { 1 mand mand = 0 kvinde 5 / 38
6 SBP som funktion af alder Age SBP 6 / 38
7 Model for SBP som funktion af alder Lineær regressionsmodel: E(Y i ) = a + b alder i for i = 1,..., 1363, hvor E(Y i ) er middelværdien af responsen (SBP) for person i. Effekten af alder er beskrevet ved b, som er hældningen på linien (målt i mmhg pr år). Interceptet (skæring med y-aksen) er bestemt ved a og svarer til middelværdien for et individ med alder 0 (!) 7 / 38
8 Estimeret model for SBP som funktion af alder Estimeret regressionslinie: SBP = alder Standard afvigelsen (SE) af alderseffekten: Konfidensinterval (0.72; 1.33). Test af alderseffekten ved et Wald-test: W = ( 1.03 ) 2 = som er χ 2 (df=1) og dermed er P < Fortolkning: Hver gang man bliver et år ældre stiger den forventede værdi af SBP med 1.03 mmhg. 8 / 38
9 SBP vs køn Sex SBP Kvinde Mand 9 / 38
10 Model for SBP som funktion af køn Lineær regressionsmodel: E(Y i ) = a + c mand i = { (a + c) (mænd) a (kvinder) Effekten af køn er beskrevet ved c, som er forskellen i middelværdi for mænd og kvinder. NB: Effekten af køn vil afhænge af reference (baseline) kategorien (her kvinder). NB: Diverse programmer vælger referencekategorien forskelligt. 10 / 38
11 Estimation af modellen for SBP som funktion af køn Gennemsnitlig SBP: Kvinder : Mænd : På modellens form { (a + c) (mænd) E(Y i ) = a + c mand i = a (kvinder) { = (mænd) = = (kvinder) Kønsforskellen er c = = / 38
12 Estimeret model for SBP som funktion af køn Den estimerede regressionslinie : SBP = mand Standardafvigelsen (SE) af kønsseffekten: Konfidensinterval: (-10.74; -4.88). Test af kønsseffekten ved et Wald-test: W = og dermed P < (χ 2 (df=1)). ( 7.81 ) 2 = Fortolkning af modellen: Den forventede værdi af SBP er 7.81mmHg større for kvinder end for mænd. 12 / 38
13 Model for SBP som funktion af alder og køn Mulig model: Kombinér de to modeller for hhv. alder og køn: E(Y i ) = a { + b alder i + c mand i (a + c) + b alderi (mænd) = a + b alder i (kvinder) 13 / 38
14 Illustration af modellen E(SBP) females males NB: Parallelle linier. Age 14 / 38
15 E(Y i ) = a { + b alder i + c mand i (a + c) + b alderi (mænd) = a + b alder i (kvinder) NB: Samme alderseffekt (= b) for mænd og kvinder. Samme kønseffekt (= c) for alle aldre. Ingen interaktion / effektmodifikation. Effekterne af køn og alder er indbyrdes justerede. 15 / 38
16 Estimeret model for SBP som funktion af køn og alder Estimeret regressionslinie for kvinder: SBP = alder og mænd: SBP = alder = alder. SE og CI for kønsseffekten: 1.47 og (-10.71;-4.94). Test af kønseffekten: ( 7.83/1.47) 2 = 28.4, P < SE og CI for alderseffekten: 0.15 og (0.73;1.33). Test af alderseffekten: (1.03/0.15) 2 = 44.8, P < / 38
17 Lineær regression i SAS Lineær regression kan udføres vha proc genmod: data framing; filename framfile url ; infile framfile firstobs=2; input id sex age frw sbp sbp10 dbp chol cig chd yrschd death yrsdth cause; if chd=1 then chd01=.; if chd=0 then chd01=0; if chd>1 then chd01=1; run; * Fjerner de observationer, som har manglende chd01; data framingchd; set framing; if chd01 ne.; run; proc genmod data=framingchd; class sex; model sbp = sex age / type3; run; 17 / 38
18 Logistisk regression I epidemiologi er responsvariablen ofte binær, dvs. Y i = { 1 hvis i er syg 0 hvis i ikke er syg En lineær regressionsmodel for E(Y i ) = Prob(Y i = 1) er ikke optimal. 18 / 38
19 Formål med logistisk regression At relatere en binær responsvariabel, f.eks. Y i = { 1 if i får CHD 0 if i ej får CHD til forklarende variable for det i te individ. Sæt p i = Prob (individ i får CHD) = Prob (Y i = 1) = E(Y i ). 19 / 38
20 log-odds ( Vi ser på ln(odds i ) = logit(p i ) = ln pi ubegrænset: 1 p i ) som er logit(p) / 38 p
21 Den logistiske regressionsmodel Model: ( ) pi ln = a + b mand i = 1 p i { a kvinder a + b mænd. Det betyder at kønsparameteren b får følgende fortolkning b = (a + b) a = ln (odds for mænd) - ln (odds for kvinder) = ln (OR for mænd vs kvinder) og tilsvarende b = a (a + b) = ln(or for kvinder vs mænd). 21 / 38
22 Simpel logistisk regression for Framingham data Y = 0 (ej CHD) Y = 1 (CHD) kvinder mænd OR = ( ) = 2.03, b = ln(or) = ln ( ) 104 a = ln(odds for kvinder) = ln = SE af kønseffekten (b): Test : (0.71/0.14) 2 = 25.74, P < Sammenligning med χ 2 -test: 26.31, P < = / 38
23 Logistisk regression i SAS Adskillige procedurer i SAS kan benyttes til logistisk regression. Vi vil bruge proc genmod: proc genmod data=framing descending; class sex; model chd01=sex / dist=bin type3; run; og ln(or) estimeres med det højeste niveau af SEX som referencekategori. 23 / 38
24 Output fra logistisk regression i SAS Vi får teststørrelsen for test af kønseffekten (SEX): Wald W = 25.74, df=1, P < og (pga. TYPE3 option): Likelihood ratio LR = 26.38, df=1, P < Disse er næsten identiske med standard χ 2 -testet i 2x2-tabellen: 26.31, df=1. 24 / 38
25 Beregning af OR i SAS OR incl 95% CI beregnes ved at tilføje estimate-kommando: proc genmod data=framing descending; class sex; model chd01=sex / dist=bin type3; estimate "maend vs kvinder" sex 1-1 / exp; run; sex-variablen har to niveauer. Vi sætter -1-tallet 1-tallet på den plads vi ønsker som reference (2=kvinder). på den plads vi ønsker at sammenligne (1=mænd). Ønsker vi OR for kvinder vs mænd skriver vi: estimate "kvinder vs maend" sex -1 1 / exp; 25 / 38
26 To forklarende variable Med to forklarende variable mand i og ryger i = { 1 hvis i er ryger 0 hvis i er ikke-ryger kan data opsummeres i to 2x2 tabeller på to måder: Mænd Kvinder ikke-rygere rygere ikke-rygere rygere Y = Y = Y = Y = Rygere Ikke-rygere mænd kvinder mænd kvinder Y = Y = Y = Y = / 38
27 MH-analyser med to forklarende variable Med to forklarende variable kan vi med en MH-analyse 1. Studere effekten of rygning justeret for køn eller 2. Studere effekten of køn justeret for rygning. 1. OR MH = 0.97 (= exp( 0.034)) XMH 2 = 0.052, P = OR MH = 2.03 (= exp(0.709)) XMH 2 = 22.96, P <.0001 Konklusion: Der er ingen effekt af rygning justeret for køn, men der er en effekt af køn justeret for rygning. 27 / 38
28 Logistisk regression med to forklarende variable ln ( pi 1 p i ) = a + b 1 mand i + b 2 ryger i a K ikke-ryger a + b = 1 M ikke-ryger a + b 2 K ryger a + b 1 + b 2 M ryger. Bemærk: b 1 = (a + b 1 ) a = (a + b 1 + b 2 ) (a + b 2 ) = ln OR (mænd vs kvinder for givet rygestatus), b 2 = (a + b 2 ) a = (a + b 1 + b 2 ) (a + b 1 ) = ln OR (rygere vs ikke-rygere for givet køn) 28 / 38
29 Logistisk regression med to forkl. variable i SAS I proc genmod inkluderes både sex og ryger i den logistiske regressionsmodel som class forklarende variable: proc genmod data=framing descending; class sex ryger; model chd01 = sex ryger / dist=bin type3; estimate maend vs kvinder sex 1-1 / exp; estimate rygning vs ej-rygning ryger -1 1 / exp; run; 29 / 38
30 OR er med to forklarende variable I den logistiske regressionsmodel med to forklarende variable, er de estimerede ln(or) er indbyrdes justeret. De estimeres begge med det højeste niveau som referencekategori. Fra estimate-statements fås OR er med højeste niveau af sex (=kvinder) og laveste niveau af ryger (=ikke-ryger) som reference. OR 95% CI Wald-test maend vs kvinder to (= exp(0.695)) rygning vs ej-rygning to (= exp(0.033)) 30 / 38
31 Logistisk regression vs stratificeret MH Resultaterne fra den logistiske regression og de stratificerede Mantel-Haenszel analyser er ikke numerisk identiske, men meget tæt på hinanden: Mantel-Haenszel: ln OR (mænd vs kvinder) = ln OR (rygning vs ej-rygning) = Logistisk regression: ln OR (mænd vs kvinder) = ln OR (rygning vs ej-rygning) = Desuden: χ 2 tests tæt på hinanden. 31 / 38
32 Forklarende variable med flere niveauer Inddel alder i 4 grupper: AlderGrp i = Kategoriseret alder mod responsen: 0 hvis i er år 1 hvis i er år 2 hvis i er år 3 hvis i er år Y = Y = / 38
33 Beskrivelse af alderseffekten Alderseffekten kan undersøges ved at se på OR erne for aldersgrupperne: OR 1 (1 vs 0) = = 1.24 = exp(0.21) OR 2 (2 vs 0) = 1.52 = exp(0.42) OR 3 (3 vs 0) = 2.36 = exp(0.86) Vi kan benytte et sædvanligt χ 2 -test til at undersøge om OR 1 = OR 2 = OR 3 = 1: 23.29, df=3, P < / 38
34 Logistisk regression på kategorisk variabel I logistisk regression estimeres ln(or) for hver kategori relativt til en referencekategori: ( ) pi ln = 1 p i b 1 = ln(or)(1 vs 0) = 0.21 b 2 = ln(or)(2 vs 0) = 0.42 b 3 = ln(or)(3 vs 0) = 0.86 a hvis i er år a + b 1 hvis i er år a + b 2 hvis i er år a + b 3 hvis i er år. 34 / 38
35 SAS proc genmod. Fra proc genmod får vi ln(or) 95% CI 0 vs to vs to vs to Pga type3 får vi et LR-test (LR=22.60 (df=3), P<.0001). OR er med kategori 0 som reference: estimate 1 vs 0 AlderGrp estimate 2 vs 0 AlderGrp estimate 3 vs 0 AlderGrp / exp; / exp; / exp; og man finder 35 / 38 OR 95% CI 1 vs to vs to vs to 3.46
36 SAS-øvelser De følgende spørgsmål drejer sig alle om Framingham studiet. De første øvelser har til formål at rekonstruere resultaterne fra forelæsningerne. 1. Indlæs Framingham data fra framing.txt og konstruer en ny responsvariabel, chd01, som er - 1 hvis chd=2, 3,..., 10-0 hvis chd=0 - missing (. ) hvis chd=1. 2. Udfør de tre lineære regressionsanalyser fra dagens gennemgang og genfind de estimerede størrelser og tests. Koden på slide 17 kan findes i framing2.sas, som ligger på hjemmesiden under dag2. 36 / 38
37 3. Tilføj kommandoer, som laver en anden ny variabel, ryger, som er - 1 hvis cig> 0-0 hvis cig=0 - missing (. ) hvis cig=. og udfør Mantel-Haenszel analyserne af køn stratificeret for rygning og rygning stratificeret for køn. 4. Konstruér variablen AlderGrp ved at inddele i 4 grupper efter age og sammenlign 18-års risikoen for chd i de 4 aldersgrupper (ved et χ 2 -test). 37 / 38
38 5. Udfør logistiske regressionsanalyser af 18-års risikoen for chd med forklarende variable: køn køn og rygning alder (dvs AlderGrp) alle 3 Fortolk resultaterne. Bestem OR er hvor henholdsvis højeste og laveste gruppe er referencekategori. 6. Konstruér en variabel svarende til en passende inddeling af sbp og estimér i en logistisk regressionsanalyse effekten af denne variabel med og uden justering for køn og alder. 38 / 38
Faculty of Health Sciences. Logistisk regression: Kvantitative forklarende variable
Faculty of Health Sciences Logistisk regression: Kvantitative forklarende variable Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet [email protected] Sammenhæng
Logistisk regression
Logistisk regression Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet [email protected] 21. marts 2013 Dagens program Chi-i-anden (χ 2 )-testet Sandsynligheder,
Logistisk regression
Logistisk regression Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet [email protected] Kursushjemmeside: www.biostat.ku.dk/~sr/forskningsaar/regression2012/
Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper.
1. Indlæs data. * HUSK at angive din egen placering af filen; data framing; infile '/home/sro00/mph2016/framing.txt' firstobs=2; input id sex age frw sbp sbp10 dbp chol cig chd yrschd death yrsdth cause;
MPH specialmodul Epidemiologi og Biostatistik
MPH specialmodul Epidemiologi og Biostatistik Kvantitative udfaldsvariable 23. maj 2011 www.biostat.ku.dk/~sr/mphspec11 Susanne Rosthøj (Per Kragh Andersen) 1 Kapitelhenvisninger Andersen & Skovgaard:
Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge
Statistik og Sandsynlighedsregning 2 IH kapitel 12 Overheads til forelæsninger, mandag 6. uge 1 Fordelingen af én (1): Regressionsanalyse udfaldsvariabel responsvariabel afhængig variabel Y variabel 2
Morten Frydenberg 26. april 2004
Introduktion til Logistisk Regression Morten Frydenberg, Inst. f. Biostatistik RESUME: 2 2. gang: 2002 Institut for Biostatistik, Århus Universitet MPH. studieår Specialmodul 4 Cand. San. uddannelsen.
Faculty of Health Sciences. Logistisk regression: Interaktion Kvantitative responsvariable
Faculty of Health Sciences Logistisk regression: Interaktion Kvantitative responsvariable Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet [email protected]
Morten Frydenberg 14. marts 2006
Introduktion til Logistisk Regression Morten Frydenberg, Inst. f. Biostatistik 1 RESUME: 2 2. gang: 2006 Institut for Biostatistik, Århus Universitet MPH 1. studieår Specialmodul 4 Cand. San. uddannelsen
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Eksamensopgave E05 Socialklasse og kronisk sygdom Data: Tværsnitsundersøgelse fra 1986 Datamaterialet indeholder: Køn, alder, Højest opnåede
Løsning til øvelsesopgaver dag 4 spg 5-9
Løsning til øvelsesopgaver dag 4 spg 5-9 5: Den multiple model Vi tilføjer nu yderligere to variable til vores model : Køn og kolesterol SBP = a + b*age + c*chol + d*mand hvor mand er 1 for mænd, 0 for
Analyse af binære responsvariable
Analyse af binære responsvariable Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet 23. november 2012 Har mænd lettere ved at komme ind på Berkeley? UC Berkeley
Man indlæser en såkaldt frequency-table i SAS ved følgende kommandoer:
1 IHD-Lexis 1.1 Spørgsmål 1 Man indlæser en såkaldt frequency-table i SAS ved følgende kommandoer: data ihdfreq; input eksp alder pyrs cases; lpyrs=log(pyrs); cards; 0 2 346.87 2 0 1 979.34 12 0 0 699.14
Dag 6: Interaktion. Overlevelsesanalyse
Dag 6: Interaktion. Overlevelsesanalyse How does CHD depend on gender and hypertension? Males: hypertension chd01 Females: Frequency Row Pct 0 1 Total ---------+--------+--------+ 0 352 95 447 78.75 21.25
12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse
. september 5 Epidemiologi og biostatistik. Forelæsning Uge, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression
Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse
Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Institut for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression Regressionsanalyse Regressionsanalyser
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Mantel-Haenszel analyser
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Mantel-Haenszel analyser Mantel-Haenszel analyser Sidst lærte vi om stratificerede analyser. I dag kigger vi på et specialtilfælde: både exposure
Introduktion til overlevelsesanalyse
Faculty of Health Sciences Introduktion til overlevelsesanalyse Kaplan-Meier estimatoren Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet [email protected]
Logistisk regression. Basal Statistik for medicinske PhD-studerende November 2008
Logistisk regression Basal Statistik for medicinske PhD-studerende November 2008 Bendix Carstensen Steno Diabetes Center, Gentofte & Biostatististisk afdeling, Københavns Universitet [email protected] www.biostat.ku.dk/~bxc
Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk
Eksempel: Systolisk blodtryk Udgangspunkt: Vi ønsker at prædiktere det systoliske blodtryk hos en gruppe af personer. Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Afdeling for Biostatistik.
Logistisk regression. Statistik Kandidatuddannelsen i Folkesundhedsvidenskab
Logistis regression Statisti Kandidatuddannelsen i Folesundhedsvidensab Multipel logistis regression Antagelser: Binære observationer (Y i, i=,.,n) f.es Ja/Nej Høj/Lav Død/Levende Kodet: / 0 Y i uafhængige
Statistik II 4. Lektion. Logistisk regression
Statistik II 4. Lektion Logistisk regression Logistisk regression: Motivation Generelt setup: Dikotom(binær) afhængig variabel Kontinuerte og kategoriske forklarende variable (som i lineær reg.) Eksempel:
Postoperative komplikationer
Løsninger til øvelser i kategoriske data, oktober 2008 1 Postoperative komplikationer Udgangspunktet for vurdering af den ny metode må være en nulhypotese om at der er samme komplikationshyppighed, 20%.
Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable
Statistik II Lektion 3 Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Setup: To binære variable X og Y. Statistisk model: Konsekvens: Logistisk regression: 2 binære var. e e X Y P
Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)
Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:
Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)
Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:
Løsning til opgave i logistisk regression
Løsning til øvelser i logistisk regression, november 2008 1 Løsning til opgave i logistisk regression 1. Først indlæses data, og vi kan lige sørge for at danne en dummy-variable for cml, som indikator
Program. Logistisk regression. Eksempel: pesticider og møl. Odds og odds-ratios (igen)
Faculty of Life Sciences Program Logistisk regression Claus Ekstrøm E-mail: [email protected] Odds og odds-ratios igen Logistisk regression Estimation og inferens Modelkontrol Slide 2 Statistisk Dataanalyse
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Stratificerede analyser
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Stratificerede analyser Dødsstraf-eksempel Betyder morderens farve noget for risikoen for dødsstraf? 1 Dødsstraf-eksempel: data Variable: Dødsstraf
Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression
Statikstik II 2. Lektion Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Sandsynlighedsregningsrepetition Antag at Svar kan være Ja og Nej. Sandsynligheden for at Svar Ja skrives
Morten Frydenberg Biostatistik version dato:
Caerphilly studiet Design og Data Biostatistik uge 14 mandag Morten Frydenberg, Afdeling for Biostatistik Poisson regression En primær tidsakse og ikke stykkevise konstante rater Cox proportional hazard
Faculty of Health Sciences. Miscellaneous: Styrkeberegninger Overlevelsesanalyse Analyse af matchede studier
Faculty of Health Sciences Miscellaneous: Styrkeberegninger Overlevelsesanalyse Analyse af matchede studier Forsøgsplanlægning Sammenligning af to grupper : Hvor mange personer skal vi bruge? Det kommer
Confounding og stratificeret analyse
Faculty of Health Sciences Confounding og stratificeret analyse Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet [email protected] Kursets form Seks fredage
Introduktion til GLIMMIX
Introduktion til GLIMMIX Af Jens Dick-Nielsen [email protected] 21.08.2008 Proc GLIMMIX GLIMMIX kan bruges til modeller, hvor de enkelte observationer ikke nødvendigvis er uafhængige.
Statistiske Modeller 1: Kontingenstabeller i SAS
Statistiske Modeller 1: Kontingenstabeller i SAS Jens Ledet Jensen October 31, 2005 1 Indledning Som vist i Notat 1 afsnit 13 er 2 log Q for et test i en multinomialmodel ækvivalent med et test i en poissonmodel.
Vi vil analysere effekten af rygning og alkohol på chancen for at blive gravid ved at benytte forskellige Cox regressions modeller.
Løsning til øvelse i TTP dag 3 Denne øvelse omhandler tid til graviditet. Et studie vedrørende tid til graviditet (Time To Pregnancy = TTP) inkluderede 423 par i alderen 20-35 år. Parrene blev fulgt i
MPH specialmodul i epidemiologi og biostatistik. SAS. Introduktion til SAS. Eksempel: Blodtryk og fedme
MPH specialmodul i epidemiologi og biostatistik. SAS Introduktion til SAS. Display manager (programmering) Vinduer: program editor (med syntaks-check) log output reproducerbart (program teksten kan gemmes
Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode
Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse
Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april
Århus 8. april 2011 Morten Frydenberg Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april Opgave 1 ( gruppe 1: sp 1-4, gruppe 5: sp 5-9 og gruppe 6: 10-14) I denne opgaveser vi på et
Forelæsning 11: Kapitel 11: Regressionsanalyse
Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
MPH specialmodul i biostatistik og epidemiologi SAS-øvelser vedr. case-control studie af malignt melanom.
MPH specialmodul i biostatistik og epidemiologi SAS-øvelser vedr. case-control studie af malignt melanom. For at I skal kunne regne på tallene fra undersøgelsen har vi taget en delmængde af variablene
Opgavebesvarelse, logistisk regression
Opgavebesvarelse, logistisk regression Data ligger i rop.xls på kursushjemmesiden: http://staff.pubhealth.ku.dk/ jufo/courses/logistic/ Når du har gemt data på din computer, kan det indlæses i SAS med
Faculty of Health Sciences. Basal Statistik. Logistisk regression mm. Lene Theil Skovgaard. 5. marts 2018
Faculty of Health Sciences Basal Statistik Logistisk regression mm. Lene Theil Skovgaard 5. marts 2018 1 / 22 APPENDIX vedr. SPSS svarende til diverse slides: To-gange-to tabeller, s. 3 Plot af binære
Simpel og multipel logistisk regression
Faculty of Health Sciences Logistisk regression Simpel og multipel logistisk regression 16. Maj 2012 Analyse af en binær responsvariabel. syg/rask, død/levende, ja/nej... Ud fra en eller flere forklarende
Basal Statistik Logistisk Regression. Dagens Tekst E Sædvanlig Linear Regression (Repetition) Basal Statistik - Logistisk regression 1
Basal Statistik Logistisk Regression Judith L. Jacobsen, PhD. Lene Theil Skovgaard http://staff.pubhealth.ku.dk/~lts/basal13_ [email protected] Dagens Tekst Logistisk regression Binære data Logit transformation
Anvendt Statistik Lektion 7. Simpel Lineær Regression
Anvendt Statistik Lektion 7 Simpel Lineær Regression 1 Er der en sammenhæng? Plot af mordraten () mod fattigdomsraten (): Scatterplot Afhænger mordraten af fattigdomsraten? 2 Scatterplot Et scatterplot
Logistisk Regression - fortsat
Logistisk Regression - fortsat Likelihood Ratio test Generel hypotese test Modelanalyse Indtil nu har vi set på to slags modeller: 1) Generelle Lineære Modeller Kvantitav afhængig variabel. Kvantitative
Regressionsanalyser. Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer.
Regressionsanalyser Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer. Hvilke faglige problemer kan man løse vha. regressionsanalyser? 1 Regressionsanalyser Det primære problem
1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ
Indhold 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) 2 1.1 Variation indenfor og mellem grupper.......................... 2 1.2 F-test for ingen
Anvendt Statistik Lektion 8. Multipel Lineær Regression
Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke
Multipel Lineær Regression
Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer
Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser
Uge 43 I Teoretisk Statistik,. oktober 3 Simpel lineær regressionsanalyse Forudsigelser Fortolkning af regressionsmodellen Ekstreme observationer Transformationer Sammenligning af to regressionslinier
1 Hb SS Hb Sβ Hb SC = , (s = )
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.
Epidemiologiske associationsmål
Epidemiologiske associationsmål Mads Kamper-Jørgensen, lektor, [email protected] Afdeling for Social Medicin, Institut for Folkesundhedsvidenskab It og sundhed l 16. april 2015 l Dias nummer 1 Sidste gang
Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]
Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af
Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17
nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse
Introduktion til overlevelsesanalyse
Faculty of Health Sciences Introduktion til overlevelsesanalyse Cox regression III Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet [email protected] Kursushjemmeside:
grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen
1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen
Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model
Multipel regression M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Y j 1 X 1j 2 X 2j... m X mj j eller m Y j 0 i 1 i X ij j BEMÆRK! j svarer til individ
Introduktion til overlevelsesanalyse
Faculty of Health Sciences Introduktion til overlevelsesanalyse Cox regression Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet [email protected] Kursushjemmeside:
Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)
Formelsamlingen 1 Regneregler for middelværdier M(a + bx) a + bm X M(X+Y) M X +M Y Spredning varians og standardafvigelse VAR(X) 1 n n i1 ( X i - M x ) 2 Y a + bx VAR(Y) VAR(a+bX) b²var(x) 2 Kovariansen
Statistik II 1. Lektion. Analyse af kontingenstabeller
Statistik II 1. Lektion Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller Logistisk regression
Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)
Afdeling for Biostatistik Bo Martin Bibby 23. november 2006 Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Vi betragter 4699 personer fra Framingham-studiet. Der er oplysninger om follow-up
Statistik og skalavalidering. Opgave 1
Statistik og skalavalidering Opgave 1 Opgavens formål: Denne opgave har, ligesom det vil være tilfældet for de fleste andre øvelsesopgaver på dette kursus, flere forskellige formål. For det første et praktisk/teknisk
Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression
Multipel Linear Regression Repetition Partiel F-test Modelsøgning Logistisk Regression Test for en eller alle parametre I jagten på en god statistisk model har vi set på følgende to hypoteser og tilhørende
Faculty of Health Sciences. Styrkeberegninger Poisson regression Overlevelsesanalyse
Faculty of Health Sciences Styrkeberegninger Poisson regression Overlevelsesanalyse Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet [email protected] Forsøgsplanlægning
Morten Frydenberg Biostatistik version dato:
Tye og Tye 2 fejl Statistisk styrke Biostatistik uge 2 mandag Morten Frydenberg, Afdeling for Biostatistik Styrkeovervejelser i lanlægning af et studie Logistisk regression Præterm fødsel, rygning, alder,
Økonometri 1. Kvalitative variabler. Kvalitative variabler. Dagens program. Kvalitative variable 8. marts 2006
Dagens program Økonometri 1 Kvalitative variable 8. marts 2006 Kvalitative variabler som forklarende variabler i en lineær regressionsmodel (Wooldridge kap. 7.1-7.4) Kvalitative variabler generelt Dummy
Overlevelsesanalyse. Faculty of Health Sciences
Faculty of Health Sciences Overlevelsesanalyse Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet [email protected] Program Overlevelsesdata Kaplan-Meier estimatoren
Logistisk regression
Logistisk regression http://biostat.ku.dk/ kach/css2 Thomas A Gerds & Karl B Christensen 1 / 18 Logistisk regression I dag 1 Binær outcome variable død : i live syg : rask gravid : ikke gravid etc 1 prædiktor
Statistik kommandoer i Stata opdateret 22/ Erik Parner
Statistik kommandoer i Stata opdateret 22/4 2008 Erik Parner Indledning... 1 Simple beskrivelser... 1 Data manipulation... 1 Estimation af proportioner... 2 Estimation af rater... 2 Estimation af Relativ
Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression
Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logisitks Regression: Repetition Y {0,} binær afhængig variabel X skala forklarende variabel π P( Y X x) Odds(Y X x) π /(-π
MPH specialmodul i epidemiologi og biostatistik. SAS. Introduktion til SAS. Eksempel: Blodtryk og fedme
MPH specialmodul i epidemiologi og biostatistik. SAS Introduktion til SAS. Display manager (programmering) Vinduer: program editor (med syntaks-check) log output reproducerbart (program teksten kan gemmes
Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele
Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Motiverende eksempel Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning
Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele
Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Motiverende eksempel Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning
Økonometri 1. Dummyvariabler 13. oktober Økonometri 1: F10 1
Økonometri 1 Dummyvariabler 13. oktober 2006 Økonometri 1: F10 1 Dagens program Dummyvariabler i den multiple regressionsmodel (Wooldridge kap. 7.3-7.6) Dummy variabler for kvalitative egenskaber med flere
1 Sammenligning af 2 grupper Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver... 2
Indhold 1 Sammenligning af 2 grupper 2 1.1 Responsvariabel og forklarende variabel......................... 2 1.2 Afhængige/uafhængige stikprøver............................ 2 2 Sammenligning af 2 middelværdier
Korrelation Pearson korrelationen
-9- Eidemiologi og biostatistik. Forelæsning Uge, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Korrelation Kliniske målinger - Kliniske målinger og variationskilder - Estimation af størrelsen
Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning
1 Regressionsproblemet 2 Simpel lineær regression Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 3
Basal statistik for sundhedsvidenskabelige forskere, efterår 2015 Udleveret 29. september, afleveres senest ved øvelserne i uge 44 (27.-30.
Hjemmeopgave Basal statistik for sundhedsvidenskabelige forskere, efterår 2015 Udleveret 29. september, afleveres senest ved øvelserne i uge 44 (27.-30. oktober) En undersøgelse blandt fødende kvinder
Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1
Matematisk Modellering 1 Side 1 I nærværende opgavesæt er der 16 spørgsmål fordelt på 4 opgaver. Ved bedømmelsen af besvarelsen vægtes alle spørgsmål lige. Endvidere lægges der vægt på, at det af besvarelsen
Noter til Specialkursus i videregående statistik
Noter til Specialkursus i videregående statistik Poul Thyregod IMM, februar 2005 Indhold Forord 6 1 Momenter og flerdimensionale stokastiske variable 7 1.0 Indledning............................. 7 1.1
Statistik FSV 4. semester 2014 Øvelser Uge 2: 11. februar
Århus 6. februar 2014 Morten Frydenberg Statistik FSV 4. semester 2014 Øvelser Uge 2: 11. februar Til disse øvelser har I brug for fishoil1.dta, der indeholder data fra det fiskeolie forsøg vi så på ved
Kursus i varians- og regressionsanalyse Data med detektionsgrænse. Birthe Lykke Thomsen H. Lundbeck A/S
Kursus i varians- og regressionsanalyse Data med detektionsgrænse Birthe Lykke Thomsen H. Lundbeck A/S 1 Data med detektionsgrænse Venstrecensurering: Baggrundsstøj eller begrænsning i måleudstyrets følsomhed
