Logistisk regression. Logistisk regression. Probit model Fortolkning udfra latent variabel. Odds/Odds ratio

Relaterede dokumenter
Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression

Opsamling. Simpel/Multipel Lineær Regression Logistisk Regression Ikke-parametriske Metoder Chi-i-anden Test

Statikstik II 3. Lektion. Multipel Logistisk regression Generelle Lineære Modeller

Økonometri 1. Lineær sandsynlighedsmodel. Hvad nu hvis den afhængige variabel er en kvalitativ variabel (med to kategorier)?

Statistik II Lektion 5 Modelkontrol. Modelkontrol Modelsøgning Større eksempel

Logistisk Regression - fortsat

Morten Frydenberg Biostatistik version dato:

Variansanalyse (ANOVA) Repetition, ANOVA Tjek af model antagelser Konfidensintervaller for middelværdierne Tukey s test for parvise sammenligninger

Statistik II Lektion 5 Modelkontrol. Modelkontrol Modelsøgning Større eksempel

Overlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere.

6. SEMESTER Epidemiologi og Biostatistik Opgaver til 3. uge, fredag

Regressionsanalyse. Epidemiologi og Biostatistik. 1.Simpel lineær regression (Kapitel 11) systolisk blodtryk og alder

Prøveeksamen Indtjening, konkurrencesituation og produktudvikling i danske virksomheder Kommenteret vejledende besvarelse

Log-lineære modeller. Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres.

Lineær regressionsanalyse8

Ugeseddel 8. Gruppearbejde:

Generelle lineære modeller

Økonometri 1. Avancerede Paneldata Metoder I 24.november F18: Avancerede Paneldata Metoder I 1

Sandsynlighedsregning og statistik med binomialfordelingen

Statistik II 4. Lektion. Logistisk regression

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Multipel Lineær Regression

Bilag 6: Økonometriske

Konfidensintervaller og Hypotesetest

Kvantitative metoder 2

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering

Binomialfordelingen. Erik Vestergaard

Vi vil analysere effekten af rygning og alkohol på chancen for at blive gravid ved at benytte forskellige Cox regressions modeller.

Statistik Lektion 14 Simpel Lineær Regression. Simpel lineær regression Mindste kvadraters metode Kovarians og Korrelation

Logistisk regression. Statistik Kandidatuddannelsen i Folkesundhedsvidenskab

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

02402 Vejledende løsninger til hjemmeopgaver og øvelser, Uge 4

Marco Goli, Ph.D, & Shahamak Rezaei. Den Sociale Højskole København & Roskilde Universitetscenter

Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004

MPH specialmodul i epidemiologi og biostatistik. SAS. Introduktion til SAS. Eksempel: Blodtryk og fedme

Produkt og marked - matematiske og statistiske metoder

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression

Statistiske Modeller 1: Kontingenstabeller i SAS

Logistisk regression. Basal Statistik for medicinske PhD-studerende November 2008

Program. Logistisk regression. Eksempel: pesticider og møl. Odds og odds-ratios (igen)

Dagens Temaer. Test for lineær regression. Test for lineær regression - via proc glm. k normalfordelte obs. rækker i proc glm. p. 1/??

RESEARCH PAPER. Nr. 7, Prisoptimering i logitmodellen under homogen og heterogen forbrugeradfærd. Jørgen Kai Olsen

Note til Generel Ligevægt

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Mantel-Haenszel analyser

Beregning af strukturel arbejdsstyrke

Økonometri 1. Funktionel form. Funktionel form (fortsat) Dagens program. Den simple regressionsmodel 14. september 2005

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

Økonometri 1. Lineær sandsynlighedsmodel (Wooldridge 8.5). Dagens program: Heteroskedasticitet 30. oktober 2006

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

Faculty of Health Sciences. Logistisk regression: Kvantitative forklarende variable

Morten Frydenberg 26. april 2004

Kreditrisiko efter IRBmetoden

Model. (m separate analyser). I vores eksempel er m = 2, n 1 = 13 (13 journalister) og

Udvikling af en metode til effektvurdering af Miljøstyrelsens Kemikalieinspektions tilsyn og kontrol

Statistik Lektion 16 Multipel Lineær Regression

Lineær og logistisk regression

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Transkript:

Logstsk regresson Logstsk regresson Odds/Odds rato Probt model Fortolknng udfra latent varabel

En varabel Y parameter p P( Y 1 Bernoull/bnomal fordelngen 1 1 p. er Bernoull- fordelt med sandsynlgheds hvs Y 1 kan tage værderne 0 og 1og Antag Y Y1 + Y2 + + Yn er en sum af Bernoull(p fordelte varable. Da er Y bnomalfordelt b(n,p. uafhængge Eksempel: antal døde ud af 10 ved doss Gennemsnts antal døde: E[Y] np. Gennemsnts andel døde: E[Y/n] p. er b( 10,p

Odds Odds for at dø vs. overleve er odds p 1 p Ex: odds2 betyder sandsynlghed p for dø dobbelt så stor som sandsynlghed 1-p for at leve.

Odds fortsat Fra odds tl sandsynlghed: odds p odds p 1 p odds + 1 Dvs. odds2 gver p2/3 (og 1-p1/3

Logstsk regresson Udgangspunkt bnomalfordelng (det naturlge valg: x antal døde med doss er bnomalfordelt b( 10,p Modellerer log odds (logt af sandsynlghederne: logt(p p Λ ( η log( 1 p p nverslogt( η η a + b doss exp( η 1 + exp( η

Logt og nvers logt transformaton logt p p 1 p p exp 1 exp NB: logt strækker ]0,1[ ud tl hele den reelle talakse og nvers logt lgger altd mellem 0 og 1.

Dose-respons: 10 nsekter for hver dose Andel døde ud af t. p exp 6,286 1,029 dose 1 exp 6,286 1,029 dose respons a 1 Intercept dose a. The reference category s: 0. Parameter Estmates 95% Confdence Interval for Exp(B B Std. Error Wald df Sg. Exp(B Lower Bound Upper Bound -6,286 1,238 25,767 1,000 1,029,197 27,315 1,000 2,799 1,903 4,118 Hvad er sandsynlghed for at dø, hvs doss er 5,7?

Dose-respons: Mere nsektgft Hvert nsekt (100 stk sn dose. p sandsynlghed for at dø.

Odds og odds rato odds p 1 p odds j p j 1 p j odds rato odds / odds j p /(1 p exp( a + b doss Dvs. odds rato exp(b (doss doss j

Eksempel b 0.69 Doss øges med1: doss doss j 1 Odds rato ( p ( p j /(1 /(1 p p j exp(0.69( doss exp(0.69 2 doss j Dvs : odds for at dø blver dobbelt så stor. Hældnng b: exp(b er forøgelse af odds, når doss øges med 1

Probt model Sandsynlgheds tætheden for en standard normal: x 1 x exp 2 2 2 2 Fordelngs funktonen for en standard normal: x x t dt Probt model: p Φ(η og η Φ -1 (p, hvor η c + d doss NB: Ingen explctte formler for Φ og Φ -1!

Logstsk og probt Invers probt mere stejl end nvers logstsk men samme form. Parameter for logstsk ca. 1.81 gange parameter for probt: b 1.81 d

Latent varabel fortolknng Antag c j er latent (uobserveret varabel for doss - f.eks. tolerance overfor gft og at c normalfordelt. j jte nsekt med er standard Insekt dør ( x j 1 hvs c j < c + d doss og overlever ellers. Da er p P(nsekt dør Φ ( c + d doss Samme fortolknng for logstsk regresson hvs logstsk fordelng stedet for standard normal fordelng.

Den logtske og normale fordelng Logstske Normal Begge har mddelværd 0 og varans 1.

Fortolknng forhold tl transport c j "energskhed" hos jte person med km tl arbejde. Hvs energskhed c j mndre end ubehag a + bkm ved at gå eller cykle, vælger person at køre bl ( x j 1.

SPSS procedurer analyze-regresson-bnary logstc: Bernoull (b(1,p og logstsk (kke b(n,p med n>1 analyze-regresson-multnomal regresson: multnomal og logstsk (herunder Bernoull (kke b(n,p med n>1 output analogt tl general lnear model output. analyze-regresson-probt: b(n,p eller Bernoull og probt eller logstsk. Jeg foretrækker multnomal regresson eller probt (for grupperede data.

Eksempel: valg af transportmddel tl arbejde forhold tl alder Undersøge om valg af transportmddel tl/fra arbejde afhænger af alder. Logstsk regresson hvor responsen 'Nej (kører ej bl' er kodet som 0 og 'Ja (kører bl' er kodet som 1.

Output fra multnomal regresson: parameter estmater Bl_tl_arbejde a Nej Intercept Alder a. The reference category s: Ja. Parameter Estmates 95% Confdence Interval for Exp(B B Std. Error Wald df Sg. Exp(B Lower Bound Upper Bound -,343,273 1,584 1,208,010,006 2,599 1,107 1,010,998 1,023 NB: reference kategor er 'Ja', dvs v modellerer sandsynlghed for 'Nej', dvs. kke at køre bl.

Alder som kategorsk/faktor: krydstabel Bl_tl_arbejde * Alderfaktor Crosstabulaton Bl_tl_ arbejde Total Nej Ja Alderfaktor 1,00 2,00 3,00 4,00 Total Count 53 130 31 43 257 % wthn Bl_tl_arbejde 20,6% 50,6% 12,1% 16,7% 100,0% % wthn Alderfaktor 79,1% 41,5% 44,3% 93,5% 51,8% % of Total 10,7% 26,2% 6,3% 8,7% 51,8% Count 14 183 39 3 239 % wthn Bl_tl_arbejde 5,9% 76,6% 16,3% 1,3% 100,0% % wthn Alderfaktor 20,9% 58,5% 55,7% 6,5% 48,2% % of Total 2,8% 36,9% 7,9%,6% 48,2% Count 67 313 70 46 496 % wthn Bl_tl_arbejde 13,5% 63,1% 14,1% 9,3% 100,0% % wthn Alderfaktor 100,0% 100,0% 100,0% 100,0% 100,0% % of Total 13,5% 63,1% 14,1% 9,3% 100,0% Kategorser kvaltatv varabel SPSS: Transform -> Recode... Krydstabel SPSS: Analyze -> Descrptve Statstcs -> Crosstabs...

Parameter estmater fra multnomal logstc med alder som kategorsk Koder nu alder som faktor: 1 svarer tl 25 og under, 2 tl 26-50, 3 tl 51-62 og 4 tl over 63 og over. Bl_tl_arbejde a Nej Intercept [Alderfaktor1,00] [Alderfaktor2,00] [Alderfaktor3,00] [Alderfaktor4,00] a. The reference category s: Ja. b. Ths parameter s set to zero because t s redundant. Parameter Estmates 95% Confdence Interval for Exp(B B Std. Error Wald df Sg. Exp(B Lower Bound Upper Bound 2,663,597 19,881 1,000-1,331,668 3,966 1,046,264,071,979-3,005,608 24,415 1,000,050,015,163-2,892,644 20,181 1,000,055,016,196 0 b.. 0....