Logstsk regresson Logstsk regresson Odds/Odds rato Probt model Fortolknng udfra latent varabel
En varabel Y parameter p P( Y 1 Bernoull/bnomal fordelngen 1 1 p. er Bernoull- fordelt med sandsynlgheds hvs Y 1 kan tage værderne 0 og 1og Antag Y Y1 + Y2 + + Yn er en sum af Bernoull(p fordelte varable. Da er Y bnomalfordelt b(n,p. uafhængge Eksempel: antal døde ud af 10 ved doss Gennemsnts antal døde: E[Y] np. Gennemsnts andel døde: E[Y/n] p. er b( 10,p
Odds Odds for at dø vs. overleve er odds p 1 p Ex: odds2 betyder sandsynlghed p for dø dobbelt så stor som sandsynlghed 1-p for at leve.
Odds fortsat Fra odds tl sandsynlghed: odds p odds p 1 p odds + 1 Dvs. odds2 gver p2/3 (og 1-p1/3
Logstsk regresson Udgangspunkt bnomalfordelng (det naturlge valg: x antal døde med doss er bnomalfordelt b( 10,p Modellerer log odds (logt af sandsynlghederne: logt(p p Λ ( η log( 1 p p nverslogt( η η a + b doss exp( η 1 + exp( η
Logt og nvers logt transformaton logt p p 1 p p exp 1 exp NB: logt strækker ]0,1[ ud tl hele den reelle talakse og nvers logt lgger altd mellem 0 og 1.
Dose-respons: 10 nsekter for hver dose Andel døde ud af t. p exp 6,286 1,029 dose 1 exp 6,286 1,029 dose respons a 1 Intercept dose a. The reference category s: 0. Parameter Estmates 95% Confdence Interval for Exp(B B Std. Error Wald df Sg. Exp(B Lower Bound Upper Bound -6,286 1,238 25,767 1,000 1,029,197 27,315 1,000 2,799 1,903 4,118 Hvad er sandsynlghed for at dø, hvs doss er 5,7?
Dose-respons: Mere nsektgft Hvert nsekt (100 stk sn dose. p sandsynlghed for at dø.
Odds og odds rato odds p 1 p odds j p j 1 p j odds rato odds / odds j p /(1 p exp( a + b doss Dvs. odds rato exp(b (doss doss j
Eksempel b 0.69 Doss øges med1: doss doss j 1 Odds rato ( p ( p j /(1 /(1 p p j exp(0.69( doss exp(0.69 2 doss j Dvs : odds for at dø blver dobbelt så stor. Hældnng b: exp(b er forøgelse af odds, når doss øges med 1
Probt model Sandsynlgheds tætheden for en standard normal: x 1 x exp 2 2 2 2 Fordelngs funktonen for en standard normal: x x t dt Probt model: p Φ(η og η Φ -1 (p, hvor η c + d doss NB: Ingen explctte formler for Φ og Φ -1!
Logstsk og probt Invers probt mere stejl end nvers logstsk men samme form. Parameter for logstsk ca. 1.81 gange parameter for probt: b 1.81 d
Latent varabel fortolknng Antag c j er latent (uobserveret varabel for doss - f.eks. tolerance overfor gft og at c normalfordelt. j jte nsekt med er standard Insekt dør ( x j 1 hvs c j < c + d doss og overlever ellers. Da er p P(nsekt dør Φ ( c + d doss Samme fortolknng for logstsk regresson hvs logstsk fordelng stedet for standard normal fordelng.
Den logtske og normale fordelng Logstske Normal Begge har mddelværd 0 og varans 1.
Fortolknng forhold tl transport c j "energskhed" hos jte person med km tl arbejde. Hvs energskhed c j mndre end ubehag a + bkm ved at gå eller cykle, vælger person at køre bl ( x j 1.
SPSS procedurer analyze-regresson-bnary logstc: Bernoull (b(1,p og logstsk (kke b(n,p med n>1 analyze-regresson-multnomal regresson: multnomal og logstsk (herunder Bernoull (kke b(n,p med n>1 output analogt tl general lnear model output. analyze-regresson-probt: b(n,p eller Bernoull og probt eller logstsk. Jeg foretrækker multnomal regresson eller probt (for grupperede data.
Eksempel: valg af transportmddel tl arbejde forhold tl alder Undersøge om valg af transportmddel tl/fra arbejde afhænger af alder. Logstsk regresson hvor responsen 'Nej (kører ej bl' er kodet som 0 og 'Ja (kører bl' er kodet som 1.
Output fra multnomal regresson: parameter estmater Bl_tl_arbejde a Nej Intercept Alder a. The reference category s: Ja. Parameter Estmates 95% Confdence Interval for Exp(B B Std. Error Wald df Sg. Exp(B Lower Bound Upper Bound -,343,273 1,584 1,208,010,006 2,599 1,107 1,010,998 1,023 NB: reference kategor er 'Ja', dvs v modellerer sandsynlghed for 'Nej', dvs. kke at køre bl.
Alder som kategorsk/faktor: krydstabel Bl_tl_arbejde * Alderfaktor Crosstabulaton Bl_tl_ arbejde Total Nej Ja Alderfaktor 1,00 2,00 3,00 4,00 Total Count 53 130 31 43 257 % wthn Bl_tl_arbejde 20,6% 50,6% 12,1% 16,7% 100,0% % wthn Alderfaktor 79,1% 41,5% 44,3% 93,5% 51,8% % of Total 10,7% 26,2% 6,3% 8,7% 51,8% Count 14 183 39 3 239 % wthn Bl_tl_arbejde 5,9% 76,6% 16,3% 1,3% 100,0% % wthn Alderfaktor 20,9% 58,5% 55,7% 6,5% 48,2% % of Total 2,8% 36,9% 7,9%,6% 48,2% Count 67 313 70 46 496 % wthn Bl_tl_arbejde 13,5% 63,1% 14,1% 9,3% 100,0% % wthn Alderfaktor 100,0% 100,0% 100,0% 100,0% 100,0% % of Total 13,5% 63,1% 14,1% 9,3% 100,0% Kategorser kvaltatv varabel SPSS: Transform -> Recode... Krydstabel SPSS: Analyze -> Descrptve Statstcs -> Crosstabs...
Parameter estmater fra multnomal logstc med alder som kategorsk Koder nu alder som faktor: 1 svarer tl 25 og under, 2 tl 26-50, 3 tl 51-62 og 4 tl over 63 og over. Bl_tl_arbejde a Nej Intercept [Alderfaktor1,00] [Alderfaktor2,00] [Alderfaktor3,00] [Alderfaktor4,00] a. The reference category s: Ja. b. Ths parameter s set to zero because t s redundant. Parameter Estmates 95% Confdence Interval for Exp(B B Std. Error Wald df Sg. Exp(B Lower Bound Upper Bound 2,663,597 19,881 1,000-1,331,668 3,966 1,046,264,071,979-3,005,608 24,415 1,000,050,015,163-2,892,644 20,181 1,000,055,016,196 0 b.. 0....