Analyse af binære responsvariable Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet 23. november 2012
Har mænd lettere ved at komme ind på Berkeley? UC Berkeley photo 2 / 13
Dagens program 1 Data 2 Association 3 Confounding (kan associationen forklares af noget andet?) 4 Stratificeret analyse 5 Opgave 3 / 13
Analyse af en binær responsvariabel Optagelsesdata fra Berkeley 1973. Binær responsvariabel: optaget / afvist 4 / 13
Analyse af en binær responsvariabel Optagelsesdata fra Berkeley 1973. Binær responsvariabel: optaget / afvist Eksponering: mand / kvinde 4 / 13
Data Bickel et al (1975) Sex Bias in Graduate Admissions: Data from Berkeley. Science 187:398-404 Optaget Optagelsesprocent Ja Nej Total Køn Kvinde 41 325 366 41 366 = 11.2% Mand 375 558 933 375 933 = 40.2% Total 416 883 1299 Afhænger sandsynligheden for at blive optaget af ansøgerens køn? 5 / 13
Beskrivelse af data Sandsynlighed for optagelse for kvinder: p K 41/366 = 0.112 Sandsynlighed for optagelse for mænd: p M 375/933 = 0.402 6 / 13
Beskrivelse af data Sandsynlighed for optagelse for kvinder: p K 41/366 = 0.112 Sandsynlighed for optagelse for mænd: p M 375/933 = 0.402 Odds for optagelse for kvinder: Odds for optagelse for mænd: p K /(1 p K ) 41/325 = 0.126 ( 1 : 8) p M /(1 p M ) 375/558 = 0.672 ( 1 : 1.5) 6 / 13
Beskrivelse af data Sandsynlighed for optagelse for kvinder: p K 41/366 = 0.112 Sandsynlighed for optagelse for mænd: p M 375/933 = 0.402 Odds for optagelse for kvinder: Odds for optagelse for mænd: p K /(1 p K ) 41/325 = 0.126 ( 1 : 8) p M /(1 p M ) 375/558 = 0.672 ( 1 : 1.5) Et statistisk test konstaterer, at der er forskel for mænd og kvinder: p K p M, p <.0001. 6 / 13
Associationsmål Vi fandt p K = 0.112 for kvinder, p M = 0.402 for mænd. Forskellen kan beskrives ved: Absolut differens i risiko (ARR): p K p M 0.29 Relativ risiko (RR) : p K /p M 0.28 Odds-ratio (OR): p K /(1 p K )/(p M /(1 p M )) 0.19. 7 / 13
Associationsmål Vi fandt p K = 0.112 for kvinder, p M = 0.402 for mænd. Forskellen kan beskrives ved: Absolut differens i risiko (ARR): p K p M 0.29 Relativ risiko (RR) : p K /p M 0.28 Odds-ratio (OR): p K /(1 p K )/(p M /(1 p M )) 0.19. Idet p K p M er ARR > 0, RR 1, OR 1 (p <.0001) 7 / 13
Odds ratio: kvinder versus mænd OR = 41 558 375 325 = 0.19 Køn Optaget Ja Nej Total Kvinde 41 325 366 Mand 375 558 933 Total 416 883 1299 Standard error af log(or) SE = 1 41 + 1 325 + 1 375 + 1 558 = 0.18 og dermed et 95%-konfidensinterval CI 95% = exp(log(or) ± 1.96 SE) = [0.13; 0.27] (indeholder ikke 1) 8 / 13
Confounding Har vi fundet den sande association mellem køn og optagelse? En variabel C er en potentiel confounder for E O relationen hvis den er: 1) relateret til exposure: E C 2) er en uafhængig risiko faktor for responsen: C O 3) Ikke er en konsekvens af exposure: E C O E C O Vi nødt til at tage højde for denne variabel i analysen. 9 / 13
Stratificeret analyse Vi opdeler materialet i strata svarende til afdelinger: Afdeling B: Køn Optaget Ja Nej Total Kvinde 17 (0.68) 8 25 Mand 353 (0.63) 207 560 Total 370 215 585 17 207 OR = 353 8 = 1.25 CI 95% = [0.53; 2.94] Afdeling F: Køn Optaget Ja Nej Total Kvinde 24 (0.07) 317 341 Mand 22 (0.06) 351 373 Total 46 668 714 24 351 OR = 22 317 = 1.21 CI 95% = [0.66; 2.20] 10 / 13
Confounding 11 / 13
En justeret analyse Vi kan beregne en fælles OR ved Mantel-Haenszel-metoden: OR MH = 1.22 CI 95% = [0.75; 1.99] I dette eksempel vender effekten af køn. Dette fænomen er et eksempel på Simpson s paradox. Findes der andre confoundere, bør de også inddrages i analysen. Vær altid omhyggelig med at justere for potentielle confoundere! 12 / 13
Opgave: Afdeling som confounder Beregn OR, afgør om der er en signifikant sammenhæng og beskriv associationen: 1. Er afdeling er relateret til køn? Afdeling Køn B F Total Kvinde 25 341 366 Mand 560 373 933 Total 585 714 1299 OR = CI 95% = [?;?] =? 2. Er afdeling relateret til optagelse? Optaget Afdeling Ja Nej Total B 370 215 585 F 46 668 714 Total 416 883 1299 OR = CI 95% = [?;?] =? 13 / 13