Analyse af binære responsvariable



Relaterede dokumenter
Effektmålsmodifikation

Lineær og logistisk regression

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Mantel-Haenszel analyser

Effektmålsmodifikation

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Stratificerede analyser

Mantel-Haenszel analyser. Stratificerede epidemiologiske analyser

Epidemiologiske associationsmål

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom

En teoretisk årsagsmodel: Operationalisering: Vurdering af epidemiologiske undersøgelser. 1. Informationsproblemer Darts et eksempel på målefejl

Epidemiologiske associationsmål

Træningsaktiviteter dag 3

Præcision og effektivitet (efficiency)?

Population attributable fraction

8.2 Statistiske analyse af hver enkelt indikator

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Mål for sammenhæng mellem to variable

Intern validitet: Fejlkilder og tolkningsproblemer i epidemiologiske undersøgelser

Sammenhængsanalyser. Et eksempel: Sammenhæng mellem rygevaner som 45-årig og selvvurderet helbred som 51 blandt mænd fra Københavns amt.

En teoretisk årsagsmodel: Operationalisering: Vurdering af epidemiologiske undersøgelser. 1. Informationsproblemer Eksempler på målefejl

Logistisk regression

Fejlkilder. Kim Overvad Afdeling for Epidemiologi Institut for Folkesundhed Aarhus Universitet Marts 2011

Vurdering af epidemiologiske undersøgelser igen

Besvarelse af opgavesættet ved Reeksamen forår 2008

ORDINÆR EKSAMEN I EPIDEMIOLOGISKE METODER IT & Sundhed, 2. semester

Faculty of Health Sciences. Logistisk regression: Kvantitative forklarende variable

Eks. 1: Kontinuert variabel som i princippet kan måles med uendelig præcision. tid, vægt,

1 Sammenligning af 2 grupper Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver... 2

8.2 Statistiske analyse af hver enkelt indikator

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

Hvad skal vi lave? Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver

Dag 6: Interaktion. Overlevelsesanalyse

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

ORDINÆR EKSAMEN I EPIDEMIOLOGISKE METODER IT & Sundhed, 2. semester

RE-EKSAMEN I EPIDEMIOLOGISKE METODER IT & Sundhed, 2. semester

Måleproblemer. Fejlkilder og tolkningsproblemer. Usikkerhed og bias. Stikprøveusikkerhed. Epidemiologi og Biostatistik (version

2. Hvilke(t) epidemiologisk(e) design(s) anvender forfatterne til at belyse problemstillingen? (7 point)

SKRIFTLIG EKSAMEN I BIOSTATISTIK OG EPIDEMIOLOGI Cand.Scient.San, 2. semester 20. februar 2015 (3 timer)

Postoperative komplikationer

ORDINÆR EKSAMEN I EPIDEMIOLOGISKE METODER IT & Sundhed, 2. semester

Tillæg til studieordningen for bacheloruddannelsen i Sundhedsteknologi

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

Selektionsbias. Mads Kamper-Jørgensen, lektor, Afdeling for Social Medicin, Institut for Folkesundhedsvidenskab

Hyppigheds- og associationsmål. Kim Overvad Afdeling for Epidemiologi Institut for Folkesundhed Aarhus Universitet Februar 2011

Vurdering af epidemiologiske undersøgelser igen

9. Chi-i-anden test, case-control data, logistisk regression.

Statistik II 1. Lektion. Analyse af kontingenstabeller

Resultater. Formål. Results. Results. Må ikke indeholde. At fåf. kendskab til rapportering af resultater. beskrivelse

1. februar Lungefunktions data fra tirsdags Gennemsnit l/min

Hver anden vil benytte øget åbningstid i dagtilbud

ORDINÆR EKSAMEN I EPIDEMIOLOGISKE METODER IT & Sundhed, 2. semester

REEKSAMEN I EPIDEMIOLOGISKE METODER IT & Sundhed, 2. semester

Eksamen Efterår 2013

Kommentarer til spørgsmålene til artikel 1: Ethnic differences in mortality from sudden death syndrome in New Zealand, Mitchell et al., BMJ 1993.

Lægevidenskabelig Embedseksamen, 6. semester Forår 2009 Epidemiologi og Biostatistik Rettevejledning

Logistisk regression. Statistik Kandidatuddannelsen i Folkesundhedsvidenskab

Social position og kirurgi for tidlig-stadie ikke-småcellet lungekræft: en registerbaseret undersøgelse

3 typer. Case-kohorte. Nested case-kontrol. Case-non case (klassisk case-kontrol us.)

Morten Frydenberg Biostatistik version dato:

Confounding. Mads Kamper-Jørgensen, lektor, Afdeling for Social Medicin, Institut for Folkesundhedsvidenskab

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression

Logistisk regression

MPH specialmodul Epidemiologi og Biostatistik

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Logistisk regression. Basal Statistik for medicinske PhD-studerende November 2008

Confounding og stratificeret analyse

Noter til SfR checkliste 3 Kohorteundersøgelser

Vurdering af epidemiologiske undersøgelser. Epidemiologisk forskning

Målsætning. Vurdering af epidemiologiske undersøgelser

Introduktion til overlevelsesanalyse

Tillæg til Studieordning for Folkesundhedsvidenskab

Skriftlig eksamen Science statistik- ST501

Program. Logistisk regression. Eksempel: pesticider og møl. Odds og odds-ratios (igen)

MPH Introduktionsmodul: Epidemiologi og Biostatistik

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Uafhængighedstestet

Confounding. Mads Kamper-Jørgensen, lektor, Afdeling for Social Medicin, Institut for Folkesundhedsvidenskab

Fejlkilder. Ulrik Schiøler Kesmodel. Rikke Guldberg Øjvind Lidegaard

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

4. september π B = Lungefunktions data fra tirsdags Gennemsnit l/min

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)

Epidemiologiprojekt. Ann-Louise, Jennifer, Matilda og Elif 408

Effekt af elektronisk stabilitetskontrol på personbilers eneuheld

Epidemiologisk design I. Eksperimentelle undersøgelser. Epidemiologisk design II. Randomiserede undersøgelser. Randomisering II

Øvelser i epidemiologi og biostatistik, 12. april 2010 Ebeltoft-projektet: Analyse af alkoholrelaterede data mm. Eksempel på besvarelse

Webtabel SR 4.1 Alkoholforbrug i det seneste år

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse

Udbrændthed og brancheskift

CENTER FOR KLINISKE RETNINGSLINJER

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper.

Kursus i Epidemiologi og Biostatistik. Epidemiologiske mål. Studiedesign. Svend Juul

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk

Morten Frydenberg 14. marts 2006

Opgavebesvarelse, Basalkursus, uge 3

Statistik II 4. Lektion. Logistisk regression

Optimering af stikprøver vha. registre. Peter Linde, DST Survey

Opgavebesvarelse, Basalkursus, uge 3

Repræsentative undersøgelser før og nu. Peter Linde, Interviewservice

CENTER FOR KLINISKE RETNINGSLINJER - CLEARINGHOUSE

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse

Mads Kamper-Jørgensen, lektor, Afdeling for Social Medicin, Institut for Folkesundhedsvidenskab

Ved undervisningen i epidemiologi/statistik den 8. og 10. november 2011 vil vi lægge hovedvægten på en fælles diskussion af følgende fire artikler:

Transkript:

Analyse af binære responsvariable Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet 23. november 2012

Har mænd lettere ved at komme ind på Berkeley? UC Berkeley photo 2 / 13

Dagens program 1 Data 2 Association 3 Confounding (kan associationen forklares af noget andet?) 4 Stratificeret analyse 5 Opgave 3 / 13

Analyse af en binær responsvariabel Optagelsesdata fra Berkeley 1973. Binær responsvariabel: optaget / afvist 4 / 13

Analyse af en binær responsvariabel Optagelsesdata fra Berkeley 1973. Binær responsvariabel: optaget / afvist Eksponering: mand / kvinde 4 / 13

Data Bickel et al (1975) Sex Bias in Graduate Admissions: Data from Berkeley. Science 187:398-404 Optaget Optagelsesprocent Ja Nej Total Køn Kvinde 41 325 366 41 366 = 11.2% Mand 375 558 933 375 933 = 40.2% Total 416 883 1299 Afhænger sandsynligheden for at blive optaget af ansøgerens køn? 5 / 13

Beskrivelse af data Sandsynlighed for optagelse for kvinder: p K 41/366 = 0.112 Sandsynlighed for optagelse for mænd: p M 375/933 = 0.402 6 / 13

Beskrivelse af data Sandsynlighed for optagelse for kvinder: p K 41/366 = 0.112 Sandsynlighed for optagelse for mænd: p M 375/933 = 0.402 Odds for optagelse for kvinder: Odds for optagelse for mænd: p K /(1 p K ) 41/325 = 0.126 ( 1 : 8) p M /(1 p M ) 375/558 = 0.672 ( 1 : 1.5) 6 / 13

Beskrivelse af data Sandsynlighed for optagelse for kvinder: p K 41/366 = 0.112 Sandsynlighed for optagelse for mænd: p M 375/933 = 0.402 Odds for optagelse for kvinder: Odds for optagelse for mænd: p K /(1 p K ) 41/325 = 0.126 ( 1 : 8) p M /(1 p M ) 375/558 = 0.672 ( 1 : 1.5) Et statistisk test konstaterer, at der er forskel for mænd og kvinder: p K p M, p <.0001. 6 / 13

Associationsmål Vi fandt p K = 0.112 for kvinder, p M = 0.402 for mænd. Forskellen kan beskrives ved: Absolut differens i risiko (ARR): p K p M 0.29 Relativ risiko (RR) : p K /p M 0.28 Odds-ratio (OR): p K /(1 p K )/(p M /(1 p M )) 0.19. 7 / 13

Associationsmål Vi fandt p K = 0.112 for kvinder, p M = 0.402 for mænd. Forskellen kan beskrives ved: Absolut differens i risiko (ARR): p K p M 0.29 Relativ risiko (RR) : p K /p M 0.28 Odds-ratio (OR): p K /(1 p K )/(p M /(1 p M )) 0.19. Idet p K p M er ARR > 0, RR 1, OR 1 (p <.0001) 7 / 13

Odds ratio: kvinder versus mænd OR = 41 558 375 325 = 0.19 Køn Optaget Ja Nej Total Kvinde 41 325 366 Mand 375 558 933 Total 416 883 1299 Standard error af log(or) SE = 1 41 + 1 325 + 1 375 + 1 558 = 0.18 og dermed et 95%-konfidensinterval CI 95% = exp(log(or) ± 1.96 SE) = [0.13; 0.27] (indeholder ikke 1) 8 / 13

Confounding Har vi fundet den sande association mellem køn og optagelse? En variabel C er en potentiel confounder for E O relationen hvis den er: 1) relateret til exposure: E C 2) er en uafhængig risiko faktor for responsen: C O 3) Ikke er en konsekvens af exposure: E C O E C O Vi nødt til at tage højde for denne variabel i analysen. 9 / 13

Stratificeret analyse Vi opdeler materialet i strata svarende til afdelinger: Afdeling B: Køn Optaget Ja Nej Total Kvinde 17 (0.68) 8 25 Mand 353 (0.63) 207 560 Total 370 215 585 17 207 OR = 353 8 = 1.25 CI 95% = [0.53; 2.94] Afdeling F: Køn Optaget Ja Nej Total Kvinde 24 (0.07) 317 341 Mand 22 (0.06) 351 373 Total 46 668 714 24 351 OR = 22 317 = 1.21 CI 95% = [0.66; 2.20] 10 / 13

Confounding 11 / 13

En justeret analyse Vi kan beregne en fælles OR ved Mantel-Haenszel-metoden: OR MH = 1.22 CI 95% = [0.75; 1.99] I dette eksempel vender effekten af køn. Dette fænomen er et eksempel på Simpson s paradox. Findes der andre confoundere, bør de også inddrages i analysen. Vær altid omhyggelig med at justere for potentielle confoundere! 12 / 13

Opgave: Afdeling som confounder Beregn OR, afgør om der er en signifikant sammenhæng og beskriv associationen: 1. Er afdeling er relateret til køn? Afdeling Køn B F Total Kvinde 25 341 366 Mand 560 373 933 Total 585 714 1299 OR = CI 95% = [?;?] =? 2. Er afdeling relateret til optagelse? Optaget Afdeling Ja Nej Total B 370 215 585 F 46 668 714 Total 416 883 1299 OR = CI 95% = [?;?] =? 13 / 13