Sammenhængsanalyser. Et eksempel: Sammenhæng mellem rygevaner som 45-årig og selvvurderet helbred som 51 blandt mænd fra Københavns amt.
|
|
- Kirsten Ibsen
- 6 år siden
- Visninger:
Transkript
1 Sammenhængsanalyser Et eksempel: Sammenhæng mellem rygevaner som 45-årig og selvvurderet helbred som 51 blandt mænd fra Københavns amt. rygevaner som 45 årig * helbred som 51 årig Crosstabulation rygevaner som 45 årig Total aldrig nej % within rygevaner som 45 årig % within rygevaner som 45 årig % within rygevaner som 45 årig % within rygevaner som 45 årig % within rygevaner som 45 årig % within rygevaner som 45 årig helbred som 51 årig usædvanlig godt godt mindre godt elendigt Total ,7% 76,0% 6,3% 1,0% 100,0% ,6% 78,1% 6,3%,0% 100,0% ,3% 73,8% 8,8% 1,3% 100,0% ,0% 73,0% 15,3% 2,7% 100,0% ,9% 85,3% 8,8% 2,9% 100,0% ,2% 76,0% 9,4% 1,4% 100,0% 1
2 Problemer, der skal løses i forbindelse med analyser af sammenhænge mellem variable (jf. afsnit 7.6.2): Problemet Muligheder Underpunkter Retning Asymmetrisk Tidsmæssig forskydning Kausal effekt Symmetrisk Reciprok sammenhæng Pga. bagvedliggende faktorer esign-skabte sammenhænge Systemiske sammenhænge Funktionelle sammenhænge Kompleksitet Enkel Kompliceret Form Monotone Lineære Kvadratiske Ikke-monotone Kvadratiske Styrke Relevant Ikke relevant Evidens Signifikant Ikke signifikant 2
3 Evidensproblemet: Er der overhovedet sammenhæng mellem to variable? Hvis svaret er nej, er de andre problemer irrelevante. Hvis svaret er ja, skal sammenhængen beskrives. Styrkeproblemet: Er der tale om en stærk sammenhæng? Er sammenhængen mellem de to variable stærkere end mellem to andre variable? Er sammenhængen mellem de to variable svagere eller stærkere under visse betingelser end under andre? Hvordan skal sammenhængen måles? 3
4 Samme variable, men fem år tidligere: rygevaner som 40 årig * helbred som 45 årig Crosstabulation rygevaner som 40 årig Total aldrig nej % within rygevaner som 40 årig % within rygevaner som 40 årig % within rygevaner som 40 årig % within rygevaner som 40 årig % within rygevaner som 40 årig % within rygevaner som 40 årig helbred som 45 årig usædvanlig godt godt mindre godt elendigt Total ,0% 72,0% 11,0%,0% 100,0% ,6% 86,1% 4,2% 4,2% 100,0% ,2% 78,0% 6,6% 2,2% 100,0% ,5% 73,8% 13,1% 1,6% 100,0% ,5% 84,4% 3,1%,0% 100,0% ,2% 77,2% 8,9% 1,7% 100,0% Er der sammenhæng mellem rygevaner som 40-årig og selvrapporteret helbred som 45-årig? Er den svagere eller stærkere end fem år senere? 4
5 Sammenhæng mellem helbred som 45-årig og som 51-årig. helbred som 45 årig * helbred som 51 årig Crosstabulation helbred som 45 årig Total usædvanlig godt godt mindre godt elendigt % within helbred som 45 årig % within helbred som 45 årig % within helbred som 45 årig % within helbred som 45 årig % within helbred som 45 årig helbred som 51 årig usædvanlig godt godt mindre godt elendigt Total ,2% 60,8%,0%,0% 100,0% ,6% 82,3% 7,1%,9% 100,0% ,8% 45,9% 35,1% 8,1% 100,0% ,0% 57,1% 42,9%,0% 100,0% ,2% 76,0% 9,4% 1,4% 100,0% Er sammenhængen med det tidligere helbred stærkere end med det tidligere forbrug af tobak? 5
6 Evidens-spørgsmålet skal besvares ved et såkaldt signifikans-test (næste gang). Spørgsmålet om styrken af sammenhængen skal vurderes ved hjælp af korrelationskoefficienter eller andre tilsvarende mål for sammenhæng: 2 2 tabeller Forskelle på betingede sandsynligheder Forholdet mellem betingede sandsynligheder (den relative risiko) Odds-ratio værdier (krydsproduktforhold) r c tabeller Gamma koefficienter for ordinale variable Intet anvendeligt mål for sammenhæng mellem variable på nominalskala niveau 6
7 Korrelationskoefficienter Kvantitativt mål for styrken af sammenhæng mellem to variable: 1) Måles på en skala fra 1 til +1. Hvis der ikke er sammenhæng mellem to variable, skal korrelationskoefficienten være lig med 0. 2) En positiv korrelationskoefficient skal være udtryk for positiv sammenhæng, hvor større værdier af den ene variabel modsvares af større værdier af den anden (omvendt for negative) 3) Korrelationsskalaen skal være symmetrisk. 4) Korrelationsskalaen skal være ordinal. Jo større skal den numeriske værdi af korrelationskoefficienten være. 5) Værdierne 1 og +1 skal angive den stærkest observerbare grad af sammenhæng. Monotone deterministiske sammenhænge skal således bl.a. være karakteriseret ved korrelationskoefficienter på enten 1 eller +1. 7
8 2x2 tabeller Sammenhængen mellem arbejdsløshed og eksponering for vold blandt deltagerne i levekårsundersøgelsen fra Udsat for vold/trusler Arbejdsløs Total nej ja nej ja Total % 3.1% 100.0% % 5.4% 100.0% % 3.4% 100.0% 8
9 en epidemiologisk synsvinkel: er er tale om en asymmetrisk (tidsmæssig eller kausal) relation med arbejdsløshed som årsag og vold/trusler om vold som virkning: Risikoen for at blive udsat for vold = Sandsynligheden for at blive udsat for trusler/vold. Overrisikoen for at blive udsat for vold eller trusler: Risiko forskel = 5,4 3,1 % = 2,3 % Relativ risiko = 5,4/3,1 = 1,74 Odds-ratio = 5,4 94,6 3,1 96,9 = 1,77 en relative risiko og odds-ratio en ligger meget tæt på hinanden fordi der er tale om en forholdsvis sjælden hændelse, således at p Odds = p 1 p 9
10 en sociologiske synsvinkel Ingen naturlig retning i sammenhængen mellem arbejdsløshed og vold/trusler om vold. Man kan derfor lige så godt se på risikoen for at blive arbejdsløs givet, at man har været udsat for (trusler om) vold: Vold Risiko for arbejdsløshed nej 13,5 % ja 21,6 % Risikoforskel = 8,1 % Relativ risiko = 1,60 Odds-ratio = 1,77 Samme sammenhæng som før, men ny risikoforskel og ny relativ risiko. Odds-ratioen er den samme som tidligere. Odds-ratio værdien (og alle funktioner af odds-ratioen) er det eneste mål for sammenhæng i 2 x 2 tabeller, der er den samme uanset synsvinkel. 10
11 Krydsproduktforholdet a b c d En 2x2 tabel Krydsproduktforholdet i tabellen er lig med κ = ad bc Eksemplet: κ = = 1,77 Krydsproduktforhold og odds-ratio er det samme! 11
12 Gamma koefficienten for 2 x 2 tabeller Odds-ratio koefficienten (OR) kan antage værdier fra 0 til plus uendelig. Odds-ratio koefficienten er derfor ikke i gængs forstand en korrelationskoefficient. γ = OR OR Værdier fra -1 til +1. Jo større OR, jo større gamma koefficient. Gamma koefficienten er formelt set en korrelationskoefficient. 12
13 Gamma, odds-ratioværdier og logit værdier gamma oddsratio logit Logaritment til odds-ratio -1,00,00 - -,90,05-2,94 -,80,11-2,20 -,70,18-1,73 -,60,25-1,39 -,50,33-1,10 -,40,43 -,85 -,30,54 -,62 -,20,67 -,41 -,10,82 -,20,00 1,00,00,10 1,22,20,20 1,50,41,30 1,86,62,40 2,33,85,50 3,00 1,10,60 4,00 1,39,70 5,67 1,73,80 9,00 2,20,90 19,00 2,94 1, Bemærk: I intervallet -0,30 til 0,30 er logit 2 gamma 13
14 Et overordnet princip Værdien af en korrelationskoefficient bør ikke afhænge af hvilket design, der er blevet brugt til indsamlingen af data, hvis valget af design er et mere eller mindre arbitrært valg mellem flere forskellige anvendelige designs. Vurderingen af styrken af sammenhæng mellem exposure og disease skal være den samme (på nær usystematisk statistisk usikkerhed) uanset om der anvendes et prospektivt design eller om man anvender et case-control design 14
15 Prospektive studier og case-control studier Virkeligheden er prospektiv E = exposure = isease Risikoen forbundet med E skal vurderes ved at sammenligne to betingede fordelinger P( = ja E = nej) og P( = ja E = ja) Tre forskellige designs En prospektiv undersøgelse af 1000 tilfældigt udvalgte personer En prospektiv undersøgelse af 500 personer med E = nej og 500 personer med E = ja Et case-control studie af 500 personer med = nej og 500 personer med = ja 15
16 Tre forskellige tabeller, der beskriver sammenhængen mellem og E isease Exposure nej ja I alt nej a b a+b ja c d c+d I alt a+c b+d 1000 Kan estimeres: P( E) isease Exposure nej ja I alt nej e f 500 ja g h 500 I alt e+g f+h 1000 Kan estimeres: P( E) isease Exposure nej ja I alt nej i j i+j ja k l k+l I alt Kan estimeres: P(E ) 16
17 17 Sammenhængen mellem P( E) og P(E ) ) ( ) ( ) ( ) ( ) ( ) ( ) ( ), ( ) ( E P P E P E P P E P E P E P E P = = = ) ( ) ( ) ( ) ( P E P E P E P = Bayes formel ette er årsagen til at case-control studier fungerer, men det forudsætter, at vi vælger et associationsmål, der 1) ikke afhænger af fordelingen af og E, 2) giver samme resultat uanset om vi regner prospektivt eller retrospektivt Odds-ratio koefficienten (og funktioner af oddsrattio koefficienten) er det eneste associationsmål med denne egenskab
18 Standardfejl κ = ln(odds-ratio): SE(ln( κ )) = a b c d Gamma-koefficienten SE ( γ ) 2 1 γ = a b c d Estimation af koefficienter for sammenhængen mellem vold og arbejdsløshed Koefficient Estimat Standardfejl 95 % konfidensinterval Krydsproduktforhold * (κ) Logit-forskel (ln(κ)) Gamma (γ)
19 Ordinale data: Gamma koefficienten for r c tabeller Fordelingen af ensformigt og psykisk krævende arbejde i levekårsundersøgelsen i 1986 psykisk krævende arbejde ensformigt arbejde Total Ja Ja, af og til Nej Ja Ja, af og til Nej Total % 19.9% 71.0% 100.0% % 33.0% 55.8% 100.0% % 34.5% 45.4% 100.0% % 32.8% 49.0% 100.0% et er tydeligt at se, at arbejdet opleves som mindre psykisk krævende, jo mere ensformig det er. Sådanne fænomener beskrives som negative sammenhænge. Hvordan skal negativ og positiv sammenhæng defineres formelt? 19
20 Positiv og negativ sammenhæng Modellen: To ordinale kategorivariable: X og Y, Sandsynligheder, p xy = P(X=x,Y=y) Hvordan definerer vi hvad der skal forstås ved positiv og negativ sammenhæng inden for rammerne af modellen? 20
21 Parvis sammenligning af indbyrdes uafhængige individer: To sæt observationer, 1) værdierne x 1 og y 1 for den første person og 2) værdierne x 2 og y 2 for den anden. Undersøg: a. For det første hvilken af de to x-værdier, der er den største. b. For det andet, hvilken af de to y-værdier, der er størst. c. For det tredje om vi finder samme tendens ved sammenligning af x-værdierne, som ved sammenligning af y-værdierne. 21
22 Konkordans hvis der er samme tendens i x-værdierne som i y-værdierne. vs., hvis enten x 1 > x 2 og y 1 > y 2 eller iskordans x 1 < x 2 og y 1 < y 2 hvis der er modsatte tendens i x-værdierne som i y- værdierne, enten eller x 1 > x 2 og y 1 < y 2 x 1 < x 2 og y 1 > y 2 Sammenfald af x- eller y-værdier Hverken konkordans eller diskordans. 22
23 efinition af positiv og negativ sammenhæng Sandsynligheder for konkordans, diskordans og sammenfald: p C = sandsynligheden for at en sammenligning mellem to personer resulterer i konkordans p = sandsynligheden for at en sammenligning mellem to personer resulterer i diskordans p S = sandsynligheden for at en sammenligning mellem to personer resulterer i sammenfald Positiv sammenhæng mellem to variable, hvis sandsynligheden for konkordans er større end sandsynligheden for diskordans, p C > p Negativ sammenhæng hvis sandsynligheden for diskordans er større end sandsynligheden for konkordans p > p C 23
24 Sammenhængens styrke Gamma koefficienten bruges som mål for sammenhængens styrke: γ = p p C C + p p Lever automatisk op til konventionerne for korrelationskoefficienter: 1) γ vil altid være et tal mellem 1 og +1. 2) Hvis p = 0, dvs hvis diskordans ikke forekommer, vil γ være lig med +1, og omvendt, hvis konkordans ikke kan forekomme. 3) Hvis γ>0 vil sammenhængen pr. definition være positiv, og omvendt, hvis γ<0. 24
25 Fortolkning af γ-koefficienten γ koefficienten er en forskel mellem to betingede sandsynligheder P( C C ) = P( C) P( C) + P( ) P( C ) = P( ) P( C) + P( ) således at γ = P(C C ) P( C ) 25
26 Beregning af γ n C = antallet af sammenligninger, der resulterer i konkordans, n = antallet af sammenligninger, der resulterer i diskordans, n S = antallet af sammenligninger, der resulterer i sammenfald. Relative hyppigheder hvorefter γ estimeres ved h h C h S = = = nc n + n + n C S n n + n + n C S ns n + n + n C S G h C = h h + h C = n n C C n + n 26
27 Eksemplet 3003 personer i tabellen parvise sammenligninger med efterfølgende optællinger af konkordanser, diskordanser og sammenfald. Resultat af parvise sammenligninger af de 3002 personer Resultat af sammenligning Antal Relativ hyppighed Betinget fordeling givet konkordans eller diskordans Konkordans iskordans Sammenfald I alt Gamma = =
28 Gamma-koefficientens fordelingsmæssige egenskaber en empiriske Gamma -koefficient er asymptotisk central og normalfordelt. Standardfejlen for gamma-koefficienten har en relativt utilgængelig form, men beregnes af de statistiske programmer. Standardfejlen på gamma-koefficienten er lig med %-konfidensintervallet: ± = [ 0.42 til 0.27] 28
29 Vurderinger af gamma-koefficienter Sammenhængens styrke Absolut værdi af Gamma Svag < 0.15 Moderat Stærk >
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Mål for sammenhæng mellem to variable
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Mål for sammenhæng mellem to variable Estimation Stikprøve Data Population Teori relativ hyppighed parameter estimat sandsynlighed parameter
Læs mereMantel-Haenszel analyser. Stratificerede epidemiologiske analyser
Mantel-Haensel analyser Stratificerede epidemiologiske analyser 1 Den epidemiologiske synsvinkel: 1) Oftest asymmetriske (kausale) sammenhænge (Eksposition Sygdom/død) 2) Risikoen vurderes bedst ved hjælp
Læs mereRegneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)
Formelsamlingen 1 Regneregler for middelværdier M(a + bx) a + bm X M(X+Y) M X +M Y Spredning varians og standardafvigelse VAR(X) 1 n n i1 ( X i - M x ) 2 Y a + bx VAR(Y) VAR(a+bX) b²var(x) 2 Kovariansen
Læs mereStatistik II 1. Lektion. Analyse af kontingenstabeller
Statistik II 1. Lektion Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller Logistisk regression
Læs mereStatistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Stratificerede analyser
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Stratificerede analyser Dødsstraf-eksempel Betyder morderens farve noget for risikoen for dødsstraf? 1 Dødsstraf-eksempel: data Variable: Dødsstraf
Læs mereStatistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Uafhængighedstestet
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Uafhængighedstestet Eksempel: Bissau data Data kommer fra Guinea-Bissau i Vestafrika: 5273 børn blev undersøgt da de var yngre end 7 mdr og blev
Læs mereAnalyse af binære responsvariable
Analyse af binære responsvariable Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet 23. november 2012 Har mænd lettere ved at komme ind på Berkeley? UC Berkeley
Læs mereEks. 1: Kontinuert variabel som i princippet kan måles med uendelig præcision. tid, vægt,
Statistik noter Indhold Datatyper... 2 Middelværdi og standardafvigelse... 2 Normalfordelingen og en stikprøve... 2 prædiktionsinteval... 3 Beregne andel mellem 2 værdier, eller over og unden en værdi
Læs mere1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ
Indhold 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) 2 1.1 Variation indenfor og mellem grupper.......................... 2 1.2 F-test for ingen
Læs meregrupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen
1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen
Læs mereEpidemiologiske associationsmål
Epidemiologiske associationsmål Mads Kamper-Jørgensen, lektor, maka@sund.ku.dk Afdeling for Social Medicin, Institut for Folkesundhedsvidenskab It og sundhed l 16. april 2015 l Dias nummer 1 Sidste gang
Læs mereEstimation og usikkerhed
Estimation og usikkerhed = estimat af en eller anden ukendt størrelse, τ. ypiske ukendte størrelser Sandsynligheder eoretisk middelværdi eoretisk varians Parametre i statistiske modeller 1 Krav til gode
Læs mere3 typer. Case-kohorte. Nested case-kontrol. Case-non case (klassisk case-kontrol us.)
EPIDEMIOLOGI CASE-KONTROL STUDIER September 2011 Søren Friis Institut for Epidemiologisk Kræftforskning Kræftens Bekæmpelse Case kontrol studie 3 typer Case-kohorte Nested case-kontrol Case-non case (klassisk
Læs mereStatikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression
Statikstik II 2. Lektion Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Sandsynlighedsregningsrepetition Antag at Svar kan være Ja og Nej. Sandsynligheden for at Svar Ja skrives
Læs mereStatistiske principper
Statistiske principper 1) Likelihood princippet - Maximum likelihood estimater - Likelihood ratio tests - Deviance 2) Modelbegrebet - Modelkontrol 3) Sufficient datareduktion 4) Likelihood inferens i praksis
Læs mereKausale modeller. Konstruktion og analyse
Kausale modeller Konstruktion og analyse 1 Kausale modeller = DAGs (Directed acyclic graphs) defineret ved Fuldstændig ordnet kausal struktur Definition af direkte kausal effekt Antagelser om fravær af
Læs mereStatistik II 4. Lektion. Logistisk regression
Statistik II 4. Lektion Logistisk regression Logistisk regression: Motivation Generelt setup: Dikotom(binær) afhængig variabel Kontinuerte og kategoriske forklarende variable (som i lineær reg.) Eksempel:
Læs mereStatistiske data. Datamatricen. Variable j. ... X ij = x ij... Anonymiserede og ækvivalente dataindivider. Datamodellen
Statistiske data Datamatricen Variable j Individer i X ij = x ij Anonymiserede og ækvivalente dataindivider Datamodellen Hvis dataindividerne er udvalgte repræsentanter fra en population, så er datamatrice
Læs mereStatistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable
Statistik II Lektion 3 Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Setup: To binære variable X og Y. Statistisk model: Konsekvens: Logistisk regression: 2 binære var. e e X Y P
Læs mereLogistisk Regression. Repetition Fortolkning af odds Test i logistisk regression
Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logisitks Regression: Repetition Y {0,} binær afhængig variabel X skala forklarende variabel π P( Y X x) Odds(Y X x) π /(-π
Læs merePræcision og effektivitet (efficiency)?
Case-kontrol studier PhD kursus i Epidemiologi Københavns Universitet 18 Sep 2012 Søren Friis Center for Kræftforskning, Kræftens Bekæmpelse Valg af design Problemstilling? Validitet? Præcision og effektivitet
Læs mereBesvarelse af opgavesættet ved Reeksamen forår 2008
Besvarelse af opgavesættet ved Reeksamen forår 2008 10. marts 2008 1. Angiv formål med undersøgelsen. Beskriv kort hvordan cases og kontroller er udvalgt. Vurder om kontrolgruppen i det aktuelle studie
Læs mereLogistisk regression
Logistisk regression Test af antagelsen om lineære effekter Modelkonstruktion og modelsøgning Hvilke variable og hvilke interaktioner skal inkluderes i regressionsmodellerne? 1 Logistiske regressionsmodeller
Læs mereEpidemiologiske associationsmål
Epidemiologiske associationsmål Mads Kamper-Jørgensen, lektor, maka@sund.ku.dk Afdeling for Social Medicin, Institut for Folkesundhedsvidenskab It og sundhed l 21. april 2016 l Dias nummer 1 Sidste gang
Læs mereStatistik kommandoer i Stata opdateret 22/ Erik Parner
Statistik kommandoer i Stata opdateret 22/4 2008 Erik Parner Indledning... 1 Simple beskrivelser... 1 Data manipulation... 1 Estimation af proportioner... 2 Estimation af rater... 2 Estimation af Relativ
Læs mereStatistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Eksamensopgave E05 Socialklasse og kronisk sygdom Data: Tværsnitsundersøgelse fra 1986 Datamaterialet indeholder: Køn, alder, Højest opnåede
Læs mereHver anden vil benytte øget åbningstid i dagtilbud
Børnefamiliers dagtilbud og arbejdsliv 17. maj 18 Hver anden vil benytte øget åbningstid i dagtilbud Halvdelen af alle lønmodtagere med børn mellem -13 år ville benytte sig af udvidede åbningstider i deres
Læs mereRegressionsanalyser. Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer.
Regressionsanalyser Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer. Hvilke faglige problemer kan man løse vha. regressionsanalyser? 1 Regressionsanalyser Det primære problem
Læs mereLog-lineære modeller. Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres.
Log-lineære modeller Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres. Kontingenstabel Contingency: mulighed/tilfælde Kontingenstabel: antal observationer (frekvenser)
Læs mereLogistisk Regression. Repetition Fortolkning af odds Test i logistisk regression
Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression: Definitioner For en binær (0/) variabel Y antager vi P(Y)p P(Y0)-p Eksempel: Bil til arbejde vs alder
Læs mere9. Chi-i-anden test, case-control data, logistisk regression.
Biostatistik - Cand.Scient.San. 2. semester Karl Bang Christensen Biostatististisk afdeling, KU kach@biostat.ku.dk, 35327491 9. Chi-i-anden test, case-control data, logistisk regression. http://biostat.ku.dk/~kach/css2014/
Læs mereOR stiger eksponentielt med forskellen i BMI komplicet model svær at forstå og analysere simpel model
Epidemiologi og biostatistik. Uge 5, torsdag. marts 1 Morten Frydenberg, Institut for Biostatistik. 1 Analyse af overlevelsesdata (ventetidsdata) Censurering (højre + andet) Kaplan-Meyer kurver Det statistiske
Læs mereBilag 4 til rapporten Idræt i udsatte boligområder
Bilag 4 til rapporten Idræt i udsatte boligområder Beboernes selvvurderede helbred Spørgeskemaerne til voksne beboere i de seks boligområder og skoleelever fra de skoler, som især har fra de samme boligområder,
Læs mereSommereksamen 2015. Bacheloruddannelsen i Medicin/Medicin med industriel specialisering
Sommereksamen 2015 Titel på kursus: Uddannelse: Semester: Statistik og evidensbaseret medicin Bacheloruddannelsen i Medicin/Medicin med industriel specialisering 2. semester Eksamensdato: 16-06-2015 Tid:
Læs mereKapitel 13 Reliabilitet og enighed
Kapitel 13 Reliabilitet og enighed Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 Version 11. april 2011 1 / 23 Indledning En observation er sammensat af en sand værdi og en målefejl
Læs mereKapitel 12 Variansanalyse
Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 / 43 Indledning Sammenligning af middelværdien i to grupper indenfor en stikprøve kan
Læs mereEffektmålsmodifikation
Effektmålsmodifikation Mads Kamper-Jørgensen, lektor, maka@sund.ku.dk Afdeling for Social Medicin, Institut for Folkesundhedsvidenskab It og sundhed l 21. april 2015 l Dias nummer 1 Sidste gang Vi snakkede
Læs mereOR stiger eksponentielt med forskellen i BMI. kompliceret model svær at forstå og analysere
Epidemiologi og biostatistik. Uge 5, torsdag 5. september 003 Morten Frydenberg, Institut for Biostatistik. 1 Analyse af overlevelsesdata (ventetidsdata) Censurering (højre + andet) Kaplan-Meyer kurver
Læs mereProgram: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19
Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større
Læs mereStatistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Mantel-Haenszel analyser
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Mantel-Haenszel analyser Mantel-Haenszel analyser Sidst lærte vi om stratificerede analyser. I dag kigger vi på et specialtilfælde: både exposure
Læs mereElaborering: Analyse af betingede relationer
Elaborering: Analyse af betingede relationer 1 Mordsager i Florida i perioden 1973-79 Sammenhæng mellem morderens race og forekomst af dødsdom i 4764 mordsager i Florida i 1973-1979. Dom Morder sort hvid
Læs mereLøsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)
Afdeling for Biostatistik Bo Martin Bibby 23. november 2006 Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Vi betragter 4699 personer fra Framingham-studiet. Der er oplysninger om follow-up
Læs mereKapitel 12 Variansanalyse
Kapitel 12 Variansanalyse Peter Tibert Stoltze stat@peterstoltzedk Elementær statistik F2011 Version 7 april 2011 1 Indledning 2 Ensidet variansanalyse 3 Blokforsøg 4 Vekselvirkning 1 Indledning 2 Ensidet
Læs mereBilagsnotat til: De nationale tests måleegenskaber
Bilagsnotat til: De nationale tests måleegenskaber Baggrund Der er ti obligatoriske test á 45 minutters varighed i løbet af elevernes skoletid. Disse er fordelt på seks forskellige fag og seks forskellige
Læs mere1. februar Lungefunktions data fra tirsdags Gennemsnit l/min
Epidemiologi og biostatistik Uge, torsdag 3. februar 005 Morten Frydenberg, Afdeling for Biostatistik. og hoste estimation sikkerhedsintervaller antagelr Normalfordelingen Prædiktion Statistisk test (ud
Læs mereHyppigheds- og associationsmål. Kim Overvad Afdeling for Epidemiologi Institut for Folkesundhed Aarhus Universitet Februar 2011
Hyppigheds- og associationsmål Kim Overvad Afdeling for Epidemiologi Institut for Folkesundhed Aarhus Universitet Februar 2011 Læringsmål Incidens Incidens rate Incidens proportion Prævalens proportion
Læs mereBenchmarking af kommunernes sagsbehandling antagelser, metode og resultater
Benchmarking af kommunernes sagsbehandling antagelser, metode og resultater Anna Amilon Materiel vurdering Ved vurderingen af en afgørelses materielle indhold vurderes afgørelsens korrekthed i forhold
Læs mereTema. Dagens tema: Indfør centrale statistiske begreber.
Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i
Læs mereStatistik kommandoer i Stata opdateret 16/3 2009 Erik Parner
Statistik kommandoer i Stata opdateret 16/3 2009 Erik Parner Indledning... 1 Hukommelse... 1 Simple beskrivelser... 1 Data manipulation... 2 Estimation af proportioner... 2 Estimation af rater... 2 Estimation
Læs mereResultater. Formål. Results. Results. Må ikke indeholde. At fåf. kendskab til rapportering af resultater. beskrivelse
Formål Resultater kendskab til rapportering af resultater Andreas H. Lundh Infektionsmedicinsk Afdeling, Hvidovre Hospital Anders W. JørgensenJ Øre-næse-halsafdeling, Århus Universitetshospital Mål At
Læs mereAnvendt Statistik Lektion 9. Variansanalyse (ANOVA)
Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:
Læs mereNormalfordelingen og Stikprøvefordelinger
Normalfordelingen og Stikprøvefordelinger Normalfordelingen Standard Normal Fordelingen Sandsynligheder for Normalfordelingen Transformation af Normalfordelte Stok.Var. Stikprøver og Stikprøvefordelinger
Læs mereORDINÆR EKSAMEN I EPIDEMIOLOGISKE METODER IT & Sundhed, 2. semester
D E T S U N D H E D S V I D E N S K A B E L I G E F A K U L T E T K Ø B E N H A V N S U N I V E R S I T E T B l e g d a m s v e j 3 B 2 2 0 0 K ø b e n h a v n N ORDINÆR EKSAMEN I EPIDEMIOLOGISKE METODER
Læs mereTo-sidet varians analyse
To-sidet varians analyse Repetition En-sidet ANOVA Parvise sammenligninger, Tukey s test Model begrebet To-sidet ANOVA Tre-sidet ANOVA Blok design SPSS ANOVA - definition ANOVA (ANalysis Of VAriance),
Læs mereAnvendt Statistik Lektion 9. Variansanalyse (ANOVA)
Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:
Læs mereRapport vedrørende. etniske minoriteter i Vestre Fængsel. Januar 2007
Rapport vedrørende etniske minoriteter i Vestre Fængsel Januar 2007 Ved Sigrid Ingeborg Knap og Hans Monrad Graunbøl 1 1. Introduktion Denne rapport om etniske minoriteter på KF, Vestre Fængsel er en del
Læs mereStatistiske modeller
Statistiske modeller Statistisk model Datamatrice Variabelmatrice Hændelse Sandsynligheder Data Statistiske modeller indeholder: Variable Hændelser defineret ved mulige variabel værdier Sandsynligheder
Læs mereHypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0
Hypotesetest Hypotesetest generelt Ingredienserne i en hypotesetest: Statistisk model, f.eks. X 1,,X n uafhængige fra bestemt fordeling. Parameter med estimat. Nulhypotese, f.eks. at antager en bestemt
Læs mereREEKSAMEN I EPIDEMIOLOGISKE METODER IT & Sundhed, 2. semester
D E T S U N D H E D S V I D E N S K A B E L I G E F A K U L T E T K Ø B E N H A V N S U N I V E R S I T E T B l e g d a m s v e j 3 B 2 2 0 0 K ø b e n h a v n N REEKSAMEN I EPIDEMIOLOGISKE METODER IT
Læs mereBetingede sandsynligheder Aase D. Madsen
1 Uge 12 Teoretisk Statistik 15. marts 2004 1. Betingede sandsynligheder Definition Loven om den totale sandsynlighed Bayes formel 2. Betinget middelværdi og varians 3. Kovarians og korrelationskoefficient
Læs mereEpidemiologi og Biostatistik
Kapitel 1, Kliniske målinger Epidemiologi og Biostatistik Introduktion til skilder (varianskomponenter) måleusikkerhed sammenligning af målemetoder Mogens Erlandsen, Institut for Biostatistik Uge, torsdag
Læs mereLandmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen
Landmålingens fejlteori Lektion Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ - rw@math.aau.dk Institut for Matematiske Fag Aalborg Universitet En stokastisk variabel er en variabel,
Læs mereEffektmålsmodifikation
Effektmålsmodifikation Mads Kamper-Jørgensen, lektor, maka@sund.ku.dk Afdeling for Social Medicin, Institut for Folkesundhedsvidenskab Sundhed og informatik l 25. april 2017 l Dias nummer 1 Sidste gang
Læs mereHver femte med hårdt arbejdsmiljø er på overførsler fire år efter
Hver femte med hårdt arbejdsmiljø er på overførsler fire år efter Ca. 420.000 lønmodtagere mellem 18 og 60 år havde et hårdt fysisk eller psykisk arbejdsmiljø i 2012. Fire år senere i 2016 modtog hver
Læs mereenige i, at der er et godt psykisk arbejdsmiljø. For begge enige i, at arbejdsmiljøet er godt. Hovedparten af sikkerhedsrepræsentanterne
3. ARBEJDSMILJØET OG ARBEJDSMILJØARBEJDET I dette afsnit beskrives arbejdsmiljøet og arbejdsmiljøarbejdet på de fem FTF-områder. Desuden beskrives resultaterne af arbejdsmiljøarbejdet, og det undersøges
Læs mereAnvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele
Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Motiverende eksempel Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning
Læs mereStatistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Estimation
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Estimation Eksempel: Bissau data Data kommer fra Guinea-Bissau i Vestafrika: 5273 børn blev undersøgt da de var yngre end 7 mdr og blev herefter
Læs mereØkonometri 1. Inferens i den lineære regressionsmodel 2. oktober Økonometri 1: F8 1
Økonometri 1 Inferens i den lineære regressionsmodel 2. oktober 2006 Økonometri 1: F8 1 Dagens program Opsamling om asymptotiske egenskaber: Asymptotisk normalitet Asymptotisk efficiens Test af flere lineære
Læs mereEksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet
Eksamen ved Københavns Universitet i Kvantitative forskningsmetoder Det Samfundsvidenskabelige Fakultet 14. december 2011 Eksamensnummer: 5 14. december 2011 Side 1 af 6 1) Af boxplottet kan man aflæse,
Læs mereForelæsning 11: Kapitel 11: Regressionsanalyse
Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Læs mere- Panelundersøgelse, Folkeskolen, februar 2013 FOLKESKOLEN. Undersøgelse om syn på kønnets betydning for fag- og uddannelsesvalg
FOLKESKOLEN Undersøgelse om syn på kønnets betydning for fag- og uddannelsesvalg 2013 Udarbejdet af Scharling Research for redaktionen af Folkeskolen, februar 2013 Formål Scharling.dk Side 1 af 14 Metode
Læs merePersonale i daginstitutioner normering og uddannelse
Personale i daginstitutioner normering og uddannelse Dagtilbudsområdet er et stort velfærdsområde, som spiller en vigtig rolle i mange børns og familiers hverdag og for samfundet som helhed. Dagtilbuddenes
Læs mereStudiedesigns: Case-kontrolundersøgelser
Studiedesigns: Case-kontrolundersøgelser Mads Kamper-Jørgensen, lektor, maka@sund.ku.dk Afdeling for Social Medicin, Institut for Folkesundhedsvidenskab It og sundhed l 12. maj 2016 l Dias nummer 1 Sidste
Læs mereAppendiks A. Entreprenørskabsundervisning i befolkningen, specielt blandt unge
Appendiks A. Entreprenørskabsundervisning i befolkningen, specielt blandt unge Redegørelsen ovenfor er baseret på statistiske analyser, der detaljeres i det følgende, et appendiks for hvert afsnit. Problematikken
Læs mereLogistisk regression. Statistik Kandidatuddannelsen i Folkesundhedsvidenskab
Logistis regression Statisti Kandidatuddannelsen i Folesundhedsvidensab Multipel logistis regression Antagelser: Binære observationer (Y i, i=,.,n) f.es Ja/Nej Høj/Lav Død/Levende Kodet: / 0 Y i uafhængige
Læs mereI dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd
I dag Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik SaSt) Helle Sørensen Først lidt om de sidste uger af SaSt. Derefter statistisk analyse af en enkelt
Læs mere1 Hb SS Hb Sβ Hb SC = , (s = )
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.
Læs mereAnvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele
Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Motiverende eksempel Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning
Læs mereLøsning til eksaminen d. 14. december 2009
DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,
Læs mereEksamen i statistik 2010 Kandidatuddannelsen i folkesundhedsvidenskab
D E T S U N D H E D S V I D E N S K A B E L I G E F A K U L T E T K Ø B E N H A V N S U N I V E R S I T E T Eksamen i statistik 2010 Kandidatuddannelsen i folkesundhedsvidenskab Eksamensnummer: 16, 23
Læs mereJUSTITSMINISTERIETS FORSKNINGSKONTOR NOVEMBER 2017
JUSTITSMINISTERIETS FORSKNINGSKONTOR NOVEMBER 2017 UDVIKLINGEN I ANTAL ANMELDELSER OG I STRAFFENES ART OG LÆNGDE FOR VOLD, 2007-2016 På baggrund af Danmarks Statistiks tal vedrørende anmeldelser og strafferetlige
Læs meremen nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller
Type I og type II fejl Type I fejl: forkast når hypotese sand. α = signifikansniveau= P(type I fejl) Program (8.15-10): Hvis vi forkaster når Z < 2.58 eller Z > 2.58 er α = P(Z < 2.58) + P(Z > 2.58) =
Læs mereKonfidensintervaller og Hypotesetest
Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller
Læs mereLineær og logistisk regression
Faculty of Health Sciences Lineær og logistisk regression Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Dagens program Lineær regression
Læs mereReminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model
Reminder: Hypotesetest for én parameter Antag vi har model Økonometri: Lektion 4 F -test Justeret R 2 Aymptotiske resultater y = β 0 + β 1 x 2 + β 2 x 2 + + β k x k + u. Vi ønsker at teste hypotesen H
Læs mereVirksomhedspraktik til flygtninge
Virksomhedspraktik til flygtninge Af Lasse Vej Toft, LVT@kl.dk Formålet med dette analysenotat er, at give viden om hvad der har betydning for om flygtninge kommer i arbejde efter virksomhedspraktik Analysens
Læs mereOversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode
Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse
Læs mereHypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j
Hypoteser om mere end to stikprøver ANOVA k stikprøver: (ikke ordinale eller højere) H 0 : 1 2... k gælder også for k 2! H 0ij : i j H 0ij : i j simpelt forslag: k k 1 2 t-tests: i j DUER IKKE! Bonferroni!!
Læs mereFokus på Forsyning. Datagrundlag og metode
Fokus på Forsyning I notatet gennemgås datagrundlaget for brancheanalysen af forsyningssektoren sammen med variable, regressionsmodellen og tilhørende tests. Slutteligt sammenfattes analysens resultater
Læs mereStatistik i GeoGebra
Statistik i GeoGebra Peter Harremoës 13. maj 2015 Jeg vil her beskrive hvordan man kan lave forskellige statistiske analyser ved hjælp af GeoGebra 4.2.60.0. De statistiske analyser svarer til pensum Matematik
Læs mereNaturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1
Matematisk Modellering 1 Side 1 I nærværende opgavesæt er der 16 spørgsmål fordelt på 4 opgaver. Ved bedømmelsen af besvarelsen vægtes alle spørgsmål lige. Endvidere lægges der vægt på, at det af besvarelsen
Læs mereMultipel Lineær Regression
Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer
Læs mereKvantitative metoder 2
Kvalitative egenskaber og dummyvariabler Kvantitative metoder 2 Dummyvariabler 28. marts 2007 Vi har (hovedsagligt) set på kvantitative variabler (løn, priser, forbrug, indkomst, )... Men hvad med kvalitative
Læs mereStatistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test
Statistik Lektion 0 Ikkeparametriske metoder Repetition KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,
Læs mereMidtvejsevaluering af målopfyldelsen i 2020- strategien
9. marts 2015 Midtvejsevaluering af målopfyldelsen i 2020- strategien J.nr. 20140039222 Ifølge den politiske aftale En strategi for arbejdsmiljøindsatsen frem til 2020 skal der i 2014 og 2017 i samarbejde
Læs mereStikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader
Stikprøver og stikprøve fordelinger Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Statistik Statistisk Inferens: Prediktere og forekaste værdier af
Læs merePOLITIETS TRYGHEDSUNDERSØGELSE I GRØNLAND, 2017
SYDSJÆLLAND POLITIETS TRYGHEDSUNDERSØGELSE I GRØNLAND, EN MÅLING AF TRYGHEDEN OG TILLIDEN TIL POLITIET I: HELE GRØNLAND NUUK BEBYGGELSE MED POLITISTATION BEBYGGELSE UDEN POLITISTATION MARTS 2018 1 INDHOLD
Læs mereBetydningen af konjunktur og regelændringer for udviklingen i sygedagpengemodtagere
DET ØKONOMISKE RÅD S E K R E T A R I A T E T d. 20. maj 2005 SG Betydningen af konjunktur og regelændringer for udviklingen i sygedagpengemodtagere Baggrundsnotat vedr. Dansk Økonomi, forår 2005, kapitel
Læs mereKursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo
Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte
Læs mereArbejdspladsens generelle prioritering af arbejdsmiljø
Arbejdspladsens generelle prioritering af arbejdsmiljø Arbejdsgiver og/eller medarbejderrepræsentanter fra over 1000 primært mellemstore til store arbejdspladser har i en særlig undersøgelse udfyldt spørgeskemaet
Læs mere