Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom
|
|
- Else Ibsen
- 6 år siden
- Visninger:
Transkript
1 Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Eksamensopgave E05 Socialklasse og kronisk sygdom
2 Data: Tværsnitsundersøgelse fra 1986 Datamaterialet indeholder: Køn, alder, Højest opnåede uddannelse (i 1986). Egen socialklasse, Familiesocialklasse og Oplysninger om tilstedeværelse af vedvarende (kronisk) sygdom. Socialklassen: mål for social status baseret på oplysninger om uddannelse og arbejde, hvor personer i socialklasse I har størst social status, mens personer i socialklasse V har lavest status. Egen socialstatus er baseret på personens egne oplysninger om uddannelse og arbejde. Familiesocialklassen er defineret som den højeste af personens egen og en eventuel ægtefælles eller samlevers socialklasse. Formål: undersøge om personens egen socialklasse og familiesocialklassen har betydning for forekomsten af kroniske sygdomme. 1
3 Indhold Jeg vil have fokus på de statistiske metoder - ikke så meget præsentation (overordnet set er studenterbesvarelsen et fint eksempel på hvordan resultater af en statistisk analyse præsenteres). 1. Analyse i 2-vejs tabeller 2. Mantel-Haenszel analyser 3. Logistisk regression (a) modelsøgning (b) vekselvirkning Her mest fokus på logistisk regression. 2
4 Deskriptiv statistik Beskriv fordelingen af de variable der indgår i analysen. Studenter besvarelsen er for kort - mangler fordeling af potentielle confoundere: Egen socialgrp. I: 5.1; II: 10.4; III: 19.7; IV: 36.9; V: 28.0 Alder 30-40: 27.0; 40-50: 24.7; 50-60: 17.6; 60-70: 17.5; 70-80: 13.2 Kronisk sygdom nogle: 51.0 Køn kvinde: Fordeling af analysevariable: relativ hyppighed i procent (N=4561). Angiv også for hver variabel antallet af uoplyste. 3
5 Marginale sammenhænge De vigtigste sammenhænge i denne analyse er relationen mellem socialklasse og kronisk sygdom. I II III IV V Egen socialklasse 34% 39% 47% 48% 61% Familiesocialklasse 36% 39% 49% 51% 66% Hypotesen om ingen sammenhæng H 0 : p 1 = p 2 = p 3 = p 4 = p 5 Egen socialklasse χ 2 = 103, df = 4, p < Familiesocialklasse χ 2 = 148, df = 4, p < Her kunne man også have angivet γ Jo dårligere socailklasse jo højere risiko for sygdom 4
6 Confounding? socialklasse confounder sygdom I stratificerede analyser og ved logistisk regression kan vi undersøge om den stærke sammenhæng vi har fundet mellem socialklasse og sygdom er et resultat af confounding 5
7 Sammenhæng mellem de to socialklassevariable Familie Egen I II III IV V Total I II III IV V Total Familiesocialgruppe bør ikke være dårligere end egen socialgruppe, dvs alle personer burde ligge på eller under diagonalen. Det er ikke tilfældet. Vi antager at data er korrekte. Man kunne også have ekskluderet disse få cases. Sådanne problemer opstår i mange data, når de opdages må man henvende sig til den dataansvarlige. χ 2 = 9277, df = 16, p < 0.001, γ = 0.879, p < 0.001, Meget stærk sammenhæng mellem de to socailklasse-variable. 6
8 Mantel-Haenszel analyse Mantel-Haenszel analyser kræver en binær eksponeringsvariabel og passer derfor ikke umiddelbart til disse data. Mantel-Haenszel analysen er en del af pensum, så ved en mundtlig eksamen kan spørgsmål i dette emne forekomme. Her er det en fordel for studenten at have konkrete resultater at tale ud fra. Derfor er det en god ide at skære data lidt til så Mantel-Haenszel analyser kan foretages. For begge socialklassevariable bruges grupperingen: I+II mod III+IV+V Tabel 3 undersøger effekt af potentielle confounders på eksponering og outcome. Mantel-Haenszel resultater i Tabel 4 og 5 i studenterbesvarelse. 7
9 Generel stratificeret analyse Confounder Z kan antage k forskellige værdier Z = 1 Z = z Z = k syg soc Ja Nej lav a 1 b 1... syg soc Ja Nej lav a z b z... syg soc Ja Nej lav a k b k høj c 1 d 1 høj c z d z høj c k d k ÔR 1 ÔR z ÔR k 8
10 Socialklasse-Sygdom: stratifikation efter alder (fra 3. søjle i Tabel 4) OR Hypotesen om ingen effektmodifikation H 0 : OR 1 = OR 2 =... = OR 5 Hypotesen testes ved Breslow-Day testet: χ 2 = 2.1, df = 4, p = 0.72 Alder modificerer ikke effekt af socialklasse på risiko for sygdom Mantel Haenzel OR estimat: % CI (1.37; 1.95) Alder kan ikke forklare effekten af socialklasse på sygdom 9
11 Hvorfor indgår køn ikke i Tabel 4 og 5? I Tabel 3 ses at køn ikke påvirker risiko for sygdom. Hermed opfylder køn ikke kravene til en confounder. Men det udelukker ikke at køn kunne være en effektmodifikator: vigtigheden af socialklasse for helbred kunne afhænge af køn. Det ville have været mere korrekt at have ladet køn indgå i Mantel-Haenzel analysen 10
12 Mantel-Haenszel og confounding s. 6 midten: formålet er at afgøre om alder, uddannelse, egen og familiesocialklasse er rent faktisk er konfoundere Nej, formålet er at estimere effekten af exposure på outcome korrigeret for mulige konfoundere. s. 7 midten: Afsnit ender med at konkludere: Alder er en konfounder. Lidt underlig konklusion. Jeg vil hellere sige at analysen har vist at det er vigtigt at korrigere for alder - ret stor forskel på marginal OR (1.83) og korrigeret OR (1.64). 11
13 Logistisk regressionsanalyse (og notation) Her bruger vi de oprindelige socialklassevariable som kategoriske kovariater: logit(p) = α + β soc Bogen og studenterbesvarelsen skriver modellen op med dummy-variable: logit(p) = α+β soc1 soc1+β soc2 soc2+β soc3 soc3+β soc4 soc4 = α+σ i β soci soci soc1, soc2, soc3, soc4 er dummy variable, der udpeger grupperne I til IV, V er reference gruppen. Dvs soc1=1 for personer i gruppe I og 0 ellers. Se også s i bogen. β soci er logit forskellen mellem gruppe i og V (referencegruppe). OR i = exp(β soci ) 12
14 Hvorfor? Model logit(p) = α + β soc1 soc1 + β soc2 soc2 + β soc3 soc3 + β soc4 soc4 logit i gruppe I: logit(p) = α + β soc1 1 + β soc2 0 + β soc3 0 + β soc4 0 = α + β soc1 logit i gruppe V: logit(p) = α + β soc1 0 + β soc2 0 + β soc3 0 + β soc4 0 = α logit-forskel = α + β soc1 α = β soc1 OR 1vs5 = exp(β soc1 ) 13
15 Resultat: familiesocialklasse Variables in the Equation B S.E. Wald df Sig. Exp(B) famsoc86 143,576 4,000 famsoc86(1) -1,248,130 91,987 1,000,287 Step 1 a famsoc86(2) -1,111, ,650 1,000,329 famsoc86(3) -,706,092 59,016 1,000,494 famsoc86(4) -,605,091 44,658 1,000,546 Constant,658,072 82,416 1,000 1,931 a. Variable(s) entered on step 1: famsoc86. Sammenlignes gruppe I med V (referencegruppen) fåes en OR på [exp( 1.248)], dvs. i gruppe I udgør odds for sygdom kun 29% af odds i gruppe V. Det samlede test for ingen effekt af socialgruppen aflæses i 1. række: p < H 0 : β soc1 = β soc2 = β soc3 = β soc4 = 0 Effekten af familiesocialgruppe er stærkt signifikant. 14
16 Multipel logistisk regressionsanalyse En vigtig fordel ved logistisk regressions analyse er at det er let at lave confounderkorrektion. En potentiel confounder medtages som endnu en kovariat. Aldersjustering: logit(p) = α + Σ i β soci soci + β al alder Nu estimeres odds-ratio værdier mellem personer fra forskellige socialgrupper, men med samme alder. 15
17 Modelsøgning - Hvilke variable skal med i modellen? Socialklasse skal med - det er jo den vi vil finde effekten af (primær del) Hvilke confounder variable? og hvad med vekselvirkninger? Baglæns selektion: Start med stor model og fjern insignifikante variable. Denne metode benyttes i studenterbesvarelsen se Tabel 6. Startmodel: egen socialklassse, familiesocialklasse, køn, alder, uddannelse, samt vekselvirkninger: egen socialklasse familiesocialklasse, egen socialklasse køn, egen socailklasse alder, egen socailklasse uddannelse, familiesocialklasse køn, familiesocailklasse alder, familiesocialklasse uddannelse. 16
18 Baglæns selektion - studenterbesvarelse Trin 1: vekselvirkningen egen socialklasse familie socialklasse fjernes fordi variablen er insignifikant og har den højeste p-værdi (p = 0.71). Trin 2: vekselvirkningen egen socialklasse uddannelse fjernes fordi variablen er insignifikant og har den højeste p-værdi (p = 0.30).... Trin 8: model indeholder: familiesocialklasse, køn, alder, uddannelse, familiesocialklasse køn - alle led er signifikante 17
19 Det hierarkiske princip for interaktioner Hvis en model indeholder interaktionen X Z skal modellen også indeholde hovedvirkningerne X og Z Dvs. i en baglæns selektionsprocedure må man ikke fjerne X eller Z hvis X Z er i modellen. Tabel 6: uddannelse kan først fjernes efter at egen socailklasse uddannelse og familie socailklasse uddannelse er fjernet. Fint illustreret i tabellen 18
20 Modelsøgning: anbefalet metode En svaghed ved metoden i studenterbesvarelsen og bogens afsnit er at man let ender med en model med vekselvirkninger. Vi foreslår: 1. Start med en model med alle potentielle confoundere men uden vekselvirkninger. Lav evt baglæns selektion. Fortolk resultatet i den endelige model. 2. Linearitetstjek af kontinuerte variable (her alder). Ikke-lineære effekter: f.eks alder 2 og alder 3. Eller logaritme. En ikke-lineær effekt rapporteres i en tegning. 3. Inkluder udvalgte vekselvirkninger og lav baglæns modelsøgning blandt disse. Kovariater med ikke-lineær effekt i trin 2 kan evt erstattes med kategoriserede variable. 19
21 Startmodeller Vi har to socialklasse-variable som er meget stærkt relaterede. Jeg starter med at se på dem hver for sig. logit(p) = α + Σ i β soci soci + β sex1 sex1 + Σ i β uddi uddi + β al alder Hvor soc-variablen angiver enten familiesocialklasse eller egen socialklasse 20
22 Output: familiesocialklasse B S.E. Wald df Sig. Exp(B) sex(1),134,065 4,222 1,040 1,144 alder86,030, ,523 1,000 1,031 udd86 17,020 4,002 udd86(1) -,336,150 5,037 1,025,715 udd86(2) -,328,136 5,812 1,016,721 udd86(3) -,303,079 14,608 1,000,738 udd86(4) -,258,134 3,725 1,054,772 famsoc86 47,624 4,000 famsoc86(1) -,851,158 28,990 1,000,427 famsoc86(2) -,712,129 30,656 1,000,491 famsoc86(3) -,549,099 30,796 1,000,577 famsoc86(4) -,341,098 12,004 1,001,711 Constant -,976,152 40,988 1,000,377 Alle confoundere er signifikante: modelsøgning stopper. Høj familiesocialklasse giver lavere risiko for sygdom når man sammenligner personer med samme køn, alder og uddannelse. 21
23 Output: egen socialklasse B S.E. Wald df Sig. Exp(B) sex(1),220,068 10,419 1,001 1,246 alder86,031, ,064 1,000 1,031 udd86 16,665 4,002 udd86(1) -,289,176 2,695 1,101,749 udd86(2) -,364,140 6,790 1,009,695 udd86(3) -,319,083 14,754 1,000,727 udd86(4) -,254,136 3,473 1,062,776 socgrp86 25,399 4,000 socgrp86(1) -,814,207 15,499 1,000,443 socgrp86(2) -,550,150 13,455 1,000,577 socgrp86(3) -,400,102 15,327 1,000,670 socgrp86(4) -,242,088 7,520 1,006,785 Constant -1,210,146 68,601 1,000,298 Igen ses en signifikant effekt af socialklasse. 22
24 Egen eller familiesocialklasse? Hvis vi vil afgøre hvilken type af socialklasse der er vigtigst kan vi prøve at inkludere begge variable som kovariater samtidigt. 23
25 Output: begge socialklasse variable B S.E. Wald df Sig. Exp(B) sex(1),157,070 5,035 1,025 1,170 alder86,030, ,664 1,000 1,031 udd86 15,417 4,004 udd86(1) -,286,177 2,611 1,106,751 udd86(2) -,353,142 6,194 1,013,703 udd86(3) -,311,084 13,764 1,000,733 udd86(4) -,248,137 3,281 1,070,780 socgrp86 1,547 4,818 socgrp86(1) -,224,283,628 1,428,799 socgrp86(2),058,220,069 1,793 1,059 socgrp86(3),068,154,196 1,658 1,070 socgrp86(4),047,120,155 1,694 1,048 famsoc86 21,218 4,000 famsoc86(1) -,729,224 10,626 1,001,482 famsoc86(2) -,758,193 15,484 1,000,469 famsoc86(3) -,598,150 15,840 1,000,550 famsoc86(4) -,364,131 7,676 1,006,695 Constant -1,002,156 41,243 1,000,367 Familiesocialklasse er vigtigst. Efter korrektion for familiesocialklasse er effekten af egen socialklasse klart insignifikant. Men efter korrektion for egen socialklasse er familiesocialklasse stadig signifikant. 24
26 Fortolkning af resultatet Familiesocialklasse har betydning for risiko for kronisk sygdom - ikke egen socialklasse Sammenlignes personer med samme egen socialklasse, men forskellig familiesocialklasse, så vil personen med den bedste familiesocialklasse have mindst sygdomsrisiko. Sammenlignes personer med samme familiesocialklasse men forskellig egen socialklasse, så vil der ikke være signifikant forskel på sygdomsrisikoen. 25
27 Er alderseffekten lineær? Testes ved at inddrage et 2. og 3. grads led i alder. Disse variable genereres og indsættes som ekstra kovariater. Herved opnås en mere fleksibel beskrivelse af alderseffekten (3. grads polynomium): logit(p) = α + Σ i β soci soci + β sex1 sex1 + Σ i β uddi uddi + β al alder +β al2 alder 2 + β al3 alder 3 Hvis β al2 = β al3 = 0 er alderseffekten lineær. 26
28 Output: 1., 2. og 3. grad Variables in the Equation B S.E. Wald df Sig. Exp(B) sex(1),135,065 4,229 1,040 1,144 alder86,189,119 2,520 1,112 1,208 udd86 17,881 4,001 udd86(1) -,346,150 5,340 1,021,708 udd86(2) -,339,136 6,193 1,013,713 udd86(3) -,311,080 15,320 1,000,732 Step 1 a udd86(4) -,263,134 3,873 1,049,768 famsoc86 47,222 4,000 famsoc86(1) -,849,159 28,659 1,000,428 famsoc86(2) -,710,129 30,412 1,000,492 famsoc86(3) -,549,099 30,651 1,000,578 famsoc86(4) -,338,098 11,830 1,001,713 alder2 -,003,002 2,076 1,150,997 alder3,000,000 2,351 1,125 1,000 Constant -3,371 1,967 2,937 1,087,034 a. Variable(s) entered on step 1: sex, alder86, udd86, famsoc86, alder2, alder3. 3. gradsled er insignifikant og fjernes derfor 27
29 Output: 1. og 2. grad Variables in the Equation B S.E. Wald df Sig. Exp(B) sex(1),135,065 4,273 1,039 1,145 alder86,009,020,203 1,652 1,009 udd86 17,182 4,002 udd86(1) -,340,150 5,181 1,023,711 udd86(2) -,333,136 5,994 1,014,717 udd86(3) -,304,079 14,628 1,000,738 Step 1 a udd86(4) -,261,134 3,794 1,051,771 famsoc86 46,528 4,000 famsoc86(1) -,841,158 28,200 1,000,431 famsoc86(2) -,705,129 29,993 1,000,494 famsoc86(3) -,545,099 30,295 1,000,580 famsoc86(4) -,338,098 11,822 1,001,713 alder2,000,000 1,218 1,270 1,000 Constant -,452,498,825 1,364,636 a. Variable(s) entered on step 1: sex, alder86, udd86, famsoc86, alder2. også 2. gradsleddet er insignifikant. Dvs en linie giver en tilstrækkelig beskrivelse af alderseffekten 28
30 Hvad betyder α? logit(p) = α + Σ i β soci soci + β sex1 sex1 + Σ i β uddi uddi + β al alder Det er logit-værdien for personer med værdien 0 på alle kovariater. Her familiesocialklasse V, kvinde, 0 år gammel, ingen uddannelse. logit(p) = log[p/(1 p)] = p = exp( 0.976)/[1+exp( 0.976)] = 0.27 Men vi har ikke data for 0-årige, så resultatet er en ekstrapolation. Åndsvage α-værdier angives for ofte. Bør droppes i artikeltabeller - eller også kan nulpunktet ændres. Dette gøres ved at lave en ny aldersvariabel der er 0 f.eks for 50-årige nyalder = alder 50 29
31 Output med nyalder B S.E. Wald df Sig. Exp(B) sex(1),134,065 4,222 1,040 1,144 udd86 17,020 4,002 udd86(1) -,336,150 5,037 1,025,715 udd86(2) -,328,136 5,812 1,016,721 udd86(3) -,303,079 14,608 1,000,738 udd86(4) -,258,134 3,725 1,054,772 Step 1 a famsoc86 47,624 4,000 famsoc86(1) -,851,158 28,990 1,000,427 famsoc86(2) -,712,129 30,656 1,000,491 famsoc86(3) -,549,099 30,796 1,000,577 famsoc86(4) -,341,098 12,004 1,001,711 nyalder,030, ,523 1,000 1,031 Constant,542,082 44,194 1,000 1,720 logit(p) = log[p/(1 p)] = p = exp(0.542)/[1+exp(0.542)] =
32 Modelsøgning: Vekselvirkninger? Nu tilføjes vekselvirkningsled. Hvilke? Socialklasse med hver af de tilbageværende confoundere, dvs familiesocailklasse køn, familiesocailklasse alder, familiesocailklasse uddannelse Baglænsselektion: 1. familiesocailklasse uddannelse (p = 0.35) 2. familiesocailklasse alder (p = 0.12) Dvs vi ender med en model med signifikant interaktion mellem køn og familiesocialklasse. 31
33 Output: vekselvirkning mellem køn og socialklasse B S.E. Wald df Sig. Exp(B) sex(1) -,272,149 3,299 1,069,762 udd86 17,894 4,001 udd86(1) -,349,153 5,239 1,022,705 udd86(2) -,319,136 5,489 1,019,727 udd86(3) -,316,080 15,691 1,000,729 udd86(4) -,255,134 3,597 1,058,775 famsoc86 48,195 4,000 famsoc86(1) -1,002,203 24,278 1,000,367 famsoc86(2) -1,039,177 34,535 1,000,354 famsoc86(3) -,809,139 33,905 1,000,445 famsoc86(4) -,582,136 18,225 1,000,559 nyalder,030, ,027 1,000 1,031 famsoc86 sex 10,539 4,032 famsoc86(1) by sex(1),302,271 1,239 1,266 1,353 famsoc86(2) by sex(1),628,229 7,546 1,006 1,874 famsoc86(3) by sex(1),513,190 7,319 1,007 1,670 famsoc86(4) by sex(1),480,187 6,572 1,010 1,616 Constant,754,109 47,426 1,000 2,125 Vekselvirkningen er signifikant - men hvordan skal den forståes? 32
34 Vekselvirkning mellem køn og socialklasse (forklaring af Tabel 8 i studenterbesvarelse) logit(p) = α + Σ i β uddi uddi + β al nyalder + Σ i β soci soci + β sex1 sex1 +β soc1,sex1 soc1 sex1 + β soc2,sex1 soc2 sex1 +β soc3,sex1 soc3 sex1 + β soc4,sex1 soc4 sex1 Sidste 4 led beskriver vekselvirkningen. logit beregnes for forskellige persontyper: 1. udd=v,alder=50, soc=v: sex=kvinde: logit= α 2. udd=v,alder=50, soc=v sex=mand: logit= α + β sex1 logit-forskel= β sex1 (2-1) 3. udd=v,alder=50, soc=iv sex=mand: logit= α + β sex1 + β soc4 + β soc4,sex1 logit-forskel=β sex1 + β soc4 + β soc4,sex1 (3-1) 33
35 Beskrivelse af vekselvirkningen logit-forskel for sygdom i forhold til kvinder med laveste socialklasse β SEX(1) SOC(1) SOC(2) SOC(3) SOC(4) SOC(1)bySEX(1) SOC(2)bySEX(1) SOC(3)bySEX(1) SOC(4)bySEX(1) SEX V IV III II I
36 Vekselvirkningen - effekt af socialklasse logit-forskel for sygdom i forhold til kvinder med laveste socialklasse V IV III II I kvinde mand Effekt af socialklasse for hvert køn V IV III II I kvinde (mand) mand
37 OR for familiesocialklasse OR 95%-CI p Kvinder soc V soc IV ; < soc III ; < soc II ; < soc I ; < Mænd soc V soc IV ; soc III ; soc II ; soc I ; Socialklasse-effekten er stærkere for kvinder 36
38 SPSS: Hvordan findes 95%-CI og p? Ret let. SPSS angiver jo socialklasse-effekten for reference-værdien af køn (kvinder). Effekt for mænd findes ved at vælge denne gruppe som referencen. 37
39 Vekselvirkning - effekt af køn V IV III II I kvinde mand Effekt af køn for hver socialklasse V IV III II I kvinde (mand) mand
40 OR for køn Socialklasse 5 OR 95%-CI p kvinde mand ; Socialklasse 4 kvinde mand ; Socialklasse 3 kvinde mand ; Socialklasse 2 kvinde mand ; Socialklasse 1 kvinde mand ; For nogle socialklasse-niveauer er mænd bedre end kvinder for andre gælder det modsatte. 39
41 SPSS: Hvordan findes 95%-CI og p? Ret let - men lidt besværligt. SPSS angiver jo køns-effekten for reference-værdien af socialklasse (5). Effekt af køn for f.eks socialklasse 4 findes ved at vælge denne gruppe som referencen. Dette kræver omkodning. Lav ny socialklassevariabel (famsoc4) der er identisk med den gamle, bortset fra at når den gamle variabel er 4 er den nye 10. Analysen køres med den nye socialklassevariabel (famsoc4) hvorved gruppe 4 automatisk bliver referencen. 40
42 Vekselvirkning Når køn indgår i en vekselvirkning giver det ikke mening at tale om en kønseffekt. Effekten af køn afhænger af socialklasse. Tilsvarende kan man ikke tale om en effekt af socialklasse. Effekten afhænger af køn. 41
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Mantel-Haenszel analyser
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Mantel-Haenszel analyser Mantel-Haenszel analyser Sidst lærte vi om stratificerede analyser. I dag kigger vi på et specialtilfælde: både exposure
Læs mereStatistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Stratificerede analyser
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Stratificerede analyser Dødsstraf-eksempel Betyder morderens farve noget for risikoen for dødsstraf? 1 Dødsstraf-eksempel: data Variable: Dødsstraf
Læs mereLineær og logistisk regression
Faculty of Health Sciences Lineær og logistisk regression Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Dagens program Lineær regression
Læs mereLogistisk regression. Statistik Kandidatuddannelsen i Folkesundhedsvidenskab
Logistis regression Statisti Kandidatuddannelsen i Folesundhedsvidensab Multipel logistis regression Antagelser: Binære observationer (Y i, i=,.,n) f.es Ja/Nej Høj/Lav Død/Levende Kodet: / 0 Y i uafhængige
Læs mereMorten Frydenberg 26. april 2004
Introduktion til Logistisk Regression Morten Frydenberg, Inst. f. Biostatistik RESUME: 2 2. gang: 2002 Institut for Biostatistik, Århus Universitet MPH. studieår Specialmodul 4 Cand. San. uddannelsen.
Læs mereMantel-Haenszel analyser. Stratificerede epidemiologiske analyser
Mantel-Haensel analyser Stratificerede epidemiologiske analyser 1 Den epidemiologiske synsvinkel: 1) Oftest asymmetriske (kausale) sammenhænge (Eksposition Sygdom/død) 2) Risikoen vurderes bedst ved hjælp
Læs mereEksamen i statistik 2010 Kandidatuddannelsen i folkesundhedsvidenskab
D E T S U N D H E D S V I D E N S K A B E L I G E F A K U L T E T K Ø B E N H A V N S U N I V E R S I T E T Eksamen i statistik 2010 Kandidatuddannelsen i folkesundhedsvidenskab Eksamensnummer: 16, 23
Læs mere25. april Probability of Developing Coronary Heart Disease in 6 years. Women (Aged 35-70) 160 No Yes
25. april 2. gang: Introduktion til Logistisk Regression Morten Frydenberg 22 Institut for Biostatistik, Århus Universitet MPH. studieår specialmodul Cand. San. uddannelsen. studieår Hvorfor logistisk
Læs mereLogistisk regression
Logistisk regression Test af antagelsen om lineære effekter Modelkonstruktion og modelsøgning Hvilke variable og hvilke interaktioner skal inkluderes i regressionsmodellerne? 1 Logistiske regressionsmodeller
Læs mereRegressionsanalyser. Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer.
Regressionsanalyser Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer. Hvilke faglige problemer kan man løse vha. regressionsanalyser? 1 Regressionsanalyser Det primære problem
Læs mereMorten Frydenberg 14. marts 2006
Introduktion til Logistisk Regression Morten Frydenberg, Inst. f. Biostatistik 1 RESUME: 2 2. gang: 2006 Institut for Biostatistik, Århus Universitet MPH 1. studieår Specialmodul 4 Cand. San. uddannelsen
Læs mereAnalyse af binære responsvariable
Analyse af binære responsvariable Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet 23. november 2012 Har mænd lettere ved at komme ind på Berkeley? UC Berkeley
Læs mereMultipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression
Multipel Linear Regression Repetition Partiel F-test Modelsøgning Logistisk Regression Test for en eller alle parametre I jagten på en god statistisk model har vi set på følgende to hypoteser og tilhørende
Læs mereOverlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere.
Overlevelse efter AMI Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Diabetes VF (Venticular fibrillation) WMI (Wall motion index) CHF (Cardiac Heart Failure) Køn og alder betragtes
Læs mereEksamen Efterår 2013
Eksamen Efterår 2013 Opgave En måde at sammenlægge svarene fra de fem EQ-5D items er igennem et indeks, der angiver værdien samfundet giver en bestemt svarkombination. EURV = 1-0.081*(D=1) 0.069*(MOVE=2)
Læs mereAnvendt Statistik Lektion 9. Variansanalyse (ANOVA)
Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:
Læs mereAnvendt Statistik Lektion 9. Variansanalyse (ANOVA)
Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:
Læs mereTræningsaktiviteter dag 3
Træningsaktiviteter dag 3 I træningsaktiviteterne skal I arbejde videre med Framingham data og risikoen for hjertesygdom. I skal dels lave MH-analyser som vi gjorde i timerne og dels lave en multipel logistisk
Læs mereKommentarer til spørgsmålene til artikel 1: Ethnic differences in mortality from sudden death syndrome in New Zealand, Mitchell et al., BMJ 1993.
Kommentarer til spørgsmålene til artikel 1: Ethnic differences in mortality from sudden death syndrome in New Zealand, Mitchell et al., BMJ 1993. 1. Det anføres, at OR for maorier vs. ikke-maorier er 3.81.
Læs mereLogistisk Regression. Repetition Fortolkning af odds Test i logistisk regression
Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression: Definitioner For en binær (0/) variabel Y antager vi P(Y)p P(Y0)-p Eksempel: Bil til arbejde vs alder
Læs mere12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse
. september 5 Epidemiologi og biostatistik. Forelæsning Uge, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression
Læs mereStatistik II 1. Lektion. Analyse af kontingenstabeller
Statistik II 1. Lektion Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller Logistisk regression
Læs mereStatistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable
Statistik II Lektion 3 Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Setup: To binære variable X og Y. Statistisk model: Konsekvens: Logistisk regression: 2 binære var. e e X Y P
Læs mereEksamen i Statistik og skalavalidering
Eksamen i Statistik og skalavalidering 2009-studieordning Til aflevering d. 22. december 2010 Efterårssemestret 2010, Kandidatuddannelsen i Folkesundhedsvidenskab Opgaven er udarbejdet af: Eksamensnummer
Læs mereStatikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression
Statikstik II 2. Lektion Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Sandsynlighedsregningsrepetition Antag at Svar kan være Ja og Nej. Sandsynligheden for at Svar Ja skrives
Læs mereMultipel Lineær Regression
Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer
Læs mereFaculty of Health Sciences. Logistisk regression: Kvantitative forklarende variable
Faculty of Health Sciences Logistisk regression: Kvantitative forklarende variable Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Sammenhæng
Læs mereEpidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk
Eksempel: Systolisk blodtryk Udgangspunkt: Vi ønsker at prædiktere det systoliske blodtryk hos en gruppe af personer. Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Afdeling for Biostatistik.
Læs mereSynopsis til eksamen i Statistik
Synopsis til eksamen i Statistik Kandidatuddannelsen i Folkesundhedsvidenskab Københavns Universitet december 2010 Eksamensnummer: 12 Antal anslag: 23.839 (svarende til 9,9 normalsider) - 1 - Indholdsfortegnelse
Læs mereEpidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse
Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Institut for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression Regressionsanalyse Regressionsanalyser
Læs mereLogistisk Regression - fortsat
Logistisk Regression - fortsat Likelihood Ratio test Generel hypotese test Modelanalyse Indtil nu har vi set på to slags modeller: 1) Generelle Lineære Modeller Kvantitav afhængig variabel. Kvantitative
Læs mereStatistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge
Statistik og Sandsynlighedsregning 2 IH kapitel 12 Overheads til forelæsninger, mandag 6. uge 1 Fordelingen af én (1): Regressionsanalyse udfaldsvariabel responsvariabel afhængig variabel Y variabel 2
Læs mereLogistisk Regression. Repetition Fortolkning af odds Test i logistisk regression
Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logisitks Regression: Repetition Y {0,} binær afhængig variabel X skala forklarende variabel π P( Y X x) Odds(Y X x) π /(-π
Læs mereStatistik og skalavalidering. Opgave 1
Statistik og skalavalidering Opgave 1 Opgavens formål: Denne opgave har, ligesom det vil være tilfældet for de fleste andre øvelsesopgaver på dette kursus, flere forskellige formål. For det første et praktisk/teknisk
Læs mereUge 13 referat hold 4
Uge 13 referat hold 4 Gruppearbejde 1a: Er variablen kvotient inkluderet på en hensigtsmæssig måde? Der er to problemer med kvotient: 1) Den er trunkeret ved 6.9 og 10.0, løsningen er at indføre dummyer
Læs mereStatistik II 4. Lektion. Logistisk regression
Statistik II 4. Lektion Logistisk regression Logistisk regression: Motivation Generelt setup: Dikotom(binær) afhængig variabel Kontinuerte og kategoriske forklarende variable (som i lineær reg.) Eksempel:
Læs mereReeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl
Reeksamen 2018 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 13-08-2018 Tid: kl. 09.00-11.00 Bedømmelsesform
Læs mere1 Multipel lineær regression
1 Multipel lineær regression Regression med 2 eksponeringsvariable Fortolkning og estimation AnovaTabel og multipel R 2 Ensidet variansanalyse: Dummy kodning Kovariansanalyse og effektmodifikation Tosidet
Læs mereStatistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Uafhængighedstestet
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Uafhængighedstestet Eksempel: Bissau data Data kommer fra Guinea-Bissau i Vestafrika: 5273 børn blev undersøgt da de var yngre end 7 mdr og blev
Læs mereLogistisk regression
Logistisk regression http://biostat.ku.dk/ kach/css2 Thomas A Gerds & Karl B Christensen 1 / 18 Logistisk regression I dag 1 Binær outcome variable død : i live syg : rask gravid : ikke gravid etc 1 prædiktor
Læs mere1 Multipel lineær regression
Indhold 1 Multipel lineær regression 2 1.1 Regression med 2 eksponeringsvariable......................... 2 1.2 Fortolkning og estimation................................ 3 1.3 AnovaTabel og multipel R
Læs mereStatistik Lektion 4. Variansanalyse Modelkontrol
Statistik Lektion 4 Variansanalyse Modelkontrol Eksempel Spørgsmål: Er der sammenhæng mellem udetemperaturen og forbruget af gas? Y : Forbrug af gas (gas) X : Udetemperatur (temp) Scatterplot SPSS: Estimerede
Læs mereIndvandrere og efterkommere i foreninger er frivillige i samme grad som danskere
Indvandrere og efterkommere i foreninger er frivillige i samme grad som danskere Bilag I afrapportering af signifikanstest i tabeller i artikel er der benyttet følgende illustration af signifikans: * p
Læs mereØkonometri 1. Kvalitative variabler. Kvalitative variabler. Dagens program. Kvalitative variable 8. marts 2006
Dagens program Økonometri 1 Kvalitative variable 8. marts 2006 Kvalitative variabler som forklarende variabler i en lineær regressionsmodel (Wooldridge kap. 7.1-7.4) Kvalitative variabler generelt Dummy
Læs mereMorten Frydenberg 25. april 2006
. gang: Introduktion til Logistisk Regression Morten Frydenberg 26 Afdeling for Biostatistik, Århus Universitet MPH. studieår specialmodul 4 Cand. San. uddannelsen. studieår Hvorfor logistisk regression
Læs mereEpidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april
Århus 8. april 2011 Morten Frydenberg Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april Opgave 1 ( gruppe 1: sp 1-4, gruppe 5: sp 5-9 og gruppe 6: 10-14) I denne opgaveser vi på et
Læs mereSYNOPSIS TIL EKSAMEN I STATISTIK OG SKALAVALIDERING
SYNOPSIS TIL EKSAMEN I STATISTIK OG SKALAVALIDERING Kandidatuddanelsen i Folkesundhedsvidenskab Københavns Universitet, 2010 EKSAMENSNUMMER: 7 & 40 Antal anslag: 23.576 December 2010 INDHOLDSFORTEGNELSE
Læs mereAnvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]
Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af
Læs mereKvantitative metoder 2
Kvalitative egenskaber og dummyvariabler Kvantitative metoder 2 Dummyvariabler 28. marts 2007 Vi har (hovedsagligt) set på kvantitative variabler (løn, priser, forbrug, indkomst, )... Men hvad med kvalitative
Læs mereLøsning til opgave i logistisk regression
Løsning til øvelser i logistisk regression, november 2008 1 Løsning til opgave i logistisk regression 1. Først indlæses data, og vi kan lige sørge for at danne en dummy-variable for cml, som indikator
Læs mereGenerelle lineære modeller
Generelle lineære modeller Regressionsmodeller med én uafhængig intervalskala variabel: Y en eller flere uafhængige variable: X 1,..,X k Den betingede fordeling af Y givet X 1,..,X k antages at være normal
Læs mereAnvendt Statistik Lektion 8. Multipel Lineær Regression
Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke
Læs mereEn teoretisk årsagsmodel: Operationalisering: Vurdering af epidemiologiske undersøgelser. 1. Informationsproblemer Darts et eksempel på målefejl
Vurdering af epidemiologiske undersøgelser Jørn Attermann. februar 00 I denne forelæsning vil vi se på fejl, som kan have betydning for fortolkningen af resultater fra epidemiologiske undersøgelser. Traditionelt
Læs mereStatistik II 1. Lektion. Sandsynlighedsregning Analyse af kontingenstabeller
Statistik II 1. Lektion Sandsynlighedsregning Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller
Læs mere9. Chi-i-anden test, case-control data, logistisk regression.
Biostatistik - Cand.Scient.San. 2. semester Karl Bang Christensen Biostatististisk afdeling, KU kach@biostat.ku.dk, 35327491 9. Chi-i-anden test, case-control data, logistisk regression. http://biostat.ku.dk/~kach/css2014/
Læs mereSynopsis til kursus i Statistik og skalavalidering på Folkesundhedsvidenskab
Synopsis til kursus i Statistik og skalavalidering på Folkesundhedsvidenskab Eksamensnr. 26, 41 og 11 Anslag (uden tabeller og figurer): 23.933 1 1. Indledning...3 2. Deskriptiv statistik...3 3. Indledende
Læs mereVi vil analysere effekten af rygning og alkohol på chancen for at blive gravid ved at benytte forskellige Cox regressions modeller.
Løsning til øvelse i TTP dag 3 Denne øvelse omhandler tid til graviditet. Et studie vedrørende tid til graviditet (Time To Pregnancy = TTP) inkluderede 423 par i alderen 20-35 år. Parrene blev fulgt i
Læs mereStatistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004
Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004 Formål med Øvelsen: Formålet med øvelsen er at analysere om risikoen for død er forbundet med to forskellige vacciner BCG (mod
Læs mereSammenhængen mellem elevernes trivsel og elevernes nationale testresultater.
Sammenhængen mellem elevernes trivsel og elevernes nationale testresultater. 1 Sammenfatning Der er en statistisk signifikant positiv sammenhæng mellem opnåelse af et godt testresultat og elevernes oplevede
Læs mereBasal statistik. 21. oktober 2008
Basal statistik 21. oktober 2008 Den generelle lineære model Repetition af variansanalyse og multipel regression Interaktion Parametriseringer Kovariansanalyse Esben Budtz-Jørgensen, Biostatistisk Afdeling
Læs mereBasal Statistik Logistisk Regression. Dagens Tekst E Sædvanlig Linear Regression (Repetition) Basal Statistik - Logistisk regression 1
Basal Statistik Logistisk Regression Judith L. Jacobsen, PhD. Lene Theil Skovgaard http://staff.pubhealth.ku.dk/~lts/basal13_ jlj@statcon.dk Dagens Tekst Logistisk regression Binære data Logit transformation
Læs mereBasal statistik. 30. oktober 2007
Basal statistik 30. oktober 2007 Den generelle lineære model Repetition af variansanalyse og multipel regression Interaktion Kovariansanalyse Parametriseringer Lene Theil Skovgaard, Biostatistisk Afdeling
Læs mereBasal statistik. 30. oktober Den generelle lineære model
Basal statistik 30. oktober 2007 Den generelle lineære model Repetition af variansanalyse og multipel regression Interaktion Kovariansanalyse Parametriseringer Lene Theil Skovgaard, Biostatistisk Afdeling
Læs mereSammenhængsanalyser. Et eksempel: Sammenhæng mellem rygevaner som 45-årig og selvvurderet helbred som 51 blandt mænd fra Københavns amt.
Sammenhængsanalyser Et eksempel: Sammenhæng mellem rygevaner som 45-årig og selvvurderet helbred som 51 blandt mænd fra Københavns amt. rygevaner som 45 årig * helbred som 51 årig Crosstabulation rygevaner
Læs mereBenchmarking af kommunernes sagsbehandling antagelser, metode og resultater
Benchmarking af kommunernes sagsbehandling antagelser, metode og resultater Anna Amilon Materiel vurdering Ved vurderingen af en afgørelses materielle indhold vurderes afgørelsens korrekthed i forhold
Læs mereStatistik og skalavalidering Synopsis. Eksamensnumre 15, 33 og 45
Statistik og skalavalidering Synopsis Københavns Universitet Folkesundhedsvidenskab, 7. semester Typografiske enheder: 22.615 December 2010 Indholdsfortegnelse 1.0 Indledning... 3 1.1 Karakteristika af
Læs mereOpgavebesvarelse, logistisk regression
Opgavebesvarelse, logistisk regression Data ligger i rop.xls på kursushjemmesiden: http://staff.pubhealth.ku.dk/ jufo/courses/logistic/ Når du har gemt data på din computer, kan det indlæses i SAS med
Læs mereStatistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Mål for sammenhæng mellem to variable
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Mål for sammenhæng mellem to variable Estimation Stikprøve Data Population Teori relativ hyppighed parameter estimat sandsynlighed parameter
Læs mereStatistik Lektion 16 Multipel Lineær Regression
Statistik Lektion 6 Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk
Læs mereMultipel regression. Data fra opgave 3 side 453: Multipel regressionsmodel: Y = α + β 1 x 1 + β 2 x 2 + ǫ. hvor ǫ N(0, σ 2 ).
Program 1. multipel regression 2. polynomiel regression (og andre kurver) 3. kategoriske variable 4. Determinationkoefficient og justeret determinationskoefficient 5. ANOVA-tabel 1/13 Multipel regression
Læs mereØkonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol
Økonometri: Lektion 5 Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol 1 / 35 Veksekvirkning: Motivation Vi har set på modeller som Price
Læs mereStatistik & Skalavalidering
å Statistik & Skalavalidering Synopsis til mundtlig eksamen d. 24. januar 2011 K ø b e n h a v n s U n i v e r s i t e t K a n d i d a t u d d a n n e l s e n i F o l k e s u n d h e d s v i d e n s k
Læs mereHver anden vil benytte øget åbningstid i dagtilbud
Børnefamiliers dagtilbud og arbejdsliv 17. maj 18 Hver anden vil benytte øget åbningstid i dagtilbud Halvdelen af alle lønmodtagere med børn mellem -13 år ville benytte sig af udvidede åbningstider i deres
Læs mereEksamen Bacheloruddannelsen i Medicin med industriel specialisering
Eksamen 2016 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 17-02-2015 Tid: kl. 09.00-11.00 Bedømmelsesform
Læs mereKrydstabeller Forventede under nulhypotesen Ki-kvadrat test Residualanalyse Eksakt test
1 Kontingenstabeller Krydstabeller Forventede under nulhypotesen Ki-kvadrat test Residualanalyse Eksakt test 2 Logaritme- og eksponentialfunktion 3 Logistisk regression Sammenligning af odds for 2 grupper
Læs mereMorten Frydenberg Biostatistik version dato:
Caerphilly studiet Design og Data Biostatistik uge 14 mandag Morten Frydenberg, Afdeling for Biostatistik Poisson regression En primær tidsakse og ikke stykkevise konstante rater Cox proportional hazard
Læs mereLogistisk regression. Basal Statistik for medicinske PhD-studerende November 2008
Logistisk regression Basal Statistik for medicinske PhD-studerende November 2008 Bendix Carstensen Steno Diabetes Center, Gentofte & Biostatististisk afdeling, Københavns Universitet bxc@steno.dk www.biostat.ku.dk/~bxc
Læs mereTest og sammenligning af udvalgte regressionsmodeller Berit Christina Olsen forår 2008
Indholdsfortegnelse 1 INDLEDNING OG PROBLEMSTILLING... 2 1.1 OVERVÆGT SOM CASE... 2 2 ANALYSEFORBEREDELSER... 4 2.1 HEPRO-UNDERSØGELSEN... 4 2.2 DEN AFHÆNGIGE VARIABEL VIGTIGHED AF ÆNDRINGEN AF VÆGT...
Læs mereØVELSER Statistik, Logistikøkonom Lektion 8 og 9: Simpel og multipel lineær regression
! ØVELSER Statistik, Logistikøkonom Lektion 8 og 9: Simpel og multipel lineær regression Eksempel 1 AT OPSTILLE EN SIMPEL LINEÆR REGRESSIONSMODEL - GENNEMGÅS AF JAKOB Et stort lager måler løbende sine
Læs mere2 Logaritme- og eksponentialfunktion 6
Indhold 1 Kontingenstabeller 2 1.1 Krydstabeller....................................... 2 1.2 Forventede under nulhypotesen............................. 4 1.3 Ki-kvadrat test......................................
Læs mereMPH specialmodul i biostatistik og epidemiologi SAS-øvelser vedr. case-control studie af malignt melanom.
MPH specialmodul i biostatistik og epidemiologi SAS-øvelser vedr. case-control studie af malignt melanom. For at I skal kunne regne på tallene fra undersøgelsen har vi taget en delmængde af variablene
Læs mereLog-lineære modeller. Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres.
Log-lineære modeller Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres. Kontingenstabel Contingency: mulighed/tilfælde Kontingenstabel: antal observationer (frekvenser)
Læs mereOplæg til den første skalavalideringsøvelse. Eksamens opgaven i 2004
Oplæg til den første skalavalideringsøvelse Eksamens opgaven i 2004 validering af skala til måling af tilfredshed med fysiske forhold i danske folkeskoler Items: a) Om lokalerne var uhensigtsmæssigt indrettede
Læs mere8.2 Statistiske analyse af hver enkelt indikator
8.2 Statistiske analyse af hver enkelt indikator Basale ideer De avancerede statistiske metoder, som anvendes i denne rapport, fokuserer primært på vurdering af eventuel geografisk heterogenitet på regions-,
Læs mereStatistiske Modeller 1: Kontingenstabeller i SAS
Statistiske Modeller 1: Kontingenstabeller i SAS Jens Ledet Jensen October 31, 2005 1 Indledning Som vist i Notat 1 afsnit 13 er 2 log Q for et test i en multinomialmodel ækvivalent med et test i en poissonmodel.
Læs mereTandstatus hos søskende
Tandstatus hos søskende Af Bodil Helbech Kleist, BOHH@kl.dk Formålet med dette analysenotat er at undersøge forskelle i tandsundheden mellem søskende, herunder betydningen af hvilket nummer i børneflokken,
Læs mereOpgavebesvarelse, brain weight
Opgavebesvarelse, brain weight (Matthews & Farewell: Using and Understanding Medical Statistics, 2nd. ed.) For 20 musekuld er der i tabellen nedenfor anført oplysning om kuldstørrelsen (fra 3 til 12 mus
Læs mereØVELSER Statistik, Logistikøkonom Lektion 8 og 9: Simpel og multipel lineær regression
! ØVELSER Statistik, Logistikøkonom Lektion 8 og 9: Simpel og multipel lineær regression Eksempel 1 AT OPSTILLE EN SIMPEL LINEÆR REGRESSIONSMODEL - GENNEMGÅS AF JAKOB Et stort lager måler løbende sine
Læs mereUge 43 I Teoretisk Statistik, 21. oktober Forudsigelser
Uge 43 I Teoretisk Statistik,. oktober 3 Simpel lineær regressionsanalyse Forudsigelser Fortolkning af regressionsmodellen Ekstreme observationer Transformationer Sammenligning af to regressionslinier
Læs mereWorkshop 6 Sundhedsprofilen metode og muligheder. Anne Helms Andreasen, Forskningscenter for Forebyggelse og Sundhed
Workshop 6 Sundhedsprofilen metode og muligheder Anne Helms Andreasen, Forskningscenter for Forebyggelse og Sundhed Metode og muligheder Design Beskrivelse af deltagere og ikke-deltagere Vægtning for design
Læs mereØkonometri 1. Dummyvariabler 13. oktober Økonometri 1: F10 1
Økonometri 1 Dummyvariabler 13. oktober 2006 Økonometri 1: F10 1 Dagens program Dummyvariabler i den multiple regressionsmodel (Wooldridge kap. 7.3-7.6) Dummy variabler for kvalitative egenskaber med flere
Læs mereLøsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)
Afdeling for Biostatistik Bo Martin Bibby 23. november 2006 Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Vi betragter 4699 personer fra Framingham-studiet. Der er oplysninger om follow-up
Læs mereModule 12: Mere om variansanalyse
Module 12: Mere om variansanalyse 12.1 Parreded observationer.................. 1 12.2 Faktor med 2 niveauer (0-1 variabel)......... 3 12.3 Tosidig variansanalyse med tilfældig virkning..... 9 12.3.1 Uafhængighedsbetragtninger..........
Læs mereFaculty of Health Sciences. Basal Statistik. Logistisk regression mm. Lene Theil Skovgaard. 5. marts 2018
Faculty of Health Sciences Basal Statistik Logistisk regression mm. Lene Theil Skovgaard 5. marts 2018 1 / 22 APPENDIX vedr. SPSS svarende til diverse slides: To-gange-to tabeller, s. 3 Plot af binære
Læs mereAppendiks A. Entreprenørskabsundervisning i befolkningen, specielt blandt unge
Appendiks A. Entreprenørskabsundervisning i befolkningen, specielt blandt unge Redegørelsen ovenfor er baseret på statistiske analyser, der detaljeres i det følgende, et appendiks for hvert afsnit. Problematikken
Læs mereBesvarelse af juul2 -opgaven
Besvarelse af juul2 -opgaven Spørgsmål 1 Indlæs data Dette gøres fra Analyst med File/Open, som sædvanlig. Spørgsmål 2 Lav regressionsanalyser for hvert køn af igf1 vs. alder for præpubertale (Tanner stadium
Læs mereØkonometri 1. Prediktion. Dummyvariabler 9. oktober Økonometri 1: F9 1
Økonometri 1 Prediktion. Dummyvariabler 9. oktober 2006 Økonometri 1: F9 1 Program frem til efterårsferien Om goodness-of-fit, prediktion og residualer (kap. 6.3-4) Kvalitative egenskaber i den multiple
Læs mereRegneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)
Formelsamlingen 1 Regneregler for middelværdier M(a + bx) a + bm X M(X+Y) M X +M Y Spredning varians og standardafvigelse VAR(X) 1 n n i1 ( X i - M x ) 2 Y a + bx VAR(Y) VAR(a+bX) b²var(x) 2 Kovariansen
Læs mereLøsning til eksamen d.27 Maj 2010
DTU informatic 02402 Introduktion til Statistik Løsning til eksamen d.27 Maj 2010 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th edition]. Opgave I.1
Læs mere8.2 Statistiske analyse af hver enkelt indikator
8.2 Statistiske analyse af hver enkelt indikator Basale ideer De avancerede statistiske metoder, som anvendes i denne rapport, fokuserer primært på vurdering af eventuel geografisk heterogenitet på regions-,
Læs mere