Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom

Save this PDF as:
 WORD  PNG  TXT  JPG

Størrelse: px
Starte visningen fra side:

Download "Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom"

Transkript

1 Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Eksamensopgave E05 Socialklasse og kronisk sygdom

2 Data: Tværsnitsundersøgelse fra 1986 Datamaterialet indeholder: Køn, alder, Højest opnåede uddannelse (i 1986). Egen socialklasse, Familiesocialklasse og Oplysninger om tilstedeværelse af vedvarende (kronisk) sygdom. Socialklassen: mål for social status baseret på oplysninger om uddannelse og arbejde, hvor personer i socialklasse I har størst social status, mens personer i socialklasse V har lavest status. Egen socialstatus er baseret på personens egne oplysninger om uddannelse og arbejde. Familiesocialklassen er defineret som den højeste af personens egen og en eventuel ægtefælles eller samlevers socialklasse. Formål: undersøge om personens egen socialklasse og familiesocialklassen har betydning for forekomsten af kroniske sygdomme. 1

3 Indhold Jeg vil have fokus på de statistiske metoder - ikke så meget præsentation (overordnet set er studenterbesvarelsen et fint eksempel på hvordan resultater af en statistisk analyse præsenteres). 1. Analyse i 2-vejs tabeller 2. Mantel-Haenszel analyser 3. Logistisk regression (a) modelsøgning (b) vekselvirkning Her mest fokus på logistisk regression. 2

4 Deskriptiv statistik Beskriv fordelingen af de variable der indgår i analysen. Studenter besvarelsen er for kort - mangler fordeling af potentielle confoundere: Egen socialgrp. I: 5.1; II: 10.4; III: 19.7; IV: 36.9; V: 28.0 Alder 30-40: 27.0; 40-50: 24.7; 50-60: 17.6; 60-70: 17.5; 70-80: 13.2 Kronisk sygdom nogle: 51.0 Køn kvinde: Fordeling af analysevariable: relativ hyppighed i procent (N=4561). Angiv også for hver variabel antallet af uoplyste. 3

5 Marginale sammenhænge De vigtigste sammenhænge i denne analyse er relationen mellem socialklasse og kronisk sygdom. I II III IV V Egen socialklasse 34% 39% 47% 48% 61% Familiesocialklasse 36% 39% 49% 51% 66% Hypotesen om ingen sammenhæng H 0 : p 1 = p 2 = p 3 = p 4 = p 5 Egen socialklasse χ 2 = 103, df = 4, p < Familiesocialklasse χ 2 = 148, df = 4, p < Her kunne man også have angivet γ Jo dårligere socailklasse jo højere risiko for sygdom 4

6 Confounding? socialklasse confounder sygdom I stratificerede analyser og ved logistisk regression kan vi undersøge om den stærke sammenhæng vi har fundet mellem socialklasse og sygdom er et resultat af confounding 5

7 Sammenhæng mellem de to socialklassevariable Familie Egen I II III IV V Total I II III IV V Total Familiesocialgruppe bør ikke være dårligere end egen socialgruppe, dvs alle personer burde ligge på eller under diagonalen. Det er ikke tilfældet. Vi antager at data er korrekte. Man kunne også have ekskluderet disse få cases. Sådanne problemer opstår i mange data, når de opdages må man henvende sig til den dataansvarlige. χ 2 = 9277, df = 16, p < 0.001, γ = 0.879, p < 0.001, Meget stærk sammenhæng mellem de to socailklasse-variable. 6

8 Mantel-Haenszel analyse Mantel-Haenszel analyser kræver en binær eksponeringsvariabel og passer derfor ikke umiddelbart til disse data. Mantel-Haenszel analysen er en del af pensum, så ved en mundtlig eksamen kan spørgsmål i dette emne forekomme. Her er det en fordel for studenten at have konkrete resultater at tale ud fra. Derfor er det en god ide at skære data lidt til så Mantel-Haenszel analyser kan foretages. For begge socialklassevariable bruges grupperingen: I+II mod III+IV+V Tabel 3 undersøger effekt af potentielle confounders på eksponering og outcome. Mantel-Haenszel resultater i Tabel 4 og 5 i studenterbesvarelse. 7

9 Generel stratificeret analyse Confounder Z kan antage k forskellige værdier Z = 1 Z = z Z = k syg soc Ja Nej lav a 1 b 1... syg soc Ja Nej lav a z b z... syg soc Ja Nej lav a k b k høj c 1 d 1 høj c z d z høj c k d k ÔR 1 ÔR z ÔR k 8

10 Socialklasse-Sygdom: stratifikation efter alder (fra 3. søjle i Tabel 4) OR Hypotesen om ingen effektmodifikation H 0 : OR 1 = OR 2 =... = OR 5 Hypotesen testes ved Breslow-Day testet: χ 2 = 2.1, df = 4, p = 0.72 Alder modificerer ikke effekt af socialklasse på risiko for sygdom Mantel Haenzel OR estimat: % CI (1.37; 1.95) Alder kan ikke forklare effekten af socialklasse på sygdom 9

11 Hvorfor indgår køn ikke i Tabel 4 og 5? I Tabel 3 ses at køn ikke påvirker risiko for sygdom. Hermed opfylder køn ikke kravene til en confounder. Men det udelukker ikke at køn kunne være en effektmodifikator: vigtigheden af socialklasse for helbred kunne afhænge af køn. Det ville have været mere korrekt at have ladet køn indgå i Mantel-Haenzel analysen 10

12 Mantel-Haenszel og confounding s. 6 midten: formålet er at afgøre om alder, uddannelse, egen og familiesocialklasse er rent faktisk er konfoundere Nej, formålet er at estimere effekten af exposure på outcome korrigeret for mulige konfoundere. s. 7 midten: Afsnit ender med at konkludere: Alder er en konfounder. Lidt underlig konklusion. Jeg vil hellere sige at analysen har vist at det er vigtigt at korrigere for alder - ret stor forskel på marginal OR (1.83) og korrigeret OR (1.64). 11

13 Logistisk regressionsanalyse (og notation) Her bruger vi de oprindelige socialklassevariable som kategoriske kovariater: logit(p) = α + β soc Bogen og studenterbesvarelsen skriver modellen op med dummy-variable: logit(p) = α+β soc1 soc1+β soc2 soc2+β soc3 soc3+β soc4 soc4 = α+σ i β soci soci soc1, soc2, soc3, soc4 er dummy variable, der udpeger grupperne I til IV, V er reference gruppen. Dvs soc1=1 for personer i gruppe I og 0 ellers. Se også s i bogen. β soci er logit forskellen mellem gruppe i og V (referencegruppe). OR i = exp(β soci ) 12

14 Hvorfor? Model logit(p) = α + β soc1 soc1 + β soc2 soc2 + β soc3 soc3 + β soc4 soc4 logit i gruppe I: logit(p) = α + β soc1 1 + β soc2 0 + β soc3 0 + β soc4 0 = α + β soc1 logit i gruppe V: logit(p) = α + β soc1 0 + β soc2 0 + β soc3 0 + β soc4 0 = α logit-forskel = α + β soc1 α = β soc1 OR 1vs5 = exp(β soc1 ) 13

15 Resultat: familiesocialklasse Variables in the Equation B S.E. Wald df Sig. Exp(B) famsoc86 143,576 4,000 famsoc86(1) -1,248,130 91,987 1,000,287 Step 1 a famsoc86(2) -1,111, ,650 1,000,329 famsoc86(3) -,706,092 59,016 1,000,494 famsoc86(4) -,605,091 44,658 1,000,546 Constant,658,072 82,416 1,000 1,931 a. Variable(s) entered on step 1: famsoc86. Sammenlignes gruppe I med V (referencegruppen) fåes en OR på [exp( 1.248)], dvs. i gruppe I udgør odds for sygdom kun 29% af odds i gruppe V. Det samlede test for ingen effekt af socialgruppen aflæses i 1. række: p < H 0 : β soc1 = β soc2 = β soc3 = β soc4 = 0 Effekten af familiesocialgruppe er stærkt signifikant. 14

16 Multipel logistisk regressionsanalyse En vigtig fordel ved logistisk regressions analyse er at det er let at lave confounderkorrektion. En potentiel confounder medtages som endnu en kovariat. Aldersjustering: logit(p) = α + Σ i β soci soci + β al alder Nu estimeres odds-ratio værdier mellem personer fra forskellige socialgrupper, men med samme alder. 15

17 Modelsøgning - Hvilke variable skal med i modellen? Socialklasse skal med - det er jo den vi vil finde effekten af (primær del) Hvilke confounder variable? og hvad med vekselvirkninger? Baglæns selektion: Start med stor model og fjern insignifikante variable. Denne metode benyttes i studenterbesvarelsen se Tabel 6. Startmodel: egen socialklassse, familiesocialklasse, køn, alder, uddannelse, samt vekselvirkninger: egen socialklasse familiesocialklasse, egen socialklasse køn, egen socailklasse alder, egen socailklasse uddannelse, familiesocialklasse køn, familiesocailklasse alder, familiesocialklasse uddannelse. 16

18 Baglæns selektion - studenterbesvarelse Trin 1: vekselvirkningen egen socialklasse familie socialklasse fjernes fordi variablen er insignifikant og har den højeste p-værdi (p = 0.71). Trin 2: vekselvirkningen egen socialklasse uddannelse fjernes fordi variablen er insignifikant og har den højeste p-værdi (p = 0.30).... Trin 8: model indeholder: familiesocialklasse, køn, alder, uddannelse, familiesocialklasse køn - alle led er signifikante 17

19 Det hierarkiske princip for interaktioner Hvis en model indeholder interaktionen X Z skal modellen også indeholde hovedvirkningerne X og Z Dvs. i en baglæns selektionsprocedure må man ikke fjerne X eller Z hvis X Z er i modellen. Tabel 6: uddannelse kan først fjernes efter at egen socailklasse uddannelse og familie socailklasse uddannelse er fjernet. Fint illustreret i tabellen 18

20 Modelsøgning: anbefalet metode En svaghed ved metoden i studenterbesvarelsen og bogens afsnit er at man let ender med en model med vekselvirkninger. Vi foreslår: 1. Start med en model med alle potentielle confoundere men uden vekselvirkninger. Lav evt baglæns selektion. Fortolk resultatet i den endelige model. 2. Linearitetstjek af kontinuerte variable (her alder). Ikke-lineære effekter: f.eks alder 2 og alder 3. Eller logaritme. En ikke-lineær effekt rapporteres i en tegning. 3. Inkluder udvalgte vekselvirkninger og lav baglæns modelsøgning blandt disse. Kovariater med ikke-lineær effekt i trin 2 kan evt erstattes med kategoriserede variable. 19

21 Startmodeller Vi har to socialklasse-variable som er meget stærkt relaterede. Jeg starter med at se på dem hver for sig. logit(p) = α + Σ i β soci soci + β sex1 sex1 + Σ i β uddi uddi + β al alder Hvor soc-variablen angiver enten familiesocialklasse eller egen socialklasse 20

22 Output: familiesocialklasse B S.E. Wald df Sig. Exp(B) sex(1),134,065 4,222 1,040 1,144 alder86,030, ,523 1,000 1,031 udd86 17,020 4,002 udd86(1) -,336,150 5,037 1,025,715 udd86(2) -,328,136 5,812 1,016,721 udd86(3) -,303,079 14,608 1,000,738 udd86(4) -,258,134 3,725 1,054,772 famsoc86 47,624 4,000 famsoc86(1) -,851,158 28,990 1,000,427 famsoc86(2) -,712,129 30,656 1,000,491 famsoc86(3) -,549,099 30,796 1,000,577 famsoc86(4) -,341,098 12,004 1,001,711 Constant -,976,152 40,988 1,000,377 Alle confoundere er signifikante: modelsøgning stopper. Høj familiesocialklasse giver lavere risiko for sygdom når man sammenligner personer med samme køn, alder og uddannelse. 21

23 Output: egen socialklasse B S.E. Wald df Sig. Exp(B) sex(1),220,068 10,419 1,001 1,246 alder86,031, ,064 1,000 1,031 udd86 16,665 4,002 udd86(1) -,289,176 2,695 1,101,749 udd86(2) -,364,140 6,790 1,009,695 udd86(3) -,319,083 14,754 1,000,727 udd86(4) -,254,136 3,473 1,062,776 socgrp86 25,399 4,000 socgrp86(1) -,814,207 15,499 1,000,443 socgrp86(2) -,550,150 13,455 1,000,577 socgrp86(3) -,400,102 15,327 1,000,670 socgrp86(4) -,242,088 7,520 1,006,785 Constant -1,210,146 68,601 1,000,298 Igen ses en signifikant effekt af socialklasse. 22

24 Egen eller familiesocialklasse? Hvis vi vil afgøre hvilken type af socialklasse der er vigtigst kan vi prøve at inkludere begge variable som kovariater samtidigt. 23

25 Output: begge socialklasse variable B S.E. Wald df Sig. Exp(B) sex(1),157,070 5,035 1,025 1,170 alder86,030, ,664 1,000 1,031 udd86 15,417 4,004 udd86(1) -,286,177 2,611 1,106,751 udd86(2) -,353,142 6,194 1,013,703 udd86(3) -,311,084 13,764 1,000,733 udd86(4) -,248,137 3,281 1,070,780 socgrp86 1,547 4,818 socgrp86(1) -,224,283,628 1,428,799 socgrp86(2),058,220,069 1,793 1,059 socgrp86(3),068,154,196 1,658 1,070 socgrp86(4),047,120,155 1,694 1,048 famsoc86 21,218 4,000 famsoc86(1) -,729,224 10,626 1,001,482 famsoc86(2) -,758,193 15,484 1,000,469 famsoc86(3) -,598,150 15,840 1,000,550 famsoc86(4) -,364,131 7,676 1,006,695 Constant -1,002,156 41,243 1,000,367 Familiesocialklasse er vigtigst. Efter korrektion for familiesocialklasse er effekten af egen socialklasse klart insignifikant. Men efter korrektion for egen socialklasse er familiesocialklasse stadig signifikant. 24

26 Fortolkning af resultatet Familiesocialklasse har betydning for risiko for kronisk sygdom - ikke egen socialklasse Sammenlignes personer med samme egen socialklasse, men forskellig familiesocialklasse, så vil personen med den bedste familiesocialklasse have mindst sygdomsrisiko. Sammenlignes personer med samme familiesocialklasse men forskellig egen socialklasse, så vil der ikke være signifikant forskel på sygdomsrisikoen. 25

27 Er alderseffekten lineær? Testes ved at inddrage et 2. og 3. grads led i alder. Disse variable genereres og indsættes som ekstra kovariater. Herved opnås en mere fleksibel beskrivelse af alderseffekten (3. grads polynomium): logit(p) = α + Σ i β soci soci + β sex1 sex1 + Σ i β uddi uddi + β al alder +β al2 alder 2 + β al3 alder 3 Hvis β al2 = β al3 = 0 er alderseffekten lineær. 26

28 Output: 1., 2. og 3. grad Variables in the Equation B S.E. Wald df Sig. Exp(B) sex(1),135,065 4,229 1,040 1,144 alder86,189,119 2,520 1,112 1,208 udd86 17,881 4,001 udd86(1) -,346,150 5,340 1,021,708 udd86(2) -,339,136 6,193 1,013,713 udd86(3) -,311,080 15,320 1,000,732 Step 1 a udd86(4) -,263,134 3,873 1,049,768 famsoc86 47,222 4,000 famsoc86(1) -,849,159 28,659 1,000,428 famsoc86(2) -,710,129 30,412 1,000,492 famsoc86(3) -,549,099 30,651 1,000,578 famsoc86(4) -,338,098 11,830 1,001,713 alder2 -,003,002 2,076 1,150,997 alder3,000,000 2,351 1,125 1,000 Constant -3,371 1,967 2,937 1,087,034 a. Variable(s) entered on step 1: sex, alder86, udd86, famsoc86, alder2, alder3. 3. gradsled er insignifikant og fjernes derfor 27

29 Output: 1. og 2. grad Variables in the Equation B S.E. Wald df Sig. Exp(B) sex(1),135,065 4,273 1,039 1,145 alder86,009,020,203 1,652 1,009 udd86 17,182 4,002 udd86(1) -,340,150 5,181 1,023,711 udd86(2) -,333,136 5,994 1,014,717 udd86(3) -,304,079 14,628 1,000,738 Step 1 a udd86(4) -,261,134 3,794 1,051,771 famsoc86 46,528 4,000 famsoc86(1) -,841,158 28,200 1,000,431 famsoc86(2) -,705,129 29,993 1,000,494 famsoc86(3) -,545,099 30,295 1,000,580 famsoc86(4) -,338,098 11,822 1,001,713 alder2,000,000 1,218 1,270 1,000 Constant -,452,498,825 1,364,636 a. Variable(s) entered on step 1: sex, alder86, udd86, famsoc86, alder2. også 2. gradsleddet er insignifikant. Dvs en linie giver en tilstrækkelig beskrivelse af alderseffekten 28

30 Hvad betyder α? logit(p) = α + Σ i β soci soci + β sex1 sex1 + Σ i β uddi uddi + β al alder Det er logit-værdien for personer med værdien 0 på alle kovariater. Her familiesocialklasse V, kvinde, 0 år gammel, ingen uddannelse. logit(p) = log[p/(1 p)] = p = exp( 0.976)/[1+exp( 0.976)] = 0.27 Men vi har ikke data for 0-årige, så resultatet er en ekstrapolation. Åndsvage α-værdier angives for ofte. Bør droppes i artikeltabeller - eller også kan nulpunktet ændres. Dette gøres ved at lave en ny aldersvariabel der er 0 f.eks for 50-årige nyalder = alder 50 29

31 Output med nyalder B S.E. Wald df Sig. Exp(B) sex(1),134,065 4,222 1,040 1,144 udd86 17,020 4,002 udd86(1) -,336,150 5,037 1,025,715 udd86(2) -,328,136 5,812 1,016,721 udd86(3) -,303,079 14,608 1,000,738 udd86(4) -,258,134 3,725 1,054,772 Step 1 a famsoc86 47,624 4,000 famsoc86(1) -,851,158 28,990 1,000,427 famsoc86(2) -,712,129 30,656 1,000,491 famsoc86(3) -,549,099 30,796 1,000,577 famsoc86(4) -,341,098 12,004 1,001,711 nyalder,030, ,523 1,000 1,031 Constant,542,082 44,194 1,000 1,720 logit(p) = log[p/(1 p)] = p = exp(0.542)/[1+exp(0.542)] =

32 Modelsøgning: Vekselvirkninger? Nu tilføjes vekselvirkningsled. Hvilke? Socialklasse med hver af de tilbageværende confoundere, dvs familiesocailklasse køn, familiesocailklasse alder, familiesocailklasse uddannelse Baglænsselektion: 1. familiesocailklasse uddannelse (p = 0.35) 2. familiesocailklasse alder (p = 0.12) Dvs vi ender med en model med signifikant interaktion mellem køn og familiesocialklasse. 31

33 Output: vekselvirkning mellem køn og socialklasse B S.E. Wald df Sig. Exp(B) sex(1) -,272,149 3,299 1,069,762 udd86 17,894 4,001 udd86(1) -,349,153 5,239 1,022,705 udd86(2) -,319,136 5,489 1,019,727 udd86(3) -,316,080 15,691 1,000,729 udd86(4) -,255,134 3,597 1,058,775 famsoc86 48,195 4,000 famsoc86(1) -1,002,203 24,278 1,000,367 famsoc86(2) -1,039,177 34,535 1,000,354 famsoc86(3) -,809,139 33,905 1,000,445 famsoc86(4) -,582,136 18,225 1,000,559 nyalder,030, ,027 1,000 1,031 famsoc86 sex 10,539 4,032 famsoc86(1) by sex(1),302,271 1,239 1,266 1,353 famsoc86(2) by sex(1),628,229 7,546 1,006 1,874 famsoc86(3) by sex(1),513,190 7,319 1,007 1,670 famsoc86(4) by sex(1),480,187 6,572 1,010 1,616 Constant,754,109 47,426 1,000 2,125 Vekselvirkningen er signifikant - men hvordan skal den forståes? 32

34 Vekselvirkning mellem køn og socialklasse (forklaring af Tabel 8 i studenterbesvarelse) logit(p) = α + Σ i β uddi uddi + β al nyalder + Σ i β soci soci + β sex1 sex1 +β soc1,sex1 soc1 sex1 + β soc2,sex1 soc2 sex1 +β soc3,sex1 soc3 sex1 + β soc4,sex1 soc4 sex1 Sidste 4 led beskriver vekselvirkningen. logit beregnes for forskellige persontyper: 1. udd=v,alder=50, soc=v: sex=kvinde: logit= α 2. udd=v,alder=50, soc=v sex=mand: logit= α + β sex1 logit-forskel= β sex1 (2-1) 3. udd=v,alder=50, soc=iv sex=mand: logit= α + β sex1 + β soc4 + β soc4,sex1 logit-forskel=β sex1 + β soc4 + β soc4,sex1 (3-1) 33

35 Beskrivelse af vekselvirkningen logit-forskel for sygdom i forhold til kvinder med laveste socialklasse β SEX(1) SOC(1) SOC(2) SOC(3) SOC(4) SOC(1)bySEX(1) SOC(2)bySEX(1) SOC(3)bySEX(1) SOC(4)bySEX(1) SEX V IV III II I

36 Vekselvirkningen - effekt af socialklasse logit-forskel for sygdom i forhold til kvinder med laveste socialklasse V IV III II I kvinde mand Effekt af socialklasse for hvert køn V IV III II I kvinde (mand) mand

37 OR for familiesocialklasse OR 95%-CI p Kvinder soc V soc IV ; < soc III ; < soc II ; < soc I ; < Mænd soc V soc IV ; soc III ; soc II ; soc I ; Socialklasse-effekten er stærkere for kvinder 36

38 SPSS: Hvordan findes 95%-CI og p? Ret let. SPSS angiver jo socialklasse-effekten for reference-værdien af køn (kvinder). Effekt for mænd findes ved at vælge denne gruppe som referencen. 37

39 Vekselvirkning - effekt af køn V IV III II I kvinde mand Effekt af køn for hver socialklasse V IV III II I kvinde (mand) mand

40 OR for køn Socialklasse 5 OR 95%-CI p kvinde mand ; Socialklasse 4 kvinde mand ; Socialklasse 3 kvinde mand ; Socialklasse 2 kvinde mand ; Socialklasse 1 kvinde mand ; For nogle socialklasse-niveauer er mænd bedre end kvinder for andre gælder det modsatte. 39

41 SPSS: Hvordan findes 95%-CI og p? Ret let - men lidt besværligt. SPSS angiver jo køns-effekten for reference-værdien af socialklasse (5). Effekt af køn for f.eks socialklasse 4 findes ved at vælge denne gruppe som referencen. Dette kræver omkodning. Lav ny socialklassevariabel (famsoc4) der er identisk med den gamle, bortset fra at når den gamle variabel er 4 er den nye 10. Analysen køres med den nye socialklassevariabel (famsoc4) hvorved gruppe 4 automatisk bliver referencen. 40

42 Vekselvirkning Når køn indgår i en vekselvirkning giver det ikke mening at tale om en kønseffekt. Effekten af køn afhænger af socialklasse. Tilsvarende kan man ikke tale om en effekt af socialklasse. Effekten afhænger af køn. 41

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Stratificerede analyser

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Stratificerede analyser Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Stratificerede analyser Dødsstraf-eksempel Betyder morderens farve noget for risikoen for dødsstraf? 1 Dødsstraf-eksempel: data Variable: Dødsstraf

Læs mere

Morten Frydenberg 26. april 2004

Morten Frydenberg 26. april 2004 Introduktion til Logistisk Regression Morten Frydenberg, Inst. f. Biostatistik RESUME: 2 2. gang: 2002 Institut for Biostatistik, Århus Universitet MPH. studieår Specialmodul 4 Cand. San. uddannelsen.

Læs mere

Mantel-Haenszel analyser. Stratificerede epidemiologiske analyser

Mantel-Haenszel analyser. Stratificerede epidemiologiske analyser Mantel-Haensel analyser Stratificerede epidemiologiske analyser 1 Den epidemiologiske synsvinkel: 1) Oftest asymmetriske (kausale) sammenhænge (Eksposition Sygdom/død) 2) Risikoen vurderes bedst ved hjælp

Læs mere

Eksamen i statistik 2010 Kandidatuddannelsen i folkesundhedsvidenskab

Eksamen i statistik 2010 Kandidatuddannelsen i folkesundhedsvidenskab D E T S U N D H E D S V I D E N S K A B E L I G E F A K U L T E T K Ø B E N H A V N S U N I V E R S I T E T Eksamen i statistik 2010 Kandidatuddannelsen i folkesundhedsvidenskab Eksamensnummer: 16, 23

Læs mere

25. april Probability of Developing Coronary Heart Disease in 6 years. Women (Aged 35-70) 160 No Yes

25. april Probability of Developing Coronary Heart Disease in 6 years. Women (Aged 35-70) 160 No Yes 25. april 2. gang: Introduktion til Logistisk Regression Morten Frydenberg 22 Institut for Biostatistik, Århus Universitet MPH. studieår specialmodul Cand. San. uddannelsen. studieår Hvorfor logistisk

Læs mere

Logistisk regression

Logistisk regression Logistisk regression Test af antagelsen om lineære effekter Modelkonstruktion og modelsøgning Hvilke variable og hvilke interaktioner skal inkluderes i regressionsmodellerne? 1 Logistiske regressionsmodeller

Læs mere

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression Multipel Linear Regression Repetition Partiel F-test Modelsøgning Logistisk Regression Test for en eller alle parametre I jagten på en god statistisk model har vi set på følgende to hypoteser og tilhørende

Læs mere

Morten Frydenberg 14. marts 2006

Morten Frydenberg 14. marts 2006 Introduktion til Logistisk Regression Morten Frydenberg, Inst. f. Biostatistik 1 RESUME: 2 2. gang: 2006 Institut for Biostatistik, Århus Universitet MPH 1. studieår Specialmodul 4 Cand. San. uddannelsen

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Analyse af binære responsvariable

Analyse af binære responsvariable Analyse af binære responsvariable Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet 23. november 2012 Har mænd lettere ved at komme ind på Berkeley? UC Berkeley

Læs mere

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression: Definitioner For en binær (0/) variabel Y antager vi P(Y)p P(Y0)-p Eksempel: Bil til arbejde vs alder

Læs mere

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse . september 5 Epidemiologi og biostatistik. Forelæsning Uge, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression

Læs mere

Træningsaktiviteter dag 3

Træningsaktiviteter dag 3 Træningsaktiviteter dag 3 I træningsaktiviteterne skal I arbejde videre med Framingham data og risikoen for hjertesygdom. I skal dels lave MH-analyser som vi gjorde i timerne og dels lave en multipel logistisk

Læs mere

Eksamen i Statistik og skalavalidering

Eksamen i Statistik og skalavalidering Eksamen i Statistik og skalavalidering 2009-studieordning Til aflevering d. 22. december 2010 Efterårssemestret 2010, Kandidatuddannelsen i Folkesundhedsvidenskab Opgaven er udarbejdet af: Eksamensnummer

Læs mere

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Statistik II Lektion 3 Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable Setup: To binære variable X og Y. Statistisk model: Konsekvens: Logistisk regression: 2 binære var. e e X Y P

Læs mere

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Statikstik II 2. Lektion Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression Sandsynlighedsregningsrepetition Antag at Svar kan være Ja og Nej. Sandsynligheden for at Svar Ja skrives

Læs mere

Statistik II 1. Lektion. Analyse af kontingenstabeller

Statistik II 1. Lektion. Analyse af kontingenstabeller Statistik II 1. Lektion Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller Logistisk regression

Læs mere

Synopsis til eksamen i Statistik

Synopsis til eksamen i Statistik Synopsis til eksamen i Statistik Kandidatuddannelsen i Folkesundhedsvidenskab Københavns Universitet december 2010 Eksamensnummer: 12 Antal anslag: 23.839 (svarende til 9,9 normalsider) - 1 - Indholdsfortegnelse

Læs mere

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk Eksempel: Systolisk blodtryk Udgangspunkt: Vi ønsker at prædiktere det systoliske blodtryk hos en gruppe af personer. Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Afdeling for Biostatistik.

Læs mere

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Institut for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression Regressionsanalyse Regressionsanalyser

Læs mere

Logistisk Regression - fortsat

Logistisk Regression - fortsat Logistisk Regression - fortsat Likelihood Ratio test Generel hypotese test Modelanalyse Indtil nu har vi set på to slags modeller: 1) Generelle Lineære Modeller Kvantitav afhængig variabel. Kvantitative

Læs mere

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logisitks Regression: Repetition Y {0,} binær afhængig variabel X skala forklarende variabel π P( Y X x) Odds(Y X x) π /(-π

Læs mere

Multipel Lineær Regression

Multipel Lineær Regression Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer

Læs mere

Faculty of Health Sciences. Logistisk regression: Kvantitative forklarende variable

Faculty of Health Sciences. Logistisk regression: Kvantitative forklarende variable Faculty of Health Sciences Logistisk regression: Kvantitative forklarende variable Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Sammenhæng

Læs mere

Statistik og skalavalidering. Opgave 1

Statistik og skalavalidering. Opgave 1 Statistik og skalavalidering Opgave 1 Opgavens formål: Denne opgave har, ligesom det vil være tilfældet for de fleste andre øvelsesopgaver på dette kursus, flere forskellige formål. For det første et praktisk/teknisk

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Uafhængighedstestet

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Uafhængighedstestet Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Uafhængighedstestet Eksempel: Bissau data Data kommer fra Guinea-Bissau i Vestafrika: 5273 børn blev undersøgt da de var yngre end 7 mdr og blev

Læs mere

Statistik II 4. Lektion. Logistisk regression

Statistik II 4. Lektion. Logistisk regression Statistik II 4. Lektion Logistisk regression Logistisk regression: Motivation Generelt setup: Dikotom(binær) afhængig variabel Kontinuerte og kategoriske forklarende variable (som i lineær reg.) Eksempel:

Læs mere

Uge 13 referat hold 4

Uge 13 referat hold 4 Uge 13 referat hold 4 Gruppearbejde 1a: Er variablen kvotient inkluderet på en hensigtsmæssig måde? Der er to problemer med kvotient: 1) Den er trunkeret ved 6.9 og 10.0, løsningen er at indføre dummyer

Læs mere

Logistisk regression

Logistisk regression Logistisk regression http://biostat.ku.dk/ kach/css2 Thomas A Gerds & Karl B Christensen 1 / 18 Logistisk regression I dag 1 Binær outcome variable død : i live syg : rask gravid : ikke gravid etc 1 prædiktor

Læs mere

1 Multipel lineær regression

1 Multipel lineær regression 1 Multipel lineær regression Regression med 2 eksponeringsvariable Fortolkning og estimation AnovaTabel og multipel R 2 Ensidet variansanalyse: Dummy kodning Kovariansanalyse og effektmodifikation Tosidet

Læs mere

Statistik Lektion 4. Variansanalyse Modelkontrol

Statistik Lektion 4. Variansanalyse Modelkontrol Statistik Lektion 4 Variansanalyse Modelkontrol Eksempel Spørgsmål: Er der sammenhæng mellem udetemperaturen og forbruget af gas? Y : Forbrug af gas (gas) X : Udetemperatur (temp) Scatterplot SPSS: Estimerede

Læs mere

SYNOPSIS TIL EKSAMEN I STATISTIK OG SKALAVALIDERING

SYNOPSIS TIL EKSAMEN I STATISTIK OG SKALAVALIDERING SYNOPSIS TIL EKSAMEN I STATISTIK OG SKALAVALIDERING Kandidatuddanelsen i Folkesundhedsvidenskab Københavns Universitet, 2010 EKSAMENSNUMMER: 7 & 40 Antal anslag: 23.576 December 2010 INDHOLDSFORTEGNELSE

Læs mere

1 Multipel lineær regression

1 Multipel lineær regression Indhold 1 Multipel lineær regression 2 1.1 Regression med 2 eksponeringsvariable......................... 2 1.2 Fortolkning og estimation................................ 3 1.3 AnovaTabel og multipel R

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af

Læs mere

Løsning til opgave i logistisk regression

Løsning til opgave i logistisk regression Løsning til øvelser i logistisk regression, november 2008 1 Løsning til opgave i logistisk regression 1. Først indlæses data, og vi kan lige sørge for at danne en dummy-variable for cml, som indikator

Læs mere

Indvandrere og efterkommere i foreninger er frivillige i samme grad som danskere

Indvandrere og efterkommere i foreninger er frivillige i samme grad som danskere Indvandrere og efterkommere i foreninger er frivillige i samme grad som danskere Bilag I afrapportering af signifikanstest i tabeller i artikel er der benyttet følgende illustration af signifikans: * p

Læs mere

Morten Frydenberg 25. april 2006

Morten Frydenberg 25. april 2006 . gang: Introduktion til Logistisk Regression Morten Frydenberg 26 Afdeling for Biostatistik, Århus Universitet MPH. studieår specialmodul 4 Cand. San. uddannelsen. studieår Hvorfor logistisk regression

Læs mere

Økonometri 1. Kvalitative variabler. Kvalitative variabler. Dagens program. Kvalitative variable 8. marts 2006

Økonometri 1. Kvalitative variabler. Kvalitative variabler. Dagens program. Kvalitative variable 8. marts 2006 Dagens program Økonometri 1 Kvalitative variable 8. marts 2006 Kvalitative variabler som forklarende variabler i en lineær regressionsmodel (Wooldridge kap. 7.1-7.4) Kvalitative variabler generelt Dummy

Læs mere

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april Århus 8. april 2011 Morten Frydenberg Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april Opgave 1 ( gruppe 1: sp 1-4, gruppe 5: sp 5-9 og gruppe 6: 10-14) I denne opgaveser vi på et

Læs mere

Synopsis til kursus i Statistik og skalavalidering på Folkesundhedsvidenskab

Synopsis til kursus i Statistik og skalavalidering på Folkesundhedsvidenskab Synopsis til kursus i Statistik og skalavalidering på Folkesundhedsvidenskab Eksamensnr. 26, 41 og 11 Anslag (uden tabeller og figurer): 23.933 1 1. Indledning...3 2. Deskriptiv statistik...3 3. Indledende

Læs mere

Statistik og skalavalidering Synopsis. Eksamensnumre 15, 33 og 45

Statistik og skalavalidering Synopsis. Eksamensnumre 15, 33 og 45 Statistik og skalavalidering Synopsis Københavns Universitet Folkesundhedsvidenskab, 7. semester Typografiske enheder: 22.615 December 2010 Indholdsfortegnelse 1.0 Indledning... 3 1.1 Karakteristika af

Læs mere

Kvantitative metoder 2

Kvantitative metoder 2 Kvalitative egenskaber og dummyvariabler Kvantitative metoder 2 Dummyvariabler 28. marts 2007 Vi har (hovedsagligt) set på kvantitative variabler (løn, priser, forbrug, indkomst, )... Men hvad med kvalitative

Læs mere

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Anvendt Statistik Lektion 8. Multipel Lineær Regression Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke

Læs mere

Basal Statistik Logistisk Regression. Dagens Tekst E Sædvanlig Linear Regression (Repetition) Basal Statistik - Logistisk regression 1

Basal Statistik Logistisk Regression. Dagens Tekst E Sædvanlig Linear Regression (Repetition) Basal Statistik - Logistisk regression 1 Basal Statistik Logistisk Regression Judith L. Jacobsen, PhD. Lene Theil Skovgaard http://staff.pubhealth.ku.dk/~lts/basal13_ jlj@statcon.dk Dagens Tekst Logistisk regression Binære data Logit transformation

Læs mere

Statistik II 1. Lektion. Sandsynlighedsregning Analyse af kontingenstabeller

Statistik II 1. Lektion. Sandsynlighedsregning Analyse af kontingenstabeller Statistik II 1. Lektion Sandsynlighedsregning Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller

Læs mere

9. Chi-i-anden test, case-control data, logistisk regression.

9. Chi-i-anden test, case-control data, logistisk regression. Biostatistik - Cand.Scient.San. 2. semester Karl Bang Christensen Biostatististisk afdeling, KU kach@biostat.ku.dk, 35327491 9. Chi-i-anden test, case-control data, logistisk regression. http://biostat.ku.dk/~kach/css2014/

Læs mere

Basal statistik. 21. oktober 2008

Basal statistik. 21. oktober 2008 Basal statistik 21. oktober 2008 Den generelle lineære model Repetition af variansanalyse og multipel regression Interaktion Parametriseringer Kovariansanalyse Esben Budtz-Jørgensen, Biostatistisk Afdeling

Læs mere

En teoretisk årsagsmodel: Operationalisering: Vurdering af epidemiologiske undersøgelser. 1. Informationsproblemer Darts et eksempel på målefejl

En teoretisk årsagsmodel: Operationalisering: Vurdering af epidemiologiske undersøgelser. 1. Informationsproblemer Darts et eksempel på målefejl Vurdering af epidemiologiske undersøgelser Jørn Attermann. februar 00 I denne forelæsning vil vi se på fejl, som kan have betydning for fortolkningen af resultater fra epidemiologiske undersøgelser. Traditionelt

Læs mere

Benchmarking af kommunernes sagsbehandling antagelser, metode og resultater

Benchmarking af kommunernes sagsbehandling antagelser, metode og resultater Benchmarking af kommunernes sagsbehandling antagelser, metode og resultater Anna Amilon Materiel vurdering Ved vurderingen af en afgørelses materielle indhold vurderes afgørelsens korrekthed i forhold

Læs mere

Vi vil analysere effekten af rygning og alkohol på chancen for at blive gravid ved at benytte forskellige Cox regressions modeller.

Vi vil analysere effekten af rygning og alkohol på chancen for at blive gravid ved at benytte forskellige Cox regressions modeller. Løsning til øvelse i TTP dag 3 Denne øvelse omhandler tid til graviditet. Et studie vedrørende tid til graviditet (Time To Pregnancy = TTP) inkluderede 423 par i alderen 20-35 år. Parrene blev fulgt i

Læs mere

Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004

Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004 Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004 Formål med Øvelsen: Formålet med øvelsen er at analysere om risikoen for død er forbundet med to forskellige vacciner BCG (mod

Læs mere

Sammenhængen mellem elevernes trivsel og elevernes nationale testresultater.

Sammenhængen mellem elevernes trivsel og elevernes nationale testresultater. Sammenhængen mellem elevernes trivsel og elevernes nationale testresultater. 1 Sammenfatning Der er en statistisk signifikant positiv sammenhæng mellem opnåelse af et godt testresultat og elevernes oplevede

Læs mere

Sammenhængsanalyser. Et eksempel: Sammenhæng mellem rygevaner som 45-årig og selvvurderet helbred som 51 blandt mænd fra Københavns amt.

Sammenhængsanalyser. Et eksempel: Sammenhæng mellem rygevaner som 45-årig og selvvurderet helbred som 51 blandt mænd fra Københavns amt. Sammenhængsanalyser Et eksempel: Sammenhæng mellem rygevaner som 45-årig og selvvurderet helbred som 51 blandt mænd fra Københavns amt. rygevaner som 45 årig * helbred som 51 årig Crosstabulation rygevaner

Læs mere

2 Logaritme- og eksponentialfunktion 6

2 Logaritme- og eksponentialfunktion 6 Indhold 1 Kontingenstabeller 2 1.1 Krydstabeller....................................... 2 1.2 Forventede under nulhypotesen............................. 4 1.3 Ki-kvadrat test......................................

Læs mere

Økonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol

Økonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol Økonometri: Lektion 5 Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol 1 / 35 Veksekvirkning: Motivation Vi har set på modeller som Price

Læs mere

Test og sammenligning af udvalgte regressionsmodeller Berit Christina Olsen forår 2008

Test og sammenligning af udvalgte regressionsmodeller Berit Christina Olsen forår 2008 Indholdsfortegnelse 1 INDLEDNING OG PROBLEMSTILLING... 2 1.1 OVERVÆGT SOM CASE... 2 2 ANALYSEFORBEREDELSER... 4 2.1 HEPRO-UNDERSØGELSEN... 4 2.2 DEN AFHÆNGIGE VARIABEL VIGTIGHED AF ÆNDRINGEN AF VÆGT...

Læs mere

Krydstabeller Forventede under nulhypotesen Ki-kvadrat test Residualanalyse Eksakt test

Krydstabeller Forventede under nulhypotesen Ki-kvadrat test Residualanalyse Eksakt test 1 Kontingenstabeller Krydstabeller Forventede under nulhypotesen Ki-kvadrat test Residualanalyse Eksakt test 2 Logaritme- og eksponentialfunktion 3 Logistisk regression Sammenligning af odds for 2 grupper

Læs mere

Statistik Lektion 16 Multipel Lineær Regression

Statistik Lektion 16 Multipel Lineær Regression Statistik Lektion 6 Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk

Læs mere

Morten Frydenberg Biostatistik version dato:

Morten Frydenberg Biostatistik version dato: Caerphilly studiet Design og Data Biostatistik uge 14 mandag Morten Frydenberg, Afdeling for Biostatistik Poisson regression En primær tidsakse og ikke stykkevise konstante rater Cox proportional hazard

Læs mere

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x) Formelsamlingen 1 Regneregler for middelværdier M(a + bx) a + bm X M(X+Y) M X +M Y Spredning varians og standardafvigelse VAR(X) 1 n n i1 ( X i - M x ) 2 Y a + bx VAR(Y) VAR(a+bX) b²var(x) 2 Kovariansen

Læs mere

Log-lineære modeller. Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres.

Log-lineære modeller. Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres. Log-lineære modeller Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres. Kontingenstabel Contingency: mulighed/tilfælde Kontingenstabel: antal observationer (frekvenser)

Læs mere

Logistisk regression. Basal Statistik for medicinske PhD-studerende November 2008

Logistisk regression. Basal Statistik for medicinske PhD-studerende November 2008 Logistisk regression Basal Statistik for medicinske PhD-studerende November 2008 Bendix Carstensen Steno Diabetes Center, Gentofte & Biostatististisk afdeling, Københavns Universitet bxc@steno.dk www.biostat.ku.dk/~bxc

Læs mere

Statistiske Modeller 1: Kontingenstabeller i SAS

Statistiske Modeller 1: Kontingenstabeller i SAS Statistiske Modeller 1: Kontingenstabeller i SAS Jens Ledet Jensen October 31, 2005 1 Indledning Som vist i Notat 1 afsnit 13 er 2 log Q for et test i en multinomialmodel ækvivalent med et test i en poissonmodel.

Læs mere

8.2 Statistiske analyse af hver enkelt indikator

8.2 Statistiske analyse af hver enkelt indikator 8.2 Statistiske analyse af hver enkelt indikator Basale ideer De avancerede statistiske metoder, som anvendes i denne rapport, fokuserer primært på vurdering af eventuel geografisk heterogenitet på regions-,

Læs mere

Statistik & Skalavalidering

Statistik & Skalavalidering å Statistik & Skalavalidering Synopsis til mundtlig eksamen d. 24. januar 2011 K ø b e n h a v n s U n i v e r s i t e t K a n d i d a t u d d a n n e l s e n i F o l k e s u n d h e d s v i d e n s k

Læs mere

Løsning til eksamen d.27 Maj 2010

Løsning til eksamen d.27 Maj 2010 DTU informatic 02402 Introduktion til Statistik Løsning til eksamen d.27 Maj 2010 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th edition]. Opgave I.1

Læs mere

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Afdeling for Biostatistik Bo Martin Bibby 23. november 2006 Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Vi betragter 4699 personer fra Framingham-studiet. Der er oplysninger om follow-up

Læs mere

MPH specialmodul i biostatistik og epidemiologi SAS-øvelser vedr. case-control studie af malignt melanom.

MPH specialmodul i biostatistik og epidemiologi SAS-øvelser vedr. case-control studie af malignt melanom. MPH specialmodul i biostatistik og epidemiologi SAS-øvelser vedr. case-control studie af malignt melanom. For at I skal kunne regne på tallene fra undersøgelsen har vi taget en delmængde af variablene

Læs mere

Logistisk regression

Logistisk regression Logistisk regression Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk 21. marts 2013 Dagens program Chi-i-anden (χ 2 )-testet Sandsynligheder,

Læs mere

Fejlkilder. Ulrik Schiøler Kesmodel. Rikke Guldberg Øjvind Lidegaard

Fejlkilder. Ulrik Schiøler Kesmodel. Rikke Guldberg Øjvind Lidegaard Fejlkilder Ulrik Schiøler Kesmodel Rikke Guldberg Øjvind Lidegaard Fejlkilder 1. Selektionsproblemer 2. Informationsproblemer 3. Confounding Generelle overvejelser I Det estimat for hyppighed, som vi måler

Læs mere

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser Uge 43 I Teoretisk Statistik,. oktober 3 Simpel lineær regressionsanalyse Forudsigelser Fortolkning af regressionsmodellen Ekstreme observationer Transformationer Sammenligning af to regressionslinier

Læs mere

Eksamen i statistik 2009-studieordning

Eksamen i statistik 2009-studieordning Kandidatuddannelsen i Folkesundhedsvidenskab Det sundhedsvidenskabelige fakultet Københavns Universitet 21.12.2010 Eksamen i statistik 2009-studieordning Underviser Svend Kreiner Udarbejdet af eksamens

Læs mere

Analyse af sociale baggrundsfaktorer for elever, der opnår bonus A

Analyse af sociale baggrundsfaktorer for elever, der opnår bonus A Analyse af sociale baggrundsfaktorer for elever, der opnår bonus A Analyse af sociale baggrundsfaktorer for elever, der opnår Bonus A Forfattere: Jeppe Christiansen og Lone Juul Hune UNI C UNI C, juni

Læs mere

Appendiks A. Entreprenørskabsundervisning i befolkningen, specielt blandt unge

Appendiks A. Entreprenørskabsundervisning i befolkningen, specielt blandt unge Appendiks A. Entreprenørskabsundervisning i befolkningen, specielt blandt unge Redegørelsen ovenfor er baseret på statistiske analyser, der detaljeres i det følgende, et appendiks for hvert afsnit. Problematikken

Læs mere

ØVELSER Statistik, Logistikøkonom Lektion 8 og 9: Simpel og multipel lineær regression

ØVELSER Statistik, Logistikøkonom Lektion 8 og 9: Simpel og multipel lineær regression ! ØVELSER Statistik, Logistikøkonom Lektion 8 og 9: Simpel og multipel lineær regression Eksempel 1 AT OPSTILLE EN SIMPEL LINEÆR REGRESSIONSMODEL - GENNEMGÅS AF JAKOB Et stort lager måler løbende sine

Læs mere

Simpel og multipel logistisk regression

Simpel og multipel logistisk regression Faculty of Health Sciences Logistisk regression Simpel og multipel logistisk regression 16. Maj 2012 Analyse af en binær responsvariabel. syg/rask, død/levende, ja/nej... Ud fra en eller flere forklarende

Læs mere

8.2 Statistiske analyse af hver enkelt indikator

8.2 Statistiske analyse af hver enkelt indikator 8.2 Statistiske analyse af hver enkelt indikator Basale ideer De avancerede statistiske metoder, som anvendes i denne rapport, fokuserer primært på vurdering af eventuel geografisk heterogenitet på regions-,

Læs mere

Module 12: Mere om variansanalyse

Module 12: Mere om variansanalyse Module 12: Mere om variansanalyse 12.1 Parreded observationer.................. 1 12.2 Faktor med 2 niveauer (0-1 variabel)......... 3 12.3 Tosidig variansanalyse med tilfældig virkning..... 9 12.3.1 Uafhængighedsbetragtninger..........

Læs mere

Økonometri 1. Dummyvariabler 13. oktober Økonometri 1: F10 1

Økonometri 1. Dummyvariabler 13. oktober Økonometri 1: F10 1 Økonometri 1 Dummyvariabler 13. oktober 2006 Økonometri 1: F10 1 Dagens program Dummyvariabler i den multiple regressionsmodel (Wooldridge kap. 7.3-7.6) Dummy variabler for kvalitative egenskaber med flere

Læs mere

INDLEDNING...2 DATAMATERIALET... 2 KARAKTERISTIK AF POPULATIONEN... 4

INDLEDNING...2 DATAMATERIALET... 2 KARAKTERISTIK AF POPULATIONEN... 4 Indholdsfortegnelse INDLEDNING...2 DATAMATERIALET... 2 KARAKTERISTIK AF OULATIONEN... 4 DELOGAVE 1...5 BEGREBSVALIDITET... 6 Differentiel item funktionsanalyser...7 Differentiel item effekt...10 Lokal

Læs mere

Besvarelse af opgavesættet ved Reeksamen forår 2008

Besvarelse af opgavesættet ved Reeksamen forår 2008 Besvarelse af opgavesættet ved Reeksamen forår 2008 10. marts 2008 1. Angiv formål med undersøgelsen. Beskriv kort hvordan cases og kontroller er udvalgt. Vurder om kontrolgruppen i det aktuelle studie

Læs mere

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test] Anvendt Statistik Lektion 6 Kontingenstabeller χ 2 -test [ki-i-anden-test] 1 Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination

Læs mere

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge Statistik og Sandsynlighedsregning 2 Repetition og eksamen Overheads til forelæsninger, mandag 7. uge 1 Normalfordelingen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange

Læs mere

Module 4: Ensidig variansanalyse

Module 4: Ensidig variansanalyse Module 4: Ensidig variansanalyse 4.1 Analyse af én stikprøve................. 1 4.1.1 Estimation.................... 3 4.1.2 Modelkontrol................... 4 4.1.3 Hypotesetest................... 6 4.2

Læs mere

Workshop 6 Sundhedsprofilen metode og muligheder. Anne Helms Andreasen, Forskningscenter for Forebyggelse og Sundhed

Workshop 6 Sundhedsprofilen metode og muligheder. Anne Helms Andreasen, Forskningscenter for Forebyggelse og Sundhed Workshop 6 Sundhedsprofilen metode og muligheder Anne Helms Andreasen, Forskningscenter for Forebyggelse og Sundhed Metode og muligheder Design Beskrivelse af deltagere og ikke-deltagere Vægtning for design

Læs mere

Eksamen i Statistik for biokemikere. Blok

Eksamen i Statistik for biokemikere. Blok Eksamen i Statistik for biokemikere. Blok 2 2007. Vejledende besvarelse 22-01-2007, Niels Richard Hansen Bemærkning: Flere steder er der givet en argumentation (f.eks. baseret på konfidensintervaller)

Læs mere

En teoretisk årsagsmodel: Operationalisering: Vurdering af epidemiologiske undersøgelser. 1. Informationsproblemer Eksempler på målefejl

En teoretisk årsagsmodel: Operationalisering: Vurdering af epidemiologiske undersøgelser. 1. Informationsproblemer Eksempler på målefejl Vurdering af epidemiologiske undersøgelser Jørn Attermann 6. februar 2006 I denne forelæsning vil vi se på fejl, som kan have betydning for fortolkningen af resultater fra epidemiologiske undersøgelser.

Læs mere

Økonometri 1. Prediktion. Dummyvariabler 9. oktober Økonometri 1: F9 1

Økonometri 1. Prediktion. Dummyvariabler 9. oktober Økonometri 1: F9 1 Økonometri 1 Prediktion. Dummyvariabler 9. oktober 2006 Økonometri 1: F9 1 Program frem til efterårsferien Om goodness-of-fit, prediktion og residualer (kap. 6.3-4) Kvalitative egenskaber i den multiple

Læs mere

Elaborering: Analyse af betingede relationer

Elaborering: Analyse af betingede relationer Elaborering: Analyse af betingede relationer 1 Mordsager i Florida i perioden 1973-79 Sammenhæng mellem morderens race og forekomst af dødsdom i 4764 mordsager i Florida i 1973-1979. Dom Morder sort hvid

Læs mere

ØVELSER Statistik, Logistikøkonom Lektion 8 og 9: Simpel og multipel lineær regression

ØVELSER Statistik, Logistikøkonom Lektion 8 og 9: Simpel og multipel lineær regression ! ØVELSER Statistik, Logistikøkonom Lektion 8 og 9: Simpel og multipel lineær regression Eksempel 1 AT OPSTILLE EN SIMPEL LINEÆR REGRESSIONSMODEL - GENNEMGÅS AF JAKOB Et stort lager måler løbende sine

Læs mere

Morten Frydenberg Biostatistik version dato:

Morten Frydenberg Biostatistik version dato: Tye og Tye 2 fejl Statistisk styrke Biostatistik uge 2 mandag Morten Frydenberg, Afdeling for Biostatistik Styrkeovervejelser i lanlægning af et studie Logistisk regression Præterm fødsel, rygning, alder,

Læs mere

Program dag 2 (11. april 2011)

Program dag 2 (11. april 2011) Program dag 2 (11. april 2011) Dag 2: 1) Hvordan kan man bearbejde data; 2) Undersøgelse af datamaterialet; 3) Forskellige typer statistik; 4) Indledende dataundersøgelser; 5) Hvad kan man sige om sammenhænge;

Læs mere

Logistisk regression

Logistisk regression Logistisk regression Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Kursushjemmeside: www.biostat.ku.dk/~sr/forskningsaar/regression2012/

Læs mere

Intern validitet: Fejlkilder og tolkningsproblemer i epidemiologiske undersøgelser

Intern validitet: Fejlkilder og tolkningsproblemer i epidemiologiske undersøgelser Intern validitet: Fejlkilder og tolkningsproblemer i epidemiologiske undersøgelser Jørn Attermann 23. september 2009 Vurdering af den interne validitet af en epidemiologisk undersøgelse: Informationsproblemer

Læs mere

1 Hb SS Hb Sβ Hb SC = , (s = )

1 Hb SS Hb Sβ Hb SC = , (s = ) PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.

Læs mere

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet

Læs mere

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse

Læs mere

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper.

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper. 1. Indlæs data. * HUSK at angive din egen placering af filen; data framing; infile '/home/sro00/mph2016/framing.txt' firstobs=2; input id sex age frw sbp sbp10 dbp chol cig chd yrschd death yrsdth cause;

Læs mere

ØVELSER Statistik, Logistikøkonom Lektion 8 og 9: Simpel og multipel lineær regression // SVAR

ØVELSER Statistik, Logistikøkonom Lektion 8 og 9: Simpel og multipel lineær regression // SVAR ! ØVELSER Statistik, Logistikøkonom Lektion 8 og 9: Simpel og multipel lineær regression // SVAR Eksempel 1 AT OPSTILLE EN SIMPEL LINEÆR REGRESSIONSMODEL - GENNEMGÅS AF JAKOB Et stort lager måler løbende

Læs mere