6. SEMESTER Epidemiologi og Biostatistik Opgaver til 3. uge, fredag

Relaterede dokumenter
Regressionsanalyse. Epidemiologi og Biostatistik. 1.Simpel lineær regression (Kapitel 11) systolisk blodtryk og alder

EKSAMEN I MATEMATIK-STATISTIK, 27. JANUAR 2006, KL 9-13

Morten Frydenberg Biostatistik version dato:

Opsamling. Simpel/Multipel Lineær Regression Logistisk Regression Ikke-parametriske Metoder Chi-i-anden Test

Kvantitative metoder 2

Statikstik II 4. Lektion. Generelle Lineære Modeller

Morten Frydenberg Biostatistik version dato:

Statistik II Lektion 5 Modelkontrol. Modelkontrol Modelsøgning Større eksempel

Bilag 6: Økonometriske

Statistik II Lektion 4 Generelle Lineære Modeller. Simpel Lineær Regression Multipel Lineær Regression Flersidet Variansanalyse (ANOVA)

Økonometri 1. Lineær sandsynlighedsmodel. Hvad nu hvis den afhængige variabel er en kvalitativ variabel (med to kategorier)?

Statistik Lektion 15 Mere Lineær Regression. Modelkontrol Prædiktion Multipel Lineære Regression

Økonometri 1. Heteroskedasticitet 27. oktober Økonometri 1: F12 1

Økonometri 1. Test for heteroskedasticitet. Test for heteroskedasticitet. Dagens program. Heteroskedasticitet 26. oktober 2005

Kvantitative metoder 2

Anvendt Statistik Lektion 10. Regression med både kvantitative og kvalitative forklarende variable Modelsøgning Modelkontrol

Prøveeksamen Indtjening, konkurrencesituation og produktudvikling i danske virksomheder Kommenteret vejledende besvarelse

Binomialfordelingen: april 09 GJ

Anvendt Statistik Lektion 10. Regression med både kvantitative og kvalitative forklarende variable Modelkontrol

Økonometri 1. Avancerede Paneldata Metoder I 24.november F18: Avancerede Paneldata Metoder I 1

Økonometri 1 Efterår 2006 Ugeseddel 9

Statikstik II 3. Lektion. Multipel Logistisk regression Generelle Lineære Modeller

Statistik II Lektion 5 Modelkontrol. Modelkontrol Modelsøgning Større eksempel

Sandsynlighedsregning 12. forelæsning Bo Friis Nielsen

Eksempel: PEFR. Epidemiologi og biostatistik. Uge 1, tirsdag. Erik Parner, Institut for Biostatistik.

Lineær regressionsanalyse8

Vi ønsker også at teste hypoteser om parametrene. F.eks: Kan µ tænkes at være 0 (eller anden fast, kendt værdi)? Eksempel: dollarkurser

Ugeseddel 8. Gruppearbejde:

Fagblok 4b: Regnskab og finansiering 2. del Hjemmeopgave kl til kl

Økonometri lektion 7 Multipel Lineær Regression. Testbaseret Modelkontrol

Stadig ligeløn blandt dimittender

Økonometri 1 Efterår 2006 Ugeseddel 13

Kvantitative metoder 2 Forår 2007 Ugeseddel 10

Økonometri 1. Funktionel form. Funktionel form (fortsat) Dagens program. Den simple regressionsmodel 14. september 2005

Løsninger til kapitel 12

Stadig ligeløn blandt dimittender

Kvantitative metoder 2 Forår 2007 Ugeseddel 9

Sandsynlighedsregning og statistik med binomialfordelingen

Brugen af R^2 i gymnasiet

Prøveeksamen Indtjening, konkurrencesituation og produktudvikling i danske virksomheder Kommenteret vejledende besvarelse

Tabsberegninger i Elsam-sagen

PRODUKTIONSEFFEKTEN AF AVL FOR HANLIG FERTILITET I DUROC

Variansanalyse (ANOVA) Repetition, ANOVA Tjek af model antagelser Konfidensintervaller for middelværdierne Tukey s test for parvise sammenligninger

Landbrugets efterspørgsel efter Kunstgødning. Angelo Andersen

Økonometri 1. Interne evalueringer. Interne evalueringer. Dagens program. Heteroskedaticitet (Specifikation og dataproblemer) 2.

Økonometri 1. Lineær sandsynlighedsmodel (Wooldridge 8.5). Dagens program: Heteroskedasticitet 30. oktober 2006

Vægtet model. Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl. Vægte. Vægte: Eksempel. Definition: Vægtrelationen

Logistisk regression. Logistisk regression. Probit model Fortolkning udfra latent variabel. Odds/Odds ratio

Udvikling af en metode til effektvurdering af Miljøstyrelsens Kemikalieinspektions tilsyn og kontrol

Rettevejledning til Økonomisk Kandidateksamen 2007I, Økonometri 1

Estimation af CES - forbrugssystemet med og uden dynamik: -fcf/fcfv sammenhold med fcv/fcfv -fct/fcts sammenhold med fcs/fcts

10. Usikkerhed og fejlsøgning

Prøveeksamen Indtjening, konkurrencesituation og produktudvikling i danske virksomheder Kommenteret vejledende besvarelse

Kvantitative metoder 2

Kvantitative metoder 2

Beregning af strukturel arbejdsstyrke

DLU med CES-nytte. Resumé:

Ny Langeland Kommunes redegørelse 2007 til brug for rammeaftalen på de sociale og socialpsykiatriske tilbud i Region Syddanmark

Prøveeksamen Indtjening, konkurrencesituation og produktudvikling i danske virksomheder Kommenteret vejledende besvarelse

Ligeløn-stilling blandt dimittender

Binomialfordelingen. Erik Vestergaard

Kvantitative metoder 2

Husholdningsbudgetberegner

6. SEMESTER Epidemiologi og Biostatistik Opgaver til 3. uge, tirsdag. Noget om meta-analyse og vægtning af estimater.

2. Sandsynlighedsregning

Indtjening, konkurrencesituation og produktudvikling i danske virksomheder

Statistik Lektion 14 Simpel Lineær Regression. Simpel lineær regression Mindste kvadraters metode Kovarians og Korrelation

Referat fra Bestyrelsesmøde

TNS Gallup - Public Ishøj kommune Borgerservice

Økonometri 1. Avancerede Paneldata Metoder II Introduktion til Instrumentvariabler 27. november 2006

Validering og test af stokastisk trafikmodel

Rettevejledning til Økonomisk Kandidateksamen 2005II, Økonometri 1

Miljø- og Fødevareudvalget MOF Alm.del Bilag 16 Offentligt

BESKÆFTIGELSES- OG LØNSTATISTIK FOR KVINDER

χ 2 -fordelte variable

Morten Frydenberg Version: Thursday, 16 June 2011

DANMARKS NATIONALBANK WORKING PAPERS

Inertimoment for arealer

Simpel Lineær Regression - repetition

6. SEMESTER Epidemiologi og Biostatistik Opgaver til 3. uge, tirsdag

Luftfartens vilkår i Skandinavien

Kreditrisiko efter IRBmetoden

Kvalitet af indsendte måledata

Scorer FCK "for mange" mål i det sidste kvarter?

Statistisk mekanik 13 Side 1 af 9 Faseomdannelse. Faseligevægt

Undersøgelse af pris- og indkomstelasticiteter i forbrugssystemet - estimeret med AIDS

Nøglebegreber: Objektivfunktion, vægtning af residualer, optimeringsalgoritmer, parameterusikkerhed og korrelation, vurdering af kalibreringsresultat.

Antag X 1,..., X n stokastiske variable med fælles middelværdi µ og varians σ 2. Hvis µ er ukendt estimeres σ 2 ved 1/36.

Forbedret Fremkommelighed i Aarhus Syd. Agenda. 1. Vurdering af forsøg Lukning af Sandmosevej

econstor zbw

Støbning af plade. Køreplan Matematik 1 - FORÅR 2005

Marco Goli, Ph.D, & Shahamak Rezaei. Den Sociale Højskole København & Roskilde Universitetscenter

TEORETISKE MÅL FOR EMNET:

Forberedelse til den obligatoriske selvvalgte opgave

TALTEORI Følger og den kinesiske restklassesætning.

Handleplan for Myndighed (Handicap og Socialpsykiatri)


Note til Generel Ligevægt

Erhvervsstyrelsen og Ernst & Young. 26. februar 2014

SERVICE BLUEPRINTS KY selvbetjening 2013

Transkript:

Afdelng for Epdemolog Afdelng for Bostatstk 6. SEESTER Epdemolog og Bostatstk Opgaver tl 3. uge, fredag Data tl denne opgave stammer fra. Bland: An Introducton to edcal Statstcs (Exercse 11E ). V har hentet tallene fra forfatterens hjemmesde og formentlg på grund af afrundngsfejl kan de følgende resultater afvge en llle smule fra bogen. I en stkprøve bestående af 43 kvnder og 58 mænd har man målt personernes PER og højde. Opgave 1 Kg alene på PER-værderne, se hstogram og standardberegnnger på næste sde. 1.1. Beregn et estmat (og et 95% skkerhedsnterval) for forskellen mellem mænd og kvnders PER-nveau. 1.2. Er der forskel på mandlge og kvndelge medcnstuderendes PER-værder? Hvs spørgsmålet ovenfor er besvaret rgtgt sger den skarpsndge student: Jamen forskellen på kvnder og mænd skyldes da bare, at mænd er højere end kvnder!. Så lad os lge kgge ldt nærmere på det. 1.3. Overvej om Højde er en confounder, når man vl estmere sammenhængen mellem køn og PER? V vl nu korrgere PER for Højde for at kunne sammenlgne mænd og kvnder. Det sker Exercse 11E, hvor der laves en lneær regresson af PER mod Højde for kvnder og for mænd. Det vl sge, v starter med følgende model: PER + β Højde + E (kvnder) = + β Højde + E (mænd) (1) hvor E angver den tlfældge/uforklarede varaton for den te person. V antager, at E for kvnder hhv. mænd kan beskrves ved hver sn normalfordelng, og dermed med hver sn standard devaton, sd og sd. V beregner først den lneære regresson af PER på Højde for kvnder og mænd hver for sg (Tabel 1). Tabel 1. Parameter-estmater odel (1). Parameter Estmat se -2.387 201.806-131.251 216.523 β 2.871 1.215 β 3.945 1.221 sd 46.593 - sd 58.432 -

2 20 emale requency 10 0 Std. Dev = 49.06 ean = 474.1 N = 43.00 325.0 425.0 525.0 625.0 725.0 375.0 475.0 575.0 675.0 775.0 PER 20 ale requency 10 0 Std. Dev = 63.09 ean = 568.2 N = 58.00 325.0 425.0 525.0 625.0 725.0 375.0 475.0 575.0 675.0 775.0 PER (l/mn) 2

3 1.4. Hvordan skal v fortolke estmaterne? Beregn 95% skkerhedsntervaller for og β. Kan de to hældnnger antages at være ens? 1.5. Opskrv regressonslnen for kvnder og for mænd. 1.6. Hvad er den predkterede PER-værd for en kvnde og for en mand, der begge er 170 cm høje? (Det falder desværre udenfor rammerne af dette kursus at beregne en standard error (se) for forskellen mellem de 2 predkterede PER-værder). 1.6. Hvad er predktonsntervallet for PER for en kvnde, der er 170 cm høj? Da v kke kan afvse at de to hældnnger antages at være ens, kan v lave en ny model, hvor kvnder og mænd nu antages at have en fælles hældnng: + β Højde + "error" (kvnder) PER = + β Højde + "error" (mænd) (2) Estmaterne for de 3 ukendte parametre denne model fremgår af Tabel 2 (an kan vse, at størrelsen af den tlfældge varaton ( error ) omkrng regressonslnerne er den samme for kvnder og mænd, dvs samme standard devaton (sd). an kan derfor nøjes med at angve et fælles estmat for denne). Det bemærkes, at standard error for estmatet for kke umddelbart kan beregnes ved hjælp af den sædvanlge fremgangsmåde, og denne værd er derfor også anført. Tabel 2. Parameter-estmater odel (2). Parameter Estmat se -110.997 145.177-56.838 155.010-54.159 14.639 β 3.525 0.873 sd 53.57-1.7. Kg på størrelsen af se( ˆ β ) forhold tl de køns-specfkke værder (Tabel 1). Hvorfor blver den nye værd mndre? 1.8. Hvordan skal v fortolke β og hvordan skal v fortolke de 2 ˆ -er Tabel 2? 1.9. Prædktér gen PER for en mandlg og en kvndelg studerende, der begge er 170 cm høje. 3

Opgave 2 4 2.1. Hvad er den forventede forskel PER mellem en kvnde og en mand, der er lge høje? 2.2. Er højde en effekt-modfkator? 2.3. Er der forskel på kvnders og mænds PER-værder, når v korrgerer for eventuelle højdeforskelle, det vl sge: er det mulgt, at =? 2.4. Hvad vl der ske med estmaterne, hvs v skftede enheder på Højden, f.eks. fra centmeter tl meter (ny skala)? 2.5. Hvad vl der ske med estmaterne, hvs v foretrak at benytte højde-afvgelsen fra 170 cm som forklarende varabel (skfter nul-punkt), det vl sge hvs v stedet benytter H_170 = Højde 170 som forklarende varabel? Vnk: Regn på udtrykkene odel 2. Opgave 3 I et stude tl belysnng af ændrng af energ ndtaget forbndelse med menstruatonen målte man det gennemsntlge daglge energndtag 10 dage før menstruatonen hos 11 kvnder. Resultaterne blev ( kj): 5260, 5470, 5640, 6180, 6390, 6515, 6805, 7515, 7515, 8230 og 8770. Gennemsnt=6754 kj og sprednngen=1142 kj an havde det samme stude på tlsvarende måde regstreret energndtaget efter menstruatonen hos 10 andre kvnder : 3885, 3910, 4220, 4680, 5160, 5265, 5645, 5975, 6790 og 6900. Gennemsnt=5243 kj og sprednngen=1097 kj or begge grupper gælder at data med rmelghed kan beskrves som værende normalfordelte, så statstske metoder baseret på t-fordelngen kan bruges. 3.1. Estmer forskellen energndtaget før og efter menstruatonen. I et andet stude havde man målt 10 kvnder både 10 dage før og efter menstruatonen og beregnet dfferensen: før-efter. Dette gav følgende data: 1350, 1250, 1755, 1020, 745, 1835, 1540, 1540, 725 og 1330 (Gennemsnt=1309 kj og sprednngen=385 kj). Dsse tal kan lgeledes beskrves ved en normalfordelng. 3.2. Estmer, på bass af dsse tal, forskellen energndtaget før og efter menstruatonen. 3.3. Sammenlgn de to resultater og specelt bredden af skkerhedsntervallerne. 3.4. Hvorfor er det sdste skkerhedsnterval smallere? 4

Opgave 4 5 I et follow-up stude fk man følgende data: Syg Rask Total Eksponeret 7 74 81 Ikke eksponeret 13 221 234 Total 20 295 315 4.1. Test hypotesen: Ingen sammenhæng mellem eksponerng og sygdom, vha. X 2 - testet. 4.2. Estmer den relatve rsko og test hypotesen: Den relatve rsko er 1. I et andet stude af det tlsvarende problem fk man: Syg Rask Total Eksponeret 49 518 567 Ikke eksponeret 91 1547 1638 Total 140 2065 2205 4.3. Test hypotesen: Ingen sammenhæng mellem eksponerng og sygdom, vha. X 2 - testet. 4.4. Estmer den relatve rsko og test hypotesen: Den relatve rsko er 1. 4.5. Sammenlgn resultaterne og konklusonerne for de to studer. 5