Vejledende besvarelse af hjemmeopgave, forår 2019

Størrelse: px
Starte visningen fra side:

Download "Vejledende besvarelse af hjemmeopgave, forår 2019"

Transkript

1 Vejledende besvarelse af hjemmeopgave, forår 2019 Udleveret 4. marts, afleveres senest ved øvelserne i uge 13 (26. marts.-28. marts). På hjemmesiden ligger oplysninger om 6 variable på 654 børn, nemlig idnr: Løbenummer for barnet gender: Barnets køn (D: dreng, P:pige) alder: Barnets alder (år) hoejde: Barnets højde (cm) expo: Barnets eksposition for rygning i hjemmet (0:nej, 1:ja) lungefkt: Lungefunktionsmål (liter) 1. Lav en simpel sammenligning af lungefunktionen for røg-eksponerede og ikke-røg-eksponerede drenge: Efter at have læst data ind, skal vi sørge for, at vi i de første 4 spørgsmål kun ser på drengene. Vi går derfor ind i Data/Select Cases, sætter flueben ved If condition is satisfied og udfylder med gender= D. Derefter laver vi et Boxplot ved at benytte Graphs/Graph Builder/Boxplots, hvor lungefkt trækkes over på Y-aksen, og expo trækkes over på X- aksen. 1

2 Da dette ikke viser tydelige tegn på at kræve transformation inden vi sammenligner de to grupper, vil vi fortsætte til et T-test for at estimere forskellen på grupperne, dvs. effekten af røg-eksposition. (a) Hvor stor er den estimerede forskel i lungefunktion på de to grupper? Her er der lagt op til at lave et uparret T-test, og dette gøres i Analyze/Compare Means/Independent Samples T-test, hvor vi sætter lungefkt over i Test Variable(s) og expo i Grouping Variable. Under Define Groups vælges Group1 til 0 og Group2 til 1. Herved får vi 2

3 Hvis vi vil se mere detaljeret på fordelingen af lungefunktion i hver af de to grupper, kan vi supplere med histogrammer, som vi kan lave ved først at benytte Data/Split File, vælge Compare groups og sætte expo over i Groups Based on, hvorefter vi benytter Graph/Chart/Histogram. Herved får vi Disse histogrammer antyder problemer med normalfordelingsantagelsen, idet vi for de ueksponerede har en tydelig hale af høje 3

4 værdier, medens vi for de eksponerede mere har en hale af lave værdier (men i denne gruppe er der ikke nær så mange observationer). Vi kunne forsøge med en logaritmetransformation, men da der er vigtigere problemer med denne analyse, vil vi undlade at gå videre ad denne vej. Outputtet ovenfor viser en tydelig signifikant forskel på de to grupper (P = 0.000) uanset om man antager, at spredningerne er ens eller ej. Den estimerede forskel er på ca 1 liter, eller mere præcist: liter, med CI=(0.62,1.40) liter... (b) og i hvis favør? men mærkeligt nok således, at det er de røg-eksponerede, der viser sig at have den højeste lungefunktion! Hvad sker der? (c) Giver det mening at konkludere noget om effekten af røg-eksposition ud fra denne analyse? Nej, det gør det ikke. Analysen her er alt for simpel, f.eks. fordi børnenes alder er vidt forskellig i de to grupper, som vi skal se nedenfor. 2. Vi skal nu se på drengenes alder. (a) Begrund med tal og figurer, hvorfor alder er en confounder for effekten af røg-eksposition i spørgsmål 1. Først skal vi lige huske at afblæse Data/Split File. Vi skal vise, at alder har en effekt på lungefunktionen (dette er vel ret velkendt) samt at aldersfordelingen (tilfældigvis?) ikke er ens i de to eksponeringsgrupper. Vi gør dette ved hjælp af grafiske metoder, dels i form af et Boxplot af alder i de to grupper, og dels i form af et loess-plot af lungefunktionen som funtion af alder, lavet ud fra et scatter plot Graph/Chart Builder, hvor man vælger Scatter plot (det længst til venstre), og i den fremkomne 4

5 boks trækker man lungefkt over på Y-aksen og alder over på X-aksen. Efterfølgende dobbeltklikkes på plottet, og man vælger Add Fit Line at Total, vælger en evt. foretrukken farve, samt vælger Loess under Fit Line: Disse to figurer viser tydeligt alderens sammenhæng til såvel eksposition som outcome. Vi er derfor nødt til at tage hensyn til alderen for at få et fornuftigt bud på effekten af røg-eksposition. Det kan man gøre på flere måder, og her forsøger vi dels at udelade en del af materialet for at gøre aldersfordelingerne mere ens, og dels at korrigere for alder ved at lave regressionsanalyse (kovariansanalyse). (b) Foretag sammenligningen fra spørgsmål 1 igen, men med et reduceret datamateriale, hvor de yngste ikke-eksponerede drenge er slettet, så de to grupper har nogenlunde samme minimumsalder. Vi udregner nogle simple summary statistics for drengene, opdelt efter de to ekspositions-grupper ved igen at anvende Data/Split File med expo som grupper, hvorefter vi bruger Analyze/Descriptive Statistics, vælger Descriptives og flytter de ønskede variable (her blot alder) over i Variable(s). Herved får vi outputtet: 5

6 Det er jo tydeligt, at de røg-eksponerede drenge er væsentligt ældre end de ueksponerede, og det giver naturligvis en hel skæv vurdering af effekten af røg-eksposition. Minimumsalderen for de ueksponerede er helt nede på 3 år, hvorimod den yngste eksponerede er 9 år. Vi vil derfor nu reducere vores materiale til udelukkende at indeholde drenge, der er mindst 9 år gamle, og så foretage T-testet igen. Først må vi lige aflyse Split File igen. Herefter skal vi filtrere datasættet yderligere, og vi går derfor tilbage til Data/Select Cases, sætter igen flueben ved If condition is satisfied men modificerer nu til gender= D & alder >= 9. T-testet giver nu nedenstående output 6

7 (c) Giver det et væsentligt andet resultat? Forklar hvorfor, eller hvorfor ikke. Vi bemærker, at estimatet for effekten af røg-eksposition er blevet betragteligt mindre, men at det stadig viser en fordel til de røgeksponerede, nu med 0.57 liter, CI=(0.21, 0.94) liter. Vi ser derfor nærmere på aldersfordelingen i denne selekterede population, igen i form af et Box plot: 7

8 Det er tydeligt at se fra denne figur, at aldersfordelingerne langtfra er blevet ens, blot fordi vi har sat minimumsalderen til at være den samme, og vi har derfor stadig konfundering fra alderen, som vi bør justere for. Det gør vi i næste spørgsmål. 3. Inkluder nu alder som kovariat i sammenligningen af lungefunktionen fra spørgsmål 1 (altså med data fra alle drengene), og husk passende modelkontrol. Vi skal først lige tilbage til Data/Select Cases, og ændre If condition is satisfied tilbage til gender= D, fordi vi nu skal have alle drengene med igen. Vi inkluderer derefter alderen som kovariat, med en lineær effekt på lungefunktionen, så vi skal efterfølgende huske at checke, om denne linearitet ser fornuftig ud. (a) Ser effekten af røg-eksposition ud til at afhænge af alder? Vi starter ud med at inkludere interaktionen mellem eksposition og alder, da der netop bliver spurgt til denne. Vi bruger Analyze/General Linear Model/Univariate, hvor vi sætter lungefkt i Dependent Variable, alder i Covariate og expo i Fixed Factor(s). Under Model afkrydses Custom, og begge variable føres over som Main effects. Derefter markeres de begge og føres over som Interaction. Vi skal desuden ind under Options, hvor vi afkrydser Parameter estimates. Lidt modelkontrolplots kan også fås under Options ved at afkrydse Residual Plots, men det bliver ikke særligt kønt og er desuden utilstrækkeligt. For at få fuld kontrol over modelkontrollen, anvender vi i stedet Save-knappen, og krydser det af, vi gerne vil bruge, f.eks. Unstandardized Predicted Values og Unstandardized Residuals, 8

9 men evt. også Standardized Residuals og/eller Cook s distance: Vores output bliver: Det ser altså kraftigt ud til, at effekten af røg-eksposition afhænger af alder, idet interaktionen er signifikant (P=0.003). Man kan også udtrykke det ved at der er forskellig afhængighed af alder i de to grupper, hvilket også ses af figuren nedenfor, som er lavet ved først at tegne et scatter plot i Graph/Chart Builder, hvor man vælger Scatter plot (nr. 2 fra venstre), og i den fremkomne boks trækker man lungefkt over på Y-aksen, alder over på X-aksen og expo over i Set Color. 9

10 For at tegne linierne dobbeltklikker man efterfølgende på grafen og klikker på ikonet Add Fit Line at Subgroups og derefter i Properties-boksen afkrydse Linear og klikke Apply. Faktisk er alderseffekten dobbelt så stor for de ueksponerede sammenlignet med de eksponerede (for de eksponerede er estimatet 0.14, og forskellen estimeres til 0.15). Bemærk dog, at da de eksponerede alle er blandt de ældste, kunne denne interaktion også skyldes, at lungefunktionen har en tendens til at flade ud som funktion af alder (der er jo grænser for, hvor meget den kan blive ved med at stige). Og den røde regressionslinie er noget misvisende, fordi den først burde starte ved 9-års alderen. Og nu til den semi-automatiske modelkontrol, lavet ud fra Optionsknappen: 10

11 Kvaliteten af denne er rigtig dårlig, og det eneste, vi kan se (fra den midterste figur forneden) er, at der er tendens til trompetfacon. Da vi have gemt residualer og predikterede værdier ved opsætning af analysen ovenfor, kan vi imidlertid gøe det bedre selv ved at lave passende plots, f.eks. her først at reproducere det ovenfor omtalte plot af residualer mod predikterede værdier i en bedre kvalitet: samt at tegne residualer op mod kovariaten alder for at checke lineariteten. Vi hjælper det visuelle indtryk ved at lægge en loesskurve ind oveni: 11

12 Endvidere checker vi normalfordelingsantagelsen ved at tegne histogram af residualerne: Vi er ikke helt tilfredse med modelkontrollen... (b) Er det nødvendigt/nyttigt at transformere lungefunktionen for at få en god model? Det er ikke fordi modelkontrollen ser rigtig grim ud: Linearitetsantagelsen for alder ser ret fornuftig ud, og residualerne ser perfekt normalfordelte ud. Det er kun spredningen, der synes at stige med niveauet af de predikterede værdier, hvilket ses først af den emiautomatiske modelkontrol, og dernæst af den lidt pænere figur af residualer mod predikterede værdier. Det ses måske lidt tydeligere i den ekstra modelkontrol nedenfor, hvor kvadratroden af de numeriske standardiserede residualer er tegnet op mod de predikterede værdier. 12

13 Denne sidste modelkontroltegning er lavet ved at bygge videre på de gemte residualer ved at transformere dem således i Transform/Compute Variable: sqrtres = SQRT(ABS(ZRE_1))) Når vi tegner disse transformerede residualer op mod de predikterede værdier, får vi Ser man her bort fra de yderste ender af figuren (hvor der ikke er så mange observationer), ses en vis positiv trend, således at spredningen er større svarende til de høje predikterede værdier. Vi prøver derfor at logaritmere lungefunktionen (her er benyttet en 10-tals logaritme, og den nye variabel kaldes loglungefkt). loglungefkt = LG10(lungefkt) Ved den tilsvarende analyse med dette logaritmerede outcome, finder vi 13

14 og modelkontrollen for denne analyse ses nedenfor: 14

15 Vi har nok nu lidt bedre varianshomogenitet, men til gengæld en anelse skævhed i residualernes fordeling. Det er svært på denne baggrund at foretrække den ene analyse for den anden, og begge synes rimelige. For de logaritmerede data får vi følgende figur til illustration af modellen: og under alle omstændigheder er konklusionen angående interaktionen mellem eksposition og alder fortsat den samme. Der ses en signifikant interaktion (P=0.001), og hældningen for de uek- 15

16 sponerede er igen ca. det dobbelte af den for de røg-eksponerede. (c) Hvad er den estimerede lungefunktion for ikke-eksponerede 14- årige drenge? Er det usædvanligt at støde på en sådan 14-årig dreng med et lungefunktionsmål på 3 l? Her må vi benytte tricket med at fratrække 14 fra alderen, så vi definerer alder14=alder-14. For at få de ueksponerede som reference, er vi endvidere nødt til at bytte om på rækkefølgen af disse ved at definere unexpo=1-expo, og får så outputtet, først for det utransformerede outcome: der direkte viser, at den estimerede lungefunktion for 14-årige drenge er liter, med CI=(3.858, 4.097) liter. Hvis vi i stedet benytter analysen af de logaritmerede værdier, skal vi huske at tilbagetransformere de tilsvarende resultater: 16

17 og vi skal så udregne = 4.04, samt de tilsvarende konfidensintervaller: = 3.87 hhv = Vi opdeler derfor resultatet, afhængigt af, om vi har logaritmetransformeret eller ej, og finder den estimerede lungefunktion for 14- årige drenge til: Uden logaritmetransformation: 3.98 liter, CI=(3.86, 4.10) liter Med logaritmetransformation: 4.04 liter, CI=(3.87, 4.22) liter og vi bemærker, at disse to kvantificeringer er i ret god overensstemmelse. Når vi skal svare på noget, der vedrører en enkelt dreng, skal vi imidlertid ikke se på konfidensintervaller, men på prediktionsintervaller, og dertil skal vi benytte spredningen omkring regressionslinierne, altså Standard Error of the Estimate. Denne er imidlertid ikke så let at få fat i, da kun kvadratet på den fremgår af udskrifterne, under overskriften Tests of Between-Subjects Effects, rækken Error og søjen Mean Square. Her står der for 17

18 den utransformerede analyse tallet (men ved at dobbeltklikke på det, kan man få oplyst flere decimaler, så den bliver ), og man skal så tage kvadratroden af denne, hvilket giver = Tilsvarende gør vi for analysen, hvor outcome er logaritmeret, og finder så = Vi finder derfor prediktionsintervallerne til: Uden logaritmetransformation: 3.98 ± = (2.82, 5.14) liter Med logaritmetransformation, før tilbagetransformation: ± = (0.426, 0.786) Og efter tilbagetransformation: ( , ) = (2.67, 6.11) liter Bemærk den noget større diskrepans mellem disse to prediktionsintervaller (normalområder), som skyldes, at spredningen antages at være større for de ældste, når vi ser på logaritmerede outcomes. Som man kan se, er 3 liter ret lavt for 14-årige drenge, men dog ikke ekstremt lavt, da det ligger indenfor normalområdet. (d) Hvor stor en effekt af røg-eksposition estimerer vi for 14-årige drenge? Kan røg-eksposition tænkes at medføre en 20% reduktion af lungefunktionen? Her aflæser vi igen fra outputtet ovenfor, først for det utransformerede outcome, hvor forskellen på de eksponerede og de ueksponerede ved alder 14 år er (altså at de eksponerede ligger liter under de ueksponerede) med CI=(-0.477, 0.031), P= For det logaritmerede outcome ses forskellen at være , som igen skal tilbagetransformeres, så vi får = Vi opdeler resultaterne efter, hvorvidt vi har transformeret eller ej: Uden logaritmetransformation: liter, CI=(-0.477, 0.031) liter, hvilket godt kunne be- 18

19 tyde en reduktion på 20% i den lave ende af skalaen (20% af f.eks. 2 liter giver en reduktion på 0.4 liter < liter. Med logaritmetransformation, i form af ratio er: 0.899, CI=(0.822, 0.984), altså en estimeret reduktion på 10.1%, men med konfidensgrænser ned til en reduktion på 17.8%, men altså ikke helt ned til en 20% reduktion. Bemærk forskelligheden i disse konklusioner, idet kun den logaritmiske analyse umiddelbart giver resultatet i procent. (e) Kunne der være flere relevante kovariater at inddrage i modellen? Det er vist almindeligt kendt, at lungefunktionen afhænger af højden, og selv om vi har justeret for alder, kan der stadig tænkes at være en yderligere effekt af højde. I hvert fald er højden relateret til alle de hidtil betragtede variable, såvel outcome (lungefunktionen) som de to kovariater (eksposition og alder), som det ses i figurerne nedenfor (et Boxplot og to loessplots): 4. Inkluder nu højde som kovariat i sammenligningen af lungefunktionen fra spørgsmål 3, og husk igen passende modelkontrol. Inden selve analysen skal vi lige have noget grafik på banen: 19

20 (a) Forsøg at lave en illustration af lungefunktionens afhængighed af alder og højde. En mulighed er her at benytte lungefunktionen til at angive størrelsen af plottesymbolet i et scatter plot af højde vs. alder, ved at benytte Graphs/Graphboard Template Choser, markere de 3 involverede variable (alder, hoejde og lungefkt) og klikke på Bubble Plot. For at bytte om på akserne, klikkes på Detailed, hvor man så kan sætte f.eks. hoejde på Y-aksen, alder på X-aksen og lungefkt på Z-aksen. Man kan også evt. vælge expo som Color: Af dette plot får man en vis fornemmelse af, at lungefunktionen afhænger af såvel alder som højde, men det er meget vanskeligt at overskue, om denne afhængighed lader sig beskrive ved hjælp af linearitet... (b) Ser effekten af røg-eksposition stadig ud til at afhænge af alder? Vi inkluderer højden som kovariat, uden at checke for interaktioner med denne, i første omgang med utransformeret outcome ved at gå tilbage i Analyze/General Linear Model/Univariate, hvor vi nu tilføjer hoejde i Covariate, samt under Model. 20

21 I lyset af, hvad der spørges om efterfølgende, har vi dog allerede lagt Y-aksen hen ved 14 år og en højde på 170 cm (nærmere forklaring følger nedenfor). Vi har således defineret en ekstra ny variabel: hoejde170 = hoejde og benytter denne i stedet for hoejde: Vi finder hermed outputtet: og vi konstaterer, at interaktionen mellem eksposition og alder nu er forsvundet (P=0.83). Men modelkontrollen giver anledning til påtale, både af manglende varianshomogenitet og også problemer med lineariteten i såvel alder som højde: 21

22 Vi prøver derfor at gentage analysen med logaritmeret lungefunktion, og finder så: med tilhørende modelkontrol 22

23 Her bemærker vi bedre tilpasning af alle modelantagelser, så det er denne model, vi vil gå videre med at fortolke. (c) Hvad er den estimerede lungefunktion for ikke-eksponerede 14- årige drenge med alderssvarende højde? Dette spørgsmål er lidt vanskeligt, fordi vi nu først må finde ud af, hvad en alderssvarende højde er. En mulighed er blot at se på en figur af højde vs. alder (den har vi set tidligere): og måske også at lave en hurtig analyse i form af en simpel lineær regression (der dog ikke virker helt rimelig pga den oplagte ikkelinearitet i plottet ovenfor). Vi benytter igen alder14 som kovariat for at få et bud på højden af 14-årige drenge. Dette er gjort ved at gå ind i menuen Analyze/Regression/Linear, og i boksen sætte hoejde som Dependent og alder14 som Independent(s), 23

24 hvorved vi får: Ud fra denne analyse kan vi se, at en 14-årig dreng estimeres til at være ca. 175 cm høj, men i lyset af tegningen ovenfor gætter vi på, at 170 cm er mere rimeligt, så derfor brugte vi i den tidligere analyse kovariaten hoejde170. I denne tidligere analyse svarede interceptet (Constant) altså til 14-årige drenge med en højde på 170 cm, og vi fandt dette til Dette skal dog også tilbagetransformeres ligesom før, så vi får = Tilsvarende får vi konfidensintervallet til ( , ) = (3.459, 3.698) Vores bedste svar er altså at angive estimatet for 14-årige drenge med en højde på 170 cm, og dette estimat er 3.58 liter, med CI=(3.46, 3.70) liter. (d) Hvor stor en effekt af røg-eksposition estimerer vi for 14-årige drenge? Dette er allerede besvaret ovenfor på linien [unexpo=,00], hvor estimatet er angivet til 0.015, som tilbagetransformeret giver ratioen = 0.965, hvilket betyder, at de røg-eksponerede estimeres til at ligge lavest, omend kun 3.5% lavere end de ueksponerede, og absolut ikke signifikant (P=0.28). Konfidensintervallet er CI=( , ) = (0.905, 1.029), svarende til, at det også kunne være 9.5% under eller måske helt op til 2.9% højere. Bemærk, at højde ikke indgår i beregningen af dette estimat, da højden ikke indgår i en interaktion med ekspositionen. Men faktisk kan vi jo reducere modellen, idet interaktionen mellem 24

25 røg-eksposition og alder slet ikke ser ud til at have nogen betydning (P=0.59). Hvis vi fjerner denne insignifikante interaktion, finder vi Vi konstaterer, at ekspositionen ikke er signifikant (P=0.24), men at den estimeres til på logaritmisk skala, med CI=(-0.044, 0.011). Det svarer til en nedsættelse af lungefunktionen med faktoren = 0.962, og CI=( , ) = (0.904, 1.026), svarende til en nedsættelse af lungefunktionen med ca. 3.8%, med konfidensgrænser fra en reduktion på 9.6% til en øgning på 2.6%. Vi kan sammenfatte alle de ovenfor fundne resultater (samt enkelte, der ikke er fundet ovenfor) i en tabel: 25

26 Ueksponerede Effekt af s 14-årige drenge eksposition Utransformeret Uden højde (3.86, 4.10) (-0.477, 0.031) Med højde (3.58, 3.78) (-0.249, 0.152) Log-transformeret Uden højde (3.87, 4.21) (0.822, 0.984) Med højde (3.46, 3.70) (0.905, 1.029) Ditto, uden interaktion (3.48, 3.70) (0.904, 1.026) : Denne model er ikke god. Bemærk, at der sker et ret stort fald i residualspredningen, når højde inddrages i modellen, idet denne har stor betydning, selv når der er korrigeret for alderen. Man bemærker også, at prediktionen af niveauet for lungefunktion falder en del, når højde inddrages, hvilket skyldes, at højden ikke er en lineær funktion af alderen. For de ældste drenge ses ingen særlig stigning i højde med alderen, og derfor predikteres lungefunktionen lavere, når denne højde tages i betragtning. 5. Vi inddrager nu pigerne i analyserne: (a) Angiv den relative risiko for røg-eksposition for piger vs. drenge. Er der signifikant forskel på kønnene i denne henseende? Nu er røg-eksposition blevet vores outcome-variabel, så vi er altså ovre i tabel -situationen, hvor kønnet skal være vores rækker i en 2x2-tabel, idet vi så skal undersøge forholdet mellem frekvenserne af eksposition for de 2 køn: 26

27 Vi bemærker, at der ikke er signifikant forskel på, hvorvidt drenge og piger er røg-eksponerede (P=0.067 for Fishers eksakte test), men at piger dog har en tendens til oftere at være eksponerede (12.3% af pigerne mod kun 7.7% af drengene). Disse procenter giver umiddelbart en relativ risiko for eksposition blandt piger i forhold til drenge på = 1.59 men dette tal finder vi ikke under Risk Estimate ovenfor, fordi 27

28 drenge kommer først i alfabetet, og vi derfor i stedet får ratioen = 0.63 I stedet for selv at invertere denne ratio (og de tilhørende konfidensgrænser), rekoder vi derfor kønnene til 1:P hhv 2:D og får så i stedet outputtet Her finder vi vores relative risiko på 1.59 og kan så aflæse konfidensintervallet til (0.99, 2.54). Vi kan altså ikke afvise, at piger har op til 2 1 gang så stor risiko for at være røg-eksponerede, men 2 de kunne også ligge lige en anelse under drengenes risiko. (b) Hvor stor er den procentvise forskel i lungefunktion for sammenlignelige piger og drenge? Nu begynder det at blive en anelse tricky... En ting er, at vi skal inkludere gender som ekstra kovariat, men hvad betyder overhovedet sammenlignelige drenge og piger? Hvis de er lige gamle, er de næppe lige høje... Hvis vi optegner højden som funktion af alderen for pigerne alene ses det, at 14-årige piger snarere er 160 cm høje, altså 10 cm kortere end drenge på samme alder. 28

29 Når vi så skal finde forskellen på drenge og piger i 14-års alderen, kan vi således anskue det på 2 måder: i. Effekten, der udelukkende skyldes kønnet, hvilket indebærer, at vi sammenligner drenge og piger, der er lige gamle og lige høje. Dette vil være det direkte estimat for gender i modellen, da der ikke er nogen interaktioner med kønnet. Nedenfor ses disse analyser for det logaritmetransformerede outcome, og estimatet ses at være 0.013, med CI=(0.003, 0.023). Når dette tilbagetransformeres, får vi = og CI=( , ) = (1.007, 1.054) svarende til 3% øget lungefunktion hos drenge, med konfidensinterval fra 0.7% øgning og op til 5.4% øgning. 29

30 ii. Forskellen på drenge og piger, der er lige gamle, men med alderssvarende højde, hvilket vil sige, at pigerne er ca 10 cm lavere end drengene. For at finde dette estimat, skal vi lægge effekten af 10 cm i højden til det direkte kønsestimat. Vi kan gøre dette direkte ud fra outputtet og finder så = 0.083, og når vi tilbagetransformerer dette, får vi = Men hvordan får vi nu konfidensgrænser på dette estimat? Det er svært!! Vi kan lave et trick, og definere en meget mystisk kovariat (kaldet hoejde14), således: For drenge: hoejde-170 For piger: hoejde-160 Det er lidt indviklet at definere denne, idet man i Transform/Compute Variable skal gøre det ad to omgange, idet man begge gange afkrydser if for neden i feltet og under Include if case satisfies condition skriver hhv. gender= D og gender= P. Med denne nye højde-kovariat, får vi outputtet: 30

31 Vi tilbagetransformerer kønseffekten, med tilhørende konfidensinterval til = 1.219, CI=( , ) = (1.191, 1.247) Vi må altså konkludere, at den rene kønseffekt (forskel på drenge og piger, der er lige gamle og lige høje, er en 3% højere lungefunktion hos drengene, CI=(+0.6%, +5.4%), men at sammenligningen af lige gamle drenge og piger med alderssvarende højde giver, at drenge ligger hele 21.9% over pigerne, CI=(+19.1%, +24.7%). Og her har vi afstået fra yderligere modelkontrol... Reference: I. Tager and S. Weiss and B. Rosner and F. Speizer (1979). Effect of Parental Cigarette Smoking on the Pulmonary Function of Children. American Journal of Epidemiology. 110:

Basal Statistik - SPSS

Basal Statistik - SPSS Faculty of Health Sciences Basal Statistik - SPSS Kovariansanalyse. Lene Theil Skovgaard 3. oktober 2017 1 / 12 APPENDIX med instruktioner til SPSS-analyse svarende til nogle af slides Bland-Altman plot,

Læs mere

Basal Statistik - SPSS

Basal Statistik - SPSS Faculty of Health Sciences Basal Statistik - SPSS Kovariansanalyse. Lene Theil Skovgaard 1. oktober 2018 1 / 12 APPENDIX med instruktioner til SPSS-analyse svarende til nogle af slides Bland-Altman plot,

Læs mere

Basal Statistik - SPSS

Basal Statistik - SPSS Faculty of Health Sciences Basal Statistik - SPSS Multipel regression. Lene Theil Skovgaard 10. oktober 2017 1 / 12 APPENDIX med instruktioner til SPSS-analyse svarende til nogle af slides Figurer: s.

Læs mere

Basal Statistik - SPSS

Basal Statistik - SPSS Faculty of Health Sciences APPENDIX med instruktioner til SPSS-analyse svarende til nogle af slides Basal Statistik - SPSS Den generelle lineære model. Lene Theil Skovgaard 24. oktober 2017 Biokemisk iltforbrug,

Læs mere

Basal Statistik - SPSS

Basal Statistik - SPSS Faculty of Health Sciences Basal Statistik - SPSS Den generelle lineære model. Lene Theil Skovgaard 26. februar 2018 1 / 28 APPENDIX med instruktioner til SPSS-analyse svarende til nogle af slides Biokemisk

Læs mere

Vejledende besvarelse af hjemmeopgave, efterår 2018

Vejledende besvarelse af hjemmeopgave, efterår 2018 Vejledende besvarelse af hjemmeopgave, efterår 2018 Udleveret 1. oktober, afleveres senest ved øvelserne i uge 44 (30. oktober.-1. november). Der er foretaget en del undersøgelser af krigsveteraner og

Læs mere

Vejledende besvarelse af hjemmeopgave, forår 2018

Vejledende besvarelse af hjemmeopgave, forår 2018 Vejledende besvarelse af hjemmeopgave, forår 2018 Udleveret 12. februar, afleveres senest ved øvelserne i uge 10 (6.-9.marts) I forbindelse med reagensglasbehandling blev 100 par randomiseret til to forskellige

Læs mere

Basal Statistik - SPSS

Basal Statistik - SPSS Faculty of Health Sciences Basal Statistik - SPSS Regressionsanalyse. Lene Theil Skovgaard 5. februar 2018 1 / 12 APPENDIX med instruktioner til SPSS-analyse svarende til nogle af slides Indlæsning og

Læs mere

Faculty of Health Sciences. Basal Statistik. Logistisk regression mm. Lene Theil Skovgaard. 5. marts 2018

Faculty of Health Sciences. Basal Statistik. Logistisk regression mm. Lene Theil Skovgaard. 5. marts 2018 Faculty of Health Sciences Basal Statistik Logistisk regression mm. Lene Theil Skovgaard 5. marts 2018 1 / 22 APPENDIX vedr. SPSS svarende til diverse slides: To-gange-to tabeller, s. 3 Plot af binære

Læs mere

SPSS appendix SPSS APPENDIX. Box plots. Indlæsning. Faculty of Health Sciences. Basal Statistik: Sammenligning af grupper, Variansanalyse

SPSS appendix SPSS APPENDIX. Box plots. Indlæsning. Faculty of Health Sciences. Basal Statistik: Sammenligning af grupper, Variansanalyse Faculty of Health Sciences SPSS APPENDIX SPSS appendix Basal Statistik: Sammenligning af grupper, Variansanalyse Lene Theil Skovgaard 12. september 2017 med instruktioner til SPSS-analyse svarende til

Læs mere

Faculty of Health Sciences. SPSS appendix. Basal Statistik: Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 22.

Faculty of Health Sciences. SPSS appendix. Basal Statistik: Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 22. Faculty of Health Sciences SPSS appendix Basal Statistik: Sammenligning af grupper, Variansanalyse Lene Theil Skovgaard 22. januar 2018 1 / 20 SPSS APPENDIX med instruktioner til SPSS-analyse svarende

Læs mere

SPSS appendix SPSS APPENDIX. Box plots. Indlæsning. Faculty of Health Sciences. Basal Statistik: Sammenligning af grupper, Variansanalyse

SPSS appendix SPSS APPENDIX. Box plots. Indlæsning. Faculty of Health Sciences. Basal Statistik: Sammenligning af grupper, Variansanalyse Faculty of Health Sciences SPSS APPENDIX SPSS appendix Basal Statistik: Sammenligning af grupper, Variansanalyse Lene Theil Skovgaard 11. februar 2019 med instruktioner til SPSS-analyse svarende til nogle

Læs mere

Besvarelse af opgave om Vital Capacity

Besvarelse af opgave om Vital Capacity Besvarelse af opgave om Vital Capacity I filen cadmium.txt ligger observationer fra et eksempel omhandlende lungefunktionen hos arbejdere i cadmium industrien (hentet fra P. Armitage & G. Berry: Statistical

Læs mere

Basal Statistik - SPSS

Basal Statistik - SPSS Faculty of Health Sciences Basal Statistik - SPSS Korrelerede målinger. Lene Theil Skovgaard 8. april 2019 1 / 21 APPENDIX med instruktioner til SPSS-analyse svarende til nogle af slides Plots: s. 3, 4,

Læs mere

Basal Statistik - SPSS

Basal Statistik - SPSS Faculty of Health Sciences APPENDIX Basal Statistik - SPSS Korrelerede målinger. Lene Theil Skovgaard 8. april 2019 med instruktioner til SPSS-analyse svarende til nogle af slides Plots: s. 3, 4, 7, 11-12

Læs mere

Vejledende besvarelse af hjemmeopgave, forår 2017

Vejledende besvarelse af hjemmeopgave, forår 2017 Vejledende besvarelse af hjemmeopgave, forår 2017 På hjemmesiden http://publicifsv.sund.ku.dk/~lts/basal17_1/hjemmeopgave/hjemmeopgave.txt ligger data fra 400 fødende kvinder. Der er tale om et uddrag

Læs mere

Basal Statistik - SPSS

Basal Statistik - SPSS Faculty of Health Sciences Basal Statistik - SPSS Begreber. Parrede sammenligninger. Lene Theil Skovgaard 5. september 2017 1 / 16 APPENDIX med instruktioner til SPSS-analyse svarende til nogle af slides

Læs mere

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger Øvelser til basalkursus, 5. uge Opgavebesvarelse: Knogledensitet hos unge piger I alt 112 piger har fået målt knogledensitet (bone mineral density, bmd) i 11-års alderen (baseline værdi). Pigerne er herefter

Læs mere

Opgavebesvarelse, brain weight

Opgavebesvarelse, brain weight Opgavebesvarelse, brain weight (Matthews & Farewell: Using and Understanding Medical Statistics, 2nd. ed.) For 20 musekuld er der i tabellen nedenfor anført oplysning om kuldstørrelsen (fra 3 til 12 mus

Læs mere

Vejledende besvarelse af hjemmeopgave, efterår 2017

Vejledende besvarelse af hjemmeopgave, efterår 2017 Vejledende besvarelse af hjemmeopgave, efterår 2017 Udleveret 3. oktober 2017, afleveres senest ved øvelserne i uge 44 (31. okt.-2. nov. 2017) På hjemmesiden http://publicifsv.sund.ku.dk/~lts/basal17_2/hjemmeopgave/hjemmeopgave.txt

Læs mere

Vi ønsker at konstruere normalområder for stofskiftet, som funktion af kropsvægten.

Vi ønsker at konstruere normalområder for stofskiftet, som funktion af kropsvægten. Opgavebesvarelse, Resting metabolic rate I filen T:\rmr.txt findes sammenhørende værdier af kropsvægt (bw, i kg) og hvilende stofskifte (rmr, kcal pr. døgn) for 44 kvinder (Altman, 1991 og Owen et.al.,

Læs mere

Basal statistik for sundhedsvidenskabelige forskere, efterår 2014 Udleveret 30. september, afleveres senest ved øvelserne i uge 44 (

Basal statistik for sundhedsvidenskabelige forskere, efterår 2014 Udleveret 30. september, afleveres senest ved øvelserne i uge 44 ( Hjemmeopgave Basal statistik for sundhedsvidenskabelige forskere, efterår 2014 Udleveret 30. september, afleveres senest ved øvelserne i uge 44 (28.-30. oktober) En stor undersøgelse søger at afdække forhold

Læs mere

Filen indeholder 45 linier, først en linie med variabelnavnene (bw og rmr) og derefter 44 datalinier, hver med disse to oplysninger.

Filen indeholder 45 linier, først en linie med variabelnavnene (bw og rmr) og derefter 44 datalinier, hver med disse to oplysninger. Opgavebesvarelse, Resting metabolic rate I filen rmr.txt findes sammenhørende værdier af kropsvægt (bw, i kg) og hvilende stofskifte (rmr, kcal pr. døgn) for 44 kvinder (Altman, 1991 og Owen et.al., Am.

Læs mere

Basal statistik for lægevidenskabelige forskere, forår 2012 Udleveret 6.marts, afleveres senest ved øvelserne i uge 15 (

Basal statistik for lægevidenskabelige forskere, forår 2012 Udleveret 6.marts, afleveres senest ved øvelserne i uge 15 ( Hjemmeopgave Basal statistik for lægevidenskabelige forskere, forår 2012 Udleveret 6.marts, afleveres senest ved øvelserne i uge 15 (10.-12. april) I et randomiseret forsøg sammenlignes vitamin D behandling

Læs mere

Opgavebesvarelse, korrelerede målinger

Opgavebesvarelse, korrelerede målinger Opgavebesvarelse, korrelerede målinger I 18 familier bestående af far, mor og 3 børn (i veldefinerede aldersintervaller, med child1 som det ældste barn og child3 som det yngste) har man registreret antallet

Læs mere

Kommentarer til øvelser i basalkursus, 2. uge

Kommentarer til øvelser i basalkursus, 2. uge Kommentarer til øvelser i basalkursus, 2. uge Opgave 2. Vi betragter målinger af hjertevægt (i g) og total kropsvægt (målt i kg) for 10 normale mænd og 11 mænd med hjertesvigt. Målingerne er taget ved

Læs mere

Faculty of Health Sciences. Basal Statistik. Overlevelsesanalyse. Lene Theil Skovgaard. 12. marts 2018

Faculty of Health Sciences. Basal Statistik. Overlevelsesanalyse. Lene Theil Skovgaard. 12. marts 2018 Faculty of Health Sciences Basal Statistik Overlevelsesanalyse Lene Theil Skovgaard 12. marts 2018 1 / 12 APPENDIX vedr. SPSS svarende til diverse slides: Kaplan-Meier kurver, s. 3 Kumulerede incidenser

Læs mere

Phd-kursus i Basal Statistik, Opgaver til 2. uge

Phd-kursus i Basal Statistik, Opgaver til 2. uge Phd-kursus i Basal Statistik, Opgaver til 2. uge Opgave 1: Sædkvalitet Filen oeko.sav på hjemmesiden indeholder datamateriale til belysning af forskellen i sædkvalitet mellem SAS-ansatte og mænd, der lever

Læs mere

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17 nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse

Læs mere

Generelle lineære modeller

Generelle lineære modeller Generelle lineære modeller Regressionsmodeller med én uafhængig intervalskala variabel: Y en eller flere uafhængige variable: X 1,..,X k Den betingede fordeling af Y givet X 1,..,X k antages at være normal

Læs mere

Basal statistik for lægevidenskabelige forskere, forår Udleveret 12. februar, afleveres senest ved øvelserne i uge 10 (6.-9.

Basal statistik for lægevidenskabelige forskere, forår Udleveret 12. februar, afleveres senest ved øvelserne i uge 10 (6.-9. Hjemmeopgave Basal statistik for lægevidenskabelige forskere, forår 2018 Udleveret 12. februar, afleveres senest ved øvelserne i uge 10 (6.-9.marts) I forbindelse med reagensglasbehandling blev 100 par

Læs mere

Basal statistik for lægevidenskabelige forskere, forår Udleveret 12. marts, afleveres senest ved øvelserne i uge 14 (2.-4.

Basal statistik for lægevidenskabelige forskere, forår Udleveret 12. marts, afleveres senest ved øvelserne i uge 14 (2.-4. Hjemmeopgave Basal statistik for lægevidenskabelige forskere, forår 2013 Udleveret 12. marts, afleveres senest ved øvelserne i uge 14 (2.-4.april) I forbindelse med reagensglasbehandling blev 100 par randomiseret

Læs mere

Besvarelse af juul2 -opgaven

Besvarelse af juul2 -opgaven Besvarelse af juul2 -opgaven Spørgsmål 1 Indlæs data Dette gøres fra Analyst med File/Open, som sædvanlig. Spørgsmål 2 Lav regressionsanalyser for hvert køn af igf1 vs. alder for præpubertale (Tanner stadium

Læs mere

Basal statistik for sundhedsvidenskabelige forskere, efterår 2015 Udleveret 29. september, afleveres senest ved øvelserne i uge 44 (27.-30.

Basal statistik for sundhedsvidenskabelige forskere, efterår 2015 Udleveret 29. september, afleveres senest ved øvelserne i uge 44 (27.-30. Hjemmeopgave Basal statistik for sundhedsvidenskabelige forskere, efterår 2015 Udleveret 29. september, afleveres senest ved øvelserne i uge 44 (27.-30. oktober) En undersøgelse blandt fødende kvinder

Læs mere

Multipel Lineær Regression

Multipel Lineær Regression Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer

Læs mere

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Afdeling for Biostatistik Bo Martin Bibby 23. november 2006 Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Vi betragter 4699 personer fra Framingham-studiet. Der er oplysninger om follow-up

Læs mere

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl Reeksamen 2018 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 13-08-2018 Tid: kl. 09.00-11.00 Bedømmelsesform

Læs mere

Besvarelse af vitcap -opgaven

Besvarelse af vitcap -opgaven Besvarelse af -opgaven Spørgsmål 1 Indlæs data Dette gøres fra Analyst med File/Open, som sædvanlig. Spørgsmål 2 Beskriv fordelingen af vital capacity og i de 3 grupper ved hjælp af summary statistics.

Læs mere

Løsning til øvelsesopgaver dag 4 spg 5-9

Løsning til øvelsesopgaver dag 4 spg 5-9 Løsning til øvelsesopgaver dag 4 spg 5-9 5: Den multiple model Vi tilføjer nu yderligere to variable til vores model : Køn og kolesterol SBP = a + b*age + c*chol + d*mand hvor mand er 1 for mænd, 0 for

Læs mere

Vejledende besvarelse af hjemmeopgave, efterår 2016

Vejledende besvarelse af hjemmeopgave, efterår 2016 Vejledende besvarelse af hjemmeopgave, efterår 2016 Udleveret 4. oktober, afleveres senest ved øvelserne i uge 44 (1.-4. november) Normal aktivitet af enzymet plasma kolinesterase er en forudsætning for

Læs mere

Løsning til opgave i logistisk regression

Løsning til opgave i logistisk regression Løsning til øvelser i logistisk regression, november 2008 1 Løsning til opgave i logistisk regression 1. Først indlæses data, og vi kan lige sørge for at danne en dummy-variable for cml, som indikator

Læs mere

Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013

Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013 Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013 I forbindelse med reagensglasbehandling blev 100 par randomiseret til to forskellige former for hormonstimulation.

Læs mere

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering Eksamen 2016 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 17-02-2015 Tid: kl. 09.00-11.00 Bedømmelsesform

Læs mere

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Eksamensopgave E05 Socialklasse og kronisk sygdom Data: Tværsnitsundersøgelse fra 1986 Datamaterialet indeholder: Køn, alder, Højest opnåede

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Anvendt Statistik Lektion 7. Simpel Lineær Regression Anvendt Statistik Lektion 7 Simpel Lineær Regression 1 Er der en sammenhæng? Plot af mordraten () mod fattigdomsraten (): Scatterplot Afhænger mordraten af fattigdomsraten? 2 Scatterplot Et scatterplot

Læs mere

Opgavebesvarelse, Basalkursus, uge 3

Opgavebesvarelse, Basalkursus, uge 3 Opgavebesvarelse, Basalkursus, uge 3 Opgave 1: Udskrivning af astma patienter (DGA s. 273) I en randomiseret undersøgelse foretaget af Storr et. al. (Lancet, i, 1987) sammenlignes effekten af en enkelt

Læs mere

Opgavebesvarelse, Basalkursus, uge 3

Opgavebesvarelse, Basalkursus, uge 3 Opgavebesvarelse, Basalkursus, uge 3 Opgave 1: Udskrivning af astma patienter (DGA s. 273) I en randomiseret undersøgelse foretaget af Storr et. al. (Lancet, i, 1987) sammenlignes effekten af en enkelt

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Vejledende besvarelse af hjemmeopgave, forår 2018

Vejledende besvarelse af hjemmeopgave, forår 2018 Vejledende besvarelse af hjemmeopgave, forår 2018 Udleveret 12. februar, afleveres senest ved øvelserne i uge 10 (6.-9.marts) I forbindelse med reagensglasbehandling blev 100 par randomiseret til to forskellige

Læs mere

Hjemmeopgave. I bedes benytte sidste side fra denne opgavetekst i udfyldt stand som forside på jeres opgavebesvarelse. Siden findes også på nettet.

Hjemmeopgave. I bedes benytte sidste side fra denne opgavetekst i udfyldt stand som forside på jeres opgavebesvarelse. Siden findes også på nettet. Hjemmeopgave Basal statistik for sundhedsvidenskabelige forskere, efterår 2012 Udleveret 2. oktober, afleveres senest ved øvelserne i uge 44 (30. oktober-1. november) I Secher et al. (1986) estimeres referencekurver

Læs mere

Basal statistik for lægevidenskabelige forskere, forår 2014 Udleveret 4. marts, afleveres senest ved øvelserne i uge 13 (25.

Basal statistik for lægevidenskabelige forskere, forår 2014 Udleveret 4. marts, afleveres senest ved øvelserne i uge 13 (25. Hjemmeopgave Basal statistik for lægevidenskabelige forskere, forår 2014 Udleveret 4. marts, afleveres senest ved øvelserne i uge 13 (25.-27 marts) Garvey et al. interesserer sig for sammenhængen mellem

Læs mere

Vi vil analysere effekten af rygning og alkohol på chancen for at blive gravid ved at benytte forskellige Cox regressions modeller.

Vi vil analysere effekten af rygning og alkohol på chancen for at blive gravid ved at benytte forskellige Cox regressions modeller. Løsning til øvelse i TTP dag 3 Denne øvelse omhandler tid til graviditet. Et studie vedrørende tid til graviditet (Time To Pregnancy = TTP) inkluderede 423 par i alderen 20-35 år. Parrene blev fulgt i

Læs mere

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet Eksamen ved Københavns Universitet i Kvantitative forskningsmetoder Det Samfundsvidenskabelige Fakultet 14. december 2011 Eksamensnummer: 5 14. december 2011 Side 1 af 6 1) Af boxplottet kan man aflæse,

Læs mere

Phd-kursus i Basal Statistik, Opgaver til 1. uge

Phd-kursus i Basal Statistik, Opgaver til 1. uge Phd-kursus i Basal Statistik, Opgaver til 1. uge Opgave 1: Wright For 17 patienter er der målt peak expiratory flow rate (maksimal udåndingshastighed, i l/min) på to forskellige måder, dels ved at anvende

Læs mere

Opgavebesvarelse, brain weight

Opgavebesvarelse, brain weight Opgavebesvarelse, brain weight (Matthews & Farewell: Using and Understanding Medical Statistics, 2nd. ed.) Spørgsmål 1 Data er indlagt på T:/Basalstatistik/brain.txt og kan indlæses direkte i Analyst med

Læs mere

Vejledende besvarelse af hjemmeopgave i Basal Statistik, forår 2014

Vejledende besvarelse af hjemmeopgave i Basal Statistik, forår 2014 Vejledende besvarelse af hjemmeopgave i Basal Statistik, forår 2014 Garvey et al. interesserer sig for sammenhængen mellem anæstesi og allergiske reaktioner (se f.eks. nedenstående reference, der dog ikke

Læs mere

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper.

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper. 1. Indlæs data. * HUSK at angive din egen placering af filen; data framing; infile '/home/sro00/mph2016/framing.txt' firstobs=2; input id sex age frw sbp sbp10 dbp chol cig chd yrschd death yrsdth cause;

Læs mere

Lineær og logistisk regression

Lineær og logistisk regression Faculty of Health Sciences Lineær og logistisk regression Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Dagens program Lineær regression

Læs mere

6. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag)

6. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag) Institut for Folkesundhed Afdeling for Biostatistik Afdeling for Epidemiologi. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag) Opgave 1 Udgangspunktet for de følgende spørgsmål er artiklen:

Læs mere

Faculty of Health Sciences. Logistisk regression: Kvantitative forklarende variable

Faculty of Health Sciences. Logistisk regression: Kvantitative forklarende variable Faculty of Health Sciences Logistisk regression: Kvantitative forklarende variable Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Sammenhæng

Læs mere

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Institut for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression Regressionsanalyse Regressionsanalyser

Læs mere

Udleveret 1. oktober, afleveres senest ved øvelserne i uge 44 (29. oktober-1. november)

Udleveret 1. oktober, afleveres senest ved øvelserne i uge 44 (29. oktober-1. november) Hjemmeopgave Basal statistik, efterår 2013 Udleveret 1. oktober, afleveres senest ved øvelserne i uge 44 (29. oktober-1. november) I forbindelse med en undersøgelse af vitamin D status i Europa, har man

Læs mere

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger Øvelser til basalkursus, 5. uge Opgavebesvarelse: Knogledensitet hos unge piger I alt 112 piger har fået målt knogledensitet (bone mineral density, bmd) i 11-års alderen (baseline værdi). Pigerne er herefter

Læs mere

Hjemmeopgave, efterår 2009

Hjemmeopgave, efterår 2009 Hjemmeopgave, efterår 2009 Basal statistik for sundhedsvidenskabelige forskere Udleveret 29. september, afleveres senest ved øvelserne i uge 44 (27.-29. oktober) I alt 112 piger har fået målt bone mineral

Læs mere

Opgavebesvarelse, brain weight

Opgavebesvarelse, brain weight Opgavebesvarelse, brain weight (Matthews & Farewell: Using and Understanding Medical Statistics, 2nd. ed.) For 20 nyfødte mus er der i tabellen nedenfor anført oplysning om kuldstørrelsen (fra 3 til 12

Læs mere

Modelkontrol i Faktor Modeller

Modelkontrol i Faktor Modeller Modelkontrol i Faktor Modeller Julie Lyng Forman Københavns Universitet Afdeling for Anvendt Matematik og Statistik Statistik for Biokemikere 2003 For at konklusionerne på en ensidet, flersidet eller hierarkisk

Læs mere

Opgave 1: Graft vs. Host disease

Opgave 1: Graft vs. Host disease Opgave 1: Graft vs. Host disease Denne opgave er baseret på opgave 12.3 fra DG Altman, p. 361. Data omhandler knoglemarvstransplantation af 37 leukæmipatienter, og outcome er forekomst af graft versus

Læs mere

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger Øvelser til basalkursus, 5. uge Opgavebesvarelse: Knogledensitet hos unge piger I alt 112 piger har fået målt knogledensitet (bone mineral density, bmd) i 11-års alderen (baseline værdi). Pigerne er herefter

Læs mere

1 Hb SS Hb Sβ Hb SC = , (s = )

1 Hb SS Hb Sβ Hb SC = , (s = ) PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.

Læs mere

Basal Statistik. Simpel lineær regression. Simpel lineær regression. Data. Faculty of Health Sciences

Basal Statistik. Simpel lineær regression. Simpel lineær regression. Data. Faculty of Health Sciences Faculty of Health Sciences Simpel lineær regression Basal Statistik Regressionsanalyse. Lene Theil Skovgaard 21. februar 2017 Regression og korrelation Simpel lineær regression Todimensionale normalfordelinger

Læs mere

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller Type I og type II fejl Type I fejl: forkast når hypotese sand. α = signifikansniveau= P(type I fejl) Program (8.15-10): Hvis vi forkaster når Z < 2.58 eller Z > 2.58 er α = P(Z < 2.58) + P(Z > 2.58) =

Læs mere

Filen indeholder 45 linier, først en linie med variabelnavnene (bw og rmr) og derefter 44 datalinier, hver med disse to oplysninger.

Filen indeholder 45 linier, først en linie med variabelnavnene (bw og rmr) og derefter 44 datalinier, hver med disse to oplysninger. Opgavebesvarelse, Resting metabolic rate I filen rmr.txt findes sammenhørende værdier af kropsvægt (bw, i kg) og hvilende stofskifte (rmr, kcal pr. døgn) for 44 kvinder (Altman, 1991 og Owen et.al., Am.

Læs mere

Løsning til eksaminen d. 14. december 2009

Løsning til eksaminen d. 14. december 2009 DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,

Læs mere

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression Multipel Linear Regression Repetition Partiel F-test Modelsøgning Logistisk Regression Test for en eller alle parametre I jagten på en god statistisk model har vi set på følgende to hypoteser og tilhørende

Læs mere

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer.

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer. Vejledende besvarelse af hjemmeopgave Basal statistik, efterår 2008 En gruppe bestående af 45 patienter med reumatoid arthrit randomiseres til en af 6 mulige behandlinger, nemlig placebo, aspirin eller

Læs mere

Overlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere.

Overlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere. Overlevelse efter AMI Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Diabetes VF (Venticular fibrillation) WMI (Wall motion index) CHF (Cardiac Heart Failure) Køn og alder betragtes

Læs mere

Statistik Lektion 17 Multipel Lineær Regression

Statistik Lektion 17 Multipel Lineær Regression Statistik Lektion 7 Multipel Lineær Regression Polynomiel regression Ikke-lineære modeller og transformation Multi-kolinearitet Auto-korrelation og Durbin-Watson test Multipel lineær regression x,x,,x

Læs mere

Basal statistik. Logaritmer og kovariansanalyse. Nyt eksempel vedr. sammenligning af målemetoder. Scatter plot af de to metoder

Basal statistik. Logaritmer og kovariansanalyse. Nyt eksempel vedr. sammenligning af målemetoder. Scatter plot af de to metoder Faculty of Health Sciences Logaritmer og kovariansanalyse Basal statistik Logaritmer. Kovariansanalyse Lene Theil Skovgaard 29. september 2015 Parret sammenligning, målemetoder med logaritmer Tosidet variansanalyse

Læs mere

Faculty of Health Sciences. Basal statistik. Logaritmer. Kovariansanalyse. Lene Theil Skovgaard. 29. september 2015

Faculty of Health Sciences. Basal statistik. Logaritmer. Kovariansanalyse. Lene Theil Skovgaard. 29. september 2015 Faculty of Health Sciences Basal statistik Logaritmer. Kovariansanalyse Lene Theil Skovgaard 29. september 2015 1 / 84 Logaritmer og kovariansanalyse Parret sammenligning, målemetoder med logaritmer Tosidet

Læs mere

6. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag)

6. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag) Institut for Epidemiologi og Socialmedicin Institut for Biostatistik. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag) Opgave 1 Læs afsnit.1 i An Introduction to Medical Statistics, specielt

Læs mere

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april Århus 8. april 2011 Morten Frydenberg Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april Opgave 1 ( gruppe 1: sp 1-4, gruppe 5: sp 5-9 og gruppe 6: 10-14) I denne opgaveser vi på et

Læs mere

Besvarelse af opgave om Vital Capacity

Besvarelse af opgave om Vital Capacity Besvarelse af opgave om Vital Capacity I filen cadmium.txt ligger observationer fra et eksempel omhandlende lungefunktionen hos arbejdere i cadmium industrien (hentet fra P. Armitage & G. Berry: Statistical

Læs mere

Basal Statistik. Simpel lineær regression. Simpel lineær regression. Data. Faculty of Health Sciences

Basal Statistik. Simpel lineær regression. Simpel lineær regression. Data. Faculty of Health Sciences Faculty of Health Sciences Simpel lineær regression Basal Statistik Regressionsanalyse. Lene Theil Skovgaard 5. februar 2018 Regression og korrelation Simpel lineær regression Todimensionale normalfordelinger

Læs mere

Vejledende besvarelse af hjemmeopgave, efterår 2018

Vejledende besvarelse af hjemmeopgave, efterår 2018 Vejledende besvarelse af hjemmeopgave, efterår 2018 Udleveret 1. oktober, afleveres senest ved øvelserne i uge 44 (30. oktober.-1. november). Der er foretaget en del undersøgelser af krigsveteraner og

Læs mere

Faculty of Health Sciences. Basal Statistik. Regressionsanalyse. Lene Theil Skovgaard. 26. september 2017

Faculty of Health Sciences. Basal Statistik. Regressionsanalyse. Lene Theil Skovgaard. 26. september 2017 Faculty of Health Sciences Basal Statistik Regressionsanalyse. Lene Theil Skovgaard 26. september 2017 1 / 85 Simpel lineær regression Regression og korrelation Simpel lineær regression Todimensionale

Læs mere

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større

Læs mere

Vejledende besvarelse af hjemmeopgave, efterår 2018

Vejledende besvarelse af hjemmeopgave, efterår 2018 Vejledende besvarelse af hjemmeopgave, efterår 2018 Udleveret 1. oktober, afleveres senest ved øvelserne i uge 44 (30. oktober.-1. november). Der er foretaget en del undersøgelser af krigsveteraner og

Læs mere

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ Indhold 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) 2 1.1 Variation indenfor og mellem grupper.......................... 2 1.2 F-test for ingen

Læs mere

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse . september 5 Epidemiologi og biostatistik. Forelæsning Uge, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression

Læs mere

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Normalfordelingen. Statistik og Sandsynlighedsregning 2 Normalfordelingen Statistik og Sandsynlighedsregning 2 Repetition og eksamen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige fejl på

Læs mere

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk Eksempel: Systolisk blodtryk Udgangspunkt: Vi ønsker at prædiktere det systoliske blodtryk hos en gruppe af personer. Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Afdeling for Biostatistik.

Læs mere

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

Læs mere

Vejledende besvarelse af hjemmeopgave, forår 2016

Vejledende besvarelse af hjemmeopgave, forår 2016 Vejledende besvarelse af hjemmeopgave, forår 2016 Udleveret 1. marts, afleveres senest ved øvelserne i uge 13 (29. marts-1. april) Denne opgave fokuserer på at beskrive niveauet af hormonet AMH (højt niveau

Læs mere

Basal statistik. Logaritmer og kovariansanalyse. Sammenligning af målemetoder. Scatter plot af de to metoder. Faculty of Health Sciences

Basal statistik. Logaritmer og kovariansanalyse. Sammenligning af målemetoder. Scatter plot af de to metoder. Faculty of Health Sciences Faculty of Health Sciences Logaritmer og kovariansanalyse Basal statistik Logaritmer, Repetition, Kovariansanalyse, Interaktion Lene Theil Skovgaard 1. oktober 2018 Parret sammenligning af målemetoder,

Læs mere

Faculty of Health Sciences. Basal statistik. Logaritmer, Repetition, Kovariansanalyse, Interaktion. Lene Theil Skovgaard. 1.

Faculty of Health Sciences. Basal statistik. Logaritmer, Repetition, Kovariansanalyse, Interaktion. Lene Theil Skovgaard. 1. Faculty of Health Sciences Basal statistik Logaritmer, Repetition, Kovariansanalyse, Interaktion Lene Theil Skovgaard 1. oktober 2018 1 / 92 Logaritmer og kovariansanalyse Parret sammenligning af målemetoder,

Læs mere

Opgave 11.4 side 316 (7ed: 11.4, side 352 og 6ed: 11.2, side 345)

Opgave 11.4 side 316 (7ed: 11.4, side 352 og 6ed: 11.2, side 345) Kursus 4: Besvarelser til øvelses- og hjemmeopgaver i uge 11 Opgave 11.4 side 316 (7ed: 11.4, side 35 og 6ed: 11., side 345) Opgaven består i at foretage en regressionsanalse. Først afbildes data som i

Læs mere

Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration

Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration Faculty of Life Sciences Program Modelkontrol og prædiktion Claus Ekstrøm E-mail: ekstrom@life.ku.dk Test af hypotese i ensidet variansanalyse F -tests og F -fordelingen. Multiple sammenligninger. Bonferroni-korrektion

Læs mere

Modul 11: Simpel lineær regression

Modul 11: Simpel lineær regression Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 11: Simpel lineær regression 11.1 Regression uden gentagelser............................. 1 11.1.1 Oversigt....................................

Læs mere

1 Regressionsproblemet 2

1 Regressionsproblemet 2 Indhold 1 Regressionsproblemet 2 2 Simpel lineær regression 3 2.1 Mindste kvadraters tilpasning.............................. 3 2.2 Prædiktion og residualer................................. 5 2.3 Estimation

Læs mere