Vejledende besvarelse af hjemmeopgave i Basal Statistik, forår 2014

Størrelse: px
Starte visningen fra side:

Download "Vejledende besvarelse af hjemmeopgave i Basal Statistik, forår 2014"

Transkript

1 Vejledende besvarelse af hjemmeopgave i Basal Statistik, forår 2014 Garvey et al. interesserer sig for sammenhængen mellem anæstesi og allergiske reaktioner (se f.eks. nedenstående reference, der dog ikke lige vedrører denne problemstilling). På hjemmesiden ligger oplysninger om 179 anæstesier (en pr. patient), der alle gav anledning til mistanke om en allergisk reaktion. Forslag til variabelnavne er angivet i 1. linie, og betydningen af disse er: id Personidentifikation gender Patientens køn, F (kvinde), M (mand) age Patientens alder reacclass Sværhedsgraden af den allergiske reaktion, 1: "Mild", 2: "More serious, 3: "Anafylactic shock" tryptase Den registrerede værdi af serum tryptase Opgaven er at se på patienternes reaktion, dels som den kvantitative måling af tryptase og dels som den kategoriske variabel, der beskriver reaktionens sværhedsgrad i 3 kategorier. Vi skal se på forskelle mellem mænd og kvinder samt en evt. aldersafhængighed. I det følgende vil det blive forudsat, at data (her med samtlige 179 patienter) ligger i datasættet tryptase (eller WORK.tryptase), og at variabelnavnene følger opgaveteksten. Output er adskillige steder beskåret for at fokusere på de relevante dele. 1. Tryptase vs. alder (og køn): (a) Lav en figur til illustration af tryptases afhængighed af alder. Kommenter på denne figur med henblik på at foretage en simpel lineær regression. 1

2 En simpel arbejdstegning, dog lige med forskellige symboler for mænd og kvinder, fås ved at skrive proc sgplot data=tryptase; scatter x=age y=tryptase / group=gender; run; hvorved vi får figuren Det er oplagt fra denne figur, at antagelserne for at lave lineær regression ikke er opfyldt, idet fordelingen omkring regressionslinien ikke kan undgå at blive udpræget skæv, altså absolut ikke normalfordelte residualer. Vi laver derfor en logaritmetransformation af tryptase: log_tryptase=log10(tryptase); og laver samme type plot med denne nye variabel Her ses en langt mere symmetrisk fordeling - men til gengæld synes der ikke at være nogensomhelst sammenhæng til alderen... 2

3 (b) Udfør en lineær regression af tryptase (evt. transformeret), med alder som kovariat, og foretag passende modelkontrol. Hvis denne viser tydelige tegn på problemer, må du lave en passende transformation af tryptase og udføre analysen igen. Vi har konstateret, at regressionsanalysen skal foretages med den logaritmetransformerede tryptase som outcome. Vi foretager den med diverse modelkontrol ved hjælp af ods-systemet: ods graphics on; proc glm PLOTS=(DIAGNOSTICS RESIDUALS(SMOOTH)) data=tryptase; model log_tryptase = age / solution clparm; run; ods graphics off; hvorved vi får outputtet Dependent Variable: log_tryptase Number of Observations Read 179 Number of Observations Used 179 R-Square Coeff Var Root MSE log_tryptase Mean Standard Parameter Estimate Error t Value Pr > t Intercept <.0001 age Parameter 95% Confidence Limits Intercept age Vi ser, at der findes en signifikant positiv effekt af alder (P=0.0087), og at denne estimeres til ( ) pr. år på log 10 -skala. Nu er modellen jo lidt kompliceret, fordi outcome er logaritmeret. Det betyder, at den relation, vi har fittet (for hvert køn for sig), hedder log 10 (tryptase) = α + β age tryptase = 10 α 10 β age 3 = α β age

4 hvor vi har defineret de anti-logaritmerede koefficienter α = 10 α β = 10 β Hverken α eller α har nogen interessant fortolkning (niveau ved alder 0), men β ses at svare til den faktor, som tryptasen skal ganges op med, for hvert år, man bliver ældre. (Strengt taget kan vi kun sige, at det er den faktor, som angiver forholdet mellem tryptase værdier for to personer, hvor den ene er et år ældre end den anden, men vi tillader os gerne at tro på, at den mere kausale fortolkning også gælder. Denne faktor er altså her = 1.014, altså 1.4% oveni for hvert år. Konfidensgrænserne er ( , ) = (1.004, 1.025), svarende til mellem 0.4% og 2.5%. Det tilhørende fit kommer automatisk frem: og modelkontrollen i form af både DiagnosticPanel med de 9 figurer, samt et enkelt residualplot (residualer mod kovariat), med indlagt smoother, ser ud som vist nedenfor. 4

5 Vi ser, at antagelserne svarende til en lineær regressionsanalyse synes rimelige (ingen udprægede krumme tendenser, pæn symmetri omkring nul, pæn linearitet i fraktildiagrammet, ingen tegn på trompetfacon). Hvis vi i stedet havde foretaget analysen på utransformeret skala, havde vi fået klare indikationer af problemer, som det ses i 5

6 nedenstående figur: Modelkontrol kan med lidt øvelse foretages direkte på scatterplottet af outcome overfor kovariat. Det var jo det, vi gjorde i spm. 1a ved at konstatere, at der umuligt kunne være normalte residualer, hvis tryptase var utransformeret. (c) Giv et estimat for den forventede forskel på tryptase for to individer med 10 års forskel i alder. Husk konfidensinterval! Hældningen i regressionsanalysen ovenfor (altså koefficienten til alder) angiver jo effekten af 1 års forskel i alder. Når vi i stedet skal finde effekten af 10 års forskel, er det ganske simpelt, vi skal nemlig bare gange hældningsestimatet med 10, inden vi transformerer tilbage, så vi finder effekten til en faktor = 1.15, altså 15% oveni for hvert tiår. Konfidensgrænserne er ( , ) = (1.037, 1.281), svarende til mellem 3.7% og 28.1%. (d) Fandt du en signifikant effekt af alder i denne model? Ja, P-værdien var (e) Udbyg figuren fra spørgsmål 1a ved at benytte forskellige symboler for mænd og kvinder. 6

7 Det havde vi allerede med fra starten, men det er ikke så overskuligt, om der er nogen forskel på kønnene. Måske ville det være bedre med større forskel på symbolerne... (f) Udbyg ligeledes analysen fra spørgsmål 1b til at undersøge, om effekten af alder er forskellig for mænd og kvinder. Her kunne man fristes til at lave separate analyser for mænd og kvinder, men det er egentlig ikke det, der lægges op til. Alligevel gør vi det først, og finder estimaterne Køn effekt af alder multiplikativ 10 år ekstra effekt af 10 år 10β 10 ˆβ 10 Kvinder (0.0202, ) 1.21 (1.05, 1.39) Mænd ( , ) 1.02 (0.86, 1.20) For kvinder er effekten af 10 års stigning i alder altså en øgning i tryptase værdi på 21% (med konfidensinterval fra 5-39%), medens det tilsvarende tal for mænd kun er 2% (med konfidensinterval fra et fald på 14% til en stigning på 20%). Umiddelbart synes der at være nogen forskel på de to hældningsestimater, idet hældningen er signifikant positiv for kvinder, men ikke for mænd. Der er dog et betydeligt overlap mellem de to konfidensintervaller, så vi kan ikke slutte noget konkret udfra disse separate analyser. Et test for identitet af de to hældninger udføres ved at indse, at forskel på hældningerne svarer til en interaktion mellem alder og køn. Vi inddrager altså dette i modellen: ods graphics on; proc glm PLOTS=(DIAGNOSTICS RESIDUALS(SMOOTH)) data=tryptase; class gender; model log_tryptase = gender age gender*age / solution clparm; run; ods graphics off; 7

8 Herved får vi figuren nedenfor, der viser de to estimerede linier, der jo ikke syner at være parallelle, men det tilhørende output modsiger ikke parallellitet, idet testet for interaktionsleddet ikke er signifikant (P=0.12). R-Square Coeff Var Root MSE log_tryptase Mean R-Square Coeff Var Root MSE log_tryptase Mean Source DF Type III SS Mean Square F Value Pr > F gender age age*gender Standard Parameter Estimate Error t Value Pr > t Intercept B <.0001 gender F B gender M B... age B age*gender F B age*gender M B... Parameter 95% Confidence Limits Intercept gender F gender M.. age age*gender F age*gender M.. 8

9 Vi må altså konstatere, at der ikke er nogen signifikant interaktion mellem gender og age (P=0.12), til trods for, at der (som set ovenfor) faktisk er en signifikant alderseffekt for kvinder, men ikke for mænd. Hvis vi ikke forventede en sådan forskellig alderseffekt, er det naturligt at fortsætte med en additiv model, altså en model med begge kovariater, dog uden interaktion. Modelkontrollen er ikke væsentligt anderledes end ovenfor, så den springer vi over. (g) Er der overhovedet nogen forskel på kønnene forsåvidt angår tryptase? Kvantificer med konfidensinterval. I den additive model med køn og alder som kovariat, finder vi Source DF Type III SS Mean Square F Value Pr > F age gender Standard Parameter Estimate Error t Value Pr > t Intercept B <.0001 age gender F B gender M B... Parameter 95% Confidence Limits Intercept age gender F gender M.. der viser, at der er signifikant forskel på mænd og kvinder med samme alder (P=0.011). Vi ser, at alderen lige knapt er formelt signifikant (P=0.0518), og at det alderskorrigerede estimat for forskellen mellem mænd og kvinder er (mænd minus kvinder), hvilket tilbagetransformeres til = 1.59, med et konfidensinterval på ( , ) = 9

10 (1.11, 2.26). Dette betyder, at mænd estimeres til at have et 59% højere niveau end kvinder, med 95% konfidensinterval fra 11% over til hele 126% over, altså et ganske bredt konfidensinterval, svarende til stor usikkerhed i kvantificeringen. Da alder strengt taget ikke er signifikant i modellen ovenfor, kunne man vælge at udføre sammenligningen som et T-test, men det bør man ikke gøre i praksis, dels fordi alder er så tæt på at være signifikant, samt fordi alder er så fundamentalt vigtig i mange problemstillinger, at der kræves et godt argument for at udelade den. Et sådant T-test ville her give... The TTEST Procedure Variable: log_tryptase gender N Mean Std Dev Std Err Minimum Maximum F M Diff (1-2) gender Method Mean 95% CL Mean Std Dev F M Diff (1-2) Pooled Diff (1-2) Satterthwaite Method Variances DF t Value Pr > t Pooled Equal Satterthwaite Unequal Equality of Variances Method Num DF Den DF F Value Pr > F Folded F hvoraf det ses, at det ukorrigerede estimat for forskellen mellem mænd og kvinder er (mænd minus kvinder), altså lidt større end det alderskorrigerede (fordi mændene - tilfældigvis? - i gennemsnit er noget ældre end kvinderne). Dette estimat tilbagetransformeres til = 1.74, med et konfidensinterval på ( , ) = (1.23, 2.45), svarende til, at mænd estimeres til at have et 74% højere niveau end kvinder, med 95% konfidensinterval fra 23% over til hele 145% over. 10

11 2. Nu skal vi se på graden af reaktionen, reacclass (eller, hvis I argumenterer for det, en binær version af denne): (a) Det formodes, at tryptase-værdien er forhøjet for personer med anafylaktisk chok. Kan dette bekræftes baseret på de indsamlede data? Det forventes her, at man udover en P-værdi også anfører et konfidensinterval for en passende valgt størrelse. Husk at tegne, inden I regner. Her skal vi sammenligne enten to eller 3 grupper, så vi starter med at se på et Boxplot af alle tre grupper (grader af allergisk reaktion, reacclass): Da fordelingerne ser rimeligt pæne ud (måske dog med større spredning i gruppen reacclass=3, svarende til anafylaktisk chok), fortsætter vi med at sammenligne de tre middelværdier, først blot ved hjælp af summariske størrelser (summary statistics, ved brug af proc means;) og derefter ved brug af ensidet variansanalyse. The MEANS Procedure N reacclass Obs Variable N Mean Median tryptase log_tryptase tryptase log_tryptase tryptase log_tryptase

12 The GLM Procedure Class Level Information Class Levels Values reacclass Number of Observations Read 179 Number of Observations Used 179 R-Square Coeff Var Root MSE log_tryptase Mean Source DF Type III SS Mean Square F Value Pr > F reacclass <.0001 Standard Parameter Estimate Error t Value Pr > t Intercept B <.0001 reacclass B <.0001 reacclass B <.0001 reacclass B... Parameter 95% Confidence Limits Intercept reacclass reacclass reacclass 3.. Vi ser ud fra gennemsnit og medianer, at personer med anafylaktisk chok ligger noget højere i tryptase end de to øvrige grupper (men vi skal lige huske på, at der her ikke er taget hensyn til hverken køn eller alder, det kommer først i spørgsmål 3). Den ensidede variansanalyse kvantificerer forskellene til gruppen med anafylaktisk chok (da denne er referencegruppe), således at vi ser, at de begge ligger ca. 0.5 lavere på log 10 -skala, svarende til, at tryptaseværdierne for gruppen med anafylaktisk chok er en faktor ca højere end de øvrige. Da de to grupper med mildere allergisk reaktion ligner hinanden så meget, kunne vi slå dem sammen (specielt hvis dette var specificeret som en oplagt mulighed i protokollen), ved f.eks. at indføje sætningen reacclass2=(reacclass>2); der definerer anafylaktisk chok til at være reacclass2=1, hvorimod de to andre grupper får reacclass2=0. 12

13 Igen udregner vi gennemsnit, og sammenligningen bliver til et simpelt T-test af de to resulterende grupper mod hinanden: The MEANS Procedure N reacclass2 Obs Variable N Mean Median tryptase log_tryptase tryptase log_tryptase The TTEST Procedure Variable: log_tryptase reacclass2 N Mean Std Dev Std Err Minimum Maximum Diff (1-2) reacclass2 Method Mean 95% CL Mean Std Dev Diff (1-2) Pooled Diff (1-2) Satterthwaite Method Variances DF t Value Pr > t Pooled Equal <.0001 Satterthwaite Unequal <.0001 Equality of Variances Method Num DF Den DF F Value Pr > F Folded F Af T-testet ses, at der er signifikant forskel på tryptase niveuet for de to grupper (P < ), idet gruppen med anafylaktisk chok estimeres til at ligge højere end de øvrige, på log 10 -skala. Dette svarer til, at tryptaseværdierne for gruppen med anafylaktisk chok er en faktor ca = 3.13 højere end de øvrige, med et 95% konfidensinterval på ( , ) = (2.28, 4.30), altså helt op til mere end en faktor 4. (b) Undersøg ved hjælp af en to gange to tabel, om anafylaktisk chok er mere udbredt blandt mænd end blandt kvinder. Kvantificer både differensen mellem sandsynlighederne samt relativ risiko og odds ratio. Formuler også konklusionen i ord. 13

14 I dette spørgsmål vil vi udelukkende se på opdelingen reacclass2, altså hvor de to mildeste former for reaktion er slået sammen. Vi fokuserer på hyppigheden af anafylaktisk chok for mænd hhv. kvinder, ved at sætte det op som en to-gange-to tabel: proc freq data=tryptase; tables gender*reacclass2 / nopercent nocol chisq expected riskdiff relrisk; run; som giver os outputtet The FREQ Procedure Table of gender by reacclass2 gender reacclass2 Frequency Expected Row Pct 0 1 Total F M Total Statistics for Table of gender by reacclass2 Statistic DF Value Prob Chi-Square Fisher s Exact Test Two-sided Pr <= P Statistics for Table of gender by reacclass2 Column 2 Risk Estimates (Asymptotic) 95% (Exact) 95% Risk ASE Confidence Limits Confidence Limits Row Row Total Difference Difference is (Row 1 - Row 2) 14

15 Estimates of the Relative Risk (Row1/Row2) Type of Study Value 95% Confidence Limits Case-Control (Odds Ratio) Cohort (Col1 Risk) Cohort (Col2 Risk) Sample Size = 179 Vi kan konstatere, at såvel χ 2 -testet som Fishers eksakte test viser, at der ses signifikant flere anafylaktiske chok blandt mænd (med en allergisk reaktion!!) end blandt kvinder (67% mod 47% af alle de allergiske reaktioner, P=0.007 eller P=0.01). Forskellen i sandsynlighed for et anafylaktisk chok blandt mænd vs. kvinder (igen, givet at man overhovedet har fået en allergisk reaktion), er altså ca. 20%, eller som output viser, , altså 19.93%, med konfidensgrænser på (0.0571, ), altså et sted mellem 5.7% og 34.1% hyppgere anafylaktisk chok blandt mænd. Denne forskel kan også kvantificeres som en odds ratio på (95% CI: ), eller som en relativ risiko på = 1.426, med konfidensgrænser (, 1 ) = (1.096, 1.857), altså en overhyppighed på 42.6% til mændene (CI: %-85.7%). (c) Er der nogen sammenhæng mellem alderen og graden af den allergiske reaktion? I behøver ikke lave test osv. for dette spørgsmål, men blot kommentere ud fra passende summariske størrelser. Igen vil vi kun se på opdelingen af sværhedsgrader i 2 grupper, altså svarende til variablen reacclass2. Først udregner vi gennemsnit og medianer for alderen i disse to grupper: The MEANS Procedure Analysis Variable : age N reacclass2 Obs N Mean Median

16 Vi ser, at gruppen med anafylaktisk chok er ældre end de øvrige (men kunne det nu skyldes, at der er en overvægt af mænd i denne gruppe?). Vi supplerer med et T-test for at undersøge, om der er signifikant forskel på aldersfordelingen i de to grupper: The TTEST Procedure Variable: age reacclass2 N Mean Std Dev Std Err Minimum Maximum Diff (1-2) reacclass2 Method Mean 95% CL Mean Std Dev Diff (1-2) Pooled Diff (1-2) Satterthwaite Method Variances DF t Value Pr > t Pooled Equal <.0001 Satterthwaite Unequal <.0001 Equality of Variances Method Num DF Den DF F Value Pr > F Folded F Vi får altså bekræftet, at gruppen med anafylaktisk chok består af personer, der er ældre end i de to øvrige grupper (P < ), men egentlig en dette en lidt bagvendt sammenligning, da det må være alderen, der betinger sværhedsgraden af den allergiske reaktion, og helt sikkert ikke omvendt. Hvis man gerne vil vide noget om, hvem det er, der får anafylaktisk chok, vil vi hellere vende det den anden vej, og have anafylaktisk chok som outcome (dikotomt outcome, 0/1-outcome), og så alderen - og kønnet - som forklarende variable, i en multipel logistisk regression (ikke med i pensum før i afleveringsugen, så derfor ikke en del af opgaven): proc genmod data=tryptase descending; class gender; model reacclass2=gender age / dist=binomial link=logit; 16

17 estimate "OR for 10 aar" age 10 / exp; estimate "OR for male vs female" gender -1 1 / exp; run; hvorved vi får resultaterne The GENMOD Procedure Model Information Data Set Distribution Link Function Dependent Variable WORK.TRYPTASE Binomial Logit reacclass2 Number of Observations Read 179 Number of Observations Used 179 Number of Events 101 Number of Trials 179 Class Level Information Class Levels Values gender 2 F M Response Profile Ordered Total Value reacclass2 Frequency PROC GENMOD is modeling the probability that reacclass2= 1. Analysis Of Maximum Likelihood Parameter Estimates Standard Wald 95% Confidence Wald Parameter DF Estimate Error Limits Chi-Square Intercept gender F gender M age Scale Analysis Of Maximum Likelihood Parameter Estimates Parameter Pr > ChiSq Intercept gender F gender M. age Scale NOTE: The scale parameter was held fixed. 17

18 Contrast Estimate Results Mean Mean L Beta Label Estimate Confidence Limits Estimate OR for 10 aar Exp(OR for 10 aar) OR for male vs female Exp(OR for male vs female) Contrast Estimate Results Standard L Beta Chi- Label Error Alpha Confidence Limits Square OR for 10 aar Exp(OR for 10 aar) OR for male vs female Exp(OR for male vs female) Contrast Estimate Results Label Pr > ChiSq OR for 10 aar Exp(OR for 10 aar) OR for male vs female Exp(OR for male vs female) Outputtet ovenfor viser, at en 10 år ældre person har en odds for anafylaktisk chok, der er 1.45 gange større (dvs. 45% større) end den 10 år yngre patient (95% konfidensgrænser 18%-77%). Desuden viser den, at der er tendens til, at mænd i højere grad får anafylaktisk chok, idet odds ratio er estimeret til 1.78 for mænd vs. kvinder (CI: , altså ikke signifikant). 3. Tilbage til tryptases afhængighed af alder: (a) Foretag en analyse, der tillader estimation af den forventede forskel på tryptase for to individer med samme sværhedsgrad af den allergiske reaktion, men med 10 års forskel i alder. Husk konfidensinterval! Her skal vi jo i hvert fald have alderen som kovariat, da det er effekten af denne, der spørges om. Desuden skal sværhedsgraden medtages, idet vi bliver bedt om effekten alder, for fastholdt (samme) værdi af sværhedsgraden. Da vi tidligere har set, at der var forskel på mænd og kvinder, tager vi også kønnet med i modellen. Vi kommer således til at estimere den forventede forskel på tryptase for to individer af samme køn og med samme sværhedsgrad af 18

19 den allergiske reaktion, men med 10 års forskel i alder. Modellen er ods graphics on; proc glm PLOTS=(DIAGNOSTICS RESIDUALS(SMOOTH)) data=tryptase; class gender reacclass reacclass2; model log_tryptase = age reacclass2 gender / solution clparm; estimate "effekt af 10 aar" age 10; run; ods graphics off; og (dele af) outputtet er: The GLM Procedure Class Level Information Class Levels Values gender 2 F M reacclass reacclass Number of Observations Read 179 Number of Observations Used 179 Dependent Variable: log_tryptase R-Square Coeff Var Root MSE log_tryptase Mean Source DF Type III SS Mean Square F Value Pr > F age reacclass <.0001 gender Standard Parameter Estimate Error t Value Pr > t effekt af 10 aar Parameter 95% Confidence Limits effekt af 10 aar Standard Parameter Estimate Error t Value Pr > t Intercept B <.0001 age reacclass B <.0001 reacclass B... gender F B gender M B... Parameter 95% Confidence Limits 19

20 Intercept age reacclass reacclass2 1.. gender F gender M.. Vi kan konstatere, at alderen absolut ikke ser ud til at have en betydning (mere), idet vi finder en P-værdi på Effekten af 10 år mere estimeres til en faktor = 1.019, altså kun 1.9% oveni for hvert tiår. Konfidensgrænserne er ( , ) = (0.921, 1.127), svarende til mellem 7.9% mindre og 12.7% mere. Den fittede model illustreres af figuren nedenfor. Vi ser 4 (næsten vandrette) linier, svarende til aldersafhængigheden i de 4 grupper (reacclass2=0-1, mænd og kvinder). Til sidst lige en bemærkning om fortolkningen af spredningen omkring regressionslinien. Denne er ikke helt simpel, pga. logaritmetransformationen. Vi finder her s = 0.46, og dermed, at 95% af kvinderne ligger indenfor en afstand af ±2s = ±0.92 fra den estimerede regressionslinie, på log 10 -skala. Hvis vi tilbagetransformerer dette interval, finder vi ( , ) = (0.12, 8.32), hvilket kan fortolkes som de enkelte kvinder har typisk en tryptase-værdi, der afviger med en faktor 9-10 stykker i forhold til medianen. (b) Fik du lavet modelkontrol for modellen ovenfor? 20

21 Her ser vi igen på modelkontrollen i form af både DiagnosticPanel med de 9 figurer, samt et enkelt residualplot (residualer mod kovariat), med indlagt smoother : Disse giver ikke anledning til nogen bekymringer. (c) Forklar forskellen på resultaterne opnået under punkt 1c og 3a. Vi sammenfatter resultaterne af analyserne med tryptase (på log 10 - skala) som outcome, inklusive en, der ikke er kommenteret ovenfor, 21

22 nemlig den, hvor kun alder og reaktionens sværhedsgrad indgår: Model/Spm. Alder, 10 år mere Mænd vs. Kvinder Anafylaktisk chok Residual s 1c (0.023) g (0.024) (0.078) (1g) (0.076) a (0.070) a (0.022) (0.071) (0.073) (3a) (0.022) (0.073) Når vi sammenligner resultaterne fra de forskellige modeller, kan vi konstatere, at alderseffekten ikke er særligt overbevisende. Godt nok er den signifikant i modellen fra spm. 1b-1c, men denne signifikans forsvinder, når vi tager kønnet i betragtning (spm. 1g, og endnu mere, når vi også tager hensyn til reaktionens sværhedsgrad. Hvis man forsøger at stille det op i et diagram med betegnelser K: Køn A: Alder R: Reactionclass2 T: Tryptase kunne det se således ud: K 3 R A T og fortolkningen kunne da være, at alderen har en positiv sammenhæng med tryptae, men at denne sammenhæng er konfunderet med køn (fordi mændene er ældre end kvinderne) og medieret af graden af den allergiske reaktion. Reference: Garvey, L.H. et al. (2010): Effect of General Anesthesia and Orthopedic Surgery on Serum Tryptase Anesthesiology 2010; 112:

Basal statistik for lægevidenskabelige forskere, forår 2014 Udleveret 4. marts, afleveres senest ved øvelserne i uge 13 (25.

Basal statistik for lægevidenskabelige forskere, forår 2014 Udleveret 4. marts, afleveres senest ved øvelserne i uge 13 (25. Hjemmeopgave Basal statistik for lægevidenskabelige forskere, forår 2014 Udleveret 4. marts, afleveres senest ved øvelserne i uge 13 (25.-27 marts) Garvey et al. interesserer sig for sammenhængen mellem

Læs mere

Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013

Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013 Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013 I forbindelse med reagensglasbehandling blev 100 par randomiseret til to forskellige former for hormonstimulation.

Læs mere

Vejledende besvarelse af hjemmeopgave, forår 2016

Vejledende besvarelse af hjemmeopgave, forår 2016 Vejledende besvarelse af hjemmeopgave, forår 2016 Udleveret 1. marts, afleveres senest ved øvelserne i uge 13 (29. marts-1. april) Denne opgave fokuserer på at beskrive niveauet af hormonet AMH (højt niveau

Læs mere

Vejledende besvarelse af hjemmeopgave

Vejledende besvarelse af hjemmeopgave Vejledende besvarelse af hjemmeopgave Basal statistik, efterår 2013 Udleveret 1. oktober, afleveres senest ved øvelserne i uge 44 (29. oktober-1. november) I forbindelse med en undersøgelse af vitamin

Læs mere

Vejledende besvarelse af hjemmeopgave, forår 2018

Vejledende besvarelse af hjemmeopgave, forår 2018 Vejledende besvarelse af hjemmeopgave, forår 2018 Udleveret 12. februar, afleveres senest ved øvelserne i uge 10 (6.-9.marts) I forbindelse med reagensglasbehandling blev 100 par randomiseret til to forskellige

Læs mere

Vejledende besvarelse af hjemmeopgave, forår 2017

Vejledende besvarelse af hjemmeopgave, forår 2017 Vejledende besvarelse af hjemmeopgave, forår 2017 På hjemmesiden http://publicifsv.sund.ku.dk/~lts/basal17_1/hjemmeopgave/hjemmeopgave.txt ligger data fra 400 fødende kvinder. Der er tale om et uddrag

Læs mere

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger Øvelser til basalkursus, 5. uge Opgavebesvarelse: Knogledensitet hos unge piger I alt 112 piger har fået målt knogledensitet (bone mineral density, bmd) i 11-års alderen (baseline værdi). Pigerne er herefter

Læs mere

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper.

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper. 1. Indlæs data. * HUSK at angive din egen placering af filen; data framing; infile '/home/sro00/mph2016/framing.txt' firstobs=2; input id sex age frw sbp sbp10 dbp chol cig chd yrschd death yrsdth cause;

Læs mere

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger Øvelser til basalkursus, 5. uge Opgavebesvarelse: Knogledensitet hos unge piger I alt 112 piger har fået målt knogledensitet (bone mineral density, bmd) i 11-års alderen (baseline værdi). Pigerne er herefter

Læs mere

Vejledende besvarelse af hjemmeopgave, forår 2015

Vejledende besvarelse af hjemmeopgave, forår 2015 Vejledende besvarelse af hjemmeopgave, forår 2015 En stikprøve bestående af 65 mænd og 65 kvinder er blevet undersøgt med henblik på at se på en evt. sammenhæng mellem kropstemperatur og puls. På hjemmesiden

Læs mere

Vejledende besvarelse af hjemmeopgave, efterår 2018

Vejledende besvarelse af hjemmeopgave, efterår 2018 Vejledende besvarelse af hjemmeopgave, efterår 2018 Udleveret 1. oktober, afleveres senest ved øvelserne i uge 44 (30. oktober.-1. november). Der er foretaget en del undersøgelser af krigsveteraner og

Læs mere

Postoperative komplikationer

Postoperative komplikationer Løsninger til øvelser i kategoriske data, oktober 2008 1 Postoperative komplikationer Udgangspunktet for vurdering af den ny metode må være en nulhypotese om at der er samme komplikationshyppighed, 20%.

Læs mere

Vejledende besvarelse af hjemmeopgave, efterår 2015

Vejledende besvarelse af hjemmeopgave, efterår 2015 Vejledende besvarelse af hjemmeopgave, efterår 2015 Udleveret 29. september, afleveres senest ved øvelserne i uge 44 (27.-30. oktober) En undersøgelse blandt fødende kvinder i Massachusetts (ref.) søger

Læs mere

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1 Københavns Universitet Afdeling for Anvendt Matematik og Statistik Statistik for biokemikere Inge Henningsen Michael Sørensen Oktober 2003 Opgaver til ZAR II Opgave 1 Et datasæt består af 20 observationer.

Læs mere

Vejledende besvarelse af hjemmeopgave, efterår 2016

Vejledende besvarelse af hjemmeopgave, efterår 2016 Vejledende besvarelse af hjemmeopgave, efterår 2016 Udleveret 4. oktober, afleveres senest ved øvelserne i uge 44 (1.-4. november) Normal aktivitet af enzymet plasma kolinesterase er en forudsætning for

Læs mere

Opgavebesvarelse, Basalkursus, uge 3

Opgavebesvarelse, Basalkursus, uge 3 Opgavebesvarelse, Basalkursus, uge 3 Opgave 1: Udskrivning af astma patienter (DGA s. 273) I en randomiseret undersøgelse foretaget af Storr et. al. (Lancet, i, 1987) sammenlignes effekten af en enkelt

Læs mere

Vejledende besvarelse af hjemmeopgave, efterår 2017

Vejledende besvarelse af hjemmeopgave, efterår 2017 Vejledende besvarelse af hjemmeopgave, efterår 2017 Udleveret 3. oktober 2017, afleveres senest ved øvelserne i uge 44 (31. okt.-2. nov. 2017) På hjemmesiden http://publicifsv.sund.ku.dk/~lts/basal17_2/hjemmeopgave/hjemmeopgave.txt

Læs mere

MPH specialmodul i epidemiologi og biostatistik. SAS. Introduktion til SAS. Eksempel: Blodtryk og fedme

MPH specialmodul i epidemiologi og biostatistik. SAS. Introduktion til SAS. Eksempel: Blodtryk og fedme MPH specialmodul i epidemiologi og biostatistik. SAS Introduktion til SAS. Display manager (programmering) Vinduer: program editor (med syntaks-check) log output reproducerbart (program teksten kan gemmes

Læs mere

Eksamen i Statistik for Biokemikere, Blok januar 2009

Eksamen i Statistik for Biokemikere, Blok januar 2009 Københavns Universitet Det Naturvidenskabelige Fakultet Eksamen i Statistik for Biokemikere, Blok 2 2008 09 19. januar 2009 Alle hjælpemidler er tilladt, og besvarelsen må gerne skrives med blyant. Opgavesættet

Læs mere

Besvarelse af vitcap -opgaven

Besvarelse af vitcap -opgaven Besvarelse af -opgaven Spørgsmål 1 Indlæs data Dette gøres fra Analyst med File/Open, som sædvanlig. Spørgsmål 2 Beskriv fordelingen af vital capacity og i de 3 grupper ved hjælp af summary statistics.

Læs mere

Løsning til opgave i logistisk regression

Løsning til opgave i logistisk regression Løsning til øvelser i logistisk regression, november 2008 1 Løsning til opgave i logistisk regression 1. Først indlæses data, og vi kan lige sørge for at danne en dummy-variable for cml, som indikator

Læs mere

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved Matematisk Modellering 1 (reeksamen) Side 1 Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved { 1 hvis x {1, 2, 3}, p X (x) = 3 0 ellers,

Læs mere

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer.

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer. Vejledende besvarelse af hjemmeopgave Basal statistik, efterår 2008 En gruppe bestående af 45 patienter med reumatoid arthrit randomiseres til en af 6 mulige behandlinger, nemlig placebo, aspirin eller

Læs mere

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Lineær regression. Simpel regression. Model. ofte bruges følgende notation: Lineær regression Simpel regression Model Y i X i i ofte bruges følgende notation: Y i 0 1 X 1i i n i 1 i 0 Findes der en linie, der passer bedst? Metode - Generel! least squares (mindste kvadrater) til

Læs mere

Generelle lineære modeller

Generelle lineære modeller Generelle lineære modeller Regressionsmodeller med én uafhængig intervalskala variabel: Y en eller flere uafhængige variable: X 1,..,X k Den betingede fordeling af Y givet X 1,..,X k antages at være normal

Læs mere

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Multipel regression M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Y j 1 X 1j 2 X 2j... m X mj j eller m Y j 0 i 1 i X ij j BEMÆRK! j svarer til individ

Læs mere

Opgavebesvarelse, brain weight

Opgavebesvarelse, brain weight Opgavebesvarelse, brain weight (Matthews & Farewell: Using and Understanding Medical Statistics, 2nd. ed.) For 20 nyfødte mus er der i tabellen nedenfor anført oplysning om kuldstørrelsen (fra 3 til 12

Læs mere

Vi ønsker at konstruere normalområder for stofskiftet, som funktion af kropsvægten.

Vi ønsker at konstruere normalområder for stofskiftet, som funktion af kropsvægten. Opgavebesvarelse, Resting metabolic rate I filen T:\rmr.txt findes sammenhørende værdier af kropsvægt (bw, i kg) og hvilende stofskifte (rmr, kcal pr. døgn) for 44 kvinder (Altman, 1991 og Owen et.al.,

Læs mere

Lineær regression i SAS. Lineær regression i SAS p.1/20

Lineær regression i SAS. Lineær regression i SAS p.1/20 Lineær regression i SAS Lineær regression i SAS p.1/20 Lineær regression i SAS Simpel lineær regression Grafisk modelkontrol Multipel lineær regression SAS-procedurer: PROC REG PROC GPLOT Lineær regression

Læs mere

Statistiske Modeller 1: Kontingenstabeller i SAS

Statistiske Modeller 1: Kontingenstabeller i SAS Statistiske Modeller 1: Kontingenstabeller i SAS Jens Ledet Jensen October 31, 2005 1 Indledning Som vist i Notat 1 afsnit 13 er 2 log Q for et test i en multinomialmodel ækvivalent med et test i en poissonmodel.

Læs mere

Faculty of Health Sciences. Basal Statistik. Logistisk regression mm. Lene Theil Skovgaard. 5. marts 2018

Faculty of Health Sciences. Basal Statistik. Logistisk regression mm. Lene Theil Skovgaard. 5. marts 2018 Faculty of Health Sciences Basal Statistik Logistisk regression mm. Lene Theil Skovgaard 5. marts 2018 1 / 22 APPENDIX vedr. SPSS svarende til diverse slides: To-gange-to tabeller, s. 3 Plot af binære

Læs mere

Basal statistik for sundhedsvidenskabelige forskere, efterår 2014 Udleveret 30. september, afleveres senest ved øvelserne i uge 44 (

Basal statistik for sundhedsvidenskabelige forskere, efterår 2014 Udleveret 30. september, afleveres senest ved øvelserne i uge 44 ( Hjemmeopgave Basal statistik for sundhedsvidenskabelige forskere, efterår 2014 Udleveret 30. september, afleveres senest ved øvelserne i uge 44 (28.-30. oktober) En stor undersøgelse søger at afdække forhold

Læs mere

Opgavebesvarelse, Basalkursus, uge 2

Opgavebesvarelse, Basalkursus, uge 2 Opgavebesvarelse, Basalkursus, uge 2 Opgave 1. Filen "space.txt" fra hjemmesiden ser således ud: salt pre post 1 71 61 1 65 59 1 52 47 1 68 65......... 0 52 77 0 54 80 0 52 79 Data indlæses i 3 kolonner,

Læs mere

Opgavebesvarelse, logistisk regression

Opgavebesvarelse, logistisk regression Opgavebesvarelse, logistisk regression Data ligger i rop.xls på kursushjemmesiden: http://staff.pubhealth.ku.dk/ jufo/courses/logistic/ Når du har gemt data på din computer, kan det indlæses i SAS med

Læs mere

Reeksamen i Statistik for Biokemikere 6. april 2009

Reeksamen i Statistik for Biokemikere 6. april 2009 Københavns Universitet Det Naturvidenskabelige Fakultet Reeksamen i Statistik for Biokemikere 6. april 2009 Alle hjælpemidler er tilladt, og besvarelsen må gerne skrives med blyant. Opgavesættet er på

Læs mere

Basal statistik. Logaritmer og kovariansanalyse. Nyt eksempel vedr. sammenligning af målemetoder. Scatter plot af de to metoder

Basal statistik. Logaritmer og kovariansanalyse. Nyt eksempel vedr. sammenligning af målemetoder. Scatter plot af de to metoder Faculty of Health Sciences Logaritmer og kovariansanalyse Basal statistik Logaritmer. Kovariansanalyse Lene Theil Skovgaard 29. september 2015 Parret sammenligning, målemetoder med logaritmer Tosidet variansanalyse

Læs mere

Faculty of Health Sciences. Basal statistik. Logaritmer. Kovariansanalyse. Lene Theil Skovgaard. 29. september 2015

Faculty of Health Sciences. Basal statistik. Logaritmer. Kovariansanalyse. Lene Theil Skovgaard. 29. september 2015 Faculty of Health Sciences Basal statistik Logaritmer. Kovariansanalyse Lene Theil Skovgaard 29. september 2015 1 / 84 Logaritmer og kovariansanalyse Parret sammenligning, målemetoder med logaritmer Tosidet

Læs mere

Afdeling for Anvendt Matematik og Statistik December 2006

Afdeling for Anvendt Matematik og Statistik December 2006 Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Inge Henningsen Afdeling for Anvendt Matematik og Statistik December 2006 i SAS (Zar kapitel 23) PROC FREQ PROC CATMOD

Læs mere

Reeksamen i Statistik for biokemikere. Blok

Reeksamen i Statistik for biokemikere. Blok Københavns Universitet Det Naturvidenskabelige Fakultet Reeksamen i Statistik for biokemikere. Blok 2 2007-2008. 3 timers skriftlig prøve. Alle hjælpemidler - også blyant - er tilladt. Opgavesættet er

Læs mere

Phd-kursus i Basal Statistik, Opgaver til 2. uge

Phd-kursus i Basal Statistik, Opgaver til 2. uge Phd-kursus i Basal Statistik, Opgaver til 2. uge Opgave 1: Sædkvalitet Filen oeko.txt på hjemmesiden indeholder datamateriale til belysning af forskellen i sædkvalitet mellem SAS-ansatte og mænd, der lever

Læs mere

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1 Matematisk Modellering 1 Side 1 I nærværende opgavesæt er der 16 spørgsmål fordelt på 4 opgaver. Ved bedømmelsen af besvarelsen vægtes alle spørgsmål lige. Endvidere lægges der vægt på, at det af besvarelsen

Læs mere

CLASS temp medie; MODEL rate=temp medie/solution; RUN;

CLASS temp medie; MODEL rate=temp medie/solution; RUN; Ugeopgave 2.1 Bakterieprøver fra patienter transporteres ofte til laboratoriet ved stuetemperatur samt mere eller mindre udsat for luftens ilt. Dette er især uheldigt for prøver som indeholder anaerobe

Læs mere

MPH specialmodul i epidemiologi og biostatistik. SAS. Introduktion til SAS. Eksempel: Blodtryk og fedme

MPH specialmodul i epidemiologi og biostatistik. SAS. Introduktion til SAS. Eksempel: Blodtryk og fedme MPH specialmodul i epidemiologi og biostatistik. SAS Introduktion til SAS. Display manager (programmering) Vinduer: program editor (med syntaks-check) log output reproducerbart (program teksten kan gemmes

Læs mere

Lineær og logistisk regression

Lineær og logistisk regression Faculty of Health Sciences Lineær og logistisk regression Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Dagens program Lineær regression

Læs mere

Opgavebesvarelse, korrelerede målinger

Opgavebesvarelse, korrelerede målinger Opgavebesvarelse, korrelerede målinger I 18 familier bestående af far, mor og 3 børn (i veldefinerede aldersintervaller, med child1 som det ældste barn og child3 som det yngste) har man registreret antallet

Læs mere

Kursus i varians- og regressionsanalyse Data med detektionsgrænse. Birthe Lykke Thomsen H. Lundbeck A/S

Kursus i varians- og regressionsanalyse Data med detektionsgrænse. Birthe Lykke Thomsen H. Lundbeck A/S Kursus i varians- og regressionsanalyse Data med detektionsgrænse Birthe Lykke Thomsen H. Lundbeck A/S 1 Data med detektionsgrænse Venstrecensurering: Baggrundsstøj eller begrænsning i måleudstyrets følsomhed

Læs mere

k normalfordelte observationsrækker (ensidet variansanalyse)

k normalfordelte observationsrækker (ensidet variansanalyse) k normalfordelte observationsrækker (ensidet variansanalyse) Lad x ij, i = 1,...,k, j = 1,..., n i, være udfald af stokastiske variable X ij og betragt modellen M 1 : X ij N(µ i, σ 2 ). Estimaterne er

Læs mere

β = SDD xt SSD t σ 2 s 2 02 = SSD 02 f 02 i=1

β = SDD xt SSD t σ 2 s 2 02 = SSD 02 f 02 i=1 Lineær regression Lad x 1,..., x n være udfald af stokastiske variable X 1,..., X n og betragt modellen M 2 : X i N(α + βt i, σ 2 ) hvor t i, i = 1,..., n, er kendte tal. Konkret analyseres (en del af)

Læs mere

Opgavebesvarelse, brain weight

Opgavebesvarelse, brain weight Opgavebesvarelse, brain weight (Matthews & Farewell: Using and Understanding Medical Statistics, 2nd. ed.) Spørgsmål 1 Data er indlagt på T:/Basalstatistik/brain.txt og kan indlæses direkte i Analyst med

Læs mere

Overlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere.

Overlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere. Overlevelse efter AMI Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Diabetes VF (Venticular fibrillation) WMI (Wall motion index) CHF (Cardiac Heart Failure) Køn og alder betragtes

Læs mere

Besvarelse af opgave om Vital Capacity

Besvarelse af opgave om Vital Capacity Besvarelse af opgave om Vital Capacity I filen cadmium.txt ligger observationer fra et eksempel omhandlende lungefunktionen hos arbejdere i cadmium industrien (hentet fra P. Armitage & G. Berry: Statistical

Læs mere

Variansanalyse i SAS. Institut for Matematiske Fag December 2007

Variansanalyse i SAS. Institut for Matematiske Fag December 2007 Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Institut for Matematiske Fag December 2007 Variansanalyse i SAS 2 Tosidet variansanalyse Residualplot Tosidet variansanalyse

Læs mere

Basal statistik. 30. oktober 2007

Basal statistik. 30. oktober 2007 Basal statistik 30. oktober 2007 Den generelle lineære model Repetition af variansanalyse og multipel regression Interaktion Kovariansanalyse Parametriseringer Lene Theil Skovgaard, Biostatistisk Afdeling

Læs mere

Filen indeholder 45 linier, først en linie med variabelnavnene (bw og rmr) og derefter 44 datalinier, hver med disse to oplysninger.

Filen indeholder 45 linier, først en linie med variabelnavnene (bw og rmr) og derefter 44 datalinier, hver med disse to oplysninger. Opgavebesvarelse, Resting metabolic rate I filen rmr.txt findes sammenhørende værdier af kropsvægt (bw, i kg) og hvilende stofskifte (rmr, kcal pr. døgn) for 44 kvinder (Altman, 1991 og Owen et.al., Am.

Læs mere

Basal statistik. 30. oktober Den generelle lineære model

Basal statistik. 30. oktober Den generelle lineære model Basal statistik 30. oktober 2007 Den generelle lineære model Repetition af variansanalyse og multipel regression Interaktion Kovariansanalyse Parametriseringer Lene Theil Skovgaard, Biostatistisk Afdeling

Læs mere

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j Hypoteser om mere end to stikprøver ANOVA k stikprøver: (ikke ordinale eller højere) H 0 : 1 2... k gælder også for k 2! H 0ij : i j H 0ij : i j simpelt forslag: k k 1 2 t-tests: i j DUER IKKE! Bonferroni!!

Læs mere

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april Århus 8. april 2011 Morten Frydenberg Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april Opgave 1 ( gruppe 1: sp 1-4, gruppe 5: sp 5-9 og gruppe 6: 10-14) I denne opgaveser vi på et

Læs mere

Logistisk regression. Basal Statistik for medicinske PhD-studerende November 2008

Logistisk regression. Basal Statistik for medicinske PhD-studerende November 2008 Logistisk regression Basal Statistik for medicinske PhD-studerende November 2008 Bendix Carstensen Steno Diabetes Center, Gentofte & Biostatististisk afdeling, Københavns Universitet bxc@steno.dk www.biostat.ku.dk/~bxc

Læs mere

Faculty of Health Sciences. Basal statistik. Logaritmer, Repetition, Kovariansanalyse, Interaktion. Lene Theil Skovgaard. 1.

Faculty of Health Sciences. Basal statistik. Logaritmer, Repetition, Kovariansanalyse, Interaktion. Lene Theil Skovgaard. 1. Faculty of Health Sciences Basal statistik Logaritmer, Repetition, Kovariansanalyse, Interaktion Lene Theil Skovgaard 1. oktober 2018 1 / 92 Logaritmer og kovariansanalyse Parret sammenligning af målemetoder,

Læs mere

Basal statistik for sundhedsvidenskabelige forskere, efterår 2015 Udleveret 29. september, afleveres senest ved øvelserne i uge 44 (27.-30.

Basal statistik for sundhedsvidenskabelige forskere, efterår 2015 Udleveret 29. september, afleveres senest ved øvelserne i uge 44 (27.-30. Hjemmeopgave Basal statistik for sundhedsvidenskabelige forskere, efterår 2015 Udleveret 29. september, afleveres senest ved øvelserne i uge 44 (27.-30. oktober) En undersøgelse blandt fødende kvinder

Læs mere

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge Statistik og Sandsynlighedsregning 2 IH kapitel 12 Overheads til forelæsninger, mandag 6. uge 1 Fordelingen af én (1): Regressionsanalyse udfaldsvariabel responsvariabel afhængig variabel Y variabel 2

Læs mere

Basal statistik for lægevidenskabelige forskere, forår 2012 Udleveret 6.marts, afleveres senest ved øvelserne i uge 15 (

Basal statistik for lægevidenskabelige forskere, forår 2012 Udleveret 6.marts, afleveres senest ved øvelserne i uge 15 ( Hjemmeopgave Basal statistik for lægevidenskabelige forskere, forår 2012 Udleveret 6.marts, afleveres senest ved øvelserne i uge 15 (10.-12. april) I et randomiseret forsøg sammenlignes vitamin D behandling

Læs mere

En Introduktion til SAS. Kapitel 5.

En Introduktion til SAS. Kapitel 5. En Introduktion til SAS. Kapitel 5. Inge Henningsen Afdeling for Statistik og Operationsanalyse Københavns Universitet Marts 2005 6. udgave Kapitel 5 T-test og PROC UNIVARIATE 5.1 Indledning Dette kapitel

Læs mere

Logistisk Regression - fortsat

Logistisk Regression - fortsat Logistisk Regression - fortsat Likelihood Ratio test Generel hypotese test Modelanalyse Indtil nu har vi set på to slags modeller: 1) Generelle Lineære Modeller Kvantitav afhængig variabel. Kvantitative

Læs mere

Basal statistik. Logaritmer og kovariansanalyse. Sammenligning af målemetoder. Scatter plot af de to metoder. Faculty of Health Sciences

Basal statistik. Logaritmer og kovariansanalyse. Sammenligning af målemetoder. Scatter plot af de to metoder. Faculty of Health Sciences Faculty of Health Sciences Logaritmer og kovariansanalyse Basal statistik Logaritmer, Repetition, Kovariansanalyse, Interaktion Lene Theil Skovgaard 1. oktober 2018 Parret sammenligning af målemetoder,

Læs mere

Vejledende besvarelse af hjemmeopgave, forår 2018

Vejledende besvarelse af hjemmeopgave, forår 2018 Vejledende besvarelse af hjemmeopgave, forår 2018 Udleveret 12. februar, afleveres senest ved øvelserne i uge 10 (6.-9.marts) I forbindelse med reagensglasbehandling blev 100 par randomiseret til to forskellige

Læs mere

Eksamen i Statistik for biokemikere. Blok

Eksamen i Statistik for biokemikere. Blok Københavns Universitet Det Naturvidenskabelige Fakultet Eksamen i Statistik for biokemikere. Blok 2 2007. 3 timers skriftlig prøve. Alle hjælpemidler - også blyant - er tilladt. Opgavesættet er på 8 sider.

Læs mere

Faculty of Health Sciences. Basal statistik. Logaritmer, Repetition, Kovariansanalyse, Interaktion. Lene Theil Skovgaard. 12.

Faculty of Health Sciences. Basal statistik. Logaritmer, Repetition, Kovariansanalyse, Interaktion. Lene Theil Skovgaard. 12. Faculty of Health Sciences Basal statistik Logaritmer, Repetition, Kovariansanalyse, Interaktion Lene Theil Skovgaard 12. februar 2018 1 / 88 Logaritmer og kovariansanalyse Parret sammenligning af målemetoder,

Læs mere

Besvarelse af juul2 -opgaven

Besvarelse af juul2 -opgaven Besvarelse af juul2 -opgaven Spørgsmål 1 Indlæs data Dette gøres fra Analyst med File/Open, som sædvanlig. Spørgsmål 2 Lav regressionsanalyser for hvert køn af igf1 vs. alder for præpubertale (Tanner stadium

Læs mere

MPH specialmodul Epidemiologi og Biostatistik

MPH specialmodul Epidemiologi og Biostatistik MPH specialmodul Epidemiologi og Biostatistik Kvantitative udfaldsvariable 23. maj 2011 www.biostat.ku.dk/~sr/mphspec11 Susanne Rosthøj (Per Kragh Andersen) 1 Kapitelhenvisninger Andersen & Skovgaard:

Læs mere

Basal Statistik Kategoriske Data

Basal Statistik Kategoriske Data Basal Statistik Kategoriske Data 8 oktober 2013 E 2013 Basal Statistik - Kategoriske data Michael Gamborg Institut for sygdomsforebyggelse Københavns Universitetshospital michael.orland.gamborg@regionh.dk

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Løsning til øvelsesopgaver dag 4 spg 5-9

Løsning til øvelsesopgaver dag 4 spg 5-9 Løsning til øvelsesopgaver dag 4 spg 5-9 5: Den multiple model Vi tilføjer nu yderligere to variable til vores model : Køn og kolesterol SBP = a + b*age + c*chol + d*mand hvor mand er 1 for mænd, 0 for

Læs mere

Multipel Lineær Regression

Multipel Lineær Regression Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer

Læs mere

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering Eksamen 2016 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 17-02-2015 Tid: kl. 09.00-11.00 Bedømmelsesform

Læs mere

Regressionsanalyse i SAS

Regressionsanalyse i SAS Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Inge Henningsen Afdeling for Anvendt Matematik og Statistik December 2006 Regressionsanalyse uden gentagelser Regressionsanalyse

Læs mere

Afdeling for Anvendt Matematik og Statistik Januar Regressionsanalyse i SAS 2. Regressionsanalyse med GLM Sammenligning af regressionslinier

Afdeling for Anvendt Matematik og Statistik Januar Regressionsanalyse i SAS 2. Regressionsanalyse med GLM Sammenligning af regressionslinier Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Inge Henningsen Afdeling for Anvendt Matematik og Statistik Januar 2007 2 Regressionsanalyse med GLM Sammenligning af regressionslinier

Læs mere

n r x rs x r = 1 n r s=1 (x rs x r ) 2, s=1

n r x rs x r = 1 n r s=1 (x rs x r ) 2, s=1 (a) Denne opgave bygger på resultaterne fra 2 forsøg med epo-behandling af for tidligt fødte børn, idet gruppe 1 og 3 stammer fra første forsøg, mens gruppe 2 og 4 stammer fra det andet. Det må antages,

Læs mere

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Afdeling for Biostatistik Bo Martin Bibby 23. november 2006 Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Vi betragter 4699 personer fra Framingham-studiet. Der er oplysninger om follow-up

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Faculty of Health Sciences. Logistisk regression: Kvantitative forklarende variable

Faculty of Health Sciences. Logistisk regression: Kvantitative forklarende variable Faculty of Health Sciences Logistisk regression: Kvantitative forklarende variable Susanne Rosthøj Biostatistisk Afdeling Institut for Folkesundhedsvidenskab Københavns Universitet sr@biostat.ku.dk Sammenhæng

Læs mere

Basal statistik. 21. oktober 2008

Basal statistik. 21. oktober 2008 Basal statistik 21. oktober 2008 Den generelle lineære model Repetition af variansanalyse og multipel regression Interaktion Parametriseringer Kovariansanalyse Esben Budtz-Jørgensen, Biostatistisk Afdeling

Læs mere

Eksamen i Statistik for biokemikere. Blok

Eksamen i Statistik for biokemikere. Blok Københavns Universitet Det Naturvidenskabelige Fakultet Eksamen i Statistik for biokemikere. Blok 2 2006. 3 timers skriftlig prøve. Alle hjælpemidler - også blyant - er tilladt. Opgavesættet er på 6 sider.

Læs mere

Basal Statistik. Simpel lineær regression. Simpel lineær regression. Data. Faculty of Health Sciences

Basal Statistik. Simpel lineær regression. Simpel lineær regression. Data. Faculty of Health Sciences Faculty of Health Sciences Simpel lineær regression Basal Statistik Regressionsanalyse. Lene Theil Skovgaard 21. februar 2017 Regression og korrelation Simpel lineær regression Todimensionale normalfordelinger

Læs mere

Program. Logistisk regression. Eksempel: pesticider og møl. Odds og odds-ratios (igen)

Program. Logistisk regression. Eksempel: pesticider og møl. Odds og odds-ratios (igen) Faculty of Life Sciences Program Logistisk regression Claus Ekstrøm E-mail: ekstrom@life.ku.dk Odds og odds-ratios igen Logistisk regression Estimation og inferens Modelkontrol Slide 2 Statistisk Dataanalyse

Læs mere

Opgavebesvarelse, Basalkursus, uge 3

Opgavebesvarelse, Basalkursus, uge 3 Opgavebesvarelse, Basalkursus, uge 3 Opgave 1: Udskrivning af astma patienter (DGA s. 273) I en randomiseret undersøgelse foretaget af Storr et. al. (Lancet, i, 1987) sammenlignes effekten af en enkelt

Læs mere

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter Program Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Øvelse: effekt af diæter. Repetition fra sidst... Parrede og ikke-parrede

Læs mere

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl Reeksamen 2018 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 13-08-2018 Tid: kl. 09.00-11.00 Bedømmelsesform

Læs mere

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6 Institut for Matematiske Fag Matematisk Modellering 1 Aarhus Universitet Eva B. Vedel Jensen 25. februar 2008 UGESEDDEL 6 Forelæsningerne torsdag den 21. februar og tirsdag den 26. februar. Jeg har gennemgået

Læs mere

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Normalfordelingen. Statistik og Sandsynlighedsregning 2 Normalfordelingen Statistik og Sandsynlighedsregning 2 Repetition og eksamen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige fejl på

Læs mere

Kommentarer til øvelser i basalkursus, 2. uge

Kommentarer til øvelser i basalkursus, 2. uge Kommentarer til øvelser i basalkursus, 2. uge Opgave 2. Vi betragter målinger af hjertevægt (i g) og total kropsvægt (målt i kg) for 10 normale mænd og 11 mænd med hjertesvigt. Målingerne er taget ved

Læs mere

Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge

Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge Opgave 1. Data indlæses i 3 kolonner, som f.eks. kaldessalt,pre ogpost. Der er således i alt tale om 26 observationer, idet de to grupper lægges

Læs mere

Besvarelse af opgave om Vital Capacity

Besvarelse af opgave om Vital Capacity Besvarelse af opgave om Vital Capacity hentet fra P. Armitage & G. Berry: Statistical methods in medical research. 2nd ed. Blackwell, 1987. Spørgsmål 1: Indlæs data og konstruer en faktor (klassevariabel)

Læs mere

1 Hb SS Hb Sβ Hb SC = , (s = )

1 Hb SS Hb Sβ Hb SC = , (s = ) PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.

Læs mere

Løsning eksamen d. 15. december 2008

Løsning eksamen d. 15. december 2008 Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Opgavebesvarelse, Basalkursus, uge 3

Opgavebesvarelse, Basalkursus, uge 3 Opgavebesvarelse, Basalkursus, uge 3 Opgave 1: Udskrivning af astma patienter (DGA s. 273) I en randomiseret undersøgelse foretaget af Storr et. al. (Lancet, i, 1987) sammenlignes effekten af en enkelt

Læs mere

Basal statistik for lægevidenskabelige forskere, forår Udleveret 12. marts, afleveres senest ved øvelserne i uge 14 (2.-4.

Basal statistik for lægevidenskabelige forskere, forår Udleveret 12. marts, afleveres senest ved øvelserne i uge 14 (2.-4. Hjemmeopgave Basal statistik for lægevidenskabelige forskere, forår 2013 Udleveret 12. marts, afleveres senest ved øvelserne i uge 14 (2.-4.april) I forbindelse med reagensglasbehandling blev 100 par randomiseret

Læs mere

Vi vil analysere effekten af rygning og alkohol på chancen for at blive gravid ved at benytte forskellige Cox regressions modeller.

Vi vil analysere effekten af rygning og alkohol på chancen for at blive gravid ved at benytte forskellige Cox regressions modeller. Løsning til øvelse i TTP dag 3 Denne øvelse omhandler tid til graviditet. Et studie vedrørende tid til graviditet (Time To Pregnancy = TTP) inkluderede 423 par i alderen 20-35 år. Parrene blev fulgt i

Læs mere

Morten Frydenberg 26. april 2004

Morten Frydenberg 26. april 2004 Introduktion til Logistisk Regression Morten Frydenberg, Inst. f. Biostatistik RESUME: 2 2. gang: 2002 Institut for Biostatistik, Århus Universitet MPH. studieår Specialmodul 4 Cand. San. uddannelsen.

Læs mere

Opgavebesvarelse, brain weight

Opgavebesvarelse, brain weight Opgavebesvarelse, brain weight (Matthews & Farewell: Using and Understanding Medical Statistics, 2nd. ed.) For 20 musekuld er der i tabellen nedenfor anført oplysning om kuldstørrelsen (fra 3 til 12 mus

Læs mere