Vejledende besvarelse af hjemmeopgave, forår 2017

Transkript

1 Vejledende besvarelse af hjemmeopgave, forår 2017 På hjemmesiden ligger data fra 400 fødende kvinder. Der er tale om et uddrag af det såkaldte Mor-Barn studie (Olsen et al., 2001), idet der er udvalgt et tilfældigt sample på 400 førstegangsfødende, der føder et levende barn i terminsugerne 37-42, og som ikke drak alkohol under graviditeten. Der er udvalgt 7 variable for hver kvinde, og forslag til variabelnavne er angivet i 1. linie. Disse er: idnr: Nummer på kvinden (blot til brug for identifikation) alder: Kvindens alder ryger: Er kvinden ryger? (ja/nej) kaffe: Er kvinden kaffedrikker? (ja/nej) uge: Gestationsalder ved fødslen vaegt: Barnets vægt i gram laengde: Barnets længde i cm Der er i nedenstående besvarelse ikke udeladt nogen observationer. Der er anvendt ods graphics i mange sammenhænge, hvor det (for nogle) ikke vil være nødvendigt at skrive dette. Opgaven er at beskrive fødselsvægten, forskellige prediktorer for denne, samt disses samspil. Først må vi jo indlæse vores data, og vi benytter de samme variabelbetegnelser som angivet ovenfor: data a1; infile " hjemmeopgave/hjemmeopgave.txt" URL firstobs=2; input idnr alder ryger$ kaffe$ uge vaegt laengde; if vaegt ge 2700 then low_weight="nej"; 1

2 else low_weight="ja"; ga=uge; kvadratled=(ga-40)**2; Udover indlæsningen har vi også lavet et par nye variable, dels en kopi af gestationsalderen (ga=uge, som skal bruges til modelkontrol i spørgsmål 4d), et kvadratled baseret på gestationsalderen (kvadratled=(ga-40)**2, som ligeledes skal bruges til modelkontrol i spørgsmål 4d) samt en dikotomisering af fødselsvægten (low_weight, som skal bruges i spørgsmål 2). 1. Beskriv fordelingen af fødselsvægt i det totale materiale. (a) Lav først en grafisk illustration. Da der kun er tale om en enkelt gruppe, vælges et histogram: title SPM 1 ; title2 SPM 1A ; proc sgplot data=a1; histogram vaegt; Her ser vi en pæn normalfordelingslignende fordeling, centreret omkring en fødselsvægt på ca gram. 2

3 (b) Udregn dernæst passende valgte summary statistics, som om du skulle lave en Tabel 1 til en artikel, og forklar kort hvorfor du vælger netop disse. Det er fristende blot at benytte de default-værdier, som SAS mener er fornuftige, når man benytter proc means, men vi supplerer her med median og kvartiler: title2 SPM 1B ; proc means N mean median stddev Q1 Q3 min max data=a1; var vaegt; hvorved vi får outputtet: SPM 1B The MEANS Procedure Analysis Variable : vaegt Lower Upper N Mean Median Std Dev Quartile Quartile Analysis Variable : vaegt Minimum Maximum Vi ser her, at gennemsnit og median er næsten sammenfaldende, samt at Q1/Q3 (og faktisk også min/max) ligger pænt symmetrisk omkring gennemsnittet. Dette passer fint med vores vurdering af normalfordelingstilpasningen ovenfor. For en ordens skyld vil vi dog lige checke hvordan fraktildiagrammet ser ud, idet et sådant er bedre til at vurdere evt afvigelser fra normalfordelingen: proc univariate noprint data=a1; qqplot vaegt; 3

4 Fraktildiagrammet kommer til at se rigtigt nydeligt ud: og man ville derfor roligt kunne indsætte gennemsnit og spredning i sin Tabel 1 i dette tilfælde. Bemærk i øvrigt, at histogram og fraktildiagram også kan fås ved at bruge proceduren ttest, selv om vi slet ikke er interesseret i noget test for middelværdien af fødselsvægten: proc ttest data=a1; var vaegt; hvilket giver figurerne Ofte viser man også oplyninger om de øvrige variable i Tabel 1, f.eks. således: 4

5 title2 SPM 1B ; proc means N mean median stddev Q1 Q3 min max data=a1; class ryger; var vaegt uge laengde; der giver outputtet: SPM 1B The MEANS Procedure N ryger Obs Variable N Mean Median Std Dev ja 115 vaegt uge laengde nej 285 vaegt uge laengde N Lower Upper ryger Obs Variable Quartile Quartile Minimum ja 115 vaegt uge laengde nej 285 vaegt uge laengde N ryger Obs Variable Maximum ja 115 vaegt uge laengde nej 285 vaegt uge laengde (c) Hvor stor en procentdel af børnene havde en fødselsvægt under 2700 gram? Kan det siges at være usædvanligt? 5

6 Her skal vi benytte variablen low_weight, som vi definerede allerede under indlæsningen. Denne variabel antager værdien ja for børn med en fødselsvægt under 2700 gram og nej ellers. Vi laver en lille tabel over denne variabel title2 SPM 1C ; proc freq data=a1; tables low_weight; og finder outputtet SPM 1C The FREQ Procedure low_ Cumulative Cumulative weight Frequency Percent Frequency Percent ja nej Der er altså netop 2 1 % af børnene, der fødes med en vægt under gram, så det må siges at være rimeligt usædvanligt. Der er naturligvis en vis usikkerhed på denne proportion, og den kan kvantificeres ved at tilføje option binomial(exact) til tablessætningen ovenfor proc freq data=a1; tables low_weight / list binomial(exact); hvorved man får udregnet et eksakt konfidensinterval, som ses (nederst) at være CI=(1.21%, 4.55%): 6

7 SPM 1C The FREQ Procedure Binomial Proportion low_weight = ja Proportion ASE Confidence Limits for the Binomial Proportion Proportion = Type 95% Confidence Limits Clopper-Pearson (Exact) Ved vurderingen af, om så lav en fødselsvægt er usædvanlig, er det også naturligt at sammenligne med et normalområde, baseret på de 400 fødselsvægte. Da vi ovenfor fandt en god normalfordelingstilpasning kan vi benytte konstruktionen med ±2 SD, og finder ± = ( , ) Baseret på dette interval er det ikke virkelig usædvanligt at finde en så lav fødselsvægt. Da vi har så mange observationer, kan vi også udregne et eksakt 95% normalområde ud fra fraktilerne proc univariate data=a1; var vaegt; output out=spm1b pctlpts= pctlpre=frak_ pctlname=lower upper; proc print data=spm1b; og vi finder outputtet SPM 1C frak_ frak_ Obs lower upper

8 Vi ser her en rigtig god overensstemmelse til det normalfordelingsbaserede normalområde, samt at 2.5%-fraktilen virkelig er meget tæt på 2700 (grunden til, at den ikke er præcis 2700 er, at barnet med den tiende mindste fødselsvægt vejer 2670 gram, medens den 11. mindste vejer 2700 gram, og der bliver så interpoleret mellem disse værdier). 2. I dette spørgsmål skal vi se nærmere på risikoen for at føde et barn med en vægt under 2700 gram (i det følgende kaldet letvægtere): (a) Er der større risiko for at føde en letvægter, hvis man er ryger i forhold til, hvis man er ikke-ryger? Her skal vi sammenholde to binære variable, nemlig ryger ja/nej og letvægter ja/nej. Vi opstiller derfor 2x2 tabellen med rygergrupperne (ja/nej) som rækker og vægtgrupperne (ja/nej til letvægter) som søjler. Desuden beder vi om et χ 2 -test (og dermed automatisk også et Fishers eksakt test) samt om diverse kvantificeringer af forskellen på de to sandsynligheder for at føde en letvægter. Herudover undertrykker vi søjleprocenter (nocol) og overall tabelprocenter (nopercent): title SPM 2 ; title2 SPM 2A ; proc freq data=a1; table ryger*low_weight / nopercent nocol chisq riskdiffc relrisk; Herved får vi en hel del output, her lettere beskåret. Vi starter med at se på den første del, bestående af selve tabellen, samt testet for uafhængighed (test af identitet for de to sandsynligheder for at føde en letvægter): The FREQ Procedure Table of ryger by low_weight 8

9 ryger low_weight Frequency Row Pct ja nej Total ja nej Total Statistics for Table of ryger by low_weight Statistic DF Value Prob Chi-Square Likelihood Ratio Chi-Square Continuity Adj. Chi-Square WARNING: 25% of the cells have expected counts less than 5. Chi-Square may not be a valid test. Fisher s Exact Test Cell (1,1) Frequency (F) 6 Two-sided Pr <= P Vi ser, at χ 2 -testet giver en advarsel, fordi der er tale om små antal. Bemærk, at det er det forventede antal i kategorien af letvægtere blandt rygende mødre, der er problemet, idet denne er = < 5), hvorimod det tilsvarende forventede antal 400 blandt ikke-rygende mødre er = > 5). 400 På grund af den tynde tabel, benytter vi Fishers eksakte test til sammenligning af de to sandsynligheder, og finder hermed P=0.037, altså en signifikant forskel. Vi må konkludere, at rygende kvinder har en større risiko for at føde letvægtere end ikke-rygende kvinder (5.22% vs. 1.40%). Angiv estimater med tilhørende konfidensgrænser for sammenligningen af sandsynlighederne for rygere vs. ikke-rygere, dels i form af differensen mellem sandsynlighederne og dels i form af relativ risiko (og evt. odds ratio). Kan der være op til en faktor 10 til forskel på de to sandsyn- 9

10 ligheder? Formuler også konklusionen i ord. Vi så allerede ovenfor på de estimerede sandsynligheder for at føde en letvægter, nemlig 5.22% for rygende kvinder og 1.40% for ikke-rygende kvinder. Det svarer til en forskel på 3.81%point. Option riskdiffc (eller bare riskdiff) i koden ovenfor bekræfter denne forskel, i nederste linie af Column 1 Risk Estimates: The FREQ Procedure Column 1 Risk Estimates (Asymptotic) 95% (Exact) 95% Risk ASE Confidence Limits Confidence Limits Row Row Total Difference Difference is (Row 1 - Row 2) The asymptotic confidence limits include a continuity correction Difference Difference is (Row 1 - Row 2) ovenfor. I outputtet får vi i tilgift 95% konfidensgrænser på dette tal, nemlig CI=(-1.08%, 8.71%). Bemærk, at CI og P-værdi her ikke passer helt sammen, fordi der er tale om en eksakt procedure sammenlignet med to forskellige approksimative. Bemærk, at denne differens altid angiver Row1 - Row2, altså her rygere minus ikke-rygere. Hvis rækkerne var byttet om, ville differensen blot skifte fortegn. Den relative risiko er ligeledes angivet som Row1 vs. Row2, og derfor er den (for Column 1, som stadig er den relevante at 10

11 se på) 3.72 (se nedenfor, hvor outputtet fra option relrisk er vist), hvilket betyder, at rygerne har 3.72 gange større risiko for at føde en letvægter, sammenlignet med ikke-rygerne. Dette tal kunne vi selv have udregnet ganske simpelt som ratio en mellem de to frekvenser, = 3.73 (der er lidt med afrunding her), men konfidensgrænserne er lidt besværlige at udreg ne, så derfor foretrækkes udregningen via SAS. Konfidensgrænserne ses at blive (1.07, 12.93), altså meget brede! Dette skyldes det lave antal letvægtere i materialet. Og ja, der kan altså godt tænkes at være en faktor 10 til forskel på sandsynlighederne for at føde en letvægter i de to grupper. The FREQ Procedure Odds Ratio and Relative Risks Statistic Value 95% Confidence Limits Odds Ratio Relative Risk (Column 1) Relative Risk (Column 2) Sample Size = 400 Hvis vi i stedet benytter odds ratio, får vi estimatet 3.87, med CI=(1.07,13.97), altså næsten det samme som den relative risiko. Det skyldes, at fødsel af en letvægter er en sjælden begivenhed. Men her er fortolkningen altså, at odds for at få en letvægter er 3.87 gange højere, hvis man er ryger i forhold til, hvis man ikke er ryger. 3. I stedet for at dikotomisere fødselsvægten i over eller under 2700 gram, ser vi nu igen på fødselsvægten som en kvantitativ størrelse: (a) Er der en sammenhæng mellem fødselslængde og fødselsvægt? Vi starter med et simpelt scatter plot: title SPM 3 ; 11

12 title2 SPM 3A ; proc sgplot data=a1; scatter Y=vaegt X=laengde; Da figuren ser rimelig lineær ud, fortsætter vi med at foretage en lineær regression af fødselsvægt, med fødselslængde som kovariat. I samme omgang sørger vi også for at få passende figurer til modelkontrol, samt inkluderer en estimate-sætning, som vi skal bruge i spørgsmål 3c: title2 SPM 3A+C ; proc glm plots=(fitplot DiagnosticsPanel Residuals(smooth)) data=a1; model vaegt=laengde / solution clparm; estimate "laengde 48 cm" intercept 1 laengde 48; Vi finder herved nedenstående output (lettere beskåret): SPM 3A+C The GLM Procedure Number of Observations Read 400 Number of Observations Used 400 The GLM Procedure Dependent Variable: vaegt Sum of 12

13 Source DF Squares Mean Square F Value Pr > F Model <.0001 Error Corrected Total R-Square Coeff Var Root MSE vaegt Mean Standard Parameter Estimate Error t Value Pr > t laengde 48 cm <.0001 Parameter 95% Confidence Limits laengde 48 cm Standard Parameter Estimate Error t Value Pr > t Intercept <.0001 laengde <.0001 Parameter 95% Confidence Limits Intercept laengde Det ses, at længde og vægt hænger tydeligt sammen (P < for test af hældning 0). Det var vi nu heller ikke rigtigt i tvivl om efter at have set tegningen ovenfor. Interceptet vil vi afstå fra at fortolke, idet det henviser til den forventede fødselsvægt for et barn på 0 cm. Modelkontroltegningerne for dette fit giver ikke anledning til bekymring: 13

14 og plot af fittet med prediktionsgrænser ser også rigtigt fornuftigt ud 14

15 (b) Hvad er den estimerede vægtforøgelse for hver cm forøgelse af længden? Denne aflæses direkte som hældningen i ovenstående analyse, dvs Det betyder, at for hver ekstra cm, barnet er langt, forventer vi, at det vejer g mere. Konfidensintervallet for denne størrelse er angivet som (148.1, 177.0) g. (c) Bestem et 95% prediktionsinterval for fødselsvægt for børn med en længde på 48 cm. Først skal vi estimere fødselsvægten for børn med længde 48 cm. Dette kan vi nemt gøre direkte ved at bruge liniens ligning: = men af hensyn til nøjagtighed, og allervigtigst: for at få konfidensgrænser på, benytter vi i stedet estimate-sætningen: estimate "laengde 48 cm" intercept 1 laengde 48; som gav resultatet Standard Parameter Estimate Error t Value Pr > t laengde 48 cm <

16 Parameter 95% Confidence Limits laengde 48 cm Estimatet er altså på g, med konfidensgrænser (2792.8, ) g. Nu er det imidlertid ikke konfidensgrænserne, vi er interesserede i, men derimod et prediktionsinterval. Hertil skal vi bruge residualspredningen (spredningen omkring linien), som vi finder i outputtet ovenfor under navnet RootMSE. Værdien er g, og vi danner derfor prediktionsintervallet ved at skrive ± = (2229.3, ) Vi bemærker, at det ser ret almindeligt ud for sådanne korte børn at have fødselsvægt under 2700 g. 4. Her skal vi fokusere på rygningens betydning for fødselsvægt. (a) Estimer vægtforskellen på børn født af rygende og ikke-rygende mødre. Husk konfidensinterval, og kommenter på bredden af dette. Inden vi går i gang med en egentlig sammenligning, skal vi lige se et Boxplot af vægtfordelingen i de to grupper: title SPM 4 ; title2; proc sgplot data=a1; vbox vaegt / group=ryger; 16

17 På dette boxplot ses en ganske beskeden forskel, idet rygernes børn synes at være lidt lettere end ikke-rygernes. For at se, om denne forskel kan tilskrives tilfældigheder, skal vi sammenligne to grupper (rygende vs. ikke-rygende) mht et kvantitativt outcome, nemlig fødselsvægten. Der er altså tale om et uparret T-test: title2 SPM 4A ; proc ttest data=a1; class ryger; var vaegt; som giver outputtet (let beskåret) SPM 4A The TTEST Procedure Variable: vaegt ryger N Mean Std Dev Std Err Minimum Maximum ja nej Diff (1-2) ryger Method Mean 95% CL Mean Std Dev ja nej Diff (1-2) Pooled Diff (1-2) Satterthwaite Method Variances DF t Value Pr > t 17

18 Pooled Equal Satterthwaite Unequal Equality of Variances Method Num DF Den DF F Value Pr > F Folded F Vi ser af ovenstående, at børn af rygende mødre i gennemsnit er gram lettere end børn af ikke-rygende mødre, med CI=(4.88, 221.9) gram, samt at dette er signifikant (P=0.04, idet jeg bruger den højeste af de to P-værdier, fordi spredningerne ikke ser helt ens ud). Der er tale om en ganske beskeden forskel, som i praksis vel må anses for ubetydelig, men signifikant på grund af den store sample size. De tilhørende modelkontroltegninger ser rigtigt fine ud, først histogrammerne: 18

19 og så fraktildiagrammerne: (b) Kommenter på mulige forklaringer på den ovenfor fundne forskel (uden at lave analyser på dette tidspunkt), f.eks. om de rygende mødre kunne afvige i alder, i deres forbrug af kaffe, i gestationsalder ved fødsel, eller i andre henseender. Der kan selvfølgelig være mange forklaringer på denne tilsyneladende effekt af rygning, men vi har kun et begrænset udvalg af oplysninger i dette materiale. Man plejer at sige, at ældre mødre får tungere børn, så hvis der er forskel på alderen for rygere og ikke-rygere (således at rygerne er yngst), kunne dette tænkes at spille ind. Det kunne naturligvis også være rygningen i sig selv, der bevirkede, at børnene blev mindre, og i så fald kunne det virke gennem forskellige mekanismer: Børnene blev født for tidligt (uge) Børnere blev generelt mindre, altså også kortere (length) Børnene var tyndere (dette kommer vi tilbage til i spørgsmål 5) Vi ser nærmere på nogle af disse muligheder ved at lave en serie af sammenligninger i form af uparrede T-tests (som samtidig producerer nogle kombinerede histogrammer og Boxplots til illustration af sammenligningerne): 19

20 title2 SPM 4B ; proc ttest data=a1; class ryger; var alder uge laengde; og får nogle figurer og en masse output SPM 4B The TTEST Procedure Variable: alder ryger N Mean Std Dev Std Err Minimum Maximum ja nej Diff (1-2) ryger Method Mean 95% CL Mean Std Dev ja nej

21 Diff (1-2) Pooled Diff (1-2) Satterthwaite Method Variances DF t Value Pr > t Pooled Equal Satterthwaite Unequal Equality of Variances Method Num DF Den DF F Value Pr > F Folded F Variable: uge ryger N Mean Std Dev Std Err Minimum Maximum ja nej Diff (1-2) ryger Method Mean 95% CL Mean Std Dev ja nej Diff (1-2) Pooled Diff (1-2) Satterthwaite Method Variances DF t Value Pr > t Pooled Equal Satterthwaite Unequal Equality of Variances Method Num DF Den DF F Value Pr > F Folded F Variable: laengde ryger N Mean Std Dev Std Err Minimum Maximum ja nej Diff (1-2) ryger Method Mean 95% CL Mean Std Dev ja nej Diff (1-2) Pooled Diff (1-2) Satterthwaite Method Variances DF t Value Pr > t Pooled Equal Satterthwaite Unequal Equality of Variances Method Num DF Den DF F Value Pr > F Folded F

22 Af disse sammenligninger kan vi se, at rygerne faktisk ser ud til at være lidt yngre end ikke-rygerne (mindre end et år, men signifikant med P=0.044), at de ikke føder tidligere (bemærk dog, at materialet er selekteret på gestationsalder, så det er ikke en valid konklusion) samt at de føder kortere børn (en halv centimeter kortere, som ud fra vores analyse i spørgsmål 3b svarer til ca g, P=0.018). Vi skal se nærmere på gestationsalderen i spørgsmål 4d, på længden i spørgsmål 5, men vil ikke kommentere yderligere på aldersforskellen. (c) Hvor godt kan vi forudsige fødselsvægten for det enkelte barn, udelukkende baseret på om moderen er ryger eller ej? Her kan man evt sammenligne med prediktionsintervallet fra spørgsmål 3c. Det er prediktionsgrænser, vi skal udregne her, eller rettere: normalområder for hver ryger-gruppe for sig. Fra T-testet ovenfor har vi fået gennemsnit og spredninger, så vi udregner prediktionsintervallerne: Rygere: ± = (2486.1, ) Ikke-rygere: ± = (2700.3, ) Nøjagtigheden er altså en anelse bedre for ikke-rygerne... Det er ikke umiddelbart fornuftigt at sammenligne til prediktionsområdet fra spørgsmål 3c, idet vi her så på børn med en fødselslængde på 48cm, hvilket jo ikke er ret meget. Men vi kan sammenligne bredden af intervallerne ved at sammenligne SD erne, og her havde vi i spørgsmål 3c en SD på 316.8, altså en del mindre end de to, vi fandt ovenfor. Dette skyldes, at vi i spørgsmål 3c har den meget vigtige prediktor laengde med som kovariat i stedet for rygning, og dette vil naturligvis formindske residualspredningen. (d) Undersøg om effekten af rygning på fødselsvægt skyldes, at rygerne føder tidligere end ikke-rygerne, dvs: Sammenlign fødselsvægten blandt børn af rygere og ikke-rygere, født i samme terminsuge. 22

23 Når vi skal sammenligne børn født i samme terminsuge, må vi holde denne fast, dvs. vi må inkludere terminsuge som kovariat i modellen. Først ser vi på en figur til at illustrere dette title2 SPM 4D ; proc sgplot data=a1; reg Y=vaegt X=uge / group=ryger; På baggrund af ovenstående figur, vil vi antage at effekten af hver ekstra uge er en konstant ekstra tilvækst i vægt, (altså en lineær effekt, som dog vil blive kontrolleret nedenfor). Vi indsætter derfor blot uge som en kvantitativ kovariat (uden interaktion med ryger - svarende til parallelle linier), og vurderer så ryger-effekten i denne ANCOVA-model: title2 SPM 4D+E ; proc glm plots=(fitplot DiagnosticsPanel Residuals(smooth)) data=a1; class ryger; model vaegt=uge ryger / solution clparm; estimate "ryger, uge 39" intercept 1 uge 39 ryger 1 0; Vi finder 23

24 SPM 4D+E The GLM Procedure Class Level Information Class Levels Values ryger 2 ja nej Number of Observations Read 400 Number of Observations Used 400 Dependent Variable: vaegt Sum of Source DF Squares Mean Square F Value Pr > F Model <.0001 Error Corrected Total R-Square Coeff Var Root MSE vaegt Mean Source DF Type III SS Mean Square F Value Pr > F uge <.0001 ryger Standard Parameter Estimate Error t Value Pr > t ryger, uge <.0001 Parameter 95% Confidence Limits ryger, uge Standard Parameter Estimate Error t Value Pr > t Intercept B uge <.0001 ryger ja B ryger nej B... Parameter 95% Confidence Limits Intercept uge ryger ja ryger nej.. Vi ser, at såvel rygning som gestationsalder er signifikante prediktorer for fødselsvægten. Modelkontrollen ser igen rigtig fornuftig ud: 24

25 og figuren nedenfor til illustration af modellen er ikke til at skelne fra den tidligere figur: 25

26 Angiv et estimat for forskellen og sammenlign med det tilsvarende estimat i spørgsmål 4a. Forskellen på rygere og ikke-rygere har kun ændret sig en anelse i forhold til det tidligere resultat fra spørgsmål 4a, og det kunne vi godt have forudset, da vi tidligere har set, at de to grupper føder i stort set samme gestationsuge. Der er altså ikke stor confounding mellem gestationsalder og rygning. Vi estimerer således nu rygere til at føde børn, der i gennemsnit er gram lettere end ikke-rygere, mod g i spørgsmål 4a. Konfidensintervallet her er CI=(19.2, 212.8) gram, hvilket er en anelse smallere end de (4.88, 221.9), som vi fandt i spørgsmål 4a, og dette skyldes, at vi trods alt har elimineret noget af residualvariationen ved at introducere gestationsalderen som kovariat. Husk at argumentere for, hvordan effekten af terminsuge modelleres, og udfør passende modelkontrol. Her skal vi bruge den kopi af gestationsalderen, som vi konstruerede i forbindelse med indlæsningen (ga=uge), og hvis vi indsætter denne som class-variabel, sammen med uge, kan vi få et test for lineariteten: 26

27 title2 SPM 4D ; proc glm data=a1; class ryger ga; model vaegt=uge ga ryger / solution clparm; The GLM Procedure Class Level Information Class Levels Values ryger 2 ja nej ga Number of Observations Read 400 Number of Observations Used 400 Dependent Variable: vaegt Sum of Source DF Squares Mean Square F Value Pr > F Model <.0001 Error Corrected Total R-Square Coeff Var Root MSE vaegt Mean Source DF Type III SS Mean Square F Value Pr > F uge ga ryger Standard Parameter Estimate Error t Value Pr > t Intercept B uge B ga B ga B ga B ga B ga B... ga B... ryger ja B ryger nej B... Parameter 95% Confidence Limits Intercept uge ga ga ga ga ga 41.. ga

28 ryger ja ryger nej.. Vi ser ovenfor, at når vi tager højde for den lineære effekt af gestationsalder (variablen uge), så er det ikke nødvendigt at medtage ga også, hvilket betyder, at der ikke ses afvigelse fra linearitet (P=0.67). Testet er dog ret svagt, da det er på 4 frihedsgrader, og vi kunne i stedet forsøge at se, om en kvadratisk effekt ville beskrive sammenhængen bedre. Til dette formål definerede vi allerede ved indlæsningen en ekstra variabel kvadratled=(ga-40)**2; og denne indsætter vi nedenfor som ekstra kovariat, hvorved vi får et test for linearitet baseret på kun en enkelt frihedsgrad: proc glm data=a1; class ryger; model vaegt=ryger uge kvadratled / solution clparm; SPM 4D+E The GLM Procedure Class Level Information Class Levels Values ryger 2 ja nej Number of Observations Read 400 Number of Observations Used 400 Dependent Variable: vaegt Sum of Source DF Squares Mean Square F Value Pr > F Model <.0001 Error Corrected Total R-Square Coeff Var Root MSE vaegt Mean Source DF Type III SS Mean Square F Value Pr > F ryger uge <.0001 kvadratled

29 Standard Parameter Estimate Error t Value Pr > t Intercept B ryger ja B ryger nej B... uge <.0001 kvadratled Parameter 95% Confidence Limits Intercept ryger ja ryger nej.. uge kvadratled Heller ikke i denne model findes nogen tegn på afvigelse fra linearitet, så vi stiller os tilfreds med modellen anvendt i spørgsmål 4d. I øvrigt er estimaterne for effekten af rygning i de to ovenstående modeller temmelig sammenfaldende med det, vi fandt ovenfor, nemlig hhv (21.4, 216.4) og (20.1, 213.7). (e) Hvad er estimatet for fødselsvægten for et barn med en rygende mor, født i terminsuge 39? Vi inkluderede i modellen i spørgsmål 4d en estimate-sætning: estimate "ryger, uge 39" intercept 1 uge 39 ryger 0 1; og fik outputtet Standard Parameter Estimate Error t Value Pr > t ryger, uge <.0001 Parameter 95% Confidence Limits ryger, uge dvs. med et estimat på gram, med CI=(3295.5, ) gram. Hvor stor spredning er der på fødselsvægten blandt børn af denne type? 29

30 Vi finder i outputtet ovenfor en RootMSE på gram, og ud fra dette kan vi udregne et prediktionsinterval: ± = (2491.4, ) Er det usædvanligt at se en fødselsvægt på under 2700 gram for rygende mødre, der føder i uge 39? Ud fra prediktionsintervallet ovenfor kan vi sige, at 2700 gram ikke er særligt usædvanligt for sådanne børn. (f) Er der tegn på, at effekten af rygning afhænger af gestationsalderen ved fødslen? Her spørges der om, hvorvidt effekten af den ene kovariat afhænger af, hvad den anden er, altså en interaktion. Vi indsætter derfor et interaktionsled i den lineære ANCOVA-model fra spørgsmål 4d. title2 SPM 4F ; proc glm plots=(fitplot DiagnosticsPanel Residuals(smooth)) data=a1; class ryger; model vaegt=uge ryger ryger*uge / solution clparm; hvorved vi får outputtet SPM 4F The GLM Procedure Class Level Information Class Levels Values ryger 2 ja nej Number of Observations Read 400 Number of Observations Used 400 Dependent Variable: vaegt Source DF Type III SS Mean Square F Value Pr > F uge <.0001 ryger

31 uge*ryger Standard Parameter Estimate Error t Value Pr > t Intercept B uge B <.0001 ryger ja B ryger nej B... uge*ryger ja B uge*ryger nej B... Parameter 95% Confidence Limits Intercept uge ryger ja ryger nej.. uge*ryger ja uge*ryger nej.. Med en P-værdi på 0.97 ser det bestemt ikke ud som om effekten af rygning afhænger af gestationsuge ved fødslen. Bemærk, at man i ovenstående model udelukkende kan fortolke det, der har med interaktionsleddet at gøre, idet estimatet for selve rygnings-variablen henviser til en gestationsuge på 0! 5. Udvid nu slutmodellen fra spørgsmål 4 med en ekstra kovariat, nemlig længden af den nyfødte: (a) Overvej, hvordan denne ekstra kovariat ændrer fortolkningen af rygningseffekten. Ved at inkludere fødsleslængden i modellen også, kommer vi til at sammenligne børn af rygende mødre med tilsvarende børn af ikkerygende mødre, hvor ordet tilsvarende dækker over børn født med samme gestationsalder og med samme fødselslængde. Det betyder, at det reelt set ikke mere er vægten, vi sammenligner, men vægten i forhold til højden, altså en form for tykkelse, eller fedme, om man vil. Og det er jo noget helt andet. Hvis børn af rygende mødre vejer mindre, fordi de er kortere, så kunne man forestille sig, at børnene ikke afveg fra hinanden 31

32 forsåvidt angår tykkelsen. Det er altså det, vi ser på nedenfor. (b) Giv et estimat for forskellen i fødselsvægt blandt børn af rygere og ikke-rygere i denne model, og formuler konklusionen i ord, idet I også sammenligner med spørgsmål 4a og 4d. Vi kører altså nu en udvidet model, med en kategorisk kovariat (ryger) og to kvantitative (uge og laengde): title2 SPM 5B+C ; proc glm plots=(diagnosticspanel Residuals(smooth)) data=a1; class ryger; model vaegt=uge laengde ryger / solution clparm; estimate "ryger, uge 39, length=48" intercept 1 uge 39 ryger 1 0 laengde 48; output out=ny5 p=predicted; proc sgpanel data=ny5; panelby uge / rows=2 columns=3; reg Y=predicted X=laengde / group=ryger; SPM 5B+C The GLM Procedure Class Level Information Class Levels Values ryger 2 ja nej Number of Observations Read 400 Number of Observations Used 400 Source DF Type III SS Mean Square F Value Pr > F uge laengde <.0001 ryger Standard Parameter Estimate Error t Value Pr > t ryger, uge 39, length= <.0001 Parameter 95% Confidence Limits 32

33 ryger, uge 39, length= Standard Parameter Estimate Error t Value Pr > t Intercept B <.0001 uge laengde <.0001 ryger ja B ryger nej B... Parameter 95% Confidence Limits Intercept uge laengde ryger ja ryger nej.. Vi finder her effekten af rygning til 21.1 g, CI=(-47.8, 90.0) gram, i modsætning til de tidligere resultater: 4a: (4.88, 221.9) 4d: (19.2, 212.8) I denne model bliver effekten af rygning estimeret til at være væsentlig mindre, og ikke længere signifikant, og vi kan heraf slutte, at fødselslængden er en såkaldt mediator (en medierende effekt) af rygning på fødselsvægten. (c) Hvad er estimatet for fødselsvægten for børn af en rygende mor, født i terminsuge 39 med en fødselslængde på 48 cm? Ovenfor havde vi estimate-sætningen: estimate "ryger, uge 39, length=48" intercept 1 uge 39 ryger 1 0 laengde 48; hvorved vi fik outputtet Standard Parameter Estimate Error t Value Pr > t ryger, uge 39, length= <.0001 Parameter 95% Confidence Limits ryger, uge 39, length=

34 Estimatet for fødselsvægten for 48 cm lange børn af rygende mødre, der er født i uge 39 er altså g, med CI=(2766.8, ) Hvor stor spredning er der på fødselsvægten blandt børn af denne type? Denne aflæses fra RootMSE i outputtet ovenfor til at være gram. Er det usædvanligt at se en fødselsvægt på under 2700 gram for rygende mødre, der føder et 48 cm langt barn i uge 39? Vi udregner prediktionsintervallet: ± = (2218.9, ) og finder således, at det ikke er særligt usædvanligt med en fødselsvægt på kun 2700 gram. Men det er jo også ret korte børn, vi snakker om her. Sammenlign svarene på de ovenstående spørgsmål med de tilsvarende i spørgsmål 4e. I spørgsmål 4e betingede vi ikke med en så kort fødselslængde, og derfor kan det ikke undre, at vi der fik et langt højere estimat, nemlig gram, med prediktionsinterval: ± = (2491.4, )g Denne model er så kompliceret (specielt på grund af de 2 kvantitative kovariater), at modelkontrol her er endnu mere påkrævet end for de tidligere modeller: 34

35 De giver heldigvis ikke anledning til bekymring. Vi kan forsøge at lave en figur af modellen, idet vi opdeler i rygere og ikke-rygere, optegner den estimerede fødselsvægt som funktion af fødselslængden, med en linie for hver gestationsuge (uge): 35

36 Det ses, at længden er af altafgørende betydning for fødselsvægten, medens gestationsuge og moderens rygning spiller en mindre rolle. Men så er spørgsmålet jo, hvilken rolle, moderens rygning spiller for barnets længde...? Reference: Olsen et.al.(2001): The Danish National Birth Cohort - its background, structure and aim. Scand. J. Public Health 29, (2001). 36