Vejledende besvarelse af hjemmeopgave, forår 2015 En stikprøve bestående af 65 mænd og 65 kvinder er blevet undersøgt med henblik på at se på en evt. sammenhæng mellem kropstemperatur og puls. På hjemmesiden http://staff.pubhealth.ku.dk/~lts/basal15_1/hjemmeopgave.html ligger data fra de i alt 130 personer, med variablenavne id: Personens løbenummer (observationsnummer) gender: Personens køn (M: mand, K: kvinde) bodytemp: Personens kropstemperatur (angivet i Fahrenheit) heartrate: Personens puls (slag pr. minut) Opgaven er at se på, om kropstemperatur og puls hænger sammen, samt om der er nogle forskelle på kønnene, enten for hver af disse to variable, eller i deres indbyrdes relation. Vi starter med at indlæse data direkte fra hjemmesiden: data a1; infile "http://staff.pubhealth.ku.dk/~lts/basal/hjemmeopgave/hjemmeopgave.txt" URL firstobs=2; input id gender$ bodytempf heartrate; bodytemp=5*(bodytempf-32)/9; hvorved vi har dannet datasættet med det korte navn a1. Samtidig har vi omregnet fra Fahrenheit til Celcius. 1. Først skal vi se på pulsen blandt kvinderne: (a) Udregn passende størrelser til beskrivelse af fordelingen af puls blandt kvinderne, og suppler med en figur, der illustrerer denne fordeling. For at få medianen med, når vi bruger proc means; må vi skrive lidt mere udførligt, hvad vi gerne vil se. Her har vi (foruden de sædvanlige, altså gennemsnit, spredning, minimum og maximum) valgt at udregne 25, 50 og 75% fraktilerne, idet medianen jo er 1
50% fraktilen. Desuden vil vi gerne have et visuelt indtryk af fordelingen, fordi vi lige om lidt skal udregne et normalområde, så vi tilføjer et sgplot til fremstilling af et histogram med overlejret normalfordelingstæthed: proc means N mean P25 median P75 stddev min max; class gender; var heartrate; proc sgplot data=a1; where gender= K ; histogram heartrate; density heartrate; The MEANS Procedure Analysis Variable : heartrate N gender Obs N Mean 25th Pctl Median 75th Pctl -------------------------------------------------------------------------- K 65 65 74.1538462 68.0000000 76.0000000 80.0000000 M 65 65 73.3692308 70.0000000 73.0000000 78.0000000 -------------------------------------------------------------------------- N gender Obs Std Dev Minimum Maximum ----------------------------------------------------------- K 65 8.1052274 57.0000000 89.0000000 M 65 5.8751841 58.0000000 86.0000000 ----------------------------------------------------------- Vi har brugt konstruktionen class gender; og får derfor oplysningerne for såvel mænd som kvinder, men vi fokuserer her alene på kvinderne. Her ser vi, at gennemsnit og median er rimeligt tæt på hinanden (faktisk ligger medianen højest, hvilket ikke er helt almindeligt, idet det tyder på en fordeling med en hale mod venstre). Til gengæld ligger 25- og 75% fraktilerne ikke helt symmetrisk omkring medianen, men snarere om gennemsnittet. Histogrammet nedenfor viser også tendensen til hale mod venstre, men det tilhørende fraktildiagram (som kommer ud fra T-testet i 2
spørgsmål 1c) ser faktisk ret nydeligt ud. (b) Udregn et 95% normalområde for kvinders puls. Er det almindeligt at støde på kvinder med en puls på 80? Baseret på de ovenstående betragtninger vedrørende fordelingen, ser det ikke helt skævt ud at udregne et normalområde baseret på en normalfordelingsantagelse. Det er i hvert fald ikke muligt at gøre andet, da en direkte udregning af 2.5% og 97.5% fraktiler ville være for ustabil på så lille et datamateriale. Vi udregner derfor efter formlen gennemsnit ± 2 SD og finder 74.154 ± 2 8.105 = (57.044, 90.364) Det er således ganske almindeligt at træffe på kvinder med en puls på 80 (hvilket selvfølgelig også ses direkte af histogrammet). Faktisk så vi også ovenfor, at 75% fraktilen netop var 80, så der er altså 25% af kvinderne, der har en puls, der ligger højere end 80. (c) Nu er en stikprøve på 65 jo ikke alverden, men nok til at give et skøn over middelværdien af puls i den kvindelige befolkning. Angiv et estimat for denne, med 95% konfidensgrænser. Kan middelværdien tænkes at være 80? Dette spørgsmål kunne besvares meget hurtigt ved at tilføje clm i proc means ovenfor, men her benyttes en anden konstruktion, 3
nemlig et T-test til test af hypotesen om middelværdi 80, med tilhørende plot, der illustrerer denne hypotese. Vi skriver proc ttest h0=80 plots(showh0) data=a1; where gender= K ; var heartrate; og finder derved The TTEST Procedure Variable: heartrate N Mean Std Dev Std Err Minimum Maximum 65 74.1538 8.1052 1.0053 57.0000 89.0000 Mean 95% CL Mean Std Dev 95% CL Std Dev 74.1538 72.1455 76.1622 8.1052 6.9120 9.8003 DF t Value Pr > t 64-5.82 <.0001 Bemærk, at T-testet for en gangs skyld ikke er et test for middelværdi 0, fordi vi eksplicit har bedt om at få testet hypotesen om, at middelværdien er 80. Dette ses at blive forkastet med en meget lille P-værdi (P < 0.0001). Svarende til dette har vi da også 95% konfidensintervallet (72.15, 76.16), som klart ikke indeholder 80. På den tilhørende figur nedenfor illustreres fordelingen, dels med en overlejret normalfordelingskurve (den blå) og dels med en såkaldt kerneudglattet tæthed (den røde), der ses at afvige en anelse, svarende til den tidligere konstaterede tendens til hale mod venstre. Forneden på figuren ses desuden et boxplot af fordelingen (lyseblåt) samt konfidensintervallet for middelværdien (grønt). Hypoteseværdien 80 er markeret med en lodret streg, der ligger et godt stykke væk fra konfidensintervallet. Middelværdien af kvinders puls er således ikke 80, men derfor kan der selvfølgelig sagtens være kvinder, der har en puls på 80, eller endda væsentligt over. Det illustrerer forskellen på normalområde 4
(til beskrivelse af enkelt individer) og konfidensinterval (til angivelse af, hvor middelværdien befinder sig). 2. Er der evidens for en systematisk forskel i puls for mænd og kvinder? Her er der lagt op til at sammenligne to gruppers middelværdier for et kvantitativt outcome, dvs. et T-test. Vi har allerede set, at normalfordelingen ser fornuftig ud, og under alle omstændigheder er det ikke specielt kritisk med denne antagelse, når vi bare skal sammenligne to middelværdier. Vi udfører derfor et T-test til sammenligning af mænd og kvinder: proc ttest plots=all data=a1; class gender; var heartrate; og finder outputtet The TTEST Procedure Variable: heartrate gender N Mean Std Dev Std Err Minimum Maximum K 65 74.1538 8.1052 1.0053 57.0000 89.0000 M 65 73.3692 5.8752 0.7287 58.0000 86.0000 Diff (1-2) 0.7846 7.0786 1.2417 5
gender Method Mean 95% CL Mean Std Dev K 74.1538 72.1455 76.1622 8.1052 M 73.3692 71.9134 74.8250 5.8752 Diff (1-2) Pooled 0.7846-1.6722 3.2415 7.0786 Diff (1-2) Satterthwaite 0.7846-1.6745 3.2437 gender Method 95% CL Std Dev K 6.9120 9.8003 M 5.0103 7.1038 Diff (1-2) Pooled 6.3075 8.0661 Diff (1-2) Satterthwaite Method Variances DF t Value Pr > t Pooled Equal 128 0.63 0.5286 Satterthwaite Unequal 116.7 0.63 0.5287 Equality of Variances Method Num DF Den DF F Value Pr > F Folded F 64 64 1.90 0.0110 Vi bemærker, at der er en del mindre spredning i pulsfordelingen hos mænd sammenlignet med kvinder. Dette ses enten af spredningsestimaterne (i T-testet ovenfor, hvor de tillige sammenlignes og findes signifikant forskellige med P=0.011) eller allerede i proc means fra spørgsmål 1. Vi benytter derfor linierne svarende til Satterthwaite og Unequal 6
og finder, at de to middelværdier ikke adskiller sig signifikant fra hinanden (P=0.53). Estimatet for differensen mellem disse middelværdier (kvinder minus mænd) er 0.7846, med et 95% konfidensinterval på (-1.6745, 3.2437). (a) Hvad er P-værdien for test af nulhypotesen om ens middelværdier? P = 0.53 (b) Angiv estimatet for forskellen på de to middelværdier, med 95% konfidensgrænser. 0.7846 CI=( 1.6745, 3.2437) 3. Vi vil studere sammenhængen mellem puls og kropstemperatur, i første omgang for kvinderne alene: Det første, man bør gøre, når man skal se på effekten af en kvantitativ forklarende variabel (kropstemperatur) på en anden kvantitativ variabel (puls), er at tegne. Her er valgt et scatterplot med en såkaldt loess-kurve (en udglattet kurve til beskrivelse af sammenhængen mellem de to variable): proc sgplot data=a1; where gender= K ; loess Y=heartrate X=bodytemp / smooth=1 group=gender; 7
Ud fra den udglattede kurve synes der at være en vis sammenhæng mellem de to variable, men om den er lineær er noget svært at bedømme. Det ser ud som om den knækker ved en kropstemparetur omkring 37 C, men dette tilsyneladende knæk er bestemt af ret få observationer. (a) Under antagelse om en lineær effekt af kropstemperatur på puls ønskes et estimat (med 95% konfidensgrænser) for den forventede puls for en kvinde med en kropstemperatur på 37 1 2 C. Vi udfører nu den lineære regressionsanalyse, idet vi samtidig laver nogle modelkontrol plots samt udregner to ekstra estimater. Det ene af disse er den forventede puls for en kvinde med en kropstemperatur på 37 1 2 C. proc glm plots=diagnosticspanel data=a1; where gender= K ; class gender; model heartrate=bodytemp / solution clparm; estimate forventet ved 37 1/2 grad intercept 1 bodytemp 37.5; estimate effekt af 1/2 grad bodytemp 0.5; Vi finder hermed outputtet: The GLM Procedure Dependent Variable: heartrate Sum of Source DF Squares Mean Square F Value Pr > F Model 1 346.151163 346.151163 5.65 0.0205 Error 63 3858.310375 61.243022 Corrected Total 64 4204.461538 R-Square Coeff Var Root MSE heartrate Mean 0.082329 10.55345 7.825792 74.15385 Standard Parameter Estimate Error t Value Pr > t forventet ved 37 1/2 grad 77.6139141 1.74939038 44.37 <.0001 effekt af 1/2 grad 2.8152152 1.18415079 2.38 0.0205 Parameter 95% Confidence Limits forventet ved 37 1/2 grad 74.1180364 81.1097918 effekt af 1/2 grad 0.4488787 5.1815517 Standard 8
Parameter Estimate Error t Value Pr > t Intercept -133.5272272 87.36130983-1.53 0.1314 bodytemp 5.6304304 2.36830158 2.38 0.0205 Parameter 95% Confidence Limits Intercept -308.1048745 41.0504201 bodytemp 0.8977574 10.3631035 Vi bemærker, at der faktisk er en signifikant effekt af kropstemperatur på puls (P=0.02), og hældningen beskriver, at ved en stigning på 1 C vil pulsen forventeligt stige med 5.63 slag pr. minut. Den forventede puls for kvinder med en kropstemperatur på 37 1 2 C ses at blive estimeret til 77.61, med konfidensgrænser (74.12, 81.11). (b) Hvad er prediktionsgrænserne for kvinder med denne kropstemperatur? Sammenlign dette med normalområdet fra spm 1B. Såvel konfidensgrænser for den estimerede linie, samt prediktionsgrænser illustreres af nedenstående figur. Ved at benytte Root MSE=7.826 fra regressionsanalyse outputtet, kan vi desuden udregne prediktionsgrænserne for kvinder med kropstemperatur 37 1 2 C til 77.614 ± 2 7.826 = (61.962, 93.266) Sammenlignet med normalområdet fra spørgsmål 1B ses dette interval at ligge noget højere (fordi vi ser på kvinder med en høj kropstemperatur), men også at det er en anelse smallere, hvilket 9
skyldes, at vi har forklaret noget af variationen i puls vha kropstemperaturen. (c) Hvad er den forventede effekt på pulsen af en øgning i kropstemperatur på 1 2 C? Vi har umiddelbart estimatet for effekten af en øgning på 1 C, og derfor skal vi bare dividere med 2, men vi kunne også være dovne og bruge estimate-sætningen, som vist ovenfor, hvorved det ses, at svaret er en pulsøgning på 2.82 (0.449, 5.182). (d) Er der nogen indflydelsesrige observationer, du ville kigge nærmere efter i sømmene? På det diagnostiske plot nedenfor ses en figur af Cook s D, plottet mod observationsnummeret. Hvis vi vil have yderligere at vide, må vi tilføje en sætning i vores regressionsanalyse output out=ny cookd=cook; og så efterfølgende f.eks. skrive proc print data=ny; where cook>0.06; Herved ville man finde ud af, at den pågældende observation er kvinde nr. 6 (i den originale nummerering), med en kropstemperatur på 36.3 og en puls på 57. Denne kvinde er farvet rød på scatterplottet ovenfor, og det er måske umiddelbart lidt overraskende, at netop denne kvinde har den største indflydelse, da andre ligger længere fra linien eller mere yderligt i kovariat-værdier. Men der må være tale om en kombination af en lav puls og så det, at hendes kropstempertaur samtidig befinder sig i et område, hvor der ikke er så mange andre, og hver enkelt derfor får en større betydning. Og faktisk er hendes indflydelse heller ikke så meget større end adskillige af de øvriges. 10
4. Definer en dikotom variabel (en 0-1-variabel), der angiver, hvorvidt en person har feber eller ej. Vi sætter grænsen for dette til 37 C. Vi definerer nu en ny variabel kaldet feber ved at tilføje sætningen feber=(bodytemp>37); inden det første i programmet. Her kan det gøre en forskel, om man definerer folk lige på grænsen som havende feber eller ej... (a) Angiv hyppighederne af feber for hvert køn, med 95% konfidensgrænser. Ser de ens ud? Med vores nye variable, der er et 1-tal for folk med feber, og et 0 for folk uden feber, kan vi nu danne en 2-gange-2 tabel, med tilhørende associationsmål for feber og køn: proc freq data=a1; tables gender*feber 11
/ nopercent nocol expected chisq riskdiff relrisk; Herved får vi et ganske stort output, som her er beskåret noget: The FREQ Procedure Table of gender by feber gender feber Frequency Expected Row Pct 0 1 Total ---------+--------+--------+ K 40 25 65 45.5 19.5 61.54 38.46 ---------+--------+--------+ M 51 14 65 45.5 19.5 78.46 21.54 ---------+--------+--------+ Total 91 39 130 Statistics for Table of gender by feber Statistic DF Value Prob ------------------------------------------------------ Chi-Square 1 4.4322 0.0353 Likelihood Ratio Chi-Square 1 4.4780 0.0343 Continuity Adj. Chi-Square 1 3.6630 0.0556 Fisher s Exact Test ---------------------------------- Two-sided Pr <= P 0.0549 Statistics for Table of gender by feber Column 2 Risk Estimates (Asymptotic) 95% (Exact) 95% Risk ASE Confidence Limits Confidence Limits ------------------------------------------------------------------------- Row 1 0.3846 0.0603 0.2663 0.5029 0.2665 0.5136 Row 2 0.2154 0.0510 0.1154 0.3153 0.1231 0.3349 Total 0.3000 0.0402 0.2212 0.3788 0.2228 0.3866 Difference 0.1692 0.0790 0.0144 0.3241 Difference is (Row 1 - Row 2) Estimates of the Relative Risk (Row1/Row2) Type of Study Value 95% Confidence Limits ----------------------------------------------------------------- Case-Control (Odds Ratio) 0.4392 0.2025 0.9526 Cohort (Col1 Risk) 0.7843 0.6228 0.9877 12
Cohort (Col2 Risk) 1.7857 1.0234 3.1157 Sample Size = 130 Vi ser, at der er 38.46% af kvinderne, der har (let) feber, medens der kun er 21.54% af mændene, der har det. Ud af 100 mænd og 100 kvinder, vil vi altså umiddelbart forvente 38.46 21.54 = 16.92 17 flere kvinder end mænd med let feber. (b) Er der evidens for forskel på hyppigheden af let feber blandt mænd og kvinder? Tja, χ 2 -testet giver P = 0.035, men Fishers eksakte test giver P = 0.0549. Baseret på de foventede værdier, der alle er større end 5, må vi godt bruge det approksimative χ 2 -test, men når den kontinuitetskorrigerede version af dette, samt Fishers eksakte test ikke mener, at der er signifikant forskel, så ville jeg ikke satse mange penge på, at den var der. (c) Angiv estimater (med 95% konfidensgrænser) for sammenligning af de to frekvenser, udtrykt dels i form af differensen på febersandsynlighederne og dels i form af odds ratio og relativ risiko for feber. Prøv så vidt muligt at formulere konklusionen i ord. Differensen mellem feberhyppighederne (kvinder minus mænd) aflæses af Column 2 Risk Estimates ovenfor til at være 0.1692, med 95% konfidensinterval (0.0144, 0.3241), altså ca. 17% (1.4%, 32.4%) Denne differens er allerede kommenteret ovenfor. Hvis vi dividerer hyppigheden af feber blandt kvinder med den tilsvarende hyppighed for mænd, har vi estimatet for den relative risiko for feber, for kvinder vs. mænd. Denne ses i afsnittet Estimates of the Relative Risk (Row1/Row2) under Cohort (Col2 Risk), og estimeres altså til 1.78, med 95% konfidensinterval på (1.02, 3.12) Vores bedste gæt er således, at feber er 1.78 gange så hyppigt blandt kvinder i forhold til mænd, men vi er ikke særligt sikre på dette estimat, da den sande værdi også kunne tænkes at være helt ned til ca. 1.02 og op til 3.12, en ganske betragtelig spændvidde. 13
Ratioen 1 ligger lige netop udenfor dette interval, svarende til, at χ 2 -testet gav en signifikant forskel på mænd og kvinder. Vi kan også vælge at udtrykke forskellen som en odds ratio, men denne ses at være angivet som 0.4392, altså mindre end 1. Det er fordi den udtrykker odds for ikke at have feber for kvinder vs. mænd, så for at få den til at være sammenlignelig med den relative risiko ovenfor, er vi nødt til at tage den inverse, altså lave 1 udregningen = 2.28, og tilsvarende for konfidensgrænserne 0.4392 1 (, 1 ) = (1.05, 4.94). 0.9526 0.2025 Odds for at en kvinde har let feber estimeres altså til at være mere end dobbelt så stor som odds for en mand, men igen med ganske brede konfidensgrænser. (d) Kan der være tale om dobbelt så stor risiko for feber for det ene køn? Ja, det så vi ovenfor, idet konfidensintervallet for den relative risiko for feber for kvinder vs. mænd blev fundet til (1.02, 3.12). Der kan altså snildt være en 3 gange så stor risiko for kvinder. 5. I spm 3 så vi på en lineær regression af puls på kropstemperatur for kvinder, men vi skal nu se, om denne linie evt kunne tænkes at have et knæk ved feber-grænsen 37 C: Figuren med den udglattede loess-kurve tydede på en vis affladning, eller måske et knæk. (a) Konstruer en ekstra kovariat, der angiver graden af feber (dvs enten 0 eller kropstemperatur minus 37) og fit en lineær spline. Vi definerer den nye variabel over_feber ved at skrive over_feber=feber*(bodytemp-37); igen inden det første i programmet. Da feber er en 0-1- variabel, vil over_feber være 0 for de, der ikke har feber (fordi 14
vi ganger med 0), men for dem med feber, ganger vi med et 1-tal, dvs. så får vi værdien bodytemp-37, altså hvor mange C, man ligger over febergrænsen. Vi fitter nu den lineære spline (en linie, der knækker i 37 C) ved at benytte såvel bodytemp som over_feber som forklarende variable: proc glm plots=all data=a1; by gender; where gender= K ; model heartrate=bodytemp over_feber / solution clparm; estimate "forventet 37 1/2 grad" intercept 1 bodytemp 37.5 over_feber 0.5; output out=pred p=forventet; I ovenstående kode har vi også tilføjet en estimate-sætning, samt en output-sætning. Disse vil blive kommenteret senere. Der er også tilføjet to sætninger by gender; og where gender= K ;. Vi skal jo kun se på kvinderne, så egentlig ville where gender= K ; være tilstrækkeligt, men by gender; er medtaget for at få overskrift på outputtet, så man kan se, at der kun er tale om kvinderne. Outputtet bliver: gender=k The GLM Procedure Dependent Variable: heartrate Sum of Source DF Squares Mean Square F Value Pr > F Model 2 477.999905 238.999952 3.98 0.0237 Error 62 3726.461634 60.104220 Corrected Total 64 4204.461538 R-Square Coeff Var Root MSE heartrate Mean 0.113689 10.45487 7.752691 74.15385 Source DF Type I SS Mean Square F Value Pr > F bodytemp 1 346.1511633 346.1511633 5.76 0.0194 over_feber 1 131.8487415 131.8487415 2.19 0.1436 Source DF Type III SS Mean Square F Value Pr > F bodytemp 1 431.5005375 431.5005375 7.18 0.0094 over_feber 1 131.8487415 131.8487415 2.19 0.1436 Standard 15
Parameter Estimate Error t Value Pr > t forventet 37 1/2 grad 75.9819019 2.05368433 37.00 <.0001 Parameter 95% Confidence Limits forventet 37 1/2 grad 71.8766454 80.0871584 Standard Parameter Estimate Error t Value Pr > t Intercept -284.4570447 133.6952767-2.13 0.0373 bodytemp 9.7505026 3.6390566 2.68 0.0094 over_feber -10.4097993 7.0284061-1.48 0.1436 Parameter 95% Confidence Limits Intercept -551.7100949-17.2039945 bodytemp 2.4761320 17.0248731 over_feber -24.4593829 3.6397842 (b) Hvad giver denne model som prediktion for pulsen hos en kvinde med kropstemperatur på 37 1 2 C? Sammenlign svaret med det fra spørgsmål 3A. Dette spørgsmål løses med den angivne estimate-sætning: estimate "forventet 37 1/2 grad" intercept 1 bodytemp 37.5 over_feber 0.5; idet kvinder med kropstemperatur på 37 1 2 C ligger 0.5 C over febergrænsen på 37 C Estimatet aflæses til 75.98, med 95% prediktionsgrænser, som udregnes ud fra Root MSE til 75.982 ± 2 7.753 = (60.476, 91.488) I spørgsmål 3A (den simple lineære regression) fik vi dette prediktionsinterval til (61.962, 93.266). I modellen med den lineære spline har vi altså flyttet grænserne lidt nedad, og gjort dem endnu en tak smallere (da vi har reduceret residualvariationen med den ekstra forklarende variabel). (c) Er der evidens for et knæk på linien, og i givet fald i hvilken retning? Nej, der er ikke evidens for et knæk på linien, idet den ekstra forklarende variabel over_feber ikke er signifikant (P = 0.14). 16
Men selvfølgelig kan vi heller ikke udelukke et knæk, idet der jo sagtens kunne være tale om en type 2 fejl. Hvis der er et knæk, vil vi gætte på, at linien knækker til at blive mindre stejl, idet koefficienten til over_feber estimeres til at være negativ. Den estimerede sammenhæng mellem kropstemperatur og puls kan illustreres ved at tegne de predikterede værdier af puls mod kropstemperaturen. Derfor er der ovenfor dannet et nyt datasæt (pred) ved at tilføje sætningen output out=pred p=forventet; Herefter kan vi tegne ved at skrive proc sgplot data=pred; series Y=forventet x=bodytemp; hvorved vi får figuren der klart viser knækket nedad (som dog altså ikke er signifikant). 6. Vi skal nu sammenligne kropstemperaturen for mænd og kvinder: 17
Her er igen lagt op til en sammenligning af to grupper, og variablen bodytemp er kvantitativ, så et T-test vil være det oplagte valg. (a) Lav en passende illustration til at belyse en evt. forskel i kropstemperatur hos mænd og kvinder. Her er brugt plottet fra det efterfølgende T-test, idet det på udmærket vis illustrerer fordelingerne, både med histogram, overlejrede tætheder og box plots. (b) Er der evidens for forskel på middelværdierne for de to køn? T-testet udføres: proc ttest plots=all data=a1; class gender; var bodytemp; og giver outputtet The TTEST Procedure 18
Variable: bodytemp gender N Mean Std Dev Std Err Minimum Maximum K 65 36.8855 0.4130 0.0512 35.7778 38.2222 M 65 36.7248 0.3882 0.0481 35.7222 37.5000 Diff (1-2) 0.1607 0.4008 0.0703 gender Method Mean 95% CL Mean Std Dev K 36.8855 36.7831 36.9878 0.4130 M 36.7248 36.6286 36.8210 0.3882 Diff (1-2) Pooled 0.1607 0.0216 0.2998 0.4008 Diff (1-2) Satterthwaite 0.1607 0.0216 0.2998 Method Variances DF t Value Pr > t Pooled Equal 128 2.29 0.0239 Satterthwaite Unequal 127.51 2.29 0.0239 Equality of Variances Method Num DF Den DF F Value Pr > F Folded F 64 64 1.13 0.6211 Her ses spredningerne at være ret ens i de to grupper (P=0.62 for test af identitet), men middelværdierne ser ikke ens ud (P=0.024), idet kvinder har en noget højere kropstemperatur end mænd. (c) Angiv estimatet (med 95% konfidensinterval) for forskellen i middelværdi for mænd vs. kvinder. Vil du vurdere denne forskel til at være vigtig? Kan den tænkes at skævvride sammenligningen af mænds og kvinders puls (fra spørgsmål 2B)? Forklar. Forskellen i middelværdier ses at blive estimeret til 0.16 C, hvilket ikke synes at være ret meget. Konfidensintervallet går fra 0.02 C til 0.30 C, altså højst svarende til en øgning i puls på ca. 1 1 2 slag pr. minut, hvilket ikke ser vigtigt ud (men som faktisk er en hel del i forhold til den ganske lille forskel, vi tidligere fandt på pulsen for mænd og kvinder). Men som altid skal man huske, at der er tale om to forskellige spørgsmål, alt efter om man foretager den direkte sammenligning af mænds og kvinders puls (som vi gjorde det i spm. 2) eller om man justerer for kropstemperatur (som vi senere gør, når vi inddrager denne som kovariat i spm. 7). 7. Tegn nu pulsmålingen op mod målingen af kropstemperatur, med symboler svarende til køn og indlæg regressionslinier for hvert køn for sig. 19
Koden proc sgplot data=a1; reg Y=heartrate X=bodytemp / group=gender; giver figuren der ikke viser nogen slående forskel på de to regressionslinier. (a) Hvis vi antager samme effekt af kropstemperatur på puls for begge køn, hvor stor er så den forventede øgning i puls ved en temperaturstigning på 1 2 C. Er denne signifikant forskellig fra 0? Og hvor stor er forskellen på kønnene, i sammenligning med resultatet fra spørgsmål 2B? En model, der antager, at effekten af kropstemperatur på puls er den samme for begge køn, er en additiv model, altså en model uden interaktion, med med såvel bodytemp som gender som forklarende variable: proc glm plots=all data=a1; 20
class gender; model heartrate=bodytemp gender / solution clparm; estimate forskel ved 37 1/2 grad gender 1-1; estimate effekt af 1/2 grad bodytemp 0.5; Vi får outputtet The GLM Procedure Class Level Information Class Levels Values gender 2 K M Number of Observations Read 130 Number of Observations Used 130 Dependent Variable: heartrate Sum of Source DF Squares Mean Square F Value Pr > F Model 2 414.153989 207.076995 4.37 0.0146 Error 127 6019.453703 47.397273 Corrected Total 129 6433.607692 R-Square Coeff Var Root MSE heartrate Mean 0.064374 9.333547 6.884568 73.76154 Source DF Type I SS Mean Square F Value Pr > F bodytemp 1 413.9484238 413.9484238 8.73 0.0037 gender 1 0.2055653 0.2055653 0.00 0.9476 Source DF Type III SS Mean Square F Value Pr > F bodytemp 1 394.1462968 394.1462968 8.32 0.0046 gender 1 0.2055653 0.2055653 0.00 0.9476 Standard Parameter Estimate Error t Value Pr > t forskel ved 37 1/2 grad 0.08113686 1.23202625 0.07 0.9476 effekt af 1/2 grad 2.18901563 0.75909620 2.88 0.0046 Parameter 95% Confidence Limits forskel ved 37 1/2 grad -2.35682076 2.51909447 effekt af 1/2 grad 0.68690125 3.69113002 Standard Parameter Estimate Error t Value Pr > t Intercept -87.41303197 B 55.76183019-1.57 0.1195 bodytemp 4.37803127 1.51819240 2.88 0.0046 gender K 0.08113686 B 1.23202625 0.07 0.9476 gender M 0.00000000 B... Parameter 95% Confidence Limits Intercept -197.7556308 22.92956691 bodytemp 1.37380249 7.38226004 gender K -2.35682076 2.51909447 gender M.. 21
Den forventede øgning i puls ved en temperaturstigning på 1 2 C estimeres ved den sidste af de to estimate-sætninger til 2.189, med konfidensinterval (0.687, 3.691), og tilhørende P-værdi P = 0.0046, altså signifikant forskellig fra 0. Der er altså stadig en signifikant effekt af kropstemperatur, selv om vi nu har medtaget mændene, der ses at have en lidt fladere linie. Til gengæld har det forøget antallet af observationer, og dermed medvirket til at sænke P-værdien. Da vi har at gøre med en additiv model, er forskellen på mænd og kvinder antaget at være den samme for alle kropstemperaturer (linierne er antaget at være parallelle). Derfor havde vi slet ikke behøvet den første af de to estimate-sætninger, idet vi bare kunne aflæse estimatet under "gender K". Forskellen (kvinder minus mænd) estimeres til 0.0811( 2.357, 2.519), P = 0.95. Der er altså (stadig) ikke nogen signifikant forskel på mænd og kvinder, når vi sammenligner nogle med samme kropstemperatur, og faktisk er de to linier svære at skelne fra hinanden på plottet nedenfor. (b) Er der evidens for, at relationen mellem kropstemperatur og puls afhænger af, om man er mand eller kvinde? Hvis effekten af kropstemperatur afhænger af, om man er mand eller kvinde, har vi at gøre med interaktion. Så nu vil vi undersøge om der er evidens for interaktion (mellem køn og kropstemperatur) ved at inkludere leddet gender*bodytemp i model-sætningen: 22
proc glm plots=all data=a1; class gender; model heartrate=bodytemp gender gender*bodytemp / solution clparm; estimate forskel ved 37 1/2 grad gender 1-1 gender*bodytemp 37.5-37.5; Herved får vi et masse output: The GLM Procedure Class Level Information Class Levels Values gender 2 K M Number of Observations Read 130 Number of Observations Used 130 Dependent Variable: heartrate Sum of Source DF Squares Mean Square F Value Pr > F Model 3 450.669897 150.223299 3.16 0.0269 Error 126 5982.937795 47.483633 Corrected Total 129 6433.607692 R-Square Coeff Var Root MSE heartrate Mean 0.070049 9.342046 6.890837 73.76154 Source DF Type I SS Mean Square F Value Pr > F bodytemp 1 413.9484238 413.9484238 8.72 0.0038 gender 1 0.2055653 0.2055653 0.00 0.9476 bodytemp*gender 1 36.5159083 36.5159083 0.77 0.3822 Source DF Type III SS Mean Square F Value Pr > F bodytemp 1 377.9320645 377.9320645 7.96 0.0056 gender 1 36.4512179 36.4512179 0.77 0.3826 bodytemp*gender 1 36.5159083 36.5159083 0.77 0.3822 Standard Parameter Estimate Error t Value Pr > t forskel ved 37 1/2 grad 1.94993390 2.46211621 0.79 0.4299 Parameter 95% Confidence Limits forskel ved 37 1/2 grad -2.92252170 6.82238950 Standard Parameter Estimate Error t Value Pr > t Intercept -35.34167668 B 81.4914889-0.43 0.6653 bodytemp 2.96015085 B 2.2188558 1.33 0.1846 gender K -98.18555051 B 112.0633314-0.88 0.3826 gender M 0.00000000 B... bodytemp*gender K 2.67027958 B 3.0450025 0.88 0.3822 bodytemp*gender M 0.00000000 B... Parameter 95% Confidence Limits 23
Intercept -196.6109376 125.92758421 bodytemp -1.43089963 7.35120133 gender K -319.9555889 123.58448790 gender M.. bodytemp*gender K -3.35569083 8.69625000 bodytemp*gender M.. Testet for om interaktionen er 0 giver P = 0.38, så der er altså her ingen evidens for, at de to liniers hældninger skulle være forskellige. Vi bemærker dog (svarende til figuren med de to regresssionslinier), at linien svarende til kvinderne er 2.67 (slag pr. C) stejlere end den for mændene, og den kunne faktisk være helt op til 8.70 stejlere... (c) Hvad er den forventede forskel i puls på en mand og en kvinde med kropstemperatur på 37 1 2 C? Dette ønskes udregnet i to forskellige modeller, nemlig med og uden interaktionen gender*bodytemp. Kommenter forskellen på disse to (og evt. også svaret på spørgsmål 2B). Vi har allerede udregnet dette estimat i den additive model ovenfor, men nu skal vi gøre det i interaktionsmodellen, hvilket er en hel del sværere. Her har vi nemlig to forklarende variable i modellen, der vedrører sammenligningen mellem mænd og kvinder, nemlig dels gender i sig selv og dels interaktionen bodytemp*gender. Vi benytter en (noget indviklet) estimate-sætning: estimate forskel ved 37 1/2 grad gender -1 1 gender*bodytemp -37.5 37.5; Standard Parameter Estimate Error t Value Pr > t forskel ved 37 1/2 grad 1.94993390 2.46211621-0.79 0.4299 Parameter 95% Confidence Limits forskel ved 37 1/2 grad -2.92252170 6.82238950 Dette giver en estimeret forskel på kønnene (kvinder minus mænd) på 1.95, med konfidensgrænser (-2.92, 6.82). Sammenlignet med den additive model springer det først og fremmest i øjnene, at intervallet er blevet meget bredere. Det skyldes, at vi har øget 24
usikkerheden på prediktionerne betragteligt ved at tillade to forskellige hældninger på linierne. Vi sammenfatter de estimerede forskelle på kvinder og mænd (ved en kropstemperatur på 37 1 2 C) i en lille tabel: Spørgsmål Estimeret forskel Konfidensinterval 2B 0.78 (-1.67, 3.24) 7A 0.08 (-2.36, 2.52) 7B 1.95 (-2.92, 6.82) 25