Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013

Transkript

1 Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013 I forbindelse med reagensglasbehandling blev 100 par randomiseret til to forskellige former for hormonstimulation. Herefter blev der udtaget et eller flere æg samt (i princippet) to ægblærevæsker, en fra hver æggestok. Kvaliteten af de udtagne æg blev vurderet, og et antal hormoner blev målt i ægblærevæskerne, heriblandt testosteron (nmol/l) og InhibinB (ng/ml). For 4 kvinder lykkedes det ikke at opnå nogle æg eller ægblærer, og for visse af de 96 resterende var det (af forskellige årsager) ikke muligt at foretage alle hormonbestemmelserne. På hjemmesiden ligger oplysninger på 96 kvinder, dels af den anvendte stimulationsmetode (treat) og dels af de 4 hormonkoncentrationer (to hormoner, på såvel højre som venstre side). Datasættet indeholder ikke individuelle registreringer af kvaliteten af de udtagne æg, men nedenfor ses en opgørelse over fordelingen af lav resp. høj kvalitet af disse, sammenholdt med stimulationsmetoden Ægkvalitet dårlig god Total Treat= Treat= Total I de første 4 spørgsmål fokuserer vi udelukkende på målingerne på venstre side 1. Lav en figur til illustration af forskellene på de to behandlingsgrupper forsåvidt angår testosteron? Udfør på baggrund af denne tegning en sammenligning af de to grupper på passende skala og kvantificer forskellen med konfidensinterval. 1

2 Vi starter med et simpelt scatter plot proc gplot data=a1; plot testo_left*treat; som dog er gjort lidt pænere ved at skrive title spm 1 ; proc gplot data=a1; plot testo_left*treat / frame haxis=axis1 vaxis=axis2; axis1 offset=(8,8) value=(h=3) minor=none label=(h=3); axis2 value=(h=3) minor=none label=(a=90 R=0 H=3); symbol1 v=circle i=none c=blue h=3; Man bemærker her, at fordelingen i begge grupper er en anelse skæv, med en hale mod de høje værdier. Da vi er på vej mod en sammenligning af grupperne med et T-test, forsøger vi at transformere med 2

3 logaritmen for at opnå symmetriske fordelinger (helst normalfordelinger). Her er anvnedt 10-tals logaritmer, men det spiller ingen rolle. Ud fra denne figur ser det fornuftigt ud at foretage et uparret T-test, idet Observationerne antages uafhængige (forskellige kvinder) Der synes at være nogenlunde samme variation i begge grupper Fordelingerne ser rimeligt symmetriske/normalfordelte ud Man kan selvfølgelig supplere med fraktildiagrammer, men det skønnes ikke at være nødvendigt her, ikke mindst fordi fordelingsantagelsen ikke er voldsomt kritisk, hvis vi blot skal sammenligne middelværdier og ikke udtale os om enkeltindivider. Vi udfører så det uparrede T-test: proc ttest data=a1; class treat; var log_testo_left; og får outputtet 3

4 The TTEST Procedure Variable: log_testo_left treat N Mean Std Dev Std Err Minimum Maximum Diff (1-2) treat Method Mean 95% CL Mean Std Dev Diff (1-2) Pooled Diff (1-2) Satterthwaite Method Variances DF t Value Pr > t Pooled Equal Satterthwaite Unequal Equality of Variances Method Num DF Den DF F Value Pr > F Folded F Her ser vi Der indgår i alt 90 personer i vores sammenligning, idet nogle kvinder har manglende værdier for testosteron på venstre side. Spredningerne i de to grupper er meget ens ( hhv , P-værdi for test af identitet af disse er Middelværdierne i de to grupper er ikke signifikant forskellige (P=0.13). Den estimerede forskel på de to behandlinger er (på logaritmisk skala) , med et konfidensinterval på ( , ). Tilbagetransformeres dette, fås et ratio-estimat på = 1.135, altså at treat=1 ligger 13.5% højere end treat=2, med et konfidensinterval på (0.96, 1.34), dvs. svarende til fra 4% under til 24% over. 2. Lav en figur til at illustrere sammenhængen mellem inhibinb og testosteron, begge målt på venstre side (benyt evt. symboler svarende til de to forskellige stimulationer). Udfør på denne baggrund en lineær regressionsanalyse (igen på passende skala), med inhibin (venstre side) som outcome og testosteron (venstre side) som forklarende variabel. Angiv estimater for intercept og hældning med konfidensintervaller samt 4

5 spredning omkring regressionslinien. Giv også, så vidt muligt, fortolkninger af disse. Her er det naturligt at starte med et scatterplot, hvor outcome (inhibin på venstre side) sættes på Y-aksen, medens kovariaten (testosteron på venstre side) sættes på X-aksen. Nedenfor er tilføjet regressionslinier som støtte for vurderingen af rimeligheden af forudsætningerne for at foretage regressionsanalysen. Denne figur viser, at residualerne fra en regressionsanalyse på disse utransformerede data ville have to problemer Residualerne har ikke samme spredning for alle niveuer af outcome, men har derimod en tendens til at være større (numerisk, dvs. både store neagtive og store positive værdier) for de høje (forventede) værdier af outcome. Dette illustreres også ved det trompetagtige udseende af plottet af residualer mod forventede værdier for denne regressionsanalyse på utransformeret skala 5

6 Residualerne er ikke normalfordelte, men har en hale mod de store værdier. Dette illustreres bedst ved et fraktildiagram, der klart har hængekøjefacon I lyset af disse problemer, vil vi transformere vores outcome med en logaritme, og vi holder os til 10-tals logaritmen. Der er ikke noget i de ovenstående problemer, der indikerer, at vi skal transformere vores kovariat. I så fald skulle der fremkomme buer på et plot af residualer mod kovariaten, men da dette fuldstændig vil ligne ovenstående plot mod de forventede værdier (bortset fra en 6

7 spejling), kan vi allerede ud fra det ovenstående se, at der næppe er nogen problemer med lineariteten. Alligevel kan det rent fortolkningsmæssigt være rimeligt at transformere kovariaten også, da der i begge tilfælde er tale om koncentrationer. Vi vil derfor her vise begge muligheder, og de forskellige fortolkninger, de fører til. Først situationen, hvor kovariaten (testosteron, venstre side) ikke er logaritmeret: med den tilhørende regressionsanalyse: proc glm data=a1; model log_inhibin_left = testo_left / solution clparm; The GLM Procedure Number of Observations Read 96 Number of Observations Used 89 The GLM Procedure 7

8 Dependent Variable: log_inhibin_left Sum of Source DF Squares Mean Square F Value Pr > F Model <.0001 Error Corrected Total R-Square Coeff Var Root MSE log_inhibin_left Mean Standard Parameter Estimate Error t Value Pr > t Intercept <.0001 testo_left <.0001 Parameter 95% Confidence Limits Intercept testo_left Vi er nu nede på 89 observationer i analysen, idet der yderligere er røget en ud på grund af manglende værdier for inhibin på venstre side. Estimatet for interceptet ses at være med tilhørende konfidensinterval (1.750, 2.067), men dette er helt meningsløst, da det refererer til en testosteronværdi på 0. Estimatet for hældningen er , med et konfidensinterval på ( , ) og dette viser tydeligt den negative association mellem de to hormonværdier. Hvis vi omsætter relationen til den oprindelige skala, har vi inhibin = 10 ( testosteron) = testosteron Fortolkningen af den tilbagetransformerede hældning = 0.97 er altså, at hver gang testosteron øges med 1 enhed, så falder inhibin med 3%. Hvis testosteron øges med 10 enheder, bliver den tilsvarende faktor = = 0.73, altså et fald på 27%. Estimatet for spredningen omkring regressionslinien er , og dette skal bruges til konstruktion af normalområder. Man kan godt tilbagetransformere denne spredning, men så bliver det hele meget sværere. Det er bedst (lettest) at udregne normalområder på logaritmisk skala og så tilbagetransformere endepunkterne. Dette skal vi gøre i spørgsmål 3 nedenfor. 8

9 Hvis vi også logaritmetransformerer kovariaten testosteron: og dernæst laver regressionsanalysen proc glm data=a1; model log_inhibin_left = log_testo_left / solution clparm; finder vi outputtet The GLM Procedure Number of Observations Read 96 Number of Observations Used 89 The GLM Procedure Dependent Variable: log_inhibin_left Sum of Source DF Squares Mean Square F Value Pr > F Model <.0001 Error Corrected Total R-Square Coeff Var Root MSE log_inhibin_left Mean

10 Standard Parameter Estimate Error t Value Pr > t log-inhibin for testo <.0001 Parameter 95% Confidence Limits log-inhibin for testo Standard Parameter Estimate Error t Value Pr > t Intercept <.0001 log_testo_left <.0001 Parameter 95% Confidence Limits Intercept log_testo_left Estimatet for interceptet ses at være med tilhørende konfidensinterval (2.350, 3.410), men dette er næsten ligeså meningsløst som ovenfor, idet det refererer til en testosteronværdi på 1 (fordi logaritmen til 1 er 0). Estimatet for hældningen er , med et konfidensinterval på ( 1.341, 0.587), som igen viser den negative association mellem de to hormonværdier. Hvis vi omsætter relationen til den oprindelige skala, har vi denne gang inhibin = 10 ( log10(testosteron)) = testosteron altså meget tæt på en omvendt proportionalitet. I dette tilfælde er det således ikke strengt nødvendigt at tilbagetransformere hældningen. Gør man det alligevel, får man effekten af at 10-doble testosteronværdien, = 0.11, altså at inhibin falder med 89% eller til 11% af hvad den var før. Interessant er det, at når begge variable (outcome såvel som kovariat) logaritmetransformeres, så får man samme hældning uanset hvilken logaritme, man benytter (blot man selvfølgelig benytter samme logaritme på begge). Det betyder, at man også direkte kan se effekten af en fordobling af testosteronværdien, nemlig en faktor = 0.51, på inhibin-værdien, altså et fald til ca. halvdelen, netop svarende til den omvendte proportionalitet. Estimatet for spredningen omkring regressionslinien er , næsten fuldstændigt det samme som ovenfor (0.3026), så det er svært på denne 10

11 baggrund at sige, hvilken model, der er bedst. Vi kan lige med et par residualplots (svarende til dem ovenfor for den utransformerede outcome variable) sikre os, at vores model ser fornuftig ud. Det ses, at forudsætningerne ser fornuftige ud, idet residualerne har nogenlunde samme spredning uanset niveauet af outcome variablen, og at de er nogenlunde normalfordelte. Samme konklusion fås fra modelkontrol i tilfælde af, at kovariaten ikke er logaritmetransformeret. 11

12 3. Hvad er den forventede værdi af inhibinb for en kvinde med en testosteron på 30? Og hvad er normalområdet for sådanne kvinder? Er det usædvanligt at se en kvinde med en inhibinb-værdi på 100 og en testosteron-værdi på 30? I modellen, hvor kovariaten testosteron er utransformeret, finder vi den ønskede predikterede værdi ved hjælp af en estimate-sætning: proc glm data=a1; model log_inhibin_left = testo_left / solution clparm; estimate log-inhibin for testo 30 intercept 1 testo_left 30; som giver de ekstra linier Standard Parameter Estimate Error t Value Pr > t log-inhibin for testo <.0001 Parameter 95% Confidence Limits log-inhibin for testo Den predikterede inhibin værdi er således = 31.0, og normalområdet på logaritmisk skala er ± = (0.886, 2.097) Da dette indeholder 2 = log 10 (100) er kombinationen ikke usædvanlig. Vi kan også tilbagetransformere normalområdet til 10 (0.886,2.097) = (7.69, ), som jo indeholder 100. I modellen hvor testosteron også er logaritmetransformeret, skal vi lige huske at benytte den transformerede værdi i estimate-sætningen, altså log10(30)=1.477 proc glm data=a1; model log_inhibin_left = log_testo_left / solution clparm; estimate log-inhibin for testo 30 intercept 1 log_testo_left 1.477; 12

13 hvorved vi finder Standard Parameter Estimate Error t Value Pr > t log-inhibin for testo <.0001 Parameter 95% Confidence Limits log-inhibin for testo Den predikterede inhibin værdi er her = 28.5, og normalområdet på logaritmisk skala er ± = (0.849, 2.062). Da dette indeholder 2 = log 10 (100) er kombinationen ikke usædvanlig. Vi kan også tilbagetransformere normalområdet til 10 (0.849,2.062) = (7.06, ), som jo indeholder 100. Hvis man havde gennemført disse beregninger i en model, hvor inhibin ikke var logaritmetransformeret, ville man have fået et normalområde, der indeholdt negative værdier. Dette bør altid lede til eftertanke om, hvad der er galt med modellen!! Bemærk i øvrigt, at det i dette spørgsmål er vigtigt om normalfordelingen og den konstante varians (spredning) holder, idet vi udtaler os om enkeltobservationer. I de to næste spørgsmål fokuserer vi på prediktion af inhibin målinger på venstre side. I spørgsmål 2 ovenfor predikterede vi denne ud fra testosteron på venstre side, men nu inddrager vi også hormoner målt på højre side som forklarende variable. 4. Er testosteron værdien på højre side ligeså god til at prediktere som testosteron på venstre side var (i spørgsmål 2)? Vi springer over scatterplot, modelkontrol osv., da dette helt følger overvejelserne fra forrige spørgsmål. Endvidere ser vi kun på situationen, hvor kovariaten også er logaritmetransformeret. 13

14 proc glm data=a1; model log_inhibin_left = log_testo_right / solution clparm; estimate log-inhibin for testo 30 intercept 1 log_testo_right 1.477; som giver outputtet The GLM Procedure Number of Observations Read 96 Number of Observations Used 84 The GLM Procedure Dependent Variable: log_inhibin_left Sum of Source DF Squares Mean Square F Value Pr > F Model Error Corrected Total R-Square Coeff Var Root MSE log_inhibin_left Mean Standard Parameter Estimate Error t Value Pr > t log-inhibin for testo <.0001 Parameter 95% Confidence Limits log-inhibin for testo Standard Parameter Estimate Error t Value Pr > t Intercept <.0001 log_testo_right Parameter 95% Confidence Limits Intercept log_testo_right Med højre sides testosteronværdi som kovariat bliver spredningen omkring regressionslinien estimeret til , altså noget større end før (hvor vi fik ). Det lyder umiddelbart meget rimeligt, at venstresiden er bedre til at prediktere venstresiden af inhibin. Bemærk dog lige, at vores sammenligning strengt taget ikke er helt fair, idet vi i denne sidste analyse er helt nede på 84 observationer i 14

15 alt. Det skyldes formentlig, at analysen nu involverer målinger fra såvel højre som venstre side, med deraf følgende større risiko for manglende værdier. Vi kan også prøve at lade begge værdier indgå som kovariater på samme tid: proc glm data=a1; model log_inhibin_left = log_testo_left log_testo_right / solution clparm; og finder så: The GLM Procedure Number of Observations Read 96 Number of Observations Used 84 Dependent Variable: log_inhibin_left Sum of Source DF Squares Mean Square F Value Pr > F Model <.0001 Error Corrected Total R-Square Coeff Var Root MSE log_inhibin_left Mean Standard Parameter Estimate Error t Value Pr > t Intercept <.0001 log_testo_left log_testo_right Parameter 95% Confidence Limits Intercept log_testo_left log_testo_right altså en virkelig klar indikation af, hvilken prediktor, der er bedst, da venstreside målingerne er en stærkt signifiknat prediktor, medens højreside målingerne ikke tilføjer noget signifikant til prediktionsevnen, når man allerede kender venstreside målingerne. 15

16 5. Hvis vi også udnytter information om inhibin niveauet på højre side som forklarende variabel, har vi da nogen glæde af at kende de to testosteron målinger? Ovenfor så vi, at venstre sides testosteron målinger predikterede bedre end højre sides, men det virker endnu mere oplagt, at inhibin målingerne på modsatte side skulle prediktere bedst. Vi afprøver dette ved at inddrage alle tre mulige kovariater i en regressionsmodel: proc glm data=a1; model log_inhibin_left = log_inhibin_right log_testo_left log_testo_right / solution clparm; og finder derved outputtet The GLM Procedure Number of Observations Read 96 Number of Observations Used 84 Dependent Variable: log_inhibin_left Sum of Source DF Squares Mean Square F Value Pr > F Model <.0001 Error Corrected Total R-Square Coeff Var Root MSE log_inhibin_left Mean Standard Parameter Estimate Error t Value Pr > t Intercept log_inhibin_right <.0001 log_testo_left log_testo_right Parameter 95% Confidence Limits Intercept log_inhibin_right log_testo_left log_testo_right

17 Som vi kan se, har vi i hvert fald ikke meget glæde af at kende testosteronværdien på højre side, så denne udelader vi, hvorved vi får The GLM Procedure Dependent Variable: log_inhibin_left Sum of Source DF Squares Mean Square F Value Pr > F Model <.0001 Error Corrected Total R-Square Coeff Var Root MSE log_inhibin_left Mean Standard Parameter Estimate Error t Value Pr > t Intercept <.0001 log_inhibin_right <.0001 log_testo_left Parameter 95% Confidence Limits Intercept log_inhibin_right log_testo_left Vi ser, at der stadig ligger noget information i at kende testosteron værdien på venstre side. I denne model er residualspredningen , altså en del lavere end modellen uden inhibin højre side som kovariat. Bemærk, at man ikke bør sammenligne R 2 -værdierne for modeller, der ikke har det samme antal kovariater, da denne altid vil være mindre, når der er flere kovariater med. Til sammenligning får vi en residualspredning på , hvis vi udelukkende medtager højresidige inhibin målinger som kovariat, se nedenfor: proc glm data=a1; model log_inhibin_left = log_inhibin_right / solution clparm; 17

18 The GLM Procedure Dependent Variable: log_inhibin_left Sum of Source DF Squares Mean Square F Value Pr > F Model <.0001 Error Corrected Total R-Square Coeff Var Root MSE log_inhibin_left Mean Standard Parameter Estimate Error t Value Pr > t Intercept <.0001 log_inhibin_right <.0001 Parameter 95% Confidence Limits Intercept log_inhibin_right For en ordens skyld skal vi lige overbevise os selv om, at den multiple regressionsmodel overhovedet var rimelig, dvs. vi skal udføre de sædvanlige modelkontroltegninger. Det drejer sig om residualer plottet mod hver af kovariaterne (her kun vist for de to vigtigste), residualer plottet mod forventede værdier af outcome samt fraktildiagram over residualerne. I de to næste spørgsmål fokuserer vi på sideforskelle for testosteron 6. Beskriv den naturligt forekommende variation i testosteron mellem en kvindes to æggestokke, evt opdelt efter behandlingsgruppe, hvis dette skønnes relevant. Kvantificer ved hjælp af limits of agreement på den relevante skala. Når vi skal beskrive variationen mellem hormon niveauerne på højre og venstre side, er det oplagt at tage udgangspunkt i forskellene på de to sider og kvantificere størrelsen af disse. Først skal man først sikre sig, at det er fornuftigt at se på differenser, dvs. om størrelsen af disse er nogenlunde uafhængigt at hormon niveauet. Dette gør vi ved hjælp af et Bland-Altman plot, som blot er et scatter plot af differenserne mellem højre og venstre, plottet mod gennemsnittet af de selvsamme værdier: 18

19 data a1; set a1; dif_testo=testo_right-testo_left; snit_testo=(testo_left+testo_right)/2; dif_log_testo=log_testo_right-log_testo_left; snit_log_testo=(log_testo_left+log_testo_right)/2; proc gplot data=a1; plot dif_testo*snit_testo=treat / vref=0 lv=33 nolegend frame haxis=axis1 vaxis=axis2; axis1 offset=(8,8) value=(h=3) minor=none label=(h=3); axis2 value=(h=3) minor=none label=(a=90 R=0 H=3); symbol1 v=circle i=none c=blue h=3 w=3 l=1 r=1; symbol2 v=star i=none c=red h=3 w=3 l=1 r=2; 19

20 som giver plottet Her ses en klar trompetfacon, svarende til, at differenserne klart bliver (numerisk) større ved de højere koncentrationer. Forskellen mellem højre og venstre er derfor bedre udtrykt i relative termer, altså som procentvise forskelle, så også her skal vi se på logaritmetransformerede data: Her ser det pænere ud, pånær en enkelt outlier, så på denne skala vil 20

21 vi kvantificere differenserne, enten for hver behandling for sig (det gør vi ikke her), eller fælles for begge behandlinger. Bemærk, at forudsætningerne om de ens spredninger (Bland-Altman plottet) og normalfordelingsantagelsen (fraktildiagrammet nedenfor) her er meget vigtigere end i de tidligere spørgsmål (med undtagelse af spørgsmål 3), idet vi her vil udtale os om enkeltindivider og ikke blot gruppegennemsnit. For at kvantificere differenserne, udregner vi de relevante summary statistics: proc means N Nmiss mean std data=a1; var dif_log_testo; og får outputtet The MEANS Procedure Analysis Variable : dif_log_testo N N Miss Mean Std Dev

22 Ud fra gennemsnit og spredning af differenserne på logaritmsik skala, udregner vi limits of agreement: ± = ( , ), som tilbagetransformeret giver estimatet = 1.02 for ratio mellem siderne, med tilhørende limits of agreement 10 ( , ) = (0.58, 1.80) Vi kan således konkludere, at 95% af forskellene højre/venstre ligger mellem ratioerne 0.58 og 1.80, svarende til at højre æggestok ligger mellem 42% under til 80% over venstre æggestok. Da der næsten ikke er nogen systematisk forskel (højre æggestok ligger i gennemsnit kun 2% højere end venstre æggestok), ville vi finde ganske det tilsvarende, hvis vi var startet med at se på forskelle den anden vej, altså venstre-højre. Dette virker måske sært pga de tilsyneladende asymmetriske grænser, men man skal tænke på, at hvis højre side ligger 80% over venstre side (svarende til f.eks. 20 og 36), så ligger venstre side 16/ = 44.4% under højre side. 7. Er der systematisk forskel på testosteronværdierne på højre og venstre side? Kvantificer på passende skala, med konfidensinterval, og giv en fortolkning. Dette spørgsmål besvares ved at udføre et T-test. Dette kan gøres ved hjælp af proc means, og hvis man bruger option clm, får man også konfidensintervallet med. proc means N Nmiss mean stderr clm probt; var dif_log_testo; med outputtet The MEANS Procedure Analysis Variable : dif_log_testo 22

23 N Lower 95% Upper 95% N Miss Mean Std Error CL for Mean CL for Mean Pr > t Vi finder ingen signifikant forskel (P=0.46). For at se, om vi burde behandle de to grupper hver for sig, kunne vi se på et scatter plot af de to sæt differenser: eller måske endda et uparret T-test af de to (idet forudsætningerne for et sådant ses at være rimelige udfra ovenstående plot): proc ttest data=a1; class treat; var dif_log_testo; The TTEST Procedure Variable: dif_log_testo 23

24 treat N Mean Std Dev Std Err Minimum Maximum Diff (1-2) treat Method Mean 95% CL Mean Std Dev Diff (1-2) Pooled Diff (1-2) Satterthwaite Method Variances DF t Value Pr > t Pooled Equal Satterthwaite Unequal Equality of Variances Method Num DF Den DF F Value Pr > F Folded F som viser, at det ikke er særligt påkrævet at opdele (P = 0.14 for identitet af middelværdier for de to sæt differenser, P = 0.14 for identitet af de tilsvarende varianser). Testet for ingen forskel mellem højre og venstre kan naturligvis også udføres som et T-test, men nu er der tale om et parret T-test. Dette kan udføres enten som et one-sample T-test på differenserne (på logaritmisk skala), eller som et parret T-test på de to sider (igen logaritmetransformeret): proc ttest; var dif_log_testo; proc ttest data=a1; paired log_testo_left*log_testo_right; og som output fås nedenstående The TTEST Procedure Variable: dif_log_testo 24

25 N Mean Std Dev Std Err Minimum Maximum Mean 95% CL Mean Std Dev 95% CL Std Dev DF t Value Pr > t The TTEST Procedure Difference: log_testo_left - log_testo_right N Mean Std Dev Std Err Minimum Maximum Mean 95% CL Mean Std Dev 95% CL Std Dev DF t Value Pr > t Vi finder (selvfølgelig ganske som ovenfor) ingen signifikant forskel (P=0.46). Den estimerede forskel (højre minus venstre) er (på logaritmisk skala) , med et konfidensinterval på ( , ). Tilbagetransformeres dette, fås som før ratio-estimatet på 1.02, nu med 95% konfidensinterval på (0.96, 1.09). Det betyder, at værdierne på højre side i gennemsnit ligger 2% over de tilsvarende i venstre side, men usikkerheden på dette estimat viser, at det ligeså godt kunne dreje sig om 9% over, eller 4% under. I de to sidste spørgsmål ser vi på ægkvaliteten, som givet i to gange to tabellen på forsiden. 8. Giv et estimat for sandsynligheden for høj ægkvalitet, for hver af de to stimulationsmetoder hver for sig. Ser de to estimater forskellige ud? Først skal vi indlæse disse ekstra data i en to gange to tabel, og udregne de relevante procenter. Vi sætter tabellen op, så behandlingerne (treat) er rækkerne, og udfaldene (hhv. god(1) og dårlig(0) ægkvalitet) er kolonnerne. De relevante procenter er således rækkeprocenter, og vi undertrykker derfor de øvrige: 25

26 data a1; input treat kvalitet antal; cards; ; title spm 8 ; proc freq data=a1; tables treat*kvalitet / nopercent nocol; weight antal; Dette giver os output i form af tabellen The FREQ Procedure Table of treat by kvalitet treat kvalitet Frequency Row Pct 0 1 Total Total hvoraf vi aflæser, at treatment 1 har en estimeret sandsynlighed for god ægkvalitet på 58.82%, hvorimod treatment 2 ligger helt oppe på 68.89%, altså noget højere. 9. Lav et test for om kvaliteten af de udtagne æg afhænger af stimulationsmetoden. Kvantificere forskellen, dels som en forskel på de to sandsynligheder fundet ovenfor og dels som en odds ratio. Husk i begge tilfælde 26

27 at supplere med et konfidensinterval. Kan vi udelukke, at der er dobbelt så stor sandsynlighed (eller odds) for at have god ægkvalitet i den ene gruppe i forhold til den anden? Vi udvider vores analyse af to gange to tabellen med et par ekstra options: expected: De forventede counts i hver celle, under hypotesen om ingen forskel på behandlingerne. dem skal vi bruge til at vurdere om Chi-i-anden testet er tilladeligt at udføre chisq: Chi-i-anden testet skal udskrives riskdiff: Estimater for forskellen mellem sandsynlighederne for god ægkvalitet skal udskrives relrisk: Estimat for den relative risiko skal udskrives title spm 8 ; proc freq data=a1; tables treat*kvalitet / nopercent nocol expected chisq riskdiff relrisk; weight antal; som giver outputtet The FREQ Procedure Table of treat by kvalitet treat kvalitet Frequency Expected Row Pct 0 1 Total Total

28 Statistics for Table of treat by kvalitet Statistic DF Value Prob Chi-Square Likelihood Ratio Chi-Square Continuity Adj. Chi-Square Mantel-Haenszel Chi-Square Phi Coefficient Contingency Coefficient Cramer s V Fisher s Exact Test Cell (1,1) Frequency (F) 21 Left-sided Pr <= F Right-sided Pr >= F Table Probability (P) Two-sided Pr <= P Column 1 Risk Estimates (Asymptotic) 95% (Exact) 95% Risk ASE Confidence Limits Confidence Limits Row Row Total Difference Difference is (Row 1 - Row 2) The FREQ Procedure Statistics for Table of treat by kvalitet Column 2 Risk Estimates (Asymptotic) 95% (Exact) 95% Risk ASE Confidence Limits Confidence Limits Row Row Total Difference Difference is (Row 1 - Row 2) Estimates of the Relative Risk (Row1/Row2) Type of Study Value 95% Confidence Limits Case-Control (Odds Ratio) Cohort (Col1 Risk) Cohort (Col2 Risk)

29 Sample Size = 96 Vi ser af såvel χ 2 -test og Fishers eksakte test, at der ikke er signifikant forskel på ægkvaliteten for de to behandlinger (P=0.31 hhv. 0.40). De forventede antal er alle et pænt stykke over de krævede 5 (minimum 16.4), så det er ikke nødvendigt at lave Fishers eksakte test, da chi-ianden approksimationen er god nok. Den estimerede forskel på de to sandsynligheder for god ægkvalitet (Column 2 risk) er (= ), altså 10 procentpoint, med konfidensgrænser (-0.09,0.29). Der kan altså med rimelighed være op til 29% større sandsynlighed for god ægkvalitet for treatment 2. Odds ratio estimeres til med konfidensinterval (0.667, 3.598), og dette indeholder et 2-tal. Det samme er tilfældet for den relative risiko for dårlig ægkvalitet (Col1 Risk), men ikke for god ægkvalitet (Col2 Risk). Man kan derfor ikke sige, at sandsynligheden for god ægkvalitet kan være dobbelt så stor i den ene gruppe i forhold til den anden, men man kan sige, at den ene gruppe (gruppe 2) kan have dobbelt så store odds for god ægkvalitet. 29