Basal statistik. Logaritmer og kovariansanalyse. Sammenligning af målemetoder. Scatter plot af de to metoder. Faculty of Health Sciences

Relaterede dokumenter
Faculty of Health Sciences. Basal statistik. Logaritmer, Repetition, Kovariansanalyse, Interaktion. Lene Theil Skovgaard. 12.

Basal statistik. Logaritmer og kovariansanalyse. Sammenligning af målemetoder. Scatter plot af de to metoder. Faculty of Health Sciences

Faculty of Health Sciences. Basal statistik. Logaritmer, Repetition, Kovariansanalyse, Interaktion. Lene Theil Skovgaard. 1.

Basal statistik. Logaritmer og kovariansanalyse. Nyt eksempel vedr. sammenligning af målemetoder. Scatter plot af de to metoder

Faculty of Health Sciences. Basal statistik. Logaritmer. Kovariansanalyse. Lene Theil Skovgaard. 29. september 2015

Basal statistik. Logaritmer og kovariansanalyse. Sammenligning af målemetoder. Scatter plot af de to metoder. Faculty of Health Sciences

Basal statistik. 21. oktober 2008

Basal statistik. 30. oktober 2007

Basal statistik. 30. oktober Den generelle lineære model

Vejledende besvarelse af hjemmeopgave, forår 2016

Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger

Øvelser til basalkursus, 5. uge. Opgavebesvarelse: Knogledensitet hos unge piger

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper.

Vejledende besvarelse af hjemmeopgave i Basal Statistik, forår 2014

Vejledende besvarelse af hjemmeopgave, efterår 2018

Basal Statistik. En- og to-stikprøve problemer. Eksempel på parrede data. Eksempel på parrede data. Faculty of Health Sciences

Faculty of Health Sciences. Basal Statistik. T-tests. Lene Theil Skovgaard. 17. september 2013

Opgavebesvarelse, Basalkursus, uge 2

Phd-kursus i Basal Statistik, Opgaver til 2. uge

Vejledende besvarelse af hjemmeopgave, forår 2018

Besvarelse af vitcap -opgaven

Opgavebesvarelse, brain weight

Vejledende besvarelse af hjemmeopgave, forår 2015

Lineær og logistisk regression

MPH specialmodul Epidemiologi og Biostatistik

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april

Vejledende besvarelse af hjemmeopgave, efterår 2016

Besvarelse af opgave om Vital Capacity

Afdeling for Anvendt Matematik og Statistik Januar Regressionsanalyse i SAS 2. Regressionsanalyse med GLM Sammenligning af regressionslinier

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer.

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model

Faculty of Health Sciences. Basal Statistik. Begreber. Parrede sammenligninger. Lene Theil Skovgaard. 6. september 2016

Opgavebesvarelse, brain weight

Eksamen i Statistik for Biokemikere, Blok januar 2009

Vejledende besvarelse af hjemmeopgave

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Basal statistik for lægevidenskabelige forskere, forår 2012 Udleveret 6.marts, afleveres senest ved øvelserne i uge 15 (

Vejledende besvarelse af hjemmeopgave, forår 2017

Besvarelse af opgave om Vital Capacity

Basal Statistik - SPSS

Regressionsanalyse i SAS

Epidemiologi og Biostatistik

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved

Vejledende besvarelse af hjemmeopgave, efterår 2015

Vi ønsker at konstruere normalområder for stofskiftet, som funktion af kropsvægten.

Basal Statistik - SPSS

Basal Statistik. Simpel lineær regression. Simpel lineær regression. Data. Faculty of Health Sciences

Faculty of Health Sciences. Logistisk regression: Kvantitative forklarende variable

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk

Opgavebesvarelse, korrelerede målinger

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse

Basal statistik. 16. september 2008

Basal statistik for sundhedsvidenskabelige forskere, efterår 2014 Udleveret 30. september, afleveres senest ved øvelserne i uge 44 (

Variansanalyse i SAS. Institut for Matematiske Fag December 2007

Filen indeholder 45 linier, først en linie med variabelnavnene (bw og rmr) og derefter 44 datalinier, hver med disse to oplysninger.

Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge

Besvarelse af juul2 -opgaven

Basal statistik for lægevidenskabelige forskere, forår Udleveret 12. marts, afleveres senest ved øvelserne i uge 14 (2.-4.

Vejledende besvarelse af hjemmeopgave, efterår 2017

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Vi vil analysere effekten af rygning og alkohol på chancen for at blive gravid ved at benytte forskellige Cox regressions modeller.

Løsning til øvelsesopgaver dag 4 spg 5-9

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom

Generelle lineære modeller

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

Basal statistik 19. september Eksempel: To metoder, som forventes at skulle give samme resultat:

Basal Statistik. Sammenligning af grupper. Vitamin D eksemplet. Praktisk håndtering af data. Faculty of Health Sciences

Faculty of Health Sciences. Basal Statistik. Sammenligning af grupper, Variansanalyse. Lene Theil Skovgaard. 7. februar 2017

Basal statistik. 18. september 2007

Basal statistik for sundhedsvidenskabelige forskere, efterår 2015 Udleveret 29. september, afleveres senest ved øvelserne i uge 44 (

Basal statistik. 18. september 2007

1 Hb SS Hb Sβ Hb SC = , (s = )

Eksempel: To metoder, som forventes at skulle give samme resultat: MF: Transmitral volumetric flow, bestemt ved Doppler ekkokardiografi

Faculty of Health Sciences. Basal statistik. Den generelle lineære model mv. Lene Theil Skovgaard. 14. marts 2017

Basal Statistik. Simpel lineær regression. Simpel lineær regression. Data. Faculty of Health Sciences

Basal statistik for lægevidenskabelige forskere, forår Udleveret 12. februar, afleveres senest ved øvelserne i uge 10 (6.-9.

Lineær regression i SAS. Lineær regression i SAS p.1/20

Faculty of Health Sciences. Basal Statistik. Regressionsanalyse. Lene Theil Skovgaard. 26. september 2017

Multipel Lineær Regression

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

k normalfordelte observationsrækker (ensidet variansanalyse)

Basal Statistik Variansanalyse. 24 september 2013

Phd-kursus i Basal Statistik, Opgaver til 2. uge

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Module 4: Ensidig variansanalyse

β = SDD xt SSD t σ 2 s 2 02 = SSD 02 f 02 i=1

Reeksamen i Statistik for Biokemikere 6. april 2009

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Reeksamen i Statistik for biokemikere. Blok

Vejledende besvarelse af hjemmeopgave, efterår 2018

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j

Transkript:

Faculty of Health Sciences Logaritmer og kovariansanalyse Basal statistik Logaritmer, Repetition, Kovariansanalyse, Interaktion Lene Theil Skovgaard 4. oktober 2016 Parret sammenligning, målemetoder med logaritmer Tosidet variansanalyse med logaritmer Kovariansanalyse: Eksempel om baseline og follow-up Sammenligning af hældninger Interaktion - igen Hjemmesider: http://biostat.ku.dk/~lts/basal16_2 E-mail: ltsk@sund.ku.dk 1 / 80 2 / 80 Sammenligning af målemetoder Scatter plot af de to metoder (jvf. eksemplet MF vs. SV fra første forelæsning) To forskellige metoder til bestemmelse af glucosekoncentration. Ref: R.G. Miller et.al. (eds): Biostatistics Casebook. Wiley, 1980 REFE: Farvetest, der kan forurenes af urinsyre TEST: Enzymatisk test, mere specifikt for glucose. nr. REFE TEST 1 155 150 2 160 155 3 180 169......... 44 94 88 45 111 102 46 210 188 X 144.1 134.2 SD 91.0 83.2 Det ser jo pænt ud..., eller? 3 / 80 4 / 80

Formål med undersøgelsen Parret sammenligning kunne være: Kan vi erstatte en dårlig metode med en bedre metode? Kan vi erstatte en dyr metode med en billigere metode? Kan vi bruge de to metoder i flæng? Under alle omstændigheder: Hvor store forskelle kan vi forvente at finde mellem de to metoder Og svaret er ikke: Korrelationen er 0.99776... Det er naturligt at se på differenser (dif=refe-test) Kvantificer individuelle differenser: Limits of agreement Test om middelværdien kan være 0: Systematisk forskel? The MEANS Procedure Variable N Mean Std Dev t Value Pr > t --------------------------------------------------------------- dif 46 9.8913043 9.7027562 6.91 <.0001 --------------------------------------------------------------- Med en P-værdi < 0.0001 er der stærk indikation af bias 5 / 80 6 / 80 Limits of agreement Bland-Altman plot På basis af en normalfordelingsantagelse på differenserne finder vi referenceintervallet (normalområdet): Plot af differenser mod gennemsnit (af de to målinger på samme person), se kode s. 71 9.89 ± 2 9.70 = ( 9.51, 29.29) med fortolkningen: Når vi måler med begge metoder på samme person, vil differensen typisk ligge i intervallet (-9.5, 29.3) På tegningen ses, at dette er en dårlig beskrivelse, idet differenserne stiger med niveauet (repræsenteret ved gennemsnittet) variationen stiger også med niveauet Store afvigelser ved høje målinger, dvs. relative afvigelser Så er det smart at se på logaritmer 7 / 80 8 / 80

Scatter plot Bemærk efter logaritmetransformation (her den naturlige ) Det er de oprindelige målinger, der skal logaritmetransformeres, ikke differenserne! Det er ligegyldigt, hvilken logaritmefunktion, der vælges (der er proportionalitet mellem alle logaritmer) Efter logaritmering gentages proceduren med differenser og konstruktion af limits of agreement 9 / 80 10 / 80 Bland-Altman plot for logaritmer Vi udelader en outlier... og laver igen et Bland-Altman plot Der er en tydelig outlier (den mindste observation) 11 / 80 som bliver acceptabelt... 12 / 80

En slags konklusion Konklusion på brugbar facon The MEANS Procedure Variable N Mean Std Dev t Value Pr > t ------------------------------------------------------------- ldif 45 0.0657295 0.0419547 10.51 <.0001 ------------------------------------------------------------- Limits of agreement på logaritmisk skala: 0.066 ± 2 0.042 = ( 0.018, 0.150) Det betyder, at der i 95% af tilfældene vil gælde 0.018 < log(refe) log(test) = log( REFE TEST ) < 0.150 Men hvad kan vi bruge det til? 13 / 80 Vi kan tilbagetransformere med anti-logaritmen (her er det eksponentialfunktionen exp()) og få exp( 0.018) = 0.982 < TEST REFE < 1.162 = exp(0.150) eller omvendt 0.861 < TEST REFE < 1.018 Det betyder: TEST ligger typisk mellem 14% under og 2% over REFE. 14 / 80 Limits of agreement Regninger direkte på ratio-skala tilbagetransformeret til oprindelig skala Med definitionen ratio = refe test får vi: The MEANS Procedure Variable N Mean Std Dev Std Error ------------------------------------------------------------ ratio 46 1.0688607 0.0451184 0.0067259 ------------------------------------------------------------ svarende til limits of agreement: 1.069 ± 2 0.045 = (0.979, 1.159) 15 / 80 altså refe fra 2% under til 16% over test, på 2 decimaler identisk med resultatet for logaritmerne Dette er ikke altid tilfældet!! 16 / 80

Limits of agreement på ratio-skala Terminologi for kvantitativt outcome, f.eks. vitamin D Regressionsanalyse: Kovariaterne er også kvantitative Simpel (lineær) regression: kun en enkelt kovariat Multipel (lineær) regression: to eller flere kovariater Variansanalyse: Kovariaterne er kategoriske (grupper) Ensidet variansanalyse: kun en enkelt kovariat Tosidet variansanalyse: to kovariater Generel lineær model GLM: Begge typer kovariater i samme model Kovariansanalyse: Netop en kvantitativ og en kategorisk kovariat 17 / 80 18 / 80 Sammenligning af to grupper - som ikke er helt sammenlignelige, pga en confounder: En variabel, som har en effekt på outcome er relateret til gruppen (dvs. der er forskel på værdierne i de to grupper) Herved kan opstå bias. Gruppe/behandling Outcome Eksempel: vægt blandt mænd og kvinder Mulig confounder: Højde To forskellige sammenligninger: T-test: Er der forskel på middel vægt blandt mænd og kvinder? Kovariansanalyse: Er der forskel på middel vægt for mænd og kvinder, med samme højde? Kønseffekten korrigeres for forskel i højde: Confounder To forskellige videnskabelige spørgsmål 19 / 80 20 / 80

Eksempel om lungekapacitet, TLC Kan højden forklare forskellen på mænd og kvinder? 32 patienter skal have foretaget hjerte/lunge transplantation TLC: Total Lung Capacity (analyseret på log 10 -skala), Er der forskel på mænd og kvinder? Køn Lungekapacitet Højde Et T-test giver P=0.0009, og en estimeret fordel til mænd på 35% (13-61%), se kode s. 72 Eller er der tillige en ægte kønseffekt? 21 / 80 22 / 80 Relation mellem TLC og HEIGHT Kovariansanalyse Igen på log 10 -skala, kode s. 73 Outcome: TLC, total lungekapacitet, logaritmeret Kovariater: 2 stk: Kode s. 74 Køn (sex) Højde (height), med lineær effekt Standard Parameter Estimate Error t Value Pr > t 95% Confidence Limits Intercept -.3278068826 B 0.26135206-1.25 0.2198 -.8623318537 0.2067180884 sex F -.0421012632 B 0.03520676-1.20 0.2415 -.1141071749 0.0299046484 sex M 0.0000000000 B..... height 0.0066723630 0.00149683 4.46 0.0001 0.0036110089 0.0097337172 Ikke ligefrem oplagt i linearitet i højden, men vi prøver alligevel... 23 / 80 Bemærk: Nu er kønseffekten helt forsvundet! Højden kunne altså godt forklare den...måske 24 / 80

Ancova-fit (parallelle linier) Estimation af kønseffekt Se kode s. 75 i 2 forskellige modeller, nemlig med og uden højde som kovariat Outcome er log10tlc: Kovariater Mænd vs. kvinder ratio (CI) P-værdi kun kønnet 1.35 (1.13, 1.61) 0.0014 køn og 1.10 (0.93, 1.30) 0.24 højde Den observerede forskel i (log 10 ) lungekapacitet mellem mænd og kvinder kan altså tilskrives højdeforskellen mellem kønnene. 25 / 80 26 / 80 Er der så en kønseffekt eller ej? Husk modelkontrol: Ja for mænd og kvinder har jo ikke samme niveau af lungekapacitet men forskellen i niveau kan forklares udfra den højdeforskel, der generelt er mellem mænd og kvinder måske men vi kan ikke påvise forskel mellem en mand og en kvinde med samme højde Se kode s. 75 Højde er en mellemkommende (intermediate) variabel for effekten af køn på lungekapacitet 27 / 80 28 / 80

Additivitet eller interaktion? Vekselvirkning (interaktion) Sammenligning af parallelle regressionslinier: Kovariansanalyse: dækker sædvanligvis over situationen med to parallelle linier, altså med identiske hældninger, også kaldet additivitet Her: Effekten af højde på lungekapacitet antages at være den samme for mænd og kvinder Mere generel model tillader interaktion=vekselvirkning, altså forskellige hældninger. Det betyder: Effekten af højde afhænger af kønnet Forskellen på kønnene afhænger af højden I tilfælde af interaktion kan man ikke udtale sig om en generel effekt af hverken højde eller køn. 29 / 80 Tænkt eksempel: To inddelingskriterier: køn og rygestatus Outcome: FEV 1 Effekten af rygning afhænger af køn Forskellen på kønnene afhænger af rygestatus 30 / 80 Mulige forklaringer Eksempel: Rygnings effekt på fødselsvægt biologisk kønsforskel på effekt af rygning holder vist ikke i praksis, men eksemplet er jo også blot tænkt måske ryger kvinderne ikke helt så meget antal pakkeår confounder for køn måske virker rygningen som en relativ (%-vis) nedsættelse af FEV 1 kunne undersøges ved en longitudinel undersøgelse 31 / 80 32 / 80

Model med interaktion Kode s. 76 Interaktion/vekselvirkning mellem mængden og varigheden af rygningen Der er effekt af mængden, men kun hvis man har røget længe. Der er effekt af varigheden, og denne effekt øges med mængden. Effekten af mængden afhænger af... og effekten af varigheden afhænger af... 33 / 80 34 / 80 Output fra model med interaktion Omregning til de to linier: Kode s. 76 Linie for mænd: Dependent Variable: ltlc Source DF Type III SS Mean Square F Value Pr > F height 1 0.13597107 0.13597107 19.55 0.0001 sex 1 0.00210426 0.00210426 0.30 0.5867 height*sex 1 0.00152852 0.00152852 0.22 0.6429 Standard Parameter Estimate Error t Value Pr > t Intercept -.2190181620 B 0.35221658-0.62 0.5391 height 0.0060473650 B 0.00201996 2.99 0.0057 sex F -.2810587157 B 0.51102682-0.55 0.5867 sex M 0.0000000000 B... height*sex F 0.0014344422 B 0.00306016 0.47 0.6429 height*sex M 0.0000000000 B... log10(lung capacity) = 0.219 + 0.00605 height Linie for kvinder: log10(lung capacity) = 0.219 + ( 0.281) + (0.00605 + 0.00143) height = 0.500 + 0.00748 height Interaktionsparameteren angiver forskellen på hældninger i de to grupper 35 / 80 Men så får vi ikke nogen konfidensgrænser... så man bør benytte programmet til udregningerne, se kode s. 77 36 / 80

SAS-udregning af de to linier Fortolkning 1. Ændring af model-sætningen: Se kode s. 77 Standard Parameter Estimate Error t Value Pr > t sex F -.5000768777 0.37025922-1.35 0.1876 sex M -.2190181620 0.35221658-0.62 0.5391 height*sex F 0.0074818072 0.00229877 3.25 0.0030 height*sex M 0.0060473650 0.00201996 2.99 0.0057 Her er der angivet to intercept-estimater og to hældningsestimater. 2. Benyt estimate-sætninger: Se kode s. 77 Standard Parameter Estimate Error t Value Pr > t intercept, male -0.21901816 0.35221658-0.62 0.5391 intercept, female -0.50007688 0.37025922-1.35 0.1876 slope, male 0.00604737 0.00201996 2.99 0.0057 slope, female 0.00748181 0.00229877 3.25 0.0030 I dette eksempel så vi Den observerede forskel i (log 10 ) lungekapacitet mellem mænd og kvinder kunne godt tilskrives højdeforskellen mellem kønnene. Der kan dog stadig være en kønsforskel op til 0.0421 ± 2.045 0.0352 = ( 0.030, 0.114), svarende til intervallet (0.933, 1.300) for ratio en, dvs. op til en 30% øget lungefunktion hos mænd Det omvendte kan også forekommer, altså at effekter dukker op, når der kontrolleres for andre Sådan et eksempel skal vi se nu 37 / 80 38 / 80 Nyt eksempel: Hormoner hos P-pille brugere Valg af skala Anti Müllersk Hormon (AMH) er et hormon, som dannes i de små tidlige ægblærer (follikler) i æggestokkene. Videnskabeligt spørgsmål: Er AMH-niveauet nedsat hos P-pille brugere? Og i givet fald hvor meget? Der foreligger en undersøgelse af 732 kvinder, heraf 228, der tager P-piller Boxplottet på forrige side viser klart en tendens til hale mod høje værdier Man får derfor en ide om, at logaritmer vil være påkrævet På den anden side er der mange observationer i hver gruppe, så det er muligvis ikke strengt nødvendigt... Boxplot af logaritmetransformerede (log 10 ) AMH-værdier Heller ikke på denne skala er der perfekt symmetri 39 / 80 40 / 80

Valg af skala Sammenligning af grupper - på logaritmisk skala er ikke altid oplagt... Man kan lade det afhænge af, hvordan man helst vil præsentere sit resultat: som en forskel i enheden antal/ml, eller som en relativ forskel, i % Hvis man vælger andre skalaer (kvadratrødder, kubikrødder etc.) kan parametrene i modellen ikke direkte fortolkes (forskellene kan ikke kvantificeres på en enkel måde). Uparret T-test giver: The TTEST Procedure Variable: logamh ppiller N Mean Std Dev Std Err Minimum Maximum 0 504 1.2646 0.3655 0.0163-0.0947 2.1014 1 228 1.2394 0.3626 0.0240-0.4034 1.9043 Diff (1-2) 0.0252 0.3646 0.0291 ppiller Method Mean 95% CL Mean Std Dev 0 1.2646 1.2326 1.2966 0.3655 1 1.2394 1.1921 1.2867 0.3626 Diff (1-2) Pooled 0.0252-0.0319 0.0823 0.3646 Diff (1-2) Satterthwaite 0.0252-0.0318 0.0822 Method Variances DF t Value Pr > t Pooled Equal 730 0.87 0.3868 Satterthwaite Unequal 441.56 0.87 0.3855 Equality of Variances Method Num DF Den DF F Value Pr > F Folded F 503 227 1.02 0.8987 41 / 80 42 / 80 Kommentarer til output Kommentarer til output,ii Der er ikke tegn på forskellige varianser i de to grupper (P=0.90) Det er derfor ligeyldigt, hvilket T-test, vi vælger at se på (de giver i øvrigt også næsten præcis det samme) P-værdien er 0.39, altså ingen evidens for forskel i AMH blandt brugere og ikke-brugere af P-piller Måske er det mere naturligt at udregne det den anden vej, altså P-pille brugere i forhold til ikke P-pille brugere, og så skal vi skifte fortegn: 10 0.0252 = 0.94, CI = (10 0.0823, 10 0.0319 ) = (0.83, 1.08) Her læser vi, at P-pille brugere i gennemsnit har et ca. 6% reduceret niveau af AMH, men at konfidensintervallet strækker sig lige fra en reduktion på ca. 17% til et forøget niveau på omkring 8%. Det lyder som en ret betydelig potentiel forskel i mine ører... men altså ikke signifikant Kan der være en confounder? Alder? 43 / 80 44 / 80

Er alder en confounder? Kovariansanalyse - justering for aldersforskel Har den en effekt på hormon-niveauet? Det skulle man tro, ud fra vores viden om, hvad hormonet afspejler Er der forskellig alder i de to grupper? Formentlig er P-pille brugerne yngre end ikke-p-pille brugerne N ppiller Obs Variable N Mean Median Std Dev -------------------------------------------------------------------------- 0 504 alder 504 33.7236111 33.7000000 4.0226765 1 228 alder 228 30.0162281 29.2000000 4.0995917 -------------------------------------------------------------------------- Nu sammenligner vi kvinder, der tager P-piller med kvinder, der ikke tager P-piller, men som har samme alder (kode s.78): Standard Parameter Estimate Error t Value Pr > t Intercept 2.280455844 B 0.09508466 23.98 <.0001 alder -0.034683747 0.00307944-11.26 <.0001 ppiller 0 0.153783588 B 0.02919734 5.27 <.0001 ppiller 1 0.000000000 B... Parameter 95% Confidence Limits Intercept 2.093783409 2.467128278 alder -0.040729371-0.028638123 ppiller 0 0.096462683 0.211104494 ppiller 1.. 45 / 80 Alder er en confounder! 46 / 80 Kommentarer til kovariansanalyse Kommentarer til de to analyser Kvidner, der tager P-piller estimeres til et 0.1538 lavere niveau end kvinder, der ikke tager P-piller, med CI=(0.0965, 0.2111). Når vi tilbagetransformerer til selve koncentrationsskalaen, giver det en estimeret ratio 10 0.1538 = 0.70, med konfidensinterval (10 0.2005, 10 0.0818 ) = (0.62, 0.80) Dette skal fortolkes som, at P-pille brugere ligger 30% lavere end ikke-p-pille brugerne, med konfidensinterval fra 20% til 38% under. Vi sammenfatter i en tabel: Reduktion i AMH: Model P-pille brugere vs. P-værdi ikke P-pille brugere T-test (s. 42-44) -6% (-17%, +8%) 0.39 Kovariansanalyse -30% (-38%, -20%) <0.0001 (s. 46-47) 47 / 80 48 / 80

Kovariansanalyse modellen grafisk Fortolkning af figur s. 49 Kovariansanalysen svarer til de to parallelle regressionslinier Men kan der tænkes at være interaktion? Den lodrette afstand imellem disse svarer til effekten af P-piller i kovariansanalysen s. 46-47 De to lodrette linier er anbragt i aldersgennemsnittene: Rød P-pille brugere Blå Ikke-P-pille brugere Disse linier ses at skære regressionslinierne i nogenlunde samme højde (dvs. værdi af logamh), og ca. svarende til det insignifikante T-test s. 42-44 49 / 80 50 / 80 Figur med frie regressionslinier Fortolkning af figur s. 51 svarende til mulig interaktion Interaktionsmodellen svarer til de to ikke-parallelle regressionslinier Den lodrette afstand imellem disse varierer nu med alderen, så man ikke kan tale om en generel effekt af P-piller De to lodrette linier skærer nu regressionslinierne i præcis de gennemsnitlige værdier af logamh, svarende til det insignifikante T-test s. 42-44 Er de to linier ikke-parallelle? 51 / 80 52 / 80

Regression for hver gruppe for sig Kode s. 79 ppiller=0 Standard Parameter Estimate Error t Value Pr > t Intercept 2.320725627 0.12927526 17.95 <.0001 alder -0.031317743 0.00380644-8.23 <.0001 Parameter 95% Confidence Limits Intercept 2.066738419 2.574712835 alder -0.038796267-0.023839219 ----------------------------------------------------------------- ppiller=1 Standard Parameter Estimate Error t Value Pr > t Intercept 2.496012716 0.15697593 15.90 <.0001 alder -0.041865092 0.00518181-8.08 <.0001 Interaktion mellem P-piller og alder? De to analyser s. 53 viser, at effekten af 5 år (5 gange hældningen) kan opsummeres som i nedenstående tabel, der også tilbagetransformerer effekten til original skala: Gruppe Effekt af 5 år på log 10 -skala Tilbagetransformeret effekt Ikke P-pille brugere -0.1566 (-0.1940, -0.1192) 0.70 (0.64, 0.76) P-pille brugere -0.2093 (-0.2604, -0.1583) 0.62 (0.55, 0.69) Parameter 95% Confidence Limits Intercept 2.186689089 2.805336343 alder -0.052075923-0.031654260 Konfidensintervallerne er noget overlappende, så vi kan ikke umiddelbart udtale os om, hvorvidt de er signifikant forskellige. 53 / 80 Fortolkningen er, at for P-pille brugere falder AMH-niveauet med 38% på 5 år (faktoren 0.62), medens der for ikke P-pille brugere kun er tale om et fald på 30% (faktoren 0.7). 54 / 80 Interaktion mellem P-piller og alder Kommentarer til output vedr. interaktion Er der evidens for reelle forskelle i alderseffekten i de to grupper? For at undersøge dette, skal vi først gøre os klart, at spørgsmålet går på, om de to hældninger ovenfor er signfikant forskellige, altså om alderseffekten afhænger af, om man er P-pille bruger eller ej. Kode s.80 Standard Parameter Estimate Error t Value Pr > t Intercept 2.496012716 B 0.16495869 15.13 <.0001 alder -0.041865092 B 0.00544532-7.69 <.0001 ppiller 0-0.175287089 B 0.20794681-0.84 0.3995 ppiller 1 0.000000000 B... alder*ppiller 0 0.010547348 B 0.00659921 1.60 0.1104 alder*ppiller 1 0.000000000 B... Testet for ens hældninger aflæses på linien alder*ppiller, og P-værdien ses at være 0.11, altså ingen signifikans. I hvert fald ikke, hvis vi holder os til et 5% signifikansniveau. Vi kan således ikke i dette materiale påvise en forskel i alderseffekt for de to grupper, omend der synes at være tendens til en større effekt i P-pille gruppen. Vi repeterer lidt på de næste sider: 55 / 80 56 / 80

Kovariansanalyse - den simpleste GLM er blot en (historisk betinget) betegnelse for en model med netop én kategorisk kovariat (gruppe, Class-variabel) og netop én kvantitativ kovariat. Formålet kan være (ganske som i tosidet ANOVA) at Undersøge effekten af begge kovariater fjerne bias, f.eks at korrigere for en evt. højdeforskel ved sammenligning af lungefunktion for rygere og ikke-rygere øge styrken i en randomiseret klinisk undersøgelse ved at inddrage en vigtig kovariat og derved nedbringe den uforklarede del af variationen Men husk, at man derved besvarer et andet videnskabeligt spørgsmål 57 / 80 Sammenligning af to grupper - som ikke er helt sammenlignelige, pga en confounder (x): En variabel, som har en effekt på outcome er relateret til gruppen (der er forskel på værdierne i de to grupper) Herved kan opstå bias. 58 / 80 Gruppe/behandling Confounder x Outcome Illustration af confounding og kovariansanalyse Men læg mærke til følgende: Selv om fordelingen af kovariaten er ens i de to grupper, kan det være af stor betydning at medtage den i analysen. Det kan give større styrke, hvis kovariaten er vigtig Gruppe/behandling Kovariat Outcome Men husk, at man derved besvarer et andet videnskabeligt spørgsmål 59 / 80 60 / 80

Simuleret eksempel Metoder til at undgå bias Uden x i modellen: Ingen særlig forskel på grupperne...? Med x i modellen: Tydelig forskel på grupperne (her den lodrette afstand mellem linierne) Matchning. Dvs. udvælge individer, således at de er nogenlunde ens med hensyn til de vigtige forstyrrende kovariater. Husk at tage matchningsvariablen med som kovariat ellers kan man skabe bias pga umålte confoundere (men lad være med at fortolke dens effekt) Randomisering. Dvs. trække lod om behandling (gruppe) NB: Dette kan naturligvis kun lade sig gøre, hvis grupperne er noget, man selv bestemmer over. og det sikrer ikke ens fordelinger i den enkelte undersøgelse Korrektion Dvs. at medtage den (muligvis skævt fordelte) variabel som kovariat, også somme tider i randomiserede undersøgelser 61 / 80 62 / 80 Metoder til at øge styrken Et typisk eksempel flere observationer/personer benytte fornuftige inklusions- eller eksklusionskriterier inddrage vigtige forklarende variable (kovariater) udelade irrelevante kovariater Men pas på med at gå for meget på fisketur!! på et før-og-efter studie: Vickers, A.J. & Altman, D.G.: Analysing controlled clinical trials with baseline and follow-up measurements. British Medical Journal 2001; 323: 1123-24.: 52 patienter med skuldersmerter randomiseres til enten Akupunktur (n=25) Placebo (n=27) og husk at fortolkningen afhænger af modellen Smerte vurderes på en 100-trins skala både før og efter behandling Høje scorer er gode 63 / 80 64 / 80

Baseline og Follow-up Resultater vedr. skuldersmerter I princippet: Behandling Sammenligninger af de to grupper: Baseline måling Outcome Der er fokus på sammenligning af behandlingerne: Er placebo ligeså godt som akupunktur? Det lægger op til et simpelt T-test, men: Hvad nu, hvis de to grupper ikke er helt identiske fra start, selv om der er randomiseret? 65 / 80 Gennemsnitlig smertescore Behandlinseffekt placebo akupunktur differens (n=27) (n=25) (95% CI) P-value Baseline 53.9 (14.0) 60.4 (12.3) 6.5 0.09 Analyse: Follow-up 62.3 (17.9) 79.6 (17.1) 17.3 (7.5; 27.1) 0.0008 Ændringer* 8.4 (14.6) 19.2 (16.1) 10.8 (2.3; 19.4) 0.014 Ancova 12.7 (4.1; 21.3) 0.005 * resultater publiceret i Kleinhenz et.al. Pain 1999; 83:235-41. 66 / 80 Udvikling i smerter, faktisk og forventeligt Udlægning af resultater, I Baseline Akupunktur gruppen ligger lidt højere end placebo Follow-up Vi vil forvente, at akupunktur gruppen stadig ligger det samme stykke højere end placebo gruppen efter behandlingen, selv hvis behandlingen ikke virker (fuldt optrukket rød linie). Det er derfor urimeligt blot at afgøre behandlingens effekt ved at sammenligne follow-up værdier (forskellen bliver for stor i dette tilfælde) 67 / 80 68 / 80

Udlægning af resultater, II APPENDIX Differenser/ændringer Lav baseline værdi giver forventning om stor positiv ændring (regression to the mean) Derfor forventes placebogruppen at stige mest, og akupunkturgruppen lidt mindre (den stiplede røde linie) og en direkte sammenligning af ændringer er derfor ikke rimelig (forskellen bliver for lille i dette tilfælde) Ancova vurderer forskellen under hensyntagen til, at baseline forklarer noget, men ikke al forskellen ved follow-up: Vi sammenligner personer, der har fået forskellig behandling, men som starter samme sted. 69 / 80 Programbidder svarende til diverse slides: Bland-Altman plot, s. 71 T-test, s. 72 Scatterplot. s. 73 Kovariansanalyse, s. 74-75, 78 Model med interaktion, s. 77, 80 Opdelte analyser, s. 79 70 / 80 Bland-Altman plot Slide 8 T-test på logaritmer data a1; input refe test; datalines; 155 150 160 155 180 169 80 79 /* flere datalinier her */ ; data a2; set a1; snit=(refe+test)/2; dif=refe-test; proc gplot data=a2; plot dif*snit / vref=0 lv=2 vref=9.89 vref=-9.51 vref=29.29 lv=33 haxis=axis1 vaxis=axis2 frame; axis1 value=(h=2) minor=none label=(h=3 gennemsnit ); axis2 value=(h=2) minor=none label=(a=90 R=0 H=3 differens refe-test ); symbol1 v=circle i=none c=black h=2 l=1 w=2; 71 / 80 Slide 21 ods graphics on; proc ttest data=a1; class sex; var ltlc; ods graphics off; 72 / 80

Scatter plot, med symboler for gruppe Kovariansanalyse - ANCOVA Slide 23 proc sgplot data=tlc; scatter x=height y=ltlc / group=sex; eller med indlagte regressionslinier, svarende til Slide 34 Slide 24 proc glm data=tlc; classes sex; model ltlc=sex height / solution clparm; proc sgplot data=tlc; reg x=height y=ltlc / group=sex; 73 / 80 74 / 80 ANCOVA-plot, med parallelle linier Model med to regressionslinier Slide 25 er en naturlig del af ANCOVA-analysen, når man bruger ods graphics og plots=all ods graphics on; proc glm plots=all data=tlc; classes sex; model ltlc=sex height / solution clparm; Modelkontrol i ANCOVA Slide 28 er ligeledes en naturlig del af ANCOVA-analysen, når man bruger ods graphics og plots=all altså inkluderende interaktion Slide 34 ods graphics on; proc glm plots=all data=tlc; class sex; model ltlc=height sex sex*height / solution clparm; ods graphics off; 75 / 80 76 / 80

Omregning til to linier Kovariansanalyse Slide 35-36 1. proc glm data=tlc; classes sex; model ltlc=sex sex*height / noint solution clparm; 2. proc glm data=tlc; classes sex; model ltlc=sex height sex*height / solution clparm; estimate intercept, male intercept 1 sex 0 1; estimate intercept, female intercept 1 sex 1 0; estimate slope, male height 1 sex*height 0 1; estimate slope, female height 1 sex*height 1 0; Slide 46 ods graphics on; proc glm plots=(diagnosticspanel Residuals(smooth)) data=a1; class ppiller rygning; model logamh = alder ppiller / solution clparm; output out=ny p=yhat r=residual cookd=cook; ods graphics off; 77 / 80 78 / 80 Opdelte analyser Test for interaktion Slide 53 Slide 55 proc sort data=a1; by ppiller; ods graphics on; proc glm plots=all data=a1; by ppiller; model logamh=alder / clparm; estimate "fald paa 5 aar" alder 5; estimate "niveau ved alder 30" intercept 1 alder 30; ods graphics off; ods graphics on; proc glm plots=(diagnosticspanel Residuals(smooth)) data=a1; class ppiller rygning; model logamh = alder ppiller ppiller*alder / solution clparm; output out=ny p=yhat r=residual cookd=cook; ods graphics off; 79 / 80 80 / 80