Kapitel 1, Kliniske målinger Epidemiologi og Biostatistik Introduktion til skilder (varianskomponenter) måleusikkerhed sammenligning af målemetoder Mogens Erlandsen, Institut for Biostatistik Uge, torsdag (forelæsning) intra- og interindividuel inden for person f.eks. dag-til-dag mellem personer Korrelation 1 Hvad influerer på en (klinisk) måling? Metode-relateret: Individ-relateret: målemetode person apparat helbredstilstand kalibrering af apparat tidspunkt (sæson, døgn) observatør??? hospital??? skilder Klinisk måling: vi forestiller os, at der er en underliggende/ukendt sand værdi, som vi forsøger at måle (for en given person, med en given helbredstilstand, til et givet tidspunkt etc) Ved gentagen måling med samme metode: en lidt anden værdi (som regel), fordi: metoden har en indbygget usikkerhed (tilfældig fejl) F.eks. normalfordeling!!! En perfekt metodes måleresultat er: nøjagtig sand værdi + en meget lille tilfældig fejl En upræcis metodes måleresultat er: sand værdi + en stor tilfældig fejl Hvis kalibreringen er unøjagtig bliver metodens måleresultat: sand værdi + systematisk fejl + en tilfældig fejl unøjagtig upræcis præcis En god metodes måleresultat er: sand værdi + meget lille systematisk fejl + meget lille tilfældig fejl Ved gentagen måling med en anden metode: en lidt anden værdi (som regel), fordi: forskellige systematiske fejl forskellige tilfældige fejl nøjagtig præcis 1
Mange målemetoder vil ud fra metodens underliggende fysiske og/eller kemiske principper være gode (nøjagtige og præcise) lungefunktion: måling af rumfang kemiske analyse: kromatografisk metode Måling på noget biologisk introducerer en række nye og måske ukendte skilder, f.eks. : fastende i hvile intra instruktion af patienten før målingen patienterne er forskellige inter Variansanalyse prøver at kvantificere systematiske og tilfældige kilder til eksempler: målinger på samme individ med samme metode forskellige målemetoder på samme individ observatører (patologer), samme individ/præparat 8 målinger per person, samme metode: f.eks. een af disse situationer: uge1/uge morgen/aften før/efter behandling tilfældig? altid målefejl over tid: altid intra-individuel Se-cholesterol PEFR blodtryk systematisk forskel? Nej Ja, Astma Ja, Beta-blokker altid interindividuel PEFR (l/min) målt med Wright meter Person 1. måling. måling 1 1 1 1 11 1 1 1 1 8 1 18 1 1 1 1 Data fra Table 1.1 (s. ) Antag:ingen preference mellem de målinger, f.eks. målt forskellige dage Ingen systematisk forskel mellem de målinger tilfældig : interindividuel intraindividuel målefejl Variation mellem de målinger inden for person: intraindividuel + målefejl Dette design kan ikke adskille intraindividuel og målefejl Antag: for en given person kan de målinger beskrives ved den samme normalfordeling F.eks. stor dag-tildag eller stor målefejl? For hver person beregnes gennemsnit og spredning (s) Personens underliggende/- sande niveau Personens intraindividuelle PEFR (l/min) målt med Wright meter Person 1. måling. måling gns s 1..8. 1.1 1 1 1..8 1 1.. 11 1 18..1 1. 1. 1 1.. 1 8 8.. 1 18 1 11..1 1.. 1 1.. Tættere på den sande værdi s = spredning for hver person (+ målefejl) 11 1 se = s
spredning.... gennemsnit (gns) vs spredning (s)..... 8. gennemsnit Forløb OK, ingen trend 1 PEFR (l/min) målt med Wright meter Person 1. måling. måling gns s 1..8. 1.1 1 1 1..8 1 1.. 11 1 18..1 1. 1. 1 1.. 1 8 8.. 1 18 1 11..1 1.. 1 1.. fælles spredning s w = 1. w = within (mellem de målinger) Variation mellem personer 1 Variation mellem personer? Variation mellem personernes sande/underliggende niveauer De sande/underliggende niveauer er ukendte! Niveauet estimeres ved personens gennemsnit Usikkerhed på gennemsnittet: se (standard error) Derfor: hvis en mellem personer alene baseres på gennemsnittenes vil den indeholde en rest af se på gennemsnittet Table 1. (s. ) fra bogen (variansanalyse-tabel) Intra-individuel (within) Analysis of variance by subject for PEFR Source of Degrees of freedom Intraindividuel + måleusikkerhed 1 1 Sum of squares Mean square Variance ratio (F) Between subjects 1 18.. 11.8 Residual (within subjects) 1 8.. Total 81. s =. = 1. Prediktionsinterval for forskel mellem målinger på samme person forskellige dage: Bemærk, ± 1. sw = ±. sw = ±. subject 1 falder udenfor w Table 1., fortsat Inter-individuel (between) (..) σ ˆ = = 11. b målinger pr individ Between og Within erne kan kombineres til den totale : s = σˆ + s = 11. Total b w Analysis of variance by subject for PEFR Source of Degrees of freedom Sum of squares Mean square Variance ratio (F) Between subjects 1 18.. 11.8 Residual (within subjects) 1 8.. Total 81. som svarer til den vi vil forvente mellem de 1 personer, hvis vi kun har een måling pr individ. Svarer til den sædvanlig SD baseret på den 1. måling fra de 1 personer. Størrelsen af skilderne er næsten altid ordnet: Inter-individuel > intra-individuel (> målefejl) 1 18
målemetoder: Sammenligning under forskellige omstændigheder: standardiseret/kontrolleret prøve raske personer patienter Systematisk forskel: generelt niveau Eksempler på metodeforskelle: kun ved små/store værdier Slipper for: inter- og intraind. var. Tilfældig : større ved store værdier forskellige målefejl 1 PEFR målt med Wright og Mini meter Person Wright (W) Mini (M) AVGWM (W+M)/ (W-M) 1 1-18 1. - 1 18-8 1 88-1. 1 8. 1 1 18 18. -81 1 8. 1 1 - Table 1. (s. ) Mini PEFR: metoder på 1 individder Metoder ens Lineær regression? Mini (y) mod Wright (x)? Tolkning 1: Forklare (noget af) en i Mini (y) vha en i Wright (x)??? Tolkning : Prediktere Mini (y) vha Wright (x)??? Det kan være OK, hvis f.eks. Mini er en gold standard, der er dyr/besværlig at lave, og Wright er ny og simpel/billig metode Wright 1 1 Hvis begge metoder formodes at være nogenlunde lige gode: gennemsnit tættere på sandheden differens mellem de metoder tilfældig differens variere omkring Bland-Altman plot, PEFR: Mini vs Wright forløber parallelt med x- akse - - AVGWM s konstant
Bland-Altman plot, nyt eksempel Bland-Altman plot, nyt eksempel DIF - DIF stigende tendens Indikation på relative ændringer DIF - DIF s ikke konstant Indikation på relative ændringer - AVG - AVG Nulhypotese: Der er ikke systematisk forskel på de metoder. t-test: PEFR: Mini vs Wright, fortsat One-Sample Statistics Std. Std. Error N Mean Deviation Mean 1 -.11 8.1.1.11 t = =., DF = 1, p =.8.1 % sikkerhedsinterval: ( -.; 1.8) Limits of agreement = Prediktionsinterval for forskel mellem de metoder (værdier målt med de metoder på samme person) PI( % ) = d ± 1. sd =.1± 1. 8.8 = 8.1,. Forudsat, differenser normalfordelt 8 Jern i knoglemarv To observatører har (uafhængigt af hinanden) bedømt indholdet af jern i den samme prøve af knoglemarv fra ialt patienter med jernmangel (bedømt ud fra blodprøve) Observatør patient 1 1 Intet Intet Intet Nedsat Normalt Normalt Nedsat Normalt Nedsat Intet Observatør Observatør 1 Intet Nedsat Normalt Øget Total Intet 1 1 1 Nedsat 1 1 Normalt 1 Øget 1 Total 11 8 11
Antal 1 Intet O 1 Nedsat Normalt Øget Intet Nedsat Normalt Øget Intet Normalt O Observatør Observatør 1 Intet Nedsat Normalt Øget Total Intet 1 1 1 Nedsat 1 1 Normalt 1 Øget 1 Total 11 8 11 Enige O1 = O +1 O1 = O -1 Antager at forskel mellem Intet og Nedsat svarer til forskel mellem Nedsat og Normalt etc 1 O 1 - O - - -1 1 Antal 1 1+ +1+ 1+++ ++1 + Sum 1 1 1 Korrelation Mål for afhængigheden (associationen) mellem sideordnede variable. Bemærk, i regression er der preference: en responsvariabel og en forklarende variabel Nulhypotese: Er der symmetri? BMI og Kolesterol (fra Uge, regression): prediktere kolesterol vha BMI eller omvendt? Næppe interessant Men: data ikke normalfordelt Association mellem BMI og Kolesterol: en underliggende fælles årsag, f.eks. gener, livsstil, m.v. Se-total kolesterol (mmol/l) 11 8 Begrebet korrelation har i statistisk forstand en præcis (sandsynlighedsteoretisk) definition. Korrelationskoefficienten ( ρ) er et tal mellem -1 og 1. Den måler den lineære afhængighed mellem variable (x og y). Hvis ρ = ±1 så ligger x og y på en ret linie, dvs y = α + β x og ingen tilfældig + 1, så er β > Hvis ρ = 1, så er β < BMI I praksis ligger observationerne aldrig på en ret linie!
Hvis både x og y er kvantitative variable, kan korrelationskoefficienten estimeres ved Pearsons korrelationskoefficient (se Kap 11.). Den betegnes normalt r. Tolkning af denne koefficient (r) giver anledning til mange misforståelser. F.eks.: der er en god overensstemmelse mellem x og y, hvis r er tæt ved +1 eller -1 Se-total kolesterol (mmol/l) 11 8 r =. (Pearson) der er ingen sammenhæng mellem x og y, hvis r er tæt ved Se f.eks. bogen, s., spørgsmål og 8. BMI 8 Hypotesen: ρ = (ingen association) kan testes vha Pearsons korrelations-koefficient, men det kræver en række forudsætninger opfyldt. Den mest udbredte misforståelse! Sammenligning af metoder vha korrelation??? Både x og y normalfordelt og linearitet se og sikkerhedsinterval kan udregnes! men I slipper! Kap. 11., 18. Hvis den ene (eller begge) variabel er en kategorisk variabel med ordnede kategorier (f.eks. NYHA I, II, III og IV eller en smerte-score) kan man ikke beregne Pearsons korrelationskoefficient. Hvis de metoder stemmer overens vil punkterne i x-y plottet ligge på en ret line, ergo korrelation = 1! Altså, hvis korrelationen er tæt på 1 stemmer de metoder (næsten) overens! Ja! Nej! Eksempel: sammenligning af blodtryksapparater Difference: SYST-SYST1 - mean diff=.1 se=. p=.18 Korrelation=. - 1 1 1 1 1 1 1 Mean: (SYST1+SYST)/ Konklusion fra Bland-Altman plottet: de apparater stemmer ikke overens!!! 1