Epidemiologi og Biostatistik



Relaterede dokumenter
Epidemiologi og Biostatistik

Korrelation Pearson korrelationen

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april

Epidemiologi og Biostatistik. Mogens Erlandsen, Institut for Biostatistik Uge 1, tirsdag d. 5. februar 2002

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse

Forelæsning 11: Kapitel 11: Regressionsanalyse

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk

Besvarelse af vitcap -opgaven

MPH specialmodul Epidemiologi og Biostatistik

Eksempel: PEFR. Epidemiologi og biostatistik. Uge 1, tirsdag. Erik Parner, Institut for Biostatistik.

Analysestrategi. Lektion 7 slides kompileret 27. oktober :24 p.1/17

OR stiger eksponentielt med forskellen i BMI komplicet model svær at forstå og analysere simpel model

6. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag)

4. september π B = Lungefunktions data fra tirsdags Gennemsnit l/min

Regressionsanalyser. Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer.

Reeksamen i Statistik for Biokemikere 6. april 2009

Multipel Lineær Regression

Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer.

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

OR stiger eksponentielt med forskellen i BMI. kompliceret model svær at forstå og analysere

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1

Muligheder: NB: test for µ 1 = µ 2 i model med blocking ækvivalent med parret t-test! Ide: anskue β j som stikprøve fra normalfordeling.

6. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag)

(studienummer) (underskrift) (bord nr)

Det kunne godt se ud til at ikke-rygere er ældre. Spredningen ser ud til at være nogenlunde ens i de to grupper.

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

Program. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data

To-sidet varians analyse

Modul 11: Simpel lineær regression

Module 4: Ensidig variansanalyse

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering

Tovejs-ANOVA (Faktoriel) Regler og problemer kan generaliseres til mere end to hovedfaktorer med tilhørende interaktioner

Logistisk Regression - fortsat

Følgende tabel (fra Fisher) giver forøgelsen af sovetiden i timer fra et eksperiment med 10 patienter vedrørende 2 sovemidler A og B.

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

Opgavebesvarelse, brain weight

Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

24. februar Analyse af overlevelsesdata (ventetidsdata) Ikke parametrisk statistiske test : Det statistiske modelbegreb Modelselektion

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet

1 Hb SS Hb Sβ Hb SC = , (s = )

To samhørende variable

Opgavebesvarelse, brain weight

Generelle lineære modeller

1. februar Lungefunktions data fra tirsdags Gennemsnit l/min

Statistik II 4. Lektion. Logistisk regression

Side 1 af 19 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

Postoperative komplikationer

Opgavebesvarelse, brain weight

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Program. Logistisk regression. Eksempel: pesticider og møl. Odds og odds-ratios (igen)

Konfidensintervaller og Hypotesetest

Vejledende besvarelse af hjemmeopgave i Basal statistik for lægevidenskabelige forskere, forår 2013

(studienummer) (underskrift) (bord nr)

Reeksamen i Statistik for biokemikere. Blok

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved

Statistik Lektion 4. Variansanalyse Modelkontrol

Kapitel 12 Variansanalyse

Eksamen i Statistik for Biokemikere, Blok januar 2009

Løsning til eksaminen d. 14. december 2009

Opgavebesvarelse, brain weight

Variansanalyse i SAS. Institut for Matematiske Fag December 2007

Vi ønsker at konstruere normalområder for stofskiftet, som funktion af kropsvægten.

Skriftlig eksamen Science statistik- ST501

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j

Eksempel , opg. 2

Øvelser i epidemiologi og biostatistik, 12. april 2010 Ebeltoft-projektet: Analyse af alkoholrelaterede data mm. Eksempel på besvarelse

Regressionsanalyse i SAS

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge

Kursus i varians- og regressionsanalyse Data med detektionsgrænse. Birthe Lykke Thomsen H. Lundbeck A/S

Dagens Emner. Likelihood teori. Lineær regression (intro) p. 1/22

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i.

En Introduktion til SAS. Kapitel 5.

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Statistik kommandoer i Stata opdateret 16/ Erik Parner

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge

Klasseøvelser dag 2 Opgave 1

Kapitel 12 Variansanalyse

Program. Sammenligning af grupper Ensidet ANOVA. Case 3, del II: Fiskesmag i lammekød. Case 3, del I: A-vitamin i leveren

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Dagens Temaer. Test for lineær regression. Test for lineær regression - via proc glm. k normalfordelte obs. rækker i proc glm. p. 1/??

Ikke-parametriske tests

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Transkript:

Kapitel 1, Kliniske målinger Epidemiologi og Biostatistik Introduktion til skilder (varianskomponenter) måleusikkerhed sammenligning af målemetoder Mogens Erlandsen, Institut for Biostatistik Uge, torsdag (forelæsning) intra- og interindividuel inden for person f.eks. dag-til-dag mellem personer Korrelation 1 Hvad influerer på en (klinisk) måling? Metode-relateret: Individ-relateret: målemetode person apparat helbredstilstand kalibrering af apparat tidspunkt (sæson, døgn) observatør??? hospital??? skilder Klinisk måling: vi forestiller os, at der er en underliggende/ukendt sand værdi, som vi forsøger at måle (for en given person, med en given helbredstilstand, til et givet tidspunkt etc) Ved gentagen måling med samme metode: en lidt anden værdi (som regel), fordi: metoden har en indbygget usikkerhed (tilfældig fejl) F.eks. normalfordeling!!! En perfekt metodes måleresultat er: nøjagtig sand værdi + en meget lille tilfældig fejl En upræcis metodes måleresultat er: sand værdi + en stor tilfældig fejl Hvis kalibreringen er unøjagtig bliver metodens måleresultat: sand værdi + systematisk fejl + en tilfældig fejl unøjagtig upræcis præcis En god metodes måleresultat er: sand værdi + meget lille systematisk fejl + meget lille tilfældig fejl Ved gentagen måling med en anden metode: en lidt anden værdi (som regel), fordi: forskellige systematiske fejl forskellige tilfældige fejl nøjagtig præcis 1

Mange målemetoder vil ud fra metodens underliggende fysiske og/eller kemiske principper være gode (nøjagtige og præcise) lungefunktion: måling af rumfang kemiske analyse: kromatografisk metode Måling på noget biologisk introducerer en række nye og måske ukendte skilder, f.eks. : fastende i hvile intra instruktion af patienten før målingen patienterne er forskellige inter Variansanalyse prøver at kvantificere systematiske og tilfældige kilder til eksempler: målinger på samme individ med samme metode forskellige målemetoder på samme individ observatører (patologer), samme individ/præparat 8 målinger per person, samme metode: f.eks. een af disse situationer: uge1/uge morgen/aften før/efter behandling tilfældig? altid målefejl over tid: altid intra-individuel Se-cholesterol PEFR blodtryk systematisk forskel? Nej Ja, Astma Ja, Beta-blokker altid interindividuel PEFR (l/min) målt med Wright meter Person 1. måling. måling 1 1 1 1 11 1 1 1 1 8 1 18 1 1 1 1 Data fra Table 1.1 (s. ) Antag:ingen preference mellem de målinger, f.eks. målt forskellige dage Ingen systematisk forskel mellem de målinger tilfældig : interindividuel intraindividuel målefejl Variation mellem de målinger inden for person: intraindividuel + målefejl Dette design kan ikke adskille intraindividuel og målefejl Antag: for en given person kan de målinger beskrives ved den samme normalfordeling F.eks. stor dag-tildag eller stor målefejl? For hver person beregnes gennemsnit og spredning (s) Personens underliggende/- sande niveau Personens intraindividuelle PEFR (l/min) målt med Wright meter Person 1. måling. måling gns s 1..8. 1.1 1 1 1..8 1 1.. 11 1 18..1 1. 1. 1 1.. 1 8 8.. 1 18 1 11..1 1.. 1 1.. Tættere på den sande værdi s = spredning for hver person (+ målefejl) 11 1 se = s

spredning.... gennemsnit (gns) vs spredning (s)..... 8. gennemsnit Forløb OK, ingen trend 1 PEFR (l/min) målt med Wright meter Person 1. måling. måling gns s 1..8. 1.1 1 1 1..8 1 1.. 11 1 18..1 1. 1. 1 1.. 1 8 8.. 1 18 1 11..1 1.. 1 1.. fælles spredning s w = 1. w = within (mellem de målinger) Variation mellem personer 1 Variation mellem personer? Variation mellem personernes sande/underliggende niveauer De sande/underliggende niveauer er ukendte! Niveauet estimeres ved personens gennemsnit Usikkerhed på gennemsnittet: se (standard error) Derfor: hvis en mellem personer alene baseres på gennemsnittenes vil den indeholde en rest af se på gennemsnittet Table 1. (s. ) fra bogen (variansanalyse-tabel) Intra-individuel (within) Analysis of variance by subject for PEFR Source of Degrees of freedom Intraindividuel + måleusikkerhed 1 1 Sum of squares Mean square Variance ratio (F) Between subjects 1 18.. 11.8 Residual (within subjects) 1 8.. Total 81. s =. = 1. Prediktionsinterval for forskel mellem målinger på samme person forskellige dage: Bemærk, ± 1. sw = ±. sw = ±. subject 1 falder udenfor w Table 1., fortsat Inter-individuel (between) (..) σ ˆ = = 11. b målinger pr individ Between og Within erne kan kombineres til den totale : s = σˆ + s = 11. Total b w Analysis of variance by subject for PEFR Source of Degrees of freedom Sum of squares Mean square Variance ratio (F) Between subjects 1 18.. 11.8 Residual (within subjects) 1 8.. Total 81. som svarer til den vi vil forvente mellem de 1 personer, hvis vi kun har een måling pr individ. Svarer til den sædvanlig SD baseret på den 1. måling fra de 1 personer. Størrelsen af skilderne er næsten altid ordnet: Inter-individuel > intra-individuel (> målefejl) 1 18

målemetoder: Sammenligning under forskellige omstændigheder: standardiseret/kontrolleret prøve raske personer patienter Systematisk forskel: generelt niveau Eksempler på metodeforskelle: kun ved små/store værdier Slipper for: inter- og intraind. var. Tilfældig : større ved store værdier forskellige målefejl 1 PEFR målt med Wright og Mini meter Person Wright (W) Mini (M) AVGWM (W+M)/ (W-M) 1 1-18 1. - 1 18-8 1 88-1. 1 8. 1 1 18 18. -81 1 8. 1 1 - Table 1. (s. ) Mini PEFR: metoder på 1 individder Metoder ens Lineær regression? Mini (y) mod Wright (x)? Tolkning 1: Forklare (noget af) en i Mini (y) vha en i Wright (x)??? Tolkning : Prediktere Mini (y) vha Wright (x)??? Det kan være OK, hvis f.eks. Mini er en gold standard, der er dyr/besværlig at lave, og Wright er ny og simpel/billig metode Wright 1 1 Hvis begge metoder formodes at være nogenlunde lige gode: gennemsnit tættere på sandheden differens mellem de metoder tilfældig differens variere omkring Bland-Altman plot, PEFR: Mini vs Wright forløber parallelt med x- akse - - AVGWM s konstant

Bland-Altman plot, nyt eksempel Bland-Altman plot, nyt eksempel DIF - DIF stigende tendens Indikation på relative ændringer DIF - DIF s ikke konstant Indikation på relative ændringer - AVG - AVG Nulhypotese: Der er ikke systematisk forskel på de metoder. t-test: PEFR: Mini vs Wright, fortsat One-Sample Statistics Std. Std. Error N Mean Deviation Mean 1 -.11 8.1.1.11 t = =., DF = 1, p =.8.1 % sikkerhedsinterval: ( -.; 1.8) Limits of agreement = Prediktionsinterval for forskel mellem de metoder (værdier målt med de metoder på samme person) PI( % ) = d ± 1. sd =.1± 1. 8.8 = 8.1,. Forudsat, differenser normalfordelt 8 Jern i knoglemarv To observatører har (uafhængigt af hinanden) bedømt indholdet af jern i den samme prøve af knoglemarv fra ialt patienter med jernmangel (bedømt ud fra blodprøve) Observatør patient 1 1 Intet Intet Intet Nedsat Normalt Normalt Nedsat Normalt Nedsat Intet Observatør Observatør 1 Intet Nedsat Normalt Øget Total Intet 1 1 1 Nedsat 1 1 Normalt 1 Øget 1 Total 11 8 11

Antal 1 Intet O 1 Nedsat Normalt Øget Intet Nedsat Normalt Øget Intet Normalt O Observatør Observatør 1 Intet Nedsat Normalt Øget Total Intet 1 1 1 Nedsat 1 1 Normalt 1 Øget 1 Total 11 8 11 Enige O1 = O +1 O1 = O -1 Antager at forskel mellem Intet og Nedsat svarer til forskel mellem Nedsat og Normalt etc 1 O 1 - O - - -1 1 Antal 1 1+ +1+ 1+++ ++1 + Sum 1 1 1 Korrelation Mål for afhængigheden (associationen) mellem sideordnede variable. Bemærk, i regression er der preference: en responsvariabel og en forklarende variabel Nulhypotese: Er der symmetri? BMI og Kolesterol (fra Uge, regression): prediktere kolesterol vha BMI eller omvendt? Næppe interessant Men: data ikke normalfordelt Association mellem BMI og Kolesterol: en underliggende fælles årsag, f.eks. gener, livsstil, m.v. Se-total kolesterol (mmol/l) 11 8 Begrebet korrelation har i statistisk forstand en præcis (sandsynlighedsteoretisk) definition. Korrelationskoefficienten ( ρ) er et tal mellem -1 og 1. Den måler den lineære afhængighed mellem variable (x og y). Hvis ρ = ±1 så ligger x og y på en ret linie, dvs y = α + β x og ingen tilfældig + 1, så er β > Hvis ρ = 1, så er β < BMI I praksis ligger observationerne aldrig på en ret linie!

Hvis både x og y er kvantitative variable, kan korrelationskoefficienten estimeres ved Pearsons korrelationskoefficient (se Kap 11.). Den betegnes normalt r. Tolkning af denne koefficient (r) giver anledning til mange misforståelser. F.eks.: der er en god overensstemmelse mellem x og y, hvis r er tæt ved +1 eller -1 Se-total kolesterol (mmol/l) 11 8 r =. (Pearson) der er ingen sammenhæng mellem x og y, hvis r er tæt ved Se f.eks. bogen, s., spørgsmål og 8. BMI 8 Hypotesen: ρ = (ingen association) kan testes vha Pearsons korrelations-koefficient, men det kræver en række forudsætninger opfyldt. Den mest udbredte misforståelse! Sammenligning af metoder vha korrelation??? Både x og y normalfordelt og linearitet se og sikkerhedsinterval kan udregnes! men I slipper! Kap. 11., 18. Hvis den ene (eller begge) variabel er en kategorisk variabel med ordnede kategorier (f.eks. NYHA I, II, III og IV eller en smerte-score) kan man ikke beregne Pearsons korrelationskoefficient. Hvis de metoder stemmer overens vil punkterne i x-y plottet ligge på en ret line, ergo korrelation = 1! Altså, hvis korrelationen er tæt på 1 stemmer de metoder (næsten) overens! Ja! Nej! Eksempel: sammenligning af blodtryksapparater Difference: SYST-SYST1 - mean diff=.1 se=. p=.18 Korrelation=. - 1 1 1 1 1 1 1 Mean: (SYST1+SYST)/ Konklusion fra Bland-Altman plottet: de apparater stemmer ikke overens!!! 1