2 Epidemiologi og biostatistik. Uge 5, mandag 26. september 2005 Michael Væth, Institut for Biostatistik

Relaterede dokumenter
OR stiger eksponentielt med forskellen i BMI. kompliceret model svær at forstå og analysere

OR stiger eksponentielt med forskellen i BMI komplicet model svær at forstå og analysere simpel model

24. februar Analyse af overlevelsesdata (ventetidsdata) Ikke parametrisk statistiske test : Det statistiske modelbegreb Modelselektion

23. februar Epidemiologi og biostatistik. Uge 5, mandag 27. februar 2006 Michael Væth, Institut for Biostatistik.

Morten Frydenberg Biostatistik version dato:

Statistik kommandoer i Stata opdateret 22/ Erik Parner

Overlevelsesfunktion. Vi kalder S(t) for overlevelsesfunktionen.

Statistik kommandoer i Stata opdateret 16/ Erik Parner

Morten Frydenberg 14. marts 2006

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)

1. februar Lungefunktions data fra tirsdags Gennemsnit l/min

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

4. september π B = Lungefunktions data fra tirsdags Gennemsnit l/min

Morten Frydenberg 26. april 2004

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april

Dag 6: Interaktion. Overlevelsesanalyse

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk

Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004

Epidemiologi og Biostatistik

Introduktion til overlevelsesanalyse

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

MPH specialmodul Epidemiologi og Biostatistik

Ikke-parametriske tests

Øvelse 7: Aktuar-tabeller, Kaplan-Meier kurver og log-rank test

1 Hb SS Hb Sβ Hb SC = , (s = )

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Løsning til eksaminen d. 14. december 2009

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Lineær og logistisk regression

Modul 12: Regression og korrelation

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Epidemiologi og Biostatistik

Statistik II 4. Lektion. Logistisk regression

Overlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere.

PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006

Morten Frydenberg Biostatistik version dato:

Korrelation Pearson korrelationen

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression

Kapitel 7 Forskelle mellem centraltendenser

Besvarelse af opgavesættet ved Reeksamen forår 2008

Program. Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering. Test for ens spredninger

Statistiske principper

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Mantel-Haenszel analyser

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 4: 2. marts

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Morten Frydenberg 25. april 2006

Statistik II 1. Lektion. Analyse af kontingenstabeller

Multipel Lineær Regression

Basal statistik. 30. januar 2007

Vi vil analysere effekten af rygning og alkohol på chancen for at blive gravid ved at benytte forskellige Cox regressions modeller.

Øvelser i epidemiologi og biostatistik, 12. april 2010 Ebeltoft-projektet: Analyse af alkoholrelaterede data mm. Eksempel på besvarelse

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Mål for sammenhæng mellem to variable

Postoperative komplikationer

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Løsning til eksaminen d. 29. maj 2009

Basal Statistik Kategoriske Data

Løsning eksamen d. 15. december 2008

Sammenhængsanalyser. Et eksempel: Sammenhæng mellem rygevaner som 45-årig og selvvurderet helbred som 51 blandt mænd fra Københavns amt.

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet

Log-lineære modeller. Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres.

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Uafhængighedstestet

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Tema. Dagens tema: Indfør centrale statistiske begreber.

Regressionsanalyser. Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer.

Kursus i anvendt onkologisk statistik og forskningsmetodik Dag 2. Jon K. Bjerregaard

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Estimation

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning

Faculty of Health Sciences. Basal Statistik. Overlevelsesanalyse. Lene Theil Skovgaard. 12. marts 2018

Epidemiologi og Biostatistik. Mogens Erlandsen, Institut for Biostatistik Uge 1, tirsdag d. 5. februar 2002

25. april Probability of Developing Coronary Heart Disease in 6 years. Women (Aged 35-70) 160 No Yes

Forelæsning 11: Kapitel 11: Regressionsanalyse

Module 4: Ensidig variansanalyse

Analysestrategi. Lektion 7 slides kompileret 27. oktober :24 p.1/17

Epidemiologiske associationsmål

Mikro-kursus i statistik 1. del Mikrokursus i biostatistik 1

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Logistisk Regression - fortsat

Forsøgsplanlægning Stikprøvestørrelse

Estimation og konfidensintervaller

Velkommen til kurset. Teoretisk Statistik. Lærer: Niels-Erik Jensen

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

6. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag)

Transkript:

... september 1 Epidemiologi og biostatistik. Uge, mandag. september Michael Væth, Institut for Biostatistik. Ikke parametrisk statistiske test : Analyse af overlevelsesdata (ventetidsdata) Censurering (højre + andet) Kaplan-Meyer kurver Ideen bag Cox proportional hazard model To grupper: Mann-Whitney / Wilcoxon testet Parret data (symmetrisk fordeling): Wilcoxon signed rank Association: Test baseret på Spearman s rang korrelation Det statistiske modelbegreb Modelselektion Ikke-parametrisk statistiske test Ikke-parametriske test (ordinale data) Hidtil (parametrisk statistik): Ukendt størrelse (parameter) f.eks OR, middelfødselsvægt eller lign. Estimat og standard error. Sikkerhedsinterval. Hypotese (fx OR=1). Test baseret på z = (estimat-hypotese)/se. Resultaterne bygger på en statistisk model. Baseres ikke på et parameter estimat. Men ofte på de rangordnede data. Bygger også på statistiske modeller. Men der er svagere antagelser bag dem. Ofte rang-test: De præcise observationsværdier har ingen betydning. Men det har rangene: Hvilken observation er mindst Rang=1 Hvilken observation er næstmindst Rang= Hvilken observation er trediemindst osv Rang= Et eksempel på Mann-Whitney-Wilcoxon test IKKE RYGER RANGORDNING RYGER Table.1 (.1) Fødselsvægt (kg) IKKE RYGER.99..1.1.9.....1..9...1. RYGER.....9....99.9...1 1....1..1 19 1.1...1.1 9 11 1 1.1..9..... 1.. Gennemsnitsrang: 1.9. 9... 1.9... 1 1.1.1.1.. Vi ønsker at teste hypotesen: Ingen forskel i fødselsvægt. ryger Idé: Sammenlign gennemsnitsrangen blandt ikke-rygere med gennemsnitsrangen blandt rygere. ikke ryger En stor forskel vil være kritisk for hypotesen.... fødselsvægt Er der forskel? P-værdi = sandsynligheden for at observere en større forskel under antagelse af hypotesen er sand! 1

. september Beregning ved hjælp af computer eller tabel (K&S A). p-værdi=9. Konklusion: Data strider mod hypotesen. Hypotesen kan ikke accepteres! Præcist samme test hvis vi regnede på ln-data. Eller kvadratroden af data. Eller en hvilken som helst monoton transformation. Kun rangordningen betyder noget. Testet hedder Mann-Whitney U-test eller Wilcoxon two-sample test. Generelt: Mann-Whitney U-test ækvivalent med Wilcoxon two sample test Data: To uafhængige sæt (ordinale) observationer. Hypotese: De to fordelinger er ens. Alternativ: De to fordelinger er forskudt i forhold til hinanden. Ide: Hvis alternativet er sandt vil gennemsnitsrangen være forskellig i de to grupper. Hvis hypotesen er sand så vil gennemsnitsrangene være næsten ens. P-værdi vha. af computer eller tabel. Et eksempel på signed Wilcoxon test En stikprøve eller parrede data Table. (.) Placebo-kontrolleret klinisk undersøgelse af sovepillers betydning for søvnlængde (timer). Patient Aktiv Placebo Differens Differens Rang 1.1..9.9..9-1.9 1.9..9.....9.9.. 1. 1... -...9.....1.. 1 9.... 9.. -1. 1. Rangordning af de numeriske værdi af differenserne (dvs glem fortegnet) 9 Hypotese: Ingen forskel mellem de to behandlinger. Man vil så forvente at der er cirka lige mange positive og negative differenser og at positive og negative differenser har ens fordelinger. Idé: Se på forskellen i sum af rangene af de positive og negative differenser. Det samme som at se på summen af rangene i den ene gruppe, da summen af alle rangene kun afhænger af stikprøvens størrelse. Husk: Rangene beregnes uden fortegn. P-værdi = sandsynligheden for at observere en større forskel under antagelse af hypotesen er sand! I eksemplet 11 Generelt: Wilcoxon signed rank test. 1 sum af negative differensers range = 1 Beregning ved hjælp af computer eller tabel (K&S A). p-værdi=.. Konklusion: Data strider ikke mod hypotesen. Hypotesen kan accepteres! Data: Et sæt uafhængige observationer. Hypotese: Fordelingen er symmetrisk om. Alternativ: Fordelingen er ikke symmetrisk om. Ide: Hvis alternativet er sandt vil rangsummene for de positive og negative tal være forskellige. Ikke samme test hvis vi transformerede data inden vi beregnede differensen. Hvis hypotesen er sand så vil rangsummene være næsten ens. P-værdi vha. af computer eller tabel. Fx et andet resultat hvis vi så på relative forskelle. Testet hedder Wilxocon signed-rank test. Bruges ofte ved parrede data - der regnes på differensen!

. september Et eksempel på test for ingen sammenhæng mellem to variable (se også andet eksempel: K&S side 9-) Incidens af Kaposi's sarcoma i Tanzania 1 Forudsætninger for lineær regression ikke opfyldt! (Derfor) beregning af Pearson korrelation uden mening. Hvad så! 1 Kan vi nøjes med et test? Til en start: Ja!? Hypotese (som sædvanlig): Ingen sammenhæng. Incidens per mio år % befolkning indenfor km fra sundhedscenter Er der en sammenhæng/association? Idé: Rangordne x erne samt y erne og beregn korrelation mellem rangene. Korrelation langt væk fra kritisk. P-værdi = sandsynligheden for at observere en korrelation længere væk fra under antagelse af hypotesen er sand! 1 Beregning ved hjælp af computer eller tabel. Korrelation mellem rangene =.. p-værdi=.1 Konklusion: Data strider ikke mod hypotesen. Hypotesen kan accepteres! Incidens af Kaposi's sarcoma i Tanzania % befolkning indenfor km fra sundhedscenter Præcist samme test hvis vi regnede på ln(x) og y. Eller ln(x) og y. Eller en hvilkensomhelst monoton transformation. Kun rangordningerne betyder noget. Testet hedder Spearman s rang korrelation Spearmans rho (ρ) Incidens per mio år Generelt: Test for ingen association baseret på Spearman s korrelation Data: Uafhængige par (x,y) af observationer. Hypotese: Ingen association mellem x og y. Alternativ: Monoton association. Ide: Hvis alternativet er sandt vil rangene af x erne være korrelerede med rangene af y erne. Spearman s korrelation beregnes. Hvis hypotesen er sand så vil denne korrelation være tæt på. P-værdi vha. af computer eller tabel. Spearman s korrelation er ikke mulig at fortolke! Men testet er godt nok! 1 y Pearson og Spearman korrelationer (1) Eksempel 1 Pearson.1 Spearman.99 1 y Pearson og Spearman korrelationer () Eksempel Pearson. Spearman. 1 x x Pearsons korrelationskoefficient er meget følsom overfor outliers. (i tvivl brug Spearmans )

. september y Pearson og Spearman korrelationer () Eksempel Pearson. Spearman -. x Lav en tegning før Pearsons korrelationskoefficient findes! Det kan være at den er meningsløs eller misvisende! Når man læser artikler: Overvej: ved forfatterne hvad de gør! 19 Ikke parametrisk test: Godt eller skidt?? For: Svage antagelser. Kan også bruges på ordinal data som meget godt; godt; rimeligt; dårligt; meget dårligt stadieinddeling af cancer (spredning). Stort set lige så stærke som parametriske test (gælder dog ikke hvis man har få data). Imod: Der er tale om test, ingen estimater med CI. Bruges ofte bevidstløst (svage antagelser = ingen antagelser?). Kan kun bruges til simple problemstillinger. Overlevelses (ventetids) data I follow-up studier ses ofte på ventetider: Tid til død af kræft efter kræft diagnose. Ventetid til operation. Tid mellem galdestensoperation og fund af ny galdesten. Sådanne data er ofte censurerede, dvs man kender ikke den præcise ventetid: Personerne dør af anden årsag end kræft. Personerne er i live da studiet slutter. Den opererede får ikke galdesten inden studiet slutter. Den opererede flytter til et andet amt/land. Højre censurering: Vi ved kun hvornår personen sidst var rask/i live 1 Ventetids data kan således være: Højre censureret: Vi ved, at personen ikke har oplevet begivenheden før sidste gang vi ser ham. Men kan også være: Venstre censureret: Vi ved, at personen har oplevet begivenheden inden vi ser ham første gang, men ikke hvornår. Interval censureret: Vi ved, at personen har oplevet begivenheden i givet tidsinterval, men ikke hvornår. Data er ofte interval censurerede: Vi ved, patienten var rask ved forrige kontrol, men nu er han/hun syg. Vi ved ikke, hvornår det skete. Interval censurerede data er svære at analysere. Der kan også være andre problemer med data: Vi ved ikke om personen har oplevet begivenheden inden vi ser ham første gang. Vi ved ikke om personen har oplevet begivenheden i et givet tidsinterval. Patienter var rask ved forrige kontrol og er det også nu. Har han været syg i mellemtiden? Personer indgår kun hvis de har overlevet. Det er kun højre censurerede data, der er lette at analysere - en computer med relevant software er dog fordel! For at bruge formlerne i K&S kapitel skal man have adgang til data for de enkelte personer. Metoderne til analyse af højre-censurerede ventetidsdata omfatter: Kaplan-Meyer plot: Metode til at beregne/tegne ventetidsfordelingen under hensyntagen til højre censureringen. Log-rank test: Tester hypotesen: Samme ventetidsfordeling i to grupper. Cox s proportional hazard model: Regressions analyse af ventetids data. Giver estimater af rate ratio er på log skala. Minder meget om logistisk regression.

. september.. K&S eksempel.. Overlevelse for patienter med leversygdom Kaplan-Meier survival estimates, by cenc Fortolkning: Kurverne er viser sandsynligheden for at live som funktion af tid siden behandlingsstart for de to grupper.. Alternativ præsentation: Risikoen for at dø som funktion af follow-up tid = 1 minus overlevelsesfunktion Kaplan-Meier failure estimates, by cenc Risikoen for at dø inden dag er.%.. Efter dage er chancen for at være i live.% cenc = cenc = 1 cenc = cenc = 1 Sammenligning af overlevelsesfunktioner Definitioner og sammenhænge: Hypotese: Overlevelsesfunktionerne i de to grupper er identiske, dvs S 1 (t) = S (t) for alle t S( t ) = Overlevelse/Survival funktion Eksemplet: Output fra en analyse med programpakken Stata Log-rank test for equality of survivor functions Events Events cenc observed expected.9 1.1 Total 9 9. chi(1) =. Pr>chi =... Kaplan-Meier survival estimates, by cenc P-værdi: Sandsynligheden er meget lille for at få to Kaplan-Meier kurver som mindst lige så forskellige, hvis overlevelsen ikke afhænger af central cholestasis. Konklusion: Hypotesen S 1 (t) = S (t) for alle t forkastes cenc = cenc = 1 h(t): hazard/intensitet til tidspunktet t. sands. for at 'dø'inden t + t givet man er i live til tid t h( t) = t ( ) t S ( t) = exp h( u) du Hazard funktionen beskriver den øjeblikkelige dødsrisiko per tidsenhed, dvs den teoretiske dødsrate I analyser af ventetidsdata benyttes sædvanligvis modeller som bekriver hvorledes prognostiske faktorer påvirker denne rate. Analyse af ventetidsdata med antagelse om proportionale hazards (proportionale rater) Eksemplet: Prognostisk faktor: Central cholestasis, ja (1), nej () Antag at raterne er proportionale, dvs h ( t) = θ h ( t) 1 Parameteren θ beskriver hvor meget raten for ja -gruppen er forøget Estimation: Et computer program giver ˆ θ =. 9% CI :.,. % større dødelighed hvis man har Central Cholestasis Survival Probability.... Rimelig overensstemmelse Observed: cenc = Observed: cenc = 1 Predicted: cenc = Predicted: cenc = 1 9 Man kan udvide denne model til at tage hensyn til flere ting på en gang (som multipel/logistisk regression). Modellens parametre beskriver effekter (rate ratio er) på en log-skala En metode er Cox proportional hazard model ( ) = ( ) exp( β1 1 + β + + β p p ) h t h t x x x eller ln[ h( t) ] = ln[ h ( t) ] + β x + β x + + β x 1 1 intet konstantled (α) men i stedet kurven ln[h (t)]. (x 1, x,..., x p ) i formlen er enten kodet (/1) fra dikotome kategoriske variable eller kontinuerte variable (vægt, bmi osv.); dette gælder også i multipel- og logistisk regression. p p

. september h (t) er baseline hazard svarerende til hazardkurven for en reference person med alle x er lig. Hazard kurven for en vilkårlig person er h ganget med exp(β 1 x 1 + β x +... +β p x p ) 1 K&S eksempel.. Overlevelse for patienter med leversygdom Vi ser på følgende tre prediktorer: Behandling: Aktiv versus placebo Central Cholestasis, ja/nej Patientens alder i år. Sammenligner man to personer der er ens mht ( x,..., x p ) og med en forskel på 1 i x 1 er h (t)/h (t) = exp(β 1 ) hazard ratio (rate ratio), uafhængig af t! Dvs. konstant rate ratio. Cox s proportional hazard model minder meget om logistisk regression. OUTPUT Prediktor behandling central chol alder reg.coeff -.19 1.. s.e.1..1 HR.. 1. lower 9% CI.. 1. upper 1.. 1. Aktiv behandling formindsker dødsraten med 1% - ikke statistisk signifikant. Alder: Dødsraten vokser med en faktor 1. per år. Statistiske modeller Modellen er typisk baseret på antagelser, så som: Bag alle beregninger af: de enkelte observationer er uafhængige. Estimater, se, sikkerhedsintervaller, test og p-værdier målefejlen er normalfordelt. ligger en statistisk model. Modellen er en approksimation til virkeligheden. Valget af model er et valg mellem: kompliceret model ofte god approksimation variationen mellem individer er normalfordelte. Ln(odds) kan skrives som en sum af forskellige bidrag. bidraget fra alder afhænger ikke af personens køn. (ingen effektmodifikation) simpel model ofte dårlig approksimation OR stiger eksponentielt med forskellen i BMI. kompliceret model svær at forstå og analysere simpel model let at forstå og analysere En model skal vælges så kompliceret, at den ikke er helt forkert og så simpel, at den er til at analysere og forstå. Hvis antagelserne ikke er (næsten) rigtige bliver resultaterne værdiløse. Derfor bør al statistisk analyse inkludere modelkontrol. Modelselektion Ofte er den model man får præsenteret i en artikel ikke den eneste forfatterne har fittet til data. Man får kun præsenteret den bedste. Modellen er selekteret (udvalgt). Bevidst eller ubevidst. Manuelt eller automatisk (PC: Find den bedste model!). Modelselektion har (desværre) betydning for resulterne: Estimaterne er typisk for store (for langt væk fra nul). Sikkerhedsintervallerne for smalle. P-værdierne for små.