24. februar Analyse af overlevelsesdata (ventetidsdata) Ikke parametrisk statistiske test : Det statistiske modelbegreb Modelselektion

Relaterede dokumenter
OR stiger eksponentielt med forskellen i BMI. kompliceret model svær at forstå og analysere

OR stiger eksponentielt med forskellen i BMI komplicet model svær at forstå og analysere simpel model

2 Epidemiologi og biostatistik. Uge 5, mandag 26. september 2005 Michael Væth, Institut for Biostatistik

23. februar Epidemiologi og biostatistik. Uge 5, mandag 27. februar 2006 Michael Væth, Institut for Biostatistik.

Statistik kommandoer i Stata opdateret 22/ Erik Parner

Morten Frydenberg Biostatistik version dato:

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april

Overlevelsesfunktion. Vi kalder S(t) for overlevelsesfunktionen.

Morten Frydenberg 14. marts 2006

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

MPH specialmodul Epidemiologi og Biostatistik

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Statistik kommandoer i Stata opdateret 16/ Erik Parner

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)

Morten Frydenberg 26. april 2004

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

4. september π B = Lungefunktions data fra tirsdags Gennemsnit l/min

1. februar Lungefunktions data fra tirsdags Gennemsnit l/min

Introduktion til overlevelsesanalyse

Epidemiologi og Biostatistik

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Dag 6: Interaktion. Overlevelsesanalyse

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Modul 12: Regression og korrelation

Forelæsning 11: Kapitel 11: Regressionsanalyse

Epidemiologi og Biostatistik

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006

Vi vil analysere effekten af rygning og alkohol på chancen for at blive gravid ved at benytte forskellige Cox regressions modeller.

Morten Frydenberg Biostatistik version dato:

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

Statistik II 4. Lektion. Logistisk regression

Korrelation Pearson korrelationen

Analysestrategi. Lektion 7 slides kompileret 27. oktober :24 p.1/17

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Basal statistik. 30. januar 2007

Løsning til eksaminen d. 14. december 2009

Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Estimation

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Statistiske principper

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression

Mikro-kursus i statistik 1. del Mikrokursus i biostatistik 1

Multipel Lineær Regression

Program. Sammenligning af to stikprøver Ikke-parametriske metoder Opsummering. Test for ens spredninger

Kapitel 7 Forskelle mellem centraltendenser

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Lineær og logistisk regression

Løsning til eksaminen d. 29. maj 2009

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 4: 2. marts

Tema. Dagens tema: Indfør centrale statistiske begreber.

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

1 Hb SS Hb Sβ Hb SC = , (s = )

Ikke-parametriske tests

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

Regressionsanalyser. Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer.

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Uafhængighedstestet

Overlevelsesanalyse. Faculty of Health Sciences

Faculty of Health Sciences. Logistisk regression: Kvantitative forklarende variable

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Faculty of Health Sciences. Basal Statistik. Overlevelsesanalyse. Lene Theil Skovgaard. 12. marts 2018

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Mål for sammenhæng mellem to variable

Løsning eksamen d. 15. december 2008

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model

Kapitel 12 Variansanalyse

Module 4: Ensidig variansanalyse

Sammenhængsanalyser. Et eksempel: Sammenhæng mellem rygevaner som 45-årig og selvvurderet helbred som 51 blandt mænd fra Københavns amt.

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Kapitel 11 Lineær regression

Overlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere.

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Mantel-Haenszel analyser

Øvelse 7: Aktuar-tabeller, Kaplan-Meier kurver og log-rank test

Eksempel: PEFR. Epidemiologi og biostatistik. Uge 1, tirsdag. Erik Parner, Institut for Biostatistik.

Anvendt Statistik Lektion 8. Multipel Lineær Regression

6. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag)

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j

Introduktion til overlevelsesanalyse

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning

Kapitel 10 Simpel korrelation

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

Program. Logistisk regression. Eksempel: pesticider og møl. Odds og odds-ratios (igen)

Seniorkursus i Biostatistik og Stata, Dag 2

Konfidensintervaller og Hypotesetest

Benchmarking af kommunernes sagsbehandling antagelser, metode og resultater

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 7: 23. marts

Morten Frydenberg 25. april 2006

Statistik II 1. Lektion. Analyse af kontingenstabeller

Øvelser i epidemiologi og biostatistik, 12. april 2010 Ebeltoft-projektet: Analyse af alkoholrelaterede data mm. Eksempel på besvarelse

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

Transkript:

. februar 00 Ikke parametrisk statistiske test : Ideen bag Epidemiologi og biostatistik. Uge, mandag. februar 00 Morten Frydenberg, Institut for Biostatistik. To grupper: Mann-Whitney / Wilcoxon testet Parret data (symmetrisk fordeling): Wilcoxon signed rank Association: Test baseret på Spearman s rang korrelation 1 Analyse af overlevelsesdata (ventetidsdata) Censurering (højre + andet) Kaplan-Meyer kurver Cox proportional hazard model Det statistiske modelbegreb Modelselektion Ikke-parametrisk statistiske test Ikke-parametriske test (ordinale data) Hidtil (parametrisk statistik): Ukendt størrelse (parameter) OR, middelfødselsvægt eller lign. Estimat og standard error. Sikkerhedsinterval. Hypotese (fx OR=1). Test baseret på z = (estimat-hypotese)/se. Resultaterne bygger på en statistisk model. Baseres ikke på et parameter estimat. Men ofte på de rangordnede data. Bygger også på statistiske modeller. Men der er svagere antagelser bag dem. Ofte rang-test: De præcise observationsværdier har ingen betydning. Men det har rangene: Hvilken observation er mindst Rang=1 Hvilken observation er næstmindst Rang= Hvilken observation er trediemindst Rang= osv Et eksempel på Mann-Whitney-Wilcoxon test Table 1. Biceps skinfold thickness (mm) Crohn s Disease Coeliac Disease 1.... 1.......0.....0.0.....0.0...0.0..0 TYPE Coeliac RANGE Crohn s Disease Coeliac Disease 1. 1. 9.. 1... 1. 1. 1... 1. 19...0 1... 1. 0..0.0 1.. 1....0.0. 9.. 1.0.0 9. 11.0 Gennemsnitsrang: 1. 11.1 Vi ønsker at teste hypotesen: Ingen forskel i skinfold. Idé: Sammenlign gennemsnitsrangen blandt Coeliac patienter med gennemsnitsrangen blandt Crohn patienter. En stor forskel vil være kritisk for hypotesen. 0 SKINFOLD Crohn 1 Er der forskel? P-værdi = sandsynligheden for at observere en større forskel under antagelse af hypotesen er sand! 1

. februar 00 Beregning ved hjælp af computer eller tabel. p-værdi=0.1. Konklusion: Data strider ikke mod hypotesen. Hypotesen kan accepteres! Præcist samme test hvis vi regnede på ln-data. Eller kvadratroden af data. Eller en hvilken som helst monoton transformation. Kun rangordningen betyder noget. Testet hedder Mann-Whitney U-test eller Wilcoxon two-sample test. Generelt: Mann-Whitney U-test ækvivalent med Wilcoxon two sample test Data: To uafhængige sæt (ordinale) observationer. Hypotese: De to fordelinger er ens. Alternativ: De to fordelinger er forskudt i forhold til hinanden. Ide: Hvis alternativet er sandt vil gennemsnitsrangen være forskellig i de to grupper. Hvis hypotesen er sand så vil gennemsnitsrangene være næsten ens. P-værdi vha. af computer eller tabel. Et eksempel på signed Wilcoxon test En stikprøve eller parrede data Del af Table. Capillary density (per mm ) in feet of ulcerated patients. Differens mellem værste og bedste fod. Obs -1 - - - - - -1 0 0 0 0 1 1 Obs 1 1 1 1 Rang 1. 1. 1.. 11 Sum af range: 1 Hypotese: Ingen forskel mellem de to fødder, mao. positive og negative differenser har ens fordelinger. Idé: Se på forskellen i sum af rangene af de positive og negative differenser. : Rangene beregnes uden fortegn. P-værdi = sandsynligheden for at observere en større forskel under antagelse af hypotesen er sand! 9 Beregning ved hjælp af computer eller tabel. p-værdi=0.. Konklusion: Data strider ikke mod hypotesen. Hypotesen kan accepteres! Ikke samme test hvis vi transformerede data inden vi beregnede differensen. Fx et andet resultat hvis vi så på relative forskelle. Testet hedder Wilxocon signed-rank test. Generelt: Wilcoxon signed rank test. Data: Et sæt uafhængige observationer. 11 Et eksempel på test for ingen sammenhæng Table 1. Incidens af Kaposi's sarcoma i Tanzania 1 Hypotese: Fordelingen er symmetrisk om 0. Alternativ: Fordelingen er ikke symmetrisk om 0. Ide: Hvis alternativet er sandt vil rangsummene for de positive og negative tal være forskellige. Hvis hypotesen er sand så vil rangsummene være næsten ens. P-værdi vha. af computer eller tabel. Bruges ofte ved parrede data - der regnes på differensen! Incidens per mio år 0 0 0 0 0 0 0 % befolkning indenfor km fra sundhedscenter Er der en sammenhæng/association?

. februar 00 Forudsætninger for lineær regression ikke opfyldt! (Derfor) beregning af Pearson korrelation uden mening. Hvad så! Kan vi nøjes med et test? Til en start: Ja!? Hypotese (som sædvanlig): Ingen sammenhæng. Idé: Rangordne x erne samt y erne og beregn korrelation mellem rangene. Korrelation langt væk fra 0 kritisk. P-værdi = sandsynligheden for at observere en korrelation længere væk fra 0 under antagelse af hypotesen er sand! 1 1 Beregning ved hjælp af computer eller tabel. Korrelation mellem rangene =0.. p-værdi=0.1 Konklusion: Data strider ikke mod hypotesen. Hypotesen kan accepteres! Præcist samme test hvis vi regnede på ln(x) og y. Eller ln(x) og y. Eller en hvilkensomhelst monoton transformation. Kun rangordningerne betyder noget. Testet hedder Spearman s rang korrelation Spearmans rho (ρ) Incidens per mio år Incidens af Kaposi's sarcoma i Tanzania 0 0 0 0 0 0 0 % befolkning indenfor km fra sundhedscenter Generelt: Test for ingen association baseret på Spearman s korrelation Data: Uafhængige par (x,y) af observationer. Hypotese: Ingen association mellem x og y. Alternativ: Monoton association. Ide: Hvis alternativet er sandt vil rangene af x erne være korrelerede med rangene af y erne. Spearman s korrelation beregnes. Hvis hypotesen er sand så vil denne korrelation være tæt på 0. 1 y Pearson og Spearman korrelationer Eksempel 1 00 0 0 x Pearson 0.1 Spearman 0.99 1 P-værdi vha. af computer eller tabel. Spearman s korrelation er ikke mulig at fortolke! Men testet er godt nok! Pearson og Spearman korrelationer 1 Pearson og Spearman korrelationer 1 y Eksempel Pearson 0. Spearman 0.0 y Eksempel Pearson 0. Spearman -0. 00 0 0 x Pearsons korrelationskoefficient er meget følsom overfor outliers. (i tvivl brug Spearmans ) 00 0 0 x Lav altid en tegning før Pearsons korrelationskoefficient findes! Det kan være at den er meningsløs eller misvisende! Når man læser artikler: Overvej om forfatterne ved hvad de gør!

. februar 00 For: Ikke parametrisk test: Godt eller skidt?? Svage antagelser. Kan også bruges på ordinal data som meget godt; godt; rimeligt; dårligt; meget dårligt CIN 1;CIN ; CIN ; Cancer. Stort set lige så stærke som parametriske test (gælder dog ikke hvis man har få data). Imod: Der er tale om test, ingen estimater med CI. Bruges ofte bevidstløst (svage antagelser=ingen antagelser). Kan kun bruges til simple problemstillinger. 19 Overlevelses (ventetids) data Data der involverer ventetider: Tid til død af kræft efter kræft diagnose. Ventetid til operation. Tid mellem galdestensoperation og fund af ny galdesten. Sådanne data er ofte censurere: Personerne dør af anden årsag end kræft. Personerne er i live da studiet slutter. Den opererede får ikke galdesten inden studiet slutter. Den opererede flytter til et andet amt/land. =Højre censurering: Vi ved hvornår personen sidst var rask/i live 0 Ventetids data kan således være: Højre censureret: Vi ved, at personen ikke har oplevet begivenheden før sidste gang vi ser ham. Men kan også være: Venstre censureret: Vi ved, at personen har oplevet begivenheden inden vi ser ham første gang, men ikke hvornår. Interval censureret: Vi ved, at personen har oplevet begivenheden i givet tidsinterval, men ikke hvornår. Data er ofte interval censurerede: Vi ved, patienten var rask ved forrige kontrol, men nu er han syg. Vi ved ikke, hvornår han blev det. Interval censurerede data er svære at analysere. 1 Der kan også være andre problemer med data: Vi ved ikke om personen har oplevet begivenheden inden vi ser ham første gang. Vi ved ikke om personen har oplevet begivenheden i et givet tidsinterval. Patienter var rask ved forrige kontrol og er det også nu. Har han været syg i mellemtiden? Personer indgår kun hvis de har overlevet. Det er kun højre censurede data, der er let at analysere! Metoderne er: Kaplan-Meyer plot: Metode til at beregne/tegne ventetidsfordelingen under hensyntagen til højre censureringen. Log-rank test: Tester hypotesen: Samme ventetidsfordeling i to grupper. Cox s proportional hazard model: Regressions analyse af ventetids data. Modellerer den relative risiko på log skala. Minder meget om logistisk regression. Intet relaps 0.00 0. 0.0 0. 1.00 Table 1.9 Kaplan-Meier survival estimate Kaplan Meyer overlevelseskurve % galdestensfrie efter ca år 0 0 0 0 0 Tid siden operation

. februar 00 Relaps 0.00 0. 0.0 0. 1.00 Kaplan-Meier survival estimate En anden akse (1- overlevelse ), her andel af nye tilfælde. Kaplan Meyer overlevelseskurve % har igen galdesten efter ca år 0 0 0 0 0 Tid siden operation Intet relaps 0.00 0. 0.0 0. 1.00 Kaplan-Meier survival estimates, by type Log rank test: p=0.009 Der forskel på ventetiden! Det går hurtigere hos de multiple. type = enkelt type = multipel 0 0 0 0 0 Tid siden operation Kurverne meget usikre efter 0-0 mdr. Definitioner og sammenhænge: S( t ) = Overlevelse/Survival funktion h(t): hazard/intensitet til tidspunktet t. sands. for at 'dø'inden t + t givet man er i live til tid t h( t) = t ( 0 ) t S ( t ) = exp h( u) du Man kan udvide sin model til at tage hensyn til flere ting på en gang (som multipel/logistisk regression). En metode er Cox proportional hazard model ( ) = 0 ( ) exp( β1 1 + β + + β p p ) h t h t x x x eller ln[ h( t) ] = ln[ h ( t )] + β x + β x + + β x 0 1 1 intet konstantled (α) men i stedet kurven ln[h 0 (t)]. (x 1, x,..., x p ) i formlen er enten kodet (0/1) fra dichotome kategoriske variable eller kontinuerte variable (vægt, bmi osv.); dette gælder også i multipel- og logistisk regression. p p h 0 (t) er baseline hazard svarerende til hazardkurven for en person med alle x er lig 0. Harzard kurven for en vilkårlig person er h 0 ganget med exp(β 1 x 1 + β x +... +β p x p ) Sammenligner man to personer der er ens mht ( x,..., x p ) og med en forskel på 1 i x 1 er h (t)/h 0 (t) = exp(β 1 ) hazard ratio, uafhængig af t! Dvs. konstant relativ risiko. Cox s proportional hazard model minder meget om logistisk regression. 9 Tid mellem galdestensoperation og næste galdesten (table 1.1) Prediktorer: Flere galdesten fjernet Diameter af største galdesten Den tid det tog at opløse galdesten(ene) i mdr. Variable B S.E. Exp(B) Flere sten..00.1 Diameter -.0.01.9 Opløsningstid.0.01 1.0 Risikoen er. gange større, når flere sten er fjernet. Risikoen stiger med % per måned det tog at opløse stenene. 0

. februar 00 Bag alle beregninger af: Statistiske modeller Estimater, se, sikkerhedsintervaller, test og p-værdier ligger en statistisk model. Modellen er en approksimation til virkeligheden. Valget af model er et valg mellem: kompliceret model ofte god approksimation simpel model ofte dårlig approksimation kompliceret model svær at forstå og analysere simpel model let at forstå og analysere En model skal vælges så kompliceret, at den ikke er helt forkert og så simpel, at den er til at analysere og forstå. 1 Modellen er typisk baseret på antagelser, så som: de enkelte observationer er uafhængige. målefejlen er normalfordelt. variationen mellem individer er normalfordelte. Ln(odds) kan skrives som en sum af forskellige bidrag. bidraget fra alder afhænger ikke af personens køn. (ingen effektmodifikation) OR stiger eksponentielt med forskellen i BMI. Hvis antagelserne ikke er (næsten) rigtige bliver resultaterne værdiløse. Derfor bør al statistisk analyse inkludere modelkontrol. Modelselektion Ofte er den model man får præsenteret i en artikel ikke den eneste forfatterne har fittet til data. Man får kun præsenteret den bedste. Modellen er selekteret (udvalgt). Bevidst eller ubevidst. Manuelt eller automatisk (PC: Find den bedste model!). Modelselektion har (desværre) betydning for resulterne: Estimaterne er typisk for store (for langt væk fra nul). Sikkerhedsintervallerne for smalle. P-værdierne for små.