Kursus i anvendt onkologisk statistik og forskningsmetodik Dag 2. Jon K. Bjerregaard

Relaterede dokumenter
9. Chi-i-anden test, case-control data, logistisk regression.

Statistikøvelse Kandidatstudiet i Folkesundhedsvidenskab 28. September 2004

OR stiger eksponentielt med forskellen i BMI. kompliceret model svær at forstå og analysere

Eks. 1: Kontinuert variabel som i princippet kan måles med uendelig præcision. tid, vægt,

Dag 6: Interaktion. Overlevelsesanalyse

OR stiger eksponentielt med forskellen i BMI komplicet model svær at forstå og analysere simpel model

En intro til radiologisk statistik. Erik Morre Pedersen

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model

8.2 Statistiske analyse af hver enkelt indikator

Morten Frydenberg Biostatistik version dato:

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Uafhængighedstestet

En intro til radiologisk statistik

Overlevelsesfunktion. Vi kalder S(t) for overlevelsesfunktionen.

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

8.2 Statistiske analyse af hver enkelt indikator

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Mantel-Haenszel analyser

Løsning til eksaminen d. 14. december 2009

Normalfordelingen og Stikprøvefordelinger

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet

Kommentarer til spørgsmålene til artikel 1: Ethnic differences in mortality from sudden death syndrome in New Zealand, Mitchell et al., BMJ 1993.

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Mål for sammenhæng mellem to variable

Faculty of Health Sciences. Basal Statistik. Overlevelsesanalyse. Lene Theil Skovgaard. 12. marts 2018

Statistik II 1. Lektion. Analyse af kontingenstabeller

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse

Program. Logistisk regression. Eksempel: pesticider og møl. Odds og odds-ratios (igen)

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Estimation

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Epidemiologi og Biostatistik

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning

1. februar Lungefunktions data fra tirsdags Gennemsnit l/min

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

2 Epidemiologi og biostatistik. Uge 5, mandag 26. september 2005 Michael Væth, Institut for Biostatistik

Logistisk Regression - fortsat

Statistik kommandoer i Stata opdateret 16/ Erik Parner

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Udvikling af den danske HSMR model. DSKS årsmøde den 15. januar 2010 Malene Cramer Engebjerg

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Mikro-kursus i statistik 1. del Mikrokursus i biostatistik 1

Analysestrategi. Lektion 7 slides kompileret 27. oktober :24 p.1/17

Øvelse 7: Aktuar-tabeller, Kaplan-Meier kurver og log-rank test

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

Noter til SfR checkliste 3 Kohorteundersøgelser

Introduktion til overlevelsesanalyse

Betinget fordeling Uafhængighed. Beregning af forventet tabel Chi-kvadrat teststatistik Chi-kvadrat test. Chi-kvadratfordelingen Agresti - Summary

Overlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere.

Predictors of chemotherapy induced toxicity in 421 patients with metastatic castration resistant prostate cancer results from a single institution

Hver anden vil benytte øget åbningstid i dagtilbud

UNDERVISNINGSEFFEKT-MODELLEN 2006 METODE OG RESULTATER

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Studieplan Biostatistik Semester 3

1 Regressionsproblemet 2

Mantel-Haenszel analyser. Stratificerede epidemiologiske analyser

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Statistik II 4. Lektion. Logistisk regression

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning

Module 3: Statistiske modeller

Morten Frydenberg Biostatistik version dato:

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

MPH specialmodul i biostatistik og epidemiologi SAS-øvelser vedr. case-control studie af malignt melanom.

Log-lineære modeller. Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres.

24. februar Analyse af overlevelsesdata (ventetidsdata) Ikke parametrisk statistiske test : Det statistiske modelbegreb Modelselektion

4. september π B = Lungefunktions data fra tirsdags Gennemsnit l/min

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression

PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006

Forelæsning 11: Kapitel 11: Regressionsanalyse

Basal statistik. 30. januar 2007

Statistik kommandoer i Stata opdateret 22/ Erik Parner

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Løsning eksamen d. 15. december 2008

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering

Opgavebesvarelse, Basalkursus, uge 3

To-sidet varians analyse

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j

Kapitel 12 Variansanalyse

Sammenligning af to sæt observationer p-værdier og sikkerhedsgrænser

MPH specialmodul Epidemiologi og Biostatistik

Kursus 02323: Introducerende Statistik. Forelæsning 12: Forsøgsplanlægning. Peder Bacher

Postoperative komplikationer

Baggrundsnotat: Søskendes uddannelsesvalg og indkomst

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Vi vil analysere effekten af rygning og alkohol på chancen for at blive gravid ved at benytte forskellige Cox regressions modeller.

Konfidensintervaller og Hypotesetest

Program. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data

Transkript:

Kursus i anvendt onkologisk statistik og forskningsmetodik Dag 2 Jon K. Bjerregaard

Dag 2 09.00 12.00 Opfriskning fra sidst Gennemgang af artikler Sammenligning af en eller flere grupper Overlevelsesanalyse 12.00 12.45 Frokost 12.45 15.00 Pretest sandsynligheder, Specificitet & Sensivitet. ROC analyser. Meta-analyser.

Teori Praksis Læring Refleksion

Læge/kliniker/forsker Statistiker Som kliniker er det vigtigt at kunne tolke resultater Som forsker er det vigtigt at udfører arbejde af høj kvalitet Som statistiker er det vigtigt at kende alt baggrunden

Naturvidenskabelig metode Observation Ide Hypotese Statistisk hypotese Observation systematisk Statistisk hypotese test

Vi kigger lige (hurtigt) på artiklerne Kan I finde hypotesen? 10 minutter

Centrale principper Normal fordeling Stikprøve Variabel typer

Normalfordeling Kan beskrives med 2 værdier -4 sd -3 sd -2 sd -1 sd mean 1 sd 2 sd 3 sd 4 sd

Stikprøve Anvendes til at generalisere til alle Stikprøve -4 sd -3 sd -2 sd -1 sd mean 1 sd 2 sd 3 sd 4 sd Patienter -4 sd -3 sd -2 sd -1 sd mean 1 sd 2 sd 3 sd 4 sd

Vi kigger igen på artiklerne Er stikprøven ok?

Datatyper Kontinuerlige variabler 1,2,3,. Kategoriske variabler Let, Moderat, Svær

Gene expression profile Hvad skal vi mene? Er den kontinuerlig eller kategorisk? Hvad skal vi mene?

Variation Variation i stikprøven sd = 2 (obs 1 gennemsnit) 2 + obs 2 gennemsnit. antal observationer 1

Normalfordeling og stikprøver Hele gruppen af patienter har et ægte gennemsnit variation Vores stikprøve anvendes som bedste bud på dette Jo større stikprøve des bedre bud

Konfidens interval Et interval hvor der er sandsynligt at den ægte værdi befinder sig. Spørgsmål Hvor præcist har vi målt højden?

Standard error of the mean Et mål for præcisionen SEM = SD n Dyb indånding Ingen Panik

Konsekvenser Variation i måling Stor SEM højere Lille SEM mindre Antal patienter Stort SEM falder Lille SEM stiger

Konfidens interval Standard error: SEM = SD n 95% CI = gennemsnit ± 1,96 SEM Test 1: n=7 Gennemsnit 178 (168-190) Test 2: n=1000 Gennemsnit 178 (177-178)

Stikprøve teori Jo større stikprøve Jo større sandsynlighed for at den passer

Stikprøve teori Jo større stikprøve Jo større sandsynlighed for at den passer n

Stikprøve teori Jo større stikprøve Jo større sandsynlighed for at den passer nn

Stikprøve teori Jo større stikprøve Jo større sandsynlighed for at den passer nn

Variation hvor går det galt Stikprøve Sted Børnehave vs. plejehjem vs. lokalet Andre Køn Race etc. Man kan tænke om variationen i stikprøven kan forklares fra andre faktorer. Alternativt kan man kalde det støj i målingen Mere om dette senere

Take-home Normafordeling er et centralt princip Fordelingen kan beskrives udfra Gennemsnit og spredning(sd) En stikprøve bruges til at estimere den ægte værdi Stikprøvens præcision øges ved at lave den større

Datatyper Kontinuerlige variabler 1,2,3,. T-test 1 stikprøve mod værdi Uparret Parret Kategoriske variabler Let, Moderat, Svær Chi2 test Observeret mod forventet Fisher's exact Hvis små tal

Teori Praksis Læring Refleksion

Onkologiske forsøgsdesign Basis videnskab Systematiske observationer af populationer Diagnostik Kliniske studier Fase I, II & III

Fase I,II & III Fortæl lige din sidemakker hvad de forskellige fasers formål og design er Endepunkt osv

Kliniske studier Fase I/II/III Fase I Dosis Bivirkninger Fase II

Onkologisk Mål & Metode Metode Kan det slå kræft ihjel? i en petriskål/mus Præ-klinisk fase Er det for giftigt? Hvilken dose er sikker? Fase I Kan det slå kræft ihjel? i en patient Fase II Er det bedre end det vi plejer at bruge? Fase III

Fase I 3+3 Bivirkninger Værste grad siden sidst Skala fra 1-5 1. Mild 2. Moderat 3. Svær 4. Livstruende 5. Død

Fase II Response Skrumpning tolkes som tegn på celledrab Vækst/nye metastaser som tegn på manglende effekt Kemoterapi

Skrumpnings-regler R.E.C.I.S.T. Progression (PD) +20% i diameter eller nye læsioner Partiel response (PR) -30% i diameter Complete response (CR) Ingen synlige manifestationer No-Change Ikke PD/PR/CR

Fase III Lodtrækning Det nye Patient Det gamle Udføres hvis man ikke klinisk kan se forskel

Kig på artiklerne Hvilke faser?

Tese Statistik skal hjælpe os med at finde ud af, om den forskel vi observere, er kausalt forbundet med en intervention/proces, eller et resultat af tilfældig variation. Vigtigt! Vi kender ikke pre-test sandsynligheden Jo mere sjælden jo større problemer

Selke et al. Am J Stat 2001 Nuzzo Nature 2014

God nyhed for klinikeren! Statistik skal hjælpe os med at finde ud af, om den forskel vi observere, er kausalt forbundet med en intervention/proces, eller et resultat af tilfældig variation. Vigtigt! Vi kender ikke pre-test sandsynligheden Jo mere sjælden jo større problemer

Take-home Forsknings metodologi Ethvert forsøg skal baserer sig på et videnskabeligt solidt grundlag.

Pause!

Styrke beregninger Vi vil gerne beregne hvor mange patienter der skal inkluderes

Hvilken strategi foretrækker du? Et stort forsøg (n=400) 4 små forsøg (n=100)x4

Test - teori Virkelighed Positiv Negativ Forsøg Positiv Negativ

Test - teori Forsøget finder sandheden Virkelighed Positiv Negativ Forsøg Positiv Negativ

Test - teori Testen finder ikke sandheden Falsk positiv Falsk negativ Virkelighed Positiv Negativ Forsøg Positiv Negativ

Test - teori Testen finder ikke sandheden Falsk positiv Falsk negativ Virkelighed Positiv Negativ Forsøg Positiv Negativ

Test - teori Testen finder ikke sandheden Falsk positiv Falsk negativ Virkelighed Positiv Negativ Forsøg Positiv Negativ Power/styrke Alfa Hvad er problemet ved hhv. falsk positiv og falsk negativt? (3 minutter)

Styrkeberegninger En styrkeberegning er en HJÆLP!!!! Forventningsafstemning

Styrkeberegning Hvad var det lige vi skulle bruge for at lave en beregning? Sidemakker

Powerberegninger Vi planlægger et studie om højde Vi tror at kvinder er mindre en mænd

Powerberegninger Vi planlægger et studie om højde Vi tror at kvinder er mindre en mænd Nul-hypotesen De er lige høje

Powerberegninger Vi planlægger et studie om højde Vi tror at kvinder er mindre en mænd Falsk positiv risiko? Falsk negativ risiko? Forskel? Variation? Variation?

Powerberegninger Effekt af antal n n

Powerberegninger Effekt af antal n n

Powerberegninger Effekt af antal n

Powerberegninger Effekt af forskel

Power-beregninger Interim analyser bruger noget af p-værdien Specielle effektstørrelser Er det realistisk?

Teori Praksis Læring Refleksion

Dag 2 09.00 12.00 Opfriskning fra sidst Gennemgang af artikler Sammenligning af en eller flere grupper Overlevelsesanalyse 12.00 12.45 Frokost 12.45 15.00 Pretest sandsynligheder, Specificitet & Sensivitet. ROC analyser. Meta-analyser.

Dyb indånding Ingen Panik

Tid-til-hændelse Vi definere at død er en hændelse event I den periode patienten er observeret er der en risiko for et event Det kan så enten ske eller ikke Livstid I live 1 Ja 3 Nej 5 Nej 5 Nej 7 Ja 8 Nej 9 Nej 9 Ja 11 Ja 12 Nej 15 Nej 18 Nej 20 Ja 25 Nej

1 2 3 4 5 6 7 8 9 10 11 12 13 14 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25

Kurven udregnes for hver rød plet 1 2 3 4 5 6 7 8 9 10 11 12 13 14 13 i risiko 1 dør Kurven falder med 1/13 del 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25

Kurven udregnes for hver rød plet 12 i risiko 2 dør 0 1Kurven 2 3falder 4 5med 6 2/12 7 8del 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 1 2 3 4 5 6 7 8 9 10 11 12 13 14

Kurven udregnes for hver rød plet 1 2 3 4 5 6 7 8 9 10 11 12 13 14 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 9 i risiko 1 dør Kurven falder med 1/9 del

Kurven udregnes for hver rød plet 1 2 3 4 5 6 7 8 9 10 11 12 13 14 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 8 i risiko 1 dør Kurven falder med 1/8 del

Kurven udregnes for hver rød plet 1 2 3 4 5 6 7 8 9 10 11 12 13 14 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 5 i risiko 1 dør Kurven falder med 1/5 del

Kurven udregnes for hver rød plet 1 2 3 4 5 6 7 8 9 10 11 12 13 14 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 4 i risiko 1 dør Kurven falder med 1/4 del

Kurven udregnes for hver rød plet 1 2 3 4 5 6 7 8 9 10 11 12 13 14 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 3 i risiko 1 dør Kurven falder med 1/3 del

Kurven udregnes for hver rød plet 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 1 2 3 4 5 6 7 8 9 10 11 12 13 14

Pause Teori Praksis Refleksion

Dag 2 09.00 12.00 Opfriskning fra sidst Gennemgang af artikler Sammenligning af en eller flere grupper Overlevelsesanalyse 12.00 12.45 Frokost 12.45 15.00 Pretest sandsynligheder, Specificitet & Sensivitet. ROC analyser. Meta-analyser.

Sammenligning mellem 2+ grupper t-test Chi 2 Log-rank Regression Cox regression

Eksempel 2x2 tabel PD-NEC PC-norm Mænd 18 21 Kvinder 14 19

Eksempel 2x2 tabel PD-NEC PC-norm Total Mænd 18 21 39 Kvinder 14 19 23 32 40 72

Eksempel 2x2 tabel PD-NEC PC-norm Total Mænd 18 21 54% Kvinder 14 19 46% 32 40 72 Forventet hvis lige PD-NEC PC-norm Total Mænd 17,3 21,6 54% Kvinder 14,7 18,4 46% 32 40 72

Lav udregningen for BRAF Observeret NEC Ade WT 12 38 50 MUT 17 2 19 29 40 69 Tabellen fra artiklen Observeret NEC Ade WT 12 38 72% MUT 17 2 28% 29 40 69 Forventet NEC Ade WT 21,01 28,99 72% MUT 7,99 11,01 28% 29 40 69

Dag 2 09.00 12.00 Opfriskning fra sidst Sammenligning af en eller flere grupper Overlevelsesanalyse Gennemgang af artikler 12.00 12.45 Frokost 12.45 15.00 Pretest sandsynligheder, Specificitet & Sensivitet. ROC analyser. Meta-analyser.

Observeret vs. forventet T-test t = rød blå SEM

Observeret vs. forventet T-test Test mod hypotetisk anden værdi Test mod anden gruppe Med eller uden samme sd Parret test Hvis det er den samme ting der måles på 2 gange t = rød blå SEM

T-test 2 stikprøver Ikke samme variation

Kig på statistik afsnittet Hvad skal vi mene? Bord diskussion 10 + 5 minutter Hvad skal vi mene?

Konklusion?

t-test flere grupper Åbn dokumentet (t-test_1.xlsx) Er kvinder(0) lige så høje som mænd(1)? t-test i excel =ttest(0;1;2;3) ID Height Gender Weight Blond 1 169 0 58 0 2 171 0 62 1 3 167 0 71 0 4 170 0 67 1 5 177 0 78 1 6 164 0 69 1 7 165 0 66 0 8 169 0 63 1 9 171 0 66 0 10 169 0 69 1 11 180 1 60 0 12 172 1 65 1 13 174 1 86 1 14 179 1 83 0 15 188 1 83 0 16 173 1 75 1 17 177 1 69 0 18 189 1 73 1 19 166 1 59 0 20 192 1 108 0

Andre test Tænk observeret vs. forventet 5 minutter diskussion med bordet ID Height Gender Weight Blond 1 169 0 58 0 2 171 0 62 1 3 167 0 71 0 4 170 0 67 1 5 177 0 78 1 6 164 0 69 1 7 165 0 66 0 8 169 0 63 1 9 171 0 66 0 10 169 0 69 1 11 180 1 60 0 12 172 1 65 1 13 174 1 86 1 14 179 1 83 0 15 188 1 83 0 16 173 1 75 1 17 177 1 69 0 18 189 1 73 1 19 166 1 59 0 20 192 1 108 0

Observeret vs. forventet Kvinder gul, mænd grøn ID Height Gender Weight Blond 1 169 0 58 0 2 171 0 62 1 3 167 0 71 0 4 170 0 67 1 5 177 0 78 1 6 164 0 69 1 7 165 0 66 0 8 169 0 63 1 9 171 0 66 0 10 169 0 69 1 11 180 1 60 0 12 172 1 65 1 13 174 1 86 1 14 179 1 83 0 15 188 1 83 0 16 173 1 75 1 17 177 1 69 0 18 189 1 73 1 19 166 1 59 0 20 192 1 108 0

Observeret vs. forventet Sorter efter højde ID Height Gender Weight Blond 6 164 0 69 1 7 165 0 66 0 19 166 1 59 0 3 167 0 71 0 1 169 0 58 0 8 169 0 63 1 10 169 0 69 1 4 170 0 67 1 2 171 0 62 1 9 171 0 66 0 12 172 1 65 1 16 173 1 75 1 13 174 1 86 0 5 177 0 78 0 17 177 1 69 0 14 179 1 83 1 11 180 1 60 0 15 188 1 83 0 18 189 1 73 1 20 192 1 108 1

Observeret vs. forventet Weight ID Height Gender Weight Blond 1 169 0 58 0 2 171 0 62 1 3 167 0 71 0 4 170 0 67 1 5 177 0 78 1 6 164 0 69 1 7 165 0 66 0 8 169 0 63 1 9 171 0 66 0 10 169 0 69 1 11 180 1 60 0 12 172 1 65 1 13 174 1 86 1 14 179 1 83 0 15 188 1 83 0 16 173 1 75 1 17 177 1 69 0 18 189 1 73 1 19 166 1 59 0 20 192 1 108 0

Observeret vs. forventet Weight ID Height Gender Weight Blond 1 169 0 58 0 19 166 1 59 0 11 180 1 60 0 2 171 0 62 1 8 169 0 63 1 12 172 1 65 1 7 165 0 66 0 9 171 0 66 0 4 170 0 67 1 6 164 0 69 1 10 169 0 69 1 17 177 1 69 0 3 167 0 71 0 18 189 1 73 1 16 173 1 75 1 5 177 0 78 0 14 179 1 83 1 15 188 1 83 0 13 174 1 86 0 20 192 1 108 1

Hårfarve Er blonde højere?

Dag 2 09.00 12.00 Opfriskning fra sidst Sammenligning af en eller flere grupper Overlevelsesanalyse Gennemgang af artikler 12.00 12.45 Frokost 12.45 15.00 Pretest sandsynligheder, Specificitet & Sensivitet. ROC analyser. Meta-analyser.

40 patienter OS Overlevelses tid Mors Event Factor 0,1,2 Ting vi har samlet ind ID OS Mors Factor0 Factor1 Factor2 1 3,6 1 0 1 1 2 59,7 1 1 1 0 3 65,8 0 1 0 0 4 76,9 1 1 1 0 5 48,1 1 0 1 0 6 93,5 1 1 1 1 7 13,6 1 1 0 1 8 35,9 1 1 1 0 9 16,0 1 0 1 1 10 99,7 0 1 1 1 11 30,7 1 0 1 0 12 79,5 1 0 1 1 13 92,8 0 0 0 1 14 69,4 1 1 1 0 15 52,5 1 1 1 0 16 27,5 0 0 0 0 17 91,5 1 1 1 1 18 96,2 1 1 0 1 19 50,1 1 1 0 0 20 58,8 1 1 0 0 21 48,7 1 0 0 0 22 0,7 0 0 0 1 23 22,2 1 0 1 1 24 48,8 0 1 1 0 25 74,9 0 1 1 0 26 90,8 1 1 0 1 27 73,4 1 0 0 0 28 45,6 1 0 0 0 29 87,8 0 1 0 1 30 77,1 0 1 0 1 31 33,3 1 0 0 0 32 27,2 1 1 1 1 33 4,5 1 0 0 1 34 6,2 0 0 1 1 35 18,1 0 0 0 1 36 27,8 1 0 1 0 37 23,4 0 0 0 1 38 28,6 1 0 0 0 39 88,7 0 1 1 1 40 76,6 1 1 0 0

Overlevelses analyse Forklar din sidemakker hvad du ser på

Delt på Factor0 Forklar din sidemakker hvad du ser på (skift) p=0.003

Factor1 Forklar din sidemakker hvad du ser på p=0.726

Factor2 Forklar din sidemakker hvad du ser på p=0.024

Hvor kom p-værdien fra? Diskuter omkring bordet 5 minutter

40 patienter Sorterer efter factor Sorterer Sortere efter tid OS Mors Factor0 3,6 1 0 59,7 1 1 65,8 0 1 76,9 1 1 48,1 1 0 93,5 1 1 13,6 1 1 35,9 1 1 16,0 1 0 99,7 0 1 30,7 1 0 79,5 1 0 92,8 0 0 69,4 1 1 52,5 1 1 27,5 0 0 91,5 1 1 96,2 1 1 50,1 1 1 58,8 1 1 48,7 1 0 0,7 0 0 22,2 1 0 48,8 0 1 74,9 0 1 90,8 1 1 73,4 1 0 45,6 1 0 87,8 0 1 77,1 0 1 33,3 1 0 27,2 1 1 4,5 1 0 6,2 0 0 18,1 0 0 27,8 1 0 23,4 0 0 28,6 1 0 88,7 0 1 76,6 1 1

Problem? Sorterer efter factor Sorterer Sortere efter tid Hvad med dem uden event? OS Mors Factor0 0,7 0 0 3,6 1 0 4,5 1 0 6,2 0 0 13,6 1 1 16 1 0 18,1 0 0 22,2 1 0 23,4 0 0 27,2 1 1 27,5 0 0 27,8 1 0 28,6 1 0 30,7 1 0 33,3 1 0 35,9 1 1 45,6 1 0 48,1 1 0 48,7 1 0 48,8 0 1 50,1 1 1 52,5 1 1 58,8 1 1 59,7 1 1 65,8 0 1 69,4 1 1 73,4 1 0 74,9 0 1 76,6 1 1 76,9 1 1 77,1 0 1 79,5 1 0 87,8 0 1 88,7 0 1 90,8 1 1 91,5 1 1 92,8 0 0 93,5 1 1 96,2 1 1 99,7 0 1

Problem? Sorterer efter factor Sorterer Sortere efter tid Hvad med dem uden event? Kan ikke indgå i analysen Hvad betyder det? OS Mors Factor0 3,6 1 0 4,5 1 0 13,6 1 1 16 1 0 22,2 1 0 27,2 1 1 27,8 1 0 28,6 1 0 30,7 1 0 33,3 1 0 35,9 1 1 45,6 1 0 48,1 1 0 48,7 1 0 50,1 1 1 52,5 1 1 58,8 1 1 59,7 1 1 69,4 1 1 73,4 1 0 76,6 1 1 76,9 1 1 79,5 1 0 90,8 1 1 91,5 1 1 93,5 1 1 96,2 1 1

Lav eksemplet med Factor2

Lav eksemplet med Factor2 Hvad nu? Tolk resultater med sidemakkeren p=0.024 OS Mors Factor2 3,6 1 1 4,5 1 1 13,6 1 1 16,0 1 1 22,2 1 1 27,2 1 1 27,8 1 0 28,6 1 0 30,7 1 0 33,3 1 0 35,9 1 0 45,6 1 0 48,1 1 0 48,7 1 0 50,1 1 0 52,5 1 0 58,8 1 0 59,7 1 0 69,4 1 0 73,4 1 0 76,6 1 0 76,9 1 0 79,5 1 1 90,8 1 1 91,5 1 1 93,5 1 1 96,2 1 1

Lav eksemplet med Factor2 Hvad nu? Analysen har problemer når kurverne krydser p=0.024 OS Mors Factor2 3,6 1 1 4,5 1 1 13,6 1 1 16,0 1 1 22,2 1 1 27,2 1 1 27,8 1 0 28,6 1 0 30,7 1 0 33,3 1 0 35,9 1 0 45,6 1 0 48,1 1 0 48,7 1 0 50,1 1 0 52,5 1 0 58,8 1 0 59,7 1 0 69,4 1 0 73,4 1 0 76,6 1 0 76,9 1 0 79,5 1 1 90,8 1 1 91,5 1 1 93,5 1 1 96,2 1 1

Status Du skulle nu gerne have en basal forståelse for: Stikprøver Variation Styrke-beregninger t-test Chi2 test Log-rank test Konceptet Observeret vs. forventet

Dag 2 09.00 12.00 Opfriskning fra sidst Sammenligning af en eller flere grupper Overlevelsesanalyse Gennemgang af artikler 12.00 12.45 Frokost 12.45 15.00 Pretest sandsynligheder, Specificitet & Sensivitet. ROC analyser. Meta-analyser.

Hvad mangler? Regression Lineær Cox tid-til hændelse regression

Modeller forklaret med Lego Modeller laves på basis af observationer Statistik Overevelse Cox regression? Resektion Logistisk regression

Modeller forklaret med Lego Modeller laves på basis af observationer Overlevelse Cox regression +/- Logistisk regression X/Y lineær regression

Modeller forklaret med Lego Forklare variationer i data Outcome = kendt faktor + støj Støj Univariat» Forklarer typisk kun lidt variation» Selvom p-værdien er lille

Modeller forklaret med Lego Forklare variationer i data Outcome = kendt faktor + støj Støj Multivariat model» Overfitting» Kan være vanskelige at tolke» Komplekse sammenhænge» Hvilke variabler og hvor mange?

Lineær regression Tegn en graf over højde/vægt fra data ID Height Gender Weight Blond 1 169 0 58 0 2 171 0 62 1 3 167 0 71 0 4 170 0 67 1 5 177 0 78 0 6 164 0 69 1 7 165 0 66 0 8 169 0 63 1 9 171 0 66 0 10 169 0 69 1 11 180 1 60 0 12 172 1 65 1 13 174 1 86 0 14 179 1 83 1 15 188 1 83 0 16 173 1 75 1 17 177 1 69 0 18 189 1 73 1 19 166 1 59 0 20 192 1 108 1

Lineær regression Tegn en graf over højde/vægt fra data 195 190 185 180 175 170 165 160 0 20 40 60 80 100 120 ID Height Gender Weight Blond 1 169 0 58 0 2 171 0 62 1 3 167 0 71 0 4 170 0 67 1 5 177 0 78 0 6 164 0 69 1 7 165 0 66 0 8 169 0 63 1 9 171 0 66 0 10 169 0 69 1 11 180 1 60 0 12 172 1 65 1 13 174 1 86 0 14 179 1 83 1 15 188 1 83 0 16 173 1 75 1 17 177 1 69 0 18 189 1 73 1 19 166 1 59 0 20 192 1 108 1

Y Hvor den samlede afstand er mindst 195 190 185 180 175 170 165 160 0 50 100 150 X Variable 1 Predicted Y Y

Take-home Regression De fleste anvender en generaliseret liniær model (GLM) Minimerer afstanden af observation til de forventede. Residualer Modellen vurderes ud fra residualerne (eksempel

Regression Cox-regression Risiko for at dø per tidsenhed Hazard Gruppe mod Gruppe Ratio

Cox-regression Factor 0 Hazard ratio: HR: 0,31

Cox-regression Factor 1 Hazard ratio: HR: 1,1

Factor0 Model vs. Observeret Observeret Model HR: 1,1 Hvad er forskellen?

Factor0 Model vs. Observeret

Cox-regression Udfordringer Tolk ratioet HR: 0,33 (0,12-0,9)

Factor2 Model vs. Observeret Observeret Model HR: 0,33

Factor2 Model vs. Observeret

Teori Praksis Læring Refleksion

Dag 2 09.00 12.00 Opfriskning fra sidst Sammenligning af en eller flere grupper Overlevelsesanalyse 12.00 12.45 Frokost 12.45 15.00 Gennemgang af artikler Pretest sandsynligheder, Specificitet & Sensivitet. ROC analyser. Meta-analyser.

Flere Grupper Factor 0 + Factor 1

Flere Grupper Teknik Sætte Factor til dens gennemsnit Bestemmer Factor0 Factor1 Hver for sig Factor 1&2 Skal være uafhængige

Udfordring Patienter Hvordan går det? Observationer Fx Livslængde Performance status Blodprøver Alder Kurver (Kaplan-Meier) over hvordan det er gået de forskellige grupper Hvis vi skal forudsige livslængde Livslængde

Observation af 220 patienter Fraction alive 1.0 Kaplan-Meier estimate of overall survival from diagnosis 0.8 0.6 0.4 0.2 Number at risk 0.0 0 1 2 3 4 5 6 7 8 9 10 Months from diagnosis 220 150 120 91 65 43 20 11 6 2 0 Performance status Blodprøver Alder

Fantastiske markør 1 (PSC1) Fraction alive 0.00 0.25 0.50 0.75 1.00 Kaplan-Meier survival estimate: PSC1 status PSC1 - PSC1 + 0 1 2 3 4 5 Months 6 7 8 9 10 Number at risk PSC1-99 63 43 30 18 11 6 4 3 1 0 PSC1 + 121 87 77 61 47 32 14 7 3 1 0 Log-rank p= 0.0013 HR: 0.60 95% CI(0.43-0.82)

Fantastiske markør 2 (PSC2) Fraction alive 0.00 0.25 0.50 0.75 1.00 Kaplan-Meier survival estimate: PSC2 status PSC2 - PSC2 + 0 1 2 3 4 5 Months 6 7 8 9 10 Number at risk PSC2-143 88 66 51 35 24 12 7 4 1 0 PSC2 + 77 62 54 40 30 19 8 4 2 1 0 Log-rank p= 0.0009 HR: 0.57 95% CI( 0.39-0.79)

Vi vil gerne kigge på dem begge (multivariat analyse) Multivariat cox model med PSC1 + PSC2 Beregn: (COX) PSC1 PSC2 PSC1: HR: 0.69 (0.49-0.98) p=0.036 PSC2: HR: 0.63 (0.44-0.92) p=0.017 Konklusion?

Tilbage til data Passer Cox-analysen? Fraction alive 0.00 0.25 0.50 0.75 1.00 Number at risk PSC1- & PSC2- PSC1- & PSC2+ PSC1+ & PSC2- PSC1+ & PSC2+ Kaplan-Meier survival estimate: PSC1/PSC2 status PSC1- & PSC2- PSC1- & PSC2+ PSC1+ & PSC2- PSC1+ & PSC2+ 0 1 2 3 4 5 6 7 8 9 10 Months 77 50 33 24 15 9 6 4 3 1 0 22 13 10 6 3 2 0 0 0 0 0 66 38 33 27 20 15 6 3 1 0 0 55 49 44 34 27 17 8 4 2 1 0

Interaktions analyse Multivariat cox model med PSC1 + PSC2 Beregn: COX PSC1 PSC2 PSC1xPSC2 PSC1: HR: 1.10 (0.78-1.61) p=0.631 PSC2: HR: 1.75 (1.06-2.89) p=0.030 PSC1xPSC2 (+/+): HR: 0.18 (0.09-0.37) p<0.0001 Konklusion? Modellen er bedre!

Flere tests Figur 1B Forklar din sidemakker den

Dag 2 09.00 12.00 Opfriskning fra sidst Sammenligning af en eller flere grupper Overlevelsesanalyse 12.00 12.45 Frokost 12.45 15.00 Gennemgang af artikler Pretest sandsynligheder, Specificitet & Sensivitet. ROC analyser. Meta-analyser.

Gennemgang af artikler Teori Praksis Læring Refleksion

Sammenfatning

Status Du skulle nu gerne have en forståelse for: Stikprøver Variation Styrke-beregninger t-test Chi2 test Log-rank test Konceptet Observeret vs. Forventet Regression Liniær Tid-til-hændelse Basal multivariat analyse

Studie designs/tests Korrelationer/sammenhæng Sensitivitet/Specificitet/AUC analyser Sammenligninger Kontinuerlige Kategoriske Tid-til-event statistik Regressioner Osv. Logistisk Cox

Valg af statistisk metode Hvad er response? Overlevelse Rask/syg Lyser lidt/lyser meget Sammenhæng mellem 2 undersøgelser Ændring

Hjælp http://stats.idre.ucla.edu/other/mult-pkg/whatstat/

Sensitivitet/Specifitet/Pretest Virk+ Virk- Total Test + a b a+b Test - c d c+d a+c b+d Sensitivitet = Specifitet = Prævalens = a a + c d d + b a + c a + b + c + d

Sensitivitet/Specifitet/Pretest Virk+ Virk- Total Test + a b a+b Test - c d c+d a+c b+d Sensitivitet = Specifitet = a a + c d d + b PPV = NPV = a a + b d c + d Prævalens = a + c a + b + c + d

slut