Kursus i anvendt onkologisk statistik og forskningsmetodik Dag 2 Jon K. Bjerregaard
Dag 2 09.00 12.00 Opfriskning fra sidst Gennemgang af artikler Sammenligning af en eller flere grupper Overlevelsesanalyse 12.00 12.45 Frokost 12.45 15.00 Pretest sandsynligheder, Specificitet & Sensivitet. ROC analyser. Meta-analyser.
Teori Praksis Læring Refleksion
Læge/kliniker/forsker Statistiker Som kliniker er det vigtigt at kunne tolke resultater Som forsker er det vigtigt at udfører arbejde af høj kvalitet Som statistiker er det vigtigt at kende alt baggrunden
Naturvidenskabelig metode Observation Ide Hypotese Statistisk hypotese Observation systematisk Statistisk hypotese test
Vi kigger lige (hurtigt) på artiklerne Kan I finde hypotesen? 10 minutter
Centrale principper Normal fordeling Stikprøve Variabel typer
Normalfordeling Kan beskrives med 2 værdier -4 sd -3 sd -2 sd -1 sd mean 1 sd 2 sd 3 sd 4 sd
Stikprøve Anvendes til at generalisere til alle Stikprøve -4 sd -3 sd -2 sd -1 sd mean 1 sd 2 sd 3 sd 4 sd Patienter -4 sd -3 sd -2 sd -1 sd mean 1 sd 2 sd 3 sd 4 sd
Vi kigger igen på artiklerne Er stikprøven ok?
Datatyper Kontinuerlige variabler 1,2,3,. Kategoriske variabler Let, Moderat, Svær
Gene expression profile Hvad skal vi mene? Er den kontinuerlig eller kategorisk? Hvad skal vi mene?
Variation Variation i stikprøven sd = 2 (obs 1 gennemsnit) 2 + obs 2 gennemsnit. antal observationer 1
Normalfordeling og stikprøver Hele gruppen af patienter har et ægte gennemsnit variation Vores stikprøve anvendes som bedste bud på dette Jo større stikprøve des bedre bud
Konfidens interval Et interval hvor der er sandsynligt at den ægte værdi befinder sig. Spørgsmål Hvor præcist har vi målt højden?
Standard error of the mean Et mål for præcisionen SEM = SD n Dyb indånding Ingen Panik
Konsekvenser Variation i måling Stor SEM højere Lille SEM mindre Antal patienter Stort SEM falder Lille SEM stiger
Konfidens interval Standard error: SEM = SD n 95% CI = gennemsnit ± 1,96 SEM Test 1: n=7 Gennemsnit 178 (168-190) Test 2: n=1000 Gennemsnit 178 (177-178)
Stikprøve teori Jo større stikprøve Jo større sandsynlighed for at den passer
Stikprøve teori Jo større stikprøve Jo større sandsynlighed for at den passer n
Stikprøve teori Jo større stikprøve Jo større sandsynlighed for at den passer nn
Stikprøve teori Jo større stikprøve Jo større sandsynlighed for at den passer nn
Variation hvor går det galt Stikprøve Sted Børnehave vs. plejehjem vs. lokalet Andre Køn Race etc. Man kan tænke om variationen i stikprøven kan forklares fra andre faktorer. Alternativt kan man kalde det støj i målingen Mere om dette senere
Take-home Normafordeling er et centralt princip Fordelingen kan beskrives udfra Gennemsnit og spredning(sd) En stikprøve bruges til at estimere den ægte værdi Stikprøvens præcision øges ved at lave den større
Datatyper Kontinuerlige variabler 1,2,3,. T-test 1 stikprøve mod værdi Uparret Parret Kategoriske variabler Let, Moderat, Svær Chi2 test Observeret mod forventet Fisher's exact Hvis små tal
Teori Praksis Læring Refleksion
Onkologiske forsøgsdesign Basis videnskab Systematiske observationer af populationer Diagnostik Kliniske studier Fase I, II & III
Fase I,II & III Fortæl lige din sidemakker hvad de forskellige fasers formål og design er Endepunkt osv
Kliniske studier Fase I/II/III Fase I Dosis Bivirkninger Fase II
Onkologisk Mål & Metode Metode Kan det slå kræft ihjel? i en petriskål/mus Præ-klinisk fase Er det for giftigt? Hvilken dose er sikker? Fase I Kan det slå kræft ihjel? i en patient Fase II Er det bedre end det vi plejer at bruge? Fase III
Fase I 3+3 Bivirkninger Værste grad siden sidst Skala fra 1-5 1. Mild 2. Moderat 3. Svær 4. Livstruende 5. Død
Fase II Response Skrumpning tolkes som tegn på celledrab Vækst/nye metastaser som tegn på manglende effekt Kemoterapi
Skrumpnings-regler R.E.C.I.S.T. Progression (PD) +20% i diameter eller nye læsioner Partiel response (PR) -30% i diameter Complete response (CR) Ingen synlige manifestationer No-Change Ikke PD/PR/CR
Fase III Lodtrækning Det nye Patient Det gamle Udføres hvis man ikke klinisk kan se forskel
Kig på artiklerne Hvilke faser?
Tese Statistik skal hjælpe os med at finde ud af, om den forskel vi observere, er kausalt forbundet med en intervention/proces, eller et resultat af tilfældig variation. Vigtigt! Vi kender ikke pre-test sandsynligheden Jo mere sjælden jo større problemer
Selke et al. Am J Stat 2001 Nuzzo Nature 2014
God nyhed for klinikeren! Statistik skal hjælpe os med at finde ud af, om den forskel vi observere, er kausalt forbundet med en intervention/proces, eller et resultat af tilfældig variation. Vigtigt! Vi kender ikke pre-test sandsynligheden Jo mere sjælden jo større problemer
Take-home Forsknings metodologi Ethvert forsøg skal baserer sig på et videnskabeligt solidt grundlag.
Pause!
Styrke beregninger Vi vil gerne beregne hvor mange patienter der skal inkluderes
Hvilken strategi foretrækker du? Et stort forsøg (n=400) 4 små forsøg (n=100)x4
Test - teori Virkelighed Positiv Negativ Forsøg Positiv Negativ
Test - teori Forsøget finder sandheden Virkelighed Positiv Negativ Forsøg Positiv Negativ
Test - teori Testen finder ikke sandheden Falsk positiv Falsk negativ Virkelighed Positiv Negativ Forsøg Positiv Negativ
Test - teori Testen finder ikke sandheden Falsk positiv Falsk negativ Virkelighed Positiv Negativ Forsøg Positiv Negativ
Test - teori Testen finder ikke sandheden Falsk positiv Falsk negativ Virkelighed Positiv Negativ Forsøg Positiv Negativ Power/styrke Alfa Hvad er problemet ved hhv. falsk positiv og falsk negativt? (3 minutter)
Styrkeberegninger En styrkeberegning er en HJÆLP!!!! Forventningsafstemning
Styrkeberegning Hvad var det lige vi skulle bruge for at lave en beregning? Sidemakker
Powerberegninger Vi planlægger et studie om højde Vi tror at kvinder er mindre en mænd
Powerberegninger Vi planlægger et studie om højde Vi tror at kvinder er mindre en mænd Nul-hypotesen De er lige høje
Powerberegninger Vi planlægger et studie om højde Vi tror at kvinder er mindre en mænd Falsk positiv risiko? Falsk negativ risiko? Forskel? Variation? Variation?
Powerberegninger Effekt af antal n n
Powerberegninger Effekt af antal n n
Powerberegninger Effekt af antal n
Powerberegninger Effekt af forskel
Power-beregninger Interim analyser bruger noget af p-værdien Specielle effektstørrelser Er det realistisk?
Teori Praksis Læring Refleksion
Dag 2 09.00 12.00 Opfriskning fra sidst Gennemgang af artikler Sammenligning af en eller flere grupper Overlevelsesanalyse 12.00 12.45 Frokost 12.45 15.00 Pretest sandsynligheder, Specificitet & Sensivitet. ROC analyser. Meta-analyser.
Dyb indånding Ingen Panik
Tid-til-hændelse Vi definere at død er en hændelse event I den periode patienten er observeret er der en risiko for et event Det kan så enten ske eller ikke Livstid I live 1 Ja 3 Nej 5 Nej 5 Nej 7 Ja 8 Nej 9 Nej 9 Ja 11 Ja 12 Nej 15 Nej 18 Nej 20 Ja 25 Nej
1 2 3 4 5 6 7 8 9 10 11 12 13 14 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
Kurven udregnes for hver rød plet 1 2 3 4 5 6 7 8 9 10 11 12 13 14 13 i risiko 1 dør Kurven falder med 1/13 del 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
Kurven udregnes for hver rød plet 12 i risiko 2 dør 0 1Kurven 2 3falder 4 5med 6 2/12 7 8del 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Kurven udregnes for hver rød plet 1 2 3 4 5 6 7 8 9 10 11 12 13 14 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 9 i risiko 1 dør Kurven falder med 1/9 del
Kurven udregnes for hver rød plet 1 2 3 4 5 6 7 8 9 10 11 12 13 14 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 8 i risiko 1 dør Kurven falder med 1/8 del
Kurven udregnes for hver rød plet 1 2 3 4 5 6 7 8 9 10 11 12 13 14 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 5 i risiko 1 dør Kurven falder med 1/5 del
Kurven udregnes for hver rød plet 1 2 3 4 5 6 7 8 9 10 11 12 13 14 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 4 i risiko 1 dør Kurven falder med 1/4 del
Kurven udregnes for hver rød plet 1 2 3 4 5 6 7 8 9 10 11 12 13 14 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 3 i risiko 1 dør Kurven falder med 1/3 del
Kurven udregnes for hver rød plet 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Pause Teori Praksis Refleksion
Dag 2 09.00 12.00 Opfriskning fra sidst Gennemgang af artikler Sammenligning af en eller flere grupper Overlevelsesanalyse 12.00 12.45 Frokost 12.45 15.00 Pretest sandsynligheder, Specificitet & Sensivitet. ROC analyser. Meta-analyser.
Sammenligning mellem 2+ grupper t-test Chi 2 Log-rank Regression Cox regression
Eksempel 2x2 tabel PD-NEC PC-norm Mænd 18 21 Kvinder 14 19
Eksempel 2x2 tabel PD-NEC PC-norm Total Mænd 18 21 39 Kvinder 14 19 23 32 40 72
Eksempel 2x2 tabel PD-NEC PC-norm Total Mænd 18 21 54% Kvinder 14 19 46% 32 40 72 Forventet hvis lige PD-NEC PC-norm Total Mænd 17,3 21,6 54% Kvinder 14,7 18,4 46% 32 40 72
Lav udregningen for BRAF Observeret NEC Ade WT 12 38 50 MUT 17 2 19 29 40 69 Tabellen fra artiklen Observeret NEC Ade WT 12 38 72% MUT 17 2 28% 29 40 69 Forventet NEC Ade WT 21,01 28,99 72% MUT 7,99 11,01 28% 29 40 69
Dag 2 09.00 12.00 Opfriskning fra sidst Sammenligning af en eller flere grupper Overlevelsesanalyse Gennemgang af artikler 12.00 12.45 Frokost 12.45 15.00 Pretest sandsynligheder, Specificitet & Sensivitet. ROC analyser. Meta-analyser.
Observeret vs. forventet T-test t = rød blå SEM
Observeret vs. forventet T-test Test mod hypotetisk anden værdi Test mod anden gruppe Med eller uden samme sd Parret test Hvis det er den samme ting der måles på 2 gange t = rød blå SEM
T-test 2 stikprøver Ikke samme variation
Kig på statistik afsnittet Hvad skal vi mene? Bord diskussion 10 + 5 minutter Hvad skal vi mene?
Konklusion?
t-test flere grupper Åbn dokumentet (t-test_1.xlsx) Er kvinder(0) lige så høje som mænd(1)? t-test i excel =ttest(0;1;2;3) ID Height Gender Weight Blond 1 169 0 58 0 2 171 0 62 1 3 167 0 71 0 4 170 0 67 1 5 177 0 78 1 6 164 0 69 1 7 165 0 66 0 8 169 0 63 1 9 171 0 66 0 10 169 0 69 1 11 180 1 60 0 12 172 1 65 1 13 174 1 86 1 14 179 1 83 0 15 188 1 83 0 16 173 1 75 1 17 177 1 69 0 18 189 1 73 1 19 166 1 59 0 20 192 1 108 0
Andre test Tænk observeret vs. forventet 5 minutter diskussion med bordet ID Height Gender Weight Blond 1 169 0 58 0 2 171 0 62 1 3 167 0 71 0 4 170 0 67 1 5 177 0 78 1 6 164 0 69 1 7 165 0 66 0 8 169 0 63 1 9 171 0 66 0 10 169 0 69 1 11 180 1 60 0 12 172 1 65 1 13 174 1 86 1 14 179 1 83 0 15 188 1 83 0 16 173 1 75 1 17 177 1 69 0 18 189 1 73 1 19 166 1 59 0 20 192 1 108 0
Observeret vs. forventet Kvinder gul, mænd grøn ID Height Gender Weight Blond 1 169 0 58 0 2 171 0 62 1 3 167 0 71 0 4 170 0 67 1 5 177 0 78 1 6 164 0 69 1 7 165 0 66 0 8 169 0 63 1 9 171 0 66 0 10 169 0 69 1 11 180 1 60 0 12 172 1 65 1 13 174 1 86 1 14 179 1 83 0 15 188 1 83 0 16 173 1 75 1 17 177 1 69 0 18 189 1 73 1 19 166 1 59 0 20 192 1 108 0
Observeret vs. forventet Sorter efter højde ID Height Gender Weight Blond 6 164 0 69 1 7 165 0 66 0 19 166 1 59 0 3 167 0 71 0 1 169 0 58 0 8 169 0 63 1 10 169 0 69 1 4 170 0 67 1 2 171 0 62 1 9 171 0 66 0 12 172 1 65 1 16 173 1 75 1 13 174 1 86 0 5 177 0 78 0 17 177 1 69 0 14 179 1 83 1 11 180 1 60 0 15 188 1 83 0 18 189 1 73 1 20 192 1 108 1
Observeret vs. forventet Weight ID Height Gender Weight Blond 1 169 0 58 0 2 171 0 62 1 3 167 0 71 0 4 170 0 67 1 5 177 0 78 1 6 164 0 69 1 7 165 0 66 0 8 169 0 63 1 9 171 0 66 0 10 169 0 69 1 11 180 1 60 0 12 172 1 65 1 13 174 1 86 1 14 179 1 83 0 15 188 1 83 0 16 173 1 75 1 17 177 1 69 0 18 189 1 73 1 19 166 1 59 0 20 192 1 108 0
Observeret vs. forventet Weight ID Height Gender Weight Blond 1 169 0 58 0 19 166 1 59 0 11 180 1 60 0 2 171 0 62 1 8 169 0 63 1 12 172 1 65 1 7 165 0 66 0 9 171 0 66 0 4 170 0 67 1 6 164 0 69 1 10 169 0 69 1 17 177 1 69 0 3 167 0 71 0 18 189 1 73 1 16 173 1 75 1 5 177 0 78 0 14 179 1 83 1 15 188 1 83 0 13 174 1 86 0 20 192 1 108 1
Hårfarve Er blonde højere?
Dag 2 09.00 12.00 Opfriskning fra sidst Sammenligning af en eller flere grupper Overlevelsesanalyse Gennemgang af artikler 12.00 12.45 Frokost 12.45 15.00 Pretest sandsynligheder, Specificitet & Sensivitet. ROC analyser. Meta-analyser.
40 patienter OS Overlevelses tid Mors Event Factor 0,1,2 Ting vi har samlet ind ID OS Mors Factor0 Factor1 Factor2 1 3,6 1 0 1 1 2 59,7 1 1 1 0 3 65,8 0 1 0 0 4 76,9 1 1 1 0 5 48,1 1 0 1 0 6 93,5 1 1 1 1 7 13,6 1 1 0 1 8 35,9 1 1 1 0 9 16,0 1 0 1 1 10 99,7 0 1 1 1 11 30,7 1 0 1 0 12 79,5 1 0 1 1 13 92,8 0 0 0 1 14 69,4 1 1 1 0 15 52,5 1 1 1 0 16 27,5 0 0 0 0 17 91,5 1 1 1 1 18 96,2 1 1 0 1 19 50,1 1 1 0 0 20 58,8 1 1 0 0 21 48,7 1 0 0 0 22 0,7 0 0 0 1 23 22,2 1 0 1 1 24 48,8 0 1 1 0 25 74,9 0 1 1 0 26 90,8 1 1 0 1 27 73,4 1 0 0 0 28 45,6 1 0 0 0 29 87,8 0 1 0 1 30 77,1 0 1 0 1 31 33,3 1 0 0 0 32 27,2 1 1 1 1 33 4,5 1 0 0 1 34 6,2 0 0 1 1 35 18,1 0 0 0 1 36 27,8 1 0 1 0 37 23,4 0 0 0 1 38 28,6 1 0 0 0 39 88,7 0 1 1 1 40 76,6 1 1 0 0
Overlevelses analyse Forklar din sidemakker hvad du ser på
Delt på Factor0 Forklar din sidemakker hvad du ser på (skift) p=0.003
Factor1 Forklar din sidemakker hvad du ser på p=0.726
Factor2 Forklar din sidemakker hvad du ser på p=0.024
Hvor kom p-værdien fra? Diskuter omkring bordet 5 minutter
40 patienter Sorterer efter factor Sorterer Sortere efter tid OS Mors Factor0 3,6 1 0 59,7 1 1 65,8 0 1 76,9 1 1 48,1 1 0 93,5 1 1 13,6 1 1 35,9 1 1 16,0 1 0 99,7 0 1 30,7 1 0 79,5 1 0 92,8 0 0 69,4 1 1 52,5 1 1 27,5 0 0 91,5 1 1 96,2 1 1 50,1 1 1 58,8 1 1 48,7 1 0 0,7 0 0 22,2 1 0 48,8 0 1 74,9 0 1 90,8 1 1 73,4 1 0 45,6 1 0 87,8 0 1 77,1 0 1 33,3 1 0 27,2 1 1 4,5 1 0 6,2 0 0 18,1 0 0 27,8 1 0 23,4 0 0 28,6 1 0 88,7 0 1 76,6 1 1
Problem? Sorterer efter factor Sorterer Sortere efter tid Hvad med dem uden event? OS Mors Factor0 0,7 0 0 3,6 1 0 4,5 1 0 6,2 0 0 13,6 1 1 16 1 0 18,1 0 0 22,2 1 0 23,4 0 0 27,2 1 1 27,5 0 0 27,8 1 0 28,6 1 0 30,7 1 0 33,3 1 0 35,9 1 1 45,6 1 0 48,1 1 0 48,7 1 0 48,8 0 1 50,1 1 1 52,5 1 1 58,8 1 1 59,7 1 1 65,8 0 1 69,4 1 1 73,4 1 0 74,9 0 1 76,6 1 1 76,9 1 1 77,1 0 1 79,5 1 0 87,8 0 1 88,7 0 1 90,8 1 1 91,5 1 1 92,8 0 0 93,5 1 1 96,2 1 1 99,7 0 1
Problem? Sorterer efter factor Sorterer Sortere efter tid Hvad med dem uden event? Kan ikke indgå i analysen Hvad betyder det? OS Mors Factor0 3,6 1 0 4,5 1 0 13,6 1 1 16 1 0 22,2 1 0 27,2 1 1 27,8 1 0 28,6 1 0 30,7 1 0 33,3 1 0 35,9 1 1 45,6 1 0 48,1 1 0 48,7 1 0 50,1 1 1 52,5 1 1 58,8 1 1 59,7 1 1 69,4 1 1 73,4 1 0 76,6 1 1 76,9 1 1 79,5 1 0 90,8 1 1 91,5 1 1 93,5 1 1 96,2 1 1
Lav eksemplet med Factor2
Lav eksemplet med Factor2 Hvad nu? Tolk resultater med sidemakkeren p=0.024 OS Mors Factor2 3,6 1 1 4,5 1 1 13,6 1 1 16,0 1 1 22,2 1 1 27,2 1 1 27,8 1 0 28,6 1 0 30,7 1 0 33,3 1 0 35,9 1 0 45,6 1 0 48,1 1 0 48,7 1 0 50,1 1 0 52,5 1 0 58,8 1 0 59,7 1 0 69,4 1 0 73,4 1 0 76,6 1 0 76,9 1 0 79,5 1 1 90,8 1 1 91,5 1 1 93,5 1 1 96,2 1 1
Lav eksemplet med Factor2 Hvad nu? Analysen har problemer når kurverne krydser p=0.024 OS Mors Factor2 3,6 1 1 4,5 1 1 13,6 1 1 16,0 1 1 22,2 1 1 27,2 1 1 27,8 1 0 28,6 1 0 30,7 1 0 33,3 1 0 35,9 1 0 45,6 1 0 48,1 1 0 48,7 1 0 50,1 1 0 52,5 1 0 58,8 1 0 59,7 1 0 69,4 1 0 73,4 1 0 76,6 1 0 76,9 1 0 79,5 1 1 90,8 1 1 91,5 1 1 93,5 1 1 96,2 1 1
Status Du skulle nu gerne have en basal forståelse for: Stikprøver Variation Styrke-beregninger t-test Chi2 test Log-rank test Konceptet Observeret vs. forventet
Dag 2 09.00 12.00 Opfriskning fra sidst Sammenligning af en eller flere grupper Overlevelsesanalyse Gennemgang af artikler 12.00 12.45 Frokost 12.45 15.00 Pretest sandsynligheder, Specificitet & Sensivitet. ROC analyser. Meta-analyser.
Hvad mangler? Regression Lineær Cox tid-til hændelse regression
Modeller forklaret med Lego Modeller laves på basis af observationer Statistik Overevelse Cox regression? Resektion Logistisk regression
Modeller forklaret med Lego Modeller laves på basis af observationer Overlevelse Cox regression +/- Logistisk regression X/Y lineær regression
Modeller forklaret med Lego Forklare variationer i data Outcome = kendt faktor + støj Støj Univariat» Forklarer typisk kun lidt variation» Selvom p-værdien er lille
Modeller forklaret med Lego Forklare variationer i data Outcome = kendt faktor + støj Støj Multivariat model» Overfitting» Kan være vanskelige at tolke» Komplekse sammenhænge» Hvilke variabler og hvor mange?
Lineær regression Tegn en graf over højde/vægt fra data ID Height Gender Weight Blond 1 169 0 58 0 2 171 0 62 1 3 167 0 71 0 4 170 0 67 1 5 177 0 78 0 6 164 0 69 1 7 165 0 66 0 8 169 0 63 1 9 171 0 66 0 10 169 0 69 1 11 180 1 60 0 12 172 1 65 1 13 174 1 86 0 14 179 1 83 1 15 188 1 83 0 16 173 1 75 1 17 177 1 69 0 18 189 1 73 1 19 166 1 59 0 20 192 1 108 1
Lineær regression Tegn en graf over højde/vægt fra data 195 190 185 180 175 170 165 160 0 20 40 60 80 100 120 ID Height Gender Weight Blond 1 169 0 58 0 2 171 0 62 1 3 167 0 71 0 4 170 0 67 1 5 177 0 78 0 6 164 0 69 1 7 165 0 66 0 8 169 0 63 1 9 171 0 66 0 10 169 0 69 1 11 180 1 60 0 12 172 1 65 1 13 174 1 86 0 14 179 1 83 1 15 188 1 83 0 16 173 1 75 1 17 177 1 69 0 18 189 1 73 1 19 166 1 59 0 20 192 1 108 1
Y Hvor den samlede afstand er mindst 195 190 185 180 175 170 165 160 0 50 100 150 X Variable 1 Predicted Y Y
Take-home Regression De fleste anvender en generaliseret liniær model (GLM) Minimerer afstanden af observation til de forventede. Residualer Modellen vurderes ud fra residualerne (eksempel
Regression Cox-regression Risiko for at dø per tidsenhed Hazard Gruppe mod Gruppe Ratio
Cox-regression Factor 0 Hazard ratio: HR: 0,31
Cox-regression Factor 1 Hazard ratio: HR: 1,1
Factor0 Model vs. Observeret Observeret Model HR: 1,1 Hvad er forskellen?
Factor0 Model vs. Observeret
Cox-regression Udfordringer Tolk ratioet HR: 0,33 (0,12-0,9)
Factor2 Model vs. Observeret Observeret Model HR: 0,33
Factor2 Model vs. Observeret
Teori Praksis Læring Refleksion
Dag 2 09.00 12.00 Opfriskning fra sidst Sammenligning af en eller flere grupper Overlevelsesanalyse 12.00 12.45 Frokost 12.45 15.00 Gennemgang af artikler Pretest sandsynligheder, Specificitet & Sensivitet. ROC analyser. Meta-analyser.
Flere Grupper Factor 0 + Factor 1
Flere Grupper Teknik Sætte Factor til dens gennemsnit Bestemmer Factor0 Factor1 Hver for sig Factor 1&2 Skal være uafhængige
Udfordring Patienter Hvordan går det? Observationer Fx Livslængde Performance status Blodprøver Alder Kurver (Kaplan-Meier) over hvordan det er gået de forskellige grupper Hvis vi skal forudsige livslængde Livslængde
Observation af 220 patienter Fraction alive 1.0 Kaplan-Meier estimate of overall survival from diagnosis 0.8 0.6 0.4 0.2 Number at risk 0.0 0 1 2 3 4 5 6 7 8 9 10 Months from diagnosis 220 150 120 91 65 43 20 11 6 2 0 Performance status Blodprøver Alder
Fantastiske markør 1 (PSC1) Fraction alive 0.00 0.25 0.50 0.75 1.00 Kaplan-Meier survival estimate: PSC1 status PSC1 - PSC1 + 0 1 2 3 4 5 Months 6 7 8 9 10 Number at risk PSC1-99 63 43 30 18 11 6 4 3 1 0 PSC1 + 121 87 77 61 47 32 14 7 3 1 0 Log-rank p= 0.0013 HR: 0.60 95% CI(0.43-0.82)
Fantastiske markør 2 (PSC2) Fraction alive 0.00 0.25 0.50 0.75 1.00 Kaplan-Meier survival estimate: PSC2 status PSC2 - PSC2 + 0 1 2 3 4 5 Months 6 7 8 9 10 Number at risk PSC2-143 88 66 51 35 24 12 7 4 1 0 PSC2 + 77 62 54 40 30 19 8 4 2 1 0 Log-rank p= 0.0009 HR: 0.57 95% CI( 0.39-0.79)
Vi vil gerne kigge på dem begge (multivariat analyse) Multivariat cox model med PSC1 + PSC2 Beregn: (COX) PSC1 PSC2 PSC1: HR: 0.69 (0.49-0.98) p=0.036 PSC2: HR: 0.63 (0.44-0.92) p=0.017 Konklusion?
Tilbage til data Passer Cox-analysen? Fraction alive 0.00 0.25 0.50 0.75 1.00 Number at risk PSC1- & PSC2- PSC1- & PSC2+ PSC1+ & PSC2- PSC1+ & PSC2+ Kaplan-Meier survival estimate: PSC1/PSC2 status PSC1- & PSC2- PSC1- & PSC2+ PSC1+ & PSC2- PSC1+ & PSC2+ 0 1 2 3 4 5 6 7 8 9 10 Months 77 50 33 24 15 9 6 4 3 1 0 22 13 10 6 3 2 0 0 0 0 0 66 38 33 27 20 15 6 3 1 0 0 55 49 44 34 27 17 8 4 2 1 0
Interaktions analyse Multivariat cox model med PSC1 + PSC2 Beregn: COX PSC1 PSC2 PSC1xPSC2 PSC1: HR: 1.10 (0.78-1.61) p=0.631 PSC2: HR: 1.75 (1.06-2.89) p=0.030 PSC1xPSC2 (+/+): HR: 0.18 (0.09-0.37) p<0.0001 Konklusion? Modellen er bedre!
Flere tests Figur 1B Forklar din sidemakker den
Dag 2 09.00 12.00 Opfriskning fra sidst Sammenligning af en eller flere grupper Overlevelsesanalyse 12.00 12.45 Frokost 12.45 15.00 Gennemgang af artikler Pretest sandsynligheder, Specificitet & Sensivitet. ROC analyser. Meta-analyser.
Gennemgang af artikler Teori Praksis Læring Refleksion
Sammenfatning
Status Du skulle nu gerne have en forståelse for: Stikprøver Variation Styrke-beregninger t-test Chi2 test Log-rank test Konceptet Observeret vs. Forventet Regression Liniær Tid-til-hændelse Basal multivariat analyse
Studie designs/tests Korrelationer/sammenhæng Sensitivitet/Specificitet/AUC analyser Sammenligninger Kontinuerlige Kategoriske Tid-til-event statistik Regressioner Osv. Logistisk Cox
Valg af statistisk metode Hvad er response? Overlevelse Rask/syg Lyser lidt/lyser meget Sammenhæng mellem 2 undersøgelser Ændring
Hjælp http://stats.idre.ucla.edu/other/mult-pkg/whatstat/
Sensitivitet/Specifitet/Pretest Virk+ Virk- Total Test + a b a+b Test - c d c+d a+c b+d Sensitivitet = Specifitet = Prævalens = a a + c d d + b a + c a + b + c + d
Sensitivitet/Specifitet/Pretest Virk+ Virk- Total Test + a b a+b Test - c d c+d a+c b+d Sensitivitet = Specifitet = a a + c d d + b PPV = NPV = a a + b d c + d Prævalens = a + c a + b + c + d
slut