Epidemiologi og Biostatistik. Mogens Erlandsen, Institut for Biostatistik Uge 1, tirsdag d. 5. februar 2002

Epidemiologi og Biostatistik Mogens Erlandsen, Institut for Biostatistik Uge 1, tirsdag d. 5. februar 2002 1

Statestik Det hedder det ikke! Statistik 2

Streptomycin til behandling af lunge-tuberkulose? (Table 2.6, s. 10. Medical Research Council 1948) Lave et forsøg, men hvordan? Success-kriterium = effekt-mål = respons? Samme virkning på alle? Bivirkninger? Kontrolgruppe? Placebo - dobbelt blindet forsøg? 3

1. Alle nye pt behandles med streptomycin? 2. Dem lægen finder egnede behandles? 3. Hver anden? 4. Lodtrækning (randomisering) Randomiseret klinisk forsøg RCT = Randomised clinical trial 4

Respons = overlevelse efter 6 måneder Gruppe Antal ialt Døde Streptomycin 55 4 Kontrol 52 14 Hvis forsøget blev gentaget på 55+52 nye pt, får vi så præcis det samme resultat? Hvorfor ikke? Pt er forskellige = interindividuel variation! 5

Hvad vil vi gerne konkludere? om Streptomycin har en (gavnlig) effekt på lungetuberkulose? om den enkelte pt s chance (Hr Jensen, Fru Olsen,...) for at overleve sygdommen ændres ved streptomycin behandling? Helbredt gøres syg Men den enkelte patient, der indgår i forsøget, kan ikke behandles med både placebo (kontrol) og streptomycin Respons: død/ilive 6

Generalisere fra stikprøven til hele populationen (= alle nye patienter med lungetuberkulose ) Stikprøven kan f.eks. bestå af alle nye patienter med sygdommen inden for det næste år. Ved lodtrækning afgøres det om den enkelte patient skal behandles med placebo eller streptomycin Er de næste 112 patienter på ÅKH typiske for hele Århus amt, eller Jylland, eller Danmark, eller????? 7

I stikprøven er dødshyppigheden blandt de streptomycin-behandlede mindre end blandt kontrollerne: 4 = 0.073< 14 = 0.269 55 52 Vil det også gælde for hele populationen (fremtidige patienter med lungetuberkulose)? En ny stikprøve vil give lidt andre hyppigheder! Hvor meget kan disse hyppigheder variere? 8

I hele populationen: hyppighed = sandsynlighed (ukendt parameter) I stikprøven: hyppighed beregnes ud fra data (estimat) og er et gæt på sandsynligheden Sandsynlighed for positiv respons, hvis man behandles med streptomycin frekventiel fortolkning (hvis vi behandler mange pt ) Sandsynlighed for positiv respons, hvis man behandles med placebo Hvis streptomycin ikke har en effekt (nulhypotese) vil vi forvente at de 2 sandsynligheder er lige store 9

Ud fra stikprøven kan vi gætte på (estimere) disse 2 sandsynligheder Hvor usikre er vores estimater? Kan vi sammenligne de 2 sandsynligheder (nulhypotese) ved hjælp af vores estimater? Hvor forskellige kan de 2 sandsynligheder være? Ved hjælp af data (stikprøven) kan vi besvare disse spørgsmål (kvantificere vores viden om problemet) = Statistisk analyse 10

Kan virke meget abstrakt med disse mentale konstruktioner som: population sandsynlighed nulhypotese Mønt-kast: Antag, at vi får udleveret 2 mønter, der begge er blevet vredet skæve af hver sin person Har de 2 mønter samme sandsynlighed for krone? Vi kan ikke måle os til disse sandsynligheder! (men vi kan godt forestille os dem som ukendte størrelser!) 11

I streptomycin-eksemplet: Responsvariablen har kun 2 mulige udfald (ilive/død). Responsvariablen kan have mere end 2 udfald: NYHA index : I, II, III og IV Systolisk blodtryk : alle positive tal (i praksis et range fra 50 til 300?) Lufttemperatur : både negative og positive tal (et range fra -100 til 100 C?) Responsvariabel: kategorisk eller kontinuert Ikke-ordnet: ilive/død, kvinde /mand Ordnet: NYHA, smerte-score 12

Lungefunktion (Table 4.4) Sammenlign lungefunktionen hos: rygere med ikke-rygere astmatikere med raske etc. Respons = FEV1 Forsøg: Udvælg et antal personer tilfældigt i hver af de 2 grupper og sammenlign deres FEV1? 13

Sandsynlighed for at FEV1=3.0 liter??? Sandsynlighed for at FEV1= π liter??? Men sandsynligheden for at FEV1 > 3.0 liter giver mening Beregne denne sandsynlighed for alle mulige tal Beskrive fordelingen af FEV1 i hver gruppe Sammenligne 2 fordelinger 14

Table 4.4, s. 49. FEV1 (liter) 57 mandlige med.stud. Oprindelig rækkefølge Ordnet efter FEV1 Obs nr FEV1 Obs nr FEV1 1 2.85 1 2.85 2 3.19 11 2.85 3 3.50 21 2.98 4 3.69 31 3.04 5 3.90 40 3.10 56 4.78 20 5.30 57 5.10 30 5.43 2.0 FEV1< 2. 5 Antal observationer = 0 minimum 2.5 FEV1< 3.0 3 obs. maximum 15

20 Histogram 15 10 2.5-3.0 5 0 2.25 2.75 3.25 3.75 4.25 4.75 5.25 5.75 2.0-2.5 FEV1 (liter) 16

Histogrammet beskriver stikprøvens fordeling En ny stikprøve (af samme størrelse) vil give et anderledes histogram, men overordnet vil de 2 histogrammer ligne hinanden: range (minimum - maximum: cirka 2.5-5.5 liter) en tydelig top omkring den centrale tendens (cirka 4 liter) symmetrisk omkring midten midten = den centrale tendens 17

80 60 asymmetrisk højreskævt 40 20 0.05.25.45.65.85 1.05 1.25 1.45 1.65 1.85.15.35.55.75.95 1.15 1.35 1.55 1.75 1.95 Triglycerid 18

Svært at beskrive/sammenligne histogrammer I stedet: beskriv hver stikprøve ved nogle karakteristiske tal Median: Det midterste tal, når observationerne er skrevet op i rækkefølge, det vil sige 50% af observationerne median-værdien 50% af observationerne median-værdien Det 29. tal (n = 57): FEV1 50% = 4.10 19

1. kvartil: 25% 75% af observationerne af observationerne FEV1 25% = 3.54 1. kvartil 1. kvartil 2. kvartil: = median! 3. kvartil: etc... Percentil: f.eks. FEV1 20% 20% af observationerne 80% af observationerne FEV120% = 3.46 FEV1 FEV1 20% 20% 20

Gennemsnit: FEV1= n 1 n i= 1 1 57 1 57 FEV1 ( 2.85 3.19... 5.10) = + + + = 231.57 = 4.06 i Tolkning: Den centrale tendens Tyngdepunkt Prediktion: Hvad er det bedste gæt på FEV1 for en ny observation (studerende)? 21

variation kan måles ved spredning (s), - også kaldet standard deviation (sd) 1 n n 1 i 1 ( ) 2 i FEV1 s = sd = FEV1 = Spredningen er et fornuftigt mål for variationen, hvis fordelingen er symmetrisk 22

Karakterisere FEV1 s fordeling ved hjælp af de 2 størrelser: gennemsnit spredning Sammenligning af 2 grupper kan baseres på en sammenligning af disse 2 størrelser 23

Een måling pr individ: (biologisk ) variation mellem personer (inter-individuel variation) Flere målinger pr individ (f.eks. over tid): (biologisk) variation mellem personer (biologisk) variation over tid pr individ (dag-til-dag variation i FEV1) (intra-individuel variation) Måleusikkerhed 24

Time Pt 1 (mal) Pt 2 (mal) Pt 10 (nor) 0 0.08 0.08 0.08 15 13.15 0.08 3.72 30 5.70 0.14 16.02 45 3.22 2.10 8.17 60 2.69 6.37 5.21 90 1.91 4.89 4.84 120 1.72 2.11 2.12 150 1.22 1.40 1.50 180 1.15 1.42 1.18 240 0.71 0.72 0.72 300 0.43 0.39 0.41 360 0.32 0.28 0.29 Blod koncentration af zidovudine (AZT) efter dosering hos patienter med unormal/normal fedt absorption Udsnit af data fra Table 10.5, s.169 25

20 15 AZT 10 5 Pt 1(mal) Pt 2 (mal) 0 Pt 10 (nor).00 30.00 60.00 120.00 180.00 300.00 Time (min) 26

(Table 10.6, s. 170) Normal Malabs abs 667.425 919.875 569.625 599.850 306.000 499.500 298.200 472.875 617.850 1377.975 256.275 527.475 388.800 505.875 Som summary measure anvendes her: Areal under kurven (AUC) Alternative forslag kunne være: peak koncentraion time to peak koncentration 27

AZT 14.00 12.00 10.00 8.00 6.00 4.00 2.00 0.00 Data Model 0 100 200 300 400 Time (min) Farmako-kinetisk model afhænger f.eks. af: dosis+fordelingsvolumen absorption elimination (clearance) 28

Koncentraion 14 12 10 8 6 stor k A Farmako-kinetisk model k k k ( k t k t ) A yt () = d exp( ) exp( ) d k k A E A E : dosis (pr kg legemsvægt) : absorptionsrate : eliminationsrate samme d og k E E A 4 2 lille k A 0 0 25 50 75 100 125 150 175 200 Time (min) 29

Randomiseret klinisk forsøg (RCT) Biomedicinsk problem Responsvariabel Designe et forsøg Indsamling af data Statistisk problem, nulhypotese Statistisk analyse Konklusion Rigtige rækkefølge!!! 30