Epidemiologi og Biostatistik. Mogens Erlandsen, Institut for Biostatistik Uge 1, tirsdag d. 5. februar 2002

Relaterede dokumenter
Epidemiologi og Biostatistik

6. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag)

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

6. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag)

Epidemiologi og Biostatistik

Mikro-kursus i statistik 1. del Mikrokursus i biostatistik 1

Susanne Ditlevsen Institut for Matematiske Fag susanne

1 Hb SS Hb Sβ Hb SC = , (s = )

4. september π B = Lungefunktions data fra tirsdags Gennemsnit l/min

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Introduktion

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning

1. februar Lungefunktions data fra tirsdags Gennemsnit l/min

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse

En teoretisk årsagsmodel: Operationalisering: Vurdering af epidemiologiske undersøgelser. 1. Informationsproblemer Darts et eksempel på målefejl

Måleproblemer. Fejlkilder og tolkningsproblemer. Usikkerhed og bias. Stikprøveusikkerhed. Epidemiologi og Biostatistik (version

MPH specialmodul Epidemiologi og Biostatistik

Eks. 1: Kontinuert variabel som i princippet kan måles med uendelig præcision. tid, vægt,

PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006

Forsøgsplanlægning Stikprøvestørrelse

Statistik. Introduktion Deskriptiv statistik Sandsynslighedregning

Kvantitative Metoder 1 - Forår Dagens program

Kapitel 4 Sandsynlighed og statistiske modeller

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Estimation

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Introduktion

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse

Mikro-kursus i statistik 2. del Mikrokursus i biostatistik 1

Introduktion til overlevelsesanalyse

Kapitel 4 Sandsynlighed og statistiske modeller

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Introduktion

Konfidensintervaller og Hypotesetest

Resumé: En statistisk analyse resulterer ofte i : Et estimat θˆmed en tilhørende se

Studiedesigns: Randomiserede kontrollerede undersøgelser

Landmålingens fejlteori - Sandsynlighedsregning - Lektion 1

Eksempel: PEFR. Epidemiologi og biostatistik. Uge 1, tirsdag. Erik Parner, Institut for Biostatistik.

Eksperimenter. Kim Overvad Afdeling for Epidemiologi Institut for Folkesundhed Aarhus Universitet Marts 2011

Postoperative komplikationer

Module 1: Data og Statistik

C) Perspektiv jeres kommunes resultater vha. jeres svar på spørgsmål b1 og b2.

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

Basal statistik Esben Budtz-Jørgensen 4. november Forsøgsplanlægning Stikprøvestørrelse

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 4: 2. marts

Statistik FSV 4. semester 2014 Øvelser Uge 2: 11. februar

Anvendt Statistik Lektion 2. Sandsynlighedsregning Sandsynlighedsfordelinger Normalfordelingen Stikprøvefordelinger

Vurdering af det Randomiserede kliniske forsøg RCT

CMU PROJEKT HYPOTESETEST OG SIMULERING MICHAEL AGERMOSE JENSEN CHRISTIANSHAVNS GYMNASIUM

Statistik. Peter Sørensen: Statistik og sandsynlighed Side 1

5.11 Middelværdi og varians Kugler Ydelse for byg [Obligatorisk opgave 2, 2005]... 14

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Indledende om Signifikanstest Boldøvelser

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

OR stiger eksponentielt med forskellen i BMI. kompliceret model svær at forstå og analysere

VIGTIGT! Kurset består af: 1. Forelæsninger. 2. Øvelser. 3. Litteraturlæsning

1 Sammenligning af 2 grupper Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver... 2

Statistik viden eller tilfældighed

Hvad skal vi lave? Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver

Basal statistik. 30. januar 2007

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Normalfordelingen og Stikprøvefordelinger

Tema. Dagens tema: Indfør centrale statistiske begreber.

Epidemiologiske associationsmål

En teoretisk årsagsmodel: Operationalisering: Vurdering af epidemiologiske undersøgelser. 1. Informationsproblemer Eksempler på målefejl

Oversigt. Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger

Ovenstående figur viser et (lidt formindsket billede) af 25 svampekolonier på en petriskål i et afgrænset felt på 10x10 cm.

2. Ved et roulettespil kan man vinde 0,10,100, 500 og 1000 kr. Sandsynligheden for gevinsterne ses af følgende skema:

Hvor megen gavn får patienten af den medicinske behandling?

2 Gennemsnitligt indhold af aktivt stof i en tablet fra et glas med 200 tabletter

ORDINÆR EKSAMEN I EPIDEMIOLOGISKE METODER IT & Sundhed, 2. semester

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ 2 -test og Goodness of Fit test.

Reeksamen i Statistik for Biokemikere 6. april 2009

Vi vil analysere effekten af rygning og alkohol på chancen for at blive gravid ved at benytte forskellige Cox regressions modeller.

Hypotesetests, fejltyper og p-værdier

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff.

Besvarelse af opgavesættet ved Reeksamen forår 2008

Landsdækkende database for kræft i tykog endetarm (DCCG) Addendum til National a rsrapport januar december 2012

OR stiger eksponentielt med forskellen i BMI komplicet model svær at forstå og analysere simpel model

Deskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium

Morten Frydenberg 14. marts 2006

Epidemiologi og biostatistik. Diagnostik og screening. Forelæsning, uge 5, Svend Juul. Hvordan stiller man en diagnose? Diagnostiske kriterier


Opgave I II III IV V VI Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Statistisk modellering og regressionsanalyse

Sammenligning af to sæt observationer p-værdier og sikkerhedsgrænser

t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t.

Kapitel 3 Centraltendens og spredning

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

Velkommen til StatBK. Program. Introduktion, summary measures, SAS. Praktisk info. Praktisk info

Løsninger til kapitel 1

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

Kursus i varians- og regressionsanalyse Data med detektionsgrænse. Birthe Lykke Thomsen H. Lundbeck A/S

Basal statistik for lægevidenskabelige forskere, forår Udleveret 12. marts, afleveres senest ved øvelserne i uge 14 (2.-4.

En intro til radiologisk statistik. Erik Morre Pedersen

Oversigt. Kursus Introduktion til Statistik. Forelæsning 1: Intro og beskrivende statistik. Per Bruun Brockhoff. Praktisk Information

Transkript:

Epidemiologi og Biostatistik Mogens Erlandsen, Institut for Biostatistik Uge 1, tirsdag d. 5. februar 2002 1

Statestik Det hedder det ikke! Statistik 2

Streptomycin til behandling af lunge-tuberkulose? (Table 2.6, s. 10. Medical Research Council 1948) Lave et forsøg, men hvordan? Success-kriterium = effekt-mål = respons? Samme virkning på alle? Bivirkninger? Kontrolgruppe? Placebo - dobbelt blindet forsøg? 3

1. Alle nye pt behandles med streptomycin? 2. Dem lægen finder egnede behandles? 3. Hver anden? 4. Lodtrækning (randomisering) Randomiseret klinisk forsøg RCT = Randomised clinical trial 4

Respons = overlevelse efter 6 måneder Gruppe Antal ialt Døde Streptomycin 55 4 Kontrol 52 14 Hvis forsøget blev gentaget på 55+52 nye pt, får vi så præcis det samme resultat? Hvorfor ikke? Pt er forskellige = interindividuel variation! 5

Hvad vil vi gerne konkludere? om Streptomycin har en (gavnlig) effekt på lungetuberkulose? om den enkelte pt s chance (Hr Jensen, Fru Olsen,...) for at overleve sygdommen ændres ved streptomycin behandling? Helbredt gøres syg Men den enkelte patient, der indgår i forsøget, kan ikke behandles med både placebo (kontrol) og streptomycin Respons: død/ilive 6

Generalisere fra stikprøven til hele populationen (= alle nye patienter med lungetuberkulose ) Stikprøven kan f.eks. bestå af alle nye patienter med sygdommen inden for det næste år. Ved lodtrækning afgøres det om den enkelte patient skal behandles med placebo eller streptomycin Er de næste 112 patienter på ÅKH typiske for hele Århus amt, eller Jylland, eller Danmark, eller????? 7

I stikprøven er dødshyppigheden blandt de streptomycin-behandlede mindre end blandt kontrollerne: 4 = 0.073< 14 = 0.269 55 52 Vil det også gælde for hele populationen (fremtidige patienter med lungetuberkulose)? En ny stikprøve vil give lidt andre hyppigheder! Hvor meget kan disse hyppigheder variere? 8

I hele populationen: hyppighed = sandsynlighed (ukendt parameter) I stikprøven: hyppighed beregnes ud fra data (estimat) og er et gæt på sandsynligheden Sandsynlighed for positiv respons, hvis man behandles med streptomycin frekventiel fortolkning (hvis vi behandler mange pt ) Sandsynlighed for positiv respons, hvis man behandles med placebo Hvis streptomycin ikke har en effekt (nulhypotese) vil vi forvente at de 2 sandsynligheder er lige store 9

Ud fra stikprøven kan vi gætte på (estimere) disse 2 sandsynligheder Hvor usikre er vores estimater? Kan vi sammenligne de 2 sandsynligheder (nulhypotese) ved hjælp af vores estimater? Hvor forskellige kan de 2 sandsynligheder være? Ved hjælp af data (stikprøven) kan vi besvare disse spørgsmål (kvantificere vores viden om problemet) = Statistisk analyse 10

Kan virke meget abstrakt med disse mentale konstruktioner som: population sandsynlighed nulhypotese Mønt-kast: Antag, at vi får udleveret 2 mønter, der begge er blevet vredet skæve af hver sin person Har de 2 mønter samme sandsynlighed for krone? Vi kan ikke måle os til disse sandsynligheder! (men vi kan godt forestille os dem som ukendte størrelser!) 11

I streptomycin-eksemplet: Responsvariablen har kun 2 mulige udfald (ilive/død). Responsvariablen kan have mere end 2 udfald: NYHA index : I, II, III og IV Systolisk blodtryk : alle positive tal (i praksis et range fra 50 til 300?) Lufttemperatur : både negative og positive tal (et range fra -100 til 100 C?) Responsvariabel: kategorisk eller kontinuert Ikke-ordnet: ilive/død, kvinde /mand Ordnet: NYHA, smerte-score 12

Lungefunktion (Table 4.4) Sammenlign lungefunktionen hos: rygere med ikke-rygere astmatikere med raske etc. Respons = FEV1 Forsøg: Udvælg et antal personer tilfældigt i hver af de 2 grupper og sammenlign deres FEV1? 13

Sandsynlighed for at FEV1=3.0 liter??? Sandsynlighed for at FEV1= π liter??? Men sandsynligheden for at FEV1 > 3.0 liter giver mening Beregne denne sandsynlighed for alle mulige tal Beskrive fordelingen af FEV1 i hver gruppe Sammenligne 2 fordelinger 14

Table 4.4, s. 49. FEV1 (liter) 57 mandlige med.stud. Oprindelig rækkefølge Ordnet efter FEV1 Obs nr FEV1 Obs nr FEV1 1 2.85 1 2.85 2 3.19 11 2.85 3 3.50 21 2.98 4 3.69 31 3.04 5 3.90 40 3.10 56 4.78 20 5.30 57 5.10 30 5.43 2.0 FEV1< 2. 5 Antal observationer = 0 minimum 2.5 FEV1< 3.0 3 obs. maximum 15

20 Histogram 15 10 2.5-3.0 5 0 2.25 2.75 3.25 3.75 4.25 4.75 5.25 5.75 2.0-2.5 FEV1 (liter) 16

Histogrammet beskriver stikprøvens fordeling En ny stikprøve (af samme størrelse) vil give et anderledes histogram, men overordnet vil de 2 histogrammer ligne hinanden: range (minimum - maximum: cirka 2.5-5.5 liter) en tydelig top omkring den centrale tendens (cirka 4 liter) symmetrisk omkring midten midten = den centrale tendens 17

80 60 asymmetrisk højreskævt 40 20 0.05.25.45.65.85 1.05 1.25 1.45 1.65 1.85.15.35.55.75.95 1.15 1.35 1.55 1.75 1.95 Triglycerid 18

Svært at beskrive/sammenligne histogrammer I stedet: beskriv hver stikprøve ved nogle karakteristiske tal Median: Det midterste tal, når observationerne er skrevet op i rækkefølge, det vil sige 50% af observationerne median-værdien 50% af observationerne median-værdien Det 29. tal (n = 57): FEV1 50% = 4.10 19

1. kvartil: 25% 75% af observationerne af observationerne FEV1 25% = 3.54 1. kvartil 1. kvartil 2. kvartil: = median! 3. kvartil: etc... Percentil: f.eks. FEV1 20% 20% af observationerne 80% af observationerne FEV120% = 3.46 FEV1 FEV1 20% 20% 20

Gennemsnit: FEV1= n 1 n i= 1 1 57 1 57 FEV1 ( 2.85 3.19... 5.10) = + + + = 231.57 = 4.06 i Tolkning: Den centrale tendens Tyngdepunkt Prediktion: Hvad er det bedste gæt på FEV1 for en ny observation (studerende)? 21

variation kan måles ved spredning (s), - også kaldet standard deviation (sd) 1 n n 1 i 1 ( ) 2 i FEV1 s = sd = FEV1 = Spredningen er et fornuftigt mål for variationen, hvis fordelingen er symmetrisk 22

Karakterisere FEV1 s fordeling ved hjælp af de 2 størrelser: gennemsnit spredning Sammenligning af 2 grupper kan baseres på en sammenligning af disse 2 størrelser 23

Een måling pr individ: (biologisk ) variation mellem personer (inter-individuel variation) Flere målinger pr individ (f.eks. over tid): (biologisk) variation mellem personer (biologisk) variation over tid pr individ (dag-til-dag variation i FEV1) (intra-individuel variation) Måleusikkerhed 24

Time Pt 1 (mal) Pt 2 (mal) Pt 10 (nor) 0 0.08 0.08 0.08 15 13.15 0.08 3.72 30 5.70 0.14 16.02 45 3.22 2.10 8.17 60 2.69 6.37 5.21 90 1.91 4.89 4.84 120 1.72 2.11 2.12 150 1.22 1.40 1.50 180 1.15 1.42 1.18 240 0.71 0.72 0.72 300 0.43 0.39 0.41 360 0.32 0.28 0.29 Blod koncentration af zidovudine (AZT) efter dosering hos patienter med unormal/normal fedt absorption Udsnit af data fra Table 10.5, s.169 25

20 15 AZT 10 5 Pt 1(mal) Pt 2 (mal) 0 Pt 10 (nor).00 30.00 60.00 120.00 180.00 300.00 Time (min) 26

(Table 10.6, s. 170) Normal Malabs abs 667.425 919.875 569.625 599.850 306.000 499.500 298.200 472.875 617.850 1377.975 256.275 527.475 388.800 505.875 Som summary measure anvendes her: Areal under kurven (AUC) Alternative forslag kunne være: peak koncentraion time to peak koncentration 27

AZT 14.00 12.00 10.00 8.00 6.00 4.00 2.00 0.00 Data Model 0 100 200 300 400 Time (min) Farmako-kinetisk model afhænger f.eks. af: dosis+fordelingsvolumen absorption elimination (clearance) 28

Koncentraion 14 12 10 8 6 stor k A Farmako-kinetisk model k k k ( k t k t ) A yt () = d exp( ) exp( ) d k k A E A E : dosis (pr kg legemsvægt) : absorptionsrate : eliminationsrate samme d og k E E A 4 2 lille k A 0 0 25 50 75 100 125 150 175 200 Time (min) 29

Randomiseret klinisk forsøg (RCT) Biomedicinsk problem Responsvariabel Designe et forsøg Indsamling af data Statistisk problem, nulhypotese Statistisk analyse Konklusion Rigtige rækkefølge!!! 30