"There are three kinds of lies: lies, damned lies and statistics. - Mark Twain

Relaterede dokumenter
Ikke-parametriske tests

Basic statistics for experimental medical researchers

Kvant Eksamen December timer med hjælpemidler. 1 Hvad er en continuous variable? Giv 2 illustrationer.

Kursus 02323: Introducerende Statistik. Forelæsning 12: Forsøgsplanlægning. Peder Bacher

Jesper Frank Christensen, PhD Center for Aktiv Sundhed, Rigshospitalet

Statistik for MPH: 7

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Afsnit E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse

Konfidensintervaller og Hypotesetest

Statistik for MPH: oktober Attributable risk, bestemmelse af stikprøvestørrelse (Silva: , )

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Løsning til eksaminen d. 29. maj 2009

1 enote 1: Simple plots og deskriptive statistik. 2 enote2: Diskrete fordelinger. 3 enote 2: Kontinuerte fordelinger

Oversigt. 1 Motiverende eksempel - energiforbrug. 2 Hypotesetest (Repetition) 3 Two-sample t-test og p-værdi. 4 Konfidensinterval for forskellen

Reexam questions in Statistics and Evidence-based medicine, august sem. Medis/Medicin, Modul 2.4.

Vejledende studieplan for kvantitativ metode og statistik FYS 514 Modul 14 efteråret 2017

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering

The use of instrumented gait analysis in interdisciplinary interventions for children with cerebral palsy

Analyseinstitut for Forskning

Kursus 02402/02323 Introduktion til statistik. Forelæsning 13: Et overblik over kursets indhold. Klaus K. Andersen og Per Bruun Brockhoff

Besvarelse af vitcap -opgaven

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j

Measuring the Impact of Bicycle Marketing Messages. Thomas Krag Mobility Advice Trafikdage i Aalborg,

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Trolling Master Bornholm 2012

Løsning eksamen d. 15. december 2008

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Uafhængighedstestet

Kursus Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, ( , ) Per Bruun Brockhoff

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Generelle lineære modeller

Løsning til eksaminen d. 14. december 2009

DoodleBUGS (Hands-on)

Cross-Sectorial Collaboration between the Primary Sector, the Secondary Sector and the Research Communities

Sommereksamen Bacheloruddannelsen i Medicin/Medicin med industriel specialisering

Skriftlig Eksamen Kombinatorik, Sandsynlighed og Randomiserede Algoritmer (DM528)

Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Basal statistik. 30. januar 2007

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

1 enote 1: Simple plots og deskriptive statistik. 2 enote 2: Diskrete fordelinger. 3 enote 2: Kontinuerte fordelinger

KA 4.2 Kvantitative Forskningsmetoder Forår 2010

En Introduktion til SAS. Kapitel 5.

Introduktion til Statistik. Forelæsning 12: Inferens for andele. Peder Bacher

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

Mikro-kursus i statistik 2. del Mikrokursus i biostatistik 1

Generalized Probit Model in Design of Dose Finding Experiments. Yuehui Wu Valerii V. Fedorov RSU, GlaxoSmithKline, US

Vina Nguyen HSSP July 13, 2008

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1

Regressionsanalyser. Hvad er det statistiske problem? Primære og sekundære problemer. Metodeproblemer.

Normalfordelingen og Stikprøvefordelinger

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Introduktion til Statistik. Forelæsning 10: Inferens for andele. Peder Bacher

Logistisk regression

Privat-, statslig- eller regional institution m.v. Andet Added Bekaempelsesudfoerende: string No Label: Bekæmpelsesudførende

Reeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

Klasseøvelser dag 2 Opgave 1

Kursus 02402/02323 Introducerende Statistik. Forelæsning 6: Sammenligning af to grupper

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Linear Programming ١ C H A P T E R 2

Resultater. Formål. Results. Results. Må ikke indeholde. At fåf. kendskab til rapportering af resultater. beskrivelse

Logistisk Regression - fortsat

X M Y. What is mediation? Mediation analysis an introduction. Definition

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

Skriftlig eksamen Science statistik- ST501

Statistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Opgavebesvarelse, Basalkursus, uge 3

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup)

How consumers attributions of firm motives for engaging in CSR affects their willingness to pay

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer.

Forelæsning 4: Konfidensinterval for middelværdi (og spredning)

Aktivering af Survey funktionalitet

STAT-UB.0103 Spring 2012 Homework Set 8 Solutions

Evaluating Germplasm for Resistance to Reniform Nematode. D. B. Weaver and K. S. Lawrence Auburn University

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff

Sikkerhed & Revision 2013

Opgavebesvarelse, Basalkursus, uge 3

Log-lineære modeller. Analyse af symmetriske sammenhænge mellem kategoriske variable. Ordinal information ignoreres.

Forsøgsplanlægning Stikprøvestørrelse

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Exam questions in Statistics and evidence-based medicine, spring sem. Medis/Medicin, Modul 2.4.

Statistik vejledende læreplan og læringsmål, efteråret 2013 SmartLearning

Oversigt. 1 Eksempel. 2 Fordelingen for gennemsnittet t-fordelingen. 3 Konfidensintervallet for µ Eksempel

Forelæsning 9: Inferens for andele (kapitel 10)

Skriftlig Eksamen Diskret matematik med anvendelser (DM72)

Opgavebesvarelse, Basalkursus, uge 3

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

Forelæsning 11: Envejs variansanalyse, ANOVA

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

Exam questions in Statistics and evidence-based medicine, spring sem. Medis/Medicin, Modul 2.4.

Opgavebesvarelse, Basalkursus, uge 3

Transkript:

"There are three kinds of lies: lies, damned lies and statistics. - Mark Twain

Statistik metoder til indsamling, analyse, fortolkning og præsentation af data I (sundhedsvidenskabelig) praksis objektiv metode til analyse af data Grundlaget for evidens Myter om statistik Statistik er en eksakt videnskab/metode Der findes én, og kun én, rigtig metode at analysere data på

NB: Der blev bygget et offentligt toilet lige overfor museet Anden Verdenskrig Antallet af amerikanske soldater dræbt i tjeneste: 408.000 Antallet af civile dræbt i USA i samme periode: 375.000 UDSAGN: Det var lige så farligt at være civil, som at være soldat i kamp under 2. verdenskrig Museumsbesøg Et amerikansk museum havde følgende besøgstal indtil 2006 2002 2003 2004 2005 2006 305.000 314.000 309.000 325.000 211.000 UDSAGN: Amerikanerne blev pludselig markant mindre interesseret i kunst.

Effekten af indførelse af hjelm for amerikanske soldater: Antallet af hovedskader steg kraftigt efter indførelsen af hjelm til amerikanske soldater under 1. verdenskrig. Antal døde var ikke medregnet i kategorien af hovedskader

Typisk afsnit i en statistik bog In general, the population mean of a finite population of size N is given by And the population variance is given by In many practical situations, the true variance of a population is not known a priori and must be computed somehow. When dealing with extremely large populations, it is not possible to count every object in the population. A common task is to estimate the variance of a population from a sample. We take a sample of n values y 1,..., y n from the population, where n < N, and estimate the mean and variance on the basis of this sample.

For one-sample t-test For paired two sample t-test For independent two sample t-test - equal variance For independent two sample t-test - un-equal variance

Fordelinger af populationer

2 typer af statistik Deskriptiv statistik: beskriver indhentet data fra en given population Inferential Statistik: drager konklusioner om en generel population ud fra en stikprøve. Population: Hele gruppen af elementer Parametre: beskriver en population (fx middeltal og varians) Observation: Én værdi (eller sæt af værdier) udtrukket fra et element (individ) i populationen Stikprøve: Et antal (tilfældigt valgte) observationer fra populationen

Normalfordelingen

Statistiske metoder i sundhedsvidenskabelig forskning

Hvad skal man overveje? Hvilken datatype: kvalitativ eller kvantitativ, norminal eller ordinal, diskret eller kontinuerlig? Hvilket design: parret eller u-parret Hvor mange grupper: 2 eller flere Hvilket Signifikans-niveau forkaster hypotesen (type 1 fejl) Hvilket antal observationer skal til for at sikre tilstrækkelig power (type 2 fejl) ER DATA NORMALFORDELT/PARAMETRISK?

Normalfordelingen

Hypotese-test Hvad er det, man undersøger? Populært: er der forskel imellem grupperne? Reelt: hvad er sandsynligheden for, at den forskel vi ser imellem grupperne skyldes tilfældigheder? - DVS STIKPRØVERNE FAKTISK STAMMER FRA SAMME FORDELING!

Hypotese-test Hvordan skal output fra en hypotese-test fortolkes? 2 centrale output: p-værdi (probability): sandsynligheden for at middeltallet for stikprøven stammer fra populationens fordeling Konfidensinterval (KI): det interval, det reelle middeltal for populationen (med 95% sandsynlighed), befinder sig indenfor

Effekt-size Udføres ofte komplementært til hypotese-test særligt når man vil undersøge effekten af en intervention Populært: Hvor stor effekten har interventionen? Reelt: Hvor stor del af differencen imellem stikprøvernes middeltal kan forklares med interventionen? MANGE måder at udregne effect-size/estimat Udregnes som: Differensen divideret med variansen MILLION-DOLLAR?: Er 0 (eller 1) indeholdt i KI?

Korrelation og regression Populært: er der sammenhæng imellem to variable? Reelt: hvor stor en del af variationen af den ene variabel kan forklares ved variationen af den anden variabel? 4 datasæt med samme korrelationskoeficient, r=0.816 (Anscombe's quartet)

Statistical Analyses and Sample Size Calculation To achieve 80% power at an α level of.05 (two tailed), 25 participants per group would be required to detect a mean difference in change for whole body lean mass of 1 kg (standard deviation of 1.25 kg) at the end of the 12-week intervention. This was based on a number of reports showing marked reductions in muscle loss in patients with prostate cancer undergoing AST. 6,32,33 Based on our previous experience with exercise trials, we anticipated an attrition rate of up to 10%. As a result, to adequately ensure that we had sufficient participant numbers at the end of the intervention, 57 participants were recruited and randomly assigned to EX (n = 29) and CO (n = 28). Data were analyzed using the SPSS version 15 (SPSS Inc, Chicago, IL) statistical software package. Normality of the distribution for outcome measures was tested using the Kolmogorov-Smirnof test. Analyses included standard descriptive statistics, independent t-tests, χ 2, and analysis of covariance adjusted for baseline values, AST time, use of antiandrogen, number of medications, and education. To determine if general health changes were mediated by changes in lean mass and functioning, correlations were explored between self-reported general health and objective measures of lean mass and muscle strength. An intention-to-treat approach was used for all analyses including missing data in all analyses by imputing change across time to be zero. However, one participant dropped-out after baseline testing and did not return the SF-36 questionnaire and there was no QLQ-30 data for seven participants as the instrument was included in the assessment battery after these participants entered the study. All tests were two tailed and an α level of.050 was required for significance. Sample size beregning Test for normalitet Primære effekt analyser Sekundære analyser (correlations-test) Statistisk metode og redegørelse for drop-out

Quality of Life and Adverse Events Quality of life assessed by the SF-36 (Table 6) showed better change scores for general health (P =.022), vitality (P =.019), and the physical health composite scores (P =.020) for the EX group. Change in general health was associated with change in whole body lean mass (r =.385; P =.039) and approached significance for change in average muscle strength (r =.249; P =.064).

Statistical analysis. Nonparametric statistics were used for the analyses, since not all data were normally distributed. To evaluate the effect of intervention over time, a Friedman test was used with post hoc Wilcoxon's test. Any between-group differences were analyzed with Kruskal-Wallis tests and subsequent Mann-Whitney U- test. Spearman's Rho was used for the correlation analysis on a limited number of data. Analysis were performed on collapsed data for all three groups, except for the relation between the delta change in type II muscle fiber area and stair walking power after 12 wk of RT. Data are presented as mean values SE. A P value of less than 0.05 were considered significant.

Mammografi Screening Virker det? Olsen et al. 2005. BMJ vs Jørgensen et al. 2010, BMJ

Tak for jeres opmærksomhed