Kursus 02402/02323 Introduktion til statistik. Forelæsning 13: Et overblik over kursets indhold. Klaus K. Andersen og Per Bruun Brockhoff

Størrelse: px
Starte visningen fra side:

Download "Kursus 02402/02323 Introduktion til statistik. Forelæsning 13: Et overblik over kursets indhold. Klaus K. Andersen og Per Bruun Brockhoff"

Transkript

1 Kursus 02402/02323 Introduktion til statistik Forelæsning 13: Et overblik over kursets indhold Klaus K. Andersen og Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Danmarks Tekniske Universitet 2800 Lyngby Danmark Klaus KA og Per BB Introduktion til statistik, Forelæsning 13 Efteråret / 39

2 Overview 1 enote 1: Simple plots og deskriptive statistik 2 enote2: Diskrete fordelinger 3 enote 2: Kontinuerte fordelinger 4 enote 3: Konfidensintervaller for én gruppe/stikprøve 5 enote 3: Hypotese tests for én gruppe/stikprøve 6 enote 3: Statistik for to grupper/stikprøver 7 enote 4: Statistik ved simulation 8 enote 5: Simpel lineær regressions analyse 9 enote 6: Multipel lineær regressions analyse 10 enote 8: Envejs variansanalyse (envejs ANOVA) 11 enote 8: Tovejs variansanalyse (ANOVA) 12 enote 7: Inferens for andele Klaus KA og Per BB (klaus@cancer.dk) Introduktion til statistik, Forelæsning 13 Efteråret / 39

3 enote 1: Simple plots og deskriptive statistik Overview 1 enote 1: Simple plots og deskriptive statistik 2 enote2: Diskrete fordelinger 3 enote 2: Kontinuerte fordelinger 4 enote 3: Konfidensintervaller for én gruppe/stikprøve 5 enote 3: Hypotese tests for én gruppe/stikprøve 6 enote 3: Statistik for to grupper/stikprøver 7 enote 4: Statistik ved simulation 8 enote 5: Simpel lineær regressions analyse 9 enote 6: Multipel lineær regressions analyse 10 enote 8: Envejs variansanalyse (envejs ANOVA) 11 enote 8: Tovejs variansanalyse (ANOVA) 12 enote 7: Inferens for andele Klaus KA og Per BB (klaus@cancer.dk) Introduktion til statistik, Forelæsning 13 Efteråret / 39

4 enote 1: Simple plots og deskriptive statistik enote 1: Simple plots og deskriptiv statistik Engelsk Teknikker til at se på data! (deskriptiv statistik) Opsummerende beregningsstørrelser Gennemsnittet: x Empirisk standard afvigelse: s Empirisk varians: s 2 Median, øvre- og nedre kvartiler Empririsk korrelation Simple plots Scatter plot (xy plot) Histogram (empirisk tæthed) Kumulativ fordeling (empirisk fordeling) Boxplots, søjlediagram, cirkeldiagram (lagkagediagram) Klaus KA og Per BB (klaus@cancer.dk) Introduktion til statistik, Forelæsning 13 Efteråret / 39

5 enote2: Diskrete fordelinger Overview 1 enote 1: Simple plots og deskriptive statistik 2 enote2: Diskrete fordelinger 3 enote 2: Kontinuerte fordelinger 4 enote 3: Konfidensintervaller for én gruppe/stikprøve 5 enote 3: Hypotese tests for én gruppe/stikprøve 6 enote 3: Statistik for to grupper/stikprøver 7 enote 4: Statistik ved simulation 8 enote 5: Simpel lineær regressions analyse 9 enote 6: Multipel lineær regressions analyse 10 enote 8: Envejs variansanalyse (envejs ANOVA) 11 enote 8: Tovejs variansanalyse (ANOVA) 12 enote 7: Inferens for andele Klaus KA og Per BB (klaus@cancer.dk) Introduktion til statistik, Forelæsning 13 Efteråret / 39

6 enote2: Diskrete fordelinger enote2: Diskrete fordelinger Engelsk Grundlæggende koncepter: Stokastisk variabel (udfaldet af et endnu ikke udført eksperiment) Tæthedsfunktion: f(x) = P (X = x) (pdf) Fordelingsfunktion: F (x) = P (X x) (cdf) Middelværdi: µ = E(X) Standard afvigelse: σ Varians: σ 2 Specifikke distributioner: Binomial (terningekast) Hypergeometrisk (trækning uden tilbagelægning) Poisson (antal hændelser i interval) Klaus KA og Per BB (klaus@cancer.dk) Introduktion til statistik, Forelæsning 13 Efteråret / 39

7 enote 2: Kontinuerte fordelinger Overview 1 enote 1: Simple plots og deskriptive statistik 2 enote2: Diskrete fordelinger 3 enote 2: Kontinuerte fordelinger 4 enote 3: Konfidensintervaller for én gruppe/stikprøve 5 enote 3: Hypotese tests for én gruppe/stikprøve 6 enote 3: Statistik for to grupper/stikprøver 7 enote 4: Statistik ved simulation 8 enote 5: Simpel lineær regressions analyse 9 enote 6: Multipel lineær regressions analyse 10 enote 8: Envejs variansanalyse (envejs ANOVA) 11 enote 8: Tovejs variansanalyse (ANOVA) 12 enote 7: Inferens for andele Klaus KA og Per BB (klaus@cancer.dk) Introduktion til statistik, Forelæsning 13 Efteråret / 39

8 enote 2: Kontinuerte fordelinger enote 2: Kontinuerte fordelinger Grundlæggende koncepter: Tæthedsfunktion: f(x) (pdf) Fordelingsfunktion: F (x) = P (X x) (cdf) Middelværdi (µ) og varians (σ 2 ) Regneregler for stokastiske variabler Specifikke fordelinger: Normal Log-Normal Uniform Exponential t χ 2 F Engelsk Klaus KA og Per BB (klaus@cancer.dk) Introduktion til statistik, Forelæsning 13 Efteråret / 39

9 enote 3: Konfidensintervaller for én gruppe/stikprøve Overview 1 enote 1: Simple plots og deskriptive statistik 2 enote2: Diskrete fordelinger 3 enote 2: Kontinuerte fordelinger 4 enote 3: Konfidensintervaller for én gruppe/stikprøve 5 enote 3: Hypotese tests for én gruppe/stikprøve 6 enote 3: Statistik for to grupper/stikprøver 7 enote 4: Statistik ved simulation 8 enote 5: Simpel lineær regressions analyse 9 enote 6: Multipel lineær regressions analyse 10 enote 8: Envejs variansanalyse (envejs ANOVA) 11 enote 8: Tovejs variansanalyse (ANOVA) 12 enote 7: Inferens for andele Klaus KA og Per BB (klaus@cancer.dk) Introduktion til statistik, Forelæsning 13 Efteråret / 39

10 enote 3: Konfidensintervaller for én gruppe/stikprøve enote 3: Konfidensintervaller for én gruppe/stikprøve Grundlæggende koncepter Estimation Signifikans niveau α Konfidensintervaller (fanger rigtige prm. 1 α af gangene) Population og tilfældig stikprøve Stikprøvefordelinger (t og χ 2 ) Centrale grænseværdisætning Engelsk Specifikke metoder, én gruppe/stikprøve: Konfidensintervaller for middelværdi (t-fordeling) og varians (χ 2 fordeling) Forsøgsplanlægning: beregn stikprøvestørrelsen n for den ønskede præcision Klaus KA og Per BB (klaus@cancer.dk) Introduktion til statistik, Forelæsning 13 Efteråret / 39

11 enote 3: Hypotese tests for én gruppe/stikprøve Overview 1 enote 1: Simple plots og deskriptive statistik 2 enote2: Diskrete fordelinger 3 enote 2: Kontinuerte fordelinger 4 enote 3: Konfidensintervaller for én gruppe/stikprøve 5 enote 3: Hypotese tests for én gruppe/stikprøve 6 enote 3: Statistik for to grupper/stikprøver 7 enote 4: Statistik ved simulation 8 enote 5: Simpel lineær regressions analyse 9 enote 6: Multipel lineær regressions analyse 10 enote 8: Envejs variansanalyse (envejs ANOVA) 11 enote 8: Tovejs variansanalyse (ANOVA) 12 enote 7: Inferens for andele Klaus KA og Per BB (klaus@cancer.dk) Introduktion til statistik, Forelæsning 13 Efteråret / 39

12 enote 3: Hypotese tests for én gruppe/stikprøve enote 3: Hypotese tests for én gruppe/stikprøve Grundlæggende koncepter: Engelsk Hypoteser p-værdi (sandsynlighed for teststørrelsen eller mere ekstremt, hvis H 0 er sand, e.g. P (T > t obs )) Type I fejl: (i virkeligheden ingen effekt, men H 0 afvises) P (Type I) = α Type II fejl: (i virkeligheden effekt, men H 0 afvises ikke) P (Type II) = β Testens styrke er β Specifikke metoder, én gruppe: t-test for middelværdiniveau Stikprøvestørrelse for ønsket styrke Normal qq-plot Klaus KA og Per BB (klaus@cancer.dk) Introduktion til statistik, Forelæsning 13 Efteråret / 39

13 enote 3: Statistik for to grupper/stikprøver Overview 1 enote 1: Simple plots og deskriptive statistik 2 enote2: Diskrete fordelinger 3 enote 2: Kontinuerte fordelinger 4 enote 3: Konfidensintervaller for én gruppe/stikprøve 5 enote 3: Hypotese tests for én gruppe/stikprøve 6 enote 3: Statistik for to grupper/stikprøver 7 enote 4: Statistik ved simulation 8 enote 5: Simpel lineær regressions analyse 9 enote 6: Multipel lineær regressions analyse 10 enote 8: Envejs variansanalyse (envejs ANOVA) 11 enote 8: Tovejs variansanalyse (ANOVA) 12 enote 7: Inferens for andele Klaus KA og Per BB (klaus@cancer.dk) Introduktion til statistik, Forelæsning 13 Efteråret / 39

14 enote 3: Statistik for to grupper/stikprøver enote 3: Statistik for to grupper/stikprøver Engelsk Specifikke metoder, to grupper: Test og konfidensintervaller for forskel i middelværdi (t-test) Forsøgsplanlægning: Beregn sample størrelsen for den ønskede styrke Specifikke metoder, to PARREDE grupper: "Tag differencen for hver måling" "statistik for én gruppe" Klaus KA og Per BB (klaus@cancer.dk) Introduktion til statistik, Forelæsning 13 Efteråret / 39

15 enote 4: Statistik ved simulation Overview 1 enote 1: Simple plots og deskriptive statistik 2 enote2: Diskrete fordelinger 3 enote 2: Kontinuerte fordelinger 4 enote 3: Konfidensintervaller for én gruppe/stikprøve 5 enote 3: Hypotese tests for én gruppe/stikprøve 6 enote 3: Statistik for to grupper/stikprøver 7 enote 4: Statistik ved simulation 8 enote 5: Simpel lineær regressions analyse 9 enote 6: Multipel lineær regressions analyse 10 enote 8: Envejs variansanalyse (envejs ANOVA) 11 enote 8: Tovejs variansanalyse (ANOVA) 12 enote 7: Inferens for andele Klaus KA og Per BB (klaus@cancer.dk) Introduktion til statistik, Forelæsning 13 Efteråret / 39

16 enote 4: Statistik ved simulation enote 4: Statistik ved simulation Introduktion til simulering (Beregn statistik mange gange) Engelsk Fejlforplantning (error propagation rules) (F.eks. igennem ikke-lineær funktion) Bootstrapping: Parametrisk (Simuler mange udfald af stokastisk var.) Ikke-parametrisk (Træk direkte fra data) Konfidensintervaller (og derfor også hypotesetest) Specifikke setups: (4 versioner af konfidensintervaller) Èn gruppe/stikprøve og to grupper/stikprøver data Parametrisk vs. ikke-parametrisk Klaus KA og Per BB Introduktion til statistik, Forelæsning 13 Efteråret / 39

17 enote 5: Simpel lineær regressions analyse Overview 1 enote 1: Simple plots og deskriptive statistik 2 enote2: Diskrete fordelinger 3 enote 2: Kontinuerte fordelinger 4 enote 3: Konfidensintervaller for én gruppe/stikprøve 5 enote 3: Hypotese tests for én gruppe/stikprøve 6 enote 3: Statistik for to grupper/stikprøver 7 enote 4: Statistik ved simulation 8 enote 5: Simpel lineær regressions analyse 9 enote 6: Multipel lineær regressions analyse 10 enote 8: Envejs variansanalyse (envejs ANOVA) 11 enote 8: Tovejs variansanalyse (ANOVA) 12 enote 7: Inferens for andele Klaus KA og Per BB (klaus@cancer.dk) Introduktion til statistik, Forelæsning 13 Efteråret / 39

18 enote 5: Simpel lineær regressions analyse enote 5: Simpel lineær regressions analyse To variable: x og y Engelsk Beregn mindstekvadraters estimat af rette linje Inferens med simpel lineær regressionsmodel Statistisk model: Y i = β 0 + β 1 x i + ε i Estimation af konfidensintervaller og tests for β 0 og β 1 Konfidensintervaller for linjen (95% gange ligger linjen indenfor) Prædiktionsintervaller for punkter (95% af nye punkter ligger indenfor) ρ, R og R 2 ρ er korrelationen (= sign R R) beskriver graden af lineær sammenhæng mellem x og y R 2 er andelen af den totale variation som er forklaret af modellen Afvises H 0 : β 1 = 0 så afvises også H 0 : ρ = 0 Klaus KA og Per BB (klaus@cancer.dk) Introduktion til statistik, Forelæsning 13 Efteråret / 39

19 enote 6: Multipel lineær regressions analyse Overview 1 enote 1: Simple plots og deskriptive statistik 2 enote2: Diskrete fordelinger 3 enote 2: Kontinuerte fordelinger 4 enote 3: Konfidensintervaller for én gruppe/stikprøve 5 enote 3: Hypotese tests for én gruppe/stikprøve 6 enote 3: Statistik for to grupper/stikprøver 7 enote 4: Statistik ved simulation 8 enote 5: Simpel lineær regressions analyse 9 enote 6: Multipel lineær regressions analyse 10 enote 8: Envejs variansanalyse (envejs ANOVA) 11 enote 8: Tovejs variansanalyse (ANOVA) 12 enote 7: Inferens for andele Klaus KA og Per BB (klaus@cancer.dk) Introduktion til statistik, Forelæsning 13 Efteråret / 39

20 enote 6: Multipel lineær regressions analyse enote 6: Multipel lineær regressions analyse Flere variabler: y, x 1, x 2,... (y afhængig/respons var. og x er er forklarende/uafhængige var.) Mindstekvadraters rette plan (et plan da der er >2 dimensioner) Inferens for en multipel lineær regressionmodel Statistisk model: Y i = β 0 + β 1 x 1,i + β 2 x 2,i ε i Estimation af konfidensintervaller og tests for β er Konfidensintervaller for modellen (For det forventede plan) Prædiktionsintervaller for nye punkter Engelsk R 2 er andelen af den totale variationen som er forklaret af modellen Klaus KA og Per BB (klaus@cancer.dk) Introduktion til statistik, Forelæsning 13 Efteråret / 39

21 enote 8: Envejs variansanalyse (envejs ANOVA) Overview 1 enote 1: Simple plots og deskriptive statistik 2 enote2: Diskrete fordelinger 3 enote 2: Kontinuerte fordelinger 4 enote 3: Konfidensintervaller for én gruppe/stikprøve 5 enote 3: Hypotese tests for én gruppe/stikprøve 6 enote 3: Statistik for to grupper/stikprøver 7 enote 4: Statistik ved simulation 8 enote 5: Simpel lineær regressions analyse 9 enote 6: Multipel lineær regressions analyse 10 enote 8: Envejs variansanalyse (envejs ANOVA) 11 enote 8: Tovejs variansanalyse (ANOVA) 12 enote 7: Inferens for andele Klaus KA og Per BB (klaus@cancer.dk) Introduktion til statistik, Forelæsning 13 Efteråret / 39

22 enote 8: Envejs variansanalyse (envejs ANOVA) enote 8: Envejs variansanalyse (envejs ANOVA) Engelsk k UAFHÆNGIGE grupper Specifikke metoder, envejs variansanalyse: Test der sammenligner middelværdien af grupperne ANOVA-tabel: SST = SS(T r) + SSE F -test Post hoc test(s): parvise t-test med/uden Bonferroni korrektion Klaus KA og Per BB (klaus@cancer.dk) Introduktion til statistik, Forelæsning 13 Efteråret / 39

23 enote 8: Tovejs variansanalyse (ANOVA) Overview 1 enote 1: Simple plots og deskriptive statistik 2 enote2: Diskrete fordelinger 3 enote 2: Kontinuerte fordelinger 4 enote 3: Konfidensintervaller for én gruppe/stikprøve 5 enote 3: Hypotese tests for én gruppe/stikprøve 6 enote 3: Statistik for to grupper/stikprøver 7 enote 4: Statistik ved simulation 8 enote 5: Simpel lineær regressions analyse 9 enote 6: Multipel lineær regressions analyse 10 enote 8: Envejs variansanalyse (envejs ANOVA) 11 enote 8: Tovejs variansanalyse (ANOVA) 12 enote 7: Inferens for andele Klaus KA og Per BB (klaus@cancer.dk) Introduktion til statistik, Forelæsning 13 Efteråret / 39

24 enote 8: Tovejs variansanalyse (ANOVA) enote 8: Tovejs variansanalyse (tovejs ANOVA) Engelsk Blokdesign giver to faktorer ANOVA-tabel: SST = SS(T r) + SS(Bl) + SSE F -test SST, SS(T r) og SS(Bl) beregnes som ved envejs ANOVA SSE = SST SS(T r) SS(Bl) Post hoc test: parvise t-test med/uden Bonferroni korrektion Klaus KA og Per BB (klaus@cancer.dk) Introduktion til statistik, Forelæsning 13 Efteråret / 39

25 enote 7: Inferens for andele Overview 1 enote 1: Simple plots og deskriptive statistik 2 enote2: Diskrete fordelinger 3 enote 2: Kontinuerte fordelinger 4 enote 3: Konfidensintervaller for én gruppe/stikprøve 5 enote 3: Hypotese tests for én gruppe/stikprøve 6 enote 3: Statistik for to grupper/stikprøver 7 enote 4: Statistik ved simulation 8 enote 5: Simpel lineær regressions analyse 9 enote 6: Multipel lineær regressions analyse 10 enote 8: Envejs variansanalyse (envejs ANOVA) 11 enote 8: Tovejs variansanalyse (ANOVA) 12 enote 7: Inferens for andele Klaus KA og Per BB (klaus@cancer.dk) Introduktion til statistik, Forelæsning 13 Efteråret / 39

26 enote 7: Inferens for andele enote 7: Inferens for andele Specifikke metoder, én, to og k > 2 grupper Binær/kategorisk respons Estimation og konfidensintervaller for andele Metoder til store stikprøver vs. til små stikprøver Engelsk Hypoteser for én andel Hypoteser for to andele Analyse af antalstabeller (χ 2 -test) (Alle forventede antal > 5) Klaus KA og Per BB (klaus@cancer.dk) Introduktion til statistik, Forelæsning 13 Efteråret / 39

27 enote 7: Inferens for andele Overview 1 enote 1: Simple plots og deskriptive statistik 2 enote2: Diskrete fordelinger 3 enote 2: Kontinuerte fordelinger 4 enote 3: Konfidensintervaller for én gruppe/stikprøve 5 enote 3: Hypotese tests for én gruppe/stikprøve 6 enote 3: Statistik for to grupper/stikprøver 7 enote 4: Statistik ved simulation 8 enote 5: Simpel lineær regressions analyse 9 enote 6: Multipel lineær regressions analyse 10 enote 8: Envejs variansanalyse (envejs ANOVA) 11 enote 8: Tovejs variansanalyse (ANOVA) 12 enote 7: Inferens for andele Klaus KA og Per BB (klaus@cancer.dk) Introduktion til statistik, Forelæsning 13 Efteråret / 39

28 enote 1: Simple Graphics and Summary Statistics enote 1: Simple Graphics and Summary Statistics Look at data as it is! (descriptive statistics) Dansk Summary Statistics Sample mean: x Sample standard deviation: s Sample variance: s 2 Median, upper- and lower quartiles Sample correlation Simple graphics Scatter plot (xy plot) Histogram (empirical density) Cumulative distribution (empirical distribution) Boxplots, Bar charts, Pie charts Klaus KA og Per BB (klaus@cancer.dk) Introduktion til statistik, Forelæsning 13 Efteråret / 39

29 enote 2: Discrete Distributions enote 2: Discrete Distributions Dansk General concepts: Random variable (Outcome of yet not carried out experiment) Density function: f(x) = P (X = x) (pdf) Distribution function: F (x) = P (X x) (cdf) Mean: µ = E(X) Standard deviation: σ Variance: σ 2 Specific distributions: The binomial distribution (Dice roll) The hypergeometric distribution (Draw without replacement) The Poisson distribution (Number of events in interval) Klaus KA og Per BB (klaus@cancer.dk) Introduktion til statistik, Forelæsning 13 Efteråret / 39

30 enote 2: Continuous Distributions enote 2: Continuous Distributions General concepts: Density function: f(x) (pdf) Distribution: F (x) = P (X x) (cdf) Mean (µ) and variance (σ 2 ) Calculation rules for random variables Specific distributions: Normal Log-Normal Uniform Exponential t χ 2 F Dansk Klaus KA og Per BB (klaus@cancer.dk) Introduktion til statistik, Forelæsning 13 Efteråret / 39

31 enote 3: One sample confidence intervals enote 3: One sample confidence intervals General concepts Estimation Significance level α Confidence intervals (Catches true value 1 α times) Population and a random sample Sampling distributions (t and χ 2 ) Central Limit Theorem Dansk Specific methods, one sample: Confidence intervals for the mean (t-distribution) and variance (χ 2 distribution) Design of experiments: calculating the sample size n for wanted precision Klaus KA og Per BB (klaus@cancer.dk) Introduktion til statistik, Forelæsning 13 Efteråret / 39

32 enote 3: One sample hypothesis testing enote 3: One sample hypothesis testing General concepts: Dansk Hypotheses p-value (Probability for observing the test value or more extreme, if H 0 is true, e.g. P (T > t obs )) Type I error: (No effect in reality, but H 0 is rejected) P (Type I) = α Type II error: (In reality an effect, but H 0 is not rejected) P (Type II) = β Power of a test is β Specific methods, one sample: t-test for mean difference Sample size for wanted power Normal qq-plot Klaus KA og Per BB (klaus@cancer.dk) Introduktion til statistik, Forelæsning 13 Efteråret / 39

33 enote 3: Two Sample statistics enote 3: Two Samples Dansk Specific methods, two samples: Test and confidence interval for the mean difference (t-test) Planning: calculating the sample size for wanted power Specific methods, two PAIRED samples: "Take difference" "One sample" Klaus KA og Per BB Introduktion til statistik, Forelæsning 13 Efteråret / 39

34 enote 4: Statistics by simulation enote 4, Statistics by simulation Introduction to simulation (Calculate the statistic many times) Dansk Error propagation rules (e.g. through a non-linear function) Bootstrapping: Parametric (Simulate many outcomes of random var.) Non-parametric (Draw values directly from data) Confidence intervals (and hence also hypothesis testing) Specific situations: (4 versions of confidence intervals) One-sample and Two-sample data Parametric vs. non-parametric Klaus KA og Per BB (klaus@cancer.dk) Introduktion til statistik, Forelæsning 13 Efteråret / 39

35 enote 5: Simple linear Regression Analysis enote 5: Simple linear Regression Analysis Two quantitative variables: x and y Dansk Calculating least squares line Inferences for a simple linear regression model Statistical model: y i = β 0 + β 1 x i + ε i Interval estimation and test for β 0 and β 1. Confidence interval for the line (95% times the line will be inside) Prediction interval for punkter (95% times new points will be inside) ρ, R og R 2 ρ is the correlation (= sign R R) describes the strength of linear relation between x and y R 2 is the fraction of the total variation explained by the model If H 0 : β 1 = 0 is rejected, then H 0 : ρ = 0 is also rejected Klaus KA og Per BB (klaus@cancer.dk) Introduktion til statistik, Forelæsning 13 Efteråret / 39

36 enote 6: Multiple linear Regression Analysis enote 6: Multiple linear Regression Analysis Many quantitative variables: y, x 1, x 2,... Dansk (y is the dependent/response var. and x s are explanatory/independent var.) Calculating least squares plane (A plane since there are >2 dimensions) Inferences for a the multiple linear regression model Statistical model: y i = β 0 + β 1 x 1,i + β 2 x 2,i ε i Confidence interval estimation and test for the β s Confidence interval for the expected fit (fitted line) Prediction interval for new points R 2 expresses the proportion of the total variation explained by the linear fit Klaus KA og Per BB (klaus@cancer.dk) Introduktion til statistik, Forelæsning 13 Efteråret / 39

37 enote 8: One-way Analysis of Variance enote 8: One-way Analysis of Variance Dansk Specific methods, k INDEPENDENT samples One-way analysis of variance Test for comparing the means of the groups ANOVA-table: SST = SS(T r) + SSE F -test Post hoc test: pairwise t-test with/without Bonferroni correction Klaus KA og Per BB (klaus@cancer.dk) Introduktion til statistik, Forelæsning 13 Efteråret / 39

38 enote 8: Two-way Analysis of Variance enote 8: Two-way Analysis of Variance Dansk Block design - two-way analysis of variance ANOVA-tabel: SST = SS(T r) + SS(Bl) + SSE F -test. SST, SS(T r) and SS(Bl) calculated as one-way ANOVA SSE = SST SS(T r) SS(Bl) Post hoc test: pairwise t-test with/without Bonferroni correction Klaus KA og Per BB (klaus@cancer.dk) Introduktion til statistik, Forelæsning 13 Efteråret / 39

39 enote 7: Inferences for Proportions enote 7: Inferences for Proportions Specific methods, one, two and k > 2 samples Binary/categorical response Estimation and confidence interval of proportions Large sample vs. small sample methods Hypotheses for one proportion Hypotheses for two proportions Dansk Analysis of contingency tables (χ 2 -test) (All expected > 5) Klaus KA og Per BB (klaus@cancer.dk) Introduktion til statistik, Forelæsning 13 Efteråret / 39

1 enote 1: Simple plots og deskriptive statistik. 2 enote2: Diskrete fordelinger. 3 enote 2: Kontinuerte fordelinger

1 enote 1: Simple plots og deskriptive statistik. 2 enote2: Diskrete fordelinger. 3 enote 2: Kontinuerte fordelinger Kursus 02402/02323 Introduktion til statistik Forelæsning 13: Et overblik over kursets indhold Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Building 324, Room 220 Danish Technical University

Læs mere

1 enote 1: Simple plots og deskriptive statistik. 2 enote 2: Diskrete fordelinger. 3 enote 2: Kontinuerte fordelinger

1 enote 1: Simple plots og deskriptive statistik. 2 enote 2: Diskrete fordelinger. 3 enote 2: Kontinuerte fordelinger Kursus 02402/02323 Introduktion til statistik Forelæsning 13: Et overblik over kursets indhold Peder Bacher DTU Compute, Dynamiske Systemer Building 303B, Room 017 Danish Technical University 2800 Lyngby

Læs mere

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 13: Summary Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Kursus 02323: Introducerende Statistik. Forelæsning 12: Forsøgsplanlægning. Peder Bacher

Kursus 02323: Introducerende Statistik. Forelæsning 12: Forsøgsplanlægning. Peder Bacher Kursus 02323: Introducerende Statistik Forelæsning 12: Forsøgsplanlægning Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk

Læs mere

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse

Læs mere

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Kursus 02402 Introduktion til Statistik Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske

Læs mere

Forelæsning 11: Kapitel 11: Regressionsanalyse

Forelæsning 11: Kapitel 11: Regressionsanalyse Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Oversigt. Course 02402/02323 Introducerende Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger

Oversigt. Course 02402/02323 Introducerende Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger Course 02402/02323 Introducerende Statistik Forelæsning 2: Stokastisk variabel og diskrete fordelinger Klaus K. Andersen og Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Danmarks Tekniske Universitet

Læs mere

Forelæsning 11: Envejs variansanalyse, ANOVA

Forelæsning 11: Envejs variansanalyse, ANOVA Kursus 02323: Introduktion til Statistik Forelæsning 11: Envejs variansanalyse, ANOVA Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark

Læs mere

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk

Læs mere

Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger. Peder Bacher

Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger. Peder Bacher Introduktion til Statistik Forelæsning 2: Stokastisk variabel og diskrete fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark

Læs mere

Løsning til eksaminen d. 29. maj 2009

Løsning til eksaminen d. 29. maj 2009 DTU Informatik 02402 Introduktion til Statistik 20-2-01 LFF/lff Løsning til eksaminen d. 29. maj 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

k UAFHÆNGIGE grupper Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen 4 Hypotesetest (F-test)

k UAFHÆNGIGE grupper Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen 4 Hypotesetest (F-test) Kursus 02323: Introduktion til Statistik Forelæsning 11: Envejs variansanalse, ANOVA Peder Bacher DTU Compute, Dnamiske Sstemer Bgning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lngb Danmark e-mail:

Læs mere

Forelæsning 2: Kapitel 4, Diskrete fordelinger

Forelæsning 2: Kapitel 4, Diskrete fordelinger Kursus 02402 Introduktion til Statistik Forelæsning 2: Kapitel 4, Diskrete fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 2: Kapitel 4, Diskrete fordelinger. Per Bruun Brockhoff. Stokastiske Variable

Oversigt. Kursus Introduktion til Statistik. Forelæsning 2: Kapitel 4, Diskrete fordelinger. Per Bruun Brockhoff. Stokastiske Variable Kursus 02402 Introduktion til Statistik Forelæsning 2: Kapitel 4, Diskrete fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Introduktion til Statistik. Forelæsning 12: Inferens for andele. Peder Bacher

Introduktion til Statistik. Forelæsning 12: Inferens for andele. Peder Bacher Introduktion til Statistik Forelæsning 12: Inferens for andele Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk Efterår

Læs mere

Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger. Peder Bacher

Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger. Peder Bacher Introduktion til Statistik Forelæsning 2: Stokastisk variabel og diskrete fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark

Læs mere

enote 2: Kontinuerte fordelinger Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher enote 2: Continuous Distributions

enote 2: Kontinuerte fordelinger Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher enote 2: Continuous Distributions Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 33B, Rum 9 Danmarks Tekniske Universitet 28 Lyngby Danmark e-mail: pbac@dtu.dk Efterår

Læs mere

Oversigt. 1 Motiverende eksempel: Højde-vægt. 2 Lineær regressionsmodel. 3 Mindste kvadraters metode (least squares)

Oversigt. 1 Motiverende eksempel: Højde-vægt. 2 Lineær regressionsmodel. 3 Mindste kvadraters metode (least squares) Kursus 02402/02323 Introducerende Statistik Forelæsning 8: Simpel lineær regression Oversigt Motiverende eksempel: Højde-vægt 2 Lineær regressionsmodel 3 Mindste kvadraters metode (least squares) Klaus

Læs mere

Kursus 02402/02323 Introducerende Statistik

Kursus 02402/02323 Introducerende Statistik Kursus 02402/02323 Introducerende Statistik Forelæsning 8: Simpel lineær regression Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark

Læs mere

Introduktion til Statistik. Forelæsning 10: Inferens for andele. Peder Bacher

Introduktion til Statistik. Forelæsning 10: Inferens for andele. Peder Bacher Introduktion til Statistik Forelæsning 10: Inferens for andele Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk Efterår

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Kursus 02402 Introduktion til Statistik Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff.

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff. Kursus 242 Introduktion til Statistik Forelæsning 3: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik Bygning 35/324 Danmarks Tekniske Universitet 28 Lyngby Danmark e-mail:

Læs mere

Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff

Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 12: Variansanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Løsning til eksaminen d. 14. december 2009

Løsning til eksaminen d. 14. december 2009 DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,

Læs mere

Løsning eksamen d. 15. december 2008

Løsning eksamen d. 15. december 2008 Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff. Envejs variansanalyse - eksempel

Oversigt. Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff. Envejs variansanalyse - eksempel Kursus 02402 Introduktion til Statistik Forelæsning 12: Variansanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Forelæsning 4: Konfidensinterval for middelværdi (og spredning)

Forelæsning 4: Konfidensinterval for middelværdi (og spredning) Introduktion til Statistik Forelæsning 4: Konfidensinterval for middelværdi (og spredning) Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark

Læs mere

enote 5: Simpel lineær regressions analyse Kursus 02402/02323 Introducerende Statistik Oversigt

enote 5: Simpel lineær regressions analyse Kursus 02402/02323 Introducerende Statistik Oversigt enote 5: Simpel lineær regressions analse Kursus 02402/02323 Introducerende Statistik Forelæsning 8: Simpel lineær regression To variable: og Beregn mindstekvadraters estimat af ret linje Inferens med

Læs mere

Oversigt. Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger

Oversigt. Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger Introduktion til Statistik Forelæsning 2: og diskrete fordelinger Oversigt 1 2 3 Fordelingsfunktion 4 Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 017 Danmarks Tekniske Universitet 2800

Læs mere

Forelæsning 11: Tovejs variansanalyse, ANOVA

Forelæsning 11: Tovejs variansanalyse, ANOVA Introduktion til Statistik Forelæsning 11: Tovejs variansanalyse, ANOVA Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk

Læs mere

Kursus 02323: Introducerende Statistik. Forelæsning 8: Simpel lineær regression. Peder Bacher

Kursus 02323: Introducerende Statistik. Forelæsning 8: Simpel lineær regression. Peder Bacher Kursus 02323: Introducerende Statistik Forelæsning 8: Simpel lineær regression Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik Bygning 305/324 Danmarks Tekniske Universitet

Læs mere

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering Eksamen 2016 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 17-02-2015 Tid: kl. 09.00-11.00 Bedømmelsesform

Læs mere

Statistik for MPH: oktober Attributable risk, bestemmelse af stikprøvestørrelse (Silva: , )

Statistik for MPH: oktober Attributable risk, bestemmelse af stikprøvestørrelse (Silva: , ) Statistik for MPH: 7 29. oktober 2015 www.biostat.ku.dk/~pka/mph15 Attributable risk, bestemmelse af stikprøvestørrelse (Silva: 333-365, 381-383) Per Kragh Andersen 1 Fra den 6. uges statistikundervisning:

Læs mere

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j Hypoteser om mere end to stikprøver ANOVA k stikprøver: (ikke ordinale eller højere) H 0 : 1 2... k gælder også for k 2! H 0ij : i j H 0ij : i j simpelt forslag: k k 1 2 t-tests: i j DUER IKKE! Bonferroni!!

Læs mere

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Anvendt Statistik Lektion 8. Multipel Lineær Regression Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke

Læs mere

Oversigt. 1 Motiverende eksempel - energiforbrug. 2 Hypotesetest (Repetition) 3 Two-sample t-test og p-værdi. 4 Konfidensinterval for forskellen

Oversigt. 1 Motiverende eksempel - energiforbrug. 2 Hypotesetest (Repetition) 3 Two-sample t-test og p-værdi. 4 Konfidensinterval for forskellen Kursus 02402/02323 Introducerende Statistik Forelæsning 6: Sammenligning af to grupper Oversigt 1 Motiverende eksempel - energiforbrug 2 Hypotesetest (Repetition) 3 Klaus K. Andersen og Per Bruun Brockhoff

Læs mere

Statistik for MPH: 7

Statistik for MPH: 7 Statistik for MPH: 7 3. november 2011 www.biostat.ku.dk/~pka/mph11 Attributable risk, bestemmelse af stikprøvestørrelse (Silva: 333-365, 381-383) Per Kragh Andersen 1 Fra den 6. uges statistikundervisning:

Læs mere

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Anvendt Statistik Lektion 7. Simpel Lineær Regression Anvendt Statistik Lektion 7 Simpel Lineær Regression 1 Er der en sammenhæng? Plot af mordraten () mod fattigdomsraten (): Scatterplot Afhænger mordraten af fattigdomsraten? 2 Scatterplot Et scatterplot

Læs mere

Oversigt. 1 Intro: Regneeksempel og TV-data fra B&O. 2 Model og hypotese. 3 Beregning - variationsopspaltning og ANOVA tabellen

Oversigt. 1 Intro: Regneeksempel og TV-data fra B&O. 2 Model og hypotese. 3 Beregning - variationsopspaltning og ANOVA tabellen Kursus 02402/02323 Introducerende Statistik Forelæsning 10: Envejs variansanalyse, ANOVA Oversigt 1 Intro: Regneeksempel og TV-data fra B&O 2 Model og hypotese Per Bruun Brockhoff DTU Compute, Statistik

Læs mere

Kursus 02402/02323 Introducerende Statistik. Forelæsning 6: Sammenligning af to grupper

Kursus 02402/02323 Introducerende Statistik. Forelæsning 6: Sammenligning af to grupper Kursus 02402/02323 Introducerende Statistik Forelæsning 6: Sammenligning af to grupper Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark

Læs mere

Oversigt. Kursus 02402 Introduktion til Statistik. Forelæsning 4: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff. Eksponential fordelingen

Oversigt. Kursus 02402 Introduktion til Statistik. Forelæsning 4: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff. Eksponential fordelingen Kursus 02402 Introduktion til Statistik Forelæsning 4: Kapitel 5: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik Bygning 305/324 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Kursus 02402/02323 Introducerende Statistik. Forelæsning 7: Simuleringsbaseret statistik

Kursus 02402/02323 Introducerende Statistik. Forelæsning 7: Simuleringsbaseret statistik Kursus 02402/02323 Introducerende Statistik Forelæsning 7: Simuleringsbaseret statistik Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark

Læs mere

Konfidensintervaller og Hypotesetest

Konfidensintervaller og Hypotesetest Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller

Læs mere

Oversigt. Kursus 02402/02323 Introducerende Statistik. Forelæsning 7: Simuleringsbaseret statistik. Klaus K. Andersen og Per Bruun Brockhoff

Oversigt. Kursus 02402/02323 Introducerende Statistik. Forelæsning 7: Simuleringsbaseret statistik. Klaus K. Andersen og Per Bruun Brockhoff Kursus 02402/02323 Introducerende Statistik Forelæsning 7: Simuleringsbaseret statistik Klaus K. Andersen og Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Danmarks Tekniske Universitet 2800

Læs mere

Forelæsning 10: Statistik ved hjælp af simulering

Forelæsning 10: Statistik ved hjælp af simulering Kursus 02402 Introduktion til Statistik Forelæsning 10: Statistik ved hjælp af simulering Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Ikke-parametriske tests

Ikke-parametriske tests Ikke-parametriske tests 2 Dagens menu t testen Hvordan var det nu lige det var? Wilcoxson Mann Whitney U Kruskall Wallis Friedman Kendalls og Spearmans correlation 3 t-testen Patient Drug Placebo difference

Læs mere

Introduktion til Statistik. Forelæsning 5: Hypotesetest, power og modelkontrol - one sample. Peder Bacher

Introduktion til Statistik. Forelæsning 5: Hypotesetest, power og modelkontrol - one sample. Peder Bacher Introduktion til Statistik Forelæsning 5: Hypotesetest, power og modelkontrol - one sample Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark

Læs mere

Oversigt. Course 02402/02323 Introducerende Statistik. Forelæsning 3: Kontinuerte fordelinger. Per Bruun Brockhoff

Oversigt. Course 02402/02323 Introducerende Statistik. Forelæsning 3: Kontinuerte fordelinger. Per Bruun Brockhoff Course 242/2323 Introducerende Statistik Forelæsning 3: Kontinuerte fordelinger Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 22 Danmarks Tekniske Universitet 28 Lyngby Danmark

Læs mere

Kapitel 4: Statistik ved simulering. Kursus 02323: Introducerende Statistik. Forelæsning 7: Simuleringsbaseret statistik.

Kapitel 4: Statistik ved simulering. Kursus 02323: Introducerende Statistik. Forelæsning 7: Simuleringsbaseret statistik. Kursus 02323: Introducerende Statistik Forelæsning 7: Simuleringsbaseret statistik Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større

Læs mere

k UAFHÆNGIGE grupper F-test Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen

k UAFHÆNGIGE grupper F-test Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen Introduktion til Statistik Forelæsning 10: Envejs variansanalyse, ANOVA Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 017 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk

Læs mere

Multipel Lineær Regression

Multipel Lineær Regression Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Basic statistics for experimental medical researchers

Basic statistics for experimental medical researchers Basic statistics for experimental medical researchers Sample size calculations September 15th 2016 Christian Pipper Department of public health (IFSV) Faculty of Health and Medicinal Science (SUND) E-mail:

Læs mere

Hvorfor er det lige at vi skal lære det her?

Hvorfor er det lige at vi skal lære det her? Lektion 8 Stokastiske variable En stokastisk variabel er en afbildning af udfaldsrummet ind i de reelle tal. Man benytter ofte store bogstaver som X, Y og Z til at betegne en stokastisk variabel. Ved at

Læs mere

En Introduktion til SAS. Kapitel 5.

En Introduktion til SAS. Kapitel 5. En Introduktion til SAS. Kapitel 5. Inge Henningsen Afdeling for Statistik og Operationsanalyse Københavns Universitet Marts 2005 6. udgave Kapitel 5 T-test og PROC UNIVARIATE 5.1 Indledning Dette kapitel

Læs mere

Oversigt. 1 Intro: Regneeksempel og TV-data fra B&O. 2 Model. 3 Beregning - variationsopspaltning og ANOVA tabellen. 4 Hypotesetest (F-test)

Oversigt. 1 Intro: Regneeksempel og TV-data fra B&O. 2 Model. 3 Beregning - variationsopspaltning og ANOVA tabellen. 4 Hypotesetest (F-test) Kursus 02402/02323 Introducerende Statistik Forelæsning 11: Tovejs variansanalyse, ANOVA Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

Læs mere

Besvarelse af vitcap -opgaven

Besvarelse af vitcap -opgaven Besvarelse af -opgaven Spørgsmål 1 Indlæs data Dette gøres fra Analyst med File/Open, som sædvanlig. Spørgsmål 2 Beskriv fordelingen af vital capacity og i de 3 grupper ved hjælp af summary statistics.

Læs mere

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/ Program: 1. Repetition af vigtige sandsynlighedsfordelinger: binomial, (Poisson,) normal (og χ 2 ). 2. Populationer og stikprøver 3. Opsummering af data vha. deskriptive størrelser og grafer. 1/29 Binomial

Læs mere

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke. Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke. 1/23 Opsummering af fordelinger X 1. Kendt σ: Z = X µ σ/ n N(0,1)

Læs mere

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ Indhold 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) 2 1.1 Variation indenfor og mellem grupper.......................... 2 1.2 F-test for ingen

Læs mere

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven. PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve

Læs mere

Normalfordelingen og Stikprøvefordelinger

Normalfordelingen og Stikprøvefordelinger Normalfordelingen og Stikprøvefordelinger Normalfordelingen Standard Normal Fordelingen Sandsynligheder for Normalfordelingen Transformation af Normalfordelte Stok.Var. Stikprøver og Stikprøvefordelinger

Læs mere

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller Type I og type II fejl Type I fejl: forkast når hypotese sand. α = signifikansniveau= P(type I fejl) Program (8.15-10): Hvis vi forkaster når Z < 2.58 eller Z > 2.58 er α = P(Z < 2.58) + P(Z > 2.58) =

Læs mere

Forelæsning 9: Inferens for andele (kapitel 10)

Forelæsning 9: Inferens for andele (kapitel 10) Kursus 02402 Introduktion til Statistik Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Generelle lineære modeller

Generelle lineære modeller Generelle lineære modeller Regressionsmodeller med én uafhængig intervalskala variabel: Y en eller flere uafhængige variable: X 1,..,X k Den betingede fordeling af Y givet X 1,..,X k antages at være normal

Læs mere

Forelæsning 1: Intro og beskrivende statistik

Forelæsning 1: Intro og beskrivende statistik Kursus 02402 Introduktion til Statistik Forelæsning 1: Intro og beskrivende statistik Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 4: Kapitel 5: Kontinuerte fordelinger

Oversigt. Kursus Introduktion til Statistik. Forelæsning 4: Kapitel 5: Kontinuerte fordelinger Kursus 02402 Introduktion til Statistik Forelæsning 4: Kapitel 5: Kontinuerte fordelinger Rune Haubo B Christensen (based on slides by Per Bruun Brockhoff) DTU Compute, Statistik og Dataanalyse Bygning

Læs mere

Muligheder: NB: test for µ 1 = µ 2 i model med blocking ækvivalent med parret t-test! Ide: anskue β j som stikprøve fra normalfordeling.

Muligheder: NB: test for µ 1 = µ 2 i model med blocking ækvivalent med parret t-test! Ide: anskue β j som stikprøve fra normalfordeling. Eksempel: dæktyper og brændstofforbrug (opgave 25 side 319) Program: cars 1 2 3 4 5... radial 4.2 4.7 6.6 7.0 6.7... belt 4.1 4.9 6.2 6.9 6.8... Muligheder: 1. vi starter med at gennemgå opgave 7 side

Læs mere

Skriftlig eksamen Science statistik- ST501

Skriftlig eksamen Science statistik- ST501 SYDDANSK UNIVERSITET INSTITUT FOR MATEMATIK OG DATALOGI Skriftlig eksamen Science statistik- ST501 Torsdag den 21. januar Opgavesættet består af 5 opgaver, med i alt 13 delspørgsmål, som vægtes ligeligt.

Læs mere

Vejledende studieplan for kvantitativ metode og statistik FYS 514 Modul 14 efteråret 2017

Vejledende studieplan for kvantitativ metode og statistik FYS 514 Modul 14 efteråret 2017 Vejledende studieplan for kvantitativ metode og statistik FYS 514 Modul 14 efteråret 2017 Generelle kommentarer. Undervisningen følger lærebogen og det må kraftigt anbefales at anskaffe denne. Bogen koster

Læs mere

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17 nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse

Læs mere

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

Tema. Dagens tema: Indfør centrale statistiske begreber.

Tema. Dagens tema: Indfør centrale statistiske begreber. Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i

Læs mere

Side 1 af 17 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 25. maj 2007 Kursus navn og nr: Introduktion til Statistik, 02402

Side 1 af 17 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 25. maj 2007 Kursus navn og nr: Introduktion til Statistik, 02402 Danmarks Tekniske Universitet Side 1 af 17 sider. Skriftlig prøve: 25. maj 2007 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (navn) (underskrift)

Læs mere

Oversigt. Kursus 02402 Introduktion til Statistik. Forelæsning 1: Intro og beskrivende statistik. Per Bruun Brockhoff. Praktisk Information

Oversigt. Kursus 02402 Introduktion til Statistik. Forelæsning 1: Intro og beskrivende statistik. Per Bruun Brockhoff. Praktisk Information Kursus 02402 Forelæsning 1: Intro og beskrivende statistik Oversigt 1 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1 Matematisk Modellering 1 Side 1 I nærværende opgavesæt er der 16 spørgsmål fordelt på 4 opgaver. Ved bedømmelsen af besvarelsen vægtes alle spørgsmål lige. Endvidere lægges der vægt på, at det af besvarelsen

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 18 sider. Skriftlig prøve: 14. december 2009 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning 1 Multipel regressions model Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning PSE (I17) ASTA - 11. lektion

Læs mere

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer.

1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer. Vejledende besvarelse af hjemmeopgave Basal statistik, efterår 2008 En gruppe bestående af 45 patienter med reumatoid arthrit randomiseres til en af 6 mulige behandlinger, nemlig placebo, aspirin eller

Læs mere

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test Statistik Lektion 0 Ikkeparametriske metoder Repetition KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

Økonometri Lektion 1 Simpel Lineær Regression 1/31

Økonometri Lektion 1 Simpel Lineær Regression 1/31 Økonometri Lektion 1 Simpel Lineær Regression 1/31 Simpel Lineær Regression Mål: Forklare variablen y vha. variablen x. Fx forklare Salg (y) vha. Reklamebudget (x). Statistisk model: Vi antager at sammenhængen

Læs mere

1 Hb SS Hb Sβ Hb SC = , (s = )

1 Hb SS Hb Sβ Hb SC = , (s = ) PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.

Læs mere

Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable

Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable Normal fordelingen Normal fordelingen Egenskaber ved normalfordelingen Standard normal fordelingen Find sandsynligheder ud fra tabel Transformation af normal fordelte variable Invers transformation Repetition

Læs mere

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge Statistik og Sandsynlighedsregning 2 Repetition og eksamen Overheads til forelæsninger, mandag 7. uge 1 Normalfordelingen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange

Læs mere

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test Ikkeparametriske metoder Repetition Wilcoxon SignedRank Test KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

Forsøgsplanlægning Stikprøvestørrelse

Forsøgsplanlægning Stikprøvestørrelse Basal statistik Esben Budtz-Jørgensen 6. november 2007 Forsøgsplanlægning Stikprøvestørrelse 1 41 Planlægning af et studie Videnskabelig hypotese Endpoints Instrumentelle/eksponerings variable Variationskilder

Læs mere

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05 Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t.

t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t. t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program (8.15-10): 1. repetition: fordeling af observatorer X, S 2 og t. 2. konfidens-intervaller, hypotese test, type I og type II fejl, styrke,

Læs mere

Indhold. 2 Tosidet variansanalyse Additive virkninger Vekselvirkning... 9

Indhold. 2 Tosidet variansanalyse Additive virkninger Vekselvirkning... 9 Indhold 1 Ensidet variansanalyse 2 1.1 Estimation af middelværdier............................... 3 1.2 Estimation af standardafvigelse............................. 3 1.3 F-test for ens middelværdier...............................

Læs mere

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Stikprøver og stikprøve fordelinger Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Statistik Statistisk Inferens: Prediktere og forekaste værdier af

Læs mere

Økonometri lektion 5 Multipel Lineær Regression. Inferens Modelkontrol Prædiktion

Økonometri lektion 5 Multipel Lineær Regression. Inferens Modelkontrol Prædiktion Økonometri lektion 5 Multipel Lineær Regression Inferens Modelkontrol Prædiktion Multipel Lineær Regression Data: Sæt af oservationer (x i, x i,, x ki, y i, i,,n y i er den afhængige variael x i, x i,,

Læs mere

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18 Program 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18 Fordeling af X Stikprøve X 1,X 2,...,X n stokastisk X stokastisk. Ex (normalfordelt stikprøve)

Læs mere

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Lineær regression. Simpel regression. Model. ofte bruges følgende notation: Lineær regression Simpel regression Model Y i X i i ofte bruges følgende notation: Y i 0 1 X 1i i n i 1 i 0 Findes der en linie, der passer bedst? Metode - Generel! least squares (mindste kvadrater) til

Læs mere

1 Sandsynlighed Sandsynlighedsbegrebet Definitioner Diskret fordeling Betinget sandsynlighed og uafhængighed...

1 Sandsynlighed Sandsynlighedsbegrebet Definitioner Diskret fordeling Betinget sandsynlighed og uafhængighed... Indhold 1 Sandsynlighed 1 1.1 Sandsynlighedsbegrebet................................. 1 1.2 Definitioner........................................ 2 1.3 Diskret fordeling.....................................

Læs mere