Kursus 02402/02323 Introducerende Statistik. Forelæsning 6: Sammenligning af to grupper

Størrelse: px
Starte visningen fra side:

Download "Kursus 02402/02323 Introducerende Statistik. Forelæsning 6: Sammenligning af to grupper"

Transkript

1 Kursus 02402/02323 Introducerende Statistik Forelæsning 6: Sammenligning af to grupper Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark Efterår 2016 DTU Compute Introduktion til Statistik Efterår / 53

2 enote 3: Statistik for to grupper/stikprøver Specifikke metoder, to grupper: Konfidensinterval for forskel i middelværdi Test for forskel i middelværdi (t-test) Forsøgsplanlægning: Beregn sample størrelsen for den ønskede styrke Specifikke metoder, to PARREDE grupper: Tag differencen for hver måling statistik for én gruppe DTU Compute Introduktion til Statistik Efterår / 53

3 enote 3: Two Samples Specific methods, two samples: Confidence interval for the mean difference Test for the mean difference (t-test) Planning: calculating the sample size for wanted power Specific methods, two PAIRED samples: Take difference One sample DTU Compute Introduktion til Statistik Efterår / 53

4 Oversigt 1 Motiverende eksempel - energiforbrug 2 Hypotesetest (Repetition) 3 Two-sample t-test og p-værdi 4 Konfidensinterval for forskellen 5 Overlappende konfidensintervaller? 6 Det parrede setup 7 Checking the normality assumptions 8 The pooled t-test - a possible alternative DTU Compute Introduktion til Statistik Efterår / 53

5 Motiverende eksempel - energiforbrug Motiverende eksempel - energiforbrug Forskel på energiforbrug? I et ernæringsstudie ønsker man at undersøge om der er en forskel i energiforbrug for forskellige typer (moderat fysisk krævende) arbejde. In the study, the energy usage of 9 nurses from hospital A and 9 (other) nurses from hospital B have been measured. The measurements are given in the following table in mega Joule (MJ). Stikprøve fra hver hospital n 1 = n 2 = 9: Hospital A Hospital B DTU Compute Introduktion til Statistik Efterår / 53

6 Motiverende eksempel - energiforbrug Eksempel - energiforbrug Hypotesen om ingen forskel ønskes undersøgt: H 0 : µ 1 = µ 2 Sample means og standard deviations: ˆµ 1 = x 1 = 8.293, (s 1 = 1.428) ˆµ 2 = x 2 = , (s 2 = 1.398) Er data i overenstemmelse med nulhyposen H 0? Data: x 2 x 1 = Nulhypotese: H 0 : µ 2 µ 1 = 0 NYT: p-værdi for forskel: p-værdi = (Beregnet under det scenarie, at H 0 er sand) NYT:Konfidensinterval for forskel: ± = [0.59; 3.42] DTU Compute Introduktion til Statistik Efterår / 53

7 Hypotesetest (Repetition) Definition af hypotesetest og signifikans (Repetition) Definition Hypotesetest: We say that we carry out a hypothesis test when we decide against a null hypothesis or not using the data. A null hypothesis is rejected if the p-value, calculated after the data has been observed, is less than some α, that is if the p-value < α, where α is some pre-specifed (so-called) significance level. And if not, then the null hypothesis is said to be accepted. Definition Statistisk signifikans: An effect is said to be (statistically) significant if the p-value is less than the significance level α. (OFTE bruges α = 0.05) DTU Compute Introduktion til Statistik Efterår / 53

8 Hypotesetest (Repetition) Metode Steps ved hypotesetests - et overblik (Repetition) Helt generelt består et hypotesetest af følgende trin: 1 Formulate the hypotheses and choose the level of significance α (choose the risk-level ) 2 Calculate, using the data, the value of the test statistic 3 Calculate the p-value using the test statistic and the relevant sampling distribution, and compare the p-value and the significance level α and make a conclusion 4 (Alternatively, make a conclusion based on the relevant critical value(s)) DTU Compute Introduktion til Statistik Efterår / 53

9 Hypotesetest (Repetition) Definition og fortolkning af p-værdien (Repetition) p-værdien udtrykker evidence imod nulhypotesen Tabel 3.1: p < Very strong evidence against H p < 0.01 Strong evidence against H p < 0.05 Some evidence against H p < 0.1 Weak evidence against H 0 p 0.1 Little or no evidence against H 0 Definition 3.21 af p-værdien: The p-value is the probability of obtaining a test statistic that is at least as extreme as the test statistic that was actually observed. This probability is calculated under the assumption that the null hypothesis is true. DTU Compute Introduktion til Statistik Efterår / 53

10 Two-sample t-test og p-værdi Metode 3.58: Two-sample t-test Beregning af teststørrelsen When considering the null hypothesis about the difference between the means of two independent samples: δ = µ 2 µ 1 the (Welch) two-sample t-test statistic is H 0 : δ = δ 0 t obs = ( x 1 x 2 ) δ 0 s 2 1 /n 1 + s 2 2 /n 2 DTU Compute Introduktion til Statistik Efterår / 53

11 Two-sample t-test og p-værdi Theorem 3.59: Fordelingen af (Welch) t-teststørrelsen Welch t-teststørrelsen er t-fordelt The (Welch) two-sample statistic seen as a random variable: T = ( X 1 X 2 ) δ 0 S1 2/n 1 + S2 2/n 2 approximately, under the null hypothesis, follows a t-distribution with ν degrees of freedom, where ( s 2 ) 2 1 n 1 + s2 2 n 2 ν =. (s 2 1 /n 1) 2 n (s2 2 /n 2) 2 n 2 1 if the two population distributions are normal or if the two sample sizes are large enough. DTU Compute Introduktion til Statistik Efterår / 53

12 Two-sample t-test og p-værdi Metode 3.60: Two-sample t-test Et level α test er 1 Compute t obs and ν as given above. 2 Compute the evidence against the null hypothesis a H 0 : µ 1 µ 2 = δ 0 vs. the alternative hypothesis H 1 : µ 1 µ 2 δ 0 by the p value = 2 P(T > t obs ) where the t-distribution with ν degrees of freedom is used. 3 If p value < α: We reject H 0, otherwise we accept H 0. 4 The rejection/acceptance conclusion could alternatively, but equivalently, be made based on the critical value(s) ±t 1 α/2 : If t obs > t 1 α/2 we reject H 0, otherwise we accept H 0. a We are often interested in the test where δ 0 = 0 DTU Compute Introduktion til Statistik Efterår / 53

13 Two-sample t-test og p-værdi Metode 3.61: Det ensidede two-sample t-test Et level α ensidet less test er 1 Compute t obs and ν as given above. 2 Compute the evidence against the null hypothesis H 0 : µ 1 µ 2 δ 0 vs. the alternative hypothesis H 1 : µ 1 µ 2 < δ 0 by the p value = P(T < t obs ) where the t-distribution with ν degrees of freedom is used. 3 If p value < α: We reject H 0, otherwise we accept H 0. 4 The rejection/acceptance conclusion could alternatively, but equivalently, be made based on the critical value t α : If t obs < t α we reject H 0, otherwise we accept H 0. DTU Compute Introduktion til Statistik Efterår / 53

14 Two-sample t-test og p-værdi Metode 3.62: Det ensidede two-sample t-test Et level α ensidet greater test er 1 Compute t obs and ν as given above. 2 Compute the evidence against the null hypothesis H 0 : µ 1 µ 2 δ 0 vs. the alternative hypothesis H 1 : µ 1 µ 2 > δ 0 by the p value = P(T > t obs ) where the t-distribution with ν degrees of freedom is used. 3 If p value < α: We reject H 0, otherwise we accept H 0. 4 The rejection/acceptance conclusion could alternatively, but equivalently, be made based on the critical value t 1 α : If t obs > t 1 α we reject H 0, otherwise we accept H 0. DTU Compute Introduktion til Statistik Efterår / 53

15 Two-sample t-test og p-værdi Spørgsmål til fordelingen af forskellen i stikprøvegennemsnit (socrative.com - ROOM:PBAC) Hvilken af pdf erne repræsenterer fordelingen af forskellen i stikprøvegennemsnit? X 2 X 1 pdf pdf A x B x under: H 0 : δ = 10 pdf C x (sample sizes n 1 = 7 and n 2 = 8) (sample std. dev. s 1 = 18 and s 2 = 24) pdf D x A B C eller D? Svar: A DTU Compute Introduktion til Statistik Efterår / 53

16 Two-sample t-test og p-værdi Spørgsmål til fordelingen af forskellen i stikprøvegennemsnit (socrative.com - ROOM:PBAC) Hvilken af pdf erne repræsenterer fordelingen af X 2 X 1 δ 0 pdf pdf A x B under: H 0 : δ = 10 pdf x C (sample sizes n 1 = 7 and n 2 = 8) (sample std. dev. s 1 = 18 and s 2 = 24) pdf x D x A B C eller D? Svar: C DTU Compute Introduktion til Statistik Efterår / 53

17 Two-sample t-test og p-værdi Spørgsmål til fordelingen af forskellen i stikprøvegennemsnit (socrative.com - ROOM:PBAC) Hvilken af pdf erne repræsenterer fordelingen af T = X 2 X 1 δ 0 s 2 1 /n 1 + s 2 2 /n 2 pdf pdf A x B x under: H 0 : δ = 10 pdf C x (sample sizes n 1 = 7 and n 2 = 8) (sample std. dev. s 1 = 18 and s 2 = 24) pdf D x A B C eller D? Svar: D DTU Compute Introduktion til Statistik Efterår / 53

18 Two-sample t-test og p-værdi Eksempel - energiforbrug Hypotesen om ingen forskel ønskes undersøgt: H 0 : δ = µ 2 µ 1 = 0 versus the non-directional(= two-sided) alternative: H 0 : δ = µ 2 µ 1 0 Først beregninger af t obs og ν: t obs = / /9 = 3.01 and ν = ( ) 2 9 (2.0394/9) (1.954/9)2 8 = DTU Compute Introduktion til Statistik Efterår / 53

19 Two-sample t-test og p-værdi Eksempel - energiforbrug Dernæst findes p-værdien: p value = 2 P(T > t obs ) = 2 P(T > 3.01) = = ## p-værdi for nulhypotese om ingen forskel mellem sygeplejeskers energiforbrug 1 - pt(3.01, df = 15.99) ## [1] DTU Compute Introduktion til Statistik Efterår / 53

20 Two-sample t-test og p-værdi Kristiske værdier og hypotesetest Acceptområdet er værdier for teststatistikken t obs som ligger indenfor de kritiske værdier: Acceptance Rejection Rejection t t Acceptområdet er værdier for teststatistikken t obs som ligger indenfor de kritiske værdier: DTU Compute Introduktion til Statistik Efterår / 53

21 Two-sample t-test og p-værdi Den standardiserede skala Hvis t obs er i acceptområdet, så accepteres H 0 Rejection Acceptance Rejection t t0.975 Den egentlige skala Hvis x ȳ er i acceptområdet, så accepteres H 0 δ0 sim1 Rejection s δ0 2 1 t0.975 n 2 1 Acceptance + s2 2 n 2 2 δ0 s δ t0.975 n 2 1 Rejection + s2 2 n 2 2 sim1 sim2 DTU Compute Introduktion til Statistik Efterår / 53

22 Konfidensinterval for forskellen Metode 3.69: Konfidensinterval for µ 1 µ 2 Konfidensintervallet for middelforskellen bliver: For two samples x 1,...,x n1 and y 1,...,y n2 the 100(1 α)% confidence interval for µ 1 µ 2 is given by s 2 1 x ȳ ± t 1 α/2 + s2 2 n 1 n 2 where t 1 α/2 is the 100(1 α/2)%-quantile from the t-distribution with ν degrees of freedom given from equation (3.26) (as above). DTU Compute Introduktion til Statistik Efterår / 53

23 Konfidensinterval for forskellen Den standardiserede skala Hvis t obs er i acceptområdet, så accepteres H 0 Rejection Acceptance Rejection t t0.975 Den egentlige skala Hvis x ȳ er i acceptområdet, så accepteres H 0 sim1 sim2 sim3 sim4 sim5 Rejection Rejection Rejection Rejection Rejection s δ0 2 1 t0.975 n 2 1 Acceptance Acceptance Acceptance Acceptance Acceptance + s2 2 n 2 2 δ0 Rejection Rejection s δ t0.975 n 2 1 Rejection Rejection Rejection + s2 2 n 2 2 Konfidensintervallet Nulhypoteser med x ȳ udenfor konfidensintervallet ville være blevet afvist δ sim1 DTU Compute Introduktion til Statistik Efterår / 53

24 Konfidensinterval for forskellen Eksempel - energiforbrug - det hele i R: Let us find the 95% confidence interval for µ 2 µ 1 : Since the relevant t-quantile is, using ν = 15.99, the confidence interval becomes: t = ± which then gives the result as also seen above: [0.59; 3.42] DTU Compute Introduktion til Statistik Efterår / 53

25 Konfidensinterval for forskellen Eksempel - energiforbrug - det hele i R: ################################ ## t-test for forskel i middelværdi på sygeplejeskers energiforbrug xa <- c(7.53, 7.48, 8.08, 8.09, 10.15, 8.4, 10.88, 6.13, 7.9) xb <- c(9.21, 11.51, 12.79, 11.85, 9.97, 8.79, 9.69, 9.68, 9.19) ## Default i t.test() er H_0: mu_1 = mu_2 (ingen forskel i middelværdi) t.test(xb, xa) ## ## Welch Two Sample t-test ## ## data: xb and xa ## t = 3, df = 20, p-value = ## alternative hypothesis: true difference in means is not equal to 0 ## 95 percent confidence interval: ## ## sample estimates: ## mean of x mean of y ## DTU Compute Introduktion til Statistik Efterår / 53

26 Konfidensinterval for forskellen I pausen: Installer Angry Birds (den originale) på jeres device (Android, Windows phone eller iphone) DTU Compute Introduktion til Statistik Efterår / 53

27 Overlappende konfidensintervaller? Eksempel - energiforbrug - Præsentation af resultat Barplot med error bars ses ofte Et grupperet barplot med nogle error bars - herunder er 95%-konfidensintervallerne for hver gruppe vist: A B DTU Compute Introduktion til Statistik Efterår / 53

28 Overlappende konfidensintervaller? Vær varsom med at bruge overlappende konfidensintervaller Remark Regel for brug af overlappende konfidensintervaller : When two CIs DO NOT overlap: The two groups are significantly different When two CIs DO overlap: We do not know what the conclusion is DTU Compute Introduktion til Statistik Efterår / 53

29 Det parrede setup Motiverende eksempel - sovemedicin Forskel på sovemedicin? I et studie er man interesseret i at sammenligne 2 sovemidler A og B. For 10 testpersoner har man fået følgende resultater, der er givet i forlænget søvntid (i timer) (Forskellen på effekten af de to midler er angivet): Stikprøve, n = 10: person A B D = B A DTU Compute Introduktion til Statistik Efterår / 53

30 Det parrede setup Parret setup og analyse: Brug one-sample analyse ## Det parrede setup: Tag forskellen og brug one-sample test x1 <- c(.7,-1.6,-.2,-1.2,-1,3.4,3.7,.8,0,2) x2 <- c(1.9,.8,1.1,.1,-.1,4.4,5.5,1.6,4.6,3.4) dif <- x2-x1 t.test(dif) ## ## One Sample t-test ## ## data: dif ## t = 5, df = 9, p-value = ## alternative hypothesis: true mean is not equal to 0 ## 95 percent confidence interval: ## ## sample estimates: ## mean of x ## 1.7 DTU Compute Introduktion til Statistik Efterår / 53

31 Det parrede setup Parret setup og analyse: Brug one-sample analyse ## Eller angiv at testen er parret med "paired=true" t.test(x2, x1, paired=true) ## ## Paired t-test ## ## data: x2 and x1 ## t = 5, df = 9, p-value = ## alternative hypothesis: true difference in means is not equal to 0 ## 95 percent confidence interval: ## ## sample estimates: ## mean of the differences ## 1.7 DTU Compute Introduktion til Statistik Efterår / 53

32 Det parrede setup Parret versus independent eksperiment Completely Randomized (independent samples) 20 patients are used and completely at random allocated to one of the two treatments (but usually making sure to have 10 patients in each group). Hence: different persons in the different groups. Paired (dependent samples) 10 patients are used, and each of them tests both of the treatments. Usually this will involve some time in between treatments to make sure that it becomes meaningful, and also one would typically make sure that some patients do A before B and others B before A. (and doing this allocation at random). Hence: the same persons in the different groups. DTU Compute Introduktion til Statistik Efterår / 53

33 Det parrede setup Eksempel - Sovemedicin - FORKERT analyse ## ## Welch Two Sample t-test ## ## data: x1 and x2 ## t = -2, df = 20, p-value = 0.07 ## alternative hypothesis: true difference in means is not equal to 0 ## 95 percent confidence interval: ## ## sample estimates: ## mean of x mean of y ## DTU Compute Introduktion til Statistik Efterår / 53

34 Det parrede setup Undersøgelse af computerspil Undersøgelse om et computerspil er designet så man forbedrer sig når man spiller: Forsøg: Personer spiller samme bane i spillet tre gange i træk Nogle har spillet det før og er derfor erfarne. Alle angiver deres erfaring ved: nybegynder, mellem og øvet Scoren måles for hver person de tre gange de spiller banen Der testes for forskellen mellem nybegyndere og øvede personer: Hvilket setup skal benyttes? A: Parret B: Ikke parret C: Ved ikke Svar) B: Ikke parret Der testes for forskellen i score fra første til tredje gang de spiller banen: Hvilket setup skal benyttes? A: Parret B: Ikke parret C: Ved ikke Svar) A: Parret DTU Compute Introduktion til Statistik Efterår / 53

35 Det parrede setup Undersøgelse af computerspil Gå ind i første level (POACHED EGGS) og spil BANE 2 tre gange i træk (hvis det er første gang så skal man lige først klare BANE 1). Noter score. Hvis man får 0 point en gang, så er det en ommer Gå ind på game.html (følg link under uge6 på Course material ) og indtast scores Download analysergame.r (følg link under uge6 på Course material ): Kan der påvises en signifikant forskel fra nybegyndere til meget øvede på α = 5% niveau? Kan der påvises en signifikant forbedring mellem første og tredje gang banen spilles på α = 5% niveau? DTU Compute Introduktion til Statistik Efterår / 53

36 Checking the normality assumptions Eksempel - Q-Q plot inden for hver stikprøve: ## Check af normalitetsantagelsen med QQ-plots par(mfrow=c(1,2)) qqnorm(xa, main="hospital A") qqline(xa) qqnorm(xb, main="hospital B") qqline(xb) Hospital A Hospital B Sample Quantiles Sample Quantiles Theoretical Quantiles Theoretical Quantiles DTU Compute Introduktion til Statistik Efterår / 53

37 Checking the normality assumptions Theoretical Quantiles Theoretical Quantiles Theoretical Quantiles Theoretical Quantiles Theoretical Quantiles Theoretical Quantiles Theoretical Quantiles Theoretical Quantiles Theoretical Quantiles Eksempel - Sammenligning med simulerede, A ## Check af normalitetsantagelsen med QQ-plots og Wally-plot ## Brug pakken MESS (install.packages("mess")) library(mess) fit1 <- lm(xa ~ 1) residualer <- resid(fit1) qqwrap <- function(x, y,...) {qqnorm(y, main="",...); abline(a = 0, b = 1)} wallyplot(residualer, FUN = qqwrap) Sample Quantiles Sample Quantiles Sample Quantiles Sample Quantiles Sample Quantiles Sample Quantiles Sample Quantiles Sample Quantiles Sample Quantiles DTU Compute Introduktion til Statistik Efterår / 53

38 Checking the normality assumptions Theoretical Quantiles Theoretical Quantiles Theoretical Quantiles Theoretical Quantiles Theoretical Quantiles Theoretical Quantiles Theoretical Quantiles Theoretical Quantiles Theoretical Quantiles Eksempel - Sammenligning med simulerede, B ## Check af normalitetsantagelsen med QQ-plots og Wally-plot fit1 <- lm(xb ~ 1) residualer <- resid(fit1) qqwrap <- function(x, y,...) {qqnorm(y, main="",...); abline(a = 0, b = 1)} wallyplot(residualer, FUN = qqwrap) Sample Quantiles Sample Quantiles Sample Quantiles Sample Quantiles Sample Quantiles Sample Quantiles Sample Quantiles Sample Quantiles Sample Quantiles DTU Compute Introduktion til Statistik Efterår / 53

39 Checking the normality assumptions Styrke og stikprøvestørrelse - two-sample Finding the power of detecting a group difference of 2 with σ = 1 for n = 10: ## Power beregning power.t.test(n = 10, delta = 2, sd = 1, sig.level = 0.05) ## ## Two-sample t test power calculation ## ## n = 10 ## delta = 2 ## sd = 1 ## sig.level = 0.05 ## power = 0.99 ## alternative = two.sided ## ## NOTE: n is number in *each* group DTU Compute Introduktion til Statistik Efterår / 53

40 Checking the normality assumptions Styrke og stikprøvestørrelse - two-sample Finding the sample size for detecting a group difference of 2 with σ = 1 and power= 0.9: ## Beregn stikprøvestørrelsen power.t.test(power = 0.90, delta = 2, sd = 1, sig.level = 0.05) ## ## Two-sample t test power calculation ## ## n = 6.4 ## delta = 2 ## sd = 1 ## sig.level = 0.05 ## power = 0.9 ## alternative = two.sided ## ## NOTE: n is number in *each* group DTU Compute Introduktion til Statistik Efterår / 53

41 Checking the normality assumptions Styrke og stikprøvestørrelse - two-sample Finding the detectable effect size (delta) with σ = 1, n = 10 and power= 0.9: ## Beregn margin of error power.t.test(power = 0.90, n = 10, sd = 1, sig.level = 0.05) ## ## Two-sample t test power calculation ## ## n = 10 ## delta = 1.5 ## sd = 1 ## sig.level = 0.05 ## power = 0.9 ## alternative = two.sided ## ## NOTE: n is number in *each* group DTU Compute Introduktion til Statistik Efterår / 53

42 The pooled t-test - a possible alternative Metode 3.64: The pooled two-sample t-test statistic Beregning af den poolede teststørrelse (og 3.63) When considering the null hypothesis about the difference between the means of two independent samples: δ = µ 2 µ 1 the pooled two-sample t-test statistic is H 0 : δ = δ 0 t obs = ( x 1 x 2 ) δ 0 s 2 p/n 1 + s 2 p/n 2 DTU Compute Introduktion til Statistik Efterår / 53

43 The pooled t-test - a possible alternative Theorem 3.65: Fordelingen af den poolede test-størrelse er en t-fordeling The pooled two-sample statistic seen as a random variable: T = ( X 1 X 2 ) δ 0 (1) S p/n Sp/n 2 2 follows, under the null hypothesis and under the assumption that σ 2 1 = σ 2 2, a t-distribution with n 1 + n 2 2 degrees of freedom if the two population distributions are normal. DTU Compute Introduktion til Statistik Efterår / 53

44 The pooled t-test - a possible alternative Vi bruger altid Welch versionen Nogenlunde (idiot)sikkert at bruge Welch-versionen altid if s 2 1 = s2 2 the Welch and the Pooled test statistics are the same. Only when the two variances become really different the two test-statistics may differ in any important way, and if this is the case, we would not tend to favour the pooled version, since the assumption of equal variances appears questionable then. Only for cases with a small sample sizes in at least one of the two groups the pooled approach may provide slightly higher power if you believe in the equal variance assumption. And for these cases the Welch approach is then a somewhat cautious approach. DTU Compute Introduktion til Statistik Efterår / 53

45 Oversigt The pooled t-test - a possible alternative 1 Motiverende eksempel - energiforbrug 2 Hypotesetest (Repetition) 3 Two-sample t-test og p-værdi 4 Konfidensinterval for forskellen 5 Overlappende konfidensintervaller? 6 Det parrede setup 7 Checking the normality assumptions 8 The pooled t-test - a possible alternative DTU Compute Introduktion til Statistik Efterår / 53

Oversigt. 1 Motiverende eksempel - energiforbrug. 2 Hypotesetest (Repetition) 3 Two-sample t-test og p-værdi. 4 Konfidensinterval for forskellen

Oversigt. 1 Motiverende eksempel - energiforbrug. 2 Hypotesetest (Repetition) 3 Two-sample t-test og p-værdi. 4 Konfidensinterval for forskellen Kursus 02402/02323 Introducerende Statistik Forelæsning 6: Sammenligning af to grupper Oversigt 1 Motiverende eksempel - energiforbrug 2 Hypotesetest (Repetition) 3 Klaus K. Andersen og Per Bruun Brockhoff

Læs mere

Oversigt. 1 Motiverende eksempel - energiforbrug. 2 Hypotesetest (Repetition) 3 Two-sample t-test og p-værdi. 4 Konfidensinterval for forskellen

Oversigt. 1 Motiverende eksempel - energiforbrug. 2 Hypotesetest (Repetition) 3 Two-sample t-test og p-værdi. 4 Konfidensinterval for forskellen Kursus 02402/02323 Introducerende Statistik Forelæsning 6: Sammenligning af to grupper Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark

Læs mere

Kursus 02323: Introducerende Statistik. Forelæsning 12: Forsøgsplanlægning. Peder Bacher

Kursus 02323: Introducerende Statistik. Forelæsning 12: Forsøgsplanlægning. Peder Bacher Kursus 02323: Introducerende Statistik Forelæsning 12: Forsøgsplanlægning Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk

Læs mere

Introduktion til Statistik. Forelæsning 5: Hypotesetest, power og modelkontrol - one sample. Peder Bacher

Introduktion til Statistik. Forelæsning 5: Hypotesetest, power og modelkontrol - one sample. Peder Bacher Introduktion til Statistik Forelæsning 5: Hypotesetest, power og modelkontrol - one sample Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark

Læs mere

Basic statistics for experimental medical researchers

Basic statistics for experimental medical researchers Basic statistics for experimental medical researchers Sample size calculations September 15th 2016 Christian Pipper Department of public health (IFSV) Faculty of Health and Medicinal Science (SUND) E-mail:

Læs mere

Oversigt. Kursus 02402/02323 Introducerende Statistik. Forelæsning 5: Hypotesetest, power og modelkontrol - one sample

Oversigt. Kursus 02402/02323 Introducerende Statistik. Forelæsning 5: Hypotesetest, power og modelkontrol - one sample Kursus 02402/02323 Introducerende Statistik Forelæsning 5: Hypotesetest, power og modelkontrol - one sample Klaus K. Andersen og Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Danmarks Tekniske

Læs mere

enote 3: Hypotesetests for én gruppe/stikprøve Introduktion til Statistik Forelæsning 5: Hypotesetest, power og modelkontrol - one sample Peder Bacher

enote 3: Hypotesetests for én gruppe/stikprøve Introduktion til Statistik Forelæsning 5: Hypotesetest, power og modelkontrol - one sample Peder Bacher Introduktion til Statistik Forelæsning 5: Hypotesetest, power og modelkontrol - one sample Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark

Læs mere

Forelæsning 11: Envejs variansanalyse, ANOVA

Forelæsning 11: Envejs variansanalyse, ANOVA Kursus 02323: Introduktion til Statistik Forelæsning 11: Envejs variansanalyse, ANOVA Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark

Læs mere

k UAFHÆNGIGE grupper Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen 4 Hypotesetest (F-test)

k UAFHÆNGIGE grupper Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen 4 Hypotesetest (F-test) Kursus 02323: Introduktion til Statistik Forelæsning 11: Envejs variansanalse, ANOVA Peder Bacher DTU Compute, Dnamiske Sstemer Bgning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lngb Danmark e-mail:

Læs mere

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik Bygning 305/324 Danmarks Tekniske Universitet

Læs mere

Kursus 02402 Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff

Kursus 02402 Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks

Læs mere

Statistik for MPH: 7

Statistik for MPH: 7 Statistik for MPH: 7 3. november 2011 www.biostat.ku.dk/~pka/mph11 Attributable risk, bestemmelse af stikprøvestørrelse (Silva: 333-365, 381-383) Per Kragh Andersen 1 Fra den 6. uges statistikundervisning:

Læs mere

Kursus 02402/02323 Introduktion til statistik. Forelæsning 13: Et overblik over kursets indhold. Klaus K. Andersen og Per Bruun Brockhoff

Kursus 02402/02323 Introduktion til statistik. Forelæsning 13: Et overblik over kursets indhold. Klaus K. Andersen og Per Bruun Brockhoff Kursus 02402/02323 Introduktion til statistik Forelæsning 13: Et overblik over kursets indhold Klaus K. Andersen og Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Danmarks Tekniske Universitet

Læs mere

Forelæsning 4: Konfidensinterval for middelværdi (og spredning)

Forelæsning 4: Konfidensinterval for middelværdi (og spredning) Introduktion til Statistik Forelæsning 4: Konfidensinterval for middelværdi (og spredning) Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark

Læs mere

Introduktion til Statistik. Forelæsning 12: Inferens for andele. Peder Bacher

Introduktion til Statistik. Forelæsning 12: Inferens for andele. Peder Bacher Introduktion til Statistik Forelæsning 12: Inferens for andele Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk Efterår

Læs mere

Statistik for MPH: oktober Attributable risk, bestemmelse af stikprøvestørrelse (Silva: , )

Statistik for MPH: oktober Attributable risk, bestemmelse af stikprøvestørrelse (Silva: , ) Statistik for MPH: 7 29. oktober 2015 www.biostat.ku.dk/~pka/mph15 Attributable risk, bestemmelse af stikprøvestørrelse (Silva: 333-365, 381-383) Per Kragh Andersen 1 Fra den 6. uges statistikundervisning:

Læs mere

Forelæsning 11: Tovejs variansanalyse, ANOVA

Forelæsning 11: Tovejs variansanalyse, ANOVA Introduktion til Statistik Forelæsning 11: Tovejs variansanalyse, ANOVA Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk

Læs mere

Introduktion til Statistik. Forelæsning 10: Inferens for andele. Peder Bacher

Introduktion til Statistik. Forelæsning 10: Inferens for andele. Peder Bacher Introduktion til Statistik Forelæsning 10: Inferens for andele Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk Efterår

Læs mere

Vina Nguyen HSSP July 13, 2008

Vina Nguyen HSSP July 13, 2008 Vina Nguyen HSSP July 13, 2008 1 What does it mean if sets A, B, C are a partition of set D? 2 How do you calculate P(A B) using the formula for conditional probability? 3 What is the difference between

Læs mere

1 enote 1: Simple plots og deskriptive statistik. 2 enote2: Diskrete fordelinger. 3 enote 2: Kontinuerte fordelinger

1 enote 1: Simple plots og deskriptive statistik. 2 enote2: Diskrete fordelinger. 3 enote 2: Kontinuerte fordelinger Kursus 02402/02323 Introduktion til statistik Forelæsning 13: Et overblik over kursets indhold Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Building 324, Room 220 Danish Technical University

Læs mere

Reexam questions in Statistics and Evidence-based medicine, august sem. Medis/Medicin, Modul 2.4.

Reexam questions in Statistics and Evidence-based medicine, august sem. Medis/Medicin, Modul 2.4. Reexam questions in Statistics and Evidence-based medicine, august 2013 2. sem. Medis/Medicin, Modul 2.4. Statistics : ESSAY-TYPE QUESTION 1. Intelligence tests are constructed such that the average score

Læs mere

Kvant Eksamen December 2010 3 timer med hjælpemidler. 1 Hvad er en continuous variable? Giv 2 illustrationer.

Kvant Eksamen December 2010 3 timer med hjælpemidler. 1 Hvad er en continuous variable? Giv 2 illustrationer. Kvant Eksamen December 2010 3 timer med hjælpemidler 1 Hvad er en continuous variable? Giv 2 illustrationer. What is a continuous variable? Give two illustrations. 2 Hvorfor kan man bedre drage konklusioner

Læs mere

STAT-UB.0103 Spring 2012 Homework Set 8 Solutions

STAT-UB.0103 Spring 2012 Homework Set 8 Solutions 1. Curtis was investigating the properties of a new vacuum cleaner motor in terms of a standardized lab procedure. In this procedure, the motor was applied to a pile of gypsum powder for five seconds,

Læs mere

Konfidensintervaller og Hypotesetest

Konfidensintervaller og Hypotesetest Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller

Læs mere

Afsnit E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse

Afsnit E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse Afsnit 8.3 - E1 Konfidensinterval for middelværdi i normalfordeling med kendt standardafvigelse Først skal normalfordelingen lige defineres i Maple, så vi kan benytte den i vores udregninger. Dette gøres

Læs mere

k UAFHÆNGIGE grupper F-test Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen

k UAFHÆNGIGE grupper F-test Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen Introduktion til Statistik Forelæsning 10: Envejs variansanalyse, ANOVA Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 017 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk

Læs mere

Generalized Probit Model in Design of Dose Finding Experiments. Yuehui Wu Valerii V. Fedorov RSU, GlaxoSmithKline, US

Generalized Probit Model in Design of Dose Finding Experiments. Yuehui Wu Valerii V. Fedorov RSU, GlaxoSmithKline, US Generalized Probit Model in Design of Dose Finding Experiments Yuehui Wu Valerii V. Fedorov RSU, GlaxoSmithKline, US Outline Motivation Generalized probit model Utility function Locally optimal designs

Læs mere

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Kursus 02402 Introduktion til Statistik Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske

Læs mere

Kursus 02323: Introducerende Statistik. Forelæsning 8: Simpel lineær regression. Peder Bacher

Kursus 02323: Introducerende Statistik. Forelæsning 8: Simpel lineær regression. Peder Bacher Kursus 02323: Introducerende Statistik Forelæsning 8: Simpel lineær regression Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering

Eksamen Bacheloruddannelsen i Medicin med industriel specialisering Eksamen 2016 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 17-02-2015 Tid: kl. 09.00-11.00 Bedømmelsesform

Læs mere

1 enote 1: Simple plots og deskriptive statistik. 2 enote 2: Diskrete fordelinger. 3 enote 2: Kontinuerte fordelinger

1 enote 1: Simple plots og deskriptive statistik. 2 enote 2: Diskrete fordelinger. 3 enote 2: Kontinuerte fordelinger Kursus 02402/02323 Introduktion til statistik Forelæsning 13: Et overblik over kursets indhold Peder Bacher DTU Compute, Dynamiske Systemer Building 303B, Room 017 Danish Technical University 2800 Lyngby

Læs mere

Oversigt. 1 Intro: Regneeksempel og TV-data fra B&O. 2 Model og hypotese. 3 Beregning - variationsopspaltning og ANOVA tabellen

Oversigt. 1 Intro: Regneeksempel og TV-data fra B&O. 2 Model og hypotese. 3 Beregning - variationsopspaltning og ANOVA tabellen Kursus 02402/02323 Introducerende Statistik Forelæsning 10: Envejs variansanalyse, ANOVA Oversigt 1 Intro: Regneeksempel og TV-data fra B&O 2 Model og hypotese Per Bruun Brockhoff DTU Compute, Statistik

Læs mere

Project Step 7. Behavioral modeling of a dual ported register set. 1/8/ L11 Project Step 5 Copyright Joanne DeGroat, ECE, OSU 1

Project Step 7. Behavioral modeling of a dual ported register set. 1/8/ L11 Project Step 5 Copyright Joanne DeGroat, ECE, OSU 1 Project Step 7 Behavioral modeling of a dual ported register set. Copyright 2006 - Joanne DeGroat, ECE, OSU 1 The register set Register set specifications 16 dual ported registers each with 16- bit words

Læs mere

Program. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data

Program. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data Faculty of Life Sciences Program t-test Hypoteser, teststørrelser og p-værdier Claus Ekstrøm E-mail: ekstrom@life.ku.dk Resumé og hængepartier fra sidst. Eksempel: effekt af foder på hormonkoncentration

Læs mere

Løsning eksamen d. 15. december 2008

Løsning eksamen d. 15. december 2008 Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220

Læs mere

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Motiverende eksempel Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning

Læs mere

Forsøgsplanlægning Stikprøvestørrelse

Forsøgsplanlægning Stikprøvestørrelse Basal statistik Esben Budtz-Jørgensen 6. november 2007 Forsøgsplanlægning Stikprøvestørrelse 1 41 Planlægning af et studie Videnskabelig hypotese Endpoints Instrumentelle/eksponerings variable Variationskilder

Læs mere

Linear Programming ١ C H A P T E R 2

Linear Programming ١ C H A P T E R 2 Linear Programming ١ C H A P T E R 2 Problem Formulation Problem formulation or modeling is the process of translating a verbal statement of a problem into a mathematical statement. The Guidelines of formulation

Læs mere

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter Program Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Øvelse: effekt af diæter. Repetition fra sidst... Parrede og ikke-parrede

Læs mere

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1

Opgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1 Københavns Universitet Afdeling for Anvendt Matematik og Statistik Statistik for biokemikere Inge Henningsen Michael Sørensen Oktober 2003 Opgaver til ZAR II Opgave 1 Et datasæt består af 20 observationer.

Læs mere

Kursus 02402/02323 Introducerende Statistik

Kursus 02402/02323 Introducerende Statistik Kursus 02402/02323 Introducerende Statistik Forelæsning 8: Simpel lineær regression Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark

Læs mere

Ikke-parametriske tests

Ikke-parametriske tests Ikke-parametriske tests 2 Dagens menu t testen Hvordan var det nu lige det var? Wilcoxson Mann Whitney U Kruskall Wallis Friedman Kendalls og Spearmans correlation 3 t-testen Patient Drug Placebo difference

Læs mere

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test Statistik Lektion 0 Ikkeparametriske metoder Repetition KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

Oversigt. 1 Motiverende eksempel: Højde-vægt. 2 Lineær regressionsmodel. 3 Mindste kvadraters metode (least squares)

Oversigt. 1 Motiverende eksempel: Højde-vægt. 2 Lineær regressionsmodel. 3 Mindste kvadraters metode (least squares) Kursus 02402/02323 Introducerende Statistik Forelæsning 8: Simpel lineær regression Oversigt Motiverende eksempel: Højde-vægt 2 Lineær regressionsmodel 3 Mindste kvadraters metode (least squares) Klaus

Læs mere

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge Statistik og Sandsynlighedsregning 2 Repetition og eksamen Overheads til forelæsninger, mandag 7. uge 1 Normalfordelingen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange

Læs mere

Question I.1 (1) We use Method 3.8 from Chapter 3 to achieve

Question I.1 (1) We use Method 3.8 from Chapter 3 to achieve Correct answers: 35132 25225 11354 53441 12141 32235 Exercise I Question I.1 (1) We use Method 3.8 from Chapter 3 to achieve And since, qt(0.95, 24) ## [1] 1.710882 90.4 ± t 0.95 10.3 25 We get that 10.3

Læs mere

Klasseøvelser dag 2 Opgave 1

Klasseøvelser dag 2 Opgave 1 Klasseøvelser dag 2 Opgave 1 1.1. Vi sætter først working directory og data indlæses: library( foreign ) d

Læs mere

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Motiverende eksempel Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning

Læs mere

Privat-, statslig- eller regional institution m.v. Andet Added Bekaempelsesudfoerende: string No Label: Bekæmpelsesudførende

Privat-, statslig- eller regional institution m.v. Andet Added Bekaempelsesudfoerende: string No Label: Bekæmpelsesudførende Changes for Rottedatabasen Web Service The coming version of Rottedatabasen Web Service will have several changes some of them breaking for the exposed methods. These changes and the business logic behind

Læs mere

Besvarelse af vitcap -opgaven

Besvarelse af vitcap -opgaven Besvarelse af -opgaven Spørgsmål 1 Indlæs data Dette gøres fra Analyst med File/Open, som sædvanlig. Spørgsmål 2 Beskriv fordelingen af vital capacity og i de 3 grupper ved hjælp af summary statistics.

Læs mere

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher

Introduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk

Læs mere

Basal statistik Esben Budtz-Jørgensen 4. november Forsøgsplanlægning Stikprøvestørrelse

Basal statistik Esben Budtz-Jørgensen 4. november Forsøgsplanlægning Stikprøvestørrelse Basal statistik Esben Budtz-Jørgensen 4. november 2008 Forsøgsplanlægning Stikprøvestørrelse 1 46 Planlægning af et studie Videnskabelig hypotese Endpoints Instrumentelle/eksponerings variable Variationskilder

Læs mere

Løsning til eksaminen d. 29. maj 2009

Løsning til eksaminen d. 29. maj 2009 DTU Informatik 02402 Introduktion til Statistik 20-2-01 LFF/lff Løsning til eksaminen d. 29. maj 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Indhold. 2 Tosidet variansanalyse Additive virkninger Vekselvirkning... 9

Indhold. 2 Tosidet variansanalyse Additive virkninger Vekselvirkning... 9 Indhold 1 Ensidet variansanalyse 2 1.1 Estimation af middelværdier............................... 3 1.2 Estimation af standardafvigelse............................. 3 1.3 F-test for ens middelværdier...............................

Læs mere

q-værdien som skal sammenlignes med den kritiske Chi-i-Anden værdi p-værdien som skal sammenlignes med signifikansniveauet.

q-værdien som skal sammenlignes med den kritiske Chi-i-Anden værdi p-værdien som skal sammenlignes med signifikansniveauet. Introduktion: Chi-i-Anden test (Goodness of Fit) på computeren fungerer som en "black-boks"- kommando, hvor eleverne med udgangspunkt i en nulhypotese (H ) taster de forventede og de observerede talværdier

Læs mere

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse

Læs mere

1 Sammenligning af 2 grupper Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver... 2

1 Sammenligning af 2 grupper Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver... 2 Indhold 1 Sammenligning af 2 grupper 2 1.1 Responsvariabel og forklarende variabel......................... 2 1.2 Afhængige/uafhængige stikprøver............................ 2 2 Sammenligning af 2 middelværdier

Læs mere

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test Ikkeparametriske metoder Repetition Wilcoxon SignedRank Test KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

En Introduktion til SAS. Kapitel 5.

En Introduktion til SAS. Kapitel 5. En Introduktion til SAS. Kapitel 5. Inge Henningsen Afdeling for Statistik og Operationsanalyse Københavns Universitet Marts 2005 6. udgave Kapitel 5 T-test og PROC UNIVARIATE 5.1 Indledning Dette kapitel

Læs mere

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller Type I og type II fejl Type I fejl: forkast når hypotese sand. α = signifikansniveau= P(type I fejl) Program (8.15-10): Hvis vi forkaster når Z < 2.58 eller Z > 2.58 er α = P(Z < 2.58) + P(Z > 2.58) =

Læs mere

Hvad skal vi lave? Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver

Hvad skal vi lave? Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver Hvad skal vi lave? 1 Sammenligning af 2 grupper Responsvariabel og forklarende variabel Afhængige/uafhængige stikprøver 2 Sammenligning af 2 middelværdier Uafhængige stikprøver Uafhængige stikprøver -

Læs mere

Skriftlig eksamen Science statistik- ST501

Skriftlig eksamen Science statistik- ST501 SYDDANSK UNIVERSITET INSTITUT FOR MATEMATIK OG DATALOGI Skriftlig eksamen Science statistik- ST501 Torsdag den 11. juni Opgavesættet består af 4 opgaver, med i alt 13 delspørgsmål, som vægtes ligeligt.

Læs mere

Analyseinstitut for Forskning

Analyseinstitut for Forskning Analyseinstitut for Forskning CIS3 The Danish Non-response Analysis Peter S. Mortensen Notat 2003/1 fra Analyseinstitut for Forskning The Danish Institute for Studies in Research and Research Policy Finlandsgade

Læs mere

Vores mange brugere på musskema.dk er rigtig gode til at komme med kvalificerede ønsker og behov.

Vores mange brugere på musskema.dk er rigtig gode til at komme med kvalificerede ønsker og behov. På dansk/in Danish: Aarhus d. 10. januar 2013/ the 10 th of January 2013 Kære alle Chefer i MUS-regi! Vores mange brugere på musskema.dk er rigtig gode til at komme med kvalificerede ønsker og behov. Og

Læs mere

Løsning til eksaminen d. 14. december 2009

Løsning til eksaminen d. 14. december 2009 DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,

Læs mere

Oversigt. 1 Eksempel. 2 Fordelingen for gennemsnittet t-fordelingen. 3 Konfidensintervallet for µ Eksempel

Oversigt. 1 Eksempel. 2 Fordelingen for gennemsnittet t-fordelingen. 3 Konfidensintervallet for µ Eksempel Kursus 02402/02323 Introducerende Statistik Forelæsning 4: Konfidensinterval for middelværdi (og spredning) Klaus K. Andersen og Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Danmarks Tekniske

Læs mere

I dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt)

I dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt) I dag Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt) Helle Sørensen Repetition vha eksempel om dagligvarepriser Analyse med R: ttest

Læs mere

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j Hypoteser om mere end to stikprøver ANOVA k stikprøver: (ikke ordinale eller højere) H 0 : 1 2... k gælder også for k 2! H 0ij : i j H 0ij : i j simpelt forslag: k k 1 2 t-tests: i j DUER IKKE! Bonferroni!!

Læs mere

User Manual for LTC IGNOU

User Manual for LTC IGNOU User Manual for LTC IGNOU 1 LTC (Leave Travel Concession) Navigation: Portal Launch HCM Application Self Service LTC Self Service 1. LTC Advance/Intimation Navigation: Launch HCM Application Self Service

Læs mere

Forelæsning 11: Kapitel 11: Regressionsanalyse

Forelæsning 11: Kapitel 11: Regressionsanalyse Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 19 sider. Skriftlig prøve: 14. december 2013 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Forsøgsplanlægning Stikprøvestørrelse

Forsøgsplanlægning Stikprøvestørrelse Basal statistik Esben Budtz-Jørgensen 8. november 2011 Videnskabelig hypotese Planlægning af et studie Endpoints Forsøgsplanlægning Stikprøvestørrelse 1 51 Instrumentelle/eksponerings variable Variationskilder

Læs mere

Measuring Evolution of Populations

Measuring Evolution of Populations Measuring Evolution of Populations 2007-2008 5 Agents of evolutionary change Mutation Gene Flow Non-random mating Genetic Drift Selection Populations & gene pools Concepts a population is a localized group

Læs mere

Muligheder: NB: test for µ 1 = µ 2 i model med blocking ækvivalent med parret t-test! Ide: anskue β j som stikprøve fra normalfordeling.

Muligheder: NB: test for µ 1 = µ 2 i model med blocking ækvivalent med parret t-test! Ide: anskue β j som stikprøve fra normalfordeling. Eksempel: dæktyper og brændstofforbrug (opgave 25 side 319) Program: cars 1 2 3 4 5... radial 4.2 4.7 6.6 7.0 6.7... belt 4.1 4.9 6.2 6.9 6.8... Muligheder: 1. vi starter med at gennemgå opgave 7 side

Læs mere

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

enote 5: Simpel lineær regressions analyse Kursus 02402/02323 Introducerende Statistik Oversigt

enote 5: Simpel lineær regressions analyse Kursus 02402/02323 Introducerende Statistik Oversigt enote 5: Simpel lineær regressions analse Kursus 02402/02323 Introducerende Statistik Forelæsning 8: Simpel lineær regression To variable: og Beregn mindstekvadraters estimat af ret linje Inferens med

Læs mere

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Normalfordelingen. Statistik og Sandsynlighedsregning 2 Statistik og Sandsynlighedsregning 2 Repetition og eksamen T-test Normalfordelingen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige

Læs mere

Exam questions in Statistics and evidence-based medicine, spring 2011 2. sem. Medis/Medicin, Modul 2.4.

Exam questions in Statistics and evidence-based medicine, spring 2011 2. sem. Medis/Medicin, Modul 2.4. Exam questions in Statistics and evidence-based medicine, spring 2011 2. sem. Medis/Medicin, Modul 2.4. MUPTIPLE HOIE QUESTION 1. Identify the false statement: D E Power = [1 - (probability of a Type II

Læs mere

enote 2: Kontinuerte fordelinger Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher enote 2: Continuous Distributions

enote 2: Kontinuerte fordelinger Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher enote 2: Continuous Distributions Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 33B, Rum 9 Danmarks Tekniske Universitet 28 Lyngby Danmark e-mail: pbac@dtu.dk Efterår

Læs mere

Skriftlig Eksamen Kombinatorik, Sandsynlighed og Randomiserede Algoritmer (DM528)

Skriftlig Eksamen Kombinatorik, Sandsynlighed og Randomiserede Algoritmer (DM528) Skriftlig Eksamen Kombinatorik, Sandsynlighed og Randomiserede Algoritmer (DM58) Institut for Matematik og Datalogi Syddansk Universitet, Odense Torsdag den 1. januar 01 kl. 9 13 Alle sædvanlige hjælpemidler

Læs mere

(studienummer) (underskrift) (bord nr)

(studienummer) (underskrift) (bord nr) Danmarks Tekniske Universitet Side 1 af 18 sider. Skriftlig prøve: 14. december 2009 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)

Læs mere

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke. Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke. 1/23 Opsummering af fordelinger X 1. Kendt σ: Z = X µ σ/ n N(0,1)

Læs mere

Generelle lineære modeller

Generelle lineære modeller Generelle lineære modeller Regressionsmodeller med én uafhængig intervalskala variabel: Y en eller flere uafhængige variable: X 1,..,X k Den betingede fordeling af Y givet X 1,..,X k antages at være normal

Læs mere

X M Y. What is mediation? Mediation analysis an introduction. Definition

X M Y. What is mediation? Mediation analysis an introduction. Definition What is mediation? an introduction Ulla Hvidtfeldt Section of Social Medicine - Investigate underlying mechanisms of an association Opening the black box - Strengthen/support the main effect hypothesis

Læs mere

KA 4.2 Kvantitative Forskningsmetoder Forår 2010

KA 4.2 Kvantitative Forskningsmetoder Forår 2010 KA 4.2 Kvantitative Forskningsmetoder Forår 2010 Besvar alle spørgsmål. Brug ikke mere end én side af tekst på de åbne spørgsmål som er markeret * Answer all questions. Do not write more than one page

Læs mere

Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff

Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff Kursus 02402 Introduktion til Statistik Forelæsning 12: Variansanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Forelæsning 9: Inferens for andele (kapitel 10)

Forelæsning 9: Inferens for andele (kapitel 10) Kursus 02402 Introduktion til Statistik Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Multivariate Extremes and Dependence in Elliptical Distributions

Multivariate Extremes and Dependence in Elliptical Distributions Multivariate Extremes and Dependence in Elliptical Distributions Filip Lindskog, RiskLab, ETH Zürich joint work with Henrik Hult, KTH Stockholm I II III IV V Motivation Elliptical distributions A class

Læs mere

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau Hvad skal vi lave? 1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ. Teststatistik P-værdi Signifikansniveau 2 t-test for middelværdi Tosidet t-test for middelværdi Ensidet t-test for middelværdi

Læs mere

Forelæsning 10: Statistik ved hjælp af simulering

Forelæsning 10: Statistik ved hjælp af simulering Kursus 02402 Introduktion til Statistik Forelæsning 10: Statistik ved hjælp af simulering Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800

Læs mere

Statistik. Statistik. Hvad er Statistik? Hvad er Statistik? Hvad er Statistik? 1. Hvad er statistik? 2. Mennesker som måleinstrumenter

Statistik. Statistik. Hvad er Statistik? Hvad er Statistik? Hvad er Statistik? 1. Hvad er statistik? 2. Mennesker som måleinstrumenter Statistik Statistik 1. statistik? Per Bruun Brockhoff Professor i Statistik DTU Informatik 27 august 2009 http://www.imm.dtu.dk/~pbb 2. Mennesker som måleinstrumenter Egentlig ikke så meget: Danmarks Statistik:

Læs mere

Sport for the elderly

Sport for the elderly Sport for the elderly - Teenagers of the future Play the Game 2013 Aarhus, 29 October 2013 Ditte Toft Danish Institute for Sports Studies +45 3266 1037 ditte.toft@idan.dk A growing group in the population

Læs mere

Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge

Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge Kommentarer til opg. 1 og 3 ved øvelser i basalkursus, 3. uge Opgave 1. Data indlæses i 3 kolonner, som f.eks. kaldessalt,pre ogpost. Der er således i alt tale om 26 observationer, idet de to grupper lægges

Læs mere

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau... Indhold 1 Statistisk inferens: Hypotese og test 2 1.1 Nulhypotese - alternativ.................................. 2 1.2 Teststatistik........................................ 3 1.3 P-værdi..........................................

Læs mere

PARALLELIZATION OF ATTILA SIMULATOR WITH OPENMP MIGUEL ÁNGEL MARTÍNEZ DEL AMOR MINIPROJECT OF TDT24 NTNU

PARALLELIZATION OF ATTILA SIMULATOR WITH OPENMP MIGUEL ÁNGEL MARTÍNEZ DEL AMOR MINIPROJECT OF TDT24 NTNU PARALLELIZATION OF ATTILA SIMULATOR WITH OPENMP MIGUEL ÁNGEL MARTÍNEZ DEL AMOR MINIPROJECT OF TDT24 NTNU OUTLINE INEFFICIENCY OF ATTILA WAYS TO PARALLELIZE LOW COMPATIBILITY IN THE COMPILATION A SOLUTION

Læs mere

t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t.

t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t. t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program (8.15-10): 1. repetition: fordeling af observatorer X, S 2 og t. 2. konfidens-intervaller, hypotese test, type I og type II fejl, styrke,

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere