Kursus 02402/02323 Introducerende Statistik
|
|
- Fredrik Kristensen
- 7 år siden
- Visninger:
Transkript
1 Kursus 02402/02323 Introducerende Statistik Forelæsning 8: Simpel lineær regression Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark Efterår 2016 DTU Compute Introduktion til Statistik Efterår / 56
2 enote 5: Simpel lineær regressions analyse To variable: x og y Beregn mindstekvadraters estimat af ret linje Inferens med simpel lineær regressionsmodel Statistisk model: Y i = β 0 + β 1 x i + ε i Estimation, konfidensintervaller og tests for β 0 og β 1 Konfidensinterval for linjen (95% sikkerhed for den rigtige linje ligger indenfor) Prædiktionsinterval for punkter (95% sikkerhed for at nye punkter ligger indenfor) ρ, R og R 2 ρ er korrelationen (= sign β1 R) er graden af lineær sammenhæng mellem x og y R 2 er andelen af den totale variation som er forklaret af modellen Afvises H 0 : β 1 = 0 så afvises også H 0 : ρ = 0 DTU Compute Introduktion til Statistik Efterår / 56
3 enote 5: Simple linear Regression Analysis Two quantitative variables: x and y Calculating the least squares line Inferences for a simple linear regression model Statistical model: y i = β 0 + β 1 x i + ε i Estimation, confidence intervals and tests for β 0 and β 1. Confidence interval for the line (95% certainty that the real line will be inside) Prediction interval for punkter (95% certainty that new points will be inside) ρ, R and R 2 ρ is the correlation (= sign β1 R) is the strength of linear relation between x and y R 2 is the fraction of the total variation explained by the model If H 0 : β 1 = 0 is rejected, then H 0 : ρ = 0 is also rejected DTU Compute Introduktion til Statistik Efterår / 56
4 Oversigt 1 Motiverende eksempel: Højde-vægt 2 Lineær regressionsmodel 3 Mindste kvadraters metode (least squares) 4 Statistik og lineær regression 5 Hypotesetests og konfidensintervaller for ˆβ 0 og ˆβ 1 6 Konfidensinterval og prædiktionsinterval Konfidensinterval for linien Prædiktionsinterval 7 summary(lm()) wrap up 8 Korrelation 9 Residual Analysis: Model kontrol DTU Compute Introduktion til Statistik Efterår / 56
5 Motiverende eksempel: Højde-vægt Motiverende eksempel: Højde-vægt Heights (x i) Weights (y i) Weight Height DTU Compute Introduktion til Statistik Efterår / 56
6 Motiverende eksempel: Højde-vægt Motiverende eksempel: Højde-vægt Heights (x i) Weights (y i) Weight Height DTU Compute Introduktion til Statistik Efterår / 56
7 Motiverende eksempel: Højde-vægt Motiverende eksempel: Højde-vægt Heights (x i) Weights (y i) ## ## Call: ## lm(formula = y ~ x) ## ## Residuals: ## Min 1Q Median 3Q Max ## ## ## Coefficients: ## Estimate Std. Error t value Pr(> t ) ## (Intercept) *** ## x e-06 *** ## --- ## Signif. codes: 0 '***' '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 ## ## Residual standard error: 3.9 on 8 degrees of freedom ## Multiple R-squared: 0.932,Adjusted R-squared: ## F-statistic: 110 on 1 and 8 DF, p-value: 5.87e-06 DTU Compute Introduktion til Statistik Efterår / 56
8 Motiverende eksempel: Højde-vægt Motiverende eksempel: Højde-vægt Heights (x i) Weights (y i) Weight Height DTU Compute Introduktion til Statistik Efterår / 56
9 Lineær regressionsmodel Et scatter plot af nogle punkter. Hvilken model? Datapunkter (x i,y i ) y x DTU Compute Introduktion til Statistik Efterår / 56
10 Lineær regressionsmodel Kommer de fra en almindelig lineær model? Opstil en lineær model: y i = β 0 + β 1 x i y Data punkter Linear model x men den der mangler noget til at beskrive den tilfældige variation! DTU Compute Introduktion til Statistik Efterår / 56
11 Lineær regressionsmodel De kommer fra en lineær regressionsmodel Opstil en lineær regressionsmodel: Y i = β 0 + β 1 x i + ε i hvor ε i N(0,σ 2 ) y σ Data punkter Lineaer model Normal fordeling Den tilfældige variation er beskrevet med en normalfordeling om linien x DTU Compute Introduktion til Statistik Efterår / 56
12 Lineær regressionsmodel Opstil en lineær regressionsmodel Opstil den lineære regressionsmodel Y i = β 0 + β 1 x i + ε i Y i er den afhængige variabel (dependent variable). En stokastisk variabel x i er en forklarende variabel (explanatory variable) ε i (epsilon) er afvigelsen (deviation). En stokastisk variabel og vi antager ε i er independent and identically distributed (i.i.d.) og N(0,σ 2 ) DTU Compute Introduktion til Statistik Efterår / 56
13 Mindste kvadraters metode (least squares) Mindste kvadraters metode Hvis vi kun har datapunkterne, hvordan kan vi estimere parametrene β 0 og β 1? God ide: Minimer variansen σ 2 på afvigelsen. Det er på næsten alle måder det bedste valg i dette setup. But how!? Minimer summen af de kvadrerede afvigelser (Residual Sum of Squares (RSS)) RSS(β 0,β 1 ) = n εi 2 i=1 Dvs. estimaterne ˆβ 0 og ˆβ 1 er dem som minimerer RSS DTU Compute Introduktion til Statistik Efterår / 56
14 Mindste kvadraters metode (least squares) Illustration af model, data og fit y ˆε i = e i σ β 0 + β 1 x ˆβ 0 + ˆβ 1 x Data punkter Lineaer model Estimeret linie ˆε i eller e i: Residual x DTU Compute Introduktion til Statistik Efterår / 56
15 Mindste kvadraters metode (least squares) Spørgsmål om beregning af residual (socrative.com-room:pbac) Udregning af residual for punkt i: y i = ˆβ 0 + ˆβ 1 x i + e i = ŷ i + e i e i = y i ŷ i y y1 ŷ e 2 1 = 0.57 data punkter linear fit -2-1 x x Hvad er e 1 her? A: ca B: ca C: ca. 1.3 D: Ved ikke Svar A: ca DTU Compute Introduktion til Statistik Efterår / 56
16 Mindste kvadraters metode (least squares) Spørgsmål om beregning af RSS (socrative.com-room:pbac) Beregn: Residual Sum of Squares (RSS) Fire punkter, så n=4 y e 2 3 = e 2 2 = 0.32 e 2 4 = 0.32 e 2 1 = Data punkter Estimeret linie x Hvad er RSS = n i=1 e2 i her? A: ca B: ca C: ca. 3.4 D: Ved ikke Svar A: RSS = = 0.67 DTU Compute Introduktion til Statistik Efterår / 56
17 Mindste kvadraters metode (least squares) Least squares estimator minimerer RSS Theorem 5.4 (her for estimatorer som i enoten) The least squares estimators of β 0 and β 1 are given by where S xx = n i=1 (x i x) 2. ˆβ 1 = n i=1 (Y i Ȳ)(x i x) S xx ˆβ 0 = Ȳ ˆβ 1 x DTU Compute Introduktion til Statistik Efterår / 56
18 Mindste kvadraters metode (least squares) Least squares estimater minimerer RSS Theorem 5.4 (her for estimater) The least squares estimatates of β 0 and β 1 are given by where S xx = n i=1 (x i x) 2. ˆβ 1 = n i=1 (y i ȳ)(x i x) S xx ˆβ 0 = ȳ ˆβ 1 x Vi går ikke dybere ind forskellen mellem estimatorer og estimater her i kurset DTU Compute Introduktion til Statistik Efterår / 56
19 R eksempel Mindste kvadraters metode (least squares) ## Simuler en lineær model med normalfordelt afvigelse og estimer parametrene ## FØRST LAV DATA: ## Generer n værdier af input x som uniform fordelt x <- runif(n=20, min=-2, max=4) ## Simuler lineær regressionsmodel beta0=50; beta1=200; sigma=90 y <- beta0 + beta1 * x + rnorm(n=length(x), mean=0, sd=sigma) ## HERFRA ligesom virkeligheden, vi har dataen i x og y: ## Et scatter plot af x og y plot(x, y) ## Udregn least squares estimaterne, brug Theorem 5.4 (beta1hat <- sum( (y-mean(y))*(x-mean(x)) ) / sum( (x-mean(x))^2 )) (beta0hat <- mean(y) - beta1hat*mean(x)) ## Brug lm() til at udregne estimaterne lm(y ~ x) ## Plot den estimerede linie abline(lm(y ~ x), col="red") DTU Compute Introduktion til Statistik Efterår / 56
20 Statistik og lineær regression Parameter estimaterne er stokastiske variabler Hvis vi tog en ny stikprøve ville estimaterne ˆβ 0 og ˆβ 1 have samme udfald? Nej, de er stokastiske variabler. Tog vi en ny stikprøve så ville vi have en anden realisation af dem. Hvordan er parameter estimaterne i en lineær regressionsmodel fordelt (givet normalfordelte afvigelser)? Prøv lige at simulere for at se på det... DTU Compute Introduktion til Statistik Efterår / 56
21 Statistik og lineær regression Hvordan er parameter estimaterne i en lineær regressionsmodel fordelt (givet normalfordelte afvigelser)? De er normalfordelte og deres varians kan estimeres: Theorem 5.7 (første del) V[ ˆβ 0 ] = σ 2 n + x2 σ 2 S xx V[ ˆβ 1 ] = σ 2 S xx Cov[ ˆβ 0, ˆβ 1 ] = xσ 2 S xx Kovariansen Cov[ ˆβ 0, ˆβ 1 ] (covariance) gør vi ikke mere ud af her. DTU Compute Introduktion til Statistik Efterår / 56
22 Statistik og lineær regression Estimater af standardafvigelserne på ˆβ 0 og ˆβ 1 Theorem 5.7 (anden del) Where σ 2 is usually replaced by its estimate ( ˆσ 2 ). The central estimator for σ 2 is ˆσ 2 = RSS( ˆβ 0, ˆβ 1 ) n 2 = n i=1 e2 i n 2. When the estimate of σ 2 is used the variances also become estimates and we ll refer to them as ˆσ 2 β 0 and ˆσ 2 β 1. Estimat af standardafvigelserne for ˆβ 0 og ˆβ 1 (ligningerne (5-73)) ˆσ β0 = ˆσ 1 n + x2 S xx ; 1 ˆσ β1 = ˆσ n i=1 (x i x) 2 DTU Compute Introduktion til Statistik Efterår / 56
23 Statistik og lineær regression Spørgsmål: Om fejlenes spredning σ (socrative.com-room:pbac) A B y data punkter linear fit y data punkter linear fit x x For hvilken er residual variansen ˆσ 2 = RSS( ˆβ 0, ˆβ 1 ) n 2 = n i=1 e2 i n 2 størst? A: For fit i plot A B: For fit i plot B C: Lige stor for begge D: Ved ikke Svar A: For fit i plot A er ˆσ ca. 100 og for fit i plot B ca. 20 DTU Compute Introduktion til Statistik Efterår / 56
24 Statistik og lineær regression Spørgsmål: Om fejlenes spredning σ (socrative.com-room:pbac) y A data punkter linear fit y B data punkter linear fit x x For hvilken er residual variansen ˆσ 2 = RSS( ˆβ 0, ˆβ 1 ) n 2 = n i=1 e2 i n 2 størst? A: For fit i plot A B: For fit i plot B C: Lige stor for begge D: Ved ikke Svar C: Lige stor for begge, omkring 200 DTU Compute Introduktion til Statistik Efterår / 56
25 Hypotesetests og konfidensintervaller for ˆβ0 og ˆβ1 Hypotesetests for parameter parametrene Vi kan altså udføre hypotesetests for parameter estimater i en lineær regressionsmodel: H 0,i : β i = β 0,i H 1,i : β i β 1,i Vi bruger de t-fordelte statistikker: Theorem 5.11 Under the null-hypothesis (β 0 = β 0,0 and β 1 = β 0,1 ) the statistics T β0 = ˆβ 0 β 0,0 ˆσ β0 ; T β1 = ˆβ 1 β 0,1 ˆσ β1, are t-distributed with n 2 degrees of freedom, and inference should be based on this distribution. DTU Compute Introduktion til Statistik Efterår / 56
26 Hypotesetests og konfidensintervaller for ˆβ0 og ˆβ1 Eksempel: Hypotesetest for parametrene Se Eksempel 5.12 for eksempel på hypotesetest Test om parametrene er signifikant forskellige fra 0 Se resultatet med simulering i R ## Hypotesetests for signifikante parametre H 0,i : β i = 0 H 1,i : β i 0 ## Generer x x <- runif(n=20, min=-2, max=4) ## Simuler Y beta0=50; beta1=200; sigma=90 y <- beta0 + beta1 * x + rnorm(n=length(x), mean=0, sd=sigma) ## Brug lm() til at udregne estimaterne fit <- lm(y ~ x) ## Se summary, deri står hvad vi har brug for summary(fit) DTU Compute Introduktion til Statistik Efterår / 56
27 Hypotesetests og konfidensintervaller for ˆβ0 og ˆβ1 Konfidensintervaller for parametrene Method 5.14 (1 α) confidence intervals for β 0 and β 1 are given by ˆβ 0 ± t 1 α/2 ˆσ β0 ˆβ 1 ± t 1 α/2 ˆσ β1 where t 1 α/2 is the (1 α/2)-quantile of a t-distribution with n 2 degrees of freedom. husk at ˆσ β0 og ˆσ β1 findes ved ligningerne (5-74) i R kan ˆσ β0 og ˆσ β1 aflæses ved Std. Error ved summary(fit) DTU Compute Introduktion til Statistik Efterår / 56
28 Hypotesetests og konfidensintervaller for ˆβ0 og ˆβ1 Simuleringseksempel: Konfidensintervaller for parametrene ## Lav konfidensintervaller for parametrene ## Antal gentagelser nrepeat <- 100 ## Fangede vi den rigtige parameter TrueValInCI <- logical(nrepeat) ## Gentag simuleringen og estimeringen nrepeat gange for(i in 1:nRepeat){ ## Generer x x <- runif(n=20, min=-2, max=4) ## Simuler y beta0=50; beta1=200; sigma=90 y <- beta0 + beta1 * x + rnorm(n=length(x), mean=0, sd=sigma) ## Brug lm() til at udregne estimaterne fit <- lm(y ~ x) ## Heldigvis kan R beregne konfidensintervallet (level=1-alpha) (ci <- confint(fit, "(Intercept)", level=0.95)) ## Var den rigtige parameterværdi "fanget" af intervallet? (TrueValInCI[i] <- ci[1] < beta0 & beta0 < ci[2]) } ## Hvor ofte blev den rigtige værdi "fanget"? sum(truevalinci) / nrepeat DTU Compute Introduktion til Statistik Efterår / 56
29 Hypotesetests og konfidensintervaller for ˆβ0 og ˆβ1 Spørgsmål: Om fordelingen af ˆβ 1 (socrative.com-room:pbac) y Simuleret data med linear model n = x data punkter linear model pdf pdf pdf A B C Hvilket plot repræsenterer fordelingen af ˆβ 1? A: Plot A B: Plot B C: Plot C D: Ved ikke Svar A: β 1 er negativ (β 1 = 25) og fordelingen af ˆβ 1 er centreret i β 1 DTU Compute Introduktion til Statistik Efterår / 56
30 Hypotesetests og konfidensintervaller for ˆβ0 og ˆβ1 Spørgsmål: Om fordelingen af ˆβ 1 β 0,1 ˆσ β1 (socrative.com-room:pbac) y Simuleret data med linear model n = x data punkter linear model pdf pdf pdf A B C Hvilket plot repræsenterer fordelingen af ˆβ 1 β 0,1 ˆσ β1 under H 0 : β 0,1 = 25? A: Plot A B: Plot B C: Plot C D: Ved ikke ˆβ Svar C: 1 β 0,1 ˆσ følger under H 0 en t-fordeling, dvs. centreret i 0 β1 DTU Compute Introduktion til Statistik Efterår / 56
31 Konfidensinterval og prædiktionsinterval Konfidensinterval for linien Method 5.17: Konfidensinterval for β 0 + β 1 x 0 Konfidensinterval for β 0 + β 1 x 0 svarer til et konfidensinterval for linien i punktet x 0 Beregnes med ( β ˆ 0 + β ˆ 1 1 x 0 ) ± t α/2 ˆσ n + (x 0 x) 2 S xx Der er 100(1 α)% sandsynlighed for at den rigtige linie, altså β 0 + β 1 x 0, er inde i konfidensintervallet DTU Compute Introduktion til Statistik Efterår / 56
32 Konfidensinterval og prædiktionsinterval Prædiktionsinterval Method 5.17: Prædiktionsinterval for β 0 + β 1 x 0 + ε 0 Prædiktionsintervallet (prediction interval) for Y 0 beregnes for en ny værdi af x i, her kaldt x 0 Dette gøres før Y 0 observeres ved ( β ˆ 0 + ˆβ 1 x 0 ) ± t α/2 ˆσ n + (x 0 x) 2 S xx Der er 100(1 α)% sandsynlighed for at den observerede y 0 vil falde inde i prædiktionsintervallet Et prædiktionsinterval bliver altid større end et konfidensinterval for fastholdt α DTU Compute Introduktion til Statistik Efterår / 56
33 Konfidensinterval og prædiktionsinterval Prædiktionsinterval Eksempel med konfidensinterval for linien ## Eksempel med konfidensinterval for linien ## Lav en sekvens af x værdier xval <- seq(from=-2, to=6, length.out=100) ## Brug predict funktionen CI <- predict(fit, newdata=data.frame(x=xval), interval="confidence", level=.95) ## Se lige hvad der kom head(ci) ## Plot data, model og intervaller plot(x, y, pch=20) abline(fit) lines(xval, CI[, "lwr"], lty=2, col="red", lwd=2) lines(xval, CI[, "upr"], lty=2, col="red", lwd=2) y x DTU Compute Introduktion til Statistik Efterår / 56
34 Konfidensinterval og prædiktionsinterval Prædiktionsinterval Eksempel med prædiktionsinterval ## Eksempel med prædiktionsinterval ## Lav en sekvens a x værdier xval <- seq(from=-2, to=6, length.out=100) ## Beregn interval for hvert x PI <- predict(fit, newdata=data.frame(x=xval), interval="prediction", level=.95) ## Se lige hvad der kom tilbage head(pi) ## Plot data, model og intervaller plot(x, y, pch=20) abline(fit) lines(xval, PI[, "lwr"], lty=2, col="blue", lwd=2) lines(xval, PI[, "upr"], lty=2, col="blue", lwd=2) y x DTU Compute Introduktion til Statistik Efterår / 56
35 summary(lm()) wrap up Hvad bliver mere skrevet ud af summary? ## ## Call: ## lm(formula = y ~ x) ## ## Residuals: ## Min 1Q Median 3Q Max ## ## ## Coefficients: ## Estimate Std. Error t value Pr(> t ) ## (Intercept) ## x e-11 *** ## --- ## Signif. codes: 0 '***' '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 ## ## Residual standard error: 100 on 18 degrees of freedom ## Multiple R-squared: 0.923,Adjusted R-squared: ## F-statistic: 216 on 1 and 18 DF, p-value: 1.8e-11 DTU Compute Introduktion til Statistik Efterår / 56
36 summary(lm()) wrap up summary(lm(y x)) wrap up Residuals: Min 1Q Median 3Q Max: Residualernes: Minimum, 1. kvartil, Median, 3. kvartil, Maximum Coefficients: Estimate Std. Error t value Pr(> t ) "stjerner" Koefficienternes: Estimat ˆσ βi t obs p-værdi Testen er H 0,i : β i = 0 vs. H 1,i : β i 0 Stjernerne er sat efter p-værdien Residual standard error: XXX on XXX degrees of freedom ε i N(0,σ 2 ): Udskrevet er ˆσ og ν frihedsgrader (brug til hypotesetesten) Multiple R-squared: Forklaret varians r 2 XXX Resten bruger vi ikke i det her kursus DTU Compute Introduktion til Statistik Efterår / 56
37 Korrelation Forklaret varians og korrelation Forklaret varians af en model er r 2, i summary Multiple R-squared Beregnes med hvor ŷ i = ˆβ 0 + ˆβ 1 x i r 2 = 1 i(y i ŷ i ) 2 i (y i ȳ) 2 Andel af den totale varians i data (y i ) der er forklaret med modellen DTU Compute Introduktion til Statistik Efterår / 56
38 Korrelation Forklaret varians og korrelation Korrelationen ρ er et mål for lineær sammenhæng mellem to stokastiske variable Estimeret (i.e. empirisk) korrelation ˆρ = r = r 2 sgn( ˆβ 1 ) hvor sgn( ˆβ 1 ) er: 1 for ˆβ 1 0 og 1 for ˆβ 1 > 0 Altså: Positiv korrelation ved positiv hældning Negativ korrelation ved negativ hældning DTU Compute Introduktion til Statistik Efterår / 56
39 Korrelation Spørgsmål om korrelation (socrative.com-room:pbac) y r 2 = 1 i(y i ŷ i ) 2 i (y i ȳ) 2 = = = 0.89 r = x Hvad er korrelationen mellem x og y? A: ca B: ca. 0 C: ca Svar) C: ca DTU Compute Introduktion til Statistik Efterår / 56
40 Korrelation Spørgsmål om korrelation (socrative.com-room:pbac) y r 2 = 1 i(y i ŷ i ) 2 i (y i ȳ) 2 = = = 0.26 r = x Hvad er korrelationen mellem x og y? A: ca B: ca. 0 C: ca. 0.5 Svar) A: ca DTU Compute Introduktion til Statistik Efterår / 56
41 Korrelation Spørgsmål om korrelation (socrative.com-room:pbac) y r 2 = 1 i(y i ŷ i ) 2 i (y i ȳ) 2 = = 1 1 = 0 r = x Hvad er korrelationen mellem x og y? A: ca B: ca. 0 C: ca. 0.5 Svar) B: ca. 0 DTU Compute Introduktion til Statistik Efterår / 56
42 Korrelation Spørgsmål om korrelation (socrative.com-room:pbac) y r 2 = 1 i(y i ŷ i ) 2 i (y i ȳ) 2 = = 1 1 = r = x Hvad er korrelationen mellem x og y? A: ca B: ca. 0 C: ca. 0.5 Svar) B: ca. 0 DTU Compute Introduktion til Statistik Efterår / 56
43 Korrelation Test for signifikant korrelation Test for signifikant korrelation (lineær sammenhæng) mellem to variable H 0 : ρ = 0 H 1 : ρ 0 er ækvivalent med H 0 : β 1 = 0 H 1 : β 1 0 hvor ˆβ 1 er estimatet af hældningen i simpel lineær regressionsmodel DTU Compute Introduktion til Statistik Efterår / 56
44 Korrelation Simuleringseksempel om korrelation ## Korrelation ## Generer x x <- runif(n=20, min=-2, max=4) ## Simuler y beta0=50; beta1=200; sigma=90 y <- beta0 + beta1 * x + rnorm(n=length(x), mean=0, sd=sigma) ## Scatter plot plot(x,y) ## Brug lm() til at udregne estimaterne fit <- lm(y ~ x) ## Den rigtige linie abline(beta0, beta1) ## Plot fittet abline(fit, col="red") ## Se summary, deri står hvad vi har brug for summary(fit) ## Korrelation mellem x og y cor(x,y) ## Kvadreret er den "Multiple R-squared" fra summary(fit) cor(x,y)^2 DTU Compute Introduktion til Statistik Efterår / 56
45 Residual Analysis: Model kontrol Residual Analysis Method 5.26 Check normality assumption with qq-plot. Check (non)systematic behavior by plotting the residuals e i as a function of fitted values ŷ i DTU Compute Introduktion til Statistik Efterår / 56
46 Residual Analysis in R Residual Analysis: Model kontrol fit <- lm(y ~ x) par(mfrow = c(1, 2)) qqnorm(fit$residuals) qqline(fit$residuals) plot(fit$fitted, fit$residuals, xlab='fitted values', ylab='residuals') Normal Q-Q Plot Sample Quantiles Residuals Theoretical Quantiles Fitted values DTU Compute Introduktion til Statistik Efterår / 56
47 Outline Outline 1 Motiverende eksempel: Højde-vægt 2 Lineær regressionsmodel 3 Mindste kvadraters metode (least squares) 4 Statistik og lineær regression 5 Hypotesetests og konfidensintervaller for ˆβ 0 og ˆβ 1 6 Konfidensinterval og prædiktionsinterval Konfidensinterval for linien Prædiktionsinterval 7 summary(lm()) wrap up 8 Korrelation 9 Residual Analysis: Model kontrol DTU Compute Introduktion til Statistik Efterår / 56
Kursus 02323: Introducerende Statistik. Forelæsning 8: Simpel lineær regression. Peder Bacher
Kursus 02323: Introducerende Statistik Forelæsning 8: Simpel lineær regression Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:
Læs mereOversigt. 1 Motiverende eksempel: Højde-vægt. 2 Lineær regressionsmodel. 3 Mindste kvadraters metode (least squares)
Kursus 02402/02323 Introducerende Statistik Forelæsning 8: Simpel lineær regression Oversigt Motiverende eksempel: Højde-vægt 2 Lineær regressionsmodel 3 Mindste kvadraters metode (least squares) Klaus
Læs mereenote 5: Simpel lineær regressions analyse Kursus 02402/02323 Introducerende Statistik Oversigt
enote 5: Simpel lineær regressions analse Kursus 02402/02323 Introducerende Statistik Forelæsning 8: Simpel lineær regression To variable: og Beregn mindstekvadraters estimat af ret linje Inferens med
Læs mereForelæsning 11: Kapitel 11: Regressionsanalyse
Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Læs mereOversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode
Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse
Læs meremen nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller
Type I og type II fejl Type I fejl: forkast når hypotese sand. α = signifikansniveau= P(type I fejl) Program (8.15-10): Hvis vi forkaster når Z < 2.58 eller Z > 2.58 er α = P(Z < 2.58) + P(Z > 2.58) =
Læs mereØkonometri Lektion 1 Simpel Lineær Regression 1/31
Økonometri Lektion 1 Simpel Lineær Regression 1/31 Simpel Lineær Regression Mål: Forklare variablen y vha. variablen x. Fx forklare Salg (y) vha. Reklamebudget (x). Statistisk model: Vi antager at sammenhængen
Læs mereForelæsning 11: Envejs variansanalyse, ANOVA
Kursus 02323: Introduktion til Statistik Forelæsning 11: Envejs variansanalyse, ANOVA Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark
Læs merek UAFHÆNGIGE grupper Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen 4 Hypotesetest (F-test)
Kursus 02323: Introduktion til Statistik Forelæsning 11: Envejs variansanalse, ANOVA Peder Bacher DTU Compute, Dnamiske Sstemer Bgning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lngb Danmark e-mail:
Læs mereKursus 02402/02323 Introduktion til statistik. Forelæsning 13: Et overblik over kursets indhold. Klaus K. Andersen og Per Bruun Brockhoff
Kursus 02402/02323 Introduktion til statistik Forelæsning 13: Et overblik over kursets indhold Klaus K. Andersen og Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Danmarks Tekniske Universitet
Læs mereAnvendt Statistik Lektion 7. Simpel Lineær Regression
Anvendt Statistik Lektion 7 Simpel Lineær Regression 1 Er der en sammenhæng? Plot af mordraten () mod fattigdomsraten (): Scatterplot Afhænger mordraten af fattigdomsraten? 2 Scatterplot Et scatterplot
Læs mereStatistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge
Statistik og Sandsynlighedsregning 2 IH kapitel 12 Overheads til forelæsninger, mandag 6. uge 1 Fordelingen af én (1): Regressionsanalyse udfaldsvariabel responsvariabel afhængig variabel Y variabel 2
Læs mereAnvendt Statistik Lektion 8. Multipel Lineær Regression
Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke
Læs mereMuligheder: NB: test for µ 1 = µ 2 i model med blocking ækvivalent med parret t-test! Ide: anskue β j som stikprøve fra normalfordeling.
Eksempel: dæktyper og brændstofforbrug (opgave 25 side 319) Program: cars 1 2 3 4 5... radial 4.2 4.7 6.6 7.0 6.7... belt 4.1 4.9 6.2 6.9 6.8... Muligheder: 1. vi starter med at gennemgå opgave 7 side
Læs mereAnalysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17
nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse
Læs mereForelæsning 11: Tovejs variansanalyse, ANOVA
Introduktion til Statistik Forelæsning 11: Tovejs variansanalyse, ANOVA Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk
Læs mereForelæsning 4: Konfidensinterval for middelværdi (og spredning)
Introduktion til Statistik Forelæsning 4: Konfidensinterval for middelværdi (og spredning) Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark
Læs mereLøsning til eksaminen d. 14. december 2009
DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,
Læs mere1 enote 1: Simple plots og deskriptive statistik. 2 enote2: Diskrete fordelinger. 3 enote 2: Kontinuerte fordelinger
Kursus 02402/02323 Introduktion til statistik Forelæsning 13: Et overblik over kursets indhold Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Building 324, Room 220 Danish Technical University
Læs mereStatistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge
Statistik og Sandsynlighedsregning 2 Repetition og eksamen Overheads til forelæsninger, mandag 7. uge 1 Normalfordelingen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange
Læs mereMLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som
MLR antagelserne Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som y = β 0 + β 1 x 1 + β 2 x 2 + + β k x k + u, hvor β 0, β 1, β 2,...,β k er ukendte parametere,
Læs mereNormalfordelingen. Statistik og Sandsynlighedsregning 2
Normalfordelingen Statistik og Sandsynlighedsregning 2 Repetition og eksamen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige fejl på
Læs mereProgram: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19
Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større
Læs mereTænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i.
Repetition af vektor-regning Økonometri: Lektion 3 Matrix-formulering Fordelingsantagelse Hypotesetest Antag vi har to n-dimensionelle (søjle)vektorer a 1 b 1 a 2 a =. og b = b 2. a n b n Tænk på a og
Læs mereMultipel Lineær Regression
Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer
Læs mere1 Regressionsproblemet 2
Indhold 1 Regressionsproblemet 2 2 Simpel lineær regression 3 2.1 Mindste kvadraters tilpasning.............................. 3 2.2 Prædiktion og residualer................................. 5 2.3 Estimation
Læs mereModul 6: Regression og kalibrering
Forskningsenheden for Statistik ST501: Science Statistik Bent Jørgensen Modul 6: Regression og kalibrering 6.1 Årsag og virkning................................... 1 6.2 Kovarians og korrelation...............................
Læs mereKursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff
Kursus 02402 Introduktion til Statistik Forelæsning 13: Summary Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:
Læs mereLineær regression. Simpel regression. Model. ofte bruges følgende notation:
Lineær regression Simpel regression Model Y i X i i ofte bruges følgende notation: Y i 0 1 X 1i i n i 1 i 0 Findes der en linie, der passer bedst? Metode - Generel! least squares (mindste kvadrater) til
Læs mereMindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning
1 Regressionsproblemet 2 Simpel lineær regression Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 3
Læs mereEksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning
1 Multipel regressions model Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning PSE (I17) ASTA - 11. lektion
Læs mereSimpel Lineær Regression
Simpel Lineær Regression Mål: Forklare variablen y vha. variablen x. Fx forklare Salg (y) vha. Reklamebudget (x). Vi antager at sammenhængen mellem y og x er beskrevet ved y = β 0 + β 1 x + u. y: Afhængige
Læs mereKursus 02323: Introducerende Statistik. Forelæsning 12: Forsøgsplanlægning. Peder Bacher
Kursus 02323: Introducerende Statistik Forelæsning 12: Forsøgsplanlægning Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk
Læs mereLøsning eksamen d. 15. december 2008
Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th
Læs mereØkonometri lektion 5 Multipel Lineær Regression. Inferens Modelkontrol Prædiktion
Økonometri lektion 5 Multipel Lineær Regression Inferens Modelkontrol Prædiktion Multipel Lineær Regression Data: Sæt af oservationer (x i, x i,, x ki, y i, i,,n y i er den afhængige variael x i, x i,,
Læs mereLøsning til eksaminen d. 29. maj 2009
DTU Informatik 02402 Introduktion til Statistik 20-2-01 LFF/lff Løsning til eksaminen d. 29. maj 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th
Læs mereReminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model
Reminder: Hypotesetest for én parameter Antag vi har model Økonometri: Lektion 4 F -test Justeret R 2 Aymptotiske resultater y = β 0 + β 1 x 2 + β 2 x 2 + + β k x k + u. Vi ønsker at teste hypotesen H
Læs mereØkonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol
Økonometri: Lektion 5 Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol 1 / 35 Veksekvirkning: Motivation Vi har set på modeller som Price
Læs mereNormalfordelingen. Statistik og Sandsynlighedsregning 2
Statistik og Sandsynlighedsregning 2 Repetition og eksamen T-test Normalfordelingen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige
Læs merek UAFHÆNGIGE grupper F-test Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen
Introduktion til Statistik Forelæsning 10: Envejs variansanalyse, ANOVA Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 017 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk
Læs mereOpgavebesvarelse, brain weight
Opgavebesvarelse, brain weight (Matthews & Farewell: Using and Understanding Medical Statistics, 2nd. ed.) For 20 nyfødte mus er der i tabellen nedenfor anført oplysning om kuldstørrelsen (fra 3 til 12
Læs mereEksamen Bacheloruddannelsen i Medicin med industriel specialisering
Eksamen 2016 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 17-02-2015 Tid: kl. 09.00-11.00 Bedømmelsesform
Læs mereØkonometri: Lektion 4. Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater
Økonometri: Lektion 4 Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater 1 / 35 Hypotesetest for én parameter Antag vi har model y = β 0 + β 1 x 2 + β 2 x 2 + + β k x k + u. Vi
Læs mereKlasseøvelser dag 2 Opgave 1
Klasseøvelser dag 2 Opgave 1 1.1. Vi sætter først working directory og data indlæses: library( foreign ) d
Læs mere1 enote 1: Simple plots og deskriptive statistik. 2 enote 2: Diskrete fordelinger. 3 enote 2: Kontinuerte fordelinger
Kursus 02402/02323 Introduktion til statistik Forelæsning 13: Et overblik over kursets indhold Peder Bacher DTU Compute, Dynamiske Systemer Building 303B, Room 017 Danish Technical University 2800 Lyngby
Læs mereTo samhørende variable
To samhørende variable Statistik er tal brugt som argumenter. - Leonard Louis Levinsen Antagatviharn observationspar x 1, y 1,, x n,y n. Betragt de to tilsvarende variable x og y. Hvordan måles sammenhængen
Læs mere(tæt på N(0,1) hvis n ikke alt for lille). t i god til at checke for outliers som kan have stor indflydelse på estimaterne s 2 og ˆσ 2 e i
Da er r i = e i ˆσ ei t(n 3) (tæt på N(0,1) hvis n ikke alt for lille). Program 1. lineær regression: opgave 3 og 13 (sukker-temperatur). 2. studentiserede residualer, multipel regression. Tommelfinger-regel:
Læs mereØkonometri: Lektion 6 Emne: Heteroskedasticitet
Økonometri: Lektion 6 Emne: Heteroskedasticitet 1 / 32 Konsekvenser af Heteroskedasticitet Antag her (og i resten) at MLR.1 til MLR.4 er opfyldt. Antag MLR.5 ikke er opfyldt, dvs. vi har heteroskedastiske
Læs mereGenerelle lineære modeller
Generelle lineære modeller Regressionsmodeller med én uafhængig intervalskala variabel: Y en eller flere uafhængige variable: X 1,..,X k Den betingede fordeling af Y givet X 1,..,X k antages at være normal
Læs mereIntroduktion til Statistik. Forelæsning 3: Kontinuerte fordelinger. Peder Bacher
Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk
Læs mereKapitel 11 Lineær regression
Kapitel 11 Lineær regression Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 1 Indledning Vi modellerer en afhængig variabel (responset) på baggrund af en uafhængig variabel (stimulus),
Læs mereForelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)
Kursus 02402 Introduktion til Statistik Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske
Læs mereKursus 02402/02323 Introducerende Statistik. Forelæsning 9: Multipel lineær regression. Klaus K. Andersen og Per Bruun Brockhoff
Kursus 02402/02323 Introducerende Statistik Forelæsning 9: Multipel lineær regression Klaus K. Andersen og Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Danmarks Tekniske Universitet 2800 Lyngby
Læs mereEn Introduktion til SAS. Kapitel 5.
En Introduktion til SAS. Kapitel 5. Inge Henningsen Afdeling for Statistik og Operationsanalyse Københavns Universitet Marts 2005 6. udgave Kapitel 5 T-test og PROC UNIVARIATE 5.1 Indledning Dette kapitel
Læs mereEnsidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese
Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik Bygning 305/324 Danmarks Tekniske Universitet
Læs mereLagrange multiplier test. Økonometri: Lektion 6 Håndtering ad heteroskedasticitet. Konsekvenser af Heteroskedasticitet
Lagrange multiplier test Et alternativ til F -testet af en eller flere parametre. Økonometri: Lektion 6 Håndtering ad heteroskedasticitet Antag vi har model: y = β 0 + β 1 x 2 + + β k x k + u. Vi ønsker
Læs mereØkonometri: Lektion 6 Emne: Heteroskedasticitet
Økonometri: Lektion 6 Emne: Heteroskedasticitet 1 / 34 Lagrange multiplier test Et alternativ til F -testet af en eller flere parametre. Antag vi har model: Vi ønsker at teste hypotesen y = β 0 + β 1 x
Læs mereStatistik Lektion 16 Multipel Lineær Regression
Statistik Lektion 6 Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk
Læs mereLineær regression i SAS. Lineær regression i SAS p.1/20
Lineær regression i SAS Lineær regression i SAS p.1/20 Lineær regression i SAS Simpel lineær regression Grafisk modelkontrol Multipel lineær regression SAS-procedurer: PROC REG PROC GPLOT Lineær regression
Læs mereKursus 02402/02323 Introducerende Statistik. Forelæsning 6: Sammenligning af to grupper
Kursus 02402/02323 Introducerende Statistik Forelæsning 6: Sammenligning af to grupper Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark
Læs mere1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer.
Vejledende besvarelse af hjemmeopgave Basal statistik, efterår 2008 En gruppe bestående af 45 patienter med reumatoid arthrit randomiseres til en af 6 mulige behandlinger, nemlig placebo, aspirin eller
Læs mereEpidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse
Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Institut for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression Regressionsanalyse Regressionsanalyser
Læs mereBesvarelse af vitcap -opgaven
Besvarelse af -opgaven Spørgsmål 1 Indlæs data Dette gøres fra Analyst med File/Open, som sædvanlig. Spørgsmål 2 Beskriv fordelingen af vital capacity og i de 3 grupper ved hjælp af summary statistics.
Læs mere12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse
. september 5 Epidemiologi og biostatistik. Forelæsning Uge, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression
Læs mereØkonometri: Lektion 2 Multipel Lineær Regression 1/27
Økonometri: Lektion 2 Multipel Lineær Regression 1/27 Multipel Lineær Regression Sidst så vi på simpel lineær regression, hvor y er forklaret af én variabel. Der er intet, der forhindre os i at have mere
Læs mereEpidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk
Eksempel: Systolisk blodtryk Udgangspunkt: Vi ønsker at prædiktere det systoliske blodtryk hos en gruppe af personer. Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Afdeling for Biostatistik.
Læs mereModule 3: Statistiske modeller
Department of Statistics ST502: Statistisk modellering Pia Veldt Larsen Module 3: Statistiske modeller 31 ANOVA 1 32 Variabelselektion 4 321 Multipel determinationskoefficient 5 322 Variabelselektion med
Læs mereModul 11: Simpel lineær regression
Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 11: Simpel lineær regression 11.1 Regression uden gentagelser............................. 1 11.1.1 Oversigt....................................
Læs mereOpgave 11.4 side 316 (7ed: 11.4, side 352 og 6ed: 11.2, side 345)
Kursus 4: Besvarelser til øvelses- og hjemmeopgaver i uge 11 Opgave 11.4 side 316 (7ed: 11.4, side 35 og 6ed: 11., side 345) Opgaven består i at foretage en regressionsanalse. Først afbildes data som i
Læs mereAppendiks Økonometrisk teori... II
Appendiks Økonometrisk teori... II De klassiske SLR-antagelser... II Hypotesetest... VII Regressioner... VIII Inflation:... VIII Test for SLR antagelser... IX Reset-test... IX Plots... X Breusch-Pagan
Læs mereStatistik Lektion 17 Multipel Lineær Regression
Statistik Lektion 7 Multipel Lineær Regression Polynomiel regression Ikke-lineære modeller og transformation Multi-kolinearitet Auto-korrelation og Durbin-Watson test Multipel lineær regression x,x,,x
Læs mereVi ønsker at konstruere normalområder for stofskiftet, som funktion af kropsvægten.
Opgavebesvarelse, Resting metabolic rate I filen T:\rmr.txt findes sammenhørende værdier af kropsvægt (bw, i kg) og hvilende stofskifte (rmr, kcal pr. døgn) for 44 kvinder (Altman, 1991 og Owen et.al.,
Læs mereOversigt. 1 Intro: Regneeksempel og TV-data fra B&O. 2 Model og hypotese. 3 Beregning - variationsopspaltning og ANOVA tabellen
Kursus 02402/02323 Introducerende Statistik Forelæsning 10: Envejs variansanalyse, ANOVA Oversigt 1 Intro: Regneeksempel og TV-data fra B&O 2 Model og hypotese Per Bruun Brockhoff DTU Compute, Statistik
Læs mereI dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd
I dag Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik SaSt) Helle Sørensen Først lidt om de sidste uger af SaSt. Derefter statistisk analyse af en enkelt
Læs mereenote 2: Kontinuerte fordelinger Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher enote 2: Continuous Distributions
Introduktion til Statistik Forelæsning 3: Kontinuerte fordelinger Peder Bacher DTU Compute, Dynamiske Systemer Bygning 33B, Rum 9 Danmarks Tekniske Universitet 28 Lyngby Danmark e-mail: pbac@dtu.dk Efterår
Læs mereSide 1 af 19 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402
Danmarks Tekniske Universitet Side 1 af 19 sider. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)
Læs mere(studienummer) (underskrift) (bord nr)
Danmarks Tekniske Universitet Side 1 af 22 sider. Skriftlig prøve: 13. december 2010 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)
Læs mereForelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6
Kursus 02402 Introduktion til Statistik Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup). 7.4-7.6 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220
Læs mereModel. k = 3 grupper: hvor ǫ ij uafhængige og normalfordelte med middelværdi nul og varians σi 2, i = 1,2,3.
Model Program (8.15-10): 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. Bruger nu to indices: i = 1,...,k for gruppenr. og j = 1,...,n i for observation indenfor gruppe. k = 3 grupper: µ 1
Læs mereKonfidensintervaller og Hypotesetest
Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller
Læs mereLogistisk Regression - fortsat
Logistisk Regression - fortsat Likelihood Ratio test Generel hypotese test Modelanalyse Indtil nu har vi set på to slags modeller: 1) Generelle Lineære Modeller Kvantitav afhængig variabel. Kvantitative
Læs mereβ = SDD xt SSD t σ 2 s 2 02 = SSD 02 f 02 i=1
Lineær regression Lad x 1,..., x n være udfald af stokastiske variable X 1,..., X n og betragt modellen M 2 : X i N(α + βt i, σ 2 ) hvor t i, i = 1,..., n, er kendte tal. Konkret analyseres (en del af)
Læs mereOpgavebesvarelse, brain weight
Opgavebesvarelse, brain weight (Matthews & Farewell: Using and Understanding Medical Statistics, 2nd. ed.) Spørgsmål 1 Data er indlagt på T:/Basalstatistik/brain.txt og kan indlæses direkte i Analyst med
Læs mereI dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt)
I dag Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt) Helle Sørensen Repetition vha eksempel om dagligvarepriser Analyse med R: ttest
Læs mereOversigt. Introduktion til Statistik. Forelæsning 2: Stokastisk variabel og diskrete fordelinger
Introduktion til Statistik Forelæsning 2: og diskrete fordelinger Oversigt 1 2 3 Fordelingsfunktion 4 Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 017 Danmarks Tekniske Universitet 2800
Læs mereKvantitative metoder 2
Kvantitative metoder 2 Den multiple regressionsmodel 5. marts 2007 regressionsmodel 1 Dagens program Emnet for denne forelæsning er stadig den multiple regressionsmodel (Wooldridge kap. 3.4-3.5, E.2) Variansen
Læs mereIntroduktion til Statistik. Forelæsning 5: Hypotesetest, power og modelkontrol - one sample. Peder Bacher
Introduktion til Statistik Forelæsning 5: Hypotesetest, power og modelkontrol - one sample Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark
Læs mereSkriftlig eksamen Science statistik- ST501
SYDDANSK UNIVERSITET INSTITUT FOR MATEMATIK OG DATALOGI Skriftlig eksamen Science statistik- ST501 Torsdag den 21. januar Opgavesættet består af 5 opgaver, med i alt 13 delspørgsmål, som vægtes ligeligt.
Læs mereKursus 02402 Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff
Kursus 02402 Introduktion til Statistik Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, (7.7-7.8,8.1-8.5) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks
Læs mere3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve
Læs mereFaculty of Health Sciences. Regressionsanalyse. Simpel lineær regression, Lene Theil Skovgaard. Biostatistisk Afdeling
Faculty of Health Sciences Regressionsanalyse Simpel lineær regression, 28-2-2013 Lene Theil Skovgaard Biostatistisk Afdeling 1 / 67 Simpel lineær regression Regression og korrelation Simpel lineær regression
Læs mereMultipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression
Multipel Linear Regression Repetition Partiel F-test Modelsøgning Logistisk Regression Test for en eller alle parametre I jagten på en god statistisk model har vi set på følgende to hypoteser og tilhørende
Læs merePerspektiver i Matematik-Økonomi: Linær regression
Perspektiver i Matematik-Økonomi: Linær regression Jens Ledet Jensen H2.21, email: jlj@imf.au.dk Perspektiver i Matematik-Økonomi: Linær regression p. 1/34 Program for i dag 1. Indledning: sammenhæng mellem
Læs mere(studienummer) (underskrift) (bord nr)
Danmarks Tekniske Universitet Side 1 af 19 sider. Skriftlig prøve: 14. december 2013 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)
Læs mereForelæsning 9: Multipel lineær regression
Introduktion til Statistik Forelæsning 9: Multipel lineær regression Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail: pbac@dtu.dk
Læs mereSimpel Lineær Regression: Model
Simpel Lineær Regression: Model Sidst så vi på simpel lineære regression. Det er en statisisk model på formen y = β 0 + β 1 x + u, hvor fejlledet u, har egenskaben E[u x] = 0. Dette betyder bl.a. E[y x]
Læs mere(studienummer) (underskrift) (bord nr)
Danmarks Tekniske Universitet Side 1 af 18 sider. Skriftlig prøve: 14. december 2009 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)
Læs mereIkke-parametriske tests
Ikke-parametriske tests 2 Dagens menu t testen Hvordan var det nu lige det var? Wilcoxson Mann Whitney U Kruskall Wallis Friedman Kendalls og Spearmans correlation 3 t-testen Patient Drug Placebo difference
Læs mereProgram. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration
Faculty of Life Sciences Program Modelkontrol og prædiktion Claus Ekstrøm E-mail: ekstrom@life.ku.dk Test af hypotese i ensidet variansanalyse F -tests og F -fordelingen. Multiple sammenligninger. Bonferroni-korrektion
Læs meregrupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen
1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen
Læs mere