Linear regression. Statistical modelling. Gilles Guillot. September 17,
|
|
- Christina Gregersen
- 5 år siden
- Visninger:
Transkript
1 Linear regression Statistical modelling Gilles Guillot September 17, 2013 Gilles Guillot Linear regression September 17, / 33
2 Example Example Concentration of DDT (a toxic chemical) in 15 pike sh as a function of sh age... See le pike_data.txt in data folder. Gilles Guillot (gigu@dtu.dk) Linear regression September 17, / 33
3 Example Various questions Does concentration increase with age? How much? Parameter estimation (aka inference) How much condence should we place in the answer? Testing signicance, model checking What is the average concentration of a 3.5 or 8 year old sh? Prediction Gilles Guillot (gigu@dtu.dk) Linear regression September 17, / 33
4 Describing a linear pattern Empirical covariance and correlation I Denition: Empirical covariance Cov(x, y) = 1 (x i x)(y i ȳ) n i Tends to be large when x i and y i are large simultaneously. Hence quanties how much x and y co-vary together. The covariance is scale-dependent: Cov(ax, y) = acov(x, y) Gilles Guillot (gigu@dtu.dk) Linear regression September 17, / 33
5 Describing a linear pattern Empirical covariance and correlation II Denition: Empirical correlation (aka Pearson's correlation coef.) i Cor(x, y) = (x i x)(y i ȳ) i (x i x) 2 i (y i ȳ) 2 Cor. = Cov. rescaled by standard deviations Gilles Guillot (gigu@dtu.dk) Linear regression September 17, / 33
6 Describing a linear pattern Correlation coecient: interpretation and pitfalls Correlation for various data patterns (reprinetd from wikipedia) Gilles Guillot (gigu@dtu.dk) Linear regression September 17, / 33
7 Describing a linear pattern The correlation coecient ρ does not tell the whole story All four sets have identical ρ 0.816, but vary considerably when graphed. Data plotted above are synthetic data made up by F. Anscombe in 1973 to illustrate the pitfalls associated with ρ. Gilles Guillot (gigu@dtu.dk) Linear regression September 17, / 33
8 Describing a linear pattern Structure eect (aka Simpson's paradox) Quick interpretation of ρ values can lead to erroneaous conclusions. See also Simpson's eect on wikipedia for further detail and examples. Gilles Guillot (gigu@dtu.dk) Linear regression September 17, / 33
9 The simple regression model The simple regression model Notation: x 1,..., x n ages of the various individiduals, y 1,..., y n DDT concentrations The simple linear model Y i = ax i + b + ε i the x i s are deterministic variables (a somehow arbitrary modelling choice) a and b are unknown deterministic coecients the ε i 's are independent realisations of a N (0, σ 2 ) variable (made for convienience, consistency with data has to be checked, see later) There are three parameters in this problem: (a, b, σ) = θ Gilles Guillot (gigu@dtu.dk) Linear regression September 17, / 33
10 Parameter estimation Least square error estimation For arbitrary values a and b, e i = y i ax i b measures the error made by the linear model on obs. i A good model should yield low errors on all observations Denition: the Least Square estimator The unknown parameters (a, b) are estimated as (a, b) LS that jointly minimize i (y i ax i b) 2. In math style: (a, b) LS = Argmin a,b (y i ax i b) 2 i Gilles Guillot (gigu@dtu.dk) Linear regression September 17, / 33
11 Parameter estimation Connection with lecture on Statistical Estimation (lecture 1) The vector (a, b) LS is an estimate of (a, b) The procedure Data (a, b) LS, i.e. the generic process associating an estimate to a dataset is an estimator This procedure or function is deterministic in the sense that the same dataset will yield the same estimate In the framework of this course, Data = (x i, y i ) i=1,...,n with Y i = ax i + b + ε i and where ε i is a random variable Data are random therefore (a, b) LS should be seen as random. Gilles Guillot (gigu@dtu.dk) Linear regression September 17, / 33
12 Parameter estimation Remarks and questions on the Least Square principle What if we attempt to minimize y i ax i b? What if we swap x and y? What if the data points are approximately located on a circle? Why the squared error? Gilles Guillot (gigu@dtu.dk) Linear regression September 17, / 33
13 Parameter estimation Explicit expression of (a, b) LS (a, b) LS = Argmin a,b (y i ax i b) 2 SSE(a, b) = i (y i ax i b) 2 is a second order polynomial in a and b i Solving a SSE(a, b) = 0 and SSE(a, b) = 0 yields: b Expression of MSE estimates: i â LS = (x i x)(y i ȳ) i (x i x) 2 and ˆbLS = ȳ â LS x Gilles Guillot (gigu@dtu.dk) Linear regression September 17, / 33
14 Parameter estimation Computational detail I Zero-ing the partial derivatives in a and b we get a SSE(a, b) = 2 i b SSE(a, b) = 2 i x i (y i ax i b) = 0 (1) (y i ax i b) = 0 (2) Hence a i x 2 i + b x i = i x i y i (3) a i x i + nb = i y i (4) We have a linear system in a and b. Gilles Guillot (gigu@dtu.dk) Linear regression September 17, / 33
15 Parameter estimation Computational detail II A subsitution yields: â LS = n i x iy i x i yi n x 2 i ( i x i) 2 (5) and ˆbLS = 1/n i x iy i xȳ 1/n x 2 i x2 (6) Gilles Guillot (gigu@dtu.dk) Linear regression September 17, / 33
16 Parameter estimation Estimating the variance σ 2 of the residuals I The LSE does not provide an estimate of σ 2. A reasonable idea could be to dene ˆε i = y i â LS x + ˆb LS and estimate σ 2 as 1 ˆε 2 i n. This would lead to a biased estimator i Gilles Guillot (gigu@dtu.dk) Linear regression September 17, / 33
17 Parameter estimation Estimating the variance σ 2 of the residuals II Unbiased estimate of σ 2 : We dene ˆσ 2 = 1 ˆε 2 i n 2 i with ˆε i = y i â LS x i + ˆb LS It is an unbiased estimator of σ 2, i.e. E[ˆσ 2 ] = σ 2 Gilles Guillot (gigu@dtu.dk) Linear regression September 17, / 33
18 Parameter estimation Connection to maximum likelihood estimation I Remember: in the Linear Model, the x i 's are considered deterministic. i.i.d And our model says: Y i = ax i + b + ε i and (ε i ) i=1,...,n N (0, σ 2 ). (i.i.d stands for independent and identically distributed) The two lines above can be re-written equivalently as indep. (Y i ) i=1,...,n N (ax i + b, σ 2 ) Gilles Guillot (gigu@dtu.dk) Linear regression September 17, / 33
19 Parameter estimation Connection to maximum likelihood estimation II The density of probability of Y i is Gaussian with mean µ i = ax i + b and variance σ 2 : [ f Yi (y) = 1 σ 2π exp 1 ( ) ] y axi b 2 2 σ The likelihood in this problem is L(y 1,..., y n ; a, b, σ) = n f Yi (y i ) = i=1 n i=1 [ 1 σ 2π exp 1 2 ( ) ] yi ax i b 2 σ Gilles Guillot (gigu@dtu.dk) Linear regression September 17, / 33
20 Parameter estimation Connection to maximum likelihood estimation III The log-likelihood (up to an additive constant) is: ( yi ax i b ) 2 l(a, b, σ) = ln L(a, b, σ) = n ln σ 1/2 i σ The MLE can be estimated by zero-ing a l(a, b, σ), bl(a, b, σ) and l(a, b, σ): σ a l(a, b, σ) = 1 σ 2 x i (y i ax i b) = 0 (7) i b l(a, b, σ) = 1 σ 2 (y i ax i b) = 0 (8) i σ l(a, b, σ) = n σ + 1 σ 3 (y i ax i b) 2 = 0 (9) i Gilles Guillot (gigu@dtu.dk) Linear regression September 17, / 33
21 Parameter estimation Connection to maximum likelihood estimation IV In Eq. (7-8), we recognize the expressions in the LS estimator. Hence â ML = â LS and ˆb ML = ˆb LS Plugging â ML and ˆb ML in Eq. (9) yields: ˆσ ML 2 = 1 (y i â ML x i n ˆb ML ) 2 i Which is biased... Gilles Guillot (gigu@dtu.dk) Linear regression September 17, / 33
22 Geometric interpretation Geometric interpretation of linear regression x = (x 1,..., x n ) and y = (y 1,..., y n ) are vectors in R n the values ax i + b can be seen as the entries of the vector ax + b1 in R n i (y i ax i b) 2 is the square of the norm of y ax b1 âx + ˆb1 is the projection of y on Span(1, x) Cor(x, y) is the cosine of the angle formed by x and y in R n Gilles Guillot (gigu@dtu.dk) Linear regression September 17, / 33
23 Goodness of t Goodness of t The quality of the model can be assessed by the coecent of determination: Coecient of determination: R 2 ˆ=1 SS err SS tot with SS tot = i (y i ȳ) 2 and SS err = i (ŷ i y i ) 2 0 R 2 1 Good model low SS err high R 2 If the regression model includes an intercept, then R 2 = ρ 2 Gilles Guillot (gigu@dtu.dk) Linear regression September 17, / 33
24 Testing parameters Testing H 0 : a = a 0 I We are often interested in assessing if a is signicantly dierent from a particular value a 0. Often H 0 : a = 0 which corresponds to the absence of dependence between x and y. The question is: should the dierence between â and a 0 be considered large enough to reject H 0? Gilles Guillot (gigu@dtu.dk) Linear regression September 17, / 33
25 Testing parameters Testing H 0 : a = a 0 II The Student test Under the assumptions given here then T = â a 0 ŝd(â) St n 2 H 0 is rejected at level α if t is larger than the quantile with probability 1 α/2 of a St n 2 distribution Gilles Guillot (gigu@dtu.dk) Linear regression September 17, / 33
26 Checking model assumptions Checking model assumptions The ε i 's are assumed to be i.i.d. If (a, b) estimates (a, b) correctly, the ˆε i 's should be close to i.i.d. A plot of ( ˆε i ) i=1,...,n against (x i ) i=1,...,n should not display any pattern. Visual check of residuals Visual check of standardised residuals plot(lm(...)) in R Gilles Guillot (gigu@dtu.dk) Linear regression September 17, / 33
27 Prediction out-of sample value under a linear regression model Prediction What value y new should be expected for an extra individual with observed explanatory variable x new? Denition: prediction y new = âx new + ˆb Straightforward in R, see also use of the generic function predict. Gilles Guillot (gigu@dtu.dk) Linear regression September 17, / 33
28 Linear regression in practice with R Parameter estimation in practice with R Assuming data objects are named x and y in your R session # fit a linear model and store the (long) output list res.lm = lm(formula = y ~ x) # extract estimated coef res.coef = coefficients(res.lm) Gilles Guillot (gigu@dtu.dk) Linear regression September 17, / 33
29 Back to pikes R code to t a linear regression on the pike data pike=read.table(" header=true) ## fitting regression line lm.res = lm(formula=ddt~1+age,data=pike) Gilles Guillot (gigu@dtu.dk) Linear regression September 17, / 33
30 Back to pikes Pike data analysis output in R ## display the R object lm.res summary(lm.res) Call: lm(formula = DDT ~ 1 + Age, data = pike) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) Age e-05 *** --- Signif. codes: 0 `***' `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1 Residual standard error: on 13 degrees of freedom Multiple R-squared: , Adjusted R-squared: F-statistic: on 1 and 13 DF, p-value: 2.165e-05 Gilles Guillot (gigu@dtu.dk) Linear regression September 17, / 33
31 Back to pikes R code. Link to the R script used in this lecture (and more) Gilles Guillot (gigu@dtu.dk) Linear regression September 17, / 33
32 Exercise Exercise Bingham and Fry, exercise 1.3 p. 29. Data le here Hints: - download with download.file(url="", destfile="./running.txt") - read in R with read.table("./running.txt",header=true) - model t on log data can be obtained by lm(log(y) ~ log(x)) - use R function confint for condence interval Sheather, exercise 1 p. 38 Data are available on the book web site as le playbill.csv Hints: For testing β 0 = 10000, use function test.coef available from here. Gilles Guillot (gigu@dtu.dk) Linear regression September 17, / 33
33 References References Suggested reading Chapter Regression and correlation, Introductory statistics with R, P. Dalgaard, Series Statistics and Computing, Springer, Gilles Guillot Linear regression September 17, / 33
Kursus 02323: Introducerende Statistik. Forelæsning 8: Simpel lineær regression. Peder Bacher
Kursus 02323: Introducerende Statistik Forelæsning 8: Simpel lineær regression Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:
Læs mereKursus 02402/02323 Introducerende Statistik
Kursus 02402/02323 Introducerende Statistik Forelæsning 8: Simpel lineær regression Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark
Læs mereOversigt. 1 Motiverende eksempel: Højde-vægt. 2 Lineær regressionsmodel. 3 Mindste kvadraters metode (least squares)
Kursus 02402/02323 Introducerende Statistik Forelæsning 8: Simpel lineær regression Oversigt Motiverende eksempel: Højde-vægt 2 Lineær regressionsmodel 3 Mindste kvadraters metode (least squares) Klaus
Læs mereBasic statistics for experimental medical researchers
Basic statistics for experimental medical researchers Sample size calculations September 15th 2016 Christian Pipper Department of public health (IFSV) Faculty of Health and Medicinal Science (SUND) E-mail:
Læs mereGeneralized Probit Model in Design of Dose Finding Experiments. Yuehui Wu Valerii V. Fedorov RSU, GlaxoSmithKline, US
Generalized Probit Model in Design of Dose Finding Experiments Yuehui Wu Valerii V. Fedorov RSU, GlaxoSmithKline, US Outline Motivation Generalized probit model Utility function Locally optimal designs
Læs mereMultivariate Extremes and Dependence in Elliptical Distributions
Multivariate Extremes and Dependence in Elliptical Distributions Filip Lindskog, RiskLab, ETH Zürich joint work with Henrik Hult, KTH Stockholm I II III IV V Motivation Elliptical distributions A class
Læs mereKvant Eksamen December 2010 3 timer med hjælpemidler. 1 Hvad er en continuous variable? Giv 2 illustrationer.
Kvant Eksamen December 2010 3 timer med hjælpemidler 1 Hvad er en continuous variable? Giv 2 illustrationer. What is a continuous variable? Give two illustrations. 2 Hvorfor kan man bedre drage konklusioner
Læs mereenote 5: Simpel lineær regressions analyse Kursus 02402/02323 Introducerende Statistik Oversigt
enote 5: Simpel lineær regressions analse Kursus 02402/02323 Introducerende Statistik Forelæsning 8: Simpel lineær regression To variable: og Beregn mindstekvadraters estimat af ret linje Inferens med
Læs mereStatistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge
Statistik og Sandsynlighedsregning 2 IH kapitel 12 Overheads til forelæsninger, mandag 6. uge 1 Fordelingen af én (1): Regressionsanalyse udfaldsvariabel responsvariabel afhængig variabel Y variabel 2
Læs mereLineær regression. Simpel regression. Model. ofte bruges følgende notation:
Lineær regression Simpel regression Model Y i X i i ofte bruges følgende notation: Y i 0 1 X 1i i n i 1 i 0 Findes der en linie, der passer bedst? Metode - Generel! least squares (mindste kvadrater) til
Læs mereX M Y. What is mediation? Mediation analysis an introduction. Definition
What is mediation? an introduction Ulla Hvidtfeldt Section of Social Medicine - Investigate underlying mechanisms of an association Opening the black box - Strengthen/support the main effect hypothesis
Læs mereDoodleBUGS (Hands-on)
DoodleBUGS (Hands-on) Simple example: Program: bino_ave_sim_doodle.odc A simulation example Generate a sample from F=(r1+r2)/2 where r1~bin(0.5,200) and r2~bin(0.25,100) Note that E(F)=(100+25)/2=62.5
Læs mereQuestion I.1 (1) We use Method 3.8 from Chapter 3 to achieve
Correct answers: 35132 25225 11354 53441 12141 32235 Exercise I Question I.1 (1) We use Method 3.8 from Chapter 3 to achieve And since, qt(0.95, 24) ## [1] 1.710882 90.4 ± t 0.95 10.3 25 We get that 10.3
Læs mereSkriftlig Eksamen Kombinatorik, Sandsynlighed og Randomiserede Algoritmer (DM528)
Skriftlig Eksamen Kombinatorik, Sandsynlighed og Randomiserede Algoritmer (DM58) Institut for Matematik og Datalogi Syddansk Universitet, Odense Torsdag den 1. januar 01 kl. 9 13 Alle sædvanlige hjælpemidler
Læs mereLogistisk Regression - fortsat
Logistisk Regression - fortsat Likelihood Ratio test Generel hypotese test Modelanalyse Indtil nu har vi set på to slags modeller: 1) Generelle Lineære Modeller Kvantitav afhængig variabel. Kvantitative
Læs mereKA 4.2 Kvantitative Forskningsmetoder Forår 2010
KA 4.2 Kvantitative Forskningsmetoder Forår 2010 Besvar alle spørgsmål. Brug ikke mere end én side af tekst på de åbne spørgsmål som er markeret * Answer all questions. Do not write more than one page
Læs mereØkonometri Lektion 1 Simpel Lineær Regression 1/31
Økonometri Lektion 1 Simpel Lineær Regression 1/31 Simpel Lineær Regression Mål: Forklare variablen y vha. variablen x. Fx forklare Salg (y) vha. Reklamebudget (x). Statistisk model: Vi antager at sammenhængen
Læs mereExercise 6.14 Linearly independent vectors are also affinely independent.
Affine sets Linear Inequality Systems Definition 6.12 The vectors v 1, v 2,..., v k are affinely independent if v 2 v 1,..., v k v 1 is linearly independent; affinely dependent, otherwise. We first check
Læs mereSkriftlig eksamen Science statistik- ST501
SYDDANSK UNIVERSITET INSTITUT FOR MATEMATIK OG DATALOGI Skriftlig eksamen Science statistik- ST501 Torsdag den 11. juni Opgavesættet består af 4 opgaver, med i alt 13 delspørgsmål, som vægtes ligeligt.
Læs mereVina Nguyen HSSP July 13, 2008
Vina Nguyen HSSP July 13, 2008 1 What does it mean if sets A, B, C are a partition of set D? 2 How do you calculate P(A B) using the formula for conditional probability? 3 What is the difference between
Læs mereStatistik for MPH: 7
Statistik for MPH: 7 3. november 2011 www.biostat.ku.dk/~pka/mph11 Attributable risk, bestemmelse af stikprøvestørrelse (Silva: 333-365, 381-383) Per Kragh Andersen 1 Fra den 6. uges statistikundervisning:
Læs merePARALLELIZATION OF ATTILA SIMULATOR WITH OPENMP MIGUEL ÁNGEL MARTÍNEZ DEL AMOR MINIPROJECT OF TDT24 NTNU
PARALLELIZATION OF ATTILA SIMULATOR WITH OPENMP MIGUEL ÁNGEL MARTÍNEZ DEL AMOR MINIPROJECT OF TDT24 NTNU OUTLINE INEFFICIENCY OF ATTILA WAYS TO PARALLELIZE LOW COMPATIBILITY IN THE COMPILATION A SOLUTION
Læs mereGenerelle lineære modeller
Generelle lineære modeller Regressionsmodeller med én uafhængig intervalskala variabel: Y en eller flere uafhængige variable: X 1,..,X k Den betingede fordeling af Y givet X 1,..,X k antages at være normal
Læs mereOversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode
Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse
Læs mereAdaptive Algorithms for Blind Separation of Dependent Sources. George V. Moustakides INRIA, Sigma 2
Adaptive Algorithms for Blind Separation of Dependent Sources George V. Moustakides INRIA, Sigma 2 Problem definition-motivation Existing adaptive scheme-independence General adaptive scheme-dependence
Læs meremen nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller
Type I og type II fejl Type I fejl: forkast når hypotese sand. α = signifikansniveau= P(type I fejl) Program (8.15-10): Hvis vi forkaster når Z < 2.58 eller Z > 2.58 er α = P(Z < 2.58) + P(Z > 2.58) =
Læs mereLineær regression i SAS. Lineær regression i SAS p.1/20
Lineær regression i SAS Lineær regression i SAS p.1/20 Lineær regression i SAS Simpel lineær regression Grafisk modelkontrol Multipel lineær regression SAS-procedurer: PROC REG PROC GPLOT Lineær regression
Læs mereLinear Programming ١ C H A P T E R 2
Linear Programming ١ C H A P T E R 2 Problem Formulation Problem formulation or modeling is the process of translating a verbal statement of a problem into a mathematical statement. The Guidelines of formulation
Læs mereReexam questions in Statistics and Evidence-based medicine, august sem. Medis/Medicin, Modul 2.4.
Reexam questions in Statistics and Evidence-based medicine, august 2013 2. sem. Medis/Medicin, Modul 2.4. Statistics : ESSAY-TYPE QUESTION 1. Intelligence tests are constructed such that the average score
Læs mereStockton dataset. 1 variograms variogram figures variogram envelopes directional variogram... 4
Stockton dataset Contents 1 variograms 2 1.1 variogram figures............................................. 2 1.2 variogram envelopes........................................... 3 1.3 directional variogram...........................................
Læs mereMSG500/MVE190 Linear Models - Lecture 4
MSG500/MVE190 Linear Models - Lecture 4 Rebecka Jörnsten Mathematical Statistics University of Gothenburg/Chalmers University of Technology November 2, 2011 1 RECAP ˆ The variance of the fitted values
Læs mereBesvarelse af vitcap -opgaven
Besvarelse af -opgaven Spørgsmål 1 Indlæs data Dette gøres fra Analyst med File/Open, som sædvanlig. Spørgsmål 2 Beskriv fordelingen af vital capacity og i de 3 grupper ved hjælp af summary statistics.
Læs mereHow consumers attributions of firm motives for engaging in CSR affects their willingness to pay
Bachelor thesis Institute for management Author: Jesper Andersen Drescher Bscb(sustainability) Student ID: 300545 Supervisor: Mai Skjøtt Linneberg Appendix for: How consumers attributions of firm motives
Læs mereForelæsning 11: Kapitel 11: Regressionsanalyse
Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Læs mereEngelsk. Niveau D. De Merkantile Erhvervsuddannelser September Casebaseret eksamen. og
052431_EngelskD 08/09/05 13:29 Side 1 De Merkantile Erhvervsuddannelser September 2005 Side 1 af 4 sider Casebaseret eksamen Engelsk Niveau D www.jysk.dk og www.jysk.com Indhold: Opgave 1 Presentation
Læs mereBesvarelser til Lineær Algebra Reeksamen Februar 2017
Besvarelser til Lineær Algebra Reeksamen - 7. Februar 207 Mikkel Findinge Bemærk, at der kan være sneget sig fejl ind. Kontakt mig endelig, hvis du skulle falde over en sådan. Dette dokument har udelukkende
Læs mereKursus 02402/02323 Introduktion til statistik. Forelæsning 13: Et overblik over kursets indhold. Klaus K. Andersen og Per Bruun Brockhoff
Kursus 02402/02323 Introduktion til statistik Forelæsning 13: Et overblik over kursets indhold Klaus K. Andersen og Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Danmarks Tekniske Universitet
Læs mereEngelsk. Niveau C. De Merkantile Erhvervsuddannelser September 2005. Casebaseret eksamen. www.jysk.dk og www.jysk.com.
052430_EngelskC 08/09/05 13:29 Side 1 De Merkantile Erhvervsuddannelser September 2005 Side 1 af 4 sider Casebaseret eksamen Engelsk Niveau C www.jysk.dk og www.jysk.com Indhold: Opgave 1 Presentation
Læs mereOversigt. 1 Motiverende eksempel - energiforbrug. 2 Hypotesetest (Repetition) 3 Two-sample t-test og p-værdi. 4 Konfidensinterval for forskellen
Kursus 02402/02323 Introducerende Statistik Forelæsning 6: Sammenligning af to grupper Oversigt 1 Motiverende eksempel - energiforbrug 2 Hypotesetest (Repetition) 3 Klaus K. Andersen og Per Bruun Brockhoff
Læs mere1 enote 1: Simple plots og deskriptive statistik. 2 enote 2: Diskrete fordelinger. 3 enote 2: Kontinuerte fordelinger
Kursus 02402/02323 Introduktion til statistik Forelæsning 13: Et overblik over kursets indhold Peder Bacher DTU Compute, Dynamiske Systemer Building 303B, Room 017 Danish Technical University 2800 Lyngby
Læs mereSign variation, the Grassmannian, and total positivity
Sign variation, the Grassmannian, and total positivity arxiv:1503.05622 Slides available at math.berkeley.edu/~skarp Steven N. Karp, UC Berkeley FPSAC 2015 KAIST, Daejeon Steven N. Karp (UC Berkeley) Sign
Læs merePortal Registration. Check Junk Mail for activation . 1 Click the hyperlink to take you back to the portal to confirm your registration
Portal Registration Step 1 Provide the necessary information to create your user. Note: First Name, Last Name and Email have to match exactly to your profile in the Membership system. Step 2 Click on the
Læs mereBlack Jack --- Review. Spring 2012
Black Jack --- Review Spring 2012 Simulation Simulation can solve real-world problems by modeling realworld processes to provide otherwise unobtainable information. Computer simulation is used to predict
Læs mereStrings and Sets: set complement, union, intersection, etc. set concatenation AB, power of set A n, A, A +
Strings and Sets: A string over Σ is any nite-length sequence of elements of Σ The set of all strings over alphabet Σ is denoted as Σ Operators over set: set complement, union, intersection, etc. set concatenation
Læs mereProject Step 7. Behavioral modeling of a dual ported register set. 1/8/ L11 Project Step 5 Copyright Joanne DeGroat, ECE, OSU 1
Project Step 7 Behavioral modeling of a dual ported register set. Copyright 2006 - Joanne DeGroat, ECE, OSU 1 The register set Register set specifications 16 dual ported registers each with 16- bit words
Læs mereØkonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol
Økonometri: Lektion 5 Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol 1 / 35 Veksekvirkning: Motivation Vi har set på modeller som Price
Læs mereIkke-parametriske tests
Ikke-parametriske tests 2 Dagens menu t testen Hvordan var det nu lige det var? Wilcoxson Mann Whitney U Kruskall Wallis Friedman Kendalls og Spearmans correlation 3 t-testen Patient Drug Placebo difference
Læs mereKursus i varians- og regressionsanalyse Data med detektionsgrænse. Birthe Lykke Thomsen H. Lundbeck A/S
Kursus i varians- og regressionsanalyse Data med detektionsgrænse Birthe Lykke Thomsen H. Lundbeck A/S 1 Data med detektionsgrænse Venstrecensurering: Baggrundsstøj eller begrænsning i måleudstyrets følsomhed
Læs mereSkriftlig Eksamen Beregnelighed (DM517)
Skriftlig Eksamen Beregnelighed (DM517) Institut for Matematik & Datalogi Syddansk Universitet Mandag den 7 Januar 2008, kl. 9 13 Alle sædvanlige hjælpemidler (lærebøger, notater etc.) samt brug af lommeregner
Læs mereMultipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model
Multipel regression M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Y j 1 X 1j 2 X 2j... m X mj j eller m Y j 0 i 1 i X ij j BEMÆRK! j svarer til individ
Læs mereOverlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere.
Overlevelse efter AMI Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Diabetes VF (Venticular fibrillation) WMI (Wall motion index) CHF (Cardiac Heart Failure) Køn og alder betragtes
Læs mereMuligheder: NB: test for µ 1 = µ 2 i model med blocking ækvivalent med parret t-test! Ide: anskue β j som stikprøve fra normalfordeling.
Eksempel: dæktyper og brændstofforbrug (opgave 25 side 319) Program: cars 1 2 3 4 5... radial 4.2 4.7 6.6 7.0 6.7... belt 4.1 4.9 6.2 6.9 6.8... Muligheder: 1. vi starter med at gennemgå opgave 7 side
Læs mereCS 4390/5387 SOFTWARE V&V LECTURE 5 BLACK-BOX TESTING - 2
1 CS 4390/5387 SOFTWARE V&V LECTURE 5 BLACK-BOX TESTING - 2 Outline 2 HW Solution Exercise (Equivalence Class Testing) Exercise (Decision Table Testing) Pairwise Testing Exercise (Pairwise Testing) 1 Homework
Læs mereModul 6: Regression og kalibrering
Forskningsenheden for Statistik ST501: Science Statistik Bent Jørgensen Modul 6: Regression og kalibrering 6.1 Årsag og virkning................................... 1 6.2 Kovarians og korrelation...............................
Læs mereKursus 02402/02323 Introducerende Statistik. Forelæsning 6: Sammenligning af to grupper
Kursus 02402/02323 Introducerende Statistik Forelæsning 6: Sammenligning af to grupper Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark
Læs mereβ = SDD xt SSD t σ 2 s 2 02 = SSD 02 f 02 i=1
Lineær regression Lad x 1,..., x n være udfald af stokastiske variable X 1,..., X n og betragt modellen M 2 : X i N(α + βt i, σ 2 ) hvor t i, i = 1,..., n, er kendte tal. Konkret analyseres (en del af)
Læs mereObservation Processes:
Observation Processes: Preparing for lesson observations, Observing lessons Providing formative feedback Gerry Davies Faculty of Education Preparing for Observation: Task 1 How can we help student-teachers
Læs mereSkriftlig Eksamen Automatteori og Beregnelighed (DM17)
Skriftlig Eksamen Automatteori og Beregnelighed (DM17) Institut for Matematik & Datalogi Syddansk Universitet Odense Campus Lørdag, den 15. Januar 2005 Alle sædvanlige hjælpemidler (lærebøger, notater
Læs mereEn Introduktion til SAS. Kapitel 5.
En Introduktion til SAS. Kapitel 5. Inge Henningsen Afdeling for Statistik og Operationsanalyse Københavns Universitet Marts 2005 6. udgave Kapitel 5 T-test og PROC UNIVARIATE 5.1 Indledning Dette kapitel
Læs mereStatistik for MPH: oktober Attributable risk, bestemmelse af stikprøvestørrelse (Silva: , )
Statistik for MPH: 7 29. oktober 2015 www.biostat.ku.dk/~pka/mph15 Attributable risk, bestemmelse af stikprøvestørrelse (Silva: 333-365, 381-383) Per Kragh Andersen 1 Fra den 6. uges statistikundervisning:
Læs mereParticle-based T-Spline Level Set Evolution for 3D Object Reconstruction with Range and Volume Constraints
Particle-based T-Spline Level Set for 3D Object Reconstruction with Range and Volume Constraints Robert Feichtinger (joint work with Huaiping Yang, Bert Jüttler) Institute of Applied Geometry, JKU Linz
Læs mereProbabilistic properties of modular addition. Victoria Vysotskaya
Probabilistic properties of modular addition Victoria Vysotskaya JSC InfoTeCS, NPK Kryptonite CTCrypt 19 / June 4, 2019 vysotskaya.victory@gmail.com Victoria Vysotskaya (Infotecs, Kryptonite) Probabilistic
Læs mereKurver og flader Aktivitet 15 Geodætiske kurver, Isometri, Mainardi-Codazzi, Teorema Egregium
Kurver og flader Aktivitet 15 Geodætiske kurver, Isometri, Mainardi-Codazzi, Teorema Egregium Lisbeth Fajstrup Institut for Matematiske Fag Aalborg Universitet Kurver og Flader 2013 Lisbeth Fajstrup (AAU)
Læs mereModtageklasser i Tønder Kommune
Modtageklasser i Tønder Kommune - et tilbud i Toftlund og Tønder til børn, der har behov for at blive bedre til dansk TOFTLUND TØNDER Hvad er en modtageklasse? En modtageklasse er en klasse med særligt
Læs mere(studienummer) (underskrift) (bord nr)
Danmarks Tekniske Universitet Side 1 af 22 sider. Skriftlig prøve: 13. december 2010 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)
Læs mereImproving data services by creating a question database. Nanna Floor Clausen Danish Data Archives
Improving data services by creating a question database Nanna Floor Clausen Danish Data Archives Background Pressure on the students Decrease in response rates The users want more Why a question database?
Læs mereHow Long Is an Hour? Family Note HOME LINK 8 2
8 2 How Long Is an Hour? The concept of passing time is difficult for young children. Hours, minutes, and seconds are confusing; children usually do not have a good sense of how long each time interval
Læs mereNaturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1
Matematisk Modellering 1 Side 1 I nærværende opgavesæt er der 16 spørgsmål fordelt på 4 opgaver. Ved bedømmelsen af besvarelsen vægtes alle spørgsmål lige. Endvidere lægges der vægt på, at det af besvarelsen
Læs mereTrolling Master Bornholm 2015
Trolling Master Bornholm 2015 (English version further down) Panorama billede fra starten den første dag i 2014 Michael Koldtoft fra Trolling Centrum har brugt lidt tid på at arbejde med billederne fra
Læs mereLESSON NOTES Extensive Reading in Danish for Intermediate Learners #8 How to Interview
LESSON NOTES Extensive Reading in Danish for Intermediate Learners #8 How to Interview CONTENTS 2 Danish 5 English # 8 COPYRIGHT 2019 INNOVATIVE LANGUAGE LEARNING. ALL RIGHTS RESERVED. DANISH 1. SÅDAN
Læs mereReestimation af eksportrelationerne april 2000
Danmarks Statistik MODELGRUPPEN Arbejdspapir* Tony Maarsleth Kristensen 14. marts 2000 Reestimation af eksportrelationerne april 2000 Resumé: I papiret præsenteres en reestimation af eksportrelationerne
Læs mereThe X Factor. Målgruppe. Læringsmål. Introduktion til læreren klasse & ungdomsuddannelser Engelskundervisningen
The X Factor Målgruppe 7-10 klasse & ungdomsuddannelser Engelskundervisningen Læringsmål Eleven kan give sammenhængende fremstillinger på basis af indhentede informationer Eleven har viden om at søge og
Læs mereDet Teknisk-Naturvidenskabelige Fakultet Første Studieår AALBORG UNIVERSITET Arkitektur Og Design MATEMATIK OG FORM
Det Teknisk-Naturvidenskabelige Fakultet Første Studieår AALBORG UNIVERSITET Arkitektur Og Design MATEMATIK OG FORM 27 April 2012 - Lecture 4 (in English) Vector operations in Grasshopper Group 1 8:15-9:15
Læs mereEksamen i Signalbehandling og matematik
Opgave. (%).a. Figur og afbilleder et diskret tid signal [n ] og dets DTFT. [n] bruges som input til et LTI filter med en frekvens amplitude respons som vist på figur. Hvilket af de 4 output signaler (y
Læs mereForelæsning 11: Envejs variansanalyse, ANOVA
Kursus 02323: Introduktion til Statistik Forelæsning 11: Envejs variansanalyse, ANOVA Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark
Læs mereSTAT-UB.0103 Spring 2012 Homework Set 8 Solutions
1. Curtis was investigating the properties of a new vacuum cleaner motor in terms of a standardized lab procedure. In this procedure, the motor was applied to a pile of gypsum powder for five seconds,
Læs mereSKRIFTLIG EKSAMEN I NUMERISK DYNAMIK Bygge- og Anlægskonstruktion, 7. semester Torsdag den 19. juni 2003 kl Alle hjælpemidler er tilladt
SKRIFTLIG EKSAMEN I NUMERISK DYNAMIK Bygge- og Anlægskonstruktion, 7. semester Torsdag den 9. juni 23 kl. 9.-3. Alle hjælpemidler er tilladt OPGAVE f(x) x Givet funktionen f(x) x, x [, ] Spørgsmål (%)
Læs merewhat is this all about? Introduction three-phase diode bridge rectifier input voltages input voltages, waveforms normalization of voltages voltages?
what is this all about? v A Introduction three-phase diode bridge rectifier D1 D D D4 D5 D6 i OUT + v OUT v B i 1 i i + + + v 1 v v input voltages input voltages, waveforms v 1 = V m cos ω 0 t v = V m
Læs mereCrowd Sourcing for Sentiment Analysis ICA 2017
Crowd Sourcing for Sentiment Analysis ICA 2017 http://vanatteveldt.com/ica2017-sentiment Is this positive or negative? Cameron urges Greek euro exit plans Is this positive or negative? Cameron urges Greek
Læs mereModule I: Statistical Background on Multi-level Models
Module I: Statistical Background on Multi-level Models Francesca Dominici Michael Griswold The Johns Hopkins University Bloomberg School of Public Health 2005 Hopkins Epi-Biostat Summer Institute 1 Statistical
Læs mereAppendices. Appendix 2: Questionnaire in StudSurvey. Appendix 3: Text presenting the electronic questionnaire. Appendix 4: Outputs from regressions
Appendices Appendix 1: Print screen of WEB-DIRECT Appendix 2: Questionnaire in StudSurvey Appendix 3: Text presenting the electronic questionnaire Appendix 4: Outputs from regressions StudSurvey http://studsurvey.asb.dk/nsurveyadmin/surveycontentbuilder.aspx?surv...
Læs mereSkriftlig Eksamen Diskret matematik med anvendelser (DM72)
Skriftlig Eksamen Diskret matematik med anvendelser (DM72) Institut for Matematik & Datalogi Syddansk Universitet, Odense Onsdag den 18. januar 2006 Alle sædvanlige hjælpemidler (lærebøger, notater etc.),
Læs mereMultipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression
Multipel Linear Regression Repetition Partiel F-test Modelsøgning Logistisk Regression Test for en eller alle parametre I jagten på en god statistisk model har vi set på følgende to hypoteser og tilhørende
Læs mereClark. A statistical loss reserving model has two key elements: The expected amount of loss to emerge in some time period
Outline I. Introduction Objectives in creating a formal model of loss reserving: Describe loss emergence in simple mathematical terms as a guide to selecting amounts for carried reserves Provide a means
Læs mereØkonometri: Lektion 6 Emne: Heteroskedasticitet
Økonometri: Lektion 6 Emne: Heteroskedasticitet 1 / 32 Konsekvenser af Heteroskedasticitet Antag her (og i resten) at MLR.1 til MLR.4 er opfyldt. Antag MLR.5 ikke er opfyldt, dvs. vi har heteroskedastiske
Læs mereAngle Ini/al side Terminal side Vertex Standard posi/on Posi/ve angles Nega/ve angles. Quadrantal angle
Mrs. Valentine AFM Objective: I will be able to identify angle types, convert between degrees and radians for angle measures, identify coterminal angles, find the length of an intercepted arc, and find
Læs mereØkonometri lektion 5 Multipel Lineær Regression. Inferens Modelkontrol Prædiktion
Økonometri lektion 5 Multipel Lineær Regression Inferens Modelkontrol Prædiktion Multipel Lineær Regression Data: Sæt af oservationer (x i, x i,, x ki, y i, i,,n y i er den afhængige variael x i, x i,,
Læs mereSkriftlig Eksamen Beregnelighed (DM517)
Skriftlig Eksamen Beregnelighed (DM517) Institut for Matematik & Datalogi Syddansk Universitet Mandag den 31 Oktober 2011, kl. 9 13 Alle sædvanlige hjælpemidler (lærebøger, notater etc.) samt brug af lommeregner
Læs mereDK - Quick Text Translation. HEYYER Net Promoter System Magento extension
DK - Quick Text Translation HEYYER Net Promoter System Magento extension Version 1.0 15-11-2013 HEYYER / Email Templates Invitation Email Template Invitation Email English Dansk Title Invitation Email
Læs mereECE 551: Digital System * Design & Synthesis Lecture Set 5
ECE 551: Digital System * Design & Synthesis Lecture Set 5 5.1: Verilog Behavioral Model for Finite State Machines (FSMs) 5.2: Verilog Simulation I/O and 2001 Standard (In Separate File) 3/4/2003 1 ECE
Læs mereRoE timestamp and presentation time in past
RoE timestamp and presentation time in past Jouni Korhonen Broadcom Ltd. 5/26/2016 9 June 2016 IEEE 1904 Access Networks Working Group, Hørsholm, Denmark 1 Background RoE 2:24:6 timestamp was recently
Læs mereOpgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1
Københavns Universitet Afdeling for Anvendt Matematik og Statistik Statistik for biokemikere Inge Henningsen Michael Sørensen Oktober 2003 Opgaver til ZAR II Opgave 1 Et datasæt består af 20 observationer.
Læs mereVariansanalyse i SAS 1. Institut for Matematiske Fag December 2007
Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Institut for Matematiske Fag December 2007 Variansanalyse i SAS 1 Ensidet variansanalyse Bartlett s test Tukey s test PROC
Læs mereKlasseøvelser dag 2 Opgave 1
Klasseøvelser dag 2 Opgave 1 1.1. Vi sætter først working directory og data indlæses: library( foreign ) d
Læs merek UAFHÆNGIGE grupper Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen 4 Hypotesetest (F-test)
Kursus 02323: Introduktion til Statistik Forelæsning 11: Envejs variansanalse, ANOVA Peder Bacher DTU Compute, Dnamiske Sstemer Bgning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lngb Danmark e-mail:
Læs mereA multimodel data assimilation framework for hydrology
A multimodel data assimilation framework for hydrology Antoine Thiboult, François Anctil Université Laval June 27 th 2017 What is Data Assimilation? Use observations to improve simulation 2 of 8 What is
Læs mereLøsning eksamen d. 15. december 2008
Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th
Læs mereVi ønsker at konstruere normalområder for stofskiftet, som funktion af kropsvægten.
Opgavebesvarelse, Resting metabolic rate I filen T:\rmr.txt findes sammenhørende værdier af kropsvægt (bw, i kg) og hvilende stofskifte (rmr, kcal pr. døgn) for 44 kvinder (Altman, 1991 og Owen et.al.,
Læs mereStatistiske Modeller 1: Kontingenstabeller i SAS
Statistiske Modeller 1: Kontingenstabeller i SAS Jens Ledet Jensen October 31, 2005 1 Indledning Som vist i Notat 1 afsnit 13 er 2 log Q for et test i en multinomialmodel ækvivalent med et test i en poissonmodel.
Læs mereLøsning til eksaminen d. 29. maj 2009
DTU Informatik 02402 Introduktion til Statistik 20-2-01 LFF/lff Løsning til eksaminen d. 29. maj 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th
Læs mere