Module 1: Introduktion til R, simpel regression
|
|
- Thor Kvist
- 7 år siden
- Visninger:
Transkript
1 Department of Statistics ST502: Statistisk modellering Pia Veldt Larsen Module 1: Introduktion til R, simpel regression 1.1 Lineære modeller Simpel lineær regression Least squares line Modelcheck Inferens Prediktion Introduktion til R Download R Essentials Kort om opsætning Databehandling i R Simpel lineær regression Program Output Figurer Lineære modeller Beskriver variationen i variabel, når en/flere andre variable varierer, så Y i = β 0 + β 1 x 1i + β 2 x 2i + + β k x ki + ǫ i, i = 1,...,n, hvor E i uafhængige E (ǫ i ) = 0, i = 1,...,n. Desuden antages typisk: Varianshomogenitet: V ar (ǫ i ) = σ 2, i = 1,...,n. Normalitet: ǫ i N, i = 1,...,n.
2 1.1 Lineære modeller 2 Eksempel 1.1 Mobilitet af ældre To metoder bruges til at måle mobiliteten af ældre mennesker: TUG score (hurtig) Berg score (omstændelig, præcis) (F1) TUG score: Berg score: Mulig model? Eksempel 1.2 Papirstyrke Styrken (p.s.i.) blev målt for forskellige partier af Kraft Paper (kraftigt indpakningspapir). For hvert parti er også angivet andelen af hårdt-træ i papirmassen. (F2) Mulig model? Eksempel 1.3 Vind energi En undersøgelse blev lavet for at finde ud af, hvordan strømproduktionen fra vindmøller afhænger af vindhastigheden. (F3) Mulig model? Eksempel 1.4 Isforbrug og temperatur Isforbruget per inbygger (i pints per dag) blev målt i forskellige områder af USA om sommeren. Desuden blev, for hver måling af isforbrug, gennemsnitstemperaturen og gennemsnitsindkomsten i området noteret: (F4) Isforbrug (pints): Temperatur (Fahrenheit): Indkomst
3 1.2 Simpel lineær regression 3 Mulig model? Eksempel 1.5 Dopaminaktivitet i skizofrene patienter I et studie af skizofreni blev 25 indlagte skizofrene patienter behandlet med antipsykotisk medicin. Efter en given tid blev de klassificeret som psykotiske(x = 0) eller ikke-psykotiske (x = 1). Prøver af rygmarvsvæsken fra hver patient blev testet for aktivitet af enzymet dopamin b-hydroxylase. (F5) Mulig model? 1.2 Simpel lineær regression Simpel lineær regressionsmodel: Y i = β 0 + β 1 x i + ǫ i, i = 1,...,n, hvor Dss ǫ i N ( 0,σ 2) uafhængige i = 1,...,n. Y i N ( β 0 + β 1 x i,σ 2) uafhængige i = 1,...,n Least squares line Variationen af observerede data væk fra linien minimeret. Minimer m.h.t. β 0 og β 1 : n (y i β 0 β 1 x i ) 2. i=1 Giver ˆβ 1 = n i=1 (x i x)(y i ȳ) n i=1 (x i x) 2 og ˆβ 0 = ȳ ˆβ 1 x Regressionslinie: ŷ = ˆβ 0 + ˆβ 1 x
4 1.2 Simpel lineær regression 4 Eksempel 1.1 Mobilitet af ældre To metoder bruges til at måle mobiliteten af ældre mennesker: TUG score (x) og Berg score (Y ). Least squares linien: ŷ = x, i = 1,...,16. (F6) Estimat af varians af fejlled: s 2 = 1 n 2 n i=1 ( y i ˆβ 0 ˆβ 1 x i ) 2. Eksempel 1.1 Mobilitet af ældre To metoder bruges til at måle mobiliteten af ældre mennesker: TUG score (x) og Berg score (Y ). Variansestimat Modelcheck s 2 = 1 n 2 n (y i x i ) 2 = i=1 Modelantagelser for i = 1,...,n: Fraktildiagram for residualer Y i ǫ i 1 uafhængige uafhængige 2 normalfordelte normalfordelte 3 E[Y i ] = β 0 + β 1 x i E[ǫ i ] = 0 4 Var[Y i ] = σ 2 Var[ǫ i ] = σ 2 Residualplot for standardiserede residualer e i = y i β 0 β 1 x i, i = 1,...,n. e i = e i 1 hi, i = 1,...,n, hvor h i = 1 n + (x i x) 2 n i=1 (x i x) 2.
5 1.3 Inferens 5 Eksempel 1.1 Mobilitet af ældre To metoder bruges til at måle mobiliteten af ældre mennesker: TUG score (x) og Berg score (Y ). Least squares linien: ŷ = x, i = 1,...,16. (F7) 1.3 Inferens Test om regressionsparametre: Teststørrelser: H 0 : β 0 = β 00 eller H 0 : β 1 = β 10 ˆβ 1 β 10 S/ n i=1 (x i x) 2 t (n 2), ˆβ 0 β 00 1 S/ n + x2 n i=1 (x i x) 2 t (n 2). Konfidensintervaller for regressionsparametre. L 100%-konfidensinterval for β 0 : s C.I. L (y) = ˆβ0 ± t (1+L)/2 (n 2) 1 n + x2 /, n i=1 (x i x) 2 hvor t (1+L)/2 (n 2) er (1 + L)/2-fraktilen i en t (n 2)-fordeling. L 100%-konfidensinterval for β 1 : C.I. L (y) = ( ˆβ 1 ± t (1+L)/2 (n 2) ) s n i=1 (x, i x) 2 hvor t (1+L)/2 (n 2) er (1 + L)/2-fraktilen i en t (n 2)-fordeling. Eksempel 1.1 Mobilitet af ældre To metoder bruges til at måle mobiliteten af ældre mennesker: TUG score (x) og Berg score (Y ). Least squares linien: ŷ = x, i = 1,...,16.
6 1.4 Prediktion 6 95%-konfidensintervaller: β 0 : C.I (y) = (54.143,68.484), β 1 : C.I (y) = ( 1.953, 0.728). 1.4 Prediktion For x = x 0 er Forventet middelrespons: Ŷ 0 = ˆβ 0 + ˆβ 1 x 0. 95% konfidensinterval for middelrespons: C.I (y) = (ˆβ0 + ˆβ )) 1 x 0 ± t (n + 2) ˆσ (Ŷ0. Eksempel 1.1 Mobilitet af ældre To metoder bruges til at måle mobiliteten af ældre mennesker: TUG score (x) og Berg score (Y ). Least squares linien: ŷ = x, i = 1,...,16. 95%-konfidensinterval for forventet Berg score, for person med TUG score 10: C.I (y) = (46.103,49.717). For x = x 0 er Ny respons: Prediktor: Y new = β 0 + β 1 x 0 + e new, med e new N (0,1). Ŷ new = ˆβ 0 + ˆβ 1 x 0.
7 1.5 Introduktion til R 7 95% konfidensinterval for prediktion: ( ) C.I (y) = ˆβ 0 + ˆβ 1 x 0 ± t (n + 2) σ n + (x i x 0 ) 2 n i=1 (x i x) 2. Eksempel 1.1 Mobilitet af ældre To metoder bruges til at måle mobiliteten af ældre mennesker: TUG score (x) og Berg score (Y ). Least squares linien: ŷ = x, i = 1,...,16. 95%-prediktionsinterval for ny observation af Berg score, for person med TUG score 10: C.I (y) = (41.328,54.492). 1.5 Introduktion til R Statistisk programpakke: Hjemmeside: Gratis version af S+ Programmeringsprog Dataanalyse Statistiske analysemetoder Grafik Matrixalgebra Noter: Computernoter til hvert modul. Getting started in R af Saghir Bashir. Kan downloades gratis fra:
8 1.6 Download R Download R Gå ind i Windows (95 and later) - hvis du har Windows 3. Vælg base 4. Download rw2011.exe 5. Installer (a) OK el. Run, hvis sikkerhedsvindue kommer op (b) Vælg alle defaults 1.7 Essentials Start R: Start menu/ genvej på skrivebord Afslut R: q() og linieskift Hjælp: en af flg. help.start() starter on-line hjælpe help(xxx) eller?xxx starter hjælpside om kommandoen xxx help.search( XXX ) finder hjælp om emnet XXX Gem program (Script): 1. Klik på Console vinduet 2. Gå ind i File i top-menuen 3. Vælg Save History 4. Navngiv, og giv extension.r Gem output: 1. Klik på Console vinduet 2. Gå ind i File i top-menuen 3. Vælg Save to File 4. Giver tekstfil med indhold af Console vindue Gem figur: 1. Klik på figuren 2. Gå ind i File i top-menuen
9 1.8 Databehandling i R 9 3. Vælg Save as... og den ønskede filtype Indlæs program (Script): 1. Gå ind i File i top-menuen 2. Vælg Open script og lokaliser programfilen xxx.r 3. Åbner scriptfil i eget vindue 4. Kør programmet: highlight koden og tryk Ctrl-R Kort om opsætning > prompt ># kommentar >; eller lineskift ny kommando > Ctrl-c afbryd kommandolinien < vs sættes lig hs, fx > x< 2 c() vektor, fx > y< c(1,5,8,9) > z< x y > z[2] > [1] Databehandling i R Kursusnoter: Kort gennemgang af analyser i R til hvert modul. Getting started in R: Matematik, vektorer og matricer. Indlæsning af data. Hjælpesiderne i R!
10 1.9 Simpel lineær regression Simpel lineær regression Eksempel Mobilitet af ældre To metoder bruges til at måle mobiliteten af ældre mennesker: TUG score (hurtig) Berg score (omstændelig, præcis) Datasættet mobility.txt er kommasepareret tekstfil. Analyse: 1. xy-plot af Berg score mod TUG score. 2. Regression af Berg score på TUG score. 3. Least squares linien. 4. xy-plot med least squares linien. 5. Fordelinger af estimatorer til regressionsparametre 6. Variansestimat og fordeling af estimator 7. Modelkontrol. 8. Konfidensintervaller for regressionsparametre. 9. Prediktion af Berg score for TUG score t = Konfidensinterval for middel-berg score, når TUG score t = Prediktionsinterval for ny observation af Berg score, for person med TUG score t = Program # 0. Indlaes data mobility <- read.table("c:/data/mobility.txt", header=true, sep=",", na.strings="na", dec=".", strip.white=true) # 1. Aktiver datasaettet attach(mobility) # 2. xy-plot af TUG og Berg scores par(pty="s") plot(tug, berg, xlab="tug score", ylab="berg score")
11 1.9 Simpel lineær regression 11 # 3. Model: least squares line model <- lm(berg ~tug) model # 4. xy-plot med least squares line plot(tug, berg, xlab="tug score", ylab="berg score") abline(model) # Fordelinger af estimatorer for regr. par. og varians summary(model) # 7. Modelkontrol par(mfrow=c(1,2)) # Residual plot plot(fitted(model),resid(model),xlab="fitted values", ylab="residuals") title(main="residualplot") # Normalfordelings plot qqnorm(resid(model), xlab="observed quantiles", ylab="normal quantiles") # 8. Konfidensintervaller for regressionsparametre confint(model) # 9. Prediktion af berg, naar tug=10 newtug <- data.frame(tug=10) predict(model,newtug) # 10. Konfidensinterval for middel-berg score, naar tug=10 predict(model,newtug, interval="confidence") # 11. Prediktionsinterval for middel-berg score, naar tug=10 predict(model,newtug, interval="prediction") Output R : Copyright 2005, The R Foundation for Statistical Computing Version ( ), ISBN R is free software and comes with ABSOLUTELY NO WARRANTY. You are welcome to redistribute it under certain conditions.
12 1.9 Simpel lineær regression 12 Type license() or licence() for distribution details. R is a collaborative project with many contributors. Type contributors() for more information and citation() on how to cite R or R packages in publications. Type demo() for some demos, help() for on-line help, or help.start() for a HTML browser interface to help. Type q() to quit R. > # 0. Indlaes data > mobility <- read.table("c:/data/mobility.txt", header=true, + sep=",", na.strings="na", dec=".", strip.white=true) > > # 1. Aktiver datasættet > attach(mobility) > > # 2. xy-plot af TUG og Berg scores > par(pty="s") > plot(tug, berg, xlab="tug score", ylab="berg score") > > # 3. Model: least squares line > model <- lm(berg~tug) > model Call: lm(formula = berg ~ tug) Coefficients: (Intercept) tug > > # 4. xy-plot med least squares line > plot(tug, berg, xlab="tug score", ylab="berg score") > abline(model) >
13 1.9 Simpel lineær regression 13 > # Fordelinger af estimatorer for regr. par. og varians > summary(model) Call: lm(formula = berg ~ tug) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) e-11 *** tug *** --- Signif. codes: 0 *** ** 0.01 * Residual standard error: on 14 degrees of freedom Multiple R-Squared: , Adjusted R-squared: F-statistic: on 1 and 14 DF, p-value: > > # 7. Modelkontrol > par(mfrow=c(1,2)) > # Residual plot > plot(fitted(model),resid(model),xlab="fitted values", + ylab="residuals") > title(main="residualplot") > # Normalfordelings plot > qqnorm(resid(model), xlab="observed quantiles", + ylab="normal quantiles") > > # 8. Konfidensintervaller for regressionsparametre > confint(model) 2.5 % 97.5 % (Intercept) tug > > # 9. Prediktion af berg, når tug=10
14 1.10 Figurer 14 > newtug <- data.frame(tug=10) > predict(model,newtug) [1] > > # 10. Konfidensinterval for middel-berg score, når tug=10 > predict(model,newtug, interval="confidence") fit lwr upr [1,] > > # 11. Prediktionsinterval for middel-berg score, når tug=10 > predict(model,newtug, interval="prediction") fit lwr upr [1,] > (F8-10) 1.10 Figurer
15 1.10 Figurer 15 Berg score TUG score Figure 1.1: TUG score mod Berg score
16 1.10 Figurer 16 Styrke Procent hardwood Figure 1.2: Papirstyrke og indhold af hård træ.
17 1.10 Figurer 17 Strømproduktion Vindhastighed Figure 1.3: Strømproduktion og vindhastighed.
18 1.10 Figurer 18 Isforbrug Isforbrug Temperatur Indkomst Figure 1.4: (a) Isforbrug og temperatur, (b) isforbrug og indkomst.
19 1.10 Figurer 19 Dopaminaktivitet Psykotisk/ Ikke psykotisk Figure 1.5: Dopaminaktivitet i skizofrene patienter
20 1.10 Figurer 20 Berg score TUG score Figure 1.6: TUG score mod Berg score: least squares linie
21 1.10 Figurer 21 Residualplot Normal Q Q Plot residuals normal quantiles fitted values observed quantiles Figure 1.7: Mobilitet af ældre: modelcheck.
22 1.10 Figurer 22 Berg score TUG score Figure 1.8: TUG score mod Berg score.
23 1.10 Figurer 23 Berg score TUG score Figure 1.9: TUG score mod Berg score, least squares line.
24 1.10 Figurer 24 Residualplot Normal Q Q Plot residuals normal quantiles fitted values observed quantiles Figure 1.10: Mobilitet af ældre: modelcheck.
Modul 6: Regression og kalibrering
Forskningsenheden for Statistik ST501: Science Statistik Bent Jørgensen Modul 6: Regression og kalibrering 6.1 Årsag og virkning................................... 1 6.2 Kovarians og korrelation...............................
Læs mereR syntaks. Installation af R
R syntaks Denne note er en introduktion 1 til syntaksen i R. Den kode, vi skal bruge til modellerne, står i bogen eller kommer til at være på hjemmesiden i den takt, vi gennemgår teorien. Så det, vi skal
Læs meremen nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller
Type I og type II fejl Type I fejl: forkast når hypotese sand. α = signifikansniveau= P(type I fejl) Program (8.15-10): Hvis vi forkaster når Z < 2.58 eller Z > 2.58 er α = P(Z < 2.58) + P(Z > 2.58) =
Læs mereTo samhørende variable
To samhørende variable Statistik er tal brugt som argumenter. - Leonard Louis Levinsen Antagatviharn observationspar x 1, y 1,, x n,y n. Betragt de to tilsvarende variable x og y. Hvordan måles sammenhængen
Læs mereOversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode
Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse
Læs mereForelæsning 11: Kapitel 11: Regressionsanalyse
Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Læs mereØkonometri Lektion 1 Simpel Lineær Regression 1/31
Økonometri Lektion 1 Simpel Lineær Regression 1/31 Simpel Lineær Regression Mål: Forklare variablen y vha. variablen x. Fx forklare Salg (y) vha. Reklamebudget (x). Statistisk model: Vi antager at sammenhængen
Læs mereModule 3: Statistiske modeller
Department of Statistics ST502: Statistisk modellering Pia Veldt Larsen Module 3: Statistiske modeller 31 ANOVA 1 32 Variabelselektion 4 321 Multipel determinationskoefficient 5 322 Variabelselektion med
Læs mereTænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i.
Repetition af vektor-regning Økonometri: Lektion 3 Matrix-formulering Fordelingsantagelse Hypotesetest Antag vi har to n-dimensionelle (søjle)vektorer a 1 b 1 a 2 a =. og b = b 2. a n b n Tænk på a og
Læs mereOversigt. 1 Motiverende eksempel: Højde-vægt. 2 Lineær regressionsmodel. 3 Mindste kvadraters metode (least squares)
Kursus 02402/02323 Introducerende Statistik Forelæsning 8: Simpel lineær regression Oversigt Motiverende eksempel: Højde-vægt 2 Lineær regressionsmodel 3 Mindste kvadraters metode (least squares) Klaus
Læs mereAnalysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17
nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse
Læs mereKursus 02323: Introducerende Statistik. Forelæsning 8: Simpel lineær regression. Peder Bacher
Kursus 02323: Introducerende Statistik Forelæsning 8: Simpel lineær regression Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:
Læs mereProgram: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19
Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større
Læs mereStatistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge
Statistik og Sandsynlighedsregning 2 IH kapitel 12 Overheads til forelæsninger, mandag 6. uge 1 Fordelingen af én (1): Regressionsanalyse udfaldsvariabel responsvariabel afhængig variabel Y variabel 2
Læs mereMLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som
MLR antagelserne Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som y = β 0 + β 1 x 1 + β 2 x 2 + + β k x k + u, hvor β 0, β 1, β 2,...,β k er ukendte parametere,
Læs mereKursus 02402/02323 Introducerende Statistik
Kursus 02402/02323 Introducerende Statistik Forelæsning 8: Simpel lineær regression Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark
Læs mereenote 5: Simpel lineær regressions analyse Kursus 02402/02323 Introducerende Statistik Oversigt
enote 5: Simpel lineær regressions analse Kursus 02402/02323 Introducerende Statistik Forelæsning 8: Simpel lineær regression To variable: og Beregn mindstekvadraters estimat af ret linje Inferens med
Læs mereOpgavebesvarelse, brain weight
Opgavebesvarelse, brain weight (Matthews & Farewell: Using and Understanding Medical Statistics, 2nd. ed.) For 20 nyfødte mus er der i tabellen nedenfor anført oplysning om kuldstørrelsen (fra 3 til 12
Læs mereNormalfordelingen. Statistik og Sandsynlighedsregning 2
Statistik og Sandsynlighedsregning 2 Repetition og eksamen T-test Normalfordelingen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige
Læs mereMuligheder: NB: test for µ 1 = µ 2 i model med blocking ækvivalent med parret t-test! Ide: anskue β j som stikprøve fra normalfordeling.
Eksempel: dæktyper og brændstofforbrug (opgave 25 side 319) Program: cars 1 2 3 4 5... radial 4.2 4.7 6.6 7.0 6.7... belt 4.1 4.9 6.2 6.9 6.8... Muligheder: 1. vi starter med at gennemgå opgave 7 side
Læs mereØkonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol
Økonometri: Lektion 5 Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol 1 / 35 Veksekvirkning: Motivation Vi har set på modeller som Price
Læs mereMultipel Lineær Regression
Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer
Læs mereStatistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge
Statistik og Sandsynlighedsregning 2 Repetition og eksamen Overheads til forelæsninger, mandag 7. uge 1 Normalfordelingen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange
Læs mereKlasseøvelser dag 2 Opgave 1
Klasseøvelser dag 2 Opgave 1 1.1. Vi sætter først working directory og data indlæses: library( foreign ) d
Læs mereModul 7: Eksempler. 7.1 Beskrivende dataanalyse. 7.1.1 Diagrammer. Bent Jørgensen. Forskningsenheden for Statistik ST501: Science Statistik
Forskningsenheden for Statistik ST501: Science Statistik Bent Jørgensen Modul 7: Eksempler 7.1 Beskrivende dataanalyse............................... 1 7.1.1 Diagrammer.................................
Læs mereModule 9: Residualanalyse
Mathematical Statistics ST6: Linear Models Bent Jørgensen og Pia Larsen Module 9: Residualanalyse 9 Rå residualer 92 Standardiserede residualer 3 93 Ensidig variansanalyse 4 94 Studentiserede residualer
Læs mereLineær regression. Simpel regression. Model. ofte bruges følgende notation:
Lineær regression Simpel regression Model Y i X i i ofte bruges følgende notation: Y i 0 1 X 1i i n i 1 i 0 Findes der en linie, der passer bedst? Metode - Generel! least squares (mindste kvadrater) til
Læs mereModul 11: Simpel lineær regression
Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 11: Simpel lineær regression 11.1 Regression uden gentagelser............................. 1 11.1.1 Oversigt....................................
Læs mereLineær regression i SAS. Lineær regression i SAS p.1/20
Lineær regression i SAS Lineær regression i SAS p.1/20 Lineær regression i SAS Simpel lineær regression Grafisk modelkontrol Multipel lineær regression SAS-procedurer: PROC REG PROC GPLOT Lineær regression
Læs mereProgram. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration
Faculty of Life Sciences Program Modelkontrol og prædiktion Claus Ekstrøm E-mail: ekstrom@life.ku.dk Test af hypotese i ensidet variansanalyse F -tests og F -fordelingen. Multiple sammenligninger. Bonferroni-korrektion
Læs mereNormalfordelingen. Statistik og Sandsynlighedsregning 2
Normalfordelingen Statistik og Sandsynlighedsregning 2 Repetition og eksamen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige fejl på
Læs mereØkonometri: Lektion 6 Emne: Heteroskedasticitet
Økonometri: Lektion 6 Emne: Heteroskedasticitet 1 / 32 Konsekvenser af Heteroskedasticitet Antag her (og i resten) at MLR.1 til MLR.4 er opfyldt. Antag MLR.5 ikke er opfyldt, dvs. vi har heteroskedastiske
Læs mere(tæt på N(0,1) hvis n ikke alt for lille). t i god til at checke for outliers som kan have stor indflydelse på estimaterne s 2 og ˆσ 2 e i
Da er r i = e i ˆσ ei t(n 3) (tæt på N(0,1) hvis n ikke alt for lille). Program 1. lineær regression: opgave 3 og 13 (sukker-temperatur). 2. studentiserede residualer, multipel regression. Tommelfinger-regel:
Læs mereØkonometri: Lektion 4. Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater
Økonometri: Lektion 4 Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater 1 / 35 Hypotesetest for én parameter Antag vi har model y = β 0 + β 1 x 2 + β 2 x 2 + + β k x k + u. Vi
Læs mere1 Regressionsproblemet 2
Indhold 1 Regressionsproblemet 2 2 Simpel lineær regression 3 2.1 Mindste kvadraters tilpasning.............................. 3 2.2 Prædiktion og residualer................................. 5 2.3 Estimation
Læs mereAppendiks Økonometrisk teori... II
Appendiks Økonometrisk teori... II De klassiske SLR-antagelser... II Hypotesetest... VII Regressioner... VIII Inflation:... VIII Test for SLR antagelser... IX Reset-test... IX Plots... X Breusch-Pagan
Læs mereMindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning
1 Regressionsproblemet 2 Simpel lineær regression Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 3
Læs mereAnvendt Statistik Lektion 7. Simpel Lineær Regression
Anvendt Statistik Lektion 7 Simpel Lineær Regression 1 Er der en sammenhæng? Plot af mordraten () mod fattigdomsraten (): Scatterplot Afhænger mordraten af fattigdomsraten? 2 Scatterplot Et scatterplot
Læs mereModule 4: Ensidig variansanalyse
Module 4: Ensidig variansanalyse 4.1 Analyse af én stikprøve................. 1 4.1.1 Estimation.................... 3 4.1.2 Modelkontrol................... 4 4.1.3 Hypotesetest................... 6 4.2
Læs mereØkonometri lektion 5 Multipel Lineær Regression. Inferens Modelkontrol Prædiktion
Økonometri lektion 5 Multipel Lineær Regression Inferens Modelkontrol Prædiktion Multipel Lineær Regression Data: Sæt af oservationer (x i, x i,, x ki, y i, i,,n y i er den afhængige variael x i, x i,,
Læs mereFaculty of Health Sciences. Regressionsanalyse. Simpel lineær regression, Lene Theil Skovgaard. Biostatistisk Afdeling
Faculty of Health Sciences Regressionsanalyse Simpel lineær regression, 28-2-2013 Lene Theil Skovgaard Biostatistisk Afdeling 1 / 67 Simpel lineær regression Regression og korrelation Simpel lineær regression
Læs mereProgram. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data
Faculty of Life Sciences Program t-test Hypoteser, teststørrelser og p-værdier Claus Ekstrøm E-mail: ekstrom@life.ku.dk Resumé og hængepartier fra sidst. Eksempel: effekt af foder på hormonkoncentration
Læs mereReminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model
Reminder: Hypotesetest for én parameter Antag vi har model Økonometri: Lektion 4 F -test Justeret R 2 Aymptotiske resultater y = β 0 + β 1 x 2 + β 2 x 2 + + β k x k + u. Vi ønsker at teste hypotesen H
Læs mereVi ønsker at konstruere normalområder for stofskiftet, som funktion af kropsvægten.
Opgavebesvarelse, Resting metabolic rate I filen T:\rmr.txt findes sammenhørende værdier af kropsvægt (bw, i kg) og hvilende stofskifte (rmr, kcal pr. døgn) for 44 kvinder (Altman, 1991 og Owen et.al.,
Læs mereSimpel Lineær Regression
Simpel Lineær Regression Mål: Forklare variablen y vha. variablen x. Fx forklare Salg (y) vha. Reklamebudget (x). Vi antager at sammenhængen mellem y og x er beskrevet ved y = β 0 + β 1 x + u. y: Afhængige
Læs mereLagrange multiplier test. Økonometri: Lektion 6 Håndtering ad heteroskedasticitet. Konsekvenser af Heteroskedasticitet
Lagrange multiplier test Et alternativ til F -testet af en eller flere parametre. Økonometri: Lektion 6 Håndtering ad heteroskedasticitet Antag vi har model: y = β 0 + β 1 x 2 + + β k x k + u. Vi ønsker
Læs mere12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse
. september 5 Epidemiologi og biostatistik. Forelæsning Uge, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression
Læs mere(studienummer) (underskrift) (bord nr)
Danmarks Tekniske Universitet Side 1 af 22 sider. Skriftlig prøve: 13. december 2010 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)
Læs mereStatistik Lektion 16 Multipel Lineær Regression
Statistik Lektion 6 Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk
Læs mereØkonometri: Lektion 6 Emne: Heteroskedasticitet
Økonometri: Lektion 6 Emne: Heteroskedasticitet 1 / 34 Lagrange multiplier test Et alternativ til F -testet af en eller flere parametre. Antag vi har model: Vi ønsker at teste hypotesen y = β 0 + β 1 x
Læs mereNaturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1
Matematisk Modellering 1 Side 1 I nærværende opgavesæt er der 16 spørgsmål fordelt på 4 opgaver. Ved bedømmelsen af besvarelsen vægtes alle spørgsmål lige. Endvidere lægges der vægt på, at det af besvarelsen
Læs mereMotivation. En tegning
Motivatio Scatter-plot at det mådelige salg mod det måedlige reklamebudget. R: plot(salg ~ budget, data = salg) Økoometri Lektio Simpel Lieær Regressio salg 400 450 500 550 20 25 30 35 40 45 50 budget
Læs mereSkriftlig Eksamen ST501: Sandsynlighedsteori og Statistik Mandag den 31. oktober 2005 kl
Skriftlig Eksamen ST501: Sandsynlighedsteori og Statistik Mandag den 31. oktober 2005 kl. 14.30-17.30 Forskningsenheden for Statistik Syddansk Universitet Alle skriftlige hjælpemidler samt brug af lommeregner
Læs mereEpidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse
Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Institut for Biostatistik. Lineær regressionsanalyse - Simpel lineær regression - Multipel lineær regression Regressionsanalyse Regressionsanalyser
Læs mereUge 43 I Teoretisk Statistik, 21. oktober Forudsigelser
Uge 43 I Teoretisk Statistik,. oktober 3 Simpel lineær regressionsanalyse Forudsigelser Fortolkning af regressionsmodellen Ekstreme observationer Transformationer Sammenligning af to regressionslinier
Læs mereProgram. Logistisk regression. Eksempel: pesticider og møl. Odds og odds-ratios (igen)
Faculty of Life Sciences Program Logistisk regression Claus Ekstrøm E-mail: ekstrom@life.ku.dk Odds og odds-ratios igen Logistisk regression Estimation og inferens Modelkontrol Slide 2 Statistisk Dataanalyse
Læs mere(studienummer) (underskrift) (bord nr)
Danmarks Tekniske Universitet Side 1 af 20 sider. Skriftlig prøve: 1. december 2011 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)
Læs mereI dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt)
I dag Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt) Helle Sørensen Repetition vha eksempel om dagligvarepriser Analyse med R: ttest
Læs mereβ = SDD xt SSD t σ 2 s 2 02 = SSD 02 f 02 i=1
Lineær regression Lad x 1,..., x n være udfald af stokastiske variable X 1,..., X n og betragt modellen M 2 : X i N(α + βt i, σ 2 ) hvor t i, i = 1,..., n, er kendte tal. Konkret analyseres (en del af)
Læs mereØkonometri: Lektion 2 Multipel Lineær Regression 1/27
Økonometri: Lektion 2 Multipel Lineær Regression 1/27 Multipel Lineær Regression Sidst så vi på simpel lineær regression, hvor y er forklaret af én variabel. Der er intet, der forhindre os i at have mere
Læs mere(studienummer) (underskrift) (bord nr)
Danmarks Tekniske Universitet Side 1 af 20 sider. Skriftlig prøve: 26. maj 2011 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)
Læs mereTransparency International Danmark på Roskilde Festival 2018: Har indsatsen nyttet noget?
Transparency International Danmark på Roskilde Festival 2018: Har indsatsen nyttet noget? Udarbejdet af frivillige Frederik Carl Windfeld og Kim Alexander Byrial Juárez Jensen samt sekretariatet i Transparency
Læs mere(studienummer) (underskrift) (bord nr)
Danmarks Tekniske Universitet Side 1 af 20 sider. Skriftlig prøve: 15. december 2008 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)
Læs mere1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer.
Vejledende besvarelse af hjemmeopgave Basal statistik, efterår 2008 En gruppe bestående af 45 patienter med reumatoid arthrit randomiseres til en af 6 mulige behandlinger, nemlig placebo, aspirin eller
Læs mereSide 1 af 19 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402
Danmarks Tekniske Universitet Side 1 af 19 sider. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)
Læs mereEpidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk
Eksempel: Systolisk blodtryk Udgangspunkt: Vi ønsker at prædiktere det systoliske blodtryk hos en gruppe af personer. Epidemiologi og biostatistik. Uge, torsdag. Erik Parner, Afdeling for Biostatistik.
Læs mereDagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at
Likelihood teori Lineær regression (intro) Dagens Emner Likelihood-metoden M : X i N(µ,σ 2 ) hvor µ og σ 2 er ukendte Vi har, at L(µ,σ 2 1 ) = ( 2πσ 2)n/2 e 1 2 P n (xi µ)2 er tætheden som funktion af
Læs mereELISA. ELISA (enzyme-linked immunosorbent assay) forsøg bruges til at detektere og kvantificere stoffer såsom proteiner, peptider, antistoffer o.lig.
ELISA ELISA (enzyme-linked immunosorbent assay) forsøg bruges til at detektere og kvantificere stoffer såsom proteiner, peptider, antistoffer o.lig. Teknikken er ganske snedig, og muliggør at man inddirekte
Læs mereAnvendt Statistik Lektion 8. Multipel Lineær Regression
Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke
Læs mereProgram. Indhold af kursus i overskrifter. Farlighed af GM-majs? (Ingeniøren Generel lineær model/multipel regression
Program Indhold af kursus i overskrifter 1. overblik over kursus (opgaver fra sidst samt huspriser som eksempler). 2. p-værdi 3. uformel evaluering 1. sandsynlighedsregning sandsynlighedsfordelinger (normal,
Læs mereSide 1 af 17 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 25. maj 2007 Kursus navn og nr: Introduktion til Statistik, 02402
Danmarks Tekniske Universitet Side 1 af 17 sider. Skriftlig prøve: 25. maj 2007 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (navn) (underskrift)
Læs mereOpgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved
Matematisk Modellering 1 (reeksamen) Side 1 Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved { 1 hvis x {1, 2, 3}, p X (x) = 3 0 ellers,
Læs mereModel. k = 3 grupper: hvor ǫ ij uafhængige og normalfordelte med middelværdi nul og varians σi 2, i = 1,2,3.
Model Program (8.15-10): 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. Bruger nu to indices: i = 1,...,k for gruppenr. og j = 1,...,n i for observation indenfor gruppe. k = 3 grupper: µ 1
Læs mere(studienummer) (underskrift) (bord nr)
Danmarks Tekniske Universitet Side 1 af 20 sider. Skriftlig prøve: 15. december 2012 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)
Læs mereLøsning eksamen d. 15. december 2008
Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th
Læs mereSimpel Lineær Regression: Model
Simpel Lineær Regression: Model Sidst så vi på simpel lineære regression. Det er en statisisk model på formen y = β 0 + β 1 x + u, hvor fejlledet u, har egenskaben E[u x] = 0. Dette betyder bl.a. E[y x]
Læs mereEksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning
1 Multipel regressions model Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning PSE (I17) ASTA - 11. lektion
Læs mereEn Introduktion til SAS. Kapitel 5.
En Introduktion til SAS. Kapitel 5. Inge Henningsen Afdeling for Statistik og Operationsanalyse Københavns Universitet Marts 2005 6. udgave Kapitel 5 T-test og PROC UNIVARIATE 5.1 Indledning Dette kapitel
Læs mereβ 2 : forskel i skæring polymer 1 og 2. β 3 forskel i skæring polymer 1 og 3.
Program suspended 200 250 300 350 400 1 2 3 6.5 7.0 7.5 8.0 8.5 9.0 1. kategoriske variable - kodning som indikator variable. 2. model selektion, R 2, F-test samt eksempler. ph Model: forskellig skæring
Læs mereØkonometri: Lektion 2 Multipel Lineær Regression 1/33
Økonometri: Lektion 2 Multipel Lineær Regression 1/33 Simpel Lineær Regression: Model Sidst så vi på simpel lineære regression. Det er en statisisk model på formen y = β 0 +β 1 x +u, hvor fejlledet u,
Læs mereOpgave 11.4 side 316 (7ed: 11.4, side 352 og 6ed: 11.2, side 345)
Kursus 4: Besvarelser til øvelses- og hjemmeopgaver i uge 11 Opgave 11.4 side 316 (7ed: 11.4, side 35 og 6ed: 11., side 345) Opgaven består i at foretage en regressionsanalse. Først afbildes data som i
Læs mereBasal Statistik. Simpel lineær regression. Simpel lineær regression. Data. Faculty of Health Sciences
Faculty of Health Sciences Simpel lineær regression Basal Statistik Regressionsanalyse i R. Lene Theil Skovgaard 23. september 2019 Regression og korrelation Simpel lineær regression Todimensionale normalfordelinger
Læs mereFaculty of Health Sciences. Basal Statistik. Regressionsanalyse i R. Lene Theil Skovgaard. 25. februar 2019
Faculty of Health Sciences Basal Statistik Regressionsanalyse i R. Lene Theil Skovgaard 25. februar 2019 1 / 85 Simpel lineær regression Regression og korrelation Simpel lineær regression Todimensionale
Læs mere1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ
Indhold 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) 2 1.1 Variation indenfor og mellem grupper.......................... 2 1.2 F-test for ingen
Læs mereProgram. 1. Varianskomponent-modeller (Random Effects) 2. Transformation af data. 1/12
Program 1. Varianskomponent-modeller (Random Effects) 2. Transformation af data. 1/12 Dæktyper og brændstofforbrug Data fra opgave 10.43, side 360: cars 1 2 3 4 5... radial 4.2 4.7 6.6 7.0 6.7... belt
Læs mereKvantitative metoder 2
Kvantitative metoder 2 Den multiple regressionsmodel 5. marts 2007 regressionsmodel 1 Dagens program Emnet for denne forelæsning er stadig den multiple regressionsmodel (Wooldridge kap. 3.4-3.5, E.2) Variansen
Læs meregrupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen
1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen
Læs mereWPS / R day. Rune Juhl (DTU Technical University of Denmark. 11th December 2013. DTU Compute Department of Applied Mathematics and Computer Science
WPS / R day Rune Juhl DTU Technical University of Denmark DTU Compute Department of Applied Mathematics and Computer Science 11th December 2013 DTU WPS Compute / R day Department of Applied 11th December
Læs merePerspektiver i Matematik-Økonomi: Linær regression
Perspektiver i Matematik-Økonomi: Linær regression Jens Ledet Jensen H2.21, email: jlj@imf.au.dk Perspektiver i Matematik-Økonomi: Linær regression p. 1/34 Program for i dag 1. Indledning: sammenhæng mellem
Læs mere3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve
Læs mereNormalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ
Normalfordelingen Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: f(x) = ( ) 1 exp (x µ)2 2πσ 2 σ 2 Frekvensen af observationer i intervallet
Læs mereModul 1: Beskrivende dataanalyse
Forskningsenheden for Statistik ST501: Science Statistik Bent Jørgensen Modul 1: Beskrivende dataanalyse 1.1 Statistik og dataanalyse............................... 1 1.2 Variable og data...................................
Læs mereMultipel regression. Data fra opgave 3 side 453: Multipel regressionsmodel: Y = α + β 1 x 1 + β 2 x 2 + ǫ. hvor ǫ N(0, σ 2 ).
Program 1. multipel regression 2. polynomiel regression (og andre kurver) 3. kategoriske variable 4. Determinationkoefficient og justeret determinationskoefficient 5. ANOVA-tabel 1/13 Multipel regression
Læs meren r x rs x r = 1 n r s=1 (x rs x r ) 2, s=1
(a) Denne opgave bygger på resultaterne fra 2 forsøg med epo-behandling af for tidligt fødte børn, idet gruppe 1 og 3 stammer fra første forsøg, mens gruppe 2 og 4 stammer fra det andet. Det må antages,
Læs mere1 Hb SS Hb Sβ Hb SC = , (s = )
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.
Læs mereØkonometri: Lektion 7 Emne: Prædiktionsintervaller, RESET teset, proxy variable og manglende data.
Økonometri: Lektion 7 Emne: Prædiktionsintervaller, RESET teset, proxy variable og manglende data. 1 / 32 Motivation Eksempel: Savings = β 0 + β 1 Income + u Vi ved allerede, hvordan vi estimerer regresseionlinjen:
Læs mereMultipel regression 22. Maj, 2012
Data: Det færøske kviksølv-studie Simpel linær regression Confounding Multipel lineær regression Fortolkning af parametre Vekselvirkning Kollinearitet Modelkontrol Multipel regression 22. Maj, 2012 Esben
Læs mereSkriftlig eksamen Science statistik- ST501
SYDDANSK UNIVERSITET INSTITUT FOR MATEMATIK OG DATALOGI Skriftlig eksamen Science statistik- ST501 Torsdag den 21. januar Opgavesættet består af 5 opgaver, med i alt 13 delspørgsmål, som vægtes ligeligt.
Læs mereMultipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression
Multipel Linear Regression Repetition Partiel F-test Modelsøgning Logistisk Regression Test for en eller alle parametre I jagten på en god statistisk model har vi set på følgende to hypoteser og tilhørende
Læs mereOpgaver til kapitel 3
Opgaver til kapitel 3 3.1 En løber er interesseret i at undersøge om hendes løbeur er kalibreret korrekt. Hun udmåler derfor en strækning på præcis 1000 m og løber den 16 gange. For hver løbetur noterer
Læs mere