Økonometri B i R. Sebastian Barfort.
|
|
- Valdemar Jørgensen
- 5 år siden
- Visninger:
Transkript
1 Økonometri B i R Sebastian Barfort sebastian.barfort@econ.ku.dk Hvis man gerne vil igang med R, men har svært ved den stejle læringskurve, kan nedenstående måske fungere som en slags guide. For at have et konkret dataset at forholde os til vil vi arbejde med data fra sommer eksamensopgaven i Økonometri B. Bemærk, at denne guide ikke anbefaler at skifte SAS ud med R, men blot er ment som en illustration af, at R kan mange af de samme ting som Stata og SAS. At R så er platform uafhængigt og gratis kan man så alt efter behov vurdere værdien af. Dette dokument er skrevet i R og kan frit downloades her. Bemærk, at jeg ikke har sammenholdt resultaterne i dette dokument med rettevejledningen, og det er muligt, at enkelte fejl har sneget sig ind. Kontakt mig endelig i tilfælde af fejl, eller endnu bedre, ret selv i filen på Github. 1 Data Vi vil arbejde med det data der ligger i en.zip fil på instituttes hjemmeside. Den første opgave må således være at downloade data til vores computer. Det følgende stykke kode downloader.zip filen i en til lejligheden oprettet mappe på skrivebordet, unzipper, og loader den som et dataset i R..exdir <- "~/Desktop/tmp" dir.create(.exdir).file <- file.path(.exdir, "groupdata7.zip") # download file url <- " download.file(url,.file) # unzip it unzip(.file, exdir = path.expand(.exdir)) # load groupdata0.sas7bdat examdata <- read.sas7bdat("/users/sebastianbarfort/desktop/tmp/groupdata0.sas7bdat") Data er en redigeret version af data brugt i Bloom et al. (2012), Americans Do IT Better. Vi kan se navnene på de 24 variable i data således names(examdata) [1] "COMPANY_CODE" "MONITORING" "OPERATIONS" "PEEPS" "SIC" [6] "YEAR" "LDGR" "DFRA" "DGER" "DITA" [11] "DSWE" "DY0" "DY1" "DY2" "DY3" [16] "DY4" "DY5" "Q" "C" "L" [21] "K" "CL" "DUSO" "DOFO" 1
2 og få et hurtigt overblik over variablene med summary(examdata) COMPANY_CODE MONITORING OPERATIONS PEEPS SIC Min. : 1 Min. : Min. : Min. : Min. :201 1st Qu.: 420 1st Qu.: st Qu.: st Qu.: st Qu.:267 Median : 718 Median : Median : Median : Median :326 Mean : 809 Mean : Mean : Mean : Mean :311 3rd Qu.:1083 3rd Qu.: rd Qu.: rd Qu.: rd Qu.:356 Max. :1822 Max. : Max. : Max. : Max. :671 YEAR LDGR DFRA DGER DITA Min. :2000 Min. :-2.7 Min. :0.000 Min. : Min. : st Qu.:2001 1st Qu.: 1.6 1st Qu.: st Qu.: st Qu.:0.000 Median :2003 Median : 2.4 Median :0.000 Median : Median :0.000 Mean :2003 Mean : 2.3 Mean :0.185 Mean : Mean : rd Qu.:2004 3rd Qu.: 3.1 3rd Qu.: rd Qu.: rd Qu.:0.000 Max. :2005 Max. : 4.6 Max. :1.000 Max. : Max. :1.000 NA's :447 DSWE DY0 DY1 DY2 DY3 Min. :0.000 Min. :0.000 Min. :0.000 Min. :0.000 Min. : st Qu.: st Qu.: st Qu.: st Qu.: st Qu.:0.000 Median :0.000 Median :0.000 Median :0.000 Median :0.000 Median :0.000 Mean :0.181 Mean :0.132 Mean :0.147 Mean :0.159 Mean : rd Qu.: rd Qu.: rd Qu.: rd Qu.: rd Qu.:0.000 Max. :1.000 Max. :1.000 Max. :1.000 Max. :1.000 Max. :1.000 DY4 DY5 Q C L Min. :0.000 Min. :0.00 Min. : 3.5 Min. : Min. :0.00 1st Qu.: st Qu.:0.00 1st Qu.:10.3 1st Qu.: st Qu.:5.12 Median :0.000 Median :0.00 Median :10.9 Median : Median :5.61 Mean :0.198 Mean :0.18 Mean :11.0 Mean : Mean :5.75 3rd Qu.: rd Qu.:0.00 3rd Qu.:11.7 3rd Qu.: rd Qu.:6.27 Max. :1.000 Max. :1.00 Max. :15.8 Max. : Max. :9.39 K CL DUSO DOFO Min. : Min. : Min. : Min. :0.00 1st Qu.: st Qu.: st Qu.: st Qu.:0.00 Median : Median : Median : Median :0.00 Mean : Mean : Mean : Mean :0.27 3rd Qu.: rd Qu.: rd Qu.: rd Qu.:1.00 Max. : Max. : Max. : Max. :1.00 2
3 I de første opgaver i eksamensopgaven bliver vi bedt om at fokusere på de 409 observationer for året Vi kan subsette vores data i R med følgende kommando examdata2005 <- subset(examdata, YEAR == 2005) Variablene kan gruperes forskelligt, og vi kan lave deskriptive tabeller på et par forskellige grupper således prod <- c("q", "C", "L", "K", "CL") own <- c("duso", "DOFO") c.op <- c("dfra", "DGER", "DITA", "DSWE") # subsetting examdata2005 examdata <- examdata2005[prod] examdata <- examdata2005[own] examdata <- examdata2005[c.op] tabellerne ser således ud Table 1: Statistic N Mean St. Dev. Min Max Q C L K CL Table 2: Statistic N Mean St. Dev. Min Max DUSO DOFO Table 3: Statistic N Mean St. Dev. Min Max DFRA DGER DITA DSWE
4 Vi kan også lave et par figurer over sammenhængeng mellem IT og produktion baseret på virksomhedens ejerskab. examdata2005$duso <- as.factor(examdata2005$duso) examdata2005$duso <- revalue(examdata2005$duso, c(`0` = "non-us ownership", `1` = "US ownership")) examdata2005$dofo <- as.factor(examdata2005$dofo) examdata2005$dofo <- revalue(examdata2005$dofo, c(`0` = "non-foreign ownership", `1` = "foreign ownershi figurerne ser således ud IT and Production non US ownership US ownership IT and Production non foreign ownership foreign ownership Production 12 Production IT IT I eksamensopgaven bliver man bedt om at lave to OLS og en enkelt first difference regression. Vi kan foretage de to OLS er med følgende kommando lm.1 <- lm(q ~ C + L + K + DUSO + DUSO * CL + DOFO + DOFO * CL + DY1 + DY2 + DY3 + DY4 + DY5 + DFRA + DGER + DITA + DSWE, data = examdata) lm.2 <- lm(q ~ C + L + K + DUSO + DUSO * CL + DOFO + DOFO * CL + DY1 + DY2 + DY3 + DY4 + DY5 + DFRA + DGER + DITA + DSWE + PEEPS + PEEPS * CL, data = examdata) Vi kan udføre en Breusch-Pagan test for heteroskedasticitet på de to OLS er med følgende kommando bptest(lm.1) studentized Breusch-Pagan test data: lm.1 BP = 84.78, df = 17, p-value = 5.356e-11 bptest(lm.2) studentized Breusch-Pagan test data: lm.2 BP = 96.11, df = 19, p-value = 2.69e-12 Bemærk, at nul hypotesen om homoskedasticitet afvises på alle fornuftige signifikansniveauer for begge modeller. 4
5 Vi kan også teste en lineær hypotese, eksempelvis at β 1 = β 2 som linearhypothesis(lm.1, "C = L") Linear hypothesis test Hypothesis: C - L = 0 Model 1: restricted model Model 2: Q ~ C + L + K + DUSO + DUSO * CL + DOFO + DOFO * CL + DY1 + DY2 + DY3 + DY4 + DY5 + DFRA + DGER + DITA + DSWE Res.Df RSS Df Sum of Sq F Pr(>F) Vi kan tilføje White heteroskedasticitets robuste standard fejl på følgende måde lm.1$se <- vcovhc(lm.1) lm.2$se <- vcovhc(lm.2) og lave tabeller af de to regressioner uden 5
6 Table 4: Model 1 Model 2 C ( ) ( ) L ( ) ( ) K (0.01) (0.01) DUSO CL ( ) ( ) DOFO (0.02) (0.02) DY DY DY DY DY DFRA DGER DITA DSWE DUSO:CL (0.07) (0.07) CL:DOFO PEEPS 0.05 CL:PEEPS (0.01) 0.10 (0.02) N R adj. R Resid. sd Standard errors in parentheses significant at p <.10; p <.05; p <.01; p <.001 6
7 og med korrigerende standard fejl Table 5: Model 1 Model 2 C ( ) ( ) L ( ) ( ) K (0.01) (0.01) DUSO CL ( ) ( ) DOFO (0.02) (0.02) DY DY DY DY DY DFRA DGER (0.05) (0.05) DITA DSWE DUSO:CL (0.06) (0.05) CL:DOFO PEEPS 0.05 CL:PEEPS (0.01) 0.10 (0.02) N R adj. R Resid. sd Robust standard errors in parentheses significant at p <.10; p <.05; p <.01; p <.001 7
8 I en af de sidste opgaver bliver vi bedt om at konstruere et balanceret panel med virksomheder, der både indgår i data i 2000 og Det kan vi gøre med følgende kommandoer examdata2000 <- subset(examdata, YEAR == 2000) # extract company code ccode <- examdata2000$company_code examdata2005 <- subset(examdata2005, COMPANY_CODE %in% ccode) ccode2005 <- examdata2005$company_code examdata2000 <- subset(examdata2000, COMPANY_CODE %in% ccode2005) merge.examdata <- smartbind(examdata2000, examdata2005) Vi kan estimere en first difference model på vores panel fd.lm.2 <- plm(q ~ C + L + K + DUSO + DUSO * CL + DOFO + DOFO * CL + DFRA + DGER + DITA + DSWE + PEEPS + PEEPS * CL, index = c("company_code", "YEAR"), data = merge.examdata, model = "fd") series DY1, xdy2, xdy3, xdy4 are constants and have been removed 8
9 og lave en flot tabel Table 6: Dependent variable: Q panel linear C 122, (119, ) L 122, (119, ) K (0.046) CL 122, (119, ) DUSO:CL (0.084) CL:DOFO (0.078) CL:PEEPS (0.056) Constant (0.025) Observations 187 R Adjusted R F statistic (d f = 7; 179) Note: p < 0.1; p < 0.05; p <
Økonometri: Lektion 6 Emne: Heteroskedasticitet
Økonometri: Lektion 6 Emne: Heteroskedasticitet 1 / 32 Konsekvenser af Heteroskedasticitet Antag her (og i resten) at MLR.1 til MLR.4 er opfyldt. Antag MLR.5 ikke er opfyldt, dvs. vi har heteroskedastiske
Læs mereLagrange multiplier test. Økonometri: Lektion 6 Håndtering ad heteroskedasticitet. Konsekvenser af Heteroskedasticitet
Lagrange multiplier test Et alternativ til F -testet af en eller flere parametre. Økonometri: Lektion 6 Håndtering ad heteroskedasticitet Antag vi har model: y = β 0 + β 1 x 2 + + β k x k + u. Vi ønsker
Læs mereØkonometri: Lektion 6 Emne: Heteroskedasticitet
Økonometri: Lektion 6 Emne: Heteroskedasticitet 1 / 34 Lagrange multiplier test Et alternativ til F -testet af en eller flere parametre. Antag vi har model: Vi ønsker at teste hypotesen y = β 0 + β 1 x
Læs mereEn meget kort introduktion til R på polit
En meget kort introduktion til R på polit Sebastian Barfort sebastian.barfort@econ.ku.dk Indhold 1 Introduktion 1 2 R som lommeregner 2 3 Tabeller, grafer og estimation 6 4 Økonomiske figurer 11 1 Introduktion
Læs mereKlasseøvelser dag 2 Opgave 1
Klasseøvelser dag 2 Opgave 1 1.1. Vi sætter først working directory og data indlæses: library( foreign ) d
Læs mereLineær regression. Simpel regression. Model. ofte bruges følgende notation:
Lineær regression Simpel regression Model Y i X i i ofte bruges følgende notation: Y i 0 1 X 1i i n i 1 i 0 Findes der en linie, der passer bedst? Metode - Generel! least squares (mindste kvadrater) til
Læs mereØkonometri: Lektion 4. Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater
Økonometri: Lektion 4 Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater 1 / 35 Hypotesetest for én parameter Antag vi har model y = β 0 + β 1 x 2 + β 2 x 2 + + β k x k + u. Vi
Læs mereReminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model
Reminder: Hypotesetest for én parameter Antag vi har model Økonometri: Lektion 4 F -test Justeret R 2 Aymptotiske resultater y = β 0 + β 1 x 2 + β 2 x 2 + + β k x k + u. Vi ønsker at teste hypotesen H
Læs mereReeksamen i Statistik for Biokemikere 6. april 2009
Københavns Universitet Det Naturvidenskabelige Fakultet Reeksamen i Statistik for Biokemikere 6. april 2009 Alle hjælpemidler er tilladt, og besvarelsen må gerne skrives med blyant. Opgavesættet er på
Læs mereKvantitative metoder 2
Kvantitative metoder Heteroskedasticitet 11. april 007 KM: F18 1 Oversigt: Heteroskedasticitet OLS estimation under heteroskedasticitet (W.8.1-): Konsekvenser af heteroskedasticitet for OLS Gyldige test
Læs mereModel. k = 3 grupper: hvor ǫ ij uafhængige og normalfordelte med middelværdi nul og varians σi 2, i = 1,2,3.
Model Program (8.15-10): 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. Bruger nu to indices: i = 1,...,k for gruppenr. og j = 1,...,n i for observation indenfor gruppe. k = 3 grupper: µ 1
Læs mereEksamen i Statistik for Biokemikere, Blok januar 2009
Københavns Universitet Det Naturvidenskabelige Fakultet Eksamen i Statistik for Biokemikere, Blok 2 2008 09 19. januar 2009 Alle hjælpemidler er tilladt, og besvarelsen må gerne skrives med blyant. Opgavesættet
Læs mereØkonometri Lektion 1 Simpel Lineær Regression 1/31
Økonometri Lektion 1 Simpel Lineær Regression 1/31 Simpel Lineær Regression Mål: Forklare variablen y vha. variablen x. Fx forklare Salg (y) vha. Reklamebudget (x). Statistisk model: Vi antager at sammenhængen
Læs mereMultipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model
Multipel regression M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Y j 1 X 1j 2 X 2j... m X mj j eller m Y j 0 i 1 i X ij j BEMÆRK! j svarer til individ
Læs mereAppendiks A Anvendte test statistikker
Appendiks A Anvendte test statistikker Afhandlingen opdeler testene i henholdsvis parametriske og ikke-parametriske test. De første fire test er parametriske test, mens de ikke-parametriske test udgør
Læs mereInstitut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6
Institut for Matematiske Fag Matematisk Modellering 1 Aarhus Universitet Eva B. Vedel Jensen 25. februar 2008 UGESEDDEL 6 Forelæsningerne torsdag den 21. februar og tirsdag den 26. februar. Jeg har gennemgået
Læs mereNaturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1
Matematisk Modellering 1 Side 1 I nærværende opgavesæt er der 16 spørgsmål fordelt på 4 opgaver. Ved bedømmelsen af besvarelsen vægtes alle spørgsmål lige. Endvidere lægges der vægt på, at det af besvarelsen
Læs mereØkonometri 1. Dagens program: Afslutningsforelæsning 23. maj 2007
Dagens program: Økonometri 1 Afslutningsforelæsning 23. maj 2007 6-trins procedure til IV estimation. Afrunding af IV: Rygning og fødselsvægt. Afrunding og perspektivering af Kvant 2. Opfølgning af introduktionsforelæsningen.
Læs mereBesvarelse af vitcap -opgaven
Besvarelse af -opgaven Spørgsmål 1 Indlæs data Dette gøres fra Analyst med File/Open, som sædvanlig. Spørgsmål 2 Beskriv fordelingen af vital capacity og i de 3 grupper ved hjælp af summary statistics.
Læs mereReeksamen i Statistik for biokemikere. Blok
Københavns Universitet Det Naturvidenskabelige Fakultet Reeksamen i Statistik for biokemikere. Blok 2 2007-2008. 3 timers skriftlig prøve. Alle hjælpemidler - også blyant - er tilladt. Opgavesættet er
Læs mereEksamen i Statistik for biokemikere. Blok
Københavns Universitet Det Naturvidenskabelige Fakultet Eksamen i Statistik for biokemikere. Blok 2 2007. 3 timers skriftlig prøve. Alle hjælpemidler - også blyant - er tilladt. Opgavesættet er på 8 sider.
Læs mereMultipel Lineær Regression
Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer
Læs mereβ = SDD xt SSD t σ 2 s 2 02 = SSD 02 f 02 i=1
Lineær regression Lad x 1,..., x n være udfald af stokastiske variable X 1,..., X n og betragt modellen M 2 : X i N(α + βt i, σ 2 ) hvor t i, i = 1,..., n, er kendte tal. Konkret analyseres (en del af)
Læs mereLineær regression i SAS. Lineær regression i SAS p.1/20
Lineær regression i SAS Lineær regression i SAS p.1/20 Lineær regression i SAS Simpel lineær regression Grafisk modelkontrol Multipel lineær regression SAS-procedurer: PROC REG PROC GPLOT Lineær regression
Læs mereMuligheder: NB: test for µ 1 = µ 2 i model med blocking ækvivalent med parret t-test! Ide: anskue β j som stikprøve fra normalfordeling.
Eksempel: dæktyper og brændstofforbrug (opgave 25 side 319) Program: cars 1 2 3 4 5... radial 4.2 4.7 6.6 7.0 6.7... belt 4.1 4.9 6.2 6.9 6.8... Muligheder: 1. vi starter med at gennemgå opgave 7 side
Læs mereEksamen Bacheloruddannelsen i Medicin med industriel specialisering
Eksamen 2016 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 17-02-2015 Tid: kl. 09.00-11.00 Bedømmelsesform
Læs mereOpgaver til ZAR II. Afdeling for Anvendt Matematik og Statistik Michael Sørensen Oktober Opgave 1
Københavns Universitet Afdeling for Anvendt Matematik og Statistik Statistik for biokemikere Inge Henningsen Michael Sørensen Oktober 2003 Opgaver til ZAR II Opgave 1 Et datasæt består af 20 observationer.
Læs mereOpgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved
Matematisk Modellering 1 (reeksamen) Side 1 Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved { 1 hvis x {1, 2, 3}, p X (x) = 3 0 ellers,
Læs mereGenerelle lineære modeller
Generelle lineære modeller Regressionsmodeller med én uafhængig intervalskala variabel: Y en eller flere uafhængige variable: X 1,..,X k Den betingede fordeling af Y givet X 1,..,X k antages at være normal
Læs mereSkriftlig eksamen Science statistik- ST501
SYDDANSK UNIVERSITET INSTITUT FOR MATEMATIK OG DATALOGI Skriftlig eksamen Science statistik- ST501 Torsdag den 21. januar Opgavesættet består af 5 opgaver, med i alt 13 delspørgsmål, som vægtes ligeligt.
Læs mereØkonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol
Økonometri: Lektion 5 Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol 1 / 35 Veksekvirkning: Motivation Vi har set på modeller som Price
Læs mereHypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j
Hypoteser om mere end to stikprøver ANOVA k stikprøver: (ikke ordinale eller højere) H 0 : 1 2... k gælder også for k 2! H 0ij : i j H 0ij : i j simpelt forslag: k k 1 2 t-tests: i j DUER IKKE! Bonferroni!!
Læs mereAppendiks Økonometrisk teori... II
Appendiks Økonometrisk teori... II De klassiske SLR-antagelser... II Hypotesetest... VII Regressioner... VIII Inflation:... VIII Test for SLR antagelser... IX Reset-test... IX Plots... X Breusch-Pagan
Læs mereFokus på Forsyning. Datagrundlag og metode
Fokus på Forsyning I notatet gennemgås datagrundlaget for brancheanalysen af forsyningssektoren sammen med variable, regressionsmodellen og tilhørende tests. Slutteligt sammenfattes analysens resultater
Læs mereMultipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression
Multipel Linear Regression Repetition Partiel F-test Modelsøgning Logistisk Regression Test for en eller alle parametre I jagten på en god statistisk model har vi set på følgende to hypoteser og tilhørende
Læs mereØkonometri 1. Målsætning for Økonometri 1. Dagens program: Afslutningsforelæsning 16. December 2005
Dagens program: Økonometri 1 Afrunding og perspektivering af Økonometri 1. Opfølgning af introduktionsforelæsningen. Wooldridge, kapitel 19: Carrying out an Empirical Project Oversigt over økonometriske
Læs mereVariansanalyse i SAS 1. Institut for Matematiske Fag December 2007
Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Institut for Matematiske Fag December 2007 Variansanalyse i SAS 1 Ensidet variansanalyse Bartlett s test Tukey s test PROC
Læs mereIkke-parametriske tests
Ikke-parametriske tests 2 Dagens menu t testen Hvordan var det nu lige det var? Wilcoxson Mann Whitney U Kruskall Wallis Friedman Kendalls og Spearmans correlation 3 t-testen Patient Drug Placebo difference
Læs mereAnalysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17
nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse
Læs mereReeksamen Bacheloruddannelsen i Medicin med industriel specialisering. Eksamensdato: Tid: kl
Reeksamen 2018 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 13-08-2018 Tid: kl. 09.00-11.00 Bedømmelsesform
Læs mereOversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode
Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse
Læs mereReestimation af eksportrelationerne april 2000
Danmarks Statistik MODELGRUPPEN Arbejdspapir* Tony Maarsleth Kristensen 14. marts 2000 Reestimation af eksportrelationerne april 2000 Resumé: I papiret præsenteres en reestimation af eksportrelationerne
Læs mereAnvendt Statistik Lektion 9. Variansanalyse (ANOVA)
Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:
Læs mereVi ønsker at konstruere normalområder for stofskiftet, som funktion af kropsvægten.
Opgavebesvarelse, Resting metabolic rate I filen T:\rmr.txt findes sammenhørende værdier af kropsvægt (bw, i kg) og hvilende stofskifte (rmr, kcal pr. døgn) for 44 kvinder (Altman, 1991 og Owen et.al.,
Læs mere6. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag)
Institut for Epidemiologi og Socialmedicin Institut for Biostatistik. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag) Opgave 1 Læs afsnit.1 i An Introduction to Medical Statistics, specielt
Læs mereReferat : af Gruppearbejde Økonometri1 øvelsestime ugeseddel 7 dato 26/3 2003, Hold 4
Referat : af Gruppearbejde Økonometri1 øvelsestime ugeseddel 7 dato 26/3 2003, Hold 4 Spm1 Den udvidede model med de to strukturelle variable sk og sh: g i (60-00) = B 0 + B 1 *log(y i ) + B 2 [ log(sk
Læs mereØkonometri 1. Inferens i den lineære regressionsmodel 2. oktober Økonometri 1: F8 1
Økonometri 1 Inferens i den lineære regressionsmodel 2. oktober 2006 Økonometri 1: F8 1 Dagens program Opsamling om asymptotiske egenskaber: Asymptotisk normalitet Asymptotisk efficiens Test af flere lineære
Læs meremen nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller
Type I og type II fejl Type I fejl: forkast når hypotese sand. α = signifikansniveau= P(type I fejl) Program (8.15-10): Hvis vi forkaster når Z < 2.58 eller Z > 2.58 er α = P(Z < 2.58) + P(Z > 2.58) =
Læs mere(studienummer) (underskrift) (bord nr)
Danmarks Tekniske Universitet Side 1 af 22 sider. Skriftlig prøve: 13. december 2010 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)
Læs mereSide 1 af 19 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402
Danmarks Tekniske Universitet Side 1 af 19 sider. Skriftlig prøve: 15. december 2007 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)
Læs mereStatistik Lektion 17 Multipel Lineær Regression
Statistik Lektion 7 Multipel Lineær Regression Polynomiel regression Ikke-lineære modeller og transformation Multi-kolinearitet Auto-korrelation og Durbin-Watson test Multipel lineær regression x,x,,x
Læs mereEn Introduktion til SAS. Kapitel 5.
En Introduktion til SAS. Kapitel 5. Inge Henningsen Afdeling for Statistik og Operationsanalyse Københavns Universitet Marts 2005 6. udgave Kapitel 5 T-test og PROC UNIVARIATE 5.1 Indledning Dette kapitel
Læs mere1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ
Indhold 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) 2 1.1 Variation indenfor og mellem grupper.......................... 2 1.2 F-test for ingen
Læs mereForelæsning 11: Kapitel 11: Regressionsanalyse
Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Læs mereAnvendt Statistik Lektion 9. Variansanalyse (ANOVA)
Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:
Læs mereMorten Frydenberg 14. marts 2006
Introduktion til Logistisk Regression Morten Frydenberg, Inst. f. Biostatistik 1 RESUME: 2 2. gang: 2006 Institut for Biostatistik, Århus Universitet MPH 1. studieår Specialmodul 4 Cand. San. uddannelsen
Læs mere1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer.
Vejledende besvarelse af hjemmeopgave Basal statistik, efterår 2008 En gruppe bestående af 45 patienter med reumatoid arthrit randomiseres til en af 6 mulige behandlinger, nemlig placebo, aspirin eller
Læs meregrupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen
1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen
Læs mereØkonometri 1 Efterår 2006 Ugeseddel 11
Økonometri 1 Efterår 2006 Ugeseddel 11 Program for øvelserne: Gruppearbejde og plenumdiskussion Introduktion til SAS øvelser SAS øvelser Øvelsesopgave: Paneldata estimation Sammenhængen mellem alder og
Læs mereRettevejledning til Økonomisk Kandidateksamen 2005I, Økonometri 1
Rettevejledning til Økonomisk Kandidateksamen 005I, Økonometri Vurderingsgrundlaget er selve opgavebesvarelsen og bilaget, inklusive det afleverede SAS program. Materialet på diskette/cd bedømmes som sådan
Læs mereOverlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere.
Overlevelse efter AMI Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Diabetes VF (Venticular fibrillation) WMI (Wall motion index) CHF (Cardiac Heart Failure) Køn og alder betragtes
Læs mereStatistik FSV 4. semester 2014 Øvelser Uge 2: 11. februar
Århus 6. februar 2014 Morten Frydenberg Statistik FSV 4. semester 2014 Øvelser Uge 2: 11. februar Til disse øvelser har I brug for fishoil1.dta, der indeholder data fra det fiskeolie forsøg vi så på ved
Læs mereOversigt. Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff. Envejs variansanalyse - eksempel
Kursus 02402 Introduktion til Statistik Forelæsning 12: Variansanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:
Læs mereModul 11: Simpel lineær regression
Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 11: Simpel lineær regression 11.1 Regression uden gentagelser............................. 1 11.1.1 Oversigt....................................
Læs mereØkonometri 1 Forår 2006 Ugeseddel 11
Økonometri 1 Forår 2006 Ugeseddel 11 Program for øvelserne: Gruppearbejde og plenumdiskussion Introduktion til SAS øvelser SAS øvelser Øvelsesopgave 5: Paneldata estimation af indkomstligninger på danske
Læs mereKvant Eksamen December 2010 3 timer med hjælpemidler. 1 Hvad er en continuous variable? Giv 2 illustrationer.
Kvant Eksamen December 2010 3 timer med hjælpemidler 1 Hvad er en continuous variable? Giv 2 illustrationer. What is a continuous variable? Give two illustrations. 2 Hvorfor kan man bedre drage konklusioner
Læs mereTænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i.
Repetition af vektor-regning Økonometri: Lektion 3 Matrix-formulering Fordelingsantagelse Hypotesetest Antag vi har to n-dimensionelle (søjle)vektorer a 1 b 1 a 2 a =. og b = b 2. a n b n Tænk på a og
Læs mereStatistik Lektion 16 Multipel Lineær Regression
Statistik Lektion 6 Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk
Læs mereEpidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april
Århus 8. april 2011 Morten Frydenberg Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april Opgave 1 ( gruppe 1: sp 1-4, gruppe 5: sp 5-9 og gruppe 6: 10-14) I denne opgaveser vi på et
Læs mereØkonometri 1. Dummyvariabler 13. oktober Økonometri 1: F10 1
Økonometri 1 Dummyvariabler 13. oktober 2006 Økonometri 1: F10 1 Dagens program Dummyvariabler i den multiple regressionsmodel (Wooldridge kap. 7.3-7.6) Dummy variabler for kvalitative egenskaber med flere
Læs mere1 Regressionsproblemet 2
Indhold 1 Regressionsproblemet 2 2 Simpel lineær regression 3 2.1 Mindste kvadraters tilpasning.............................. 3 2.2 Prædiktion og residualer................................. 5 2.3 Estimation
Læs mereKursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff
Kursus 02402 Introduktion til Statistik Forelæsning 12: Variansanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:
Læs mereMindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning
1 Regressionsproblemet 2 Simpel lineær regression Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 3
Læs mereLogistisk Regression - fortsat
Logistisk Regression - fortsat Likelihood Ratio test Generel hypotese test Modelanalyse Indtil nu har vi set på to slags modeller: 1) Generelle Lineære Modeller Kvantitav afhængig variabel. Kvantitative
Læs merek normalfordelte observationsrækker (ensidet variansanalyse)
k normalfordelte observationsrækker (ensidet variansanalyse) Lad x ij, i = 1,...,k, j = 1,..., n i, være udfald af stokastiske variable X ij og betragt modellen M 1 : X ij N(µ i, σ 2 ). Estimaterne er
Læs mereLogistisk regression. Statistik Kandidatuddannelsen i Folkesundhedsvidenskab
Logistis regression Statisti Kandidatuddannelsen i Folesundhedsvidensab Multipel logistis regression Antagelser: Binære observationer (Y i, i=,.,n) f.es Ja/Nej Høj/Lav Død/Levende Kodet: / 0 Y i uafhængige
Læs mereProgram. Indhold af kursus i overskrifter. Farlighed af GM-majs? (Ingeniøren Generel lineær model/multipel regression
Program Indhold af kursus i overskrifter 1. overblik over kursus (opgaver fra sidst samt huspriser som eksempler). 2. p-værdi 3. uformel evaluering 1. sandsynlighedsregning sandsynlighedsfordelinger (normal,
Læs mereForelæsning 11: Envejs variansanalyse, ANOVA
Kursus 02323: Introduktion til Statistik Forelæsning 11: Envejs variansanalyse, ANOVA Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark
Læs mereReestimation af uddannelsessøgende til modelversion okt15
Danmarks Statistik MODELGRUPPEN Arbejdspapir* Laurits Rømer Hjorth 5. oktober 2015 Reestimation af uddannelsessøgende til modelversion okt15 Resumé: Relationen for uddannelsessøgende reestimeres til modelversion
Læs mereProgram. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter
Program Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Øvelse: effekt af diæter. Repetition fra sidst... Parrede og ikke-parrede
Læs mereNormalfordelingen. Statistik og Sandsynlighedsregning 2
Normalfordelingen Statistik og Sandsynlighedsregning 2 Repetition og eksamen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige fejl på
Læs mereTransparency International Danmark på Roskilde Festival 2018: Har indsatsen nyttet noget?
Transparency International Danmark på Roskilde Festival 2018: Har indsatsen nyttet noget? Udarbejdet af frivillige Frederik Carl Windfeld og Kim Alexander Byrial Juárez Jensen samt sekretariatet i Transparency
Læs mereReeksamen i Statistik for biokemikere. Blok 3 2007.
Københavns Universitet Det Naturvidenskabelige Fakultet Reeksamen i Statistik for biokemikere. Blok 3 2007. Opgave 1. 3 timers skriftlig prøve. Alle hjælpemidler - også blyant - er tilladt. Opgavesættet
Læs mereEksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning
1 Multipel regressions model Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning PSE (I17) ASTA - 11. lektion
Læs mereØkonometri, ugeseddel 8 Hold 1 1/4-2003
1 Modeller/diagrammer med dummy er Disse tre diagrammer ligger til grund for gruppearbejdet. a) Generel regressions model g = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 +..+ β n x n + u i, Hvor i =1,.n g b) Model
Læs mereLøsning eksamen d. 15. december 2008
Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th
Læs mereLogistisk Regression. Repetition Fortolkning af odds Test i logistisk regression
Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression: Definitioner For en binær (0/) variabel Y antager vi P(Y)p P(Y0)-p Eksempel: Bil til arbejde vs alder
Læs mereØkonometri 1. Oversigt. Mere om dataproblemer Gentagne tværsnit og panel data I
Oversigt Økonometri 1 Mere om dataproblemer Gentagne tværsnit og panel data I Info om prøveeksamen Mere om proxyvariabler og målefejl fra sidste gang. Selektion og dataproblemer Intro til nyt emne: Observationer
Læs mereMLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som
MLR antagelserne Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som y = β 0 + β 1 x 1 + β 2 x 2 + + β k x k + u, hvor β 0, β 1, β 2,...,β k er ukendte parametere,
Læs mereAfdeling for Anvendt Matematik og Statistik Januar Regressionsanalyse i SAS 2. Regressionsanalyse med GLM Sammenligning af regressionslinier
Københavns Universitet Statistik for Biokemikere Det naturvidenskabelige fakultet Inge Henningsen Afdeling for Anvendt Matematik og Statistik Januar 2007 2 Regressionsanalyse med GLM Sammenligning af regressionslinier
Læs mereKursus 02323: Introducerende Statistik. Forelæsning 8: Simpel lineær regression. Peder Bacher
Kursus 02323: Introducerende Statistik Forelæsning 8: Simpel lineær regression Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:
Læs mereProgram. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data
Faculty of Life Sciences Program t-test Hypoteser, teststørrelser og p-værdier Claus Ekstrøm E-mail: ekstrom@life.ku.dk Resumé og hængepartier fra sidst. Eksempel: effekt af foder på hormonkoncentration
Læs mereAppendices. Appendix 2: Questionnaire in StudSurvey. Appendix 3: Text presenting the electronic questionnaire. Appendix 4: Outputs from regressions
Appendices Appendix 1: Print screen of WEB-DIRECT Appendix 2: Questionnaire in StudSurvey Appendix 3: Text presenting the electronic questionnaire Appendix 4: Outputs from regressions StudSurvey http://studsurvey.asb.dk/nsurveyadmin/surveycontentbuilder.aspx?surv...
Læs merek UAFHÆNGIGE grupper Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen 4 Hypotesetest (F-test)
Kursus 02323: Introduktion til Statistik Forelæsning 11: Envejs variansanalse, ANOVA Peder Bacher DTU Compute, Dnamiske Sstemer Bgning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lngb Danmark e-mail:
Læs mereUge 13 referat hold 4
Uge 13 referat hold 4 Gruppearbejde 1a: Er variablen kvotient inkluderet på en hensigtsmæssig måde? Der er to problemer med kvotient: 1) Den er trunkeret ved 6.9 og 10.0, løsningen er at indføre dummyer
Læs mereKursus i varians- og regressionsanalyse Data med detektionsgrænse. Birthe Lykke Thomsen H. Lundbeck A/S
Kursus i varians- og regressionsanalyse Data med detektionsgrænse Birthe Lykke Thomsen H. Lundbeck A/S 1 Data med detektionsgrænse Venstrecensurering: Baggrundsstøj eller begrænsning i måleudstyrets følsomhed
Læs mereAnvendt Statistik Lektion 7. Simpel Lineær Regression
Anvendt Statistik Lektion 7 Simpel Lineær Regression 1 Er der en sammenhæng? Plot af mordraten () mod fattigdomsraten (): Scatterplot Afhænger mordraten af fattigdomsraten? 2 Scatterplot Et scatterplot
Læs meren r x rs x r = 1 n r s=1 (x rs x r ) 2, s=1
(a) Denne opgave bygger på resultaterne fra 2 forsøg med epo-behandling af for tidligt fødte børn, idet gruppe 1 og 3 stammer fra første forsøg, mens gruppe 2 og 4 stammer fra det andet. Det må antages,
Læs mereEksportørgevinst i eksportrelationen
Danmarks Statistik MODELGRUPPEN Arbejdspapir* Ivanna Blagova 4. maj 2016 Eksportørgevinst i eksportrelationen Resumé: Nogle muligheder for at inkludere eksportørgevinst i eksportrelationen er undersøgt.
Læs mereFokus på forsyning Investeringer I: Behov og afkast Investeringer II: Konsekvenser
Investeringer I: Behov og afkast Investeringer II: Konsekvenser : I notatet beskrives datagrundlaget for analyserne af spildevandsselskabernes tilstand, muligheder og valg vedr. investering og finansiering.
Læs mere