Økonometri B i R. Sebastian Barfort.
|
|
|
- Valdemar Jørgensen
- 7 år siden
- Visninger:
Transkript
1 Økonometri B i R Sebastian Barfort [email protected] Hvis man gerne vil igang med R, men har svært ved den stejle læringskurve, kan nedenstående måske fungere som en slags guide. For at have et konkret dataset at forholde os til vil vi arbejde med data fra sommer eksamensopgaven i Økonometri B. Bemærk, at denne guide ikke anbefaler at skifte SAS ud med R, men blot er ment som en illustration af, at R kan mange af de samme ting som Stata og SAS. At R så er platform uafhængigt og gratis kan man så alt efter behov vurdere værdien af. Dette dokument er skrevet i R og kan frit downloades her. Bemærk, at jeg ikke har sammenholdt resultaterne i dette dokument med rettevejledningen, og det er muligt, at enkelte fejl har sneget sig ind. Kontakt mig endelig i tilfælde af fejl, eller endnu bedre, ret selv i filen på Github. 1 Data Vi vil arbejde med det data der ligger i en.zip fil på instituttes hjemmeside. Den første opgave må således være at downloade data til vores computer. Det følgende stykke kode downloader.zip filen i en til lejligheden oprettet mappe på skrivebordet, unzipper, og loader den som et dataset i R..exdir <- "~/Desktop/tmp" dir.create(.exdir).file <- file.path(.exdir, "groupdata7.zip") # download file url <- " download.file(url,.file) # unzip it unzip(.file, exdir = path.expand(.exdir)) # load groupdata0.sas7bdat examdata <- read.sas7bdat("/users/sebastianbarfort/desktop/tmp/groupdata0.sas7bdat") Data er en redigeret version af data brugt i Bloom et al. (2012), Americans Do IT Better. Vi kan se navnene på de 24 variable i data således names(examdata) [1] "COMPANY_CODE" "MONITORING" "OPERATIONS" "PEEPS" "SIC" [6] "YEAR" "LDGR" "DFRA" "DGER" "DITA" [11] "DSWE" "DY0" "DY1" "DY2" "DY3" [16] "DY4" "DY5" "Q" "C" "L" [21] "K" "CL" "DUSO" "DOFO" 1
2 og få et hurtigt overblik over variablene med summary(examdata) COMPANY_CODE MONITORING OPERATIONS PEEPS SIC Min. : 1 Min. : Min. : Min. : Min. :201 1st Qu.: 420 1st Qu.: st Qu.: st Qu.: st Qu.:267 Median : 718 Median : Median : Median : Median :326 Mean : 809 Mean : Mean : Mean : Mean :311 3rd Qu.:1083 3rd Qu.: rd Qu.: rd Qu.: rd Qu.:356 Max. :1822 Max. : Max. : Max. : Max. :671 YEAR LDGR DFRA DGER DITA Min. :2000 Min. :-2.7 Min. :0.000 Min. : Min. : st Qu.:2001 1st Qu.: 1.6 1st Qu.: st Qu.: st Qu.:0.000 Median :2003 Median : 2.4 Median :0.000 Median : Median :0.000 Mean :2003 Mean : 2.3 Mean :0.185 Mean : Mean : rd Qu.:2004 3rd Qu.: 3.1 3rd Qu.: rd Qu.: rd Qu.:0.000 Max. :2005 Max. : 4.6 Max. :1.000 Max. : Max. :1.000 NA's :447 DSWE DY0 DY1 DY2 DY3 Min. :0.000 Min. :0.000 Min. :0.000 Min. :0.000 Min. : st Qu.: st Qu.: st Qu.: st Qu.: st Qu.:0.000 Median :0.000 Median :0.000 Median :0.000 Median :0.000 Median :0.000 Mean :0.181 Mean :0.132 Mean :0.147 Mean :0.159 Mean : rd Qu.: rd Qu.: rd Qu.: rd Qu.: rd Qu.:0.000 Max. :1.000 Max. :1.000 Max. :1.000 Max. :1.000 Max. :1.000 DY4 DY5 Q C L Min. :0.000 Min. :0.00 Min. : 3.5 Min. : Min. :0.00 1st Qu.: st Qu.:0.00 1st Qu.:10.3 1st Qu.: st Qu.:5.12 Median :0.000 Median :0.00 Median :10.9 Median : Median :5.61 Mean :0.198 Mean :0.18 Mean :11.0 Mean : Mean :5.75 3rd Qu.: rd Qu.:0.00 3rd Qu.:11.7 3rd Qu.: rd Qu.:6.27 Max. :1.000 Max. :1.00 Max. :15.8 Max. : Max. :9.39 K CL DUSO DOFO Min. : Min. : Min. : Min. :0.00 1st Qu.: st Qu.: st Qu.: st Qu.:0.00 Median : Median : Median : Median :0.00 Mean : Mean : Mean : Mean :0.27 3rd Qu.: rd Qu.: rd Qu.: rd Qu.:1.00 Max. : Max. : Max. : Max. :1.00 2
3 I de første opgaver i eksamensopgaven bliver vi bedt om at fokusere på de 409 observationer for året Vi kan subsette vores data i R med følgende kommando examdata2005 <- subset(examdata, YEAR == 2005) Variablene kan gruperes forskelligt, og vi kan lave deskriptive tabeller på et par forskellige grupper således prod <- c("q", "C", "L", "K", "CL") own <- c("duso", "DOFO") c.op <- c("dfra", "DGER", "DITA", "DSWE") # subsetting examdata2005 examdata <- examdata2005[prod] examdata <- examdata2005[own] examdata <- examdata2005[c.op] tabellerne ser således ud Table 1: Statistic N Mean St. Dev. Min Max Q C L K CL Table 2: Statistic N Mean St. Dev. Min Max DUSO DOFO Table 3: Statistic N Mean St. Dev. Min Max DFRA DGER DITA DSWE
4 Vi kan også lave et par figurer over sammenhængeng mellem IT og produktion baseret på virksomhedens ejerskab. examdata2005$duso <- as.factor(examdata2005$duso) examdata2005$duso <- revalue(examdata2005$duso, c(`0` = "non-us ownership", `1` = "US ownership")) examdata2005$dofo <- as.factor(examdata2005$dofo) examdata2005$dofo <- revalue(examdata2005$dofo, c(`0` = "non-foreign ownership", `1` = "foreign ownershi figurerne ser således ud IT and Production non US ownership US ownership IT and Production non foreign ownership foreign ownership Production 12 Production IT IT I eksamensopgaven bliver man bedt om at lave to OLS og en enkelt first difference regression. Vi kan foretage de to OLS er med følgende kommando lm.1 <- lm(q ~ C + L + K + DUSO + DUSO * CL + DOFO + DOFO * CL + DY1 + DY2 + DY3 + DY4 + DY5 + DFRA + DGER + DITA + DSWE, data = examdata) lm.2 <- lm(q ~ C + L + K + DUSO + DUSO * CL + DOFO + DOFO * CL + DY1 + DY2 + DY3 + DY4 + DY5 + DFRA + DGER + DITA + DSWE + PEEPS + PEEPS * CL, data = examdata) Vi kan udføre en Breusch-Pagan test for heteroskedasticitet på de to OLS er med følgende kommando bptest(lm.1) studentized Breusch-Pagan test data: lm.1 BP = 84.78, df = 17, p-value = 5.356e-11 bptest(lm.2) studentized Breusch-Pagan test data: lm.2 BP = 96.11, df = 19, p-value = 2.69e-12 Bemærk, at nul hypotesen om homoskedasticitet afvises på alle fornuftige signifikansniveauer for begge modeller. 4
5 Vi kan også teste en lineær hypotese, eksempelvis at β 1 = β 2 som linearhypothesis(lm.1, "C = L") Linear hypothesis test Hypothesis: C - L = 0 Model 1: restricted model Model 2: Q ~ C + L + K + DUSO + DUSO * CL + DOFO + DOFO * CL + DY1 + DY2 + DY3 + DY4 + DY5 + DFRA + DGER + DITA + DSWE Res.Df RSS Df Sum of Sq F Pr(>F) Vi kan tilføje White heteroskedasticitets robuste standard fejl på følgende måde lm.1$se <- vcovhc(lm.1) lm.2$se <- vcovhc(lm.2) og lave tabeller af de to regressioner uden 5
6 Table 4: Model 1 Model 2 C ( ) ( ) L ( ) ( ) K (0.01) (0.01) DUSO CL ( ) ( ) DOFO (0.02) (0.02) DY DY DY DY DY DFRA DGER DITA DSWE DUSO:CL (0.07) (0.07) CL:DOFO PEEPS 0.05 CL:PEEPS (0.01) 0.10 (0.02) N R adj. R Resid. sd Standard errors in parentheses significant at p <.10; p <.05; p <.01; p <.001 6
7 og med korrigerende standard fejl Table 5: Model 1 Model 2 C ( ) ( ) L ( ) ( ) K (0.01) (0.01) DUSO CL ( ) ( ) DOFO (0.02) (0.02) DY DY DY DY DY DFRA DGER (0.05) (0.05) DITA DSWE DUSO:CL (0.06) (0.05) CL:DOFO PEEPS 0.05 CL:PEEPS (0.01) 0.10 (0.02) N R adj. R Resid. sd Robust standard errors in parentheses significant at p <.10; p <.05; p <.01; p <.001 7
8 I en af de sidste opgaver bliver vi bedt om at konstruere et balanceret panel med virksomheder, der både indgår i data i 2000 og Det kan vi gøre med følgende kommandoer examdata2000 <- subset(examdata, YEAR == 2000) # extract company code ccode <- examdata2000$company_code examdata2005 <- subset(examdata2005, COMPANY_CODE %in% ccode) ccode2005 <- examdata2005$company_code examdata2000 <- subset(examdata2000, COMPANY_CODE %in% ccode2005) merge.examdata <- smartbind(examdata2000, examdata2005) Vi kan estimere en first difference model på vores panel fd.lm.2 <- plm(q ~ C + L + K + DUSO + DUSO * CL + DOFO + DOFO * CL + DFRA + DGER + DITA + DSWE + PEEPS + PEEPS * CL, index = c("company_code", "YEAR"), data = merge.examdata, model = "fd") series DY1, xdy2, xdy3, xdy4 are constants and have been removed 8
9 og lave en flot tabel Table 6: Dependent variable: Q panel linear C 122, (119, ) L 122, (119, ) K (0.046) CL 122, (119, ) DUSO:CL (0.084) CL:DOFO (0.078) CL:PEEPS (0.056) Constant (0.025) Observations 187 R Adjusted R F statistic (d f = 7; 179) Note: p < 0.1; p < 0.05; p <
Økonometri: Lektion 6 Emne: Heteroskedasticitet
Økonometri: Lektion 6 Emne: Heteroskedasticitet 1 / 32 Konsekvenser af Heteroskedasticitet Antag her (og i resten) at MLR.1 til MLR.4 er opfyldt. Antag MLR.5 ikke er opfyldt, dvs. vi har heteroskedastiske
Lagrange multiplier test. Økonometri: Lektion 6 Håndtering ad heteroskedasticitet. Konsekvenser af Heteroskedasticitet
Lagrange multiplier test Et alternativ til F -testet af en eller flere parametre. Økonometri: Lektion 6 Håndtering ad heteroskedasticitet Antag vi har model: y = β 0 + β 1 x 2 + + β k x k + u. Vi ønsker
Økonometri: Lektion 6 Emne: Heteroskedasticitet
Økonometri: Lektion 6 Emne: Heteroskedasticitet 1 / 34 Lagrange multiplier test Et alternativ til F -testet af en eller flere parametre. Antag vi har model: Vi ønsker at teste hypotesen y = β 0 + β 1 x
En meget kort introduktion til R på polit
En meget kort introduktion til R på polit Sebastian Barfort [email protected] Indhold 1 Introduktion 1 2 R som lommeregner 2 3 Tabeller, grafer og estimation 6 4 Økonomiske figurer 11 1 Introduktion
Lineær regression. Simpel regression. Model. ofte bruges følgende notation:
Lineær regression Simpel regression Model Y i X i i ofte bruges følgende notation: Y i 0 1 X 1i i n i 1 i 0 Findes der en linie, der passer bedst? Metode - Generel! least squares (mindste kvadrater) til
Økonometri: Lektion 4. Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater
Økonometri: Lektion 4 Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater 1 / 35 Hypotesetest for én parameter Antag vi har model y = β 0 + β 1 x 2 + β 2 x 2 + + β k x k + u. Vi
Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model
Reminder: Hypotesetest for én parameter Antag vi har model Økonometri: Lektion 4 F -test Justeret R 2 Aymptotiske resultater y = β 0 + β 1 x 2 + β 2 x 2 + + β k x k + u. Vi ønsker at teste hypotesen H
Reeksamen i Statistik for Biokemikere 6. april 2009
Københavns Universitet Det Naturvidenskabelige Fakultet Reeksamen i Statistik for Biokemikere 6. april 2009 Alle hjælpemidler er tilladt, og besvarelsen må gerne skrives med blyant. Opgavesættet er på
Kvantitative metoder 2
Kvantitative metoder Heteroskedasticitet 11. april 007 KM: F18 1 Oversigt: Heteroskedasticitet OLS estimation under heteroskedasticitet (W.8.1-): Konsekvenser af heteroskedasticitet for OLS Gyldige test
Eksamen i Statistik for Biokemikere, Blok januar 2009
Københavns Universitet Det Naturvidenskabelige Fakultet Eksamen i Statistik for Biokemikere, Blok 2 2008 09 19. januar 2009 Alle hjælpemidler er tilladt, og besvarelsen må gerne skrives med blyant. Opgavesættet
Økonometri Lektion 1 Simpel Lineær Regression 1/31
Økonometri Lektion 1 Simpel Lineær Regression 1/31 Simpel Lineær Regression Mål: Forklare variablen y vha. variablen x. Fx forklare Salg (y) vha. Reklamebudget (x). Statistisk model: Vi antager at sammenhængen
Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model
Multipel regression M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Y j 1 X 1j 2 X 2j... m X mj j eller m Y j 0 i 1 i X ij j BEMÆRK! j svarer til individ
Appendiks A Anvendte test statistikker
Appendiks A Anvendte test statistikker Afhandlingen opdeler testene i henholdsvis parametriske og ikke-parametriske test. De første fire test er parametriske test, mens de ikke-parametriske test udgør
Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6
Institut for Matematiske Fag Matematisk Modellering 1 Aarhus Universitet Eva B. Vedel Jensen 25. februar 2008 UGESEDDEL 6 Forelæsningerne torsdag den 21. februar og tirsdag den 26. februar. Jeg har gennemgået
Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1
Matematisk Modellering 1 Side 1 I nærværende opgavesæt er der 16 spørgsmål fordelt på 4 opgaver. Ved bedømmelsen af besvarelsen vægtes alle spørgsmål lige. Endvidere lægges der vægt på, at det af besvarelsen
Besvarelse af vitcap -opgaven
Besvarelse af -opgaven Spørgsmål 1 Indlæs data Dette gøres fra Analyst med File/Open, som sædvanlig. Spørgsmål 2 Beskriv fordelingen af vital capacity og i de 3 grupper ved hjælp af summary statistics.
Eksamen i Statistik for biokemikere. Blok
Københavns Universitet Det Naturvidenskabelige Fakultet Eksamen i Statistik for biokemikere. Blok 2 2007. 3 timers skriftlig prøve. Alle hjælpemidler - også blyant - er tilladt. Opgavesættet er på 8 sider.
Multipel Lineær Regression
Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer
Lineær regression i SAS. Lineær regression i SAS p.1/20
Lineær regression i SAS Lineær regression i SAS p.1/20 Lineær regression i SAS Simpel lineær regression Grafisk modelkontrol Multipel lineær regression SAS-procedurer: PROC REG PROC GPLOT Lineær regression
Eksamen Bacheloruddannelsen i Medicin med industriel specialisering
Eksamen 2016 Titel på kursus: Uddannelse: Semester: Forsøgsdesign og metoder Bacheloruddannelsen i Medicin med industriel specialisering 6. semester Eksamensdato: 17-02-2015 Tid: kl. 09.00-11.00 Bedømmelsesform
Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved
Matematisk Modellering 1 (reeksamen) Side 1 Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved { 1 hvis x {1, 2, 3}, p X (x) = 3 0 ellers,
Generelle lineære modeller
Generelle lineære modeller Regressionsmodeller med én uafhængig intervalskala variabel: Y en eller flere uafhængige variable: X 1,..,X k Den betingede fordeling af Y givet X 1,..,X k antages at være normal
Skriftlig eksamen Science statistik- ST501
SYDDANSK UNIVERSITET INSTITUT FOR MATEMATIK OG DATALOGI Skriftlig eksamen Science statistik- ST501 Torsdag den 21. januar Opgavesættet består af 5 opgaver, med i alt 13 delspørgsmål, som vægtes ligeligt.
Økonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol
Økonometri: Lektion 5 Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol 1 / 35 Veksekvirkning: Motivation Vi har set på modeller som Price
Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j
Hypoteser om mere end to stikprøver ANOVA k stikprøver: (ikke ordinale eller højere) H 0 : 1 2... k gælder også for k 2! H 0ij : i j H 0ij : i j simpelt forslag: k k 1 2 t-tests: i j DUER IKKE! Bonferroni!!
Appendiks Økonometrisk teori... II
Appendiks Økonometrisk teori... II De klassiske SLR-antagelser... II Hypotesetest... VII Regressioner... VIII Inflation:... VIII Test for SLR antagelser... IX Reset-test... IX Plots... X Breusch-Pagan
Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression
Multipel Linear Regression Repetition Partiel F-test Modelsøgning Logistisk Regression Test for en eller alle parametre I jagten på en god statistisk model har vi set på følgende to hypoteser og tilhørende
Ikke-parametriske tests
Ikke-parametriske tests 2 Dagens menu t testen Hvordan var det nu lige det var? Wilcoxson Mann Whitney U Kruskall Wallis Friedman Kendalls og Spearmans correlation 3 t-testen Patient Drug Placebo difference
Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17
nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse
Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode
Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse
Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)
Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:
6. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag)
Institut for Epidemiologi og Socialmedicin Institut for Biostatistik. SEMESTER Epidemiologi og Biostatistik Opgaver til Uge 1 (fredag) Opgave 1 Læs afsnit.1 i An Introduction to Medical Statistics, specielt
Økonometri 1. Inferens i den lineære regressionsmodel 2. oktober Økonometri 1: F8 1
Økonometri 1 Inferens i den lineære regressionsmodel 2. oktober 2006 Økonometri 1: F8 1 Dagens program Opsamling om asymptotiske egenskaber: Asymptotisk normalitet Asymptotisk efficiens Test af flere lineære
men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller
Type I og type II fejl Type I fejl: forkast når hypotese sand. α = signifikansniveau= P(type I fejl) Program (8.15-10): Hvis vi forkaster når Z < 2.58 eller Z > 2.58 er α = P(Z < 2.58) + P(Z > 2.58) =
Statistik Lektion 17 Multipel Lineær Regression
Statistik Lektion 7 Multipel Lineær Regression Polynomiel regression Ikke-lineære modeller og transformation Multi-kolinearitet Auto-korrelation og Durbin-Watson test Multipel lineær regression x,x,,x
En Introduktion til SAS. Kapitel 5.
En Introduktion til SAS. Kapitel 5. Inge Henningsen Afdeling for Statistik og Operationsanalyse Københavns Universitet Marts 2005 6. udgave Kapitel 5 T-test og PROC UNIVARIATE 5.1 Indledning Dette kapitel
1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ
Indhold 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) 2 1.1 Variation indenfor og mellem grupper.......................... 2 1.2 F-test for ingen
Forelæsning 11: Kapitel 11: Regressionsanalyse
Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800
Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)
Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:
Morten Frydenberg 14. marts 2006
Introduktion til Logistisk Regression Morten Frydenberg, Inst. f. Biostatistik 1 RESUME: 2 2. gang: 2006 Institut for Biostatistik, Århus Universitet MPH 1. studieår Specialmodul 4 Cand. San. uddannelsen
1. Lav en passende arbejdstegning, der illustrerer samtlige enkeltobservationer.
Vejledende besvarelse af hjemmeopgave Basal statistik, efterår 2008 En gruppe bestående af 45 patienter med reumatoid arthrit randomiseres til en af 6 mulige behandlinger, nemlig placebo, aspirin eller
grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen
1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen
Overlevelse efter AMI. Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Køn og alder betragtes som confoundere.
Overlevelse efter AMI Hvilken betydning har følgende faktorer for risikoen for ikke at overleve: Diabetes VF (Venticular fibrillation) WMI (Wall motion index) CHF (Cardiac Heart Failure) Køn og alder betragtes
Statistik FSV 4. semester 2014 Øvelser Uge 2: 11. februar
Århus 6. februar 2014 Morten Frydenberg Statistik FSV 4. semester 2014 Øvelser Uge 2: 11. februar Til disse øvelser har I brug for fishoil1.dta, der indeholder data fra det fiskeolie forsøg vi så på ved
Modul 11: Simpel lineær regression
Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 11: Simpel lineær regression 11.1 Regression uden gentagelser............................. 1 11.1.1 Oversigt....................................
Statistik Lektion 16 Multipel Lineær Regression
Statistik Lektion 6 Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk
Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april
Århus 8. april 2011 Morten Frydenberg Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april Opgave 1 ( gruppe 1: sp 1-4, gruppe 5: sp 5-9 og gruppe 6: 10-14) I denne opgaveser vi på et
Økonometri 1. Dummyvariabler 13. oktober Økonometri 1: F10 1
Økonometri 1 Dummyvariabler 13. oktober 2006 Økonometri 1: F10 1 Dagens program Dummyvariabler i den multiple regressionsmodel (Wooldridge kap. 7.3-7.6) Dummy variabler for kvalitative egenskaber med flere
Kursus Introduktion til Statistik. Forelæsning 12: Variansanalyse. Per Bruun Brockhoff
Kursus 02402 Introduktion til Statistik Forelæsning 12: Variansanalyse Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske Universitet 2800 Lyngby Danmark e-mail:
Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning
1 Regressionsproblemet 2 Simpel lineær regression Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 3
Logistisk Regression - fortsat
Logistisk Regression - fortsat Likelihood Ratio test Generel hypotese test Modelanalyse Indtil nu har vi set på to slags modeller: 1) Generelle Lineære Modeller Kvantitav afhængig variabel. Kvantitative
Logistisk regression. Statistik Kandidatuddannelsen i Folkesundhedsvidenskab
Logistis regression Statisti Kandidatuddannelsen i Folesundhedsvidensab Multipel logistis regression Antagelser: Binære observationer (Y i, i=,.,n) f.es Ja/Nej Høj/Lav Død/Levende Kodet: / 0 Y i uafhængige
Forelæsning 11: Envejs variansanalyse, ANOVA
Kursus 02323: Introduktion til Statistik Forelæsning 11: Envejs variansanalyse, ANOVA Peder Bacher DTU Compute, Dynamiske Systemer Bygning 303B, Rum 009 Danmarks Tekniske Universitet 2800 Lyngby Danmark
Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter
Program Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve Helle Sørensen E-mail: [email protected] I formiddag: Øvelse: effekt af diæter. Repetition fra sidst... Parrede og ikke-parrede
Normalfordelingen. Statistik og Sandsynlighedsregning 2
Normalfordelingen Statistik og Sandsynlighedsregning 2 Repetition og eksamen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige fejl på
Reeksamen i Statistik for biokemikere. Blok 3 2007.
Københavns Universitet Det Naturvidenskabelige Fakultet Reeksamen i Statistik for biokemikere. Blok 3 2007. Opgave 1. 3 timers skriftlig prøve. Alle hjælpemidler - også blyant - er tilladt. Opgavesættet
Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning
1 Multipel regressions model Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning PSE (I17) ASTA - 11. lektion
Løsning eksamen d. 15. december 2008
Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th
Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression
Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression: Definitioner For en binær (0/) variabel Y antager vi P(Y)p P(Y0)-p Eksempel: Bil til arbejde vs alder
Økonometri 1. Oversigt. Mere om dataproblemer Gentagne tværsnit og panel data I
Oversigt Økonometri 1 Mere om dataproblemer Gentagne tværsnit og panel data I Info om prøveeksamen Mere om proxyvariabler og målefejl fra sidste gang. Selektion og dataproblemer Intro til nyt emne: Observationer
MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som
MLR antagelserne Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som y = β 0 + β 1 x 1 + β 2 x 2 + + β k x k + u, hvor β 0, β 1, β 2,...,β k er ukendte parametere,
Program. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data
Faculty of Life Sciences Program t-test Hypoteser, teststørrelser og p-værdier Claus Ekstrøm E-mail: [email protected] Resumé og hængepartier fra sidst. Eksempel: effekt af foder på hormonkoncentration
Kursus i varians- og regressionsanalyse Data med detektionsgrænse. Birthe Lykke Thomsen H. Lundbeck A/S
Kursus i varians- og regressionsanalyse Data med detektionsgrænse Birthe Lykke Thomsen H. Lundbeck A/S 1 Data med detektionsgrænse Venstrecensurering: Baggrundsstøj eller begrænsning i måleudstyrets følsomhed
Anvendt Statistik Lektion 7. Simpel Lineær Regression
Anvendt Statistik Lektion 7 Simpel Lineær Regression 1 Er der en sammenhæng? Plot af mordraten () mod fattigdomsraten (): Scatterplot Afhænger mordraten af fattigdomsraten? 2 Scatterplot Et scatterplot
