Økonometri 1. Dagens program. Den multiple regressionsmodel 18. september 2006

Relaterede dokumenter
Økonometri 1. Den simple regressionsmodel 11. september Økonometri 1: F2

Kvantitative metoder 2

! Variansen på OLS estimatoren. ! Multikollinaritet. ! Variansen i misspecificerede modeller. ! Estimat af variansen på fejlleddet

Kvantitative metoder 2

Økonometri 1. Inferens i den lineære regressionsmodel 2. oktober Økonometri 1: F8 1

Økonometri 1. Dummyvariabler 13. oktober Økonometri 1: F10 1

! Proxy variable. ! Målefejl. ! Manglende observationer. ! Dataudvælgelse. ! Ekstreme observationer. ! Eksempel: Lønrelation (på US data)

Økonometri 1. Oversigt. Mere om dataproblemer Gentagne tværsnit og panel data I

Økonometri: Lektion 2 Multipel Lineær Regression 1/27

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

Simpel Lineær Regression: Model

Økonometri 1. FunktioneI form i den lineære regressionsmodel 19. oktober Dagens program

Økonometri 1. Inferens i den lineære regressionsmodel 25. september Økonometri 1: F6 1

Økonometri 1. Prediktion. Dummyvariabler 9. oktober Økonometri 1: F9 1

Økonometri Lektion 1 Simpel Lineær Regression 1/31

Økonometri: Lektion 2 Multipel Lineær Regression 1/33

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Simpel Lineær Regression

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk

! Husk at udfylde spørgeskema 3. ! Lineær sandsynlighedsmodel. ! Eksempel. ! Mere om evaluering og selvselektion

Økonometri: Lektion 6 Emne: Heteroskedasticitet

Forelæsning 11: Kapitel 11: Regressionsanalyse

1. Intoduktion. Undervisningsnoter til Øvelse i Paneldata

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Økonometri 1. Gentagne tværsnit (W ): Opsamling. Gentagne tværsnit og paneldata. Gentagne Tværsnit og Paneldata II.

Lagrange multiplier test. Økonometri: Lektion 6 Håndtering ad heteroskedasticitet. Konsekvenser af Heteroskedasticitet

Lineære normale modeller (4) udkast

Økonometri: Lektion 6 Emne: Heteroskedasticitet

Velkommen til kurset. Teoretisk Statistik. Lærer: Niels-Erik Jensen

Kvantitative metoder 2

Økonometri lektion 5 Multipel Lineær Regression. Inferens Modelkontrol Prædiktion

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Økonometri: Lektion 4. Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning

Module 4: Ensidig variansanalyse

Module 1: Lineære modeller og lineær algebra

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

Module 3: Statistiske modeller

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Økonometri: Lektion 7 Emne: Prædiktionsintervaller, RESET teset, proxy variable og manglende data.

Økonometri 1. Inferens i den lineære regressionsmodel 29. september Økonometri 1: F7 1

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Modul 11: Simpel lineær regression

Hvad er danskernes gennemsnitshøjde? N = 10. X 1 = 169 cm. X 2 = 183 cm. X 3 = 171 cm. X 4 = 113 cm. X 5 = 174 cm

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Økonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol

Modul 6: Regression og kalibrering

Økonometri 1. Interne evalueringer af forelæsninger. Kvalitative variabler. Dagens program. Dummyvariabler 21. oktober 2004

To samhørende variable

Modul 12: Regression og korrelation

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Matrix Algebra med Excel Forelæsningsnoter til FR86. Jesper Lund

Kvantitative Metoder 1 - Efterår Dagens program

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning

Kvantitative metoder 2

Økonometri 1. Kvalitative variabler. Kvalitative variabler. Dagens program. Kvalitative variable 8. marts 2006

Supplement til kapitel 4 Om sandsynlighedsmodeller for flere stokastiske variable

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge

Appendiks Økonometrisk teori... II

Statistik Lektion 16 Multipel Lineær Regression

Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model

Statistik II 4. Lektion. Logistisk regression

Note om Monte Carlo eksperimenter

Multipel regression. Data fra opgave 3 side 453: Multipel regressionsmodel: Y = α + β 1 x 1 + β 2 x 2 + ǫ. hvor ǫ N(0, σ 2 ).

Et eksempel på en todimensional normalfordeling Anders Milhøj September 2006

5. Dynamiske Modeller

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Statistik Lektion 4. Variansanalyse Modelkontrol

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Transkript:

Dagens program Økonometri Den multiple regressionsmodel 8. september 006 Opsamling af statistiske resultater om den simple lineære regressionsmodel (W kap..5). Den multiple lineære regressionsmodel (W kap. 3.-3.3+appendix E.-E.) Definition og motivation Fortolkning af parametrene i den multiple regressionsmodel Sammenligning af den simple og multiple regressionsmodel Middelrette OLS estimatorer Økonometri : F4 Økonometri : F4

Definition og motivation Definition og motivation Den multiple regressionsmodel er en udvidelse af den simple regressionsmodel Definition: y = β0 + βx+ βx + + βkxk + u k forklarende variable: x,, x k Et konstantled k+ (ukendte) parametre: β0, β,..., βk (og σ ) Fejlleddet u Antagelsen Eu ( x, x,..., x ) = 0 k Fordele ved den multiple regressionsmodel: Man kan eksplicit kontrollere for flere faktorer Det betyder, at disse faktorer ikke er indeholdt i u Forhåbentlig lettere at lave ceteris paribus fortolkninger: β er effekten på y af at ændre x med én enhed, alt andet lige (dvs. givet u og de andre x er). Man kan modellere mere generelle funktionelle former: F.eks. modeller som y = β + β x+ β x + u og 0 y = β + β x + β x + β x x + u 0 3 Økonometri : F4 3 Økonometri : F4 4

Den multiple regressionsmodel på matrixform Regressionsmodel på matrixform For n observationer kan vi opskrive: y x x k u β0 y x xk u β y, X = =, u = β = y x x u β n n nk n k y og u er nx matricer (vektorer) X er en nx(k+) matrix Parameteren er en (k+)x matrix (vektor) β Den multiple regressionsmodel kan så skrives som: y = Xβ + u OLS estimatoren kan udregnes som i den simple regressionsmodel ved brug af moment metoden Moment betingelsen: E( X ' u ) = 0 OLS estimatoren findes fra den analoge betingelse i stikprøven: X ' uˆ = X '( y X ˆ β ) = 0 X ' y X ' X ˆ β = 0 ( X ' y) = ( X ' X) ˆ β Hvis X ' X er invertibel ( X har fuld rang): ˆ β = ( X ' X) X ' y Økonometri : F4 5 Økonometri : F4 6 3

Fortolkning af OLS estimaterne Sammenligning med den simple regressionsmodel Antager følgende model: y = β + β x + β x + + β x + u = Xβ + u 0... k k Den forudsagte værdi af y er givet ved: y = ˆ β + ˆ β x + ˆ β x + + ˆ β x = X ˆ β ˆ 0... k k Ændringerne i forudsagt værdi af y: = ˆ + ˆ + + ˆ yˆ β x β x... βk xk ŷ Ændringen i, når alle øvrige forklarende variabler holdes konstant: yˆ = ˆ βl xl Den multiple model giver mulighed for at lave ceteris paribus fortolkninger, selvom data ikke er indsamlet så de enkelte variabler faktisk holdes konstant. OLS estimatoren er besværlig at opskrive (med mindre man anvender matrixformen) Man kan vise (Frisch-Waugh-LovelI teoremet) at der findes et simpelt udtryk for OLS estimaterne: n Ex. k=: y = β0 + βx+ βx + u ry ˆi i ˆ i= Estimatet for kan skrives som β = n (*) rˆ i i= hvor ˆr er residualerne fra følgende OLS hjælpe - regression: x = δ0 + δx + r Hjemmeopgave: Vis at y i (*) kan erstattes med residualerne fra en hjælperegression af på x y Økonometri : F4 7 Økonometri : F4 8 4

Sammenligning med den simple regressionsmodel OLS residualer Den del af variationen i x, der er ukorreleret med x er udtrykt ved residualerne rˆ. rˆ udtrykker effekten af x efter at have "kontrolleret" for x. Estimatet af β kan fås ved en to-trins procedure: Regresser x på x og beregn residualerne rˆ Regresser y på residualerne rˆ For OLS residualer fra den multiple regressionsmodel (med et konstantled) gælder per konstruktion: X ' u ˆ = 0 n Gennemsnittet af residualerne er lig 0: uˆ i = 0 n = Den empiriske kovarians mellem residualerne og hver n forklarende variabel er lig 0: ux ˆi ij = 0 j=,.., k n = Punktet ( yx,, x k ) er altid på OLS regressionslinien i i Økonometri : F4 9 Økonometri : F4 0 5

NB er fra denne forelæsning Næste gang: Ceteris paribus fortolkning af koefficienterne i den multiple regressionsmodel i forhold til: Uobserverbare faktorer i u Observerede variabler i x, x,..., xk Udledning af OLS estimatoren på matrixform Regressionskoefficienter i den multiple lineære regressionsmodel kontrollerer for de øvrige forklarende variabler i modellen. Fredag (NB!): Mere om multipel regression (kap. 3 og appendix E): Udeladte variabler Statistiske egenskaber Gauss-Markov teoremet: OLS er bedst blandt lineære middelrette estimatorer. Øvelser: Ugeseddel : Mere om estimation af Engelkurver. Økonometri : F4 Økonometri : F4 6