Dagens program Økonometri Den multiple regressionsmodel 8. september 006 Opsamling af statistiske resultater om den simple lineære regressionsmodel (W kap..5). Den multiple lineære regressionsmodel (W kap. 3.-3.3+appendix E.-E.) Definition og motivation Fortolkning af parametrene i den multiple regressionsmodel Sammenligning af den simple og multiple regressionsmodel Middelrette OLS estimatorer Økonometri : F4 Økonometri : F4
Definition og motivation Definition og motivation Den multiple regressionsmodel er en udvidelse af den simple regressionsmodel Definition: y = β0 + βx+ βx + + βkxk + u k forklarende variable: x,, x k Et konstantled k+ (ukendte) parametre: β0, β,..., βk (og σ ) Fejlleddet u Antagelsen Eu ( x, x,..., x ) = 0 k Fordele ved den multiple regressionsmodel: Man kan eksplicit kontrollere for flere faktorer Det betyder, at disse faktorer ikke er indeholdt i u Forhåbentlig lettere at lave ceteris paribus fortolkninger: β er effekten på y af at ændre x med én enhed, alt andet lige (dvs. givet u og de andre x er). Man kan modellere mere generelle funktionelle former: F.eks. modeller som y = β + β x+ β x + u og 0 y = β + β x + β x + β x x + u 0 3 Økonometri : F4 3 Økonometri : F4 4
Den multiple regressionsmodel på matrixform Regressionsmodel på matrixform For n observationer kan vi opskrive: y x x k u β0 y x xk u β y, X = =, u = β = y x x u β n n nk n k y og u er nx matricer (vektorer) X er en nx(k+) matrix Parameteren er en (k+)x matrix (vektor) β Den multiple regressionsmodel kan så skrives som: y = Xβ + u OLS estimatoren kan udregnes som i den simple regressionsmodel ved brug af moment metoden Moment betingelsen: E( X ' u ) = 0 OLS estimatoren findes fra den analoge betingelse i stikprøven: X ' uˆ = X '( y X ˆ β ) = 0 X ' y X ' X ˆ β = 0 ( X ' y) = ( X ' X) ˆ β Hvis X ' X er invertibel ( X har fuld rang): ˆ β = ( X ' X) X ' y Økonometri : F4 5 Økonometri : F4 6 3
Fortolkning af OLS estimaterne Sammenligning med den simple regressionsmodel Antager følgende model: y = β + β x + β x + + β x + u = Xβ + u 0... k k Den forudsagte værdi af y er givet ved: y = ˆ β + ˆ β x + ˆ β x + + ˆ β x = X ˆ β ˆ 0... k k Ændringerne i forudsagt værdi af y: = ˆ + ˆ + + ˆ yˆ β x β x... βk xk ŷ Ændringen i, når alle øvrige forklarende variabler holdes konstant: yˆ = ˆ βl xl Den multiple model giver mulighed for at lave ceteris paribus fortolkninger, selvom data ikke er indsamlet så de enkelte variabler faktisk holdes konstant. OLS estimatoren er besværlig at opskrive (med mindre man anvender matrixformen) Man kan vise (Frisch-Waugh-LovelI teoremet) at der findes et simpelt udtryk for OLS estimaterne: n Ex. k=: y = β0 + βx+ βx + u ry ˆi i ˆ i= Estimatet for kan skrives som β = n (*) rˆ i i= hvor ˆr er residualerne fra følgende OLS hjælpe - regression: x = δ0 + δx + r Hjemmeopgave: Vis at y i (*) kan erstattes med residualerne fra en hjælperegression af på x y Økonometri : F4 7 Økonometri : F4 8 4
Sammenligning med den simple regressionsmodel OLS residualer Den del af variationen i x, der er ukorreleret med x er udtrykt ved residualerne rˆ. rˆ udtrykker effekten af x efter at have "kontrolleret" for x. Estimatet af β kan fås ved en to-trins procedure: Regresser x på x og beregn residualerne rˆ Regresser y på residualerne rˆ For OLS residualer fra den multiple regressionsmodel (med et konstantled) gælder per konstruktion: X ' u ˆ = 0 n Gennemsnittet af residualerne er lig 0: uˆ i = 0 n = Den empiriske kovarians mellem residualerne og hver n forklarende variabel er lig 0: ux ˆi ij = 0 j=,.., k n = Punktet ( yx,, x k ) er altid på OLS regressionslinien i i Økonometri : F4 9 Økonometri : F4 0 5
NB er fra denne forelæsning Næste gang: Ceteris paribus fortolkning af koefficienterne i den multiple regressionsmodel i forhold til: Uobserverbare faktorer i u Observerede variabler i x, x,..., xk Udledning af OLS estimatoren på matrixform Regressionskoefficienter i den multiple lineære regressionsmodel kontrollerer for de øvrige forklarende variabler i modellen. Fredag (NB!): Mere om multipel regression (kap. 3 og appendix E): Udeladte variabler Statistiske egenskaber Gauss-Markov teoremet: OLS er bedst blandt lineære middelrette estimatorer. Øvelser: Ugeseddel : Mere om estimation af Engelkurver. Økonometri : F4 Økonometri : F4 6