Dages program Økoometri De multiple regressiosmodel 5. februar 006 Emet for dee forelæsig er de multiple regressiosmodel (Wooldridge kap 3.-3.3+appedix E.-E.) Defiitio og motivatio Fortolkig af parametree i de multiple regressiosmodel Sammeligig af de simple og multiple regressiosmodel Regressio ude kostatled Middelrette OLS estimatorer For mage/for få variable regressiosmodel regressiosmodel Defiitio og motivatio Defiitio og motivatio De multiple regressiosmodel er e udvidelse af de simple regressiosmodel Defiitio: y = β0 + βx+ βx + + βkxk k forklarede variable: x,, x k Et kostatled k+ (ukedte) parametre: β0, β,..., βk u fejlled Atagelse E(u x,, x k )=0 regressiosmodel 3 Fordele ved de multiple regressiosmodel er: Ma ka eksplicit kotrollere for mage flere faktorer Det betyder, at disse faktorer ikke er ideholdt i u Det er forhåbetlig lettere at lave ceteris paribus fortolkiger Ma ka modellere mere geerelle fuktioelle former F.eks. modeller som y = β + β x+ β x 0 regressiosmodel 4
De multiple regressiosmodel på matrixform For observatioer ka vi opskrive y x x u β k 0 y x xk u β y =, X =, u = β = y x x u β k k y og u er e x matrix (vektor) X er e x(k+) matrix Parametere $ er e (k+)x matrix (vektor) Regressiosmodel på matrixform De multiple regressiosmodel ka skrives som: y = Xβ OLS estimatore ka udreges som i de simple regressiosmodel ved brug af momet metode Momet betigelse: E( X ' u ) = 0 regressiosmodel 5 regressiosmodel 6 Regressiosmodel på matrix form Fortolkig af OLS regressio OLS estimatore X ' uˆ = X '( y X ˆ β ) = 0 X ' y X ' X ˆ β = 0 ( X ' y) = ( X ' X) ˆ β Hvis (X X) er ivertibel (X har fuld rag) ka OLS estimatore udreges til ˆ β = ( X ' X) X ' y OLS estimatore ka også udledes ved at miimere uˆ i regressiosmodel 7 Fortolkig af OLS parametree Atag følgede model: y = β + β x + β x + + β x 0... k k De forudsagte værdi af y er givet ved yˆ = ˆ β0 + ˆ βx+ ˆ β ˆ x +... + βkxk Ædrigere i forudsagte værdi af y, = ˆ + ˆ + + ˆ yˆ β x β x... βk xk regressiosmodel 8
Fortolkig.. (fortsat) Eksempel: Timelø Fortolkige af estimatet for $ l : Ædrige i y år alle øvrige forklarede variable holdes kostate: y = ˆ β x ˆ l l De multiple regressiosmodel giver mulighed for at lave ceteris paribus fortolkiger, selvom data ikke er idsamlet så ekelte variable ka holdes kostate Vi beytter u data fra 994 i stedet for 980 Til dee aalyse af timelø itroduceres e y variabel: Arbejdsmarkedserfarig (baseret på ATP idbetaliger) målt i år Modelle som estimeres er givet ved: log( timelo) = β + β ( uddaelse) + β ( erfarig) 0 regressiosmodel 9 regressiosmodel 0 Fortolkig.. (fortsat) Fortolkig.. (fortsat) OLS estimatore er besværlig at opskrive (med midre ma aveder matrixforme) I tilfældet med to forklarede variable ka ma dog få et udtryk for OLS estimatere: Model y = β0 + βx+ βx ry i i ˆ Estimatet for $ ka skrives som β = ri Hvor r er residualere fra følgede OLS regressio x = δ + δ x + v 0 Residualere r ka altså fortolkes som de del af x som er ukorreleret med x r er effekte af x efter at have kotrolleret for x Estimatet af $ ka opås ved følgede procedure: Regresser x på x og udreg residualere r Regresser y på residualere r regressiosmodel regressiosmodel 3
OLS Residualer OLS residualer (fortsat) For OLS residualer fra de multiple regressiosmodel (med et kostatled) gælder følgede: Geemsittet af residualere er lig 0: ui ˆ = 0 = i Goodess of fit: Læs selv Dette er helt aalogt til de simple lieære regressiosmodel De empiriske kovarias mellem residualer og de forklarede variable er lig 0: ux ˆi ij 0 j,.., k = = = i Puktet ( yx,, x k ) er altid på på OLS regressiosliie regressiosmodel 3 regressiosmodel 4 Regressiosmodel ude kostatled Middelret OLS estimator Regressiosmodel ude kostatled estimeret med OLS y = βx+ βx +... + βkxk I dee model gælder: OLS residualere har ikke geemsit lig 0 R er re-defieret til og ka blive egativet SSR R = SSR= ( yi βxi βxi... βkxik) SST Hvis populatios modelle ideholder et kostatled, vil OLS estimatere af $, $ k være biased (ikke middelrette) Atagelser MLR (lieær i parametree): De afhægige variabel y ka beskrives ved følgede model: y = β + β x + β x + + β x 0.. k k MLR (tilfældig stikprøve): Vi har e tilfældig stikprøve (y i,x i,x i,.., x ik ),.., fra populatioe (se defiitio i appedix c.) regressiosmodel 5 regressiosmodel 6 4
Middelret..(fortsat) Middelret.. (fortsat) MLR 3 (ige perfekt multikolliaritet) I stikprøve (og i populatioe) ka ige af de forklarede variable skrives som e lieær fuktio af de øvrige De forklarede variable må godt være korreleret f.eks.: ka både x og x være forklarede variable Eksempler på perfekt multikolliaritet: log( ) β0 βlog( ) βlog( ) y = + x + x Alder og fødselsår (i tværsitsdata) Atallet af observatioer er lille (<k+) regressiosmodel 7 MLR 4 (betiget middelværdi af fejlled): Eu ( x, x,..., x ) = 0 k Grude til at MLR 4 ikke er opfyldt: Forkert fuktioel form (mere om dette i kap. 9) Udeladte variable, som er korreleret med e af de forklarede variable Målefejl i de forklarede variable (mere om dette i kap. 9) Hvis MLR 4 er opfyldt kaldes de forklarede variable for eksogee forklarede variable Hvis x j er korreleret med u kaldes x j for edoge forklarede variable regressiosmodel 8 Middelret.. (fortsat) For mage variable i modelle Teorem 3. Uder atagelse MLR -MLR 4 gælder: E( ˆ β ) = β j = 0,,.., k j Bevis laves som i appedix E. (tavlegeemgag) j Irrelevate variable i regressiosmodelle: Eksempel: De sade model (som opfylder MLR -MLR4) y = β0 + βx+ βx Regressiosmodelle som estimeres med OLS: yˆ = ˆ β + ˆ β x + ˆ β x + ˆ β x,..., i 0 i i 3 i3 Har det betydig for estimatere af β 0, β og β? Estimatere er stadig middelrette: E( ˆ β0) = β0, E( ˆ β) = β ˆ ˆ, E( β) = β, E( β3) = 0 Me iklusio af irrelevate variable påvirker variase af estimatere regressiosmodel 9 regressiosmodel 0 5
For få variable For få variable Udeladte relevate variable OLS estimatere er biased (ikke middelrette) Eksempel: De sade model (som opfylder MLR - 4) y = β + β x + β x 0 Regressiosmodelle som estimeres ved OLS yˆ ˆ ˆ i = β0 + βxi,..., Middelværdie af OLS estimatet ( xi x)( xi x) ˆ i E( β x, x) = β+ β = ( x x ) i regressiosmodel Bias β >0 β <0 Corr(x,x ) positiv Positiv bias Negativ bias Corr(x,x ) egativ Negativ Bias Positiv bias regressiosmodel 6