Dages program Kvatitative metoder De multiple regressiosmodel 6. februar 007 Emet for dee forelæsig er de multiple regressiosmodel (Wooldridge kap 3.- 3.+appedix E.) Defiitio og motivatio Fortolkig af parametree i de multiple regressiosmodel Sammeligig af de simple og multiple regressiosmodel Regressio ude kostatled Goodess of fit regressiosmodel regressiosmodel
Defiitio og motivatio Defiitio og motivatio De multiple regressiosmodel er e udvidelse af de simple regressiosmodel Defiitio: y = β0 + βx+ βx + K+ βkxk + u k forklarede variable: x,, x k Et kostatled k+ (ukedte) parametre: β0, β,..., βk u fejlled Atagelse E(u x,, x k )=0 regressiosmodel 3 Fordele ved de multiple regressiosmodel: Ma ka eksplicit kotrollere for mage flere faktorer Det betyder, at disse faktorer ikke er ideholdt i u Det er forhåbetlig lettere at lave ceteris paribus fortolkiger: β er effekte på y af at ædre x med e ehed alt adet lige (dvs. givet u og de adre x er) Ma ka modellere mere geerelle fuktioelle former F.eks. modeller som y = β + β x+ β x + u 0 regressiosmodel 4
De multiple regressiosmodel på matrixform For observatioer ka vi opskrive y x L x u β k 0 y xl xk u β y =, X =, u = β = M M M M M M y x L x u β k k y og u er e x matrix (vektor) X er e x(k+) matrix Parametere β er e (k+)x matrix (vektor) Regressiosmodel på matrixform De multiple regressiosmodel ka skrives som: y = Xβ + u OLS estimatore ka udreges som i de simple regressiosmodel ved brug af momet metode Momet betigelse: E( X ' u ) = 0 regressiosmodel 5 regressiosmodel 6 3
Regressiosmodel på matrix form Fortolkig af OLS regressio OLS estimatore fides ud fra aaloge betigelser i stikprøve X ' uˆ = X '( y X ˆ β ) = 0 X ' y X ' X ˆ β = 0 ( X ' y) = ( X ' X) ˆ β Hvis (X X) er ivertibel (X har fuld rag) ka OLS estimatore udreges til ˆ β = ( X ' X) X ' y OLS estimatore ka også udledes ved at miimere i= uˆ i Fortolkig af OLS parametree Atag følgede model: y = β + β x + β x + + β x + u 0... k k De forudsagte værdi af y er givet ved yˆ = ˆ β0 + ˆ βx+ ˆ β ˆ x +... + βkxk Ædrigere i forudsagte værdi af y, Δ = ˆΔ + ˆ Δ + + ˆ Δ yˆ β x β x... βk xk regressiosmodel 7 regressiosmodel 8 4
Fortolkig.. (fortsat) Eksempel: Timelø Fortolkige af estimatet for β l : Ædrige i y år alle øvrige forklarede variable holdes kostate: Δ y = ˆ β Δx ˆ l l De multiple regressiosmodel giver mulighed for at lave ceteris paribus fortolkiger, selvom data ikke er idsamlet så ekelte variable ka holdes kostate Vi beytter u data fra 994 i stedet for 980 Til dee aalyse af timelø itroduceres e y variabel: Arbejdsmarkedserfarig (baseret på ATP idbetaliger) målt i år Modelle som estimeres er givet ved: log( timelo) = β + β ( uddaelse) + β ( erfarig) + u 0 regressiosmodel 9 regressiosmodel 0 5
Fortolkig.. (fortsat) Fortolkig.. (fortsat) OLS estimatore er besværlig at opskrive (med midre ma aveder matrixforme) Ma ka vise Frisch-Waugh-Lovell teoremet I tilfældet med to forklarede variable ka ma dog få et udtryk for OLS estimatere: Model y = β0 + βx+ βx + u ry i i ˆ i= β Estimatet for β ka skrives som = ri Hvor r er residualere fra følgede OLS i= regressio x = δ + δ x + v 0 regressiosmodel Residualere r ka altså fortolkes som de del af x som er ukorreleret med x r er effekte af x efter at have kotrolleret for x Estimatet af β ka opås ved følgede procedure: Regresser x på x og udreg residualere r Regresser y på residualere r regressiosmodel 6
OLS Residualer Goodess of fit For OLS residualer fra de multiple regressiosmodel (med et kostatled) gælder følgede: Geemsittet af residualere er lig 0: ui De empiriske kovarias mellem residualer og de forklarede variable er lig 0: ux ˆi ij 0 j,.., k Puktet ( y, x K, x k ) regressiosliie i er altid på på OLS ˆ = 0 = i = = = regressiosmodel 3 Goodess of fit: Dette er helt aalogt til de simple lieære regressiosmodel Total variatio i y ka dekompoeres i to dele SST = SSE + SSR Total Sum of Squares: SST = ( y y) i= Explaied Sum of Squares: SSE = ( yˆ y) Residual Sum of Squares: SSR = ( uˆ ) i i= i i= regressiosmodel 4 i 7
Goodess of fit Næste gag Determiatioskoeficiete R : SSE R = SST Egeskaber ved R : R ligger mellem 0 og R falder aldrig hvis ma tilføjer e ekstra variabel. Hvorfor? R ka ikke bruges til at sammelige modeller med forskellige afhægige variable Overvej hvad ma ka bruge R til? Osdag d. 8/: kapitel 3.3-3.4+ E. OLS estimatores statistiske egeskaber Udeladte variable Variase af OLS estimatore regressiosmodel 5 regressiosmodel 6 8