y = cy ( c 0) Plan for resten af gennemgangen Kvanttatve metoder Instrumentvarabel estmaton 4. maj 007 F5: Instrumentvarabel (IV) estmaton: Introdukton tl endogentet og nstrumentvarabler En regressor, et nstrument: Kap.5. + afsnt -4 noten. F6: Kap. 5.-3, 5.5 og afsnt 4, 6-7 noten. Flere endogene regressorer (eksakt dentfceret): 5.-3 SLS (two-stage least squares) et eksakt dentfceret tlfælde. Test af exogentet F7: Kap. 5.4-6, afsnt 5-7 noten Overdentfceret tlfælde SLS (two-stage least squares) estmaton og nferens. Test af overdentfcerende restrktoner Målefejl F8: Afslutnngsforelæsnng Eksempel: Fødselsvægt og rygnng Kap. 9 om emprske projekter Informaton vedr. eksamen Ugeseddel 0 KM: F5 KM: F5
Exogentetsantagelsen Exogentetsantagelsen Smpel lneær regressonsmodel: y = β + β x + u 0 Hdtl: MLR.4: Eux ( )=0 cov( u, x) = 0 (Exogentet) Nu: Endogene forklarende varabler: Stokastske varabler, der er korrelerede med fejlleddet. cov( u, x ) 0 (Endogentet): OLS er kke konsstent. Har allerede set på årsager tl at en varabel kan være endogen: - udeladte varabler og uobserveret heterogentet (kaptel 3 og 5, 3 og 4) - forkert funktonel form (kaptel 9) - nogle former for målefejl (kaptel 9) Ofte fortolkes regressonsmodellen ud fra en kausal sammenhæng mellem y og x. Kan v estmere modellen med OLS, opnå estmatet ˆ β, og så slutte at en gven ændrng x vl forårsage en ændrng y, alt andet lge? Og at ˆ β er et "godt bud" på den ændrng? Ikke altd. KM: F5 3 KM: F5 4
Exogentet: Korrelaton er kke kausaltet ˆ β 0 udtrykker en korrelaton, men ndebærer kke nødvendgvs kausaltet: Tlfældgheder: Derfor bruger v statstk! x forårsager y, y forårsager kke x: ˆ β 0 er udtryk for kausal relaton. Ex. y voksen kvndes højde, x hendes mors højde. y forårsager x, x forårsager kke y: Ex. x voksen kvndes højde, y er hendes mors højde. OLS fnder postv korrelaton. Omvendt kausaltet! y forårsager x, x forårsager y: Ex. prs og mængde på et fuldkommen konkurrence marked. Kan kke lave alt andet lge betragtnng. y og x forårsaget af en trede varabel, w: Ex. længden på en persons højre og venstre ben. Ex. Lønlgnngen Opstller regressonsmodel tl forklarng af løn for n tlfældgt udvalgte lønmodtagere. Inkluderer relevante og potentelt observerbare faktorer vektor af forklarende varabler x : køn, alder, uddannelse, branche, erfarng, Uobserverbar heterogentet: evne, ntellgens, arbejdsver Ønsker at estmere afkastet af uddannelse. Men: Uddannelseslængde er korreleret med evne og evne har rmelgvs en drekte effekt på lønnen. Tredje faktor forårsager både løn og uddannelse. Kan v bruge OLS estmatet af koeffcenten tl uddannelse lønlgnngen tl noget? I hvlken retnng forventer v bas? w KM: F5 5 KM: F5 6 3
Instrumentvarabler () Instrumentvarabler () Smpel regressonsmodel: y = β0 + βx + u Ex. Lønlgnngen y = log w, x = educ Uobserverbar heterogentet form af evner : Postv effekt på løn og (postvt) korreleret med uddannelse. OLS er nkonsstent: cov( x, u ) 0 IV løsnng: Fnd nstrumentvarabel som opfylder to betngelser:. cov( z, u ) = 0. cov( z, x ) 0 Udfordrngen er at fnde gode nstrumenter: Økonomsk teor spller den afgørende rolle her. z KM: F5 7 De to betngelser for en gyldg nstrumentvarabel har forskellg status: Betngelse : cov( z, u ) = 0 Instrumentvarablen skal være ukorreleret med de uobserverbare faktorer u Løn-eksemplet: Instrumentet skal være ukorreleret med evner. Afhænger sdste ende altd af en teoretsk baseret antagelse. Betngelse : cov( z, x) 0 Instrumentvarablen skal være korreleret med den endogene forklarende varabel. Testbar antagelse på grundlag af data på z og x : Sgnfkant regressonskoeffcent regresson af x på z. KM: F5 8 4
Lønlgnngen: Overvej nogle mulge nstrumenter Sdste cffer personnummer: US: Tlfældgt: Ukorreleret med evner, men heller kke korreleret med uddannelse. DK: Hvad kan v sge om cpr. nummeret? IQ-score: Proxy-varabel for evner kap. 9. Korreleret med evner : Ikke godt for nstrumentvarabel! Famlebaggrundsvarabler: Moderens uddannelse: Betngelse OK; betngelse :?? Korreleret med børns evner, måske va genetk og evne for spædbørnspleje. Antal søskende: Negatvt korreleret med længde af uddannelse (betngelse er OK (DK?)); betngelse er OK pr. antagelse. IV estmaton en smpel regressonsmodel: En endogen regressor, et nstrument Den smple regressonsmodel y = β0 + βx + u Antag: x er endogen og z er et brugbart nstrument for x, dvs: cov( z, u ) = 0, cov( z, x ) 0 IV estmatoren for β kan udledes som en moment estmator (tavlegennemgang) KM: F5 9 KM: F5 0 5
IV estmaton: Identfkaton af parametrene IV estmatoren Smpel regressonsmodel: y = β + β x + u 0 Gyldgt nstrument: cov( z, u ) = 0, cov( z, x ) 0 Gvet cov( z, u ) = 0 dentfceres parameteren som cov( z, y) β = cov( z, x ) IV estmatorerne fndes ved at ndsætte de analoge størrelser fra stkprøven: n = ( z z)( y y) ˆ = β ˆ ˆ =, β n 0 = y βx ( z z)( x x) KM: F5 β IV estmatoren er konsstent: p lm( ˆ β) = β (tavlegennemgang) IV estmatoren er asymptotsk normalfordelt. Hvs x faktsk er exogen kan den bruges som st eget nstrument : OLS som specaltlfælde af IV. IV estmatoren: Har gode asymptotske egenskaber, dvs. v ved at den vrker store datasæt. Men: IV generelt kke mddelret IV vl ofte have en relatvt stor varans. Hvs cov( z, x) 0, men den kke er ret stor, så er z et svagt nstrument : t-test hjælperegresson af x på z KM: F5 6
IV estmatoren: Inferens Andre bud på nstrumenter tl lønlgnngen Antag: Homoskedastctet: Eu ( z) = σ Den asymptotske varans på ˆβ er gvet ved σ, ρ xz, < nσ ρ x, z Varansen går mod nul som /n lgesom for OLS. Estmeres konsstent ved t-værd er asymptotsk normalfordelt. Eksempler: Ex. 5. og 5.. x n ˆ, ˆ σ = uˆ, ˆ ˆ ˆ u = y β0 βx x x, z n = σ SST R KM: F5 3 Angrst og Krueger: Dummy varabel som nstrument: Fnder sgnfkant korrelaton mellem uddannelseslængde og det kvartal, man er født (for amerkanske data). Argumenterer for at fødselskvartal er ukorreleret med evne. Angrst: Naturlgt eksperment : Ser på sammenhæng mellem løn og mltærtjeneste Vetnam. Værneplgten var et lotter: Høj korrelaton mellem at trække et lavt sessonsnummer og faktsk at aftjene værneplgt. Tlfældgt udvalg, dvs. sessonsnummer ukorreleret med evne og andre varabler. Sessonsnummer som nstrument. KM: F5 4 7
NB er Næste gang: Korrelaton og kausaltet er kke det samme. Data kan vse om der er korrelaton mellem to varabler. Kausaltet må bero på et teoretsk argument. Regressonsmodellen tolkes ofte som en kausal sammenhæng. Endogene regressorer er forklarende varabler som er korrelerede med fejlleddet: OLS er nkonsstent IV estmatoren bygger på at der kan fndes en varabel (eller flere) som Man kan argumentere for er ukorrelerede med fejlleddet, Og kan vses at være korreleret med den endogene regressor. Onsdag Flere endogene regressorer SLS (two-stage least squares) estmaton og nferens. Test af exogentet KM: F5 5 KM: F5 6 8