Kvanttatve metoder 2 Instrumentvarabel estmaton 14. maj 2007 KM2: F25 1
y = cy ( c 0) Plan for resten af gennemgangen F25: Instrumentvarabel (IV) estmaton: Introdukton tl endogentet og nstrumentvarabler En regressor, et nstrument: Kap.15.1 + afsnt 1-4 noten. F26: Kap. 15.2-3, 15.5 og afsnt 4, 6-7 noten. Flere endogene regressorer (eksakt dentfceret): 15.2-3 2SLS (two-stage least squares) et eksakt dentfceret tlfælde. Test af exogentet F27: Kap. 15.4-6, afsnt 5-7 noten Overdentfceret tlfælde 2SLS (two-stage least squares) estmaton og nferens. Test af overdentfcerende restrktoner Målefejl F28: Afslutnngsforelæsnng Eksempel: Fødselsvægt og rygnng Kap. 19 om emprske projekter Informaton vedr. eksamen Ugeseddel 10 KM2: F25 2
Exogentetsantagelsen Smpel lneær regressonsmodel: y = β + β x + u 0 1 Hdtl: MLR.4: Eux ( )=0 cov( u, x) = 0 (Exogentet) Nu: Endogene forklarende varabler: Stokastske varabler, der er korrelerede med fejlleddet. cov( u, x ) 0 (Endogentet): OLS er kke konsstent. Har allerede set på årsager tl at en varabel kan være endogen: - udeladte varabler og uobserveret heterogentet (kaptel 3 og 5, - forkert funktonel form (kaptel 9) - nogle former for målefejl (kaptel 9) 13 og 14) KM2: F25 3
Exogentetsantagelsen Ofte fortolkes regressonsmodellen ud fra en kausal sammenhæng mellem y og x. Kan v estmere modellen med OLS, opnå estmatet ˆ β, og så slutte at en gven ændrng x vl forårsage en ændrng y, på den ændrng? alt andet lge? Og at ˆ β er et "godt bud" 1 1 Ikke altd. KM2: F25 4
1 Exogentet: Korrelaton er kke kausaltet ˆ β 0 udtrykker en korrelaton, men ndebærer kke nødvendgvs kausaltet: Tlfældgheder: Derfor bruger v statstk! x forårsager y, y forårsager kke x: ˆ β1 0 er udtryk for kausal relaton. Ex. y voksen kvndes højde, x hendes mors højde. y forårsager x, x forårsager kke y: Ex. x voksen kvndes højde, y er hendes mors højde. OLS fnder postv korrelaton. Omvendt kausaltet! y forårsager x, x forårsager y: Ex. prs og mængde på et fuldkommen konkurrence marked. Kan kke lave alt andet lge betragtnng. y og x forårsaget af en trede varabel, w: Ex. længden på en persons højre og venstre ben. KM2: F25 5
Ex. Lønlgnngen Opstller regressonsmodel tl forklarng af løn for n tlfældgt udvalgte lønmodtagere. Inkluderer relevante og potentelt observerbare faktorer vektor af forklarende varabler x : køn, alder, uddannelse, branche, erfarng, Uobserverbar heterogentet: evne, ntellgens, arbejdsver Ønsker at estmere afkastet af uddannelse. Men: Uddannelseslængde er korreleret med evne og evne har rmelgvs en drekte effekt på lønnen. Tredje faktor forårsager både løn og uddannelse. Kan v bruge OLS estmatet af koeffcenten tl uddannelse lønlgnngen tl noget? I hvlken retnng forventer v bas? w KM2: F25 6
Instrumentvarabler (1) Smpel regressonsmodel: Ex. Lønlgnngen y = β + β x + u y = log w, x = educ 0 1 Uobserverbar heterogentet form af evner : Postv effekt på løn og (postvt) korreleret med uddannelse. OLS er nkonsstent: cov( x, u ) 0 IV løsnng: Fnd nstrumentvarabel som opfylder to betngelser: 1. cov( z, u ) = 0 2. cov( z, x ) 0 Udfordrngen er at fnde gode nstrumenter: Økonomsk teor spller den afgørende rolle her. z KM2: F25 7
Instrumentvarabler (2) De to betngelser for en gyldg nstrumentvarabel har forskellg status: Betngelse 1: cov( z, u ) = 0 Instrumentvarablen skal være ukorreleret med de uobserverbare faktorer u Løn-eksemplet: Instrumentet skal være ukorreleret med evner. Afhænger sdste ende altd af en teoretsk baseret antagelse. cov( z, x ) 0 Betngelse 2: Instrumentvarablen skal være korreleret med den endogene forklarende varabel. Testbar antagelse på grundlag af data på z og x : Sgnfkant regressonskoeffcent regresson af x på z. KM2: F25 8
Lønlgnngen: Overvej nogle mulge nstrumenter Sdste cffer personnummer: US: Tlfældgt: Ukorreleret med evner, men heller kke korreleret med uddannelse. DK: Hvad kan v sge om cpr. nummeret? IQ-score: Proxy-varabel for evner kap. 9. Korreleret med evner : Ikke godt for nstrumentvarabel! Famlebaggrundsvarabler: Moderens uddannelse: Betngelse 2 OK; betngelse 1:?? Korreleret med børns evner, måske va genetk og evne for spædbørnspleje. Antal søskende: Negatvt korreleret med længde af uddannelse (betngelse 2 er OK (DK?)); betngelse 1 er OK pr. antagelse. KM2: F25 9
IV estmaton en smpel regressonsmodel: En endogen regressor, et nstrument Den smple regressonsmodel y = β + β x + u 0 1 Antag: x er endogen og z er et brugbart nstrument for x, dvs: cov( z, u ) = 0, cov( z, x ) 0 IV estmatoren for β 1 kan udledes som en moment estmator (tavlegennemgang) KM2: F25 10
IV estmaton: Identfkaton af parametrene Smpel regressonsmodel: y = β0 + β1x + u Gyldgt nstrument: cov( z, u ) = 0, cov( z, x) 0 Gvet cov( z, u ) = 0 dentfceres parameteren β 1 som cov( z, y) β 1 = cov( z, x) IV estmatorerne fndes ved at ndsætte de analoge størrelser fra stkprøven: n ( z z)( y y) ˆ = 1 β ˆ ˆ 1 =, β n 0 = y β1x ( z z)( x x) = 1 KM2: F25 11
IV estmatoren IV estmatoren er konsstent: p lm( ˆ β1) = β1 (tavlegennemgang) IV estmatoren er asymptotsk normalfordelt. Hvs x faktsk er exogen kan den bruges som st eget nstrument : OLS som specaltlfælde af IV. IV estmatoren: Har gode asymptotske egenskaber, dvs. v ved at den vrker store datasæt. Men: IV generelt kke mddelret IV vl ofte have en relatvt stor varans. Hvs cov( z, x) 0, men den kke er ret stor, så er z et svagt nstrument : t-test hjælperegresson af x på z KM2: F25 12
IV estmatoren: Inferens 2 2 Antag: Homoskedastctet: Eu ( z) = σ Den asymptotske varans på 1 ˆβ er gvet ved 2 σ nσ ρ 2 2 x x, z, ρ < 1 Varansen går mod nul som 1/n lgesom for OLS. Estmeres konsstent ved σ SST R t-værd er asymptotsk normalfordelt. Eksempler: Ex. 15.1 og 15.2. 2 xz, 2 n ˆ 2 1 2, ˆ σ = uˆ, ˆ ˆ ˆ 2 u = y β0 β1x x x, z n 2 = 1 KM2: F25 13
Andre bud på nstrumenter tl lønlgnngen Angrst og Krueger: Dummy varabel som nstrument: Fnder sgnfkant korrelaton mellem uddannelseslængde og det kvartal, man er født (for amerkanske data). Argumenterer for at fødselskvartal er ukorreleret med evne. Angrst: Naturlgt eksperment : Ser på sammenhæng mellem løn og mltærtjeneste Vetnam. Værneplgten var et lotter: Høj korrelaton mellem at trække et lavt sessonsnummer og faktsk at aftjene værneplgt. Tlfældgt udvalg, dvs. sessonsnummer ukorreleret med evne og andre varabler. Sessonsnummer som nstrument. KM2: F25 14
NB er Korrelaton og kausaltet er kke det samme. Data kan vse om der er korrelaton mellem to varabler. Kausaltet må bero på et teoretsk argument. Regressonsmodellen tolkes ofte som en kausal sammenhæng. Endogene regressorer er forklarende varabler som er korrelerede med fejlleddet: OLS er nkonsstent IV estmatoren bygger på at der kan fndes en varabel (eller flere) som Man kan argumentere for er ukorrelerede med fejlleddet, Og kan vses at være korreleret med den endogene regressor. KM2: F25 15
Næste gang: Onsdag Flere endogene regressorer 2SLS (two-stage least squares) estmaton og nferens. Test af exogentet KM2: F25 16