Kvantitative metoder 2 Specifikation og dataproblemer 30. april 2007 KM2: F21 1
Program for de to næste forelæsninger Emnet er specifikation og dataproblemer (Wooldridge kap. 9) Fejlleddet kan være korreleret med de forklarende variabler: Endogene regressorer og MLR.4 holder ikke; OLS er hverken middelret eller konsistent. Fokus er her på de forskellige problemtyper og på test. Mulige løsninger i kap. 13-15. Misspecifikation af den funktionelle form Brug af proxy-variabler Betydning af målefejl Dataudvælgelse Feedback på Obligatorisk opgave 2 + eksempler på multiple choice spørgsmål KM2: F21 2
Funktionel form misspecifikation Hvad nu, hvis man benytter en forkert funktionel form? Generelt vil OLS estimaterne ikke være middelrette og ikke konsistente Forkert funktionel form kan opfattes som udeladte variable Eksempel: Antag, at i den sande model er y beskrevet ved et 2. gradspolynomium i x: 2 y = β0 + β1x+ β2x + u Antag, vi benytter en lineær funktion i x til estimationen (forkert funktionel form) y = β + β x+ w 0 1 Det kvadratiske led er en udeladt variabel, som generelt vil give biased estimater KM2: F21 3
Funktionel form misspecifikation Lønrelation: Antag at den sande model er 2 log( timeløn) = β + βudd + βkvinde+ βerfaring + βerfaring + u Modellen, som estimeres, er log( timeløn) = β + β udd + β kvinde + β erfaring + v OLS estimaterne er ikke middelrette og konsistente Fortolkningen af afkastet af erfaring er forkert I den sande model: I den forkerte model : β3 0 1 2 3 4 0 1 2 3 ˆ β + 2 ˆ β erfaring 3 4 KM2: F21 4
Funktionel form misspecifikation Økonomisk teori giver sjældent præcise anvisninger på den funktionelle form Forkert funktionel form: Den afhængige variabel har forkert funktionel form: Log(y) i stedet for y Forklarende variabel har forkert funktionel form: Log(x) i stedet for x eller exp(x) i stedet for x 2 x mangler Mangler interaktionsled mellem og x j xk Men bemærk: Vi observerer de relevante variabler KM2: F21 5
Funktionel form misspecifikation Problem med funktionel misspecifikation betragtes derfor som mindre fatalt end ægte udeladte variabler (som man typisk ikke har information om) I tilfælde med forkert funktionel form har man i princippet mulighed for at opstille den rigtige model Fremgangsmåde: Estimer modellen med OLS Udregn residualerne Plot residualerne mod de forklarende variabler: Grafisk test Beregn formelle test KM2: F21 6
Formelle test for misspecifikation Udgangspunkt i at hvis MLR.1- MLR.4 er opfyldt og man tilføjer fx kvadratiske led af regressorerne, bør disse være insignifikante. Generelt kan man approksimere en ukendt funktionel form med et polynomium Antag at modellen er givet ved y = β + β x + β x + + β x + u 0 1 1 2 2 k k og opfylder MLR.1-4. Simpelt test: Tilføj kvadratiske led af de forklarende variabler og interaktionsled. Udfør et sædvanligt F-test af deres signifikans: Ej signifikante hvis specifikationen er OK. KM2: F21 7
RESET Specialiseret test af funktionel forms misspecifikation: REgresssion Specification Error Test (RESET) Antag: Modellen opfylder MLR.1- MLR.4 y = β0 + β1x1+ β2x2 + + βkxk + u I RESET tilføjes et polynomium i de predikterede værdier i y 2 3 y = β0 + β1x1+ β2x2 + + β ˆ ˆ kxk + δ1y + δ2y + v Testet af korrekt funktionel form er et test for hypotesen H0 : δ1 = δ 2 = 0 Teststørrelsen er approx. F-fordelt (2, n-k-3) KM2: F21 8
Test af ikke-nestede alternativer To nest : To put inside one another: to nest boxes. Udenfor den almindelige testteori: Model under nulhypotesen er ikke specialtilfælde af model under alternativet. Ex. Model 1: y = β0 + β1x1+ β2x2 + u Model 2: y = β + β log( x ) + β log( x ) + u 0 1 1 2 2 Tilgang 1: Estimér omfattende model (Mizon og Richard) y = γ 0 + γ1x1+ γ2x2 + γ3log( x1) + γ4log( x2) + u Her kan vi teste flg. to hypoteser: H : γ = γ = 0 (model 2), H : γ = γ = 0 (model 1) 0 1 2 0 3 4 KM2: F21 9
Test af ikke-nestede alternativer Tilgang 2: Tilføje prediktion fra alternativ model (Davidson-MacKinnon) Hjælperegression 1: y = β0 + β ˆ 1x1+ β2x2 + θ1y+ v hvor yˆ er de predikterede værdier fra model 2 Hypotese: H : θ = 0 0 1 Hjælperegression 2: y = β0 + β1log( x1) + β2 log( x2) + θ2ˆ y+ v hvor yˆ er de predikterede værdier fra model 1 Hypotese: H 0 : θ 2 = 0 KM2: F21 10
Test af ikke-nestede alternativer Konklusionen er ikke nødvendigvis entydig. Begge modeller kan blive afvist: Prøv en tredje funktionel form Ingen af de to modeller kan afvises: 2 Brug andre kriterier for modelvalg, fx R Selvom en model ikke kan afvises, er det ikke nødvendigvis den sande model. Ikke-nestede alternativer med forskellige afhængige variabler er et (endnu mere) kompliceret problem. KM2: F21 11
Proxy variabler Proxy variabler kan bruges, når den variabel, som man egentlig er interesseret i at korrigere for (men ikke måle effekten af), er uobserverbar. Proxy variablen indgår som erstatning for den sande variabel. Ideen er at fjerne/-minimere problemet med udeladte variabel bias Eksempler: Tilbagetrækning fra arbejdsmarkedet: Alder, uddannelse og indkomst som forklarende variabler. Helbred spiller en rolle og self-reported health status bruges som proxy Løn-uddannelses relation: IQ som proxy for evner KM2: F21 12
Proxy variabler Tavlegennemgang KM2: F21 13
Proxy variabler Eksempel: Lønrelation (på US data) Se tabel 9.2 I alle lønestimationer er der problemer med, at evner ikke er medtaget. Kan være korreleret med både løn, erfaring og uddannelse Giver ikke middelrette/konsistente estimater (specielt problem med uddannelse) IQ bruges som en proxy for evner Resultaterne viser, at estimatet på uddannelse falder, når proxyen medtages Er det som forventet? KM2: F21 14
Proxy variabler Lagget variabel som proxy: Sidste periodes værdier I nogle tilfælde kan man kontrollere for udeladte variabler ved at korrigere med laggede værdier af den afhængige variabel y = + x + y + u β β β 0 1 1 2 1 Den laggede afhængige variabel kan her opfattes som en proxy for udeladte variabler: y 1 vil være korreleret med de udeladte variabler i sidste periode y 1 må ikke være korreleret med denne periodes fejlled KM2: F21 15
NB er Funktionel form misspecifikation: De relevante variabler er til rådighed, men formen kendes ikke. RESET er et test for misspecifikation af den funktionelle form, ikke for fx ægte udeladte variabler eller for heteroskedasticitet. Proxyvariabler bruges som erstatning for udeladte variabler, men proxyens effekt på y har sjældent nogen selvstændig interesse. Der må argumenteres for proxyvariablens gyldighed i hvert enkelt tilfælde. KM2: F21 16
Næste gang Næste forelæsning er onsdag den 2. maj Mere om kapitel 9: Målefejl Dataudvælgelse Eksempler på multiple choice opgaver KM2: F21 17