Kvantitative metoder 2

Relaterede dokumenter
! Proxy variable. ! Målefejl. ! Manglende observationer. ! Dataudvælgelse. ! Ekstreme observationer. ! Eksempel: Lønrelation (på US data)

Kvantitative metoder 2

Kvantitative metoder 2

Økonometri 1. Dummyvariabler 13. oktober Økonometri 1: F10 1

Økonometri 1. Oversigt. Mere om dataproblemer Gentagne tværsnit og panel data I

Økonometri 1. Dagens program. Den simple regressionsmodel 15. september 2006

Økonometri 1. FunktioneI form i den lineære regressionsmodel 19. oktober Dagens program

Økonometri 1. Dagens program. Den multiple regressionsmodel 18. september 2006

Økonometri 1. Prediktion. Dummyvariabler 9. oktober Økonometri 1: F9 1

Økonometri 1. Inferens i den lineære regressionsmodel 2. oktober Økonometri 1: F8 1

Økonometri 1. Den simple regressionsmodel 11. september Økonometri 1: F2

! Husk at udfylde spørgeskema 3. ! Lineær sandsynlighedsmodel. ! Eksempel. ! Mere om evaluering og selvselektion

Kvantitative metoder 2

Økonometri: Lektion 7 Emne: Prædiktionsintervaller, RESET teset, proxy variable og manglende data.

Økonometri 1. Kvalitative variabler. Kvalitative variabler. Dagens program. Kvalitative variable 8. marts 2006

! Variansen på OLS estimatoren. ! Multikollinaritet. ! Variansen i misspecificerede modeller. ! Estimat af variansen på fejlleddet

Økonometri 1. Definition og motivation. Definition og motivation. Dagens program. Den multiple regressionsmodel 15. februar 2006

Økonometri 1. Interne evalueringer. Interne evalueringer. Dagens program. Heteroskedaticitet (Specifikation og dataproblemer) 2.

Kvantitative metoder 2

Appendiks Økonometrisk teori... II

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Rettevejledning til Økonomisk Kandidateksamen 2005I, Økonometri 1

Økonometri 1. Dagens program: Afslutningsforelæsning 23. maj 2007

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Økonometri: Lektion 6 Emne: Heteroskedasticitet

Kvantitative metoder 2

Wooldridge, kapitel 19: Carrying out an Empirical Project. Information og spørgsmål vedr. eksamen. Økonometri 1: Afslutningsforelæsning 2

Økonometri 1. Inferens i den lineære regressionsmodel 25. september Økonometri 1: F6 1

Økonometri, ugeseddel 8 Hold 1 1/4-2003

Økonometri 1. Interne evalueringer af forelæsninger. Kvalitative variabler. Dagens program. Dummyvariabler 21. oktober 2004

Statistik Lektion 4. Variansanalyse Modelkontrol

Rettevejledning til Økonomisk Kandidateksamen 2004I, Økonometri 1

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Lagrange multiplier test. Økonometri: Lektion 6 Håndtering ad heteroskedasticitet. Konsekvenser af Heteroskedasticitet

Økonometri 1. Målsætning for Økonometri 1. Dagens program: Afslutningsforelæsning 16. December 2005

W.2 Simpel lineær regression: Egenskaber ved OLS: Forudsagte værdier og residualer: Et residual:

Kvantitative metoder 2

Forelæsning 11: Kapitel 11: Regressionsanalyse

Økonometri 1. Gentagne tværsnit (W ): Opsamling. Gentagne tværsnit og paneldata. Gentagne Tværsnit og Paneldata II.

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Økonometri: Lektion 6 Emne: Heteroskedasticitet

Kvantitative metoder 2

Økonomisk Kandidateksamen 2006II Økonometri 1. Afkastet af uddannelse for britiske tvillingepar

Rettevejledning til Økonomisk Kandidateksamen 2007II. Økonometri 1

Rettevejledning til Økonomisk Kandidateksamen 2007II. Kvantitative Metoder 2: Tag-hjem eksamen

Rettevejledning til Økonomisk Kandidateksamen 2006II, Økonometri 1

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007

Undervisningsnoter til øvelse i Panel Modeller. %, it. E(x kjs

Økonometri: Lektion 2 Multipel Lineær Regression 1/27

Kvantitative metoder 2

Fokus på Forsyning. Datagrundlag og metode

Kvantitative Metoder 1 - Forår 2007

Økonomisk Kandidateksamen 2003II Økonometri 1. Værdisætning af skov

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

Multipel Lineær Regression

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse

Effekten af indvandring på indfødte danskeres løn og beskæftigelse

Økonometri: Lektion 4. Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Økonomisk Kandidateksamen 2004II Økonometri 1. Læsefærdigheder hos skoleelever i Danmark

Estimation af bilkøbsrelationen med nye indkomst- og formueudtryk

(tæt på N(0,1) hvis n ikke alt for lille). t i god til at checke for outliers som kan have stor indflydelse på estimaterne s 2 og ˆσ 2 e i

Referat : af Gruppearbejde Økonometri1 øvelsestime ugeseddel 7 dato 26/3 2003, Hold 4

Program. 1. Varianskomponent-modeller (Random Effects) 2. Transformation af data. 1/12

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Simpel Lineær Regression: Model

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk

Økonometri 1. Inferens i den lineære regressionsmodel 29. september Økonometri 1: F7 1

Analysestrategi. Lektion 7 slides kompileret 27. oktober :24 p.1/17

Estimation og konfidensintervaller

Økonometri: Lektion 2 Multipel Lineær Regression 1/33

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i.

Susanne Ditlevsen Institut for Matematiske Fag susanne

Out-of-sample forecast samt reestimation af ADAMs lønligning

Statistik Lektion 17 Multipel Lineær Regression

Module 3: Statistiske modeller

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge

Velkommen til kurset. Teoretisk Statistik. Lærer: Niels-Erik Jensen

Poul Thyregod, introslide.tex Specialkursus vid.stat. foraar Lad θ = θ(β) R k for β B R m med m k

Rettevejledning til Kvantitative metoder 1, 2. årsprøve 18. juni timers prøve med hjælpemidler

Kvantitative Metoder 1 - Efterår Dagens program

Center for Statistik. Multipel regression med laggede responser som forklarende variable

Økonometri 1. Test for heteroskedasticitet. Test for heteroskedasticitet. Dagens program. Heteroskedasticitet 26. oktober 2005

Rettevejledning til Økonomisk Kandidateksamen 2008II. Kvantitative Metoder 2: Tag-hjem eksamen

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression

Statistik II 4. Lektion. Logistisk regression

Multipel regression. Data fra opgave 3 side 453: Multipel regressionsmodel: Y = α + β 1 x 1 + β 2 x 2 + ǫ. hvor ǫ N(0, σ 2 ).

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Statistik II 1. Lektion. Analyse af kontingenstabeller

Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model

Økonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol

Kapitel 11 Lineær regression

Økonometri lektion 5 Multipel Lineær Regression. Inferens Modelkontrol Prædiktion

Økonomisk Kandidateksamen 2004I Økonometri 1. Kvinders arbejdsudbud

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

Transkript:

Kvantitative metoder 2 Specifikation og dataproblemer 30. april 2007 KM2: F21 1

Program for de to næste forelæsninger Emnet er specifikation og dataproblemer (Wooldridge kap. 9) Fejlleddet kan være korreleret med de forklarende variabler: Endogene regressorer og MLR.4 holder ikke; OLS er hverken middelret eller konsistent. Fokus er her på de forskellige problemtyper og på test. Mulige løsninger i kap. 13-15. Misspecifikation af den funktionelle form Brug af proxy-variabler Betydning af målefejl Dataudvælgelse Feedback på Obligatorisk opgave 2 + eksempler på multiple choice spørgsmål KM2: F21 2

Funktionel form misspecifikation Hvad nu, hvis man benytter en forkert funktionel form? Generelt vil OLS estimaterne ikke være middelrette og ikke konsistente Forkert funktionel form kan opfattes som udeladte variable Eksempel: Antag, at i den sande model er y beskrevet ved et 2. gradspolynomium i x: 2 y = β0 + β1x+ β2x + u Antag, vi benytter en lineær funktion i x til estimationen (forkert funktionel form) y = β + β x+ w 0 1 Det kvadratiske led er en udeladt variabel, som generelt vil give biased estimater KM2: F21 3

Funktionel form misspecifikation Lønrelation: Antag at den sande model er 2 log( timeløn) = β + βudd + βkvinde+ βerfaring + βerfaring + u Modellen, som estimeres, er log( timeløn) = β + β udd + β kvinde + β erfaring + v OLS estimaterne er ikke middelrette og konsistente Fortolkningen af afkastet af erfaring er forkert I den sande model: I den forkerte model : β3 0 1 2 3 4 0 1 2 3 ˆ β + 2 ˆ β erfaring 3 4 KM2: F21 4

Funktionel form misspecifikation Økonomisk teori giver sjældent præcise anvisninger på den funktionelle form Forkert funktionel form: Den afhængige variabel har forkert funktionel form: Log(y) i stedet for y Forklarende variabel har forkert funktionel form: Log(x) i stedet for x eller exp(x) i stedet for x 2 x mangler Mangler interaktionsled mellem og x j xk Men bemærk: Vi observerer de relevante variabler KM2: F21 5

Funktionel form misspecifikation Problem med funktionel misspecifikation betragtes derfor som mindre fatalt end ægte udeladte variabler (som man typisk ikke har information om) I tilfælde med forkert funktionel form har man i princippet mulighed for at opstille den rigtige model Fremgangsmåde: Estimer modellen med OLS Udregn residualerne Plot residualerne mod de forklarende variabler: Grafisk test Beregn formelle test KM2: F21 6

Formelle test for misspecifikation Udgangspunkt i at hvis MLR.1- MLR.4 er opfyldt og man tilføjer fx kvadratiske led af regressorerne, bør disse være insignifikante. Generelt kan man approksimere en ukendt funktionel form med et polynomium Antag at modellen er givet ved y = β + β x + β x + + β x + u 0 1 1 2 2 k k og opfylder MLR.1-4. Simpelt test: Tilføj kvadratiske led af de forklarende variabler og interaktionsled. Udfør et sædvanligt F-test af deres signifikans: Ej signifikante hvis specifikationen er OK. KM2: F21 7

RESET Specialiseret test af funktionel forms misspecifikation: REgresssion Specification Error Test (RESET) Antag: Modellen opfylder MLR.1- MLR.4 y = β0 + β1x1+ β2x2 + + βkxk + u I RESET tilføjes et polynomium i de predikterede værdier i y 2 3 y = β0 + β1x1+ β2x2 + + β ˆ ˆ kxk + δ1y + δ2y + v Testet af korrekt funktionel form er et test for hypotesen H0 : δ1 = δ 2 = 0 Teststørrelsen er approx. F-fordelt (2, n-k-3) KM2: F21 8

Test af ikke-nestede alternativer To nest : To put inside one another: to nest boxes. Udenfor den almindelige testteori: Model under nulhypotesen er ikke specialtilfælde af model under alternativet. Ex. Model 1: y = β0 + β1x1+ β2x2 + u Model 2: y = β + β log( x ) + β log( x ) + u 0 1 1 2 2 Tilgang 1: Estimér omfattende model (Mizon og Richard) y = γ 0 + γ1x1+ γ2x2 + γ3log( x1) + γ4log( x2) + u Her kan vi teste flg. to hypoteser: H : γ = γ = 0 (model 2), H : γ = γ = 0 (model 1) 0 1 2 0 3 4 KM2: F21 9

Test af ikke-nestede alternativer Tilgang 2: Tilføje prediktion fra alternativ model (Davidson-MacKinnon) Hjælperegression 1: y = β0 + β ˆ 1x1+ β2x2 + θ1y+ v hvor yˆ er de predikterede værdier fra model 2 Hypotese: H : θ = 0 0 1 Hjælperegression 2: y = β0 + β1log( x1) + β2 log( x2) + θ2ˆ y+ v hvor yˆ er de predikterede værdier fra model 1 Hypotese: H 0 : θ 2 = 0 KM2: F21 10

Test af ikke-nestede alternativer Konklusionen er ikke nødvendigvis entydig. Begge modeller kan blive afvist: Prøv en tredje funktionel form Ingen af de to modeller kan afvises: 2 Brug andre kriterier for modelvalg, fx R Selvom en model ikke kan afvises, er det ikke nødvendigvis den sande model. Ikke-nestede alternativer med forskellige afhængige variabler er et (endnu mere) kompliceret problem. KM2: F21 11

Proxy variabler Proxy variabler kan bruges, når den variabel, som man egentlig er interesseret i at korrigere for (men ikke måle effekten af), er uobserverbar. Proxy variablen indgår som erstatning for den sande variabel. Ideen er at fjerne/-minimere problemet med udeladte variabel bias Eksempler: Tilbagetrækning fra arbejdsmarkedet: Alder, uddannelse og indkomst som forklarende variabler. Helbred spiller en rolle og self-reported health status bruges som proxy Løn-uddannelses relation: IQ som proxy for evner KM2: F21 12

Proxy variabler Tavlegennemgang KM2: F21 13

Proxy variabler Eksempel: Lønrelation (på US data) Se tabel 9.2 I alle lønestimationer er der problemer med, at evner ikke er medtaget. Kan være korreleret med både løn, erfaring og uddannelse Giver ikke middelrette/konsistente estimater (specielt problem med uddannelse) IQ bruges som en proxy for evner Resultaterne viser, at estimatet på uddannelse falder, når proxyen medtages Er det som forventet? KM2: F21 14

Proxy variabler Lagget variabel som proxy: Sidste periodes værdier I nogle tilfælde kan man kontrollere for udeladte variabler ved at korrigere med laggede værdier af den afhængige variabel y = + x + y + u β β β 0 1 1 2 1 Den laggede afhængige variabel kan her opfattes som en proxy for udeladte variabler: y 1 vil være korreleret med de udeladte variabler i sidste periode y 1 må ikke være korreleret med denne periodes fejlled KM2: F21 15

NB er Funktionel form misspecifikation: De relevante variabler er til rådighed, men formen kendes ikke. RESET er et test for misspecifikation af den funktionelle form, ikke for fx ægte udeladte variabler eller for heteroskedasticitet. Proxyvariabler bruges som erstatning for udeladte variabler, men proxyens effekt på y har sjældent nogen selvstændig interesse. Der må argumenteres for proxyvariablens gyldighed i hvert enkelt tilfælde. KM2: F21 16

Næste gang Næste forelæsning er onsdag den 2. maj Mere om kapitel 9: Målefejl Dataudvælgelse Eksempler på multiple choice opgaver KM2: F21 17