5. Dynamiske Modeller

Relaterede dokumenter
Undervisningsnoter til øvelse i Panel Modeller. %, it. E(x kjs

1. Intoduktion. Undervisningsnoter til Øvelse i Paneldata

, i ' 1,...,N ; t ' 1,...,T, - i.i.d.(0,f 2, ), ) ' 0, E(, it. x kjs. œ i,t,s,j,k.

Økonometri 1. Dagens program. Den multiple regressionsmodel 18. september 2006

Kvantitative metoder 2

! Variansen på OLS estimatoren. ! Multikollinaritet. ! Variansen i misspecificerede modeller. ! Estimat af variansen på fejlleddet

Økonometri 1. Dagens program. Den simple regressionsmodel 15. september 2006

Økonometri 1. Den simple regressionsmodel 11. september Økonometri 1: F2

Kvantitative metoder 2

Økonometri: Lektion 2 Multipel Lineær Regression 1/27

Økonometri Lektion 1 Simpel Lineær Regression 1/31

! Proxy variable. ! Målefejl. ! Manglende observationer. ! Dataudvælgelse. ! Ekstreme observationer. ! Eksempel: Lønrelation (på US data)

Økonometri 1. FunktioneI form i den lineære regressionsmodel 19. oktober Dagens program

Kvantitative metoder 2

Supplement til kapitel 4 Om sandsynlighedsmodeller for flere stokastiske variable

Økonometri: Lektion 2 Multipel Lineær Regression 1/33

Økonometri 1. Oversigt. Mere om dataproblemer Gentagne tværsnit og panel data I

Økonometri lektion 5 Multipel Lineær Regression. Inferens Modelkontrol Prædiktion

Kvantitative metoder 2

Økonometri 1. Gentagne tværsnit (W ): Opsamling. Gentagne tværsnit og paneldata. Gentagne Tværsnit og Paneldata II.

Et eksempel på en todimensional normalfordeling Anders Milhøj September 2006

Simpel Lineær Regression: Model

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

Økonometri 1. Dummyvariabler 13. oktober Økonometri 1: F10 1

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i.

Simpel Lineær Regression

Økonometri 1. Inferens i den lineære regressionsmodel 25. september Økonometri 1: F6 1

Økonometri 1. Prediktion. Dummyvariabler 9. oktober Økonometri 1: F9 1

Elementær sandsynlighedsregning

Økonometri: Lektion 6 Emne: Heteroskedasticitet

Estimation af Uddannelsesafkast

Økonometri 1. Inferens i den lineære regressionsmodel 2. oktober Økonometri 1: F8 1

Kvantitative metoder 2

Økonometri 1. Målsætning for Økonometri 1. Dagens program: Afslutningsforelæsning 16. December 2005

Wooldridge, kapitel 19: Carrying out an Empirical Project. Information og spørgsmål vedr. eksamen. Økonometri 1: Afslutningsforelæsning 2

Rettevejledning til Økonomisk Kandidateksamen 2005I, Økonometri 1

Kvantitative Metoder 1 - Forår Dagens program

Økonometri 1. Dagens program: Afslutningsforelæsning 23. maj 2007

Analysestrategi. Lektion 7 slides kompileret 27. oktober :24 p.1/17

Lagrange multiplier test. Økonometri: Lektion 6 Håndtering ad heteroskedasticitet. Konsekvenser af Heteroskedasticitet

Økonometri 1 Efterår 2006 Ugeseddel 11

Økonometri: Lektion 7 Emne: Prædiktionsintervaller, RESET teset, proxy variable og manglende data.

Økonometri: Lektion 6 Emne: Heteroskedasticitet

! Husk at udfylde spørgeskema 3. ! Lineær sandsynlighedsmodel. ! Eksempel. ! Mere om evaluering og selvselektion

Module 3: Statistiske modeller

Kvantitative metoder 2

Elementær sandsynlighedsregning

Økonomisk Kandidateksamen 2006II Økonometri 1. Afkastet af uddannelse for britiske tvillingepar

Kapitel 11 Lineær regression

Den todimensionale normalfordeling

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen

Opgaver til kapitel 3

Oversigt over emner. Punktestimatorer: Centralitet(bias) og efficiens

Uddannelses afkast i Danmark

Center for Statistik. Multipel regression med laggede responser som forklarende variable

Økonometri 1 Forår 2006 Ugeseddel 11

Kvantitative metoder 2

hvor a og b er konstanter. Ved middelværdidannelse fås videre

Referat : af Gruppearbejde Økonometri1 øvelsestime ugeseddel 7 dato 26/3 2003, Hold 4

Multipel Lineær Regression

Antag X 1, X 2,..., X n er n uafhængige stokastiske variable, hvor Var(X 1 )=σ 2 1,..., Var(X n )=σ 2 n.

W.2 Simpel lineær regression: Egenskaber ved OLS: Forudsagte værdier og residualer: Et residual:

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Kvantitative Metoder 1 - Forår Dagens program

Kvantitative Metoder 1 - Forår 2007

Rettevejledning til Økonomisk Kandidateksamen 2007II. Økonometri 1

Bilag A. Dexia-obligationen (2002/2007 Basis)

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Økonomisk Kandidateksamen 2004II Økonometri 1. Læsefærdigheder hos skoleelever i Danmark

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Normalfordelingen og Stikprøvefordelinger

Module 9: Residualanalyse

Institut for Matematiske Fag Aalborg Universitet Specielt: Var(aX) = a 2 VarX 1/40. Lad X α, X β og X γ være stokastiske variable (vinkelmålinger) med

Løsning eksamen d. 15. december 2008

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Modul 6: Regression og kalibrering

Sandsynlighedsregning Oversigt over begreber og fordelinger

Rettevejledning til Økonomisk Kandidateksamen 2006II, Økonometri 1

Lineære normale modeller (1) udkast. 1 Flerdimensionale stokastiske variable

Rettevejledning til Økonomisk Kandidateksamen 2007II. Kvantitative Metoder 2: Tag-hjem eksamen

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Kvantitative Metoder 1 - Efterår Dagens program

Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Økonometri 1. Definition og motivation. Definition og motivation. Dagens program. Den multiple regressionsmodel 15. februar 2006

Mat2SS Vejledende besvarelse uge 11

Praktiske ting og sager: Forelæsninger tirsdag og torsdag kl i Kirkesalen, Studiestræde 38 Øvelser

Rettevejledning til Økonomisk Kandidateksamen 2008II. Kvantitative Metoder 2: Tag-hjem eksamen

Matematisk modellering og numeriske metoder. Lektion 5

standard normalfordelingen på R 2.

Landmålingens fejlteori - Lektion 3. Estimation af σ Dobbeltmålinger Geometrisk nivellement Linearisering

Sandsynlighed og Statistik

Økonometri: Lektion 4. Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Sandsynlighedsregning 11. forelæsning Bo Friis Nielsen

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Transkript:

5. En af styrkerne ved paneldata er, som det også blev diskuteret i afsnit 1, at det er muligt både at beskrive de statistiske processer på både langt og kort sigt ved at udnytte både tværsnits- og panelegenskaberne på samme tid. Dette gælder især, når vi er interesserede i den dynamiske struktur for en proces. Den traditionelle 1EC model, som har været diskuteret indtil nu, har været en statisk model, dvs at højresiden ikke har indeholdt laggede endogene variabler. Vi vil nu definere den 1. ordens dynamiske model 1 ved: y it ' *y it&1 % µ i %, it : i ' 1,...,N ; t ' 2,...,T, hvor: µ i - i.i.d.(0,f 2 µ ) ;, i - i.i.d.(0,f 2, ) ; E(µ i, it ) ' 0. Yderligere forudsætter vi, at initialværdien y i1 er lig 0 for alle personer. Dette sker af nemhedsskyld 2 for den følgende analyse og har ingen principiel betydning. Spørgsmålet er nu, hvordan parameteren i denne model skal estimeres. Lad os prøve med OLS estimatoren: ˆ* ' (y ) &1 y &1 )&1 y ) &1 y %1 hvor y -1 er en vektor med y lagget en periode, og y +1 er en vektor med y trimmet en periode. Forventningen til denne estimator er: E[ˆ*] ' E[(y ) &1 y &1 )&1 y ) &1 (*y &1 % µ %,)] ' * % E[(y ) &1 y &1 )&1 y ) &1 µ]. 1 Det er valgt at vise modellen uden andre forklarende variabler end den laggede endogene. Disse kan uden tab af generalitet indføres. 2 Forventningen til y vil derfor være 0 for alle personer til alle tidspunkter. 1

Da µ i indgår i alle led med y it-1 er sidste led på højresiden af lighedstegnet forskellig fra nul. Mere nøjagtig er det større end nul, da kovariansen mellem µ i og y it-1 er positiv. Dvs at OLS estimatoren for * er positiv biased. Det næste forslag vi kan komme med for at estimere *, er at anvende within transformationen. Definer den transformerede model: ỹ it ' *ỹ it&1 %, it : i ' 1,...,N ; t ' 2,...,,T, hvor: ỹ it ' y it & (T&1) &1 T ' s'2 y is ; ỹ it&1 ' y it&1 & (T&1) &1 T&1 ' s'1 y is ;, it ', it & (T&1) &1 T ' s'2, is, Within estimatoren for * er nu: ˆ* ' (ỹ ) &1ỹ&1 )&1 ỹ ) &1ỹ%1 og som før undersøger vi biasen i estimatoren ved at tage forventningen: E[ˆ*] ' E[(ỹ ) &1ỹ&1 )&1 ỹ ) &1 (*ỹ &1 %,)] ' * % E[(ỹ ) &1ỹ&1 )&1 ỹ ) &1,]. Det er klart, at ỹ &1 og, pr definition er negativt korrelerede. Det kommer direkte af, at der i ligningen for både det enkelte ỹ it&1 og, it alle perioders, is, s = 2,..., T-1. Alt i alt betyder det, at within estimatoren for * er negativ biased 3. 3 En nærmere diskussion af biasen for h.h.v. OLS og Within estimatoren for dynamiske 1EC modeller kan findes i Nickell (1981). 2

Den sidste estimator, vi har diskuteret, er første ordens differens estimatoren. Modellen kan skrives som: )y it ' *)y it&1 % ), it : i ' 1,...,N ; t ' 2,...,T, hvor estimatoren bliver: ˆ* ' ()y ) &1 )y &1 )&1 )y ) &1 )y %1. Igen undersøger vi biasen ved at tage forventningen: E[ˆ*] ' E[()y ) &1 )y &1 )&1 )y ) &1 (*)y &1 % ),)] ' * % E[()y ) &1 )y &1 )&1 )y ) &1 ),]. Det er klart, at )y -1 og ), pr definition er negativt korrelerede: korrelerede gennem tilstedeværelsen af, it-1 i begge led og negativt da, it-1 indgår med et negativt fortegn i ),. Det betyder, at første orden differens estimatoren for * er negativ biased. Problemet med de tre estimatorer opstår ved, at den forklarende variabel er korreleret med fejlledet. Dette - endogene regressorer - er et klassisk problem i økonometrien, og løsningen er at anvende instrumentvariabel (IV) estimatorer. Dvs vi skal finde et instrument til den endogene regressor (i dette tilfælde den laggede endogene variabel), der er korreleret med denne, men som ikke er korreleret med fejlledet. Vi definerer et instrument z ijt til en regressor x ijt som validt, hvis og kun hvis følgende to betingelser er overholdt. For det første skal kovariansen mellem instrumentet, og den variabel, der skal instrumenteres, være forskellig fra 0: cov(x ijt z ijt ) 0, og for det andet må der ikke være korrelation mellem instrumentet og fejlledet: 3

E(< it z ijt ) ' 0, hvor < it er fejlledet i modellen. IV estimatoren er anvendt overalt i økonometrien, men i empiriske undersøgelser mangler der ofte en grundig diskussion og argumentationen for hvorfor lige netop denne variabel anvendes som instrument. Yderligere er validiteten af anvendte instrumenter i mange tilfælde diskutabel. Paneldata åbner imidlertidig op for nogle muligheder, der ikke er i tværsnitsdata. Hsiao og Anderson foreslog i en meget citeret artikel fra 1981 at tage udgangspunkt i første ordens differens estimatoren for den 1. ordens dynamiske 1EC model og instrumentere )y it-1 med y it-2. Lad os se om y it-2 er et validt instrument for )y it-1. Den første betingelse, der skal være opfyldt er, at kovariansen mellem )y it-1 og y it-2 skal være forskellig fra 0: cov()y it&1,y it&2 ) ' cov(y it&1 &y it&2,y it&2 ) ' E[y it&1 y it&2 &y 2 it&2 ] 0 Så den første betingelse for validitet er opfyldt. At den anden også er opfyldt, ses ved: cov(), it,y it&2 ) ' cov(, it &, it&1,y it&2 ) ' E[, it y it&2 &, it&1 y it&2 ] ' 0 Hsiao-Anderson estimatoren for den 1. ordens dynamiske 1EC model bliver derfor: ˆ* ' ()y ) &1 P)y &1 )&1 )y ) &1 P)y %1, hvor P er projektions matrixn for instrumentet: P ' y &2 (y ) &2 y &2 )&1 y ) &2, og hvor y -2 er den to perioder laggede endogene variabel i niveau. 4

Det næste problem bliver selvfølgelig at beregne en varians for estimatet af *. Da HA estimatoren er en første ordens differens estimator, er det transformerede fejlled ikke længere i.i.d.. Det viste vi allerede i kapitel 4: cov(), it,), is ) ' 2F 2, : s't &F 2, : s't&1 0 : s&t >1 Det betyder, at den estimerede varians af estimatet til * bliver: hvor: var( ˆ*) ' ()y ) &1 P)y &1 )&1 )y ) &1 PŜP)y &1 ()y ) &1 P)y &1 )&1, Ŝ i ' Ŝ i qi N, Ŝ i ' ˆF 2, 2 &1 0 þ þ 0 &1 2 &1 0 þ 0! "! 0 þ 0 &1 2 &1 0 þ þ 0 &1 2. Det er klart, at HA estimatoren ikke udnytter al den information, vi har til rådighed om den estimerbare model. Man kan sammenligne problemstillingen med forholdet mellem OLS og FGLS. Når vi anvender differens operatoren ved vi jo, at fejlledene ikke længere er i.i.d. og derfor findes der en mere efficient estimator for * end HA. Denne estimator er GMM estimatoren (Arrelano og Bond, 1991). Lidt løst formuleret er GMM estimatoren for den dynamiske panelmodel, det samme som en FGLS-estimator i et tilfælde med endogene regressorer. Estimatoren bliver: ˆ* ' ()y ) &1 ˆP)y &1 ) &1 )y ) &1 ˆP)y %1, 5

hvor den nye projektionsmatrix er: ˆP ' y &2 (y ) &2Ŝy &2 )&1 y ) &2, Som det ses er situationen helt analog til den mellem OLS og FGLS. GMM estimatoren kræver et estimat af S, hvorfor den er en to-trins estimator. Dog kan vi estimere den i et trin, hvis vi fastholder forudsætningen om, at fejlledet er i.i.d.. I det tilfælde kan vi jo skrive kovariansmatrixen som Ŝ ' ˆF 2, A, (A er defineret i kapitel 4), hvorfor GMM estimatoren bliver: hvor: ˆ* ' ()y ) &1 P A )y &1 ) &1 )y ) &1 P A )y %1, P A ' y &2 (y ) &2 Ay &2 )&1 y ) &2. 6

Øvelser 1. Hvilken fortolkning skal man give af det individspecifikke led i en 1. ordens dynamisk 1EC model på h.h.v. kort og langt sigt? 2. Fra internet-hjemmesiden kan du downloade en fil med simulerede data: dyn.asc. Første søjle er et id-nummer, anden søjle er tidsvariabel og tredie søjle er en variabel y. Regresser nu OLS, within, 1. ordens differens estimator og Hsiao-Anderson estimatoren for en 1. ordens dynamisk model uden konstantled. Er resulaterne i overensstemmelse med de teoretiske prediktioner? For GAUSS brugere er der følgende hjælp at hente: new; #include putil2.src; load data[]= dyn.asc; data = reshape(data,rows(data)/3,3); id = data[.,1]; t = data[.,2]; y = data[.,3]; @renser hukomm@ @indl. rutiner@ @indl. af data@ @omdanner data@ nid = nmbid(id); @nmbid er fra putil2@ ytrim = tlag(y,0,1,nid); @tlag er fra putil2@ ylag = tlag(y,0,1,nid); /*** ols ***/ bols = inv(ylag *ylag)*ylag *ytrim; ols: bols; /*** within ***/ ylagw = within(ylag,nid-1); ytrimw = within(ytrim,nid-1); bwth = inv(ylagw *ylagw)*ylagw *ytrimw; within: bwth; @der er tabt en df@ /*** første ordens differens ***/ 7

dylag = dif(ylag,1,nid-1); dytrim = dif(ytrim,1,nid-1); bdif = inv(dylag *dylag)*dylag *dytrim; 1. Dif: bdif; @dif er fra putil2@ /*** hsiao anderson **/ z = tlag(y,2,0,nid); xz = dylag *z; xy = dylag *dytrim; izz = inv(z *z); bha = inv(xz*izz*xz )*xz*izz*xy; hsiao-anderson: bha; @instrument lagget 2 perioder i niveau@ 8