5. En af styrkerne ved paneldata er, som det også blev diskuteret i afsnit 1, at det er muligt både at beskrive de statistiske processer på både langt og kort sigt ved at udnytte både tværsnits- og panelegenskaberne på samme tid. Dette gælder især, når vi er interesserede i den dynamiske struktur for en proces. Den traditionelle 1EC model, som har været diskuteret indtil nu, har været en statisk model, dvs at højresiden ikke har indeholdt laggede endogene variabler. Vi vil nu definere den 1. ordens dynamiske model 1 ved: y it ' *y it&1 % µ i %, it : i ' 1,...,N ; t ' 2,...,T, hvor: µ i - i.i.d.(0,f 2 µ ) ;, i - i.i.d.(0,f 2, ) ; E(µ i, it ) ' 0. Yderligere forudsætter vi, at initialværdien y i1 er lig 0 for alle personer. Dette sker af nemhedsskyld 2 for den følgende analyse og har ingen principiel betydning. Spørgsmålet er nu, hvordan parameteren i denne model skal estimeres. Lad os prøve med OLS estimatoren: ˆ* ' (y ) &1 y &1 )&1 y ) &1 y %1 hvor y -1 er en vektor med y lagget en periode, og y +1 er en vektor med y trimmet en periode. Forventningen til denne estimator er: E[ˆ*] ' E[(y ) &1 y &1 )&1 y ) &1 (*y &1 % µ %,)] ' * % E[(y ) &1 y &1 )&1 y ) &1 µ]. 1 Det er valgt at vise modellen uden andre forklarende variabler end den laggede endogene. Disse kan uden tab af generalitet indføres. 2 Forventningen til y vil derfor være 0 for alle personer til alle tidspunkter. 1
Da µ i indgår i alle led med y it-1 er sidste led på højresiden af lighedstegnet forskellig fra nul. Mere nøjagtig er det større end nul, da kovariansen mellem µ i og y it-1 er positiv. Dvs at OLS estimatoren for * er positiv biased. Det næste forslag vi kan komme med for at estimere *, er at anvende within transformationen. Definer den transformerede model: ỹ it ' *ỹ it&1 %, it : i ' 1,...,N ; t ' 2,...,,T, hvor: ỹ it ' y it & (T&1) &1 T ' s'2 y is ; ỹ it&1 ' y it&1 & (T&1) &1 T&1 ' s'1 y is ;, it ', it & (T&1) &1 T ' s'2, is, Within estimatoren for * er nu: ˆ* ' (ỹ ) &1ỹ&1 )&1 ỹ ) &1ỹ%1 og som før undersøger vi biasen i estimatoren ved at tage forventningen: E[ˆ*] ' E[(ỹ ) &1ỹ&1 )&1 ỹ ) &1 (*ỹ &1 %,)] ' * % E[(ỹ ) &1ỹ&1 )&1 ỹ ) &1,]. Det er klart, at ỹ &1 og, pr definition er negativt korrelerede. Det kommer direkte af, at der i ligningen for både det enkelte ỹ it&1 og, it alle perioders, is, s = 2,..., T-1. Alt i alt betyder det, at within estimatoren for * er negativ biased 3. 3 En nærmere diskussion af biasen for h.h.v. OLS og Within estimatoren for dynamiske 1EC modeller kan findes i Nickell (1981). 2
Den sidste estimator, vi har diskuteret, er første ordens differens estimatoren. Modellen kan skrives som: )y it ' *)y it&1 % ), it : i ' 1,...,N ; t ' 2,...,T, hvor estimatoren bliver: ˆ* ' ()y ) &1 )y &1 )&1 )y ) &1 )y %1. Igen undersøger vi biasen ved at tage forventningen: E[ˆ*] ' E[()y ) &1 )y &1 )&1 )y ) &1 (*)y &1 % ),)] ' * % E[()y ) &1 )y &1 )&1 )y ) &1 ),]. Det er klart, at )y -1 og ), pr definition er negativt korrelerede: korrelerede gennem tilstedeværelsen af, it-1 i begge led og negativt da, it-1 indgår med et negativt fortegn i ),. Det betyder, at første orden differens estimatoren for * er negativ biased. Problemet med de tre estimatorer opstår ved, at den forklarende variabel er korreleret med fejlledet. Dette - endogene regressorer - er et klassisk problem i økonometrien, og løsningen er at anvende instrumentvariabel (IV) estimatorer. Dvs vi skal finde et instrument til den endogene regressor (i dette tilfælde den laggede endogene variabel), der er korreleret med denne, men som ikke er korreleret med fejlledet. Vi definerer et instrument z ijt til en regressor x ijt som validt, hvis og kun hvis følgende to betingelser er overholdt. For det første skal kovariansen mellem instrumentet, og den variabel, der skal instrumenteres, være forskellig fra 0: cov(x ijt z ijt ) 0, og for det andet må der ikke være korrelation mellem instrumentet og fejlledet: 3
E(< it z ijt ) ' 0, hvor < it er fejlledet i modellen. IV estimatoren er anvendt overalt i økonometrien, men i empiriske undersøgelser mangler der ofte en grundig diskussion og argumentationen for hvorfor lige netop denne variabel anvendes som instrument. Yderligere er validiteten af anvendte instrumenter i mange tilfælde diskutabel. Paneldata åbner imidlertidig op for nogle muligheder, der ikke er i tværsnitsdata. Hsiao og Anderson foreslog i en meget citeret artikel fra 1981 at tage udgangspunkt i første ordens differens estimatoren for den 1. ordens dynamiske 1EC model og instrumentere )y it-1 med y it-2. Lad os se om y it-2 er et validt instrument for )y it-1. Den første betingelse, der skal være opfyldt er, at kovariansen mellem )y it-1 og y it-2 skal være forskellig fra 0: cov()y it&1,y it&2 ) ' cov(y it&1 &y it&2,y it&2 ) ' E[y it&1 y it&2 &y 2 it&2 ] 0 Så den første betingelse for validitet er opfyldt. At den anden også er opfyldt, ses ved: cov(), it,y it&2 ) ' cov(, it &, it&1,y it&2 ) ' E[, it y it&2 &, it&1 y it&2 ] ' 0 Hsiao-Anderson estimatoren for den 1. ordens dynamiske 1EC model bliver derfor: ˆ* ' ()y ) &1 P)y &1 )&1 )y ) &1 P)y %1, hvor P er projektions matrixn for instrumentet: P ' y &2 (y ) &2 y &2 )&1 y ) &2, og hvor y -2 er den to perioder laggede endogene variabel i niveau. 4
Det næste problem bliver selvfølgelig at beregne en varians for estimatet af *. Da HA estimatoren er en første ordens differens estimator, er det transformerede fejlled ikke længere i.i.d.. Det viste vi allerede i kapitel 4: cov(), it,), is ) ' 2F 2, : s't &F 2, : s't&1 0 : s&t >1 Det betyder, at den estimerede varians af estimatet til * bliver: hvor: var( ˆ*) ' ()y ) &1 P)y &1 )&1 )y ) &1 PŜP)y &1 ()y ) &1 P)y &1 )&1, Ŝ i ' Ŝ i qi N, Ŝ i ' ˆF 2, 2 &1 0 þ þ 0 &1 2 &1 0 þ 0! "! 0 þ 0 &1 2 &1 0 þ þ 0 &1 2. Det er klart, at HA estimatoren ikke udnytter al den information, vi har til rådighed om den estimerbare model. Man kan sammenligne problemstillingen med forholdet mellem OLS og FGLS. Når vi anvender differens operatoren ved vi jo, at fejlledene ikke længere er i.i.d. og derfor findes der en mere efficient estimator for * end HA. Denne estimator er GMM estimatoren (Arrelano og Bond, 1991). Lidt løst formuleret er GMM estimatoren for den dynamiske panelmodel, det samme som en FGLS-estimator i et tilfælde med endogene regressorer. Estimatoren bliver: ˆ* ' ()y ) &1 ˆP)y &1 ) &1 )y ) &1 ˆP)y %1, 5
hvor den nye projektionsmatrix er: ˆP ' y &2 (y ) &2Ŝy &2 )&1 y ) &2, Som det ses er situationen helt analog til den mellem OLS og FGLS. GMM estimatoren kræver et estimat af S, hvorfor den er en to-trins estimator. Dog kan vi estimere den i et trin, hvis vi fastholder forudsætningen om, at fejlledet er i.i.d.. I det tilfælde kan vi jo skrive kovariansmatrixen som Ŝ ' ˆF 2, A, (A er defineret i kapitel 4), hvorfor GMM estimatoren bliver: hvor: ˆ* ' ()y ) &1 P A )y &1 ) &1 )y ) &1 P A )y %1, P A ' y &2 (y ) &2 Ay &2 )&1 y ) &2. 6
Øvelser 1. Hvilken fortolkning skal man give af det individspecifikke led i en 1. ordens dynamisk 1EC model på h.h.v. kort og langt sigt? 2. Fra internet-hjemmesiden kan du downloade en fil med simulerede data: dyn.asc. Første søjle er et id-nummer, anden søjle er tidsvariabel og tredie søjle er en variabel y. Regresser nu OLS, within, 1. ordens differens estimator og Hsiao-Anderson estimatoren for en 1. ordens dynamisk model uden konstantled. Er resulaterne i overensstemmelse med de teoretiske prediktioner? For GAUSS brugere er der følgende hjælp at hente: new; #include putil2.src; load data[]= dyn.asc; data = reshape(data,rows(data)/3,3); id = data[.,1]; t = data[.,2]; y = data[.,3]; @renser hukomm@ @indl. rutiner@ @indl. af data@ @omdanner data@ nid = nmbid(id); @nmbid er fra putil2@ ytrim = tlag(y,0,1,nid); @tlag er fra putil2@ ylag = tlag(y,0,1,nid); /*** ols ***/ bols = inv(ylag *ylag)*ylag *ytrim; ols: bols; /*** within ***/ ylagw = within(ylag,nid-1); ytrimw = within(ytrim,nid-1); bwth = inv(ylagw *ylagw)*ylagw *ytrimw; within: bwth; @der er tabt en df@ /*** første ordens differens ***/ 7
dylag = dif(ylag,1,nid-1); dytrim = dif(ytrim,1,nid-1); bdif = inv(dylag *dylag)*dylag *dytrim; 1. Dif: bdif; @dif er fra putil2@ /*** hsiao anderson **/ z = tlag(y,2,0,nid); xz = dylag *z; xy = dylag *dytrim; izz = inv(z *z); bha = inv(xz*izz*xz )*xz*izz*xy; hsiao-anderson: bha; @instrument lagget 2 perioder i niveau@ 8