Eksogenitet. Øvelsesoplæg i Makroøkonometriske Problemstillinger. af Anders V. Rasmussen og Mikkel T. Kromann

Relaterede dokumenter
Kvantitative metoder 2

Test for strukturelle ændringer i investeringsadfærden

Out-of-sample forecast samt reestimation af ADAMs lønligning

Undervisningsnoter til øvelse i Panel Modeller. %, it. E(x kjs

Reestimation af importrelationer

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Forelæsning 11: Kapitel 11: Regressionsanalyse

Kvantitative metoder 2

Estimation af bilkøbsrelationen med nye indkomst- og formueudtryk

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning

Betydningen af konjunktur og regelændringer for udviklingen i sygedagpengemodtagere

Center for Statistik. Multipel regression med laggede responser som forklarende variable

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Økonometri 1. Inferens i den lineære regressionsmodel 2. oktober Økonometri 1: F8 1

Uddybende beregninger til Produktivitetskommissionen

Fokus på Forsyning. Datagrundlag og metode

1. Intoduktion. Undervisningsnoter til Øvelse i Paneldata

Kvantitative metoder 2

Skriftlig eksamen i samfundsfag

1 Regressionsproblemet 2

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning

Markante sæsonudsving på boligmarkedet

Københavnske ejerlejlighedspriser en meget begrænset indikator for hele landets boligmarked

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

! Proxy variable. ! Målefejl. ! Manglende observationer. ! Dataudvælgelse. ! Ekstreme observationer. ! Eksempel: Lønrelation (på US data)

Tema. Dagens tema: Indfør centrale statistiske begreber.

Økonometri 1. Den simple regressionsmodel 11. september Økonometri 1: F2

Effekten af indvandring på indfødte danskeres løn og beskæftigelse

Appendiks Økonometrisk teori... II

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Kapitel 11 Lineær regression

Kapitel 7 Forskelle mellem centraltendenser

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

Modul 12: Regression og korrelation

Økonometri: Lektion 6 Emne: Heteroskedasticitet

Lagrange multiplier test. Økonometri: Lektion 6 Håndtering ad heteroskedasticitet. Konsekvenser af Heteroskedasticitet

Økonometri: Lektion 7 Emne: Prædiktionsintervaller, RESET teset, proxy variable og manglende data.

Analysestrategi. Lektion 7 slides kompileret 27. oktober :24 p.1/17

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i.

Løsninger til kapitel 14

Et eksempel på en todimensional normalfordeling Anders Milhøj September 2006

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Om hypoteseprøvning (1)

Konfidensintervaller og Hypotesetest

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

Den personlige skattepligtige indkomst

Økonometri: Lektion 6 Emne: Heteroskedasticitet

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

Økonometri: Lektion 4. Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater

Eksportørgevinst i eksportrelationen

1 Hb SS Hb Sβ Hb SC = , (s = )

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Økonometri 1 Efterår 2006 Ugeseddel 11

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Økonometri 1. Dagens program. Den multiple regressionsmodel 18. september 2006

02402 Vejledende løsninger til Splus-opgaverne fra hele kurset

Seminaropgave: Præsentation af idé

Reestimation af uddannelsessøgende

Økonometri 1. Inferens i den lineære regressionsmodel 25. september Økonometri 1: F6 1

Kvantitative Metoder 1 - Efterår Dagens program

Introduktion til Konjunktur teori. Carl-Johan Dalgaard Økonomisk Institut Københavns Universitet

Rettevejledning til Økonomisk Kandidateksamen 2007II. Økonometri 1

Module 4: Ensidig variansanalyse

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

Appendiks A. Lag-længde samt unit-root test Test for unit-roots - 1 -

Et kig på løn-, forbrug-, boligpris- og boligmængde relationernes historiske forklaringsevne

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Løsning til eksaminen d. 14. december 2009

Stokastiske stød til ADAMs adfærdsrelationer

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Estimation og konfidensintervaller

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

Økonometri 1 Forår 2006 Ugeseddel 11

Appendiks E. Lag-længde samt unit-root test Test for unit-roots - 1 -

Bilag 12 Regressionsanalysens tabeller og forklaringer

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

Rettevejledning til Økonomisk Kandidateksamen 2004I, Økonometri 1

Module 3: Statistiske modeller

Kapitel 12 Variansanalyse

Kvantitative metoder 2

Økonometri, ugeseddel 8 Hold 1 1/4-2003

Vejledende besvarelser til opgaver i kapitel 14

Økonometri Lektion 1 Simpel Lineær Regression 1/31

2 X 2 = Antal mygstik på enpersoniløbetaf1minut

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Susanne Ditlevsen Institut for Matematiske Fag susanne

Statistik II 1. Lektion. Analyse af kontingenstabeller

Økonometri: Lektion 2 Multipel Lineær Regression 1/27

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007

1 α K = A t, (SS1) n + g + δ eller: ln yt =lna t +

En sammenligning af 5 reestimationer af lønrelationen

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Transkript:

Eksogenitet Øvelsesoplæg i Makroøkonometriske Problemstillinger af Anders V. Rasmussen og Mikkel T. Kromann Vejleder: H. C. Kongsted Afleveret d. 9/4 2002 Opponenter: Jeppe Juhl Christensen og Søren Andersen Forsvar d. 14/5 2002 Økonomisk Institut, Københavns Universitet Indhold: 1 Introduktion... 3 2 Eksogenitet... 4 2.1 Svag eksogenitet... 4 2.2 Stærk eksogenitet... 6 2.3 Super eksogenitet... 6 3 Data og modelspecifikation... 7 3.1 Databeskrivelse... 7 3.2 Overvejelser i tidsrækkeanalyse... 9 3.3 Modelspecifikation... 13 4 Tests for eksogenitet... 16 4.1 Svag eksogenitet... 16 4.2 Stærk eksogenitet... 18 4.3 Super eksogenitet... 20 5 Alternative analysemetoder... 23 6 Konklusion... 25 Litteratur... 27 A Alternativ modelspecifikation... 28 B Test for undladt variabel... 30 C Identifikation af ligningssystem... 30 D Testhypotese for svag eksogenitet... 33

E Parameterinvarians i betinget model... 34 F Udskrifter fra PcGive... 35 2

Eksogenitet Sammenfatning: 1 Vi undersøger en fremført økonometrisk funderet påstand om, at politiske indgreb, der reducerer boliginvesteringerne, kan føre til lavkonjunktur. Den moderne økonometris overvejelser om eksogenitet opsummeres, og det viser sig at de beskrevne tests kun kan bekræfte en enkelt ud af flere nødvendige betingelser for at boliginvesteringerne kan tages for givne i den beskrevne sammenhæng. Vi illustrerer på danske data hvilke tests, der som minimum bør udføres, før man kan argumentere for eller imod den fremførte påstand. 1 Introduktion Dette oplæg tager sit udgangspunkt i en artikel af Green (1997), med titlen: Follow the Leader: How Changes in Residential and Non-residential Investment Predict Changes in GDP, som på amerikanske kvartalsvise tal påviser, at boliginvesteringer Granger forårsager BNP. På denne baggrund foreslås at... policies designed to funnel capital away from housing into plant and equipment could produce severe short-run disalocations. En sådan titel og slutning giver efter vores mening anledning til at genoverveje kriterierne for under hvilke omstændigheder, man med rimelighed kan specificere retningen af den tænkte sammenhæng i en økonometrisk model, hvornår en model har gyldighed som redskab til forudsigelser, og hvordan man kan sikre sig, at modellens resultater er robuste nok til at foreslå eller fraråde specifikke politikforslag. Til disse tre spørgsmål knytter sig den moderne økonometris tre vigtigste varianter af begrebet eksogenitet, som vi derfor vil beskrive og implementere tests for. Oplægget kan således betragtes som en lille kogebog i eksogenitet og tests herfor. I afsnit 2 gennemgås de tre eksogenitetsbegreber, mens afsnit 3 beskriver de danske data og specifikation af modellen, vi vil anvende til eksogenitetstestene. Disse foretages i afsnit 4. Sidst overvejes en alternativ afprøvning af Greens konklusion i afsnit 5. 1) Anders har skrevet afsnittene 3, 4 og 6 (undtagen 3.1 og 4.3), samt appendiks C, D og F. Mikkel har skrevet afsnittene 1, 2, 3.1, 4.3 og 5, samt appendiks A og E. Resten er fælles arbejde. 3

2 Eksogenitet De fleste økonomer er formentlig opmærksomme på, at en påvist korrelation mellem to variable ikke er tilstrækkeligt til at påvise et direkte årsags/virknings-forhold mellem de fænomener, variablene tænkes at beskrive. Tværtimod er statistisk analyse af korrelationer isoleret set kun egnet til at afvise foreslåede årsagssammenhænge. Herved begrænser mulighederne for at påvise en givet årsagssammenhæng sig til at specificere alle tænkelige årsagssammenhænge, for derefter så vidt muligt at udelukke eller afvise så mange som muligt af disse, så i bedste fald kun én står tilbage. Uheldigvis kan man principielt set forestille sig en hvilken som helst årsagssammenhæng mellem to eller flere af samtlige fænomener i verden, så denne analyse kan ikke gennemføres. I stedet må man lade sig nøje med én der er mindre omfattende ved kun at medtage et begrænset antal fænomener. Givet at de relevante fænomer kan beskrives af variable, er de to spørgsmål i økonometriske termer: Hvilke variable kan helt udelades, og hvornår kan de medtagne forklarende variable tages for givne i en analyse af korrelationen med den/de forklarede variable sådan, at de forklarende variable kan efterlades umodellerede uden at påvirke inferensen. Vi vil i afsnit 3.3.2 kort vende tilbage til det første spørgsmål, mens det sidste er genstand for nærmere analyse nedenfor. Endvidere ser vi på betingelser for om modellen kan bruges til forudsigelse, og for hvornår den er robust nok til at bruges til politikanbefalinger. Nedenfor rekapitulerer vi følgende: 2 Som vist af Engle et al. (1983) er betingelsen for, at forklarende variable kan tages for givne i korrelationen med andre variable, at de forklarende variable er svagt eksogene i forhold til de interessante parametre. Ønsker man en analyse, som kan bruges til at forudsige variable givet forklarende variable, er det tilsvarende krav stærk eksogenitet, mens analyse givet politikker kræver super eksogenitet. 2.1 Svag eksogenitet Vi ser på en statistisk model for variablene y t og x t, hvor u t og v t er stokastiske fejlled, mens β er parameteren af interesse: y t = βx t + u t (1) x t = v t (2) 2) Fremstillingen bygger på Engle, Hendry og Richard (1983), Hendry (1995, kap. 5.4) og Johnston og DiNardo (1997). 4

Til denne model hører en tænkt marginal tæthedsfunktion for den uafhængige x t og en tilsvarende tænkt betinget tæthedsfunktion for y t. Det gælder altid, at den fælles tæthedsfunktion kan skrives som produktet af den betingede og den marginale tæthed: f (y t, x t λ) = f (y t x t, λ 1 ) f (x t λ 2 ) (3) hvor λ erne betegner tæthedsfunktionernes parametre. 3 Uformelt siger man, at x t er svagt eksogen i forhold til β, hvis inferensen omkring β uden tab af information kan foretages ud fra den betingede fordeling af y t ; med andre ord at den marginale fordeling af x t ikke indeholder relevant information og kan ignoreres. Er x t svagt eksogen i forhold til β, slipper økonometrikeren for at estimere (2), og svag eksogenitet er således en forudsætning for, at den fælles tæthed med rimelighed kan udtrykkes i en betinget og en marginal model. Ved at anvende tæthedsfunktionerne til modellen kan eksogenitetsbegrebet relateres til likelihood-funktionen, og derved til efficient estimation. Lad ψ være den/de interessante parametre. Hvis de betingende variable er svagt eksogene i forhold til ψ er inferens omkring den betingede tæthed ækvivalent med inferens omkring den fælles tæthed. Sammen med diskussionen i sidste afsnit ses det, at svag eksogenitet for de uafhængige variable i forhold til de interessante parametre er en tilstrækkelig betingelse for retmæssigt at tage de uafhængige variable for givne, og følgeligt ignorere deres marginale fordeling. Formelt kan svag eksogenitet udtrykkes i to nødvendige og (samlet set) tilstrækkelige betingelser i forhold til tæthedsfunktionerne, nemlig at: 1. de interessante parametre kan udtrykkes entydigt ved hjælp parametrene fra den betingede tæthed, dvs. ψ = g (λ 1 ) 2. parametrene fra de to tætheder er variationsfrie, dvs. at (λ 1, λ 2 ) Λ 1 Λ 2 hvor λ i Λ i. Heraf følger at λ 1 og λ 2 ikke må være underlagt krydsrestriktioner. 4 Var dette tilfældet ville man smide information væk ved kun at estimere den betingede model, hvilket ikke er efficient. Endelig er det værd at bemærke, at manglende svag eksogenitet for en uafhængig variabel i forhold til interesse-parametrene (afhængigt af modelspecifikationen og parametervær- 3) Til λ, λ 1 og λ 2 hører også parametrene fra variansmatricen for fejlledene u t og v t. For et mere udspecificeret eksempel, se Johnston og DiNardo (1997, kap. 8.2.3). 4) Eksemplet fra Johnston og DiNardo (1997, kap. 8.2.3) indeholder også denne problemstilling. Hendry (1995, kap. 5.4) giver et eksempel, hvor variationsfriheden kan reddes af en strukturelt begrundet antagelse om efterspørgselselasticiteten. 5

dierne) ikke nødvendigvis giver anledning til inkonsistens, men blot at inferensen ikke er fuldt efficient, fordi relevant information fra den marginale tæthed ignoreres. 2.2 Stærk eksogenitet Svag eksogenitet berettiger til, at de uafhængige variable tages for givne i forhold til de parametre, der estimeres. Ønsker man derimod at lave et forecast på den afhængige variabel, må det sikres, at de uafhængige kan tages for givne i forhold til den afhængige. Til denne betingelse knytter sig stærk eksogenitet. For modellen i (1) siges x t at være stærkt eksogen for ψ (bemærk at eksogeniteten igen defineres i forhold til angivne parametre), såfremt x t er svagt eksogen for ψ, og at y t ikke Granger-forårsager x t. Sidste betingelse er opfyldt såfremt x t ikke afhænger af de laggede værdier af y t (dvs. Y t 1 = {y t 1, y t 2,..., y 0 }), men eventuelt laggede værdier af x t (X t 1 ), dvs.: f (x t X t 1, Y t 1 ) = f (x t X t 1 ) Når variablen i forvejen er svagt eksogen, sikrer denne betingelse, at x t heller ikke påvirkes af y t og derfor stadig kan tages for givet. 2.3 Super eksogenitet Ikke bare forecasts kan have økonometrisk interesse. Siden økonomisk politik af og til bygger på økonometrisk analyse, er det også interessant at vide, om den specificerede økonometriske model er holdbar overfor politiktiltag. Er dette ikke tilfældet, vil den økonomiske politik ikke have de virkninger, som modellen forudsiger, og modellen er derfor mindre egnet eller helt uegnet som basis for økonomisk politik. Spørgsmålet om eksogenitet opstår, hvis politikeren kun har kontrol over (dele af) λ 2, men ikke λ 1, mens variablen der ønskes påvirket er y t. Her vil det være oplagt med en politik, som påvirker x t, i en sådan grad, at den ønskede virkning for eksempel på y t opnås via βx t i den betingede model. Selvom svag eksogenitet sikrer at λ 1 og λ 2 er variationsfrie, kan det stadig tænkes at de to afhænger (evt. delvis) af fælles dybere parametre. Herved vil en politik der ændrer λ 2 via en sådan dyb parameter kunne påvirke λ 1 og derved medføre en anderledes ændring af politikvariablen y t end påtænkt. Man siger at x t er super eksogen for ψ, hvis x t er svagt eksogen for ψ, og den betingede model er strukturelt invariant, dvs. at den betingede 6

models parametre, λ 1, er konstante for ændringer i fordelingen for den marginale model, herunder også de forårsaget af politikændringer. 3 Data og modelspecifikation Udgangspunktet for dette oplæg er, som skrevet ovenfor, Green (1997). I denne artikel motiveres boliginvesteringer som værende en god predikter for BNP ud fra, at denne hovedsageligt skulle være forklaret ved forventningen til fremtidige udsving i BNP. Green opstiller implicit en model, foretager en overfladisk analyse af de grundlæggende karakteristika og mener efterfølgende at kunne påvise, at modellen kan bruges til forecast hhv. politik anbefalinger. I dette afsnit forsøger vi at afdække opgavens problemformulering ud fra en praktisk indfaldsvinkel. Vi undersøger datas grundlæggende karakteristika, herunder om tidsserierne i modellen er integrerede, om de er kointegrerede, og om der er autokorrelation i modellens fejlled. Dette gøres for at undersøge, om de oven for anførte kriterier, stærk eksogenitet og super eksogenitet for parametrene i en model analog til Greens, kan testes konsistent ved hjælp af OLS, og om Greens påvisninger holder for danske data. Derudover vil der blive taget stilling til konsekvensen af, kun at have én forklarende variabel med i modellen. Det vil blive undersøgt om det kan påvises, at relevante forklarende variable er blevet udeladt, og hvilke konsekvenser dette kan medføre. Vi synes det er vigtigt at pointere, at vi ikke har til hensigt at kulegrave Greens artikel for at finde fejl og mangler, men i stedet forsøge at afdække hvilke tanker man bør have gjort sig om en model, før man i praksis bruger den til et givent formål. Det givne formål vil her være at illustrere tests for, om modellen kan bruges i forecast sammenhæng og analyse af politik anbefalinger. 3.1 Databeskrivelse Data er BNP og boliginvesteringer i 95-priser, hentet fra MONAs databank (hhv. variablene FY og FIH). FIH indeholder kun private investeringer i boligbyggeri, idet offentligt støttet byggeri ikke (længere) er medregnet. Serierne er kvartalsvise og går fra 1971q1 til 2001q4, ialt 124 observationer. Herfra angiver BNP og BI de logaritmetransformerede tidsserier for hhv. FY og FIH. Den præcise timing af investeringen er dog behæftet med nogen statistisk usikkerhed, idet opgørelsen af boliginvesteringerne sker på grundlag af registeroplysninger om tilladelser 7

vedrørende påbegyndt, igangværende og afsluttet byggeri og arealet heraf. Sammen med et omkostningsindeks for boligbyggeri bliver det herved muligt at beregne de aggregerede investeringers størrelse. Da boligbyggeri typisk strækker sig over flere kvartaler, kan opgørelsesmetoden have nogen indflydelse på en undersøgelse af Granger kausalitet, som den der foretages her. Det er imidlertid ikke oplagt, hvordan et sådant problem kan afdækkes, og da det også ligger et stykke uden for problemformuleringen, behandles det ikke yderligere. Figur 1 aftegner seriernes udvikling i perioden. Figur 1 Realt BNP og boliginvesteringer 1971 2001 (1995-priser) BNP (stiplet) BI 1200 90 1100 80 1000 900 800 70 60 50 40 700 30 600 1975 1980 1985 1990 1995 2000 20 Kilde: MONA s databank. Som det kan ses udvikler BNP sig nogenlunde jævnt stigende over tid. Man kan bemærke sig afmatningerne efter oliepris-chokkene i 1970 erne og starten af 1980 erne, mens tilbageslaget efter Skattereformen i 1987 også tydeligt ses. I mellem disse perioder med lav vækst ses perioder med relativt høj vækst. I forbindelse med en diskussion af politiske indgrebs påvirkning af korrelationen mellem de to variable, er det også af interesse at notere sig, at konjunkturpolitiske indgreb, som fx. dele af Skattereformen 1987 eller Pinsepakken 1998, ofte i høj grad gennemføres igennem boligmarkedet. Såfremt boligbenyttelsen på langt sigt udgør en stabil andel af indkomsten, kan man forvente, at boliginvesteringerne udvikler sig på samme måde som BNP. Når dette ikke er tilfældet for første tredjedel af perioden, kan der peges på flere mulige forklaringer, som for eksempel befolkningens aldersmæssige forskydning pga. fødselsboomet i 1940 erne, 5 æn- 5) Se fx. Danmarks Statistik: Befolkningens bevægelser 2000. 8

drede boligsociale strukturer a la parcelhus-boomet i 1960 erne, men også en reduktion i mængden af ledige attraktive grunde som følge af en stor byggeaktivitet. 6 Det er oplagt, at en bivariat model over de to serier vil udelade væsentlig information om seriernes langsigtede udvikling. Oplæggets fokus er imidlertid samvariationen mellem de to størrelser på noget kortere sigt, hvorfor udeladelse af denne information har nogen berettigelse. Det er imidlertid også klart, at boliginvesteringerne er præget af en del støj. Et godt eksempel herpå er orkanen i december 1999, som foranledigede den (også på figuren) markante stigning i boliginvesteringerne til udbedring af skaderne. En sådan type variation sætter derfor grænser for modellens forklaringskraft. 3.2 Overvejelser i tidsrækkeanalyse Når man betragter problemstillinger i tidsrækkeanalyse, er det nødvendigt at være opmærksom på datas grundlæggende karakteristika. Dette er vigtigt for at være sikker på, at de resultater, man finder, ikke er non-sense resultater fra ugyldig inferens. Ugyldig inferens er inferens mellem to eller flere tidsserier, som er ikke-stationære og ikkekointegrerede, som derfor giver resultater uden mening. I det efterfølgende afsnit vil vi belyse dette problem, og undersøge hvorledes det kan afhjælpes. Derudover vil vi belyse kilder til autokorrelation, herunder især effekten af at udelade relevant information fra modellen, og undersøge om der er autokorrelation i modellens fejlled. For at replicere Greens modelanalyse mener vi, det er nærliggende at opstille en modificeret version af den model, han implicit opstiller. På strukturel form og med kun ét lag af de forklarende variable, er denne givet ved hvor ε ( 0 0 1 β 12 0 1 ; ω 11 0 0 ω 22 BNP t BI t ). = γ 11 γ 12 γ 21 γ 22 BNP t 1 BI t 1 β 21 = ω 12 = 0 i henhold til identifikation, hvilket svarer til en antagelse om, at BNP t ikke indgår til forklarelse af BI t, og at fejlledene er ukorrelerede. 7 Denne restriktion gør modellen eksakt identificeret, hvilket er en forudsætning for at estimere modellen ud fra data. Dette vender vi tilbage til i afsnittet for svag eksogenitet, efter vi for en kort stund har forladt modellen for at undersøge, om de pågældende tidsserier er stationære. + ε 1t ε 2t (4) 6) Se fx. Det Økonomiske Råd (2001, boks I.3). 7) Se bilag C. 9

3.2.1 Stationære tidsserier En uformel metode til at undersøge, om tidsserierne er stationære, er givet ved inspicere ovenstående graf, som angiver de to tidsseriers udvikling over tid. Heraf ses det, at begge tidsserier fluktuerer over tid uden at variere omkring en fast værdi, hvilket indikerer, at de er ikke-stationære. Hvis en tidsserie er ikke-stationær, kan det i visse tilfælde give komplikationer for gyldigheden af inferencen omkring de estimererede parametre. Dette vil være tilfældet, hvis der eksempelvis i et bivariat set-up som vores findes to ikke-stationære serier, som ikke er kointegrerede. For at gennemskue dette, betragtes følgende model 8 y t = δx t + u t, (5) hvor u t Nid(0, σ 2 ), og hvor cov(x t, u t ) = 0. Antag nu at y t og x t er ikke-stationære processer, og at de har den egenskab, at deres rødder ligger på enhedscirklen. Denne type af processer kategoriseres som integrerede processer og betegnes I(d), hvor d angiver processens orden og refererer til det antal af lags, som gør processen stationær. Problemet med integrerede tidsserier er, at en linearkombination mellem dem ofte også er en integreret serie. Dette skaber problemer i ovenstående model, som på baggrund heraf vil producere spurious (non-sense) resultater, og forårsage at OLS ikke følger den normale standardfordeling. Som nævnt er det eneste tilfælde, hvor regression af integrerede serier på hinanden ikke giver komplikationer, når de pågældende processer er kointegrerede. Derved vil eksempelvis linearkombinationen y t ˆδx t = û t være en stationær proces, som kan estimeres konsistent ved hjælp af OLS. Hvis der ikke findes et ˆδ, så û t er stationær, vil en tilstrækkelig løsning til stationaritet være at estimere modellen i differenser af orden d. Dette vil i visse tilfælde løse problemet, da processernes udsving derved bliver samlet omkring en fast tidsuafhængig middelværdi med en tidsuafhængig varians, hvilket er en forudsætning for gyldig inferens mellem ikke-kointegrerende processer. For at undersøge om de to tidsserier BNP og BI er stationære opstilles Dickey-Fuller modellen (DF): 9 y t = β 0 + β 1 t + u t u t = αu t 1 + ε t Dette kan reduceres til: y t = γ + δt + αy t 1 + ε t hvor γ = β 0 (1 α)+β 1 α, δ = β 1 (1 α) og ε t er hvid støj. t er en trend, der anvendes som en alternativ stationaritetsløsning til differenser, hvilket vi vil uddybe senere i oplægget. 8) Se Hylleberg (1997, note 7). 9) Se Maddala (1992, s. 583). 10

y t er stationær hvis α < 1, og indeholder en enhedsrod hvis α = 1, hvilket sammenfalder med δ = 0, som betyder at trenden udgår af modellen, og differenser vil være den brugbare stationaritetsløsning. Problemet med DF-modellen er dens følsomhed over for autokorrelation i ε t. Dette kan kun afhjælpes ved at udvide modellen med laggede differenser af y t, hvilket betegnes som den udvidede Dickey-Fuller, (fremover ADF). Modellen oven for er et specialtilfælde af denne ADF og fremkommer, når alle lagoperatorer er testet væk. Det er værd at gøre opmærksom på, at konsekvensen af for få medtagne laggede differenser er, at H 0 for ofte forkastes uden grund. Derfor bør DF kun benyttes, såfremt alle laggede differenser er testet ud af modellen. ADF regressionen kan formelt opstilles som følger: k y t = γ + δt + αy t 1 + θ j y t j + υ t I dette test er det ligeledes meget vigtigt, at υ t ikke er autokorreleret, og derfor inkluderes laggede differenser indtil v t ikke længere udviser tegn på autokorrelation. Hvorvidt trenden medtages i dette test bestemmes ud fra den enkelte proces udviklingsforløb over tid, men bør overvejes, da medtagelse uden grund kan medføre forkerte resultater. Hvis en proces viser tegn på at være repræsenteret ved en veldefineret trend, vil medtagelse af trend være nok til at gøre denne stationær, og førstedifferenser bør undgås. Alternativt vil medtagelse af trenden i ADF for en serie, som er differens-stationær ikke have de store komplikationer, men bør alligevel overvejes og undgås. j=1 3.2.2 Test for enhedsrødder i tidsserierne Ud fra ADF kan det testes om vores to tidsserier BNP og BI indeholder enhedsrødder. Nulhypotesen er, at der er en enhedsrod i processen (α = 1) over for det stationære alternativ (α < 1). Teststørrelsen er et t-test, som er givet ved: t(1) = ˆα 1 SE(ˆα) Resultaterne af testene er fremført i tabel 1, hvor op til 3 lags af differenser er medtaget for at gøre fejlledet hvidt, og regressionen er gennemført med hhv. uden trend. De kritiske værdier for den udvidede Dickey-Fuller fordeling med trend er givet ved 5% = 2, 886 og 1% = 3, 486 og uden trend 5% = 3, 447 og 1% = 4, 037. 10 Af dette skema fremgår det, at H 0 ikke kan forkastes, og at begge processer derfor er integrerede. Det er dog interessant at bemærke forskellen i t-værdier for BNP med hhv. uden trend. Årsagen til dette skal findes i, at BNP udviser en positiv determinstisk trend, 10) Se Maddala (1992, s. 606). 11

Tabel 1 t-størrelser for stationaritet af BNP og BI k, t/ut 1, t 2, t 3, t 1, ut 2, ut 3, ut BN P 2.401 2.611 2.671 0.081 0.002 0.165 BI 1.856 2.206 2.344 1.898 2.241 2.410 Kilde: Beregninger foretaget med PcGive. og det derfor bør overvejes om BNP er trendstationær. Da t-værdierne for ADF med trend ikke er signifikante, vælger vi ikke at gå i dybden med det her, men vil belyse det i appendiks A, hvor en alternativ trendstationær modelspecifikation kort bliver undersøgt. For at undersøge af hvilken orden processerne er integrerede, defineres processernes førstedifferenser, hvorefter enhedsrodstest mage til det oven for gennemføres. Såfremt førstedifferenserne er stationære, vil tidsserierne være integrerede af første orden, og fremtidige tests og analyser vil blive foretaget på førstedifferenser. Dette kan generaliseres ved følgende: 11 En proces y t er integreret af orden d og betegnes y t I(d) hvis (1 L) d y t er stationær. L er lagoperateren, og d betegner den orden af differens, som gør processen (1 L) d y t stationær. Hvis (1 L) d y t er stationær, vil inferens mellem de pågældende tidsserier ske ved differenser af orden d. Tabel 2 t-størrelser for stationaritet for førstedifferenser af BNP og BI k, t/ut 1, t 2, t 3, t 1, ut 2, ut 3, ut BN P 7.272 6.084 5.440 7.285 6.103 5.456 BI 5.439 4.775 5.049 5.421 4.731 4.970 Kilde: Beregninger foretaget med PcGive. De ovenfor anførte kritiske t-værdier er fortsat gældende, og i tabel 2 ses det, at H 0 må forkastes. Processernes førstedifferens er stationære, og BN P og BI er derfor begge integreret af første orden. Dette betyder, at inferens mellem de to tidsserier i niveauer vil give meningsløse resultater, medmindre det kan påvises, at der eksisterer en langsigtet sammenhæng mellem dem. Dette vil vi nu undersøge ved at teste, om linearkombinationen mellem de to tidsserier, dvs. fejlledet i modellen tilsvarende (5), er stationær. 3.2.3 Test for kointegration For at undersøge om der er kointegrerende sammenhænge mellem BNP og BI, foretages en regression tilsvarende (5) af BNP t på BI t for at undersøge, om linearkombinationen mellem dem er stationær. Dette gøres analog til sidste afsnits metode ved hjælp af ADF 11) Se Hylleberg (1997, note 7). 12

testet. Ved at benytte k = 2, fås t-størrelsen for û t til 0.693. Da fejlledet i regressionen ikke kan observeres, men skal estimeres, vil den kritiske værdi være forskellig fra den normale ADF værdi. De kritiske værdier for kointegration er fundet i en tabel udviklet af Engel og Yoo 12 og er for k = 2 på 5%-niveau 3, 17. Da værdier mindre end den fundne værdi på 3.17 er kritiske for ADF, kan H 0 ikke forkastes, og det kan derfor ikke påvises, at de to tidsserier er kointegrerede. Da serierne er integrerede af første orden, og ikke er kointegrerede, vil den videre analyse, dvs. opstillelse af model og test for eksogenitet, blive foretaget i førstedifferenser idet tabel 1 antyder, at aftrendning muligvis ikke løser stationaritetsproblemet. 3.3 Modelspecifikation Efter denne gennemgang af tidsseriernes karakteristika vil vi vende tilbage til den oven for anførte model, som nu bliver opstillet i førstedifferenser, og som på strukturel form er givet ved: BNP t = β 12 BI t + γ 11 BNP t 1 + γ 12 BI t 1 + υ 1t (6) BI t = γ 21 BNP t 1 + γ 22 BI t 1 + υ 2t (7) ( ) 0 σ 11 0 hvor υ t ; 0 0 σ 22 Det antages, at samme nulrestriktioner fortsat er pålagt modellen i henhold til identifikation. Dette gøres fortsat for at replicere Greens modelanalyse, og undersøge om modellen kan anvendes til såvel forecast af BNP som analyse af konsekvenserne af ændringer i boligpolitikken. Som nævnt omfatter dette at teste de anførte kriterier stærk eksogenitet og super eksogenitet, hvilket vi vil vende tilbage til efter en gennemgang af kilder til autokorrelation i modellens fejlled og udførelse af et test herfor. 3.3.1 Kilder til autokorrelation Et af designkriterierne, som skal være opfyldt, for at OLS giver konsistente estimater, er, at der ikke må eksistere autokorrelation i den estimerede models fejlled. At der er autokorrelation i modellens fejlled betyder, at disse er afhængige over tid, og angives ved cov(u t, u t s ) 0 for s > 0, hvor u t er den reducerede models fejlled. Der kan nævnes to vigtige forklaringer på dette problem: (i) enten eksisterer der information i data, som vi ikke har taget højde for, da vi opstillede modellen, eller (ii) at vores model er dynamisk 12) Se Maddala (1992, s. 607). 13

fejlspecificeret, og at dette bør afhjælpes ved at opstille en anden model. 13 Grundet det lille antal af forklarende variable i modellen mener vi, at (i) er oplagt at belyse, og at (ii), grundet oplæggets omfang, derfor ikke vil blive belyst. Vi vil derfor undersøge, om der er autokorrelation i modellen oven for, ved først at belyse (i) teoretisk og derefter teste dette ud fra data. 3.3.2 Autokorrelation grundet manglende information Autokorrelation i en models fejlled opstår som oftest på grund af, at relevant information i data er blevet overset, da den estimerede model blev opstillet. Dette betyder med andre ord, at den estimerede model ikke er den sande model, og at OLS bliver biased og inkonsistent. Dette kan illustreres ved følgende eksempel. Observer den sande model: 14 y t = βx t + γz t + u t, hvor u t ( ) 0, σ 2 u (8) hvor z t antages at følge en AR(1) proces: z t = φz t 1 + ε t, hvor ε t (0, σ 2 ε ). z t er dermed tidsmæssigt afhængig. Observer den estimerede model: y t = βx t + υ t (9) Denne models fejlled vil være autokorreleret over tid, såfremt υ t og υ t 1 begge afhænger af informationen fra den udelukkede variabel z t. Dette undersøges ved følgende omskrivning: υ t = γz t + u t υ t = γφz t 1 + γε t + u t, og υ t 1 = γz t 1 + u t 1. Heraf fremgår det, at cov(υ t, υ t 1 ) 0 da υ t og υ t 1 begge afhænger af z t 1. Diskussionen om, hvorvidt al information i data er forklaret ud fra modellen, bliver gradvist mere interessant jo færre forklarende variable modellen indeholder, og i tidsseriemodeller med få variable bør det stærkt overvejes eksplicit at foretage test herfor. Dette test ønsker vi at foretage og gennemfører det ved at finde en variabel i MONA, som vi mener er udeladt uden grund, og tester om denne er signifikant i en model tilsvarende (8). Såfremt data foreligger for den pågældende variabel, er testet ligetil og gennemføres ved at estimere (8), med det antal af lags man nu ønsker, og endelig undersøge om koefficienten til den udeladte variabel er signifikant. Såfremt data ikke foreligger, foretages et Ramsey Reset test, som gennemføres analogt til ovenstående, men hvor processen for den udeladte variabel approksimeres ved hjælp af potenser af de prediktede værdier af y t fundet ved estimation af (9). 15 13) Se Hylleberg (1996, note 4). 14) Se Hylleberg (1996, note 4). 15) Se Maddala (1992, s. 478). 14

Testet for udeladt variabel hvor data er kendt har vi gennemført for tidsserien renten (kaldet IBZ og mærket bond yield ), som er fundet i MONAs databank. Listen af kandidater er lang, men renten tillægges ofte stor betydning for udviklingen i indkomsten, og er derfor valgt som eksempel. Testene (se appendiks B) indikerer, at tidsserien uden gyldig grund er blevet udeladt af modellen. Det er derfor ikke nødvendigt at teste for, om andre variable skulle være udeladt uden grund, da resultatet af dette test er nok til at påvise, at der er risiko for, at modellens fejlled er autokorreleret. Dette vil vi nu teste. 3.3.3 Test for autokorrelation Som nævnt ovenfor, svarer autokorrelation i en models fejlled til, at fejlledet er afhængigt over tid. Eksempelvis vil fejlledet, som følger processen u t = ρu t 1 + ε t, hvor ρ < 1, benævnes AR(1), da denne er afhængig af sidste periodes værdi. Om ρ er positiv eller negativ kan som regel afsløres ved at betragte plottet af de estimerede residualer over tid. Såfremt ρ > 0 vil residualerne bevæge sig i bløde buer omkring aksen og have få fortegnsskift, mens ρ < 0 medfører mange fortegnsskift. I tilfælde hvor det ikke kan afsløres visuelt foretages et eksplicit test herfor, hvilket vi nu vil gøre. Testet er motiveret af Breusch-Godfrey og er et Lagrange Multiplier test, som udføres i 2 trin: (i) regression af den pågældende model under H 0 ved hjælp af OLS, (ii) foretag en hjælperegression hvor residualerne fra (i) estimeres på de i (i) medtagne forklarende variable og laggede residualer. 16 Test-statistikken er givet ved: LM = T R 2 χ 2 f (10) hvor T er antallet af observationer under H 0 og R 2 angiver forklaringsgraden i modellen under (ii). Store værdier er kritiske for χ 2 -fordelingen, så H 0 forkastes hvis LM > χ 2 f,1 α, hvor α angiver signifikansniveauet. Modellen givet ved (6) og (7) estimeres ligning for ligning, og LM testet foretages. Vi ønsker at teste, om H 0 : ρ = 0 i oven for anførte autokorrelationsproces kan godkendes, hvilket indikerer, at der ikke er autokorrelation i modellen over for alternativet H A : ρ 0. Testet er foretaget, og LM-værdierne for BN P er 0.216, mens den tilsvarende værdi for BI er 2.665. Den kritiske værdi på 10% signifikansniveau for f = 1 er 2.71, 17 og kun det forhøjede signifikansniveau retfærdiggør forkastelsen af autokorrelation, idet store værdier af LM-størrelsen er kritiske. Efter denne gennemgang vil vi fortsætte med det, som er det egentlige formål med denne øvelse: at illustrere tests for svag, stærk og super eksogenitet. 16) Se Hylleberg (1996, note 4). 17) Se appendiks F og Maddala (1992, side 614). 15

4 Tests for eksogenitet Underliggende for Greens analyser foreligger en problemstilling, som undersøger hvorvidt det er muligt at forudsige BNP på baggrund af BI, og afgøre i hvilken grad ændringer i boligpolitikken er forklarende for ændringer i BNP. Dette er med andre ord en undersøgelse af, om modellen udviser stærk og super eksogenitet for variablen BI i forhold til parametrene i den betingede model for BNP givet BI. Disse undersøgelser gennemfører Green ikke, men fremsætter alligevel dels en påstand om, at ændringer i boliginvesteringer har betydning for BNP i en sådan grad, at ændringer i disse kan føre økonomien ind og ud af lavkonjunktur, og dels en påstand om at BI er en glimrende predikter for BNP, da denne jo netop afspejler forventningen til fremtidige ændringer i BNP. Forud for disse påstande (og en forudsætning for overhovedet at benytte modellen i disse sammenhænge), skal der gælde, at variablen BI er svagt eksogent i forhold til parametrene af interesse i den betingede model for BNP givet BI. Såfremt dette er opfyldt, vil inferens omkring den betingede model for BNP givet BI svare til inferensen omkring den samlede bivariate model, og vi vil kunne estimere modellen efficient uden hensynstagen til den marginale model for BI, jvf. afsnit 2.1. Dette vil i det efterfølgende blive testet for modellen i differenser, hvor også betingelserne Granger non-kausalitet løbende fra BN P til BI og strukturel invarians mellem den betingede og den marginale model vil blive testet, som, under forudsætning af svag eksogenitet af BI, definerer stærk hhv. super eksogenitet. 4.1 Svag eksogenitet I dette afsnit vil vi belyse, hvordan det er muligt at afsløre, om BI opfylder at være svag eksogen i forhold til angivne interesse-parametre i den betingede model for BN P givet BI, jvf. Haldrup (1998). Som nævnt er dette en forudsætning for senere at anvende denne betingede model, fremfor den bivariate model, i et praktisk øjemed omkring forecast modellering og analyse af politiske indgreb. Metoden til dette er at udvinde den betingede model for BN P givet BI og undersøge, om (i) interesse-parametrene indgår heri og (ii) om der foreligger nogen krydsrestriktioner mellem parametrene i den betingede og den marginale model; i overensstemmelse med notation i afsnit 2.1 er (ii) i princippet en undersøgelse af om λ 1 og λ 2 i modellen er variationsfrie. 16

Den betingede model for BNP givet BI udledes ved i modellen (6) og (7) at multiplicere (7) med størrelsen σ 12 /σ 22 og trække denne fra (6), hvilket giver BNP t = (β 12 + σ 12 σ 22 ) BI t + (γ 11 σ 12 σ 22 γ 21 ) BNP t 1 (11) +(γ 12 σ 12 σ 22 γ 22 ) BI t 1 + ξ t hvor ξ t = υ 1t σ 12 σ 22 υ 2t. Forud for at undersøge om BI er svag eksogen, er det nødvendigt at angive hvilke parametre, som variablen skal være svag eksogen i forhold til. Disse parametre, som kaldes interesse-parametre, fastsættes i henhold til den givne problemstilling. I dette oplæg vil det være naturligt at undersøge, om BI er svag eksogen i forhold til BN P -seriens middelværdi, hvilke er en funktion af parametrene i (6), som derfor vil være interesse-parametrene oplægget ud. Modellen oven for, givet ved (6) og (7), betragtes nu, fortsat under antagelse af β 21 = σ 12 = 0 i henhold til identifikation. Heraf ses det, at den betingede model givet ved (11) vil blive reduceret til (6), og at (7) kommer til at angive BI s marginale ( model, ) da BNP t ikke indgår i forklarelsen. Derudover gælder, at Eξ t υ 2t = E υ 1t σ 12 σ 22 υ 2t υ 2t = 0, og at både (i) og (ii) oven for vil være opfyldte. Dette implicerer, at BI pr. konstruktion er svag eksogen i forhold til parametrene af interesse, og at test herfor ikke vil give mening. Hvis man ud fra økonomisk intuition havde pålagt modellen andre identifikations restriktioner, eksempelvis β 21 = γ 11 = 0, ville det ikke være muligt at afsløre svag eksogenitet uden at teste for det. Dette skyldes, at modellen vil have fuld kovariansmatrice, og hverken (i) eller (ii) nødvendigvis vil være opfyldt. I det efterfølgende vil vi, i forhold til den generelle kontekst, gennemgå testet og undersøge, om BI i modellen er svag eksogen i forhold til interesse-parametrene i den betingede model. 4.1.1 Test for svag eksogenitet I appendiks D er testet for svag eksogenitet udledt under de alternative identifikationsrestriktioner givet ved β 21 = γ 11 = 0. Heraf fremgår det, at testet for om BI t er svag eksogen, ikke overraskende, er et test for om σ 12 = 0, hvilket herunder definerer nulhypotesen. Testet foretages ved først at regressere (7) med β 21 = 0 og finde fejlprædiktionen, û t, som er bestemt ved forskellen mellem de observerede og de fittede værdier for BI. Derefter estimeres den betingede model (11) under antagelse af at γ 11 = 0, og med fejlprædiktionen som ekstra forklarende variabel. Hvis BI er svag eksogen, vil der gælde, at BI t er ukorreleret med den betingede models fejlled ξ t, hvilket i dette test er en afledt effekt af nulhypotesen. 17

Formålet med at inkludere û t i regressionen er, at denne størrelse er ukorreleret med ξ t under H 0 men korreleret under H A. Derved vil det kunne afsløres, om BI er svag eksogen i forhold til interesse-parametrene, hvilket er tilfældet, hvis koefficienten til û t er insignifikant. Dette svarer til, at û t og ξ t er ukorrelerede, og vil være indikator for om BI t og ξ t under H 0 er ukorreleret. Årsagen til at û t, og ikke de fittede værdier, benyttes som indikator er, at de fittede værdier vil være ukorreleret med ξ t både under H 0 og H A, og vil derfor ikke være brugbare som indikator. Testet bliver gennemført i overensstemmelse med modellen oven for, hvilket vil sige, at vi estimerer modellen i førstedifferenser i stedet for i niveauer, og tester om û t er signifikant. Estmationen bliver foretaget i PcGive, og resultaterne herfra findes i appendiks F. Af dette ses det, at koefficienten til û t, kaldet uhat, er insignifikant med en t-værdi på 0.726 svarende til en sandsynlighed for at være insignifikant på 0.4693. H 0 godkendes således, og det konkluderes, at BI er svag eksogen i forhold til de angivne interessse-parametre. Efterfølgende er det derfor både interessant og relevant at undersøge, om Granger nonkausalitet er opfyldt, hvilket vil opfylde forudsætingerne for forecast-analyse. Dette vil vi nu fortsætte med. 4.2 Stærk eksogenitet Definitionen på Granger non-kausalitet er, i overensstemmelse med notationen fra afsnit 2.2, givet ved: f( BI t BNP t 1, BI t 1, λ 2 ) f( BI t BI t 1, λ 2 ) (12) Dette betyder uformelt, at tidligere værdier af tidsserien BNP (dvs BNP t j for j = 1,..., k) ikke har nogen forklarende effekt på tidsserien BI. Hvis vi af pædagogiske årsager fortsat betragter modellen (6) og (7) vil (12) betyde, at γ 21 i (7) er lig 0, svarende til at tidligere værdier af BNP ikke medtages i modellen til beskrivelse af BI t. For modeller med kun to tidsserier kan dette testes på flere måder. 18 Ét test, som er foreslået af Sim, estimerer den afhængige variabel på fortiden, nutiden og fremtiden af de forklarende variable, og undersøger om fremtidige værdier af den forklarende variabel af interesse er signifikant. En udvidet version af dette test er foreslået af Geweke, som mener at kunne afhjælpe F -testets følsomhed over for autokorrelation, ved at inkludere laggede værdier af den afhængige variabel på den forklarende side. Et tredje test, som vi vil gøre brug af her, er et test foreslået af Granger, som direkte tester om laggede værdier af den pågældende variabel har forklaringskraft. 18) Se Maddala (1992, s. 394). 18

I det generelle set-up med flere laggede værdier af den pågældende variabel i modellen, gennemføres testet som et normalt F -test, ved først at estimere en model tilsvarende (7) under H 0 hhv. under H A, beregne summen af de kvadrerede residualafvigelser i de to modeller og udføre F -testet. H 0 svarer her til, at de laggede værdier ikke har forklaringskraft og H A til, at mindst én af de laggede værdier er signifikant. I vores set-up, hvor der kun eksisterer én lagget værdi af BNP i (7), reduceres F -testet til et t-test og udføres ved at estimere (7) og undersøge, om værdien til BNP t 1 er signifikant. I det generelle set-up vil F -størrelsen under H 0 være givet ved: F = (RSS R + RSS U ) /k 2 RSS U / (T k) F k2,t k (13) hvor k 2 angiver det antal af restriktioner modellen er pålagt, k angiver antallet af estimerede parametre i modellen uden restriktioner og T antallet af observationer. F -størrelsen er kritisk overfor store F -værdier og forkaster H 0, hvis F > F k2,t k,1 α, hvor α angiver det pågældende signifikansniveau. På baggrund heri kan det nu testes, om de pågældende variable, her kun BNP t 1, Granger-forårsager den afhængige variabel, BI t, og om den betingede model for BNP givet BI under forudsætning af, at BI er svag eksogen i forhold til interesse-parametrene, kan benyttes i forecastsammenhæng. 4.2.1 Test for Granger non-kausalitet Som nævnt ønsker vi at undersøge, om det kan påvises, at BNP ikke Granger-forårsager BI, hvilket vi gør ved en simpel estimation af (7) for hypotesen: H 0 : γ 21 = 0 og H A :. Under H 0 gælder det, at BNP ikke Granger-forårsager BI t over for alternativhypotesen, at den tidligere værdi af BNP er signifikant, og at BNP derfor Grangerforårsager BI. Estimationen er foretaget og resultaterne foreligger i appendiks F. Heraf ses, at BNP t 1 med en t-værdi på 1.156 svarende til en sandsynlighed for at værdien er insignifikant på 0.250, må betragtes som værende uden forklaringsevne for BI t. Derved godkendes H 0, BI t vil med andre ord være stærk eksogen, og det vil være muligt at bruge denne som forecaster for BN P. Dette er analogt til det Green gør, og det er derved påvist at den betingede model for BN P givet BI kan bruges som forecastmodel herfor. Det er værd at bemærke, at alternativ-hypotesen er givet ved, at mindst én af de tidligere værdier af BN P er forklaringsdygtig, hvorfor dette test, under normale omstændigheder, bør foretages for en model med flere laggede værdier for BNP. Testet er følsomt over for antallet af lags, og det er ikke givet, at udførelse af et test med én kombination af laggede værdier, udelukker at andre kombinationer af laggede værdier skulle være signifikante. Dette giver god mening, da der ikke er nogen faste rammer for hvor lang tid en effekt i en tidsserie er om at slå igennem i en anden tidsserie. 19

I vores set-up har vi i midlertidigt testet modellen i bund for BNP ved at medtage så mange lags af de forklarende variable, som vi mente, vi kunne forsvare i henhold til antallet af frihedsgrader, og foretaget modeludvælgelse ved hjælp af general to specific - metoden. Resultatet er angivet i appendiks F, hvoraf det fremgår, at de eneste signifikante forklarende variable tilbage i modellen er værdier af nutidige ændringer i BI og værdier af de to tidsseriers førstedifferenser lagget én gang, hvilket derfor blev grundlaget for den opstillede model ovenfor. I det efterfølgende vil vi fortsætte analysen af modellen på danske data, og forsøge at afgøre om modellen også er robust i forhold til politikanbefalinger. 4.3 Super eksogenitet For at kunne påvise et super eksogent forhold, er det (som nævnt i afsnit 2.3) nødvendigt at finde manglende parameterinvarians i den marginale model, mens den betingede model er parameterinvariant. Parameterinvarians kan afvises ved blot at påvise et modeksempel. Modsat kan påvisning af parameterinvarians i princippet kun foretages, hvis alle tænkelige forhold undersøges. Da dette ikke er muligt, må man nøjes med være ekstra grundig, og foretage den bredest mulige vifte af tests. Det vil vi gøre herunder, hvor vi først forsøger at sandsynliggøre, at den betingede models parametre er konstante, og efterfølgende at den marginale models parametre ikke er det. 4.3.1 Den betingede model En meget kraftfuld klasse af tests for parameterinvarians er baseret på rekursiv estimation, jvf. Johnston og DiNardo (1997, kap 4.3.3). Ideen bag denne type estimationer er, at modellen og parametrene estimeres ved at udvide eller indskrænke mængden af observationer. På denne måde kan man se hvordan parameterestimater og diverse teststørrelser udvikler sig. Den første teststørrelse der præsenteres her, er den betingede models (11) F -værdi, som er et relativt mål for uforklaret varians, såfremt en lineær restriktion sætter modellens parametre til nul. Store værdier heraf indikerer, at modellens variable og de estimerede parametre er gode til at forklare variationen. Størrelsen er F (q, n k)-fordelt hvor (q, n, k) er henholdsvis antallet af restriktioner, observationer og estimerede parametre. Figur 2 viser udviklingen i denne størrelse, dels når observationer inkluderes målt fra periodens start, dels når de ekskluderes. 20

Figur 2 F 10 8 6 4 2 F-størrelser og signifikanssandsynlighed for modellens samlede forklaringskraft estimeret ved in- og ekskludering af observationer Ssh. 0.80 0.60 0.40 0.20 0 1976 1981 1986 1991 1996 F - excl. F - incl. Ssh. excl. 0.00 2001 Note: Kilde: Den vandrette linie angiver 5 pct. s signifikanssandsynlighedsniveau (h. akse). Den lodrette streg er indsat umiddelbart efter 83q2. sas\suex\bet\strchg\structchange.lst I figuren ses det (de fuldt optrukne linier for F -størrelse (fed) og tilsvarende signifikanssandsynlighed), at modellens forklaring af variationen falder efterhånden som observationer ekskluderes (fra periodens begyndelse). Tilsvarende viser den stiplede linie F-størrelsen for modellen efterhånden som observationer inkluderes fra periodens begyndelse (disse størrelser kan dog på ingen måde give anledning til forkastelse af den samlede model). Udfra de alt for høje signifikanssandsynligheder kan det konstateres at modellen ingen forklaringskraft har i den sidste del af perioden, mens den i den første del af perioden på ingen måde kan afvises, og det må konkluderes at den angivne model er udsat for et strukturelt brud på et tidspunkt i perioden. Figuren er dog mindre egnet til at konstatere, præcis hvornår dette brud forekom, idet den inkluderende rekursive procedure bekræfter modellen for hele perioden, 19 mens den ekskluderende før brudtidspunktet kommer til at indeholde relativt flere informationsløse observationer, og derfor må tænkes at afkræfte modellen for tidligt. På baggrund af det markante fald i den inkluderende størrelse (stiplede) og tilsvarende fald i den ekskluderende, efter 1983q3, vælger vi at antage at vores strukturbrud forekommer her. 20 Da 19) Dette fremgår af de til F-størrelsen hørende ikke rapporterede signifikanssandsynligheder som bortset fra de første få ligger under 1 pct. Se kilden til figuren. 20) En one-step ahead prediction errors procedure kunne muligvis have afsløret det eksakte tidspunkt med sikkerhed. Se Johnston og DiNardo (1997, kap 4.3.4). 21

vores model ingen forklaringskraft har efter dette tidspunkt vælger vi at se bort fra alle observationer herefter og fortsætter vores testprocedurer på det begrænsede datasæt. En anden oplagt rekursiv estimationsprocedure er at estimere modellens parametre og disses standardafvigelser ved at in- og ekskludere observationer. Figurer heraf kan ses i appendiks E. Af figurerne fremgår det ret tydeligt at parametrene stabiliserer sig når omkring halvdelen af observationerne er medtaget, og at deres standardafvigelse indsnævrer sig jo flere observationer der estimeres på. Disse parameterestimater viser bestemt ingen tegn på ustabilitet. Samlet set har de foretagne parameterinvarianstest på den betingede model ikke kunne påvise at parametrene ikke er konstante for perioden før 83q3. Imidlertid har modellen fra og med dette tidpunkt måttet afvises, idet den er helt uden forklaringskraft. Den betragtelige følgende reduktion i antallet af frihedsgrader begrænser kraften i dette og de følgende tests. 4.3.2 Den marginale model Også på den marginale model (for BI t ) estimerer vi parametrene rekursivt. Det viser sig at kun parameteren til BI t 1 er signifikant. De estimerede parametre kan findes i figur 3, både med inkluderende og ekskluderende rekursion. Figur 3 dbilag 3 2 1 0-1 -2 Rekursivt estimerede parametre for den marginale model inkluderende (tv.) og ekskluderende (th.) dbilag 3 2 1 0-1 -2-3 71 72 73 74 75 76 77 78 79 80 81 82 83-3 72 73 74 75 76 77 78 79 80 81 82 83 Kilde: sas\suex\marg\parcon\ Selvom parameteren holder sig nogenlunde stabil kan perioden 76q2 til 79q2 give anledning til en lille bekymring, især for den ekskluderende procedure (figur 3 th.). Derfor underlægger vi den marginale model et Chows forecast test, som fremstillet i Johnston og DiNardo (1997, s. 115 116), hvor vi netop vælger denne periode ud som vores forecastperiode. Lad 22

modellen være y e = X e β + e (14) y f X f hvor y i er en n i -dimensional (for i = e, f) søjlevektor, mens X i er en matrix af dimensionen (n i k). k er antallet af estimerede parametre (β-søjlevektorernes dimension), n e er antallet af observationer som bruges til at estimere β e i modellen y e = X e β e + e e, mens n f er antallet af observationer som skal forudsiges, givet den estimerede β e. Hovedparten af observationerne bruges til estimation, mens kun en mindre del bruges til forudsigelse. Har modellen ikke konstante parametre, vil fejlledene for forudsigelserne være markant større. Hypotesen om konstante parametre afvises, hvis teststørrelsen 21 F = (e e e e e e) /n f e e e e/ (n e k) F (n f, n e k) (15) overskrider en forudvalgt kritisk værdi. Her vælger vi et 5 pct. signifikansniveau, hvilket med én estimeret parameter svarer til F (13, 34) F (14, 34) = 2.00. Da vores udregnede teststørrelse er F = 0.66 giver denne test ikke anledning til at kunne afvise parameterinvarians i den marginale model. Med baggrund i de rekursivt estimerede parametre og den foretagne Chow-test har det ikke været muligt at påvise parameterinvarians i den betingede model. Hermed kan super eksogenitet hverken be- eller afkræftes. Dette skal dog ses i forhold til, for det første at der kun er 48 observationer til rådighed, og for det andet at den marginale model kun har én uafhængig variabel. På denne baggrund kunne man, hvis tiden havde tilladt det, have overvejet at anvende modelspecifikationen fra appendiks A. 5 Alternative analysemetoder I afsnit 4.3 så vi, at det ikke var muligt at bekræfte, at ( )BI var super eksogen for de interessante parametre i den betingede model for ( )BNP, fordi den marginale model ikke udviste tegn på parameterinvarians. Det er dog ikke vanskeligt at forestille sig politikændringer, som ville ændre på fordelingen af BI; bare på skatteområdet findes mange instrumenter af betydning. Problemet i den marginale (såvel som i den betingede) model er, at modellernes forklaringsgrad er så ringe, at politik/parameterændringerne ikke er til at skille fra den øvrige støj. Den manglende påvisning af super eksogenitet medfører, at man ikke med baggrund i denne model med Greens formulering kan konkludere at politikændringer som 21) Denne kan vises at være identisk med (13). 23