Estimation af Multifaktor Affine Rentestruktur Modeller ved Kalman Filter metoder. Morten Boelt Barslund Jens Dick-Nielsen Allan Sall Tang Andersen



Relaterede dokumenter
Et eksempel på en todimensional normalfordeling Anders Milhøj September 2006

Undervisningsnoter til øvelse i Panel Modeller. %, it. E(x kjs

Produkt og marked - matematiske og statistiske metoder

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

1. Intoduktion. Undervisningsnoter til Øvelse i Paneldata

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Center for Statistik. Multipel regression med laggede responser som forklarende variable

Økonometri 1. Den simple regressionsmodel 11. september Økonometri 1: F2

Lineære normale modeller (1) udkast. 1 Flerdimensionale stokastiske variable

Supplement til kapitel 4 Om sandsynlighedsmodeller for flere stokastiske variable

Overheads til forelæsninger, mandag 5. uge På E har vi en mængde af mulige sandsynlighedsfordelinger for X, (P θ ) θ Θ.

hvor a og b er konstanter. Ved middelværdidannelse fås videre

Module 1: Lineære modeller og lineær algebra

Introduktion til GLIMMIX

Elementær sandsynlighedsregning

Præsentation af ph.d. projekt med titlen

Matricer og lineære ligningssystemer

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Motivation. Konfidensintervaller og vurdering af usikkerhed på estimerede størrelser

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Affine rum. a 1 u 1 + a 2 u 2 + a 3 u 3 = a 1 u 1 + (1 a 1 )( u 2 + a 3. + a 3. u 3 ) 1 a 1. Da a 2

standard normalfordelingen på R 2.

Kvantitative Metoder 1 - Forår Dagens program

Note om Monte Carlo metoden

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

13 Markovprocesser med transitionssemigruppe

Elementær sandsynlighedsregning

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i.

Middelværdi og varians. Kovarians. korrelation = 0.02 korrelation = 0.7 korrelation = 1.0

Kvantitative metoder 2

Analysestrategi. Lektion 7 slides kompileret 27. oktober :24 p.1/17

Poul Thyregod, introslide.tex Specialkursus vid.stat. foraar Lad θ = θ(β) R k for β B R m med m k

Matematisk modellering og numeriske metoder. Lektion 5

Fejlforplantning. Landmålingens fejlteori - Lektion 5 - Fejlforplantning. Repetition: Varians af linear kombination. Eksempel: Vinkelberegning

Korte eller lange obligationer?

Institut for Matematiske Fag Aalborg Universitet Specielt: Var(aX) = a 2 VarX 1/40. Lad X α, X β og X γ være stokastiske variable (vinkelmålinger) med

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Mat H /05 Note 2 10/11-04 Gerd Grubb

Løsning til eksaminen d. 14. december 2009

Teoretisk Statistik, 9 marts nb. Det forventes ikke, at alt materialet dækkes d. 9. marts.

Matematisk modellering og numeriske metoder. Lektion 16

Introduktion til Statistiske Modeller for Finansielle Tidsserier. Forelæsningsnoter til Finansiel Økonometri

Økonometri 1. Dagens program. Den multiple regressionsmodel 18. september 2006

Statistiske modeller

DesignMat Uge 1 Gensyn med forårets stof

Statistik og Sandsynlighedsregning 2

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

Dagens Emner. Likelihood teori. Lineær regression (intro) p. 1/22

Kvantitative Metoder 1 - Forår 2007

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

Estimation og usikkerhed

i x-aksens retning, så fås ). Forskriften for g fås altså ved i forskriften for f at udskifte alle forekomster af x med x x 0

! Proxy variable. ! Målefejl. ! Manglende observationer. ! Dataudvælgelse. ! Ekstreme observationer. ! Eksempel: Lønrelation (på US data)

En martingalversion af CLT

Sandsynlighedsregning Oversigt over begreber og fordelinger

Program. Statistik og Sandsynlighedsregning. Eksempler. Sandsynlighedstæthed og sandsynlighedsmål

Økonometri Lektion 1 Simpel Lineær Regression 1/31

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Antag X 1, X 2,..., X n er n uafhængige stokastiske variable, hvor Var(X 1 )=σ 2 1,..., Var(X n )=σ 2 n.

FINANSIERING 1. Opgave 1

Økonometri 1. Inferens i den lineære regressionsmodel 25. september Økonometri 1: F6 1

Kvantitative Metoder 1 - Forår Dagens program

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Kvantitative Metoder 1 - Efterår Dagens program

Praktiske ting og sager: Forelæsninger tirsdag og torsdag kl i Kirkesalen, Studiestræde 38 Øvelser

Kvantitative Metoder 1 - Efterår Dagens program

22. maj Investering og finansiering Ugeseddel nr. 15. Nogle eksamensopgaver:

Taylors formel. Kapitel Klassiske sætninger i en dimension

Program. Statistik og Sandsynlighedsregning 2 Middelværdi og varians. Eksempler fra sidst. Sandsynlighedstæthed og sandsynlighedsmål

Anvendt Lineær Algebra

Anvendt Statistik Lektion 7. Simpel Lineær Regression

En martingalversion af CLT

Lineære differentialligningers karakter og lineære 1. ordens differentialligninger

Økonometri 1. Dagens program. Den simple regressionsmodel 15. september 2006

Økonometri 1. Inferens i den lineære regressionsmodel 2. oktober Økonometri 1: F8 1

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede

Statistik og Sandsynlighedsregning 2

Sandsynlighed og Statistik

Simpel Lineær Regression

Statistiske principper

Statistik og Sandsynlighedsregning 2

Preben Blæsild og Jens Ledet Jensen

Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl

Chapter 3. Modulpakke 3: Egenværdier. 3.1 Indledning

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Statistik og Sandsynlighedsregning 2

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007

Matematisk modellering og numeriske metoder

Projektopgave Observationer af stjerneskælv

Bilag 7. SFA-modellen

Den todimensionale normalfordeling

Modulpakke 3: Lineære Ligningssystemer

Landmålingens fejlteori - Lektion 5 - Fejlforplantning

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Kvantitative metoder 2

Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable

Naturvidenskabelig Bacheloruddannelse Forår 2006 Matematisk Modellering 1 Side 1

Transkript:

Estimation af Multifaktor Affine Rentestruktur Modeller ved Kalman Filter metoder Morten Boelt Barslund Jens Dick-Nielsen Allan Sall Tang Andersen 20. maj 2006

Indhold 1 Indledning 3 I Det teoretiske fundament 4 2 Multifaktor rentemodeller 5 2.1 Generel beskrivelse........................ 5 2.2 Affine rentemodeller....................... 7 2.3 Risikopræmier i affine rentemodeller............... 11 2.4 Generaliseret multi-faktor Gaussisk model........... 12 2.5 CIR-modeller........................... 14 3 State-space repræsentation af en affin rente-struktur 18 3.1 Udledning af Kalman filteret................... 19 3.2 Kalman filtrering af multifaktor Gaussisk model........ 25 3.3 Kalman filtrering af CIR-modeller................ 26 3.4 Monte Carlo simuleringer..................... 30 II Empiriske Anvendelser 32 4 Beskrivelse af data 33 5 Principal komponent analyse 34 6 Estimationsresultater i de Gaussiske modeller 37 6.1 1-faktor modellen......................... 37 6.2 2-faktor modellen......................... 38 6.3 3-faktor modellen......................... 41 1

7 Estimationsresultater i CIR-modellerne 44 7.1 1-faktor modellen......................... 44 7.2 2-faktor modellen......................... 45 7.3 3-faktor modellen......................... 47 8 Konklusion 50 2

1 Indledning Udviklingen i nulkuponrentestrukturen er et centralt element i risikostyring og prisfastsættelse af finansielle aktiver. Specielt for derivater, der direkte er afhængige af den stokastiske udvikling i de fremtidige renter, er det nødvendigt at opstille og estimere modeller for rentestrukturens udvikling over tid. De metoder vi vil bruge i denne opgave, bliver i udstrakt omfang anvendt i praksis af den finansielle sektor. Det kan fx være med henblik på at styre statens gældsporteføjle (se Danmarks Nationalbank (2006)). I denne opgave betragter vi modeller for rentestrukturen hørende indenfor den affine klasse introduceret af Duffie & Kan (1996). Denne klasse er interessant, fordi den har specielt pæne egenskaber mht. fordelinger og løsningsformer for nulkuponobligationer etc. Specifikt vil vi anvende Gaussiske (Langetieg (1980)) og CIR-multifaktor modeller (Cox et. al (1985)). I denne typer modeller er renteudviklingen drevet af en række underliggende faktorer, hvis udvikling er beskrevet ved en stokastisk differentialligning. Modellerne passer godt ind i et state-space setup, da vi har observerbare nulkuponrenter, uobserverbare underliggende faktorer og samtidig kan faktorernes fordeling relativt let diskretiseres. I forhold til den teoretiske model antager vi her, at nulkuponrenter observeres med støj som følge af fx inkomplette markeder, bid-ask spreads og asynkron notering af priser. Når vi således har modellerne på state-space form, kan vi anvende Kalman filter metoden til at drage inferens om de ukendte parametre og således også estimere de uobserverbare faktorer. Denne fremgangsmåde bliver blandt andet brugt i Lund (1997a, 1997b), de Jong (2000), Babbs & Nowman (1999) og Geyer & Pichler (1998) med flere. Fordelen ved Kalman filter metoden er, at den både tillader inddragelse af renteobservationer over tid og på tværs af løbetider. Herved undgår vi også at lave en proxy for den i praksis tvivlsomme spot-rente. Opgaven er struktureret som følger: I afsnit 2 udleder vi den generelle affine rentestrukturmodel. Desuden udleder vi fordelingsegenskaber og arbitragefri prisfastsættelse af nulkuponobligationer for multifaktor Gaussiske og CIRmodeller. I afsnit 3 beskriver vi state-space repræsentationen af de affine rentemodeller og udleder et Kalman filter til estimation af modellerne. Vi foretager også et mindre Monte Carlo studie af vores Kalman filter. Afsnit 4 og 5 beskriver data og foretager en simpel principal komponent analyse af rentestrukturens udvikling. I afsnit 6 og 7 beskriver vi estimations resultaterne i de affine rentemodeller. Endelig konkluderes der i afsnit 8. 3

Del I Det teoretiske fundament 4

2 Multifaktor rentemodeller Vi ønsker at studere den såkaldte rentestruktur, der forbinder bestemte finansielle aktiver med deres tid til udløb. Disse aktiver kaldes for nulkuponobligationer (herefter NKO) og er defineret som kontrakter, der garanterer 1 ejeren af obligationen en betaling på 1 kr. til udløbstidspunktet. Vi vælger at betegne prisen for en NKO til tidspunkt t med udløb T t med P(t, T), som trivielt tilfredsstiller P(T, T) = 1. Den tilhørende nulkuponrente y(t, T) er defineret som den rentesats, der får den diskonterede betaling på udløbstidspunktet til at være lig markedsprisen, og idet vi vælger at arbejde med kontinuert tilskrevne renter gælder der P(t, T) = e y(t,t)(t t) ln P(t, T) y(t, T) = T t (1) Hertil definerer vi rentestrukturen til tidspunkt t som funktionen T y(t, T), og i det følgende vil vi studere stokastiske modeller, der søger at forklare udviklingen i denne. 2.1 Generel beskrivelse I en generel n-faktor rentemodel antages det, at renten bliver drevet af en n- dimensional vektor proces x = (x 1,...,x n ) af tilstandsvariable defineret på sandsynlighedsfeltet (Ω, F, (F t ), P), hvor (F t ) er filtreringen genereret af en n-dimensional Brownsk bevægelse og P er det statistiske sandsynlighedsmål. En særlig form er, hvor x antages at følge Itô-processen dx t = α(x t, t)dt + β(x t, t)d z t (2) hvor z er en n-dimensional korreleret P-Brownsk bevægelse med korrelationsmatrix ρ. Her gælder det, at udfaldsrummet for processen vil være givet ved S R n, og dermed er α(x t, t) en funktion således at S R + R n. Ergo er α(x t, t) en n 1 vektor. Tilsvarende er β(x t, t) en funktion, der foretager en afbildning fra S R + til mængden af n n-matricer, og ergo er β(x t, t) en n n-matrix. 1 Ordet garanterer er i denne sammenhæng vigtigt, idet vi forudsætter, at fallit ikke forekommer. Dermed er betalingen på 1 kr. til tidspunkt T deterministisk i sandsynlighedsmæssig sammenhæng 5

En alternativ måde at skrive modellen på er dx t = α(x t, t)dt + β(x t, t) ρ 1/2 dz t = α(x t, t)dt + ˆβ(x t, t)dz t hvor ρ 1/2 er Cholesky-dekompositionen af korrelations-matricen ρ, mens z er en ukorreleret n-dimensional P-Brownsk bevægelse. Ydermere har vi benyttet omparametriseringen ˆβ(x t, t) = β(x t, t) ρ 1/2 (3) Vi ved, jf. Björk (2004), at fravær af arbitrage vil være ensbetydende med eksistensen af et ækvivalent martingal mål Q på F T 2. Til dette målskift definerer vi den Radon-Nikodym afledte på F T ved 3 { dq dp = exp 1 T } T λ(x t, t) 2 dt λ(x t, t) dz t 2 0 0 og fra Girsanov (se Björk (2004)) får vi dz t = dz Q t λ(x t, t)dt Dermed vil dynamikken for tilstandsvariablene under Q være givet ved dx t = α(x t, t)dt + ˆβ(x t, t) ( dz Q t λ(x t, t)dt ) = ( ) α(x t, t) ˆβ(x t, t)λ(x t, t) dt + ˆβ(x t, t)dz Q t (4) Ved at anvende Itô s Lemma på et handlet, afledt aktiv af renten og derefter danne en instantant risikofri portefølje, skal denne nødvendigvis give det instantant riskofrie afkast for at undgå arbitrage. Dermed får vi den partielle differentialligning (herefter PDE), der skal gælde til tidspunkt t for ethvert 2 Her er T et tidspunkt strengt større end alle betragtede T. Herved eksisterer der en likelihood proces dq dp for alle betragtede T. 3 Herved antager vi implicit at Novikov-betingelsen - dvs E P [exp ( )] T 1 λ(x t, t) 2 dt < 2 0 er opfyldt. Se fx Björk (2004) for en nærmere beskrivelse. 6

afledt aktiv P(x t, t, T) med udløb til tidspunkt T t i forhold til den underliggende proces x t som P t (x t, t, T) + P ( ) x (x t, t, T) α(x t, t) ˆβ(x t, t)λ(x t, t) + (5) ( ) 1 2 tr ˆβ(x t, t) 2 P x x (x t, t, T)ˆβ(x t, t) r(x t, t)p(x t, t, T) = 0 Bemærk at (5) er givet ud fra parametrene i (2), den stokastiske proces, der styrer tilstandsvariablene og endelig en vektor λ, der indeholder prisen på risiko (også kaldet risikopræmie). Betragter vi en NKO, er den tilhørende randbetingelse P(x T, T, T) = 1 Løsningen til (5) med denne randbetingelse bliver iflg. Feynman-Kač [ ] P(x t, t, T) = E Q P(xT, T, T) M(x t, t) M(x T, T) F t således at fravær af arbitrage er ensbetydende med, at alle prisprocesser diskonteret med numerairen M(x t, t) er martingaler under det tilhørende ækvivalente martingal mål Q. M(x t, t) følger den normale definition på bank bogen ( t ) M(x t, t) = exp r(x s, s)ds 0 Idet P(x T, T, T) = 1 kan prisen på en NKO findes som ( T ) ] P(x t, t, T) = E [exp Q r(x s, s)ds F t t (6) 2.2 Affine rentemodeller Vi vil i denne opgave fokusere på en delmængde af multifaktor rentemodeller, nemlig de såkaldte affine modeller. Affine modeller i et multifaktor setup blev introduceret af Duffie og Kan (1996), og i denne klasse er spot-renten på formen r t = δ 0 (t) + δ x t (7) 7

hvor dynamikken for x er og σ(x t ) er defineret som dx t = (ϕ κx t )dt + Γσ(x t )dz t (8) σ(x t ) = α 1 + β 1 x t... 0..... 0... α n + β n x t Her er ϕ, α, β j og δ konstante vektorer, mens δ 0 (t) er en funktion, der f.eks. kan bruges til at tilpasse den observerede rentestruktur til tidspunkt t - se fx. Hull & White (1993). Desuden er κ og Γ konstante n n matricer, og jf. reparametriseringen i (3) lader vi Γ indeholde Cholesky-dekompositionen af korrelations-matricen ρ, således at z er en ukorreleret P-Brownsk bevægelse 4. Vi vil i denne opgave kun betragte det tids-homogene tilfælde af modellerne, hvorfor vi har δ 0 (t) = δ 0. Da vi har fokus på implementationen af Kalman filteret, jf. diskussionen i afsnit 3, behøver vi kendskab til de betingede momenter af hhv. første og anden orden for tilstandsvariablene x. Indenfor den affine klasse eksisterer der lukkede udtryk for disse, som følgende udledes. Lad matrix eksponentiel funktionen være defineret som ( ) exp κt = I + i=1 1 ( i κt) (9) i! Herefter følger det af Itô s Lemma samt egenskaberne ved denne at ( ( ) ) ( ) ( ) d exp κt x t = exp κt ϕdt + exp κt Γσ(x t )dz t ( ) Integration fra t til T og multiplikation med exp κt medfører da ( ) T ( ) x T = exp κ (T t) x t + exp κ (T s) ϕds + η (t, T) (10) t 4 Duffie & Kan (1996) modellerer rentens dynamik direkte under Q og antager herved fravær af arbitrage. Da faktorernes udvikling foregår under det statistiske mål P, skal vi kende dynamikken under både P- og Q-mål. Givet vores specifikation af risikopræmie får vi samme typer af stokastiske processer under de to mål. 8

hvor η (t, T) = T t ( ) exp κ (T s) Γ σ(x t )dz s (11) Dette giver umiddelbart løsningen til (8), og da stokastiske Itô-integraler er martingaler, følger middelværdien for tilstandsvariablene af (10) (antaget κ ikke er singulær) som E [ ] ) [ ( )] x Ft T = exp ( κ (T t) x t + I exp κ (T t) κ 1 ϕ (12) Kovariansmatricen er givet som Cov [ ] [ x Ft T = E η (t, T)η (t, T) ] Ft [( T ( ) ) ( T ( ) ) ] = E exp κ (T s) Γ σ(x t )dz s exp κ (T u) Γ σ(x t )dz u F t t t [ T ( ) ( ) ] = E exp κ (T s) Γσ 2 (x s )Γ exp κ (T s) ds F t t T ( ) = exp κ (T s) ΓE [σ 2 (x s ) ] ( ) Ft Γ exp κ (T s) ds (13) hvor t E [σ 2 (x s ) ] F t = α j + β j E [ ] x s F t jj og alle andre elementer, der ikke er i diagonalen, er nul. Bemærk at udtrykket i (13) nødvendigvis skal reduceres yderligere, hvilket er gjort i hhv. afsnit 2.4 og 2.5 for de betragtede modeller i den affine klasse. Hvis risikopræmien antages at være på formen λ(x t ) = σ(x t )λ følger Q-dynamikken af (4) som ) dx t = (ϕ Γ σ(x t ) σ(x t )λ κx t dt + Γ σ(x t )dz Q t (14) Den partielle differentialligning i (5) reduceres i den affine klasse til P t (x t, t, T) + P ) x (x t, t, T) (ϕ Γσ(x t ) σ(x t )λ κx t + (15) ( ) 1 2 tr Γ 2 P σ(x t ) x x (x t, t, T)σ(x t ) Γ r(x t, t)p(x t, t, T) = 0 9

Antages det ydermere, at formen på NKO er er givet ved P(x t, t, T) = exp ( A(t, T) B(t, T) x t ) (16) bliver de relevante afledte P t (x t, t, T) = P(x t, t, T) ( A(t, T) t P x (x t, t, T) = P(x t, t, T)B(t, T) P x x (x t, t, T) = P(x t, t, T)B(t, T)B(t, T) ( ) ) B(t, T) x t Vi ser, at alle P(x t, t, T) går ud, og sammen med definitionen på renten får vi, at PDE en kan skrives om til ( ) A(t, T) B(t, T) ) x t B(t, T) (ϕ Γ σ(x t ) σ(x t )λ κx t + t t 1 ( ) 2 tr Γ σ(x t )B(t, T)B(t, T) σ(x t ) Γ δ 0 δ x t = 0 Ved udregning af matricerne får vi at ( ) tr Γ σ(x t )B(t, T)B(t, T) σ(x t ) Γ = = B(t, T) Γσ(x t ) σ(x t )λ = = t ( n n ) 2 (α i + β i x t) B j (t, T)Γ ji i=1 i=1 j=1 n (α i + β i x t ) [ Γ B(t, T) ] 2 i ( n n B j (t, T)Γ ji )(α i + β i x t)λ i i=1 j=1 n [ Γ B(t, T) ] (α i i + β i x t )λ i hvor [X] i beskriver det i te element af vektoren X, dvs. PDE en kan omskrives til ( ( ) B(t, T) n [ + λ i Γ B(t, T) ] t i β i + B(t, T) κ + 1 n 2 i=1 i=1 ( A(t, T) n [ + B(t, T) ϕ + Γ B(t, T) ] t α i iλ i + 1 n 2 i=1 10 i=1 i=1 [ Γ B(t, T) ] 2 i β i δ [ Γ B(t, T) ] 2 i α i δ 0 ) ) x t = 0

Dette løses ved, at de to parenteser er nul på samme tid, hvilket resulterer i det ordinære differentialligningssystem B(t, T) t A(t, T) t = 1 2 = 1 2 n i=1 [ Γ B(t, T) ] 2 i β i + κ B(t, T) + n i=1 n [ λ i Γ B(t, T) ] β i i δ i=1 [ Γ B(t, T) ] 2 i α i + B(t, T) ϕ n [ λ i Γ B(t, T) ] α i i + δ 0 i=1 med slutbetingelser A(T, T) = 0 og B(T, T) = 0, som nødvendigvis skal løses sekventielt. Differentialligningerne er såkaldte Ricatti-ligninger og kan generelt altid løses numerisk, hvorimod analystiske løsninger kun optræder i særlige tilfælde. Disse er fx de Gaussiske modeller samt CIR-modeller, som gennemgås i hhv. afsnit 2.4 og 2.5. 2.3 Risikopræmier i affine rentemodeller I dette afsnit gøres overvejelser angående risikopræmier indenfor klassen af affine modeller med henblik på diskussionen af de estimerede parametre i den empiriske del af denne opgave. Det følger af (7) og (8) samt brug af Itô s Lemma, at prisen på en NKO er en Itô proces med driften P t (x t, t, T) + P ) x (x t, t, T) (ϕ κx t + 1 ( ) 2 tr Γ σ(x t ) 2 P x x (x t, t, T)σ(x t ) Γ under det statistiske sandsynlighedsmål P. Fra (15) får vi, at dette skal være lig med P x (x t, t, T)Γσ(x t ) σ(x t )λ + r(x t, t)p(x t, t, T) Dermed bliver driften på det relative afkast dp P ( ) dp 1 P Drift = r(x t, t) + P P(x t, t, T) x (x t, t, T)Γσ(x t ) σ(x t )λ n [ = r(x t, t) Γ B(t, T) ] (α i i + β i x t)λ i i=1 } {{ } ( ) For en risikoavers investor må vi forvente, at ( ) er negativ. Dvs. hvis B- funktionerne er positive, vil vi forvente, at λ skal være så det samlede merafkast bliver positivt. 11

2.4 Generaliseret multi-faktor Gaussisk model I dette afsnit betragter vi en generaliseret Gaussisk model, der hører indenfor den affine klasse. Vi lader den korte rente være givet på formen r t = δ 0 + 1 x t hvor dynamikken for x t er givet ved dx t = κx t dt + Σρ 1/2 dz t (17) Her er både κ og Σ diagonale 5. Bemærk at modellen er affin, idet vi ved sammenligning med (8) har (i) δ = 1 (ii) ϕ = 0 (iii) Γ = Σρ 1/2 (iv) σ (x t ) = I Dermed følger de første 2 momenter af hhv. (12) og (13), hvorfor vi har ( ) E [x T F t ] = exp κ(t t) x t exp [ κ 1 (T t)] x 1t =. exp [ κ n (T t)] x nt og Cov [x T F t ] = = T ( exp κ(t s) t v 1,1... v 1,n..... v n,1... v n,n ) ( ) Σ ρσ exp κ (T s) ds 5 Dai & Singleton (2000) beskriver, hvornår affine rentemodeller er maksimale og identificerbare. Dette er tilfældet i den betragtede model. Selvom vores specifikation af modellen ikke er den samme som i Dai & Singleton, kan vi ved en omparametrisering vise ækvivalens mellem de to modeller, se fx Poulsen (2006). 12

hvor v i,i = B 2i (t, T)σ 2 i, i = 1,...,n v i,j = B i+j (t, T)ρσ i σ j i, j = 1,...,n, i j Ud fra de første 2 momenter fremgår det, at den har flere umiddelbart attraktive egenskaber, som tydeliggøres ved at betragte den forventede værdi af den fremtidige spot-rente r T E [r T F t ] = δ 0 + n exp [ κ j (T t) x jt ] j=1 Denne konvergerer oplagt mod det langtsigtede niveau δ 0 for T, og afvigelser i forhold til dette fremkommer ud fra hhv. valget af parametre og tilstandsvariable, som både kan antage positive og negative værdier. Det virker intuitivt at disse skulle være korrelerede, og givet ovenstående kovariansmatrix er modellen i stand til at beskrive dette. Dermed udnyttes den egenskab, at iflg. (6) og (1) kan nulkuponrenten y(t, T) for varierende løbetider dekomponeres i flere underliggende tilstandsvariable. Disse kan eksempelvis repræsentere hhv. rente-niveau og hældning på rentestrukturen. For at prisfastsætte afledte aktiver af renten skal vi kende dens Q-dynamik, som iflg. (14) bliver dx t = κx t dt + Γ ( dz Q t λ t dt ) ) = ( Γ λ t κx t dt + Γdz Q t Tilføjer vi dette med en antagelse omkring konstant risikopræmie, får vi at λ = (λ 1,...,λ n ) for alle t. Ricatti-ligningerne reduceres i den Gaussiske model til B(t, T) t A(t, T) t = κb(t, T) 1 = 1 n [ Γ B(t, T) ] 2 n 2 [ λ i i Γ B(t, T) ] + δ i 0 i=1 i=1 Da κ er diagonal, bliver løsningerne til de enkelte B-funktioner ens og er givet som B i (t, T) = 1 exp( κ i(t t)) κ i (18) 13

hvilket også er tilfældet i Vasičeks model (1977). I systemet kan den partielt omskrives til afledte A(t,T) t A(t, T) t = 1 n σi 2 2 B i(t, T) 2 i=1 n B i (t, T)σ i λ i + δ 0 i=1 n 1 n i=1 j=i+1 σ i σ j ρ ij B i (t, T)B j (t, T) Løsningen for A(t, T) følger da ved integration og ved anvendelse af randbetingelsen A(T, T) = 0 som A(t, T) = 1 2 n i=1 n 1 σ 2 i i=1 j=i+1 n i=1 ( ) (T t) 2Bi (t, T) + B 2i (t, T) + κ 2 i n ( ) Bi+j (t, T) B i (t, T) B j (t, T) + (T t) ρ ij σ i σ j + κ i κ j ( ) (T t) Bi (t, T) λ i σ i δ 0 (T t) (19) κ i Dermed bliver prisen på en NKO i modellen iflg. (16) P(x t, t, T) = exp [ A(t, T) B(t, T) x t ] således at rentestrukturen i modellen bliver ln P(t, T) y(t, T) = = A(t, T) B(t, T) x t T t T t hvor A(t, T) og B(t, T) er som angivet i hhv. (19) og (18). 2.5 CIR-modeller I deres model fra 1985 finder Cox, Ingersoll og Ross (herefter CIR) i tilfældet med logaritmisk nytte og én enkelt stokastisk faktor til at beskrive de ledige produktionsmuligheder, at den korte rente i ligevægt følger den stokastiske proces dr t = κ (θ r t ) dt + σ r t dz t (20) 14

hvor κ, θ og σ er positive konstanter 6. Ved en simpel reparametrisering kan (20) også formuleres dr t = (φ κr t )dt + σ r t dz t (21) hvor φ = κθ er en positiv konstant. I det analoge n-dimensionale tilfælde siges en model at være en n-dimensional CIR-model, hvis den korte rente kan skrives som summen af tilstandsvariablene, dvs. r t = n j=1 x jt, og tilstandsvariablene er uafhængige, hvor den enkelte tilstandsvariabel følger samme proces som i det én-dimensionale tilfælde. Dermed er dynamikken for x givet ved dx jt = (φ j κ j x jt ) dt + σ j xjt dz jt, j = 1,..., n hvor κ j, φ j og σ j er positive konstanter. Bemærk at modellen er affin idet vi ved sammenligning med (8) har (i) δ = 1 (ii) α j + β j x t = x jt (iii) Γ er diagonal med elementer σ 2 j (iv) δ 0 = 0 og ergo følger fordelingsegenskaberne af hhv. (12) og (13). Da κ er diagonal er middelværdien veldefineret og givet ved ( ) ( ( )) E [x T F t ] = exp κ (T t) x t + I exp κ (T t) κ 1 ϕ e κ 1(T t) x 1t + ( 1 e ) κ 1(T t) φ 1 κ 1 =. e κn(t t) x nt + ( 1 e κn(t t)) φ n κ n Da tilstandsvariablene er uafhængige i modellen, bliver kovarians-matricen diagonal og er givet ved T ( ) Cov [x T F t ] = exp κ (T s) ΓE [σ 2 (x s ) ] ( ) Ft Γ exp κ (T s) ds t v 1... 0 =..... 0... v n 6 I modsætning til den Gaussiske model er CIR-modellen ikke maksimal, idet κ ikke behøver at være diagonal for at modellen kan identificeres, jf. Dai og Singleton (2000). 15

hvor v j = σ2 j ( x jt e κ j (T t) e ) 2κ j(t t) + σ2 jφ j ( ) 1 e κ j (T t) 2 κ j 2κ 2 j Det følger af Cox, Ingersoll og Ross (1985), at modellen er ikke-centralt χ 2 - fordelt med de to første momenter som angivet ovenfor. Desuden har den flere umiddelbart attraktive egenskaber. For det første udviser den korte rente mean-reversion omkring det langtsigtede niveau r t = n j=1 φ j κ j. For det andet kan den ikke blive negativ (forudsat at tilstandsvariablene initielt er positive, således at processerne er veldefinerede). Desuden er volatiliteten afhængig af renten (altså er den heteroskedastisk), således at den er mindre volatil for lave niveauer end høje niveauer af den korte rente. Dette lader til at være konsistent med observerede bevægelser i den korte rente. Som angivet i afsnit 2.2 medfører arbitragefri prisfastsættelse specifikationen af en risikopræmie λ jt for hver tilstandsvariabel, som givet modellen bliver λ jt = λ j xjt σ j Hermed bliver processerne for tilstandsvariablene under det ækvivalente martingal mål Q dx jt = ( φ j κ j x jt λ jt σ j xjt ) dt + σj xjt dz Q jt = [φ j (κ j + λ j ) x jt ] dt + σ j xjt dz Q jt = (φ j ˆκx jt ) dt + σ j xjt dz Q jt hvor ˆκ j = κ j + λ j. Processen udviser også mean-reversion under Q, men både hastigheden og det langtsigtede niveau er forandret. Bemærk dog, at prisen for at anvende CIR-modellen er manglen på viden om en passende risikopræmie, da denne er implicit givet. Idet en NKO per definition udbetaler 1 kr. til tidspunkt T, bliver randbetingelsen P(x t, t, T) = 1 med generel løsning [ P(x t, t, T) = E Q e ] ÊT r(x t u,u)du F t (22) 16

Imidlertid kan vi udnytte relationen r t = n j=1 x jt og uafhængighed mellem tilstandsvariablene, hvormed (22) kan formuleres { n T ] P(x t, t, T) = E [exp Q x ju du} F t [ n = E Q exp = j=1 n E [exp Q j=1 j=1 t T { { t T t } ] x ju du F t } ] x ju du F t Da modellen er affin og tilstandsvariablene uafhængige, gælder der { T } ] E [exp Q x ju du F t = exp {A j (t, T) B j (t, T)x jt } t (23) og da alle tilstandsvariable endvidere følger en proces af samme type, skal A j (t, T) og B j (t, T) tilfredsstille det ordinære differentialligningssystem B j (t, T) t A j (t, T) t = 1 2 σ2 j B j(t, T) + ˆκ j B j (t, T) 1 = φ j B j (t, T) for j = 1,...,n. Givet initialbetingelserne A j (T, T) = B j (T, T) = 0 bliver løsningen til systemet 2 ( e γj(τ) 1 ) B j (t, T) = (γ j + ˆκ j )(e γ j(τ) 1) + 2γ j A j (t, T) = 2φ j (ln(2γ j ) + 12 (ˆκ j + γ j ) (τ) ln [ ] ) (γ j + ˆκ j )(e γj(τ) 1) + 2γ j hvor γ j = σ j ˆκ 2 j + 2σ2 j. Dermed bliver prisen på en NKO i modellen iflg. (23) P(x t, t, T) = n exp (A j (t, T) B j (t, T)x jt ) (24) j=1 således at rentestrukturen i modellen bliver n ln P(t, T) j=1 y(t, T) = = (A j(t, T) B j (t, T)x jt ) T t T t 17

3 State-space repræsentation af en affin rentestruktur State-space modellerne blev oprindeligt introduceret sammen med en filtreringsalgoritme i Kalman (1960), deraf navnet Kalman filtrering. I den generelle state-space model (se eksempelvis Hamilton (1994) eller Harvey (1990)) har man en stokastisk vektorproces (Y t ) t 0 observeret til diskrete tidspunkter. Denne proces er en funktion af en uobserverbar underliggende stokastisk vektorproces (X t ) t 0. Det antages, at den uobserverbare proces til de diskrete tidspunkter følger en vektor autoregressiv (herefter VAR) proces af første orden X tj = C + D X tj 1 + ω tj (25) Her er X tj og C vektorer af længde n 1. D er en overgangsmatrix af dimension n n, der beskriver den lineære afhængighed mellem to tidspunkter i processen. Derfor kaldes selve ligningen også for overgangsligningen (engelsk: transition eller state equation). Endelig er ω t en støjproces, der antages at være flerdimensional normalfordelt med dimension n. I vores setup er C og D tidsinvariante, men de kunne uden problemer afhænge af tiden på en deterministisk måde. Den observerbare proces afhænger af den underliggende proces på følgende måde (engelsk: measurement equation) Y tj = A + B X tj + ǫ tj her er Y tj og A m 1 vektorer og B er en m n matrix. Modellen bliver dobbelt stokastisk, idet vi antager, at også vores observationer er behæftet med støj. ǫ t er således en stokastisk vektor, der er flerdimensionalt normalfordelt af orden m. For de to normalfordelte støj processer antages det, at de har middelværdi 0 og en kovariansstruktur givet som: ] E [ǫ tj ǫ tj = H, for i = j og 0 ellers ] E [ω tj ω tj = V, for i = j og 0 ellers ] E [ω tj ǫ tj = 0, for alle i og j Her er H af dimension m m og V er af dimension n n. Støjprocesserne er altså indbyrdes uafhængige og desuden uafhængige over tid. Disse restriktioner kan også lempes uden problemer. 18

Den observerbare proces hos os er nulkuponrenternes udvikling over tid. Denne udvikling styres af de uobserverbare tilstandsvariable (engelsk: state variables), der bestemmer spot-renten. Da vi har observationer af nulkuponrenterne på ugebasis (se afsnit 4), bliver observationstidspunkterne ækvidistante t j t j 1 = t. Ydermere har vi hele tiden de samme m løbetider. Disse to simplifikationer giver os en state space fremstilling, hvor overgangsmatricerne ikke kommer til at afhænge af det præcise tidspunkt t j, men kun af tidsskridtets længde t. I den generelle affine rentestrukturmodel har nulkuponrenten til tid t med udløb til tid T iflg. afsnit 2.2 formen ln P(t, T) y(t, T) = = A(t, T) B(t, T) x t T t T t Observationsligningen for vores m nulkuponrenter bliver derfor: A(t j,t 1 ) B 1 (t j,t 1 ) B y(t j, T 1 ) T 1 t j T. = + 1 t j... n(t j,t 1 ) T 1 t j..... y(t j, T m ). A(t j,t m) T m t j B 1 (t j,t m) T m t j... B n(t j,t m) T m t j x 1 t j. x n t j Dette er den teoretiske observationsligning ud fra den affine model. Hvis vi har flere løbetider end underliggende faktorer (m > n), vil det i praksis være svært for denne ligning at holde. I vores state-space fremstilling er der derfor et extra støjled 7 med for hver løbetid. Dette støjled kommer fra, at vores nulkuponrenter er fremkommet ved en estimation til hvert tidspunkt ud fra handlede aktiver (se afsnit 4). Derved kommer der dels fejl fra selve estimationen, fra bid-ask spreads på de handlede aktiver, afrunding af priserne og asynkron notering af priserne m.v. (Lund (1997a), de Jong (2000)). Vi laver her yderligere den simplifikation, at alle målefejlene antages at være uafhængige og identisk fordelte. H matricen reduceres derved til en diagonalmatrix med ens elementer. Det virker meget rimeligt, specielt i den korte ende, mens den lange ende af nulkuponrentestrukturen er fremkommet ved en høj grad af extrapolation, og derfor er der formentlig en større usikkerhed her. 3.1 Udledning af Kalman filteret Når vi har givet et system på state-space form, ligger den primære interesse i at kunne give estimater af den underliggende proces (X t ) t 0. De første 7 Hvis den teoretiske ligning holdt i praksis ville fordelingen af fejlleddene være singulær. 19

anvendelser af et Kalman filter var i rumfarten, hvor man ud fra tilgængelige oplysninger fra en rumraket om fx fart m.v. ønskede at estimere position i rummet. I vores setup ønsker vi tilsvarende at kunne estimere de faktorer, der bestemmer dynamikken for spot-renten. Egentligt ønsker vi at kunne estimere de ukendte koefficienter i de matricer, der definerer vores statespace model, og derved identificere parametrene i vores affine modeller for rentestrukturen som beskrevet i hhv. afsnit 2.4 og 2.5. Dette problem løses dog som en sidegevinst udfra Kalman filtreringen, idet likelihood-ligningen for de ukendte parametre fremkommer som et biprodukt af filtreringerne. Vi indfører filtreringen frembragt af observationerne til og med t j som F tj = σ { Y t1,...,y tj } 8 for 1 j N, hvor N er antallet af observationstidspunkter. Vi lader X tj t i betegne forventningen til X tj givet filtreringen F ti. Dvs. X tj t i = E [ X tj F ti ] og vi lader P tj t i være kovariansmatricen for X tj t i dvs. P tj t i = E [ (Xtj X t j t i )( Xtj X tj t i ) ] Vi kalder X tj t i et forecast når j > i og en filtrering 9 når i = j. Filtreringen er altså en opdateret inferens omkring den underliggende variabel. State-space formen betyder, at X tj kan skrives som en linearkombination af startværdien X t0 og fejlledene mellem tid t 1 og t j, hvilket fremkommer ved at benytte vores antagelse om ækvidistante tidspunkter ) X tj = C + D X tj 1 + ω tj = C + D (C + D X tj 2 + ω tj 1 + ω tj ) = (I + D +... + D j 1 C + ω tj + Dω tj 1 +... + D j 1 ω t1 + DX t0 Det bemærkes, at der skal gælde nogle regularitetsbetingelser på vores C og D matricer, for at processen er stationær. Disse vil vi dog ikke komme nærmere ind på her. Vi vil antage, at startpunktet for processen er kendt på forhånd, således at både X t0 t 0 = X t0 og P t0 t 0 er faste 10 og uafhængige af støjprocesserne. P t0 t 0 er et udtryk for usikkerheden på startgættet af initialværdien for processen. Hvis processen er kovariansstationær, kunne man 8 Bemærk at denne filtrering ikke er ækvivalent med F t hørende til P og Q. Denne indeholder information om de sande realisationer af den uobserverbare vektorproces, hvilket ikke er tilfældet for F tj. Dermed er X tj ikke F tj -målelig. 9 For i < j kaldes det smoothing. Rekursionerne til smoothing findes fx i Harvey (1990) 10 Da vores tidserie er relativ lang, bliver vores startgæt ikke af afgørende betydning. 20

passende benytte den ubetingede middelværdi og kovarians. Når vi således har kendte startværdier er fordelingen af X tj t i igen en flerdimensional normalfordeling. Forecastet af den underliggende proces findes som X tj t j 1 = E [ ] [ ] X tj F tj 1 = E C + DX tj 1 + ω Ftj 1 tj ] = E [C + DX Ftj 1 tj 1 + E [ ] ω Ftj 1 tj ] = C + E [DX Ftj 1 tj 1 = C + DX tj 1 t j 1 og kovariansen på denne [ (Xtj P tj t j 1 = E X )( ) ] t j t Xtj j 1 X tj t j 1 [ ( ) ] = E C + DX + ω tj 1 t X j t j t j 1 )(C + DX tj 1 + ω tj X tj tj 1 [ ( = E D ( X X ) )( tj 1 t j 1 t j 1 + ωtj D ( ) ) ] X tj 1 X tj 1 t j 1 + ωtj [ = DE (Xtj 1 X )( t j 1 t X ) ] ] Xtj 1 j 1 t j 1 t j 1 D + E [ω tj ω tj = D P tj 1 t j 1 D + V hvor vi i fjerde lighedstegn har brugt, at ω tj er uafhængig af fortiden. Forecastene er altså rekursivt bestemt af de filtrerede værdier. For at finde de filtrerede værdier definerer vi innovationen som = Y tj E [ ] ] Y Ftj 1 tj = Y tj E [A + BX tj + ǫ Ftj 1 tj v tj = Y tj A B E [ X tj + ǫ tj Ftj 1 ] = Y tj A BX tj t j 1 Innovationen er igen flerdimensionalt normalfordelt med dimension m og middelværdi E [ v tj ] = E [ Y tj E [ Y tj Ftj 1 ]] = E [ Y tj ] E [ E [ Y tj Ftj 1 ]] = 0 og kovariansmatrix givet som )(Y tj A B X tj tj 1 ) ] F tj = E [ ( Y tj A B X t j t j 1 )(A + B X tj + ǫ tj A B X tj tj 1 ) ] [ ( = E A + B X + ǫ tj t A B X j t j t j 1 [ (Xtj = BE X )( ) ] ] t j t Xtj j 1 X tj t j 1 B + E [ǫ tj ǫ tj = B P tj t j 1 B + H 21

hvor vi igen har brugt, at støjleddet er uafhængig af fortiden. Den betingede kovariansmatrix mellem innovationsprocessen og den underliggende proces, der begge er flerdimensionalt normalfordelte, findes som [ (Xtj E X ) ( t j t j 1 Y tj E [ ]) ] Y Ftj 1 tj [ (Xtj = E X ) ( t j t j 1 B ( ) ) ] X tj X tj t j 1 + ǫtj [ (Xtj = E X )( ) [ t j t Xtj j 1 X tj t j 1 B ] (Xtj + E X ) ] t j t j 1 ǫ tj = P tj t j 1 B Men det betyder, at fordelingen af den underliggende proces og innovationsprocessen betinget med F tj 1 kan skrives som ( ) ( ( ) ( )) Xtj F v N Xtj t P tj t j 1 P tj t j 1 tj 1, B j 1 tj 0 B P tj t j 1 F tj Den filtrerede værdi af den underliggende proces er forventningen til den første delvektor af denne flerdimensionale normalfordeling betinget med den anden del X tj t j = E [ X tj Ftj ] = E [ Xtj Ftj 1, v tj ] Før vi kan finde et udtryk for denne, har vi brug for en linearkombination af de to delvektorer, der er uafhængig af den sidste delvektor. Vi vil altså finde en ikke-singulær matrix C af dimension n m, der opfylder (følger Anderson (2003)) U 1 = X tj + Cv tj, og U 2 = v tj hvor [ (U E 1 E [ U 1])( U 2 E [ U 2]) ] F t j = 0 Vi kan nu bestemme C som [ (U E 1 E [ U 1])( U 2 E [ U 2]) ] F t j [ ( ]) = E X + C v E (vtj tj tj [X tj + C v tj E [ ] ]) v tj F tj [ (Xtj = E E [ ])( X tj vtj E [ ] ]) v tj + C v tj v t j F tj = P tj t j 1 B + C F tj 22

hvilket giver C = P tj t j 1 B F 1 t j Vi har i andet lighedstegn ovenfor benyttet, at forventningen til innovationen betinget med filtreringen til tid t j 1 er 0. Forventningen til vores linearkombination af de to delvektorer findes som E [ U 1 Ftj 1 ] = E [ X tj + C v tj Ftj 1 ] = X tj t j 1 og kovariansmatricen for U 1 [ (U E 1 E [ U 1]) ( U 1 E [ U 1]) ] F t j 1 [ ( ]) ( ]) ] = E X + C v E tj tj [X tj + C v tj X tj + C v tj E [X tj + C v tj F tj 1 = E[ (Xtj E [ X tj ]) ( Xtj E [ X tj ]) + C ( vtj E [ v tj ])( vtj E [ v tj ]) C + ( X tj E [ X tj ])( vtj E [ v tj ]) C + C ( v tj E [ v tj ]) ( Xtj E [ X tj ]) F tj ] = P tj t j 1 + C F tj C + P tj t j 1 B C + C B P tj t j 1 ( ) = P tj t j 1 + P tj t j 1 B F 1 t j F tj P tj t j 1 B F 1 t j P tj t j 1 B F 1 t j B P tj t j 1 P tj t j 1 B ( P tj t j 1 B F 1 t j ) = P tj t j 1 P tj t j 1 B F 1 t j B P tj t j 1 Σ ( ) ( ) 1 hvor vi i sidste lighedstegn har brugt, at F 1 t j = F t j = F 1 t j, idet F tj er en kovariansmatrix. Da en linearkombination af normalfordelinger igen er normalfordelt, bliver U 1 og U 2 flerdimensionalt normalfordelte med fordeling givet som ( U 1 U 2 ) F tj 1 N ( ( Xtj t j 1 0 ) ( Σ 0, 0 F t Tætheden for de oprindelige delvektorer kan vi finde ved, at transforme tilbage igen. Dette gøres blot ved at sætte U 1 = X tj + C v tj og U 2 = v tj ind igen, idet vi bemærker, at Jacobi-matricen for transformationen har determinant 1 I P tj t j 1 B F 1 t j 0 I 23 = 1 ))

Tætheden er altså givet som f ( ) X tj, v tj 1 F tj 1 = (2π) n/2 Σ { exp 1 ( ) X tj + C v tj X tj t 2 j 1 Σ 1 { 1 (2π) m/2 F tj exp 1 } 2 v t j F 1 t j v tj (X tj + C v tj X tj tj 1 ) } Det er nu nemt at se, at den betingede fordeling af X tj givet v tj er det første led i produktet ovenfor, idet vi finder den betingede fordeling ved at dele ovenstående tæthed med tætheden for v tj, og sidste led altså forsvinder ud, dvs. f ( ) X Ftj 1 1 tj, v tj = (2π) n/2 Σ { exp 1 ( ) ) X tj + C v tj X tj t 2 j 1 Σ 1 (X } tj + C v tj X tj tj 1 Den betingede fordeling er dermed en n-dimensional normalfordeling med middelværdi E [ X tj Ftj 1, v tj ] = C vtj + X tj t j 1 = X tj t j 1 P tj t j 1 B F 1 t j v tj og kovariansmatrix Cov [ X tj Ftj 1, v tj ] = Σ = P tj t j 1 P tj t j 1 B F 1 t j B P tj t j 1 Det er netop disse to størrelser, vi tidligere har defineret som hhv. X tj t j og P tj t j, altså vores filtrerede værdi af den underliggende proces og kovariansmatricen på dette estimat. Vi har her udledt Kalman filter rekursionerne ved brug af normalfordelingens egenskaber. Vi kunne på helt tilsvarende vis have udledt de samme filterligninger ved hjælp af lineære projektioner ind på underrummet udspændt af F tj (se Harvey (1990)). Dermed ville middelværdioperatoren være projektionen og kovariansmatricen bliver til en mean squared error (MSE). I dette tilfælde bliver Kalman filteret optimalt indenfor klassen af forecasts, der er lineær i de observerede værdier. Hvis begge fejlledene derimod er flerdimensionalt normalfordelte som ovenfor, bliver forecastet optimalt b- landt alle funktioner på underrummet udspændt af F tj, fordi lineærprojektion og betinget forventning er ækvivalente i det normalfordelte tilfælde. 24

Da forecastene altså blot er linearkombinationer af den observerede vektorproces, bliver også innovationerne normalfordelte, som vi har set tidligere. Dette gør det nemt at opstille en likehoodfunktion baseret på disse. Dette kaldes prediction error decomposition eller innovations form of the likelihood function. Idet vi lader Θ betegne vektoren af de ukendte parametre, vi vil drage inferens omkring, bliver loglikelihoodfunktionen (pånær et konstantled) l(θ F tn ) = N l i (Θ N F ti ) = ln F tj (Θ) + v ti (Θ) F tj (Θ) 1 v ti (Θ) i=1 i=1 Størrelserne i likelihoodfunktionen bliver beregnet, idet man gennemløber Kalman rekursionerne fra tid t 1 til t N. Herefter kan vi bruge almindelig maksimum likelihood estimation til at finde Θ ˆΘ = arg max Θ l(θ FtN ) Vi bruger en quasi-newton metode til at maksimere likelihoodfunktionen numerisk. Alternativt kan man udregne eksakte afledte af likelihoodfunktionen og benytte en almindelig Newton-Raphson metode. Desuden findes forskellige andre metoder til at gøre de rekursive beregninger af likelihooden hurtigere (se Harvey (1990)). Specielt er determinanten og den inverse af F tj tidskrævende. Shumway og Stoffer (1982, 2000) foreslår alternativt en manglede data -tilgang, hvor man maksimerer likelihoodfunktionen ved hjælp af en EM-algoritme. 3.2 Kalman filtrering af multifaktor Gaussisk model Den diskrete tidsdynamik for en multifaktor Gaussisk model, der udgør vores underliggende vektorproces i state-space formuleringen, følger af afsnit 2.4. Herved får vi, at diskrettidsfordelingen er en VAR(1) proces med normalfordelte fejlled og dermed bliver overgangsligningen (25) i state-space formuleringen til X tj = D X tj 1 + ω tj hvor exp [ κ 1 t]... 0 D =..... 0... exp [ κ n t] 25

og kovarians-matricen for ω tj er som udledt i afsnit 2.4. Da vi, som tidligere nævnt, har et fast tidsskridt mellem observationerne bliver koefficientmatricerne tidsinvariante. Algoritmen bliver 1. Vælg X t0 t 0 og P t0 t 0. Udregn koefficientmatricerne A, B, C, D, V og H til state-space ligningerne for givne parametre Θ. 2. Lav forecast og find kovariansen på dette X tj t j 1 P tj t j 1 = C + D X tj 1 t j 1 = D P tj 1 t j 1 D + V 3. Udregn innovationen og dennes kovarians v tj F tj = Y tj A B X tj t j 1 = B P tj t j 1 B + H 4. Find det j te led i loglikelihooden l j = log F tj v tj F 1 t j v tj 5. Opdater estimatet på den underliggende proces, dvs. lav filtreringen X tj t j P tj t j = X tj t j 1 P tj t j 1 B F 1 t j v tj = P tj t j 1 P tj t j 1 B F 1 t j B P tj t j 1 6. For j < N gå tilbage til punkt 2. For j = N find loglikelihoodfunktionen ved at summere bidragene fra punkt 4. 3.3 Kalman filtrering af CIR-modeller Baseret på udledningen af de 2 første betingede momenter i CIR-modeller i afsnit 2.5, kan vi skrive den diskrete overgangsligning for den underliggende proces i state-space formuleringen som VAR(1) processen X tj = C + D X tj 1 + ω tj 26

hvor C = ( 1 e κ 1 t ) φ 1 κ 1. ( 1 e κ n t ) φ n κ n exp ( κ 1 t)... 0 D =..... 0... exp ( κ n t) og kovarians-matricen for ω tj er som angivet i afsnit 2.5. Dette bryder dog med Kalman filteret, som vi har udledt det, idet dynamikken nu ikke er Gaussisk i den underliggende vektorproces, og fordi kovariansmatricen kommer til at afhænge rekursivt af værdien af processen selv. Det er muligt at implementere eksakte filterligninger for ikke-gaussiske fordelinger og derved få den eksakte likelihoodfunktion (se Harvey (1990), side 162-165 eller Lund (1997b)), men det kræver numerisk integration at kunne håndtere dem her, og det vil være meget tidskrævende i flerdimensionale tilfælde. Vi vil i stedet bruge en approksimativ Gaussisk quasi maksimum likelihood metode baseret på det lineære Kalman filter vi udledte ovenfor (Duan og Simonato (1995), Chen og Scott (1995), Lund (1997a og 1997b), Geyer og Pichler (1999), de Jong (2000) og andre). Ideen i quasi maksimum likelihood (herefter QML) metoden er at bruge en overgangsligning for den underliggende proces i det lineære Kalman filter, hvor vi skifter den eksakte fordeling ud med en normalfordeling. Den nye normalfordeling vælges således, at vi matcher det første og andet betinget moment med dem fra den eksakte fordeling. Vi modificerer Kalman filteret i yderligere to henseender 1. Den betingede kovarians i CIR-modellen afhænger af den realiserede værdi af den underliggende proces X tj 1. Da den er uobserverbar og ikke indeholdt i F tj 1, benytter vi i stedet den filtrerede værdi af processen X tj t j når vi beregner kovariansen. Denne modificering af det lineære Kalman filter kaldes for det udvidede Kalman filter (Extended Kalman Filter) (se Harvey (1990), side 160-162). 2. Multifaktor CIR-modellen er opbygget af kvadratrodsprocesser, der ikke tillader, at værdierne for tilstandsvariablene bliver negative. Det lineære filter tager ikke højde for dette når estimaterne af processen opdateres, og for at kompensere for dette erstatter vi negative værdier 27

med et 0. Dette gøres for at undgå en kovariansmatrix, der kunne være negativ definit. I de tilfælde, hvor vi bliver nødt til at erstatte negative værdier af den underliggende proces med 0, bliver vores forecast ikke optimalt i projektionsforstanden. Det er ikke muligt ex ante at kontrollere, om filteret vil være lineært optimalt. Men dette kan kontrolleres ex post, når rekursionerne gennemløbes. En tilstrækkelig betingelse for at QML metoden for betingede heteroskedastiske modeller (som her) giver konsistente estimater, er ifølge Bollerslev og Wooldrigde (1992), at det første og andet betinget moment for fejlen på forecastet en periode frem er korrekt specificeret. Dette gør sig imidlertid ikke gældende i vores tilfælde E [ v tj F tj 1 ] ] = E [Y tj A B X tj tj 1 F tj 1 ] [A + B X tj + ǫ Ftj 1 tj = E = B ( E [ X tj Ftj 1 ] Xtj t j 1 ) 0 ] E [A + B X Ftj 1 tj tj 1 Her følger andet lighedstegn, idet forecastet X tj t j 1 er F tj 1 målelig. Forskellig fra -relationen kommer fra, at vi i det lineære Kalman filter bruger en lineær projektion som vores forecast, og når fordelingen ikke er Gaussisk, er dette ikke nødvendigvis det samme som den betingede forventning. Selvom vores Kalman filter ikke giver konsistente estimater, giver det stadig et optimalt forecast indenfor klassen af lineære estimater af X tj. Lund (1997a) viser, hvordan man ved at bruge den ubetingede kovarians for den underliggende proces i Kalman filteret kan få asymptotisk konsistente estimater ud fra QML-metoden. Men et Monte Carlo studie for en endelig tidshorisont, giver faktisk større bias med end uden korrektionen af kovariansen. Det er uklart hvorvidt dette kan generaliseres, men vi vælger på linje med bla. D- uan og Simonato (1995) ikke at bruge korrektionen. I de tilfælde, hvor det beskrevne bias ikke er alt for stort, ved vi også, at QML giver asymptotisk normalfordelte estimater ( ) L1 N ˆΘN Θ N (0, Σ( ˆΘ) ) for N hvor Σ( ˆΘ) = H( ˆΘ) 1 1 G( ˆΘ)H( ˆΘ) 28

og H( ˆΘ) = G( ˆΘ) = N 2 l tj (Θ) Θ Θ N ( ltj (Θ) Θ j=1 j=1 Θ= ˆΘ Θ= ˆΘ ) ( ltj (Θ) Θ Θ= ˆΘ Jf. Hamilton (1994, side 389) er denne angivelse en metode til korrekt at estimere kovariansmatricen, når der anvendes QML. Algoritmen bliver 1. Vælg X t0 t 0 og P t0 t 0. Udregn koefficientmatricerne A, B, C, D og H til state-space ligningerne for givne parametre Θ. 2. Udregn den betingede kovariansmatrix for den underliggende proces V tj ved at benytte X tj t j i stedet for den ukendte realisering af processen X tj. 3. Lav forecast og find kovariansen på dette ) X tj t j 1 = C + D X tj 1 t j 1 P tj t j 1 = D P tj 1 t j 1 D + V tj 4. Udregn innovationen og dennes kovarians v tj F tj = Y tj A B X tj t j 1 = B P tj t j 1 B + H 5. Find det j te led i loglikelihooden l j = ln F tj v tj F 1 t j v tj 6. Opdater estimatet på den underliggende proces, dvs. lav filtreringen og erstat med 0, hvis den filtrerede værdi bliver negativ: ( ) X tj t j = max X tj t j 1 P tj t j 1 B F 1 t j v tj, 0 P tj t j = P tj t j 1 P tj t j 1 B F 1 t j B P tj t j 1 7. For j < N gå tilbage til punkt 2. For j = N find loglikelihoodfunktionen ved at summere bidragene fra punkt 5. 29

3.4 Monte Carlo simuleringer Da vi ved, at vores Kalman filter algoritme kun er approksimativt quasi optimalt, laver vi her et mindre Monte Carlo studie af vores implementerede algoritmer. Det gør vi for at undersøge bias og stabilitet af de estimater, vi finder ud fra datasæt med en endelig tidshorisont. Monte Carlo studiet for en given rentemodel sker efter følgende fremgangsmåde 1. Vi simulerer de underliggende faktorer til 500 tidspunkter, og vi lader afstanden mellem hver observation være en uge. Dette gør vi, da vores rigtige datasæt netop består af 532 observationer med ugentligt frekvens. 2. Ved hjælp af den givne parametre simulerer vi de underliggende faktorer. Selve simuleringen af faktorerne foretages efter et Euler skema, hvor vi bruger 50 tidsskridt mellem hver ugentlig observation. 3. Når vi har faktorerne danner vi den teoretiske rentekurve og vælger 10 nulkuponrenter ud. Vi bruger de samme løbetider, som vi har i vores rigtige datasæt, dvs. 1 mdr, 3 mdr, 1, 2, 3, 5, 7, 10, 15, 30 år. 4. Målefejlene på de enkelte nulkuponrenter simuleres fra uafhængige normalfordelinger med middelværdi 0 og samme varians. 5. Det simulerede datasæt består nu af nulkuponrenterne til de 10 faste løbetider inklusiv individuelle målefejl observeret til 500 tidspunkter. Derefter det relevante Kalman filter til estimation. 6. Punkt 1-5 gentages 500 gange. Som startgæt på parameterestimaterne i Kalman filter algoritmen, bruger vi de samme paramterværdier, som vi faktisk simulerede rentestrukturen med. Vi Monte Carlo simulerer både for hhv. 1-3 faktor Gaussiske og CIR-modeller. Resultaterne ses i Tabel 9-14. I de Gaussiske modeller er der ikke noget specielt stort bias. Der er dog en tendens til at både bias og standardafvigelserne bliver større, når antallet af faktorer øges. Det er naturligt, at standardafvigelsen stiger, da vi på den samme størrelse datasæt forsøger at estimere flere parametre. Som hos Lund (1997b) er der mest usikkerhed på risikopræmien og middelniveauet for renten. Det skyldes primært, at disse to parametre er korrelerede. 30

I CIR-modellerne lader der til at være samme billede som for de Gaussiske modeller, men bias stiger mere ved tilføjelse af flere faktorer. Specielt er estimaterne fra 3-faktor modellen behæftet med større usikkerhed end de øvrige modeller. Dette er samme tendens, som findes i Geyer & Pichler (1998). 31

Del II Empiriske Anvendelser 32

4 Beskrivelse af data Som bekendt er forudsætningen for eksistensen af en kontinuert rentestruktur til tidspunkt t, at priser på NKO er eksisterer kontinuert for tidspunkter T t. Dette er oplagt ikke tilfældet, men Kalman filteret er dog fleksibelt nok til at overkomme dette problem. Et andet umiddelbart problem er, NKO er i Danmark kun bliver udstedt med løbetider på maksimalt et år, og heraf bliver der kun handlet 4 på samme tid - vi har altså ikke umiddelbart nogen tilgængelig information omkring f.eks. det 30-årige punkt på rentestrukturen. Dette problem løses ved i stedet at anvende de observerede par-renter for (rente)swaps af forskellige løbetider fra Nordea Analytics kombineret med en udvidet Nelson-Siegel estimationsmetode, jf. Svensson (1995) Rente (%) 3.0 3.5 4.0 0 5 10 15 20 25 30 T t Figur 1: Observerede rentesatser per 28. februar 2006 samt estimeret rentestruktur. Dette er gjort i perioden 3. januar 1996 til 8. marts 2006 med ugentlig frekvens om onsdagen for at undgå manglende observationer og ugedageseffekter, jf. Lund (1997a). Vi har valgt par-renter med 1 og 3 mdr. samt 1, 2, 33

3, 5, 7, 10, 15 og 30 års restløbetider. Dette resulterer i 532 dagsobservationer og til hver af disse 10 observerede rentesatser. Når man ser på udviklingen i nulkuponrenterne, dels over tid og på tværs af løbetider, ser man en meget stærk indbyrdes afhængighed. I tabel 1 kan vi se, at korrelationerne mellem løbetiderne er ekstremt store. Korrelationen måler graden af lineær afhængighed mellem renterne, og vi kan altså se, at renteændringer i høj grad følges ad, endog ved et lineært mønster. Hvis vi ser på autokorrelationerne for løbetiderne, jf. tabel 2, ser vi igen en stærk afhængighed mellem renteniveauet den ene uge og den foregående uge. Da autokorrelationerne er positive, betyder det, at niveauerne ikke svinger voldsomt ud fra uge til uge, men at store niveauskift sker over længere tidsperioder. Det er netop disse stærke afhængigheder, der er en af hovedmotivationerne for at forsøge at opstille modeller for rentestrukturen som et hele. 5 Principal komponent analyse Vi vil her foretage en principal komponent analyse (se fx Anderson (2003)) af korrelationsmatricen for at få et mindre antal faktorer til at beskrive de mest almindelige ændringer i rentestrukturen på tværs af løbetiderne. Vi finder her på linje med Litterman & Scheinkman (1991), at 3 faktorer står for langt den største del af ændringerne 11. De beskriver tilsammen 99.5 procent af variationen. Den første faktor, der i figur 2 er afbildet med sort, står alene for hele 83.6 procent af variationen. Et skift i denne faktor svarer til, at rentestrukturen parallelforskydes. Der er en svag tendens til, at den korte ende svinger lidt mere end den lange ende. Den anden faktor, som er afbildet som den røde linje, står for 14.4 procent af variationen. En ændring i denne faktor får den korte ende med løbetider op til 4 år til at forskydes modsat af den lange ende af rentestrukturen med løbetider over de 4 år. Endelig er der den tredje faktor, som kun står for 1.5 procent af variationen, men som stadig er vigtig, hvis man vil lave et godt hedge mod renteændringer. En stigning i den tredje faktor vil få renten for løbetiderne mellem cirka 1 år og 10 år til at stige, mens de resterende løbetider vil falde. Det er de helt korte og de helt lange løbetider, der vil falde mest, mens det på den anden side er løbetider omkring 2-3 år, der vil stige mest. Ved et fald i denne faktor vil ændringerne i renten selvfølgelig være de modsatte. 11 Litterman & Scheinkman (1991) dekomponener kovariansmatricen, mens vi dekomponerer korrelationsmatricen. De to metoder er ikke ækvivalente, men giver resultater, der er meget lig hinanden. 34

35 1 mdr. 3 mdr. 1 år 2 år 3 år 5 år 7 år 10 år 15 år 30 år 1 mdr. 1.000 3 mdr. 0.994 1.000 1 år 0.942 0.971 1.000 2 år 0.886 0.921 0.982 1.000 3 år 0.830 0.866 0.942 0.987 1.000 5 år 0.731 0.765 0.851 0.928 0.974 1.000 7 år 0.655 0.686 0.774 0.865 0.931 0.989 1.000 10 år 0.578 0.605 0.692 0.793 0.874 0.959 0.990 1.000 15 år 0.509 0.532 0.617 0.723 0.814 0.918 0.964 0.991 1.000 30 år 0.453 0.473 0.555 0.661 0.753 0.863 0.914 0.951 0.980 1.000 Tabel 1: Korrelationer på tværs af de enkelte løbetider i datasættet.

Løbetid Middelværdi Std.afv AC(1) AC(5) AC(10) AC(20) 1 mdr. 0.0354 0.0106 0.9914 0.9673 0.9358 0.8437 3 mdr. 0.0358 0.0105 0.9952 0.9747 0.9450 0.8586 1 år 0.0377 0.0107 0.9957 0.9747 0.9412 0.8568 2 år 0.0407 0.0105 0.9947 0.9697 0.9316 0.8452 3 år 0.0434 0.0105 0.9944 0.9685 0.9304 0.8457 5 år 0.0477 0.0109 0.9949 0.9723 0.9414 0.8692 7 år 0.0510 0.0113 0.9954 0.9759 0.9511 0.8908 10 år 0.0547 0.0118 0.9959 0.9795 0.9599 0.9113 15 år 0.0583 0.0124 0.9942 0.9803 0.9633 0.9237 30 år 0.0622 0.0139 0.9675 0.9565 0.9351 0.9008 Tabel 2: Middelværdier, standard afvigelser og autokorrelationer for de enkelte løbetider i datasættet. Factor loading 0.4 0.2 0.0 0.2 0.4 0.6 Faktor 1 Faktor 2 Faktor 3 0 5 10 15 20 25 30 Restløbetid Figur 2: Factor loadings for de 3 faktorer fremkommet via principal komponent analyse. 36

Vores dekomponering af rentestrukturens korrelationsmatrix er meget lig med Litterman & Scheinkman, de 3 faktorer vi finder er næsten identiske med dem, der findes for den amerikanske statskurve. Vi kan tolke vores faktorer hhv. som ændringer i rentekurvens niveau, stejlhed og krumning. Faktor 2 og 3 bliver altså en ændring i den første og anden afledte af rentekurven. I klassiske hedgestrategier er det kun den første faktor, man kan sikre sig overfor. Hvis man laver varighedsimmunisering af sin obligationsportefølje er man netop sikret mod parallelforskydninger af rentestrukturen. Men som vi kan se på vores 2 andre faktorer er dette bestemt ikke nok til at sikre porteføljen. Der findes dog ikke tilsvarende let tilgængelige nøgletal, der beskriver en porteføljes følsomhed overfor de to sidste faktorer. Litterman & Scheinkman viser, hvordan man alligevel godt kan bruge sin viden om de primære skift i rentestrukturen til at foretage et hedge af sin portefølje. 6 Estimationsresultater i de Gaussiske modeller Vi vil i dette afsnit beskrive estimationsresulaterne i de multifaktor Gaussiske modeller. Vi har implementeret Kalman filteret beskrevet i afsnit 3.2 i R. Som beskrevet i afsnit 3 har vi benyttet en quasi-newton metode, dvs. alle afledte er udregnet vha. endelig differens metoder. Vores generelle erfaring er, at den Gaussiske model konvergerer så snart en rimelig start vektor Θ 0 er valgt. Dog har det langtsigtede renteniveau δ 0 en tendens til at antage høje værdier, i enkelte tilfælde værdier svarende til langsigtsrenteniveauet er på 75 %. Som konsekvens af dette begrænsede vi parameteren δ 0 til mere plausible værdier, ca. 10 %. Dette resulterede i pænere parameter estimater og højere likelihood værdier, dog blev standard afvigelsen på parametren også større. Dette indikerer, at likelihood en har flere lokale maksima. 6.1 1-faktor modellen I tabel 3 er de estimerede parametre i den 1-faktor Gaussiske model vist. Vi ser, at parameteren, der beskriver mean-reversion hastigheden, κ er insignifikant. Det lave estimat beskriver således, at mean-reversionen i modellen sker langsomt, dvs. faktoren i modellen bevarer effekter i renteudviklingen i lang tid og beskriver herved det generelle niveau for renten. Hvis κ var lig 0 37