Fordelinger for realiseret volatilitet for aktieafkast



Relaterede dokumenter
Konfidensintervaller og Hypotesetest

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Analysestrategi. Lektion 7 slides kompileret 27. oktober :24 p.1/17

Tema. Dagens tema: Indfør centrale statistiske begreber.

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning

Appendiks Økonometrisk teori... II

Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model

Out-of-sample forecast samt reestimation af ADAMs lønligning

Økonometri: Lektion 4. Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

1. Intoduktion. Undervisningsnoter til Øvelse i Paneldata

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet

Module 4: Ensidig variansanalyse

Økonometri 1. Inferens i den lineære regressionsmodel 2. oktober Økonometri 1: F8 1

PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006

Reestimation af importrelationer

Center for Statistik. Multipel regression med laggede responser som forklarende variable

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Betydningen af konjunktur og regelændringer for udviklingen i sygedagpengemodtagere

Stokastiske stød til ADAMs adfærdsrelationer

1 Regressionsproblemet 2

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved

Normalfordelingen og Stikprøvefordelinger

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning

Kvantitative Metoder 1 - Forår 2007

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Appendiks 1. Tabel A1 Likviditetskrav for de analyserede handelsstrategier

Kvantitative Metoder 1 - Forår 2007

Produkt og marked - matematiske og statistiske metoder

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Et eksempel på en todimensional normalfordeling Anders Milhøj September 2006

Løsning til eksaminen d. 14. december 2009

Statistik for ankomstprocesser

Note om Monte Carlo metoden

Løsning eksamen d. 15. december 2008

1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable

To samhørende variable

Note til styrkefunktionen

Introduktion til Statistiske Modeller for Finansielle Tidsserier. Forelæsningsnoter til Finansiel Økonometri

En Introduktion til SAS. Kapitel 5.

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Schweynoch, Se eventuelt

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

Fokus på Forsyning. Datagrundlag og metode

Økonometri 1. Den simple regressionsmodel 11. september Økonometri 1: F2

Faktor- og konjunkturanalyse af efterspørgselskomponenter

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

Matematik A. Studentereksamen. Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet

Løsning til eksaminen d. 29. maj 2009

Indblik i statistik - for samfundsvidenskab

Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ 2 -test og Goodness of Fit test.

Statistiske modeller

Stokastiske processer og køteori

1 Hb SS Hb Sβ Hb SC = , (s = )

Undervisningsnoter til øvelse i Panel Modeller. %, it. E(x kjs

Kræver generelt at diverse ventetider er eksponentialfordelte. Faste rammer for serverdiscipliner mv. Svært at modellere ikke-standard køsystemer.

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

Appendiks A Anvendte test statistikker

Uddybende beregninger til Produktivitetskommissionen

Statistik Lektion 17 Multipel Lineær Regression

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

Kvantitative metoder 2

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...

Kapitel 7 Forskelle mellem centraltendenser

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Eksempel på logistisk vækst med TI-Nspire CAS

Bilag 7. SFA-modellen

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Bilag 12 Regressionsanalysens tabeller og forklaringer

Simpel Lineær Regression

Matematisk modellering og numeriske metoder. Lektion 1

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Kvantitative Metoder 1 - Forår Dagens program

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/

Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable

4 Oversigt over kapitel 4

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Personlig stemmeafgivning

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1)

Perspektiver i Matematik-Økonomi: Linær regression

Matematisk modellering og numeriske metoder

University of Copenhagen. Notat om statistisk inferens Larsen, Martin Vinæs. Publication date: Document Version Peer-review version

Teoretisk Statistik, 9 marts nb. Det forventes ikke, at alt materialet dækkes d. 9. marts.

Kapitel 4 Sandsynlighed og statistiske modeller

Deskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium

Estimation af bilkøbsrelationen med nye indkomst- og formueudtryk

Dagens Emner. Likelihood teori. Lineær regression (intro) p. 1/22

2 -test. Fordelingen er særdeles kompleks at beskrive med matematiske formler. 2 -test blev opfundet af Pearson omkring år 1900.

5.11 Middelværdi og varians Kugler Ydelse for byg [Obligatorisk opgave 2, 2005]... 14

02402 Vejledende løsninger til Splus-opgaverne fra hele kurset

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Transkript:

Cand. Merc. Finansiering Investigations of Securities Markets Opgaveløsere Per H. Frederiksen 3. semester Mads Overgaard Vejleder Carsten Tanggaard Fordelinger for realiseret volatilitet for aktieafkast - eksemplificeret gennem Novo Nordisk og Tele Danmark Handelshøjskolen i Århus 2002

Indholdsfortegnelse 1. Indledning...1 1.1. Problemformulering... 1 2. Teorien bag det realiserede volatilitetsmål...2 2.1. Den generelle afkast-proces... 2 2.2. Kvadratisk variation og kovariation... 4 2.3. Data... 6 2.3.1. Praktiske forhold... 7 2.4. Generering og estimation af de realiserede volatilitets- og kovariationsmål... 8 3. Afkasts- og volatilitetsfordelinger...9 3.1. Afkast... 9 3.1.1. ARCH og GARCH modeller... 10 3.1.2. Standardisering med realiserede standardafvigelser... 12 3.2. Varianser og logaritmiske standardafvigelser... 15 3.3. Kovarians og Korrelation... 17 4. Betingede volatilitetsfordelinger...19 4.1. Logaritmiske standardafvigelser... 19 4.1.1. Enhedsrødder i volatilitetsserierne... 20 4.1.2. Hyperbolsk henfald i SACF... 22 4.2. Korrelationen... 23 5. Langtidshukommelse i de logaritmiske volatilitetstidsserier...24 5.1. Modellering af long-memory processer... 25 5.2. The frequency Domain Spektralanalysen... 26 5.2.1. Teorien bag spektralanalysen... 27 5.2.2. De empiriske resultater af periodogram-regressionen... 29 6. Asymmetrisk volatilitets-respons...32 6.1 Asymmetrisk respons i de logaritmiske standardafvigelser... 35 7. Konklusion...36 Litteraturliste...38 Appendiks A. SAS-kode til estimation af fraktionel integration...40 Appendiks B. GAUSS-kode til generering af den fraktionel differensede serie...41

1. Indledning Estimering af volatiliteten på finansielle afkast er relevant for en lang række formål. Det er blandt andet centralt for prisfastsættelse af aktiver, for beslutninger omkring aktivallokering og til styring af finansiel risiko. Mange økonometriske modeller antager i denne sammenhæng et konstant variansestimat over tid, selvom det tværtimod er den generelle opfattelse, at volatiliteten varierer betydeligt over tid. Denne anerkendelse har i den senere tids finansiering fostret en bred vifte af undersøgelser indenfor de fordelingsmæssige og dynamiske egenskaber for volatilitet. Indtil nu har de fleste empiriske resultater været bygget på ARCH/GARCH- og stokastisk volatilitetsmodeller for de underliggende afkast, eller på implicitte volatilitetsmodeller fra optionsteorien. Dog afhænger disse volatilitetsmål af specifikke fordelingsmæssige antagelser, hvilke indskrænker anvendeligheden. En alternativ indgangsvinkel til modellering af volatiliteten blev fremsat af blandt andet French (1987), hvor kvadrerede afkast over en relevant horisont giver et modelfrit og unbiased estimat på den realiserede ex post varians. Denne tilgangsvinkel er igen i 2001 taget op til revision, hvor Andersen, Bollerslev, Diebold og Ebens har undersøgt den tidsvarierende volatiliteten for DJIA aktier. På baggrund af den nylige udvikling indenfor volatilitetsmodellering tager denne opgave udgangspunkt i to forholdsvis nye artikler, der estimerer realiseret volatilitet på baggrund af 5-minutters afkast. Andersen, Bollerslev, Diebold og Labys (ABDL (2000)) udledte teorien bag estimationsmetoden og anvendte den til at estimere volatilitet på valutakurser. Andersen, Bollerslev, Diebold og Ebens (ABDE (2001)) anvendte videre den præsenterede metode til at estimere volatilitet på aktie afkast på 30 meget likvide DJIA aktier. 1.1. Problemformulering Formålet med denne opgave er at anvende den præsenterede metode på danske aktier. To hovedpunkter udspringer af dette 1. At finde en metode til at estimere de daglige realiserede varianser. 2. At undersøge i hvilket omfang, estimaterne for de danske aktier har de samme egenskaber som estimaterne for de amerikanske aktier. Først vil den bagvedliggende teori for generering af realiseret volatilitet blive præsenteret. Til trods for at selve estimeringen af de daglige realiserede varianser har været en tidskrævende del af pro- 1

jektet, vil der i denne opgave kun kort blive præsenteret den anvendte metode samt få praktiske problemer forbundet hermed. I stedet bruges den resterende del af opgaven på at gennemføre de samme analyser som ABDE (2001) og sammenligne resultaterne derfra med resultaterne for de danske aktier. Herunder vil afkastfordelingerne yderligere blive analyseret gennem GARCH-modeller for at sammenligne resultatet af denne meget udbredte metode med den nye metode foreslået af ABDE (2001). Udover en analyse af de ubetingede fordelinger for standardiseret afkast, log-volatilitet og korrelation vil også de betingede fordelinger for log-volatilitet og korrelation blive analyseret. Herunder skal det undersøges, om serierne er stationære, og om der er lang hukommelse i dem. Hvis der er lang hukommelse i serierne vil fraktionelle integrationsparametre blive estimeret, og endelig vil de fraktionelt differensede serier blive anvendt til at undersøge, om der forefindes asymmetrisk volatilitets respons. 2. Teorien bag det realiserede volatilitetsmål I dette afsnit klarlægges teorien for de kommende volatilitets- og kovarians mål. Da aktieafkast, og derved den sande latente volatilitet, i princippet kan estimeres over arbitrere små tidsintervaller, hvis aktien er tilstrækkelig likvid, vil fundamentet for målene være baseret på kontinuert tids finansiering. Derfor modelleres afkast-processen som en standard Ito-proces, hvori volatilitetsstrukturen kan approksimeres gennem anvendelse af høj frekvente transaktionsdata. 2.1. Den generelle afkast-proces Der betragtes et marked, hvor den generelle usikkerhed er defineret ved et filtreret sandsynlighedsrum (Ω, F, F t, P), hvor Ω er udfaldsrummet (de mulige markedstilstande), P er det objektive sandsynlighedsmål baseret på dette udfaldsrum, F repræsenterer det sæt af begivenheder, der implicit ligger til grund for den forudgående information, og F t = {F t : 0 t T max } er den naturlige filtrering, hvilken karakteriseres ved en voksende funktion over tid, der beskriver al tilgængelig information på det udvalgte tidspunkt. Det antages, at den usikkerhed, der påvirker udviklingen i de enkelte aktier, kan beskrives ved følgende generelle Ito-proces 1 : dp = u( p, tdt ) + Σ( p, td ) w t t t udt + Σdw t (2.1) 1 Denne kaldes også en stokastisk differentialligning (SDE). 2

hvor p t er den logaritmiske n-dimensionale pris-vektor. Af ovenstående ses, at den infinitisimale ændring i prisen består af et deterministisk driftled udt plus et stokastisk støjled Σdw, hvor Σ karakteriserer den (n x n) dimensionale positive definitte diffusionsmatrice, og w er en n-dimensional vektor af uafhængige standard wiener-processer (brownske bevægelser), hvilke genererer de stokastiske stød fra usikkerheden i markedet. Idet regneregler for stokastiske differentialer 2 benyttes, kan wienerprocessen i (2.1) vises at have følgende egenskaber: [ ] [ ] E dw = lim E z( t+ dt) z( t) = 0 dt 0 [ ] [ ] 2 Var dw = lim E zt ( + dt) zt ( ) = dt dt 0 (2.2) (2.3) Det vil sige at dw ~ N(0, dt). Gennem (2.2) og (2.3) kan det vises, at den forventede værdi til den infinitisimale ændring i prisen er: [ ] [ ] [ ] [ ] E[ dp ] = E udt+ Σdw = E udt + E Σdw = E udt = u dt (2.4) t hvorfor variansen på processen kan udledes som: dp t = E dp t E dp t dp t E dp ( )( ( t) ) Var [ ] ( ) = E dt + d dt dt d dt ( u Σ w u )( u + Σ w u ) = E ( d )( d ) = E[ d d ] dt Σ w Σ w Σ w wσ = ΣΣ (2.5) Da den stokastiske differentialligning (2.1) er en forkortet form af det stokastiske integrale, kan afkastet fra t-1 til t opskrives som: 2 Se Cochrane (2001), s. 489 for stokastiske regneregler som dz 2 = dt. 3

t ( τ ) τ ( τ) r (t) = p (t) p (t 1) = u d + Σ d w ( τ ) (2.6) t 1 t 1 t hvilket i øvrigt også betegnes en martingale repræsentation. 3 Hvis tidsperioden mellem de observerede priser normaliseres til h = 1, hvilket repræsenterer en handelsdag, er fordelingen for dagsafkastet betinget på den realiserede sti for µ t og Σ t : 4 h {, } ~N (, ) h h τ τ τdτ τ τd = r σ µ Σ µ Σ τ t+ h, h t+ t+ 0 0 t+ 0 t+ (2.7) h { t τ, t τ} τ 0 hvor µ Σ er det udfaldsrum, der genereres af udviklingen i µ t og Σ t for 0 τ h. Som σ + + = det fremgår af (2.7) giver den integrerede diffusionsmatrice derfor en naturligt mål for den sande h- periode volatilitet. 2.2. Kvadratisk variation og kovariation Generelt gælder det for semimartingale processer, at den kvadratiske variation og kovariation er defineret ved: ( ) 2 Qvar pj = pj 2 pjdpj ( ) (2.8a) j k = j k j j k p k (2.8b) Qcov p, p p p p dp p d hvor p j er den logaritmiske pris for aktie j. Disse mål er i kontinuert tid, hvorfor en diskretisering af (2.8a) og (2.8b) er nødvendig i vores tilfælde, hvor observationerne falder diskret. Ifølge ABDL (2000) kan der opstilles følgende sammenhæng: + 0 n= t/ 2 ( j) + ( j i j i ) = ( ) lim Q var 0 p p var i 1, p, 1 Q p = t j (2.9a) + 0 ( ) ( n= t/ ( j k) + ( ji ji )( ki ki ) = t j k) (2.9b) lim Q cov 0 p, p p cov, i 1, p, 1 p, p, 1 Q p p = 3 Se ABDL (2000). 4 Se ABDE (2001) samt ABDL (2000) for yderligere forklaring. 4

hvor afkastet r p p j, i j, i j, i 1, og der summeres over n intervaller fra tidspunkt 0 til t. Dette bevirker, at for infinitisimale tidsændringer kan den kvadratiske variation og kovariation til tidspunkt t findes ved en grænseværdibetragtning af summen af den kvadratiske variation og kovariation til tidspunkt 0 plus de infinitisimale kvadrerede ændringer i prisen fra tidspunkt 0 til t. Hvis ovenstående processer samtidig følger den generelle Ito-proces (2.1) kan den kvadratiske horisont variation henholdsvis kovariation, over intervallet [t,t+h], beskrives ved ændring heri således at: t+ h 2 ( ) + ( ) ( ) ( ) Qvar p Qvar p Qvar p = σ τ dτ (2.10a) ht, j t h j t j t j t+ h ( ) + ( ) ( ) ( ) ( ) Qcovh, t p j, pk Qcovt h p j, pk Qcovt p j, pk = σ j τ σk τ dτ (2.10b) t Af ovenstående er det blevet klart, at det kun er nødvendigt at fokusere på ændringerne i den kvadratiske variation for at finde et mål for den sande varians henholdsvis kovarians. Hvis vi jf. ABDE (2001) definerer horisont variansen henholdsvis kovariansen for afkastene som følger: V ar h / 2 jht,, i= 1 jt, + i = r (2.11a) h / Cov = r r (2.11b) jk, h, t i= 1 j, t+ i k, t+ i kan det vises, at (2.11) er gående i sandsynlighed mod (2.10) for gående mod nul. Ved at indsætte (2.9) i (2.10) fås for variansen (resultatet for kovariansen udledes tilsvarende): ( ) = + ( ) ( ) Qvar p Qvar p Qvar p ht, j t h j t j ( ) ( ) ( )/ 2 / 2 lim Q var p t + h r Q 0 1, var p t r h / r 2 = j + + ji 0 j + 1 ji, = jt i 0 i= i= i 1, + (2.12) = Heraf følger det intuitivt, at tidsserien for den daglige varians indeholder følgende egenskab: 5

h / t+ h 2 2 rjt, + i σ j( τ) dτ for i= 1 + t 0 0 (2.13a) hvor σ 2 j refererer til den individuelle varians på aktie j. Af (2.13a) kan ses, at for hver dag summeres h/ kvadrerede afkast, hvilket approksimativt giver et estimat på den sande varians. Endvidere konvergerer differensen næsten sikkert for alle t når afkast-frekvensen stiger eller som skrevet i (2.13a) når tiden mellem de observerede afkast,, mindskes. For at (2.13a) antageligvis skal holde er det derfor nødvendigt med højfrekvente transaktionsafkast, da vi ellers får meget støjede estimater. Dette postulat skal ses i lyset af (2.5) hvorfra vi ved, at hvis samplingsfrekvensen tilnærmelsesvis er kontinuert vil driftledets påvirkning af variansmålet være negligibelt. På samme måde kan tidsserien for den daglige kovarians mellem aktie j og k approksimeres ved kryds-produkter af de højfrekvente afkast således at: h / t+ h + rjt, + i rkt, + i σ j( τ) σk( τ) dτ 0 for 0 (2.13b) i= 1 t konvergere næsten sikker for alle t, hvor σ j og σ k henviser til den sande volatilitet for henholdsvis aktie j og k. 2.3. Data Til den empiriske analyse har vi udvalgt 2 forholdsvis likvide aktier på Københavns Fondsbørs. Disse aktier benævnes forholdsvis likvide, da de ikke tilnærmelsesvis er ligeså likvide som amerikanske aktier. De undersøgte aktier er Novo Nordisk (NOVO) samt Tele Danmark (TDC). Vores stikprøve af højfrekvente transaktionsdata går fra januar 1995 til medio juni 1999, hvilket i alt giver os 1.114 daglige afkast for hver aktie. Dog står vi med det problem, at aktierne ikke altid handles indenfor korte tidsintervaller, hvorfor vi havde valget mellem ikke at overholde de teoretiske approksimationer i (2.12a) og (2.12b) eller at generere kunstige 5-minutters afkast. Her er sidste metode valgt, hvorved vi i perioder, hvor aktien ikke blev handlet, har sat 5-minutters afkastet lig 0. Vi har imidlertid overvejet at anvende lineær interpolation mellem de observerede priser, hvorved alle 6

afkast ville blive forskellige fra 0. 5 Dog bibringer denne metode med positiv autokorrelation i intradag afkastene, hvilket vi ikke er interesseret i. Samtidig skal det fremhæves, at grundet markedets struktur har de højfrekvente priser tendens til at anløbe markedet i klumper, hvilket sammen med andre mikrostruktur-effekter kan påvirke fordelingsegenskaberne for intra-dag afkastene. Disse effekter forsøges mindsket inden afkastene anvendes til variansestimation, hvilket forklares senere. 2.3.1. Praktiske forhold Genereringen af de ikke-filtrerede 5-minutters afkast er foretaget i Excel, hvor handelskursen samt handelstidspunktet, for et år af gangen, er indlæst. I Excel er handelstidspunktet lavet om ved hjælp af datofunktionerne, så der i stedet for dato oprettes handelsdagsnummer. Med dette oprettes en tidsvariabel, der kan læses som et tal, som 10.000*dagsnummer + 100*time + minut + 0,01*sekund. Hernæst oprettes en kolonne med de tidspunkter, hvorpå en kurs ønskes aflæst. 2. januar (første handelsdag) klokken 09.05 får eksempelvis værdien 10905,00. Til at aflæse kursen anvendes funktionen LOPSLAG, der leder efter den ønskede værdi i en kolonne, hvis denne ikke findes i kolonnen læses den største værdi, der er mindre end den ønskede værdi. Formlen returnerer den kurs, der står ud for det ønskede tidspunkt, hvilket således bliver kursen på 5-minutters mærket, eller den seneste kurs før 5-minutters mærket. I datasættet fandtes handler udenfor åbningstid, hvilke vi blokerede før opslagsfunktionen blev anvendt. I tilfælde af, at der ikke forelå handler mellem åbning og klokken 09.05 på en dag, ville opslaget enten have taget den sidste kurs fra dagen før, hvilket således kunne have været efter lukketid, eller en kurs fra om morgenen før åbningstid. Ved at gennemføre den nævnte blokering vil den opslåede kurs klokken 09.05 i stedet blive den sidste kurs indenfor åbningstid den foregående dag, det vil sige klokken 17.00 eller så tæt derpå, dog under, som muligt. Det synes mest rimeligt at definere et dagsafkast som lukkekursen dagen før til lukkekursen på dagen. Dagsafkastet er derfor beregnet som lukkekursen klokken 17.00 den pågældende dag i forhold til lukkekursen klokken 17.00 den foregående dag. For at være konsistent med dette, er 5-minutters afkastene defineret, så det første 5-minutters afkast på en dag bliver fra lukkekursen klokken 17.00 5 Lineær interpolation mellem kurserne giver mindre estimater på den daglige volatilitet, end hvis vi antager nul-afkast. Eksempelvis hvis aktien kun handles én gang på 10 minutter, og kurserne hhv. var 200 og 210, vil lineær interpolation bibringe med 11,9% til variansen, i modsætning til 23,8% hvis afkastet blev sat til 0. 7

den foregående dag til kursen klokken 09.05 den pågældende dag. Det sidste 5-minutters afkast bliver således fra klokken 16.55 til klokken 17.00. Det skal bemærkes, at for at anvende notationen fra ABDE (2001) betyder dette, at lukkekursen på dag t kaldes p t+1, således at dagsafkastet på dag t bliver r t = p t+1 p t. Efter disse mere metodemæssige overvejelser har vi genereret 96 5-minutters afkast for hver dag i stikprøven, hvilket svarer til 106.944 observationer for hver aktie. Derudover har vi genreret 1.114 dagsafkast for hver aktie, hvilke i det følgende benævnes r j,t. 2.4. Generering og estimation af de realiserede volatilitets- og kovariationsmål 5-minutters afkastserierne er genereret på baggrund af (100 gange) differencen mellem de logaritmiske priser observeret ved eller lige før 5-minutters mærket. På denne måde er hver handelsdag opdelt i 96 5-minutters-intervaller, hvorimellem der er beregnet et afkast. Som nævnt er aktierne ikke så likvide, at de kontinuerlig handles hvert femte minut, hvorfor afkastet er sat til 0 for disse observationer. Selvom resultatet af (2.5) i teorien medfører uafhængighed med driften i afkastprocessen fra (2.1), kan anvendelsen af et diskret og fast, systematisk tidsinterval mellem observationerne påvirke vores variansestimater. For at rense vores estimater for den negative autokorrelation introduceret af den ujævne tidsafstand mellem de observerede priser, samt de indlejrede bid-ask-effekter, MA(1)-filtrerer vi vores to afkastserier inden disse anvendes til varians- og kovariansberegning jf. ABDE (2001): Tabel 2.1. MA(1)-identifikation af 5-minuttters afkastene Variabel Koefficient Std. Afv. t-stat P-værdi NOVO C 0.000894 0.000859 1.040026 0.2983 MA(1) -0.340219 0.002876-118.3154 0.0000 TDC C 0.000791 0.001088 0.726544 0.4675 MA(1) -0.283588 0.002932-96.70820 0.0000 Som det fremgår af tabellen er de estimerede MA-koefficienter negative, hvilket også er konsistent med den spuriøse afhængighed, der introduceres gennem asynkron-handel og bid-ask-effekter. De filtrerede afkastserier benævnes r t+,, for at skelne dem fra de ufiltrerede dagsafkast, og det er disse der ligger til grund for den videre variansberegning. 8

Varians- og kovariansserierne kan efterfølgende estimeres ved at summere de kvadrerede rensede 5- minutters afkast, hvor h i forhold til (2.11) er sat til 1, hvilket repræsenterer en handelsdag, som følgende:, 1/ 2 1/ jt, = r i 1 jt, + i, jkt, = r i 1 jt, + i, r = = kt, + i var cov (2.13) hvor t = 1,2,3,., 1.114, hvilket er antallet af handelsdage, og er 1/96, hvilket kendetegner tidsintervallet mellem de observerede afkast. Hvis standardafvigelsesserierne benævnes henholdsvis v j og v k er det intuitivt at generere en korrelationsserie som corr, cov, / v, v, hvilken samtidig analyseres i det efterfølgende. jkt jkt jt kt, 3. Afkasts- og volatilitetsfordelinger I dette kapitel præsenteres de empiriske resultater for afkast og volatilitet. Resultaterne for NOVO og TDC sammenholdes med resultaterne for de 30 DJIA aktier i ABDE (2001). 3.1. Afkast De ufiltrerede dagsafkast, benævnt r j,t, der blot er beregnet som 100 gange forskellen på de logaritmiske kurser umiddelbart inden lukketid på to på hinanden følgende dage, er illustreret som histogrammer i figur 3.1. Figur 3.1. Afkast for NOVO og TDC, r NOVO,t og r TDC,t 400 400 300 300 200 200 100 100 0-12 -10-8 -6-4 -2 0 2 4 6 8 0-12 -10-8 -6-4 -2 0 2 4 6 8 10 12 9

Som forventet er disse afkast langt fra normalfordelte. Der ligger forholdsvis mange observationer omkring nul, og enkelte på op til ±12 procent. Fordelingerne har hvad der ofte kaldes tykke haler, og som illustreret senere i tabel 3.2. betyder dette, at fordelingerne er leptokurtiske, det vil sige de har en kurtosis over 3. Derudover er begge fordelinger venstreskæve, da de har negative skewness mål. Dette overrasker måske lidt i forhold til ABDE (2001), der fandt at langt hovedparten af afkastserierne var højreskæve. 3.1.1. ARCH og GARCH modeller En efterhånden meget udbredt metode til at håndtere sådanne afkastfordelinger er at modellere variansen som en ARCH- eller GARCH-proces 6. Det er vist for en lang række tidsserier, at tykke haler kan skyldes volatilitetsklumpninger, da store udsving henholdsvis små udsving ofte følger hinanden. Ved at lade volatiliteten på tidspunkt t afhænge af fejl og eventuelt også volatilitet på tidspunkter før t, kan man således få pænere afkastfordelinger. Det illustreres med line graphs i følgende figur, at der tyder på at være volatilitetsklumpninger i begge serier. Figur 3.2. Line graphs for r NOVO,t og r TDC,t 10 15 5 10 0 5 0-5 -5-10 -10-15 200 400 600 800 1000-15 200 400 600 800 1000 Inden der estimers ARCH- og GARCH-modeller for de to serier, undersøges deres tidsserieegenskaber for at kunne tage højde for eventuelle afhængigheder i afkastene. Et korrelogram for NOVO viser signifikant første ordens autokorrelation. Det kan ikke pr. øjemål vurderes, hvorvidt en AR(1)- eller en MA(1)-proces synes at passe bedst, så forskellige modeller må estimeres. For TDC 6 Se f.eks. Bera & Higgins (1993) 10

er der ingen signifikante autokorrelationer. Som illustreret i tabel 3.1. findes følgende modeller at passe bedst, vurderet ud fra Schwarz-kriteriet 7. Tabel 3.1. GARCH-modeller for dagsafkast for NOVO og TDC NOVO Koefficient Std. Afv. z-stat P-værdi C 0.136262 0.038895 3.503362 0.0005 MA(1) 0.096394 0.034451 2.798024 0.0051 Variance Equation C 0.057845 0.012061 4.796213 0.0000 ARCH(1) 0.149383 0.017067 8.752801 0.0000 GARCH(1) 0.839295 0.014922 56.24738 0.0000 TDC Koefficient Std. Afv. z-stat P-værdi Variance Equation C 0.071323 0.011382 6.266398 0.0000 ARCH(1) 0.085318 0.007466 11.42729 0.0000 GARCH(1) 0.901354 0.007241 124.4721 0.0000 For NOVO modelleres afkastet som en MA(1)-proces med konstant og variansen som en GARCH(1,1) proces, hvilket ønskes at give følgende egenskaber (fodtegnet NOVO er underforstået for resten af parametrene og er blot udeladt for at lette notationen) r µ ε θ ε r ε r µ θ ε r N σ (3.1a) 2 NOVO, t = + t 1 t 1 NOVO, t = t = NOVO, t + 1 t 1, NOVO, t ~ (0, t ) σ = α0 + αε 1 1+ βσ 1 z, = r, / σ ~ N(0,1) (3.1b) 2 2 2 t t t NOVO t NOVO t t For TDC anvendes hverken konstant, AR- eller MA-led til afkastet, mens variansen også her modellers som en GARCH(1,1) proces. Således ønskes følgende egenskaber (fodtegn TDC kun anvendt for afkast og standardiseret residual) 7 Ifølge Greene (2000) s. 306 har dette kriterium ingen åbenlys fordel frem for Akaike. Dog straffer Schwarz hårdere for tabet af frihedsgrader, hvilket kan give sig udslag i en simplere model. Scwartz-kriteriet er ifølge Carsten Tanggard at foretrække i store stikprøver. 11

r = r =ε r N σ (3.2a) 2 TDC, t TDC, t t, TDC, t ~ (0, t ) σ = α0 + αε 1 1+ βσ 1 z, = r, / σ ~ N(0,1) (3.2b) 2 2 2 t t t TDC t TDC t t Begge serier beskrives bedst ved GARCH(1,1)-modellen præsenteret af Bollerslev i 1986. Fordelen ved denne er, at den i stedet for en ARCH-model med mange lags af de kvadrerede fejl opsamler disse i selve variansen fra tidspunkt t-1. På denne måde fås en mere parsimonius estimation, da færre parametre skal estimeres, hvilket belønnes af Schwarz-kriteriet. Begge standardiserede residualer skulle gerne følge en standardnormalfordeling, hvis al volatilitetsklumpning er modelleret. Følgende histogrammer med tilhørende beskrivende mål viser, at dette ikke et tilfældet, men at kurtosis dog er nedbragt i forhold til de rene afkastserier. Figur 3.3. Standardiserede residualer for GARCH modellerne, z NOVO,t og z TDC,t 300 400 250 200 300 150 200 100 50 100 0-4 -2 0 2 4 6 Mean -0.015039 Skewness 0.232188 Std. Dev. 1.000246 Kurtosis 5.841041 0-6 -4-2 0 2 4 6 Mean 0.040733 Skewness -0.233463 Std. Dev. 0.999139 Kurtosis 7.386294 3.1.2. Standardisering med realiserede standardafvigelser I stedet for at standardisere med en volatilitet fra en GARCH-model, hvilket som vist ovenfor ikke giver normalfordelte afkast for hverken NOVO eller TDC, standardiseres afkastene nu med de realiserede standardafvigelser estimeret på baggrund af de filtrerede 5-minutters afkast, som foreslået i ABDE (2001). Dette benævnes r j,t /v j,t, og de ustandardiserede og standardiserede afkast sammenlignes i tabel 3.2. 12

Tabel 3.2. Beskrivende mål for r NOVO,t, r TDC,t, r NOVO,t /v NOVO,t og r TDC,t /v TDC,t Afkast r j,t Std.afk. r j,t /v j,t Aktie Mean St.dev. Skew. Kurt. Mean St.dev. Skew. Kurt. NOVO 0,0857 1,5567-0,4596 9,0599 0,0307 0,3875-0,1136 3,0203 TDC 0,0759 1,9271-0,1396 8,9580 0,0066 0,4049-0,1723 3,2932 De standardiserede afkast har en betydelig lavere kurtosis, bemærkelsesværdigt er NOVO s kun marginalt større end 3. TDC s kurtosis er også kraftigt reduceret, og selv om den er på lidt over normalfordelingens kurtosis på 3, er resultatet sammenlignet med ABDE (2001) ikke ekstremt. Det svarer omtrent til deres 75% fraktil. Med hensyn til skævheden opfører NOVO sig igen pænest, da denne bliver reduceret til under en tredjedel, mens TDC s faktisk stiger (numerisk) en anelse. For at illustrere de standardiserede afkast anvendes kernel-tætheder. Problemet med at illustrere normalfordelte observationer med histogrammer er, at illustrationen bliver et direkte resultat af, hvilke intervaller observationerne klassificeres i. Normalfordelingen er kontinuer mens histogrammet tvinger en diskretisering ned over observationerne. Kernel-tæthedsestimation fitter en jævn kurve ved at estimere en smoothing parameter, kaldet h 8. Tæthedsfunktionen estimeres som: N 1 x X i f ( x) = K (3.3) Nh i= 1 h Hvor N er antal observationer og K er kernel-funktionen. For NOVO blev h estimeret til 0,0857 og for TDC blev h estimeret til 0,0890. 8 Jf. Silverman (1986). 13

Figur 3.4. Fordelinger for de standardiserede afkast for NOVO og TDC 1.2 1.2 1.0 1.0 0.8 0.8 0.6 0.6 0.4 0.4 0.2 0.2 0.0-1.5-1.0-0.5 0.0 0.5 1.0 0.0-1.5-1.0-0.5 0.0 0.5 1.0 Det er på øjemål svært at fastlægge, om fordelingerne for NOVO og TDC følger en normalfordeling, hvorfor vi har valgt at analysere dette nærmere. Som det kan observeres, har vi undladt at fratrække de respektive gennemsnit og dividere med de respektive standardafvigelser, hvorfor fordelingerne ikke kan sammenlignes med standardnormalfordelingen. Målet med ovenstående figurer er at illustrere fordelingerne for observationernes faktiske værdier fremfor at kunne sammenligne med fordelingerne fra blandt andet GARCH-modellerne. For at teste om fordelingerne er normalfordelte anvendes Jarque-Bera (JB) testeren: N k 2 1 2 JB = S + ( K 3) (3.4) 6 4 hvor N er antal observationer, S er skewness, K er kurtosis og k er antal estimerede koefficienter anvendt til at estimere serien. JB følger en χ 2 fordeling med 2 frihedsgrader. I tabel 3.3 vises kun JBtestet for de standardiserede afkast, da nulhypoteserne for de ustandardiserede afkast naturligvis blev meget kraftigt forkastet. Tabel 3.3. Jarque-Bera test for om de standardiserede afkast er normalfordelte Aktie Jarque-Bera P-værdi NOVO 3,020281 0,299052 TDC 9,500713 0,008649 14

Nulhypotesen, om at NOVO s standardiserede afkast følger en normalfordeling, fastholdes altså med en p-værdi på knap 0,3. Hypotesen for TDC forkastes dog med en p-værdi på 0,0086, men generelt må det konkluderes, at disse resultater er i overensstemmelse med resultaterne fra ABDE (2001). 3.2. Varianser og logaritmiske standardafvigelser De realiserede daglige varianser er som beskrevet beregnet på baggrund af de kvadrerede 5- minutters filtrerede afkast. De logaritmiske standardafvigelser er beregnet som ( ) 2 ln v it,. Beskrivende mål for disse er illustreret i tabel 3.4. Tabel 3.4. Beskrivende mål for v 2 NOVO,t, v 2 TDC,t, lv NOVO,t og lv TDC,t Realiseret varians v 2 jt, Realiseret log-standardafvigelse lv j,t Aktie Mean St.dev. Skew. Kurt. Mean St.dev. Skew. Kurt. NOVO 17,4073 34,7639 10,1804 165,7888 1,0747 0,5764 0,1539 2,9822 TDC 23,6937 46,3669 9,0721 120,2040 1,3015 0,4685 0,6951 3,9535 Det bemærkes at de realiserede daglige varianser er forholdsvis høje. For NOVO er den gennemsnitlige varians 17,4, hvilket med traditionel skalering svarer til en årlig standardafvigelse på ca. 17,4 250 66%. Den tilsvarende årlige standardafvigelse for TDC er helt oppe på ca. 77%. Disse estimater er over dobbelt så store som en skalering af standardafvigelserne på de ufiltrerede daglige afkast i tabel 3.2, hvilket giver resultater på ca. 24,5% ( ) 1,56 250 og 30,5% (. Forklaringen herpå skyldes den store intradagvolatilitet, som et variansmål estimeret på de daglige observationer ikke opfanger. 1,93 250 ) Begge varianser har desuden ret store standardafvigelser og er meget højreskæve. Der er altså stor spredning på de daglige varianser, og begge serier indeholder få ret store observationer på flere hundrede procent. Dette kunne indikere, at der er problemer med at anvende 5-minutters metoden på dataene, og de følgende resultater ville muligvis forbedres, hvis de få ekstremer udelades. Dette gøres dog ikke, da formålet netop er at undersøge, hvor godt metoden præsenteret i ABDE (2001) virker på danske data. Det skal dog bemærkes, at det ikke var forventet, at varianserne er normal- 15

fordelte. Skævheden og topstejlheden er ikke ekstrem sammenlignet med tabel 2 i ABDE (2001), hvor de ligger mellem 75 og 90 procent fraktilerne. De logaritmiske standardafvigelser opfører sig imidlertid betydelig pænere. Gennemsnit og standardafvigelse på de daglige realiserede logaritmiske standafvigelser er stadig høje, men både skævheden og topstejlheden er blevet væsentligt reduceret. Faktisk er kurtosis for NOVO akkurat under 3, og det ses af figur 3.5, at fordelingen for NOVO ligner en normalfordeling. Figur 3.5. Fordelinger for de logaritmiske standardafvigelser for NOVO og TDC 0.8 1.0 0.6 0.8 0.6 0.4 0.4 0.2 0.2 0.0 0 1 2 3 0.0 0 1 2 3 Igen er der anvendt kernel-tætheder, for NOVO er smoothing parameteren h estimeret til 0,1275, og for TDC er h estimeret til 0,0962. Det fremgår af både tabel 3.4 og figur 3.5 at TDC s logaritmiske standardafvigelse er højreskæv og leptokurtisk, men sammenholdt med tabel 2 i ABDE (2001) er dette ikke ekstremt. Som for de standardiserede afkast testes normalfordelingshypotesen med et Jarque-Bera test. Kun de logaritmiske standardafvigelser er testet. Tabel 3.5. Jarque-Bera test for om de logaritmiske standardafvigelser er normalfordelte Aktie Jarque-Bera P-værdi NOVO 4,410760 0,110209 TDC 131,9013 0 Ret bemærkelsesværdigt fastholdes nulhypotesen for NOVO. ABDE har ikke foretaget lignende tests, men beregnes JB for deres 30 DJIA aktier udfra tabel B2 i appendix til ABDE (2001), fremgår det, at nulhypotesen kun fastholdes for én aktie, nemlig CHV. Observatorværdien for TDC er sam- 16

menholdt med disse 30 aktier ikke ekstrem, men som det fremgår forkastes nulhypotesen. Det kan altså konkluderes, at metoden genererer forholdsvis store estimater, men de logaritmiske standardafvigelser er tæt på at være normalfordelte. 3.3. Kovarians og Korrelation Da der er udtrukket 5-minutters afkast for to aktier, er det muligt at anvende disses filtrerede 5- minutters afkast til at estimere kovarians og korrelation. De daglige kovarianser er som beskrevet estimeret som summen af produktet af de 96 filtrerede afkast for de to aktier. Hvis der skal være en positiv kovarians, hvilket med baggrund i en overvældende mængde finansiel litteratur forventes at være på dagsbasis, betyder det for denne estimation, at de to aktier skal handels i samme retning indenfor det samme 5-minutters interval. Da aktierne som beskrevet ikke handles i alle 5-minutters intervaller, især ikke de første år, må forventningerne til resultatet dog skrues ned. En positiv markedsnyhed kan have indflydelse på den ene aktie i ét interval, men først for den anden aktie i et andet interval, simpelthen fordi de ikke handles tit nok. Det betyder ikke, at de to aktier ikke er positivt korreleret, blot at det ikke kan vises på 5-minutters basis. I tabel 3.6. er de beskrivende mål for kovariansen og korrelationen vist. Korrelationen er beregenet som Cov / v v. NOVO, TDC, t NOVO, t TDC, t Tabel 3.6. Beskrivende mål for kovarians og korrelation Cov Corr,, NOVO, TDC, t NOVO TDC t Mean St.dev. Skew. Kurt. Mean St.dev. Skew. Kurt. 0,7182 3,2732 2,4482 34,0882 0,0399 0,1494 0,2910 5,2787 Der observeres en forholdsvis stor kovarians, sammenlignet med ABDE (2001), men dette skal ses i sammenhæng med de forholdsvis store varianser på de to variable, som illustreret i tabel 3.4. Den gennemsnitlige korrelation er derimod ret lille, mindre end den mindste observeret blandt de 30 DJIA aktier i ABDE (2001). Et simpelt t-test, for om den gennemsnitlige korrelation er lig nul, afvi- 17

ser dog nulhypotesen med en p-værdi meget tæt på nul 9, så der er dog en signifikant gennemsnitlig positiv korrelation. For både kovariansen og korrelationen observeres en forholdsvis stor variation over tid, men standardafvigelsen for korrelationen er dog ikke ekstrem sammenholdt med ABDE (2001), da denne er det samme som standardafvigelsen for deres median korrelation. Kovariansen er både højreskæv og leptokurtisk, og dermed langt fra normalfordelt, men igen er disse estimater ikke ekstreme. For korrelationen reduceres både skævhed og kurtosis betydeligt, men resultatet for denne, der ligesom de standardiserede afkast og de logaritmiske standardafvigelser gerne skulle være normalfordelte, er det mest skuffende hidtil. Topstejlheden er større end den største i undersøgelsen af ABDE (2001), og Jarque-Bera testet forkaster klart nulhypotesen om, at korrelationen er normalfordelt. 10 Figur 3.6. viser kernel-tætheden for korrelationen, estimeret med smoothing parameter h lig 0,0297. Figur 3.6. Fordeling for korrelationen mellem NOVO og TDC 4 3 2 1 0-0.5 0.0 0.5 1.0 Som det kan anes til højre i figuren, er der enkelte observationer mellem 0,5 og 1. Disse bidrager naturligvis meget til skævheden og topstejlheden, og hvis der ses bort fra disse, er resultatet trods alt ret pænt. Generelt kan det dog konkluderes, at metoderne fra ABDE (2001) virker overraskende godt på de, i forhold til DJIA aktierne, ret illikvide danske aktier NOVO og TDC. 9 tobs ( ) = 0, 0399 / 0,1494 / 1114 = 8, 91 P værdi 0. 10 JB obs = 256,7 => p- værdi 0 18

4. Betingede volatilitetsfordelinger Tidsserieegenskaberne for de bemærkelsesværdigt pæne fordelinger for de realiserede logaritmiske standardafvigelser og korrelationer undersøges nærmere i dette kapitel. Mere specifikt vil der blive fokuseret på seriernes stationaritetsegenskaber. 4.1. Logaritmiske standardafvigelser De realiserede logaritmiske standardafvigelser er som beskrevet dannet ud fra 5-minutters afkast, hvilke blev renset for mikrostruktur-effekter ved en MA(1)-filtrering. Mellem de 1.114 dagsobservationer forventes imidlertid at være en vis afhængighed, og ligeledes kunne det forventes, at der fremtræder volatilitetsklumpninger. I figur 4.1. er vist tidsserieplot for NOVO og TDC. Figur 4.1. Line graphs for lv NOVO,t og lv TDC,t 4 4 3 3 2 2 1 1 0 0-1 200 400 600 800 1000-1 200 400 600 800 1000 Som forventet spores en vis grad af positiv afhængighed, da der er en tendens til at visse perioder har høj og visse perioder har lav log-volatilitet. Signifikante effekter bør naturligvis ikke konkluderes på øjemål, så derfor estimeres autokorrelationfunktionen, ACF, og den partielle, PACF. Figurer for begge disse er ikke medtaget her, men senere i figur 4.2. vises SACF for de to aktier. Her ønskes det blot undersøgt, hvorvidt der er signifikant autokorrelation i serierne, hvilket gøres med Ljung- Box s Q-statistik: r Q = T ( T + 2) (4.1) k p 2 k k = 1 T 19

Jf. Greene (2000) har denne korrigerede Q-statistik bedre finite sample egenskaber end Box-Pierce Q-statistikken, begge følger dog en χ 2 fordeling med p frihedsgrader. Ljung-Box er estimeret på op til 200 lags for begge serier, og i alle tilfælde forkastes nulhypotesen om insignifikant autokorrelation ret kraftigt. For at sammenligne med resultaterne fra ABDE (2001) vises Q-testene for p = 22 i tabel 4.1. Tabel 4.1. Ljung-Box Q-test for p = 22 Aktie Q 22 Kritisk værdi (1%) P-værdi NOVO 3454,8 40,29 0 TDC 353,38 40,29 0 Resultaterne er på linie med ABDE (2001), og til trods for at Q for TDC er noget lavere end selv den mindste blandt de 30 DJIA aktier forkastes nulhypotesen ved et hvert tænkeligt valg af signifikansniveau. Af figur 4.2. fremgår endvidere, at der er tale om signifikant positiv autokorrelation. 4.1.1. Enhedsrødder i volatilitetsserierne Det er værd at hæfte sig ved, at specielt for NOVO dør ACF kun langsomt ud. Helt oppe på lag 100 er der stadig en autokorrelation på 0,237. Når ACF kun dør langsomt ud, kunne man have en formodning om, at serierne ikke er stationære. Det vil derfor i det følgende bliver undersøgt, om serierne for de to aktiers logaritmiske standardafvigelser er I(1). Det er valgt at anvende et Augmentet Dickey-Fuller test (ADF), da dette inddrager laggede differencer af den afhængige variabel, til trods for at testes svaghed er, at det som præsenteret i det følgende kun er anvendeligt, hvis de undersøgte serier kan identificeres som rene AR-processer, og således ikke med MA-led. 11 Ved inddragelse af netop så mange argumenter, at fejlledet i (4.2) er hvid støj kan ADF-testet anskues som en parametrisk korrektion for højere ordens seriel korrelation. Der findes dog et relativt simpel alternativ til dette test givet af Phillips-Perron, som opstiller en ikkeparametrisk korrektion af t-statistikken fra regressionen (4.2) således at denne tager højde for seriel korrelation i fejlledet. 12 11 Dog viser Said & Dickey (1984), at ADF-testet stadig kan anvendes selvom serien indeholder et moving average element givet, at regressionen er velspecificeret med hensyn til antallet af laggede argumenter. 12 Korrektionen tager udgangspunkt i et Newey-West heteroskedastisk og autokorrelations konsistens estimat. 20

Dickey-Fuller testet udledes ved at opstille en simpel AR(1), hvorefter lv t-1 fratrækkes på begge sider (fodtegn j til betegnelse af hver af de to aktier er udeladt) lvt = + lvt 1 + t µ γ ε = + +ε (4.2) lvt µ γ * lvt 1 t Hvor γ * = γ 1 og ε t er hvid støj. Der testes for om γ* = 0, hvilket fastholder nulhypotesen om en enhedsrod. Som nævnt anvendes imidlertid ADF, hvilket udvider (4.2) med laggede differencer som følger: p lvt = + γ lvt + 1 1 j= 1 µ * ϕ lv + ε (4.3) j t j t Stadig testes for om γ* = 0. Dette test er følsom overfor antallet af lags, der medtages i estimationen. Ved at medtage tilstrækkelig mange vil nulhypotesen altid kunne fastholdes, det vil sige testet bliver meget svagt. For igen at sammenligne med resultaterne fra ABDE (2001) er testet kørt på NOVO og TDC med 22 augmentationslags, resultatet er vist i tabel 4.2. Tabel 4.2. ADF test for enhedsrødder i lv NOVO,t og lv TDC,t Aktie γ* t-stat Kritisk værdi (5%) Kritisk værdi (1%) NOVO -0,110531-3,175264-2,8646-3,4391 TDC -0,300263-4,875956-2,8646-3,4391 t-statistikkerne følger ikke den normale t-fordeling under nulhypotesen, derfor anvendes MacKinnon kritiske værdier, og en p-værdi kan således ikke direkte beregnes. Det ses, at γ* er signifikant mindre end nul på et 5% niveau for NOVO og på et 1% niveau for TDC. I begge tilfælde kan nulhypotesen om en enhedsrod altså forkastes med at rimeligt valg af signifikansniveau, og resultaterne er helt på linie med ABDE (2001), der forkastede for 26 ud af 30 DJIA aktier. Selv om konklusionen for NOVO er følsom over for valg af signifikansniveau, skal det bemærkes, at ADF testet er svagt når der medtages mange augmentationslags. Her forkastes begge hulhypoteser selv med 22 lags, der blev valgt for at kunne sammenligne resultaterne med ABDE (2001), men adskillige af ϕ-estimaterne er insignifikante, og reduceres udtrykket med disse fås naturligvis et re- 21

sultat, der er endnu mere signifikant end det ovenstående. Der skulle derfor ikke være grund til at tvivle på, at serierne ikke er I(1). 13 4.1.2. Hyperbolsk henfald i SACF Årsagen til, at SACF kun dør langsomt ud kunne altså ikke findes i hypotesen om, at de to serier indeholder enhedsrødder. Til brug i afsnit 5 om fraktionel integration undersøges det her, om henfaldet i SACF kan betragtes som hyperbolsk, i modsætning til det mere traditionelle eksponentielle henfald, der ofte observeres i stationære tidsseriers SACF. I figur 4.2. er SACF for de realiserede logaritmiske standardafvigelser plottet mod lag-nummer (horisont, h). For Novo er medtaget 100 lags, mens der for TDC kun er medtaget 23 lags, hvorefter enkelte estimerede autokorrelationer bliver negative. Figur 4.2. SACF for lv NOVO,t og lv TDC,t 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 1 9 17 25 33 41 49 57 65 73 81 89 97 0,45 0,4 0,35 0,3 0,25 0,2 0,15 0,1 0,05 0 1 3 5 7 9 11 13 15 17 19 21 23 ACF Hyperbolsk ACF Hyperbolsk Specielt for NOVO synes kurven at fitte rigtig godt. For TDC er den hyperbolske kurve kun beregnet på baggrund af de første 23 positive observationer, så selv om kurven ser ud til at fitte disse observationer godt, er denne ikke lige så informativ, som tilfældet er for NOVO. I figurerne er ikke indlagt eksponentielle henfaldskurver, men disse estimers i det følgende for at sammenligne. Begge kurver er estimeret gennem lineær regression ved at foretage følgende omskrivninger, hvor h er lag-nummeret 13 For NOVO og TDC er γ* henholdsvis 3,708 og 9,222 ved henholdsvis 15 og 5 argumenter. 22

Hyperbolsk henfald SAC ch 2d F = 1 ln( SACF) = ln( c) + (2d 1) ln( h) (4.3a) Eksponentielt henfald SACF = ce β *h ln( SACF) = ln( c) + β * h (4.3b) Parametrene er estimeret og illustreret i tabel 4.3. sammen med forklaringsgraderne på regressionerne. Tabel 4.3. Resultater fra fittede kurver for SACF for lv NOVO,t og lv TDC,t Hyperbolsk Eksponentiel Aktie Ln(c) (2d-1) R 2 Ln(c) β R 2 NOVO -0,57427-0,19985 0,771-1,00563-0,00585 0,646 TDC -0,96728-0,55994 0,825-1,51015-0,05945 0,626 Det fremgår tydeligt af tabel 4.3, at kurverne med hyperbolsk henfald fitter bedre til SACF for begge aktier. Det bemærkes dog igen, at forklaringsgraden for TDC måske er kunstigt høj, idet det kun kan konkluderes, at hyperbolsk henfald fitter bedre til de første 23 observationer. 4.2. Korrelationen Serien med de realiserede korrelationer levede som tidligere beskrevet ikke op til vores forhåbninger. I ABDE (2001) gennemføres en analyse tilsvarende den ovenstående for den betingede korrelationsfordeling. I figur 4.3. vises et tidsserieplot for denne. 23

Figur 4.3. Line graph for korrelationen 1.5 1.0 0.5 0.0-0.5-1.0 200 400 600 800 1000 Korrelationsserien ser ud til at opføre sig pænt, og der er ikke signifikant autokorrelation ved nogen lags, vurderet ud fra Ljung-Box Q-statistikken. Det er derfor ikke fundet interessant at arbejde videre med denne serie. Der gennemføres derfor ikke ADF-test på serien, som det blev foretaget for de logaritmiske standardafvigelser i forrige afsnit, og serien bliver ikke inddraget i kommende afsnit om fraktionel integration. 5. Langtidshukommelse i de logaritmiske volatilitetstidsserier Identifikationen af long-memory processer, karakteriseret ved høj autokorrelation mellem observationer over store tidsintervaller, er efterhånden en meget udbredt disciplin. Disse stationære processer er karakteriseret ved en langsom hyperbolisk aftagende autokorrelationsfunktion i modsætning til det hurtigere eksponentielle aftag, der karakteriserer de traditionelle stationære tidsserier. I det kommende vil vi jf. ABDE (2001) fokusere på en mulig langtidshukommelse i tidsserierne for de realiserede log-standardafvigelser for henholdsvis NOVO og TDC. Afsnittet vil først kortfattet klarlægge teorien bag long-memory processer, hvor spektralanalysen bliver introduceret. Efterfølgende vil Geweke & Porter-Hudak s (GPH) log-periodogram-regression ligge til grund for en egentlig estimation af integrationsordenen, hvorunder en alternativ estimationsprocedure vil blive brugt som sammenligningsgrundlag. 24

5.1. Modellering af long-memory processer Betragt en tidsserie med autokorrelationsfunktion ρ k. For de traditionelle stationære tidsserier vil autokorrelationsfunktionen dø hurtigt ud med en eksponentiel udvikling, hvilket samtidig bevirker, at grænseværdien for summen af de nummeriske autokorrelationer konvergerer i stikprøven. Modsætningsvis vil samme grænseværdi ikke konvergere, men derimod divergere, hvis serien udviser lang hukommelse. Altså vil: ρk = (5.1) n k = 0 lim n Ved hjælp af lag-operatoren, L, kan en sådan serie dog stadig opskrives som hvid støj, hvilket i litteraturen kaldes en fraktionel differenset hvid støj tidsserie: 2 ( 1 ) d ε, ε ~IID ( 0, ) d yt = L yt = t t σ ε (5.2a) d 2 ( L) ( L) yt ( 1 L) ( L) ( L) yt t, t~iid ( 0, ε ) d 1 1 θ φ = θ φ = ε ε σ (5.2b) hvor (5.2a) kendetegner en ARFIMA( 0, d,0) θ ( L) 14, og (5.2b) en (,,, hvor ARFIMA p d q) φ ( L) er de respektive lag-polynomier med rødder udenfor enhedscirklen. Til illustration af teorien er det umiddelbart kun nødvendigt at fokusere på førstnævnte, hvorfor dette gøres i det følgende. og Jf. Mills (Esben Høg, 1993) kan (5.2a) omskrives gennem de autoregressive koefficienter, φ k, til: d t = φk t k = k = 0 y y εt (5.3) hvor de autoregressive koefficienter kan gengives ved en binomialrække, eller lettere gennem gammafunktionen: 14 Når d = 1 genkendes (5.2a) som den klassiske random walk uden drift. 25

Γ( ) ( ) ( 1) k d k d φk = ( 1) = k Γ d Γ k+ (5.4) For processen d yt = εt, hvor t ε er hvid støj og d < ½ kan det vises, at y t er stationær og invertibel med variansen: var ( y ) t ( 1 2d ) ( 1 d ) Γ = γ = Γ 0 2 (5.5) hvilken kan vises at være endelig når d < ½. Med viden omkring gammafunktionen kan der af udtrykket for autokorrelationsfunktionen (5.6) ses, at denne aftager hyperbolsk, hvis d < ½. 15 ( 1 d) ( k d) ( d) ( k 1 d) Γ Γ + ρk = Γ Γ + 2d 1 c k for k (5.6) Heraf fremkommer det, at autokorrelationsfunktionen for sådanne fraktionelt integrerede processer vedbliver signifikante endda ved lange lags, hvilket har givet anledning til navnet long-memory processer. 5.2. The frequency Domain Spektralanalysen Indtil nu har vi kun analyseret vores tidsserier i det, der kaldes tidsdomainet, hvilket skal forstås ved, at vi kun har analyseret seriernes tidsmæssige egenskaber. Enhver kovarians-stationær proces kan imidlertid ikke kun opskrives i tidsdomainet, men også i frekvensdomainet, hvorved spektralanalysen kan udføres 16. I frekvensdomainet er interessen centreret omkring, hvorledes bidraget er fra seriens forskellige periodiske komponenter. Disse komponenter behøver ikke nødvendigvis at blive identificeret som regulære cykler i et plot af serien. Faktisk forholder det sig ifølge Harvey (1993) således, at økonomiske tidsserier kun indeholder tendenser til cykliske bevægelser omkring 15 Se Butler (1996) og Whitcher & Jensen (2000). Deo & Hurvich (1999) viser eksplicit, at en serie siges at have long memory hvis 2d 1 korrelationsfunktionen har udseendet: ρ k ~ ck for k. 16 Se Hamilton (1994), s. 152ff. 26

en specifik frekvens. Det er med afsæt i netop dette spektrum eller den spektrale tæthedsfunktion, at vi ifølge GPH (1983) kan estimere den fraktionelle integrationsorden, d. Inden vi kaster os ud i spektralanalysen, er det nyttigt at have kendskab til sammenhængen mellem autokorrelationsfunktionen, der observeres i korrelogrammet, og spektrummet, der observeres i periodogrammet. Som nævnt er dette to sider af samme sag, hvorfor der er en direkte sammenhæng mellem eksistensen af høje autokorrelationer over store lags, og en stor dynamik i spektrummet ved lave frekvenser. 17 Ifølge Greene (2000) kan en tidsseries autokovariansfunktion opskrives ved dennes spektrum eller spektrale tæthedsfunktion som: k π y ( ) cos( ) γ = f ω kω dω (5.7) π hvor frekvenserne, ω j, for hvilke analysen gennemføres, er givet ved fourier frekvenserneω = 2 π j / T. Det er ifølge Hamilton (1994) en konvention, at der kun fokuseres på positive fre- j kvenser, men grundet symmetrien omkring ω = 0 kan (5.7) stadig estimeres. 18 Med denne information bag os er det nu intuitivt at fokusere kortfattet på selve teorien bag spektrummet for opgavens ARFIMA-proces. 5.2.1. Teorien bag spektralanalysen Omskrives den stationære ARFIMA( p, d, q) -proces i (5.2b) til: ( ) d 1 L y u u ( L) ( L) 1 =, = φ θ ε, (5.8) t t t t kan dennes spektrum opskrives som: i 2 2 ( ) 1 ω d d j ω ( ω ) 4sin ( ω /2) ( f = e f = f ω (5.9) y j u j j u j ) 17 Jf. Greene (2000), s. 769ff. 18 Da cos( ω ) = cos( ω) fy( ω) = f y( ω) er værdierne i hele spektrummet kendt når værdierne for ω er kendt i intervallet [0,π]. Se endvidere Greene (2000), s. 770. 27

Hvis u t i (5.8) er hvid støj, er spektrummet for denne givet ved ( ) ( ) 1 2 f ω 2π σ u j =. 19 Logtransformeres (5.9) fås et udtryk, hvor graden af fraktionel integration, d, ikke længere står i potensen, men som koefficient: u 2 ( ω ) = ( ω ) ( ω ) ln fy j ln fu j dln 4sin j / 2 (5.10) Hvis vi som Butler (1996) trækker ln ( 0) f u fra på begge sider af (5.10) og samtidig tillægger logperiodogrammet af y t, ln I y ( ω j ), hvilket er stikprøveestimatet på spektrummet, på begge sider og isolerer, får vi følgende: 2 ( ω ) = ( ) ( ω ) + ( ω ) ( ω ) + ( ) ( ) ln Iy j ln fu 0 dln 4sin j / 2 ln Iy j / fy j ln fu ω j / fu 0 (5.11) Udtrykket i (5.11) kan yderligere simplificeres når frekvensen mindskes, idet sidste led i (5.11) går mod nul når frekvensen, ω, går mod nul. Ifølge GPH (1993) er ln Iy( ω j) / fy( ω j) ω j, hvorfor GPH s log-periodogram-regression er baseret på følgende udtryk: IID over alle 2 ( ) ( ) ln I y ω j = α βln 4sin ω j / 2 + ν j for j = 1,.., K (5.12) hvor α og β er konsistente OLS estimater på henholdsvis ln 0 og d, og ν = ln I / ( ω ) f ( ω j) j y j y. Samtidig er K det største harmoniske ordinat (frekvens), der anvendes i ( ) analysen, således at 0 < K < g T, hvor g(t) er en upper-bound funktion for K. I litteraturen fastlægges g(t) apriori normalt til T λ, hvor T er stikprøvestørrelsen og 0,5 λ 0,7, idet dette giver det bedste empiriske resultat. Dog er valget af denne funktion ikke negligibelt, idet der ifølge Butler plim β d = 0. Denne diskussion har vi fravalgt, men (1996) eksisterer en funktion således, at T ( ) vi laver dog en kortfattet scenarieanalyse for at anskueliggøre estimaternes følsomhed overfor ændringer i λ. f u ( ) 19 Jf Hamilton (1994), s. 154. 28

5.2.2. De empiriske resultater af periodogram-regressionen Med inspiration fra GPH (1983) samt Butler (1996) er SAS anvendt til estimation af den fraktionelle integrations-parameter, d. Dette er gjort ved først at anvende det indbyggede modul Proc Spectra, der estimerer periodogrammet for den valgte serie, for derefter at køre regressionen i (5.12) gennem modulet Proc Reg. Dette har givet os følgende estimater for henholdsvis NOVO og TDC ved λ = 0,65: Tabel 5.1. De fraktionelle integrations parameter-estimater Variabel Koefficient Std. afv. t-stat P-værdi NOVO C -1.66001 0.26699-6.22 <.0001 D 0.37811 0.07290 5.19 <.0001 TDC C -1.27867 0.19905-6.42 <.0001 D 0.25909 0.05435 4.77 <.0001 Som der kan ses af tabellen, er begge estimater mindre end ½, hvorfor processerne er stationære. Dog er de af programmet estimerede standardafvigelser ikke anvendelig ifølge Deo & Hurvich (1999), idet deres resultater påviser, at parameteren, d, er asymptotisk normalfordelt med standardafvigelse π(24m) -½, hvor m er lig T λ. For vores resultater bevirker det, at den asymptotiske standardafvigelser kan beregnes til 0,066, hvilket ikke ændrer på konklusionerne, at den fraktionelle integrationsparameter for begge aktiers vedkommende er signifikant forskellig fra både 0 og 1. I nedenstående tabel ses vores simple scenarieanalyse, der tydeligt viser vores estimaters følsomhed overfor ændringer i λ. Tabel 5.2 Integrationsordenens følsomhed overfor stikprøvestørrelsen. λ Stikprøve d NOVO Std.afv. d TDC Std. afv. Asymp. std.afv 0,50 33 0,5141 0,1377 0,3043 0,1082 0,111 0,55 47 0,5032 0,1147 0,2628 0,0833 0,101 0,60 67 0,4413 0,0945 0,2156 0,0638 0,078 0,65 96 0,3781 0,0729 0,2591 0,0544 0,066 0,70 136 0,2986 0,0568 0,2765 0,0461 0,055 29