Fordelinger for realiseret volatilitet for aktieafkast

Størrelse: px
Starte visningen fra side:

Download "Fordelinger for realiseret volatilitet for aktieafkast"

Transkript

1 Cand. Merc. Finansiering Investigations of Securities Markets Opgaveløsere Per H. Frederiksen 3. semester Mads Overgaard Vejleder Carsten Tanggaard Fordelinger for realiseret volatilitet for aktieafkast - eksemplificeret gennem Novo Nordisk og Tele Danmark Handelshøjskolen i Århus 2002

2 Indholdsfortegnelse 1. Indledning Problemformulering Teorien bag det realiserede volatilitetsmål Den generelle afkast-proces Kvadratisk variation og kovariation Data Praktiske forhold Generering og estimation af de realiserede volatilitets- og kovariationsmål Afkasts- og volatilitetsfordelinger Afkast ARCH og GARCH modeller Standardisering med realiserede standardafvigelser Varianser og logaritmiske standardafvigelser Kovarians og Korrelation Betingede volatilitetsfordelinger Logaritmiske standardafvigelser Enhedsrødder i volatilitetsserierne Hyperbolsk henfald i SACF Korrelationen Langtidshukommelse i de logaritmiske volatilitetstidsserier Modellering af long-memory processer The frequency Domain Spektralanalysen Teorien bag spektralanalysen De empiriske resultater af periodogram-regressionen Asymmetrisk volatilitets-respons Asymmetrisk respons i de logaritmiske standardafvigelser Konklusion...36 Litteraturliste...38 Appendiks A. SAS-kode til estimation af fraktionel integration...40 Appendiks B. GAUSS-kode til generering af den fraktionel differensede serie...41

3 1. Indledning Estimering af volatiliteten på finansielle afkast er relevant for en lang række formål. Det er blandt andet centralt for prisfastsættelse af aktiver, for beslutninger omkring aktivallokering og til styring af finansiel risiko. Mange økonometriske modeller antager i denne sammenhæng et konstant variansestimat over tid, selvom det tværtimod er den generelle opfattelse, at volatiliteten varierer betydeligt over tid. Denne anerkendelse har i den senere tids finansiering fostret en bred vifte af undersøgelser indenfor de fordelingsmæssige og dynamiske egenskaber for volatilitet. Indtil nu har de fleste empiriske resultater været bygget på ARCH/GARCH- og stokastisk volatilitetsmodeller for de underliggende afkast, eller på implicitte volatilitetsmodeller fra optionsteorien. Dog afhænger disse volatilitetsmål af specifikke fordelingsmæssige antagelser, hvilke indskrænker anvendeligheden. En alternativ indgangsvinkel til modellering af volatiliteten blev fremsat af blandt andet French (1987), hvor kvadrerede afkast over en relevant horisont giver et modelfrit og unbiased estimat på den realiserede ex post varians. Denne tilgangsvinkel er igen i 2001 taget op til revision, hvor Andersen, Bollerslev, Diebold og Ebens har undersøgt den tidsvarierende volatiliteten for DJIA aktier. På baggrund af den nylige udvikling indenfor volatilitetsmodellering tager denne opgave udgangspunkt i to forholdsvis nye artikler, der estimerer realiseret volatilitet på baggrund af 5-minutters afkast. Andersen, Bollerslev, Diebold og Labys (ABDL (2000)) udledte teorien bag estimationsmetoden og anvendte den til at estimere volatilitet på valutakurser. Andersen, Bollerslev, Diebold og Ebens (ABDE (2001)) anvendte videre den præsenterede metode til at estimere volatilitet på aktie afkast på 30 meget likvide DJIA aktier Problemformulering Formålet med denne opgave er at anvende den præsenterede metode på danske aktier. To hovedpunkter udspringer af dette 1. At finde en metode til at estimere de daglige realiserede varianser. 2. At undersøge i hvilket omfang, estimaterne for de danske aktier har de samme egenskaber som estimaterne for de amerikanske aktier. Først vil den bagvedliggende teori for generering af realiseret volatilitet blive præsenteret. Til trods for at selve estimeringen af de daglige realiserede varianser har været en tidskrævende del af pro- 1

4 jektet, vil der i denne opgave kun kort blive præsenteret den anvendte metode samt få praktiske problemer forbundet hermed. I stedet bruges den resterende del af opgaven på at gennemføre de samme analyser som ABDE (2001) og sammenligne resultaterne derfra med resultaterne for de danske aktier. Herunder vil afkastfordelingerne yderligere blive analyseret gennem GARCH-modeller for at sammenligne resultatet af denne meget udbredte metode med den nye metode foreslået af ABDE (2001). Udover en analyse af de ubetingede fordelinger for standardiseret afkast, log-volatilitet og korrelation vil også de betingede fordelinger for log-volatilitet og korrelation blive analyseret. Herunder skal det undersøges, om serierne er stationære, og om der er lang hukommelse i dem. Hvis der er lang hukommelse i serierne vil fraktionelle integrationsparametre blive estimeret, og endelig vil de fraktionelt differensede serier blive anvendt til at undersøge, om der forefindes asymmetrisk volatilitets respons. 2. Teorien bag det realiserede volatilitetsmål I dette afsnit klarlægges teorien for de kommende volatilitets- og kovarians mål. Da aktieafkast, og derved den sande latente volatilitet, i princippet kan estimeres over arbitrere små tidsintervaller, hvis aktien er tilstrækkelig likvid, vil fundamentet for målene være baseret på kontinuert tids finansiering. Derfor modelleres afkast-processen som en standard Ito-proces, hvori volatilitetsstrukturen kan approksimeres gennem anvendelse af høj frekvente transaktionsdata Den generelle afkast-proces Der betragtes et marked, hvor den generelle usikkerhed er defineret ved et filtreret sandsynlighedsrum (Ω, F, F t, P), hvor Ω er udfaldsrummet (de mulige markedstilstande), P er det objektive sandsynlighedsmål baseret på dette udfaldsrum, F repræsenterer det sæt af begivenheder, der implicit ligger til grund for den forudgående information, og F t = {F t : 0 t T max } er den naturlige filtrering, hvilken karakteriseres ved en voksende funktion over tid, der beskriver al tilgængelig information på det udvalgte tidspunkt. Det antages, at den usikkerhed, der påvirker udviklingen i de enkelte aktier, kan beskrives ved følgende generelle Ito-proces 1 : dp = u( p, tdt ) + Σ( p, td ) w t t t udt + Σdw t (2.1) 1 Denne kaldes også en stokastisk differentialligning (SDE). 2

5 hvor p t er den logaritmiske n-dimensionale pris-vektor. Af ovenstående ses, at den infinitisimale ændring i prisen består af et deterministisk driftled udt plus et stokastisk støjled Σdw, hvor Σ karakteriserer den (n x n) dimensionale positive definitte diffusionsmatrice, og w er en n-dimensional vektor af uafhængige standard wiener-processer (brownske bevægelser), hvilke genererer de stokastiske stød fra usikkerheden i markedet. Idet regneregler for stokastiske differentialer 2 benyttes, kan wienerprocessen i (2.1) vises at have følgende egenskaber: [ ] [ ] E dw = lim E z( t+ dt) z( t) = 0 dt 0 [ ] [ ] 2 Var dw = lim E zt ( + dt) zt ( ) = dt dt 0 (2.2) (2.3) Det vil sige at dw ~ N(0, dt). Gennem (2.2) og (2.3) kan det vises, at den forventede værdi til den infinitisimale ændring i prisen er: [ ] [ ] [ ] [ ] E[ dp ] = E udt+ Σdw = E udt + E Σdw = E udt = u dt (2.4) t hvorfor variansen på processen kan udledes som: dp t = E dp t E dp t dp t E dp ( )( ( t) ) Var [ ] ( ) = E dt + d dt dt d dt ( u Σ w u )( u + Σ w u ) = E ( d )( d ) = E[ d d ] dt Σ w Σ w Σ w wσ = ΣΣ (2.5) Da den stokastiske differentialligning (2.1) er en forkortet form af det stokastiske integrale, kan afkastet fra t-1 til t opskrives som: 2 Se Cochrane (2001), s. 489 for stokastiske regneregler som dz 2 = dt. 3

6 t ( τ ) τ ( τ) r (t) = p (t) p (t 1) = u d + Σ d w ( τ ) (2.6) t 1 t 1 t hvilket i øvrigt også betegnes en martingale repræsentation. 3 Hvis tidsperioden mellem de observerede priser normaliseres til h = 1, hvilket repræsenterer en handelsdag, er fordelingen for dagsafkastet betinget på den realiserede sti for µ t og Σ t : 4 h {, } ~N (, ) h h τ τ τdτ τ τd = r σ µ Σ µ Σ τ t+ h, h t+ t+ 0 0 t+ 0 t+ (2.7) h { t τ, t τ} τ 0 hvor µ Σ er det udfaldsrum, der genereres af udviklingen i µ t og Σ t for 0 τ h. Som σ + + = det fremgår af (2.7) giver den integrerede diffusionsmatrice derfor en naturligt mål for den sande h- periode volatilitet Kvadratisk variation og kovariation Generelt gælder det for semimartingale processer, at den kvadratiske variation og kovariation er defineret ved: ( ) 2 Qvar pj = pj 2 pjdpj ( ) (2.8a) j k = j k j j k p k (2.8b) Qcov p, p p p p dp p d hvor p j er den logaritmiske pris for aktie j. Disse mål er i kontinuert tid, hvorfor en diskretisering af (2.8a) og (2.8b) er nødvendig i vores tilfælde, hvor observationerne falder diskret. Ifølge ABDL (2000) kan der opstilles følgende sammenhæng: + 0 n= t/ 2 ( j) + ( j i j i ) = ( ) lim Q var 0 p p var i 1, p, 1 Q p = t j (2.9a) + 0 ( ) ( n= t/ ( j k) + ( ji ji )( ki ki ) = t j k) (2.9b) lim Q cov 0 p, p p cov, i 1, p, 1 p, p, 1 Q p p = 3 Se ABDL (2000). 4 Se ABDE (2001) samt ABDL (2000) for yderligere forklaring. 4

7 hvor afkastet r p p j, i j, i j, i 1, og der summeres over n intervaller fra tidspunkt 0 til t. Dette bevirker, at for infinitisimale tidsændringer kan den kvadratiske variation og kovariation til tidspunkt t findes ved en grænseværdibetragtning af summen af den kvadratiske variation og kovariation til tidspunkt 0 plus de infinitisimale kvadrerede ændringer i prisen fra tidspunkt 0 til t. Hvis ovenstående processer samtidig følger den generelle Ito-proces (2.1) kan den kvadratiske horisont variation henholdsvis kovariation, over intervallet [t,t+h], beskrives ved ændring heri således at: t+ h 2 ( ) + ( ) ( ) ( ) Qvar p Qvar p Qvar p = σ τ dτ (2.10a) ht, j t h j t j t j t+ h ( ) + ( ) ( ) ( ) ( ) Qcovh, t p j, pk Qcovt h p j, pk Qcovt p j, pk = σ j τ σk τ dτ (2.10b) t Af ovenstående er det blevet klart, at det kun er nødvendigt at fokusere på ændringerne i den kvadratiske variation for at finde et mål for den sande varians henholdsvis kovarians. Hvis vi jf. ABDE (2001) definerer horisont variansen henholdsvis kovariansen for afkastene som følger: V ar h / 2 jht,, i= 1 jt, + i = r (2.11a) h / Cov = r r (2.11b) jk, h, t i= 1 j, t+ i k, t+ i kan det vises, at (2.11) er gående i sandsynlighed mod (2.10) for gående mod nul. Ved at indsætte (2.9) i (2.10) fås for variansen (resultatet for kovariansen udledes tilsvarende): ( ) = + ( ) ( ) Qvar p Qvar p Qvar p ht, j t h j t j ( ) ( ) ( )/ 2 / 2 lim Q var p t + h r Q 0 1, var p t r h / r 2 = j + + ji 0 j + 1 ji, = jt i 0 i= i= i 1, + (2.12) = Heraf følger det intuitivt, at tidsserien for den daglige varians indeholder følgende egenskab: 5

8 h / t+ h 2 2 rjt, + i σ j( τ) dτ for i= 1 + t 0 0 (2.13a) hvor σ 2 j refererer til den individuelle varians på aktie j. Af (2.13a) kan ses, at for hver dag summeres h/ kvadrerede afkast, hvilket approksimativt giver et estimat på den sande varians. Endvidere konvergerer differensen næsten sikkert for alle t når afkast-frekvensen stiger eller som skrevet i (2.13a) når tiden mellem de observerede afkast,, mindskes. For at (2.13a) antageligvis skal holde er det derfor nødvendigt med højfrekvente transaktionsafkast, da vi ellers får meget støjede estimater. Dette postulat skal ses i lyset af (2.5) hvorfra vi ved, at hvis samplingsfrekvensen tilnærmelsesvis er kontinuert vil driftledets påvirkning af variansmålet være negligibelt. På samme måde kan tidsserien for den daglige kovarians mellem aktie j og k approksimeres ved kryds-produkter af de højfrekvente afkast således at: h / t+ h + rjt, + i rkt, + i σ j( τ) σk( τ) dτ 0 for 0 (2.13b) i= 1 t konvergere næsten sikker for alle t, hvor σ j og σ k henviser til den sande volatilitet for henholdsvis aktie j og k Data Til den empiriske analyse har vi udvalgt 2 forholdsvis likvide aktier på Københavns Fondsbørs. Disse aktier benævnes forholdsvis likvide, da de ikke tilnærmelsesvis er ligeså likvide som amerikanske aktier. De undersøgte aktier er Novo Nordisk (NOVO) samt Tele Danmark (TDC). Vores stikprøve af højfrekvente transaktionsdata går fra januar 1995 til medio juni 1999, hvilket i alt giver os daglige afkast for hver aktie. Dog står vi med det problem, at aktierne ikke altid handles indenfor korte tidsintervaller, hvorfor vi havde valget mellem ikke at overholde de teoretiske approksimationer i (2.12a) og (2.12b) eller at generere kunstige 5-minutters afkast. Her er sidste metode valgt, hvorved vi i perioder, hvor aktien ikke blev handlet, har sat 5-minutters afkastet lig 0. Vi har imidlertid overvejet at anvende lineær interpolation mellem de observerede priser, hvorved alle 6

9 afkast ville blive forskellige fra 0. 5 Dog bibringer denne metode med positiv autokorrelation i intradag afkastene, hvilket vi ikke er interesseret i. Samtidig skal det fremhæves, at grundet markedets struktur har de højfrekvente priser tendens til at anløbe markedet i klumper, hvilket sammen med andre mikrostruktur-effekter kan påvirke fordelingsegenskaberne for intra-dag afkastene. Disse effekter forsøges mindsket inden afkastene anvendes til variansestimation, hvilket forklares senere Praktiske forhold Genereringen af de ikke-filtrerede 5-minutters afkast er foretaget i Excel, hvor handelskursen samt handelstidspunktet, for et år af gangen, er indlæst. I Excel er handelstidspunktet lavet om ved hjælp af datofunktionerne, så der i stedet for dato oprettes handelsdagsnummer. Med dette oprettes en tidsvariabel, der kan læses som et tal, som *dagsnummer + 100*time + minut + 0,01*sekund. Hernæst oprettes en kolonne med de tidspunkter, hvorpå en kurs ønskes aflæst. 2. januar (første handelsdag) klokken får eksempelvis værdien 10905,00. Til at aflæse kursen anvendes funktionen LOPSLAG, der leder efter den ønskede værdi i en kolonne, hvis denne ikke findes i kolonnen læses den største værdi, der er mindre end den ønskede værdi. Formlen returnerer den kurs, der står ud for det ønskede tidspunkt, hvilket således bliver kursen på 5-minutters mærket, eller den seneste kurs før 5-minutters mærket. I datasættet fandtes handler udenfor åbningstid, hvilke vi blokerede før opslagsfunktionen blev anvendt. I tilfælde af, at der ikke forelå handler mellem åbning og klokken på en dag, ville opslaget enten have taget den sidste kurs fra dagen før, hvilket således kunne have været efter lukketid, eller en kurs fra om morgenen før åbningstid. Ved at gennemføre den nævnte blokering vil den opslåede kurs klokken i stedet blive den sidste kurs indenfor åbningstid den foregående dag, det vil sige klokken eller så tæt derpå, dog under, som muligt. Det synes mest rimeligt at definere et dagsafkast som lukkekursen dagen før til lukkekursen på dagen. Dagsafkastet er derfor beregnet som lukkekursen klokken den pågældende dag i forhold til lukkekursen klokken den foregående dag. For at være konsistent med dette, er 5-minutters afkastene defineret, så det første 5-minutters afkast på en dag bliver fra lukkekursen klokken Lineær interpolation mellem kurserne giver mindre estimater på den daglige volatilitet, end hvis vi antager nul-afkast. Eksempelvis hvis aktien kun handles én gang på 10 minutter, og kurserne hhv. var 200 og 210, vil lineær interpolation bibringe med 11,9% til variansen, i modsætning til 23,8% hvis afkastet blev sat til 0. 7

10 den foregående dag til kursen klokken den pågældende dag. Det sidste 5-minutters afkast bliver således fra klokken til klokken Det skal bemærkes, at for at anvende notationen fra ABDE (2001) betyder dette, at lukkekursen på dag t kaldes p t+1, således at dagsafkastet på dag t bliver r t = p t+1 p t. Efter disse mere metodemæssige overvejelser har vi genereret 96 5-minutters afkast for hver dag i stikprøven, hvilket svarer til observationer for hver aktie. Derudover har vi genreret dagsafkast for hver aktie, hvilke i det følgende benævnes r j,t Generering og estimation af de realiserede volatilitets- og kovariationsmål 5-minutters afkastserierne er genereret på baggrund af (100 gange) differencen mellem de logaritmiske priser observeret ved eller lige før 5-minutters mærket. På denne måde er hver handelsdag opdelt i 96 5-minutters-intervaller, hvorimellem der er beregnet et afkast. Som nævnt er aktierne ikke så likvide, at de kontinuerlig handles hvert femte minut, hvorfor afkastet er sat til 0 for disse observationer. Selvom resultatet af (2.5) i teorien medfører uafhængighed med driften i afkastprocessen fra (2.1), kan anvendelsen af et diskret og fast, systematisk tidsinterval mellem observationerne påvirke vores variansestimater. For at rense vores estimater for den negative autokorrelation introduceret af den ujævne tidsafstand mellem de observerede priser, samt de indlejrede bid-ask-effekter, MA(1)-filtrerer vi vores to afkastserier inden disse anvendes til varians- og kovariansberegning jf. ABDE (2001): Tabel 2.1. MA(1)-identifikation af 5-minuttters afkastene Variabel Koefficient Std. Afv. t-stat P-værdi NOVO C MA(1) TDC C MA(1) Som det fremgår af tabellen er de estimerede MA-koefficienter negative, hvilket også er konsistent med den spuriøse afhængighed, der introduceres gennem asynkron-handel og bid-ask-effekter. De filtrerede afkastserier benævnes r t+,, for at skelne dem fra de ufiltrerede dagsafkast, og det er disse der ligger til grund for den videre variansberegning. 8

11 Varians- og kovariansserierne kan efterfølgende estimeres ved at summere de kvadrerede rensede 5- minutters afkast, hvor h i forhold til (2.11) er sat til 1, hvilket repræsenterer en handelsdag, som følgende:, 1/ 2 1/ jt, = r i 1 jt, + i, jkt, = r i 1 jt, + i, r = = kt, + i var cov (2.13) hvor t = 1,2,3,., 1.114, hvilket er antallet af handelsdage, og er 1/96, hvilket kendetegner tidsintervallet mellem de observerede afkast. Hvis standardafvigelsesserierne benævnes henholdsvis v j og v k er det intuitivt at generere en korrelationsserie som corr, cov, / v, v, hvilken samtidig analyseres i det efterfølgende. jkt jkt jt kt, 3. Afkasts- og volatilitetsfordelinger I dette kapitel præsenteres de empiriske resultater for afkast og volatilitet. Resultaterne for NOVO og TDC sammenholdes med resultaterne for de 30 DJIA aktier i ABDE (2001) Afkast De ufiltrerede dagsafkast, benævnt r j,t, der blot er beregnet som 100 gange forskellen på de logaritmiske kurser umiddelbart inden lukketid på to på hinanden følgende dage, er illustreret som histogrammer i figur 3.1. Figur 3.1. Afkast for NOVO og TDC, r NOVO,t og r TDC,t

12 Som forventet er disse afkast langt fra normalfordelte. Der ligger forholdsvis mange observationer omkring nul, og enkelte på op til ±12 procent. Fordelingerne har hvad der ofte kaldes tykke haler, og som illustreret senere i tabel 3.2. betyder dette, at fordelingerne er leptokurtiske, det vil sige de har en kurtosis over 3. Derudover er begge fordelinger venstreskæve, da de har negative skewness mål. Dette overrasker måske lidt i forhold til ABDE (2001), der fandt at langt hovedparten af afkastserierne var højreskæve ARCH og GARCH modeller En efterhånden meget udbredt metode til at håndtere sådanne afkastfordelinger er at modellere variansen som en ARCH- eller GARCH-proces 6. Det er vist for en lang række tidsserier, at tykke haler kan skyldes volatilitetsklumpninger, da store udsving henholdsvis små udsving ofte følger hinanden. Ved at lade volatiliteten på tidspunkt t afhænge af fejl og eventuelt også volatilitet på tidspunkter før t, kan man således få pænere afkastfordelinger. Det illustreres med line graphs i følgende figur, at der tyder på at være volatilitetsklumpninger i begge serier. Figur 3.2. Line graphs for r NOVO,t og r TDC,t Inden der estimers ARCH- og GARCH-modeller for de to serier, undersøges deres tidsserieegenskaber for at kunne tage højde for eventuelle afhængigheder i afkastene. Et korrelogram for NOVO viser signifikant første ordens autokorrelation. Det kan ikke pr. øjemål vurderes, hvorvidt en AR(1)- eller en MA(1)-proces synes at passe bedst, så forskellige modeller må estimeres. For TDC 6 Se f.eks. Bera & Higgins (1993) 10

13 er der ingen signifikante autokorrelationer. Som illustreret i tabel 3.1. findes følgende modeller at passe bedst, vurderet ud fra Schwarz-kriteriet 7. Tabel 3.1. GARCH-modeller for dagsafkast for NOVO og TDC NOVO Koefficient Std. Afv. z-stat P-værdi C MA(1) Variance Equation C ARCH(1) GARCH(1) TDC Koefficient Std. Afv. z-stat P-værdi Variance Equation C ARCH(1) GARCH(1) For NOVO modelleres afkastet som en MA(1)-proces med konstant og variansen som en GARCH(1,1) proces, hvilket ønskes at give følgende egenskaber (fodtegnet NOVO er underforstået for resten af parametrene og er blot udeladt for at lette notationen) r µ ε θ ε r ε r µ θ ε r N σ (3.1a) 2 NOVO, t = + t 1 t 1 NOVO, t = t = NOVO, t + 1 t 1, NOVO, t ~ (0, t ) σ = α0 + αε 1 1+ βσ 1 z, = r, / σ ~ N(0,1) (3.1b) t t t NOVO t NOVO t t For TDC anvendes hverken konstant, AR- eller MA-led til afkastet, mens variansen også her modellers som en GARCH(1,1) proces. Således ønskes følgende egenskaber (fodtegn TDC kun anvendt for afkast og standardiseret residual) 7 Ifølge Greene (2000) s. 306 har dette kriterium ingen åbenlys fordel frem for Akaike. Dog straffer Schwarz hårdere for tabet af frihedsgrader, hvilket kan give sig udslag i en simplere model. Scwartz-kriteriet er ifølge Carsten Tanggard at foretrække i store stikprøver. 11

14 r = r =ε r N σ (3.2a) 2 TDC, t TDC, t t, TDC, t ~ (0, t ) σ = α0 + αε 1 1+ βσ 1 z, = r, / σ ~ N(0,1) (3.2b) t t t TDC t TDC t t Begge serier beskrives bedst ved GARCH(1,1)-modellen præsenteret af Bollerslev i Fordelen ved denne er, at den i stedet for en ARCH-model med mange lags af de kvadrerede fejl opsamler disse i selve variansen fra tidspunkt t-1. På denne måde fås en mere parsimonius estimation, da færre parametre skal estimeres, hvilket belønnes af Schwarz-kriteriet. Begge standardiserede residualer skulle gerne følge en standardnormalfordeling, hvis al volatilitetsklumpning er modelleret. Følgende histogrammer med tilhørende beskrivende mål viser, at dette ikke et tilfældet, men at kurtosis dog er nedbragt i forhold til de rene afkastserier. Figur 3.3. Standardiserede residualer for GARCH modellerne, z NOVO,t og z TDC,t Mean Skewness Std. Dev Kurtosis Mean Skewness Std. Dev Kurtosis Standardisering med realiserede standardafvigelser I stedet for at standardisere med en volatilitet fra en GARCH-model, hvilket som vist ovenfor ikke giver normalfordelte afkast for hverken NOVO eller TDC, standardiseres afkastene nu med de realiserede standardafvigelser estimeret på baggrund af de filtrerede 5-minutters afkast, som foreslået i ABDE (2001). Dette benævnes r j,t /v j,t, og de ustandardiserede og standardiserede afkast sammenlignes i tabel

15 Tabel 3.2. Beskrivende mål for r NOVO,t, r TDC,t, r NOVO,t /v NOVO,t og r TDC,t /v TDC,t Afkast r j,t Std.afk. r j,t /v j,t Aktie Mean St.dev. Skew. Kurt. Mean St.dev. Skew. Kurt. NOVO 0,0857 1,5567-0,4596 9,0599 0,0307 0,3875-0,1136 3,0203 TDC 0,0759 1,9271-0,1396 8,9580 0,0066 0,4049-0,1723 3,2932 De standardiserede afkast har en betydelig lavere kurtosis, bemærkelsesværdigt er NOVO s kun marginalt større end 3. TDC s kurtosis er også kraftigt reduceret, og selv om den er på lidt over normalfordelingens kurtosis på 3, er resultatet sammenlignet med ABDE (2001) ikke ekstremt. Det svarer omtrent til deres 75% fraktil. Med hensyn til skævheden opfører NOVO sig igen pænest, da denne bliver reduceret til under en tredjedel, mens TDC s faktisk stiger (numerisk) en anelse. For at illustrere de standardiserede afkast anvendes kernel-tætheder. Problemet med at illustrere normalfordelte observationer med histogrammer er, at illustrationen bliver et direkte resultat af, hvilke intervaller observationerne klassificeres i. Normalfordelingen er kontinuer mens histogrammet tvinger en diskretisering ned over observationerne. Kernel-tæthedsestimation fitter en jævn kurve ved at estimere en smoothing parameter, kaldet h 8. Tæthedsfunktionen estimeres som: N 1 x X i f ( x) = K (3.3) Nh i= 1 h Hvor N er antal observationer og K er kernel-funktionen. For NOVO blev h estimeret til 0,0857 og for TDC blev h estimeret til 0, Jf. Silverman (1986). 13

16 Figur 3.4. Fordelinger for de standardiserede afkast for NOVO og TDC Det er på øjemål svært at fastlægge, om fordelingerne for NOVO og TDC følger en normalfordeling, hvorfor vi har valgt at analysere dette nærmere. Som det kan observeres, har vi undladt at fratrække de respektive gennemsnit og dividere med de respektive standardafvigelser, hvorfor fordelingerne ikke kan sammenlignes med standardnormalfordelingen. Målet med ovenstående figurer er at illustrere fordelingerne for observationernes faktiske værdier fremfor at kunne sammenligne med fordelingerne fra blandt andet GARCH-modellerne. For at teste om fordelingerne er normalfordelte anvendes Jarque-Bera (JB) testeren: N k JB = S + ( K 3) (3.4) 6 4 hvor N er antal observationer, S er skewness, K er kurtosis og k er antal estimerede koefficienter anvendt til at estimere serien. JB følger en χ 2 fordeling med 2 frihedsgrader. I tabel 3.3 vises kun JBtestet for de standardiserede afkast, da nulhypoteserne for de ustandardiserede afkast naturligvis blev meget kraftigt forkastet. Tabel 3.3. Jarque-Bera test for om de standardiserede afkast er normalfordelte Aktie Jarque-Bera P-værdi NOVO 3, , TDC 9, ,

17 Nulhypotesen, om at NOVO s standardiserede afkast følger en normalfordeling, fastholdes altså med en p-værdi på knap 0,3. Hypotesen for TDC forkastes dog med en p-værdi på 0,0086, men generelt må det konkluderes, at disse resultater er i overensstemmelse med resultaterne fra ABDE (2001) Varianser og logaritmiske standardafvigelser De realiserede daglige varianser er som beskrevet beregnet på baggrund af de kvadrerede 5- minutters filtrerede afkast. De logaritmiske standardafvigelser er beregnet som ( ) 2 ln v it,. Beskrivende mål for disse er illustreret i tabel 3.4. Tabel 3.4. Beskrivende mål for v 2 NOVO,t, v 2 TDC,t, lv NOVO,t og lv TDC,t Realiseret varians v 2 jt, Realiseret log-standardafvigelse lv j,t Aktie Mean St.dev. Skew. Kurt. Mean St.dev. Skew. Kurt. NOVO 17, , , ,7888 1,0747 0,5764 0,1539 2,9822 TDC 23, ,3669 9, ,2040 1,3015 0,4685 0,6951 3,9535 Det bemærkes at de realiserede daglige varianser er forholdsvis høje. For NOVO er den gennemsnitlige varians 17,4, hvilket med traditionel skalering svarer til en årlig standardafvigelse på ca. 17, %. Den tilsvarende årlige standardafvigelse for TDC er helt oppe på ca. 77%. Disse estimater er over dobbelt så store som en skalering af standardafvigelserne på de ufiltrerede daglige afkast i tabel 3.2, hvilket giver resultater på ca. 24,5% ( ) 1, og 30,5% (. Forklaringen herpå skyldes den store intradagvolatilitet, som et variansmål estimeret på de daglige observationer ikke opfanger. 1, ) Begge varianser har desuden ret store standardafvigelser og er meget højreskæve. Der er altså stor spredning på de daglige varianser, og begge serier indeholder få ret store observationer på flere hundrede procent. Dette kunne indikere, at der er problemer med at anvende 5-minutters metoden på dataene, og de følgende resultater ville muligvis forbedres, hvis de få ekstremer udelades. Dette gøres dog ikke, da formålet netop er at undersøge, hvor godt metoden præsenteret i ABDE (2001) virker på danske data. Det skal dog bemærkes, at det ikke var forventet, at varianserne er normal- 15

18 fordelte. Skævheden og topstejlheden er ikke ekstrem sammenlignet med tabel 2 i ABDE (2001), hvor de ligger mellem 75 og 90 procent fraktilerne. De logaritmiske standardafvigelser opfører sig imidlertid betydelig pænere. Gennemsnit og standardafvigelse på de daglige realiserede logaritmiske standafvigelser er stadig høje, men både skævheden og topstejlheden er blevet væsentligt reduceret. Faktisk er kurtosis for NOVO akkurat under 3, og det ses af figur 3.5, at fordelingen for NOVO ligner en normalfordeling. Figur 3.5. Fordelinger for de logaritmiske standardafvigelser for NOVO og TDC Igen er der anvendt kernel-tætheder, for NOVO er smoothing parameteren h estimeret til 0,1275, og for TDC er h estimeret til 0,0962. Det fremgår af både tabel 3.4 og figur 3.5 at TDC s logaritmiske standardafvigelse er højreskæv og leptokurtisk, men sammenholdt med tabel 2 i ABDE (2001) er dette ikke ekstremt. Som for de standardiserede afkast testes normalfordelingshypotesen med et Jarque-Bera test. Kun de logaritmiske standardafvigelser er testet. Tabel 3.5. Jarque-Bera test for om de logaritmiske standardafvigelser er normalfordelte Aktie Jarque-Bera P-værdi NOVO 4, , TDC 131, Ret bemærkelsesværdigt fastholdes nulhypotesen for NOVO. ABDE har ikke foretaget lignende tests, men beregnes JB for deres 30 DJIA aktier udfra tabel B2 i appendix til ABDE (2001), fremgår det, at nulhypotesen kun fastholdes for én aktie, nemlig CHV. Observatorværdien for TDC er sam- 16

19 menholdt med disse 30 aktier ikke ekstrem, men som det fremgår forkastes nulhypotesen. Det kan altså konkluderes, at metoden genererer forholdsvis store estimater, men de logaritmiske standardafvigelser er tæt på at være normalfordelte Kovarians og Korrelation Da der er udtrukket 5-minutters afkast for to aktier, er det muligt at anvende disses filtrerede 5- minutters afkast til at estimere kovarians og korrelation. De daglige kovarianser er som beskrevet estimeret som summen af produktet af de 96 filtrerede afkast for de to aktier. Hvis der skal være en positiv kovarians, hvilket med baggrund i en overvældende mængde finansiel litteratur forventes at være på dagsbasis, betyder det for denne estimation, at de to aktier skal handels i samme retning indenfor det samme 5-minutters interval. Da aktierne som beskrevet ikke handles i alle 5-minutters intervaller, især ikke de første år, må forventningerne til resultatet dog skrues ned. En positiv markedsnyhed kan have indflydelse på den ene aktie i ét interval, men først for den anden aktie i et andet interval, simpelthen fordi de ikke handles tit nok. Det betyder ikke, at de to aktier ikke er positivt korreleret, blot at det ikke kan vises på 5-minutters basis. I tabel 3.6. er de beskrivende mål for kovariansen og korrelationen vist. Korrelationen er beregenet som Cov / v v. NOVO, TDC, t NOVO, t TDC, t Tabel 3.6. Beskrivende mål for kovarians og korrelation Cov Corr,, NOVO, TDC, t NOVO TDC t Mean St.dev. Skew. Kurt. Mean St.dev. Skew. Kurt. 0,7182 3,2732 2, ,0882 0,0399 0,1494 0,2910 5,2787 Der observeres en forholdsvis stor kovarians, sammenlignet med ABDE (2001), men dette skal ses i sammenhæng med de forholdsvis store varianser på de to variable, som illustreret i tabel 3.4. Den gennemsnitlige korrelation er derimod ret lille, mindre end den mindste observeret blandt de 30 DJIA aktier i ABDE (2001). Et simpelt t-test, for om den gennemsnitlige korrelation er lig nul, afvi- 17

20 ser dog nulhypotesen med en p-værdi meget tæt på nul 9, så der er dog en signifikant gennemsnitlig positiv korrelation. For både kovariansen og korrelationen observeres en forholdsvis stor variation over tid, men standardafvigelsen for korrelationen er dog ikke ekstrem sammenholdt med ABDE (2001), da denne er det samme som standardafvigelsen for deres median korrelation. Kovariansen er både højreskæv og leptokurtisk, og dermed langt fra normalfordelt, men igen er disse estimater ikke ekstreme. For korrelationen reduceres både skævhed og kurtosis betydeligt, men resultatet for denne, der ligesom de standardiserede afkast og de logaritmiske standardafvigelser gerne skulle være normalfordelte, er det mest skuffende hidtil. Topstejlheden er større end den største i undersøgelsen af ABDE (2001), og Jarque-Bera testet forkaster klart nulhypotesen om, at korrelationen er normalfordelt. 10 Figur 3.6. viser kernel-tætheden for korrelationen, estimeret med smoothing parameter h lig 0,0297. Figur 3.6. Fordeling for korrelationen mellem NOVO og TDC Som det kan anes til højre i figuren, er der enkelte observationer mellem 0,5 og 1. Disse bidrager naturligvis meget til skævheden og topstejlheden, og hvis der ses bort fra disse, er resultatet trods alt ret pænt. Generelt kan det dog konkluderes, at metoderne fra ABDE (2001) virker overraskende godt på de, i forhold til DJIA aktierne, ret illikvide danske aktier NOVO og TDC. 9 tobs ( ) = 0, 0399 / 0,1494 / 1114 = 8, 91 P værdi JB obs = 256,7 => p- værdi 0 18

21 4. Betingede volatilitetsfordelinger Tidsserieegenskaberne for de bemærkelsesværdigt pæne fordelinger for de realiserede logaritmiske standardafvigelser og korrelationer undersøges nærmere i dette kapitel. Mere specifikt vil der blive fokuseret på seriernes stationaritetsegenskaber Logaritmiske standardafvigelser De realiserede logaritmiske standardafvigelser er som beskrevet dannet ud fra 5-minutters afkast, hvilke blev renset for mikrostruktur-effekter ved en MA(1)-filtrering. Mellem de dagsobservationer forventes imidlertid at være en vis afhængighed, og ligeledes kunne det forventes, at der fremtræder volatilitetsklumpninger. I figur 4.1. er vist tidsserieplot for NOVO og TDC. Figur 4.1. Line graphs for lv NOVO,t og lv TDC,t Som forventet spores en vis grad af positiv afhængighed, da der er en tendens til at visse perioder har høj og visse perioder har lav log-volatilitet. Signifikante effekter bør naturligvis ikke konkluderes på øjemål, så derfor estimeres autokorrelationfunktionen, ACF, og den partielle, PACF. Figurer for begge disse er ikke medtaget her, men senere i figur 4.2. vises SACF for de to aktier. Her ønskes det blot undersøgt, hvorvidt der er signifikant autokorrelation i serierne, hvilket gøres med Ljung- Box s Q-statistik: r Q = T ( T + 2) (4.1) k p 2 k k = 1 T 19

22 Jf. Greene (2000) har denne korrigerede Q-statistik bedre finite sample egenskaber end Box-Pierce Q-statistikken, begge følger dog en χ 2 fordeling med p frihedsgrader. Ljung-Box er estimeret på op til 200 lags for begge serier, og i alle tilfælde forkastes nulhypotesen om insignifikant autokorrelation ret kraftigt. For at sammenligne med resultaterne fra ABDE (2001) vises Q-testene for p = 22 i tabel 4.1. Tabel 4.1. Ljung-Box Q-test for p = 22 Aktie Q 22 Kritisk værdi (1%) P-værdi NOVO 3454,8 40,29 0 TDC 353,38 40,29 0 Resultaterne er på linie med ABDE (2001), og til trods for at Q for TDC er noget lavere end selv den mindste blandt de 30 DJIA aktier forkastes nulhypotesen ved et hvert tænkeligt valg af signifikansniveau. Af figur 4.2. fremgår endvidere, at der er tale om signifikant positiv autokorrelation Enhedsrødder i volatilitetsserierne Det er værd at hæfte sig ved, at specielt for NOVO dør ACF kun langsomt ud. Helt oppe på lag 100 er der stadig en autokorrelation på 0,237. Når ACF kun dør langsomt ud, kunne man have en formodning om, at serierne ikke er stationære. Det vil derfor i det følgende bliver undersøgt, om serierne for de to aktiers logaritmiske standardafvigelser er I(1). Det er valgt at anvende et Augmentet Dickey-Fuller test (ADF), da dette inddrager laggede differencer af den afhængige variabel, til trods for at testes svaghed er, at det som præsenteret i det følgende kun er anvendeligt, hvis de undersøgte serier kan identificeres som rene AR-processer, og således ikke med MA-led. 11 Ved inddragelse af netop så mange argumenter, at fejlledet i (4.2) er hvid støj kan ADF-testet anskues som en parametrisk korrektion for højere ordens seriel korrelation. Der findes dog et relativt simpel alternativ til dette test givet af Phillips-Perron, som opstiller en ikkeparametrisk korrektion af t-statistikken fra regressionen (4.2) således at denne tager højde for seriel korrelation i fejlledet Dog viser Said & Dickey (1984), at ADF-testet stadig kan anvendes selvom serien indeholder et moving average element givet, at regressionen er velspecificeret med hensyn til antallet af laggede argumenter. 12 Korrektionen tager udgangspunkt i et Newey-West heteroskedastisk og autokorrelations konsistens estimat. 20

23 Dickey-Fuller testet udledes ved at opstille en simpel AR(1), hvorefter lv t-1 fratrækkes på begge sider (fodtegn j til betegnelse af hver af de to aktier er udeladt) lvt = + lvt 1 + t µ γ ε = + +ε (4.2) lvt µ γ * lvt 1 t Hvor γ * = γ 1 og ε t er hvid støj. Der testes for om γ* = 0, hvilket fastholder nulhypotesen om en enhedsrod. Som nævnt anvendes imidlertid ADF, hvilket udvider (4.2) med laggede differencer som følger: p lvt = + γ lvt j= 1 µ * ϕ lv + ε (4.3) j t j t Stadig testes for om γ* = 0. Dette test er følsom overfor antallet af lags, der medtages i estimationen. Ved at medtage tilstrækkelig mange vil nulhypotesen altid kunne fastholdes, det vil sige testet bliver meget svagt. For igen at sammenligne med resultaterne fra ABDE (2001) er testet kørt på NOVO og TDC med 22 augmentationslags, resultatet er vist i tabel 4.2. Tabel 4.2. ADF test for enhedsrødder i lv NOVO,t og lv TDC,t Aktie γ* t-stat Kritisk værdi (5%) Kritisk værdi (1%) NOVO -0, , ,8646-3,4391 TDC -0, , ,8646-3,4391 t-statistikkerne følger ikke den normale t-fordeling under nulhypotesen, derfor anvendes MacKinnon kritiske værdier, og en p-værdi kan således ikke direkte beregnes. Det ses, at γ* er signifikant mindre end nul på et 5% niveau for NOVO og på et 1% niveau for TDC. I begge tilfælde kan nulhypotesen om en enhedsrod altså forkastes med at rimeligt valg af signifikansniveau, og resultaterne er helt på linie med ABDE (2001), der forkastede for 26 ud af 30 DJIA aktier. Selv om konklusionen for NOVO er følsom over for valg af signifikansniveau, skal det bemærkes, at ADF testet er svagt når der medtages mange augmentationslags. Her forkastes begge hulhypoteser selv med 22 lags, der blev valgt for at kunne sammenligne resultaterne med ABDE (2001), men adskillige af ϕ-estimaterne er insignifikante, og reduceres udtrykket med disse fås naturligvis et re- 21

24 sultat, der er endnu mere signifikant end det ovenstående. Der skulle derfor ikke være grund til at tvivle på, at serierne ikke er I(1) Hyperbolsk henfald i SACF Årsagen til, at SACF kun dør langsomt ud kunne altså ikke findes i hypotesen om, at de to serier indeholder enhedsrødder. Til brug i afsnit 5 om fraktionel integration undersøges det her, om henfaldet i SACF kan betragtes som hyperbolsk, i modsætning til det mere traditionelle eksponentielle henfald, der ofte observeres i stationære tidsseriers SACF. I figur 4.2. er SACF for de realiserede logaritmiske standardafvigelser plottet mod lag-nummer (horisont, h). For Novo er medtaget 100 lags, mens der for TDC kun er medtaget 23 lags, hvorefter enkelte estimerede autokorrelationer bliver negative. Figur 4.2. SACF for lv NOVO,t og lv TDC,t 0,7 0,6 0,5 0,4 0,3 0,2 0, ,45 0,4 0,35 0,3 0,25 0,2 0,15 0,1 0, ACF Hyperbolsk ACF Hyperbolsk Specielt for NOVO synes kurven at fitte rigtig godt. For TDC er den hyperbolske kurve kun beregnet på baggrund af de første 23 positive observationer, så selv om kurven ser ud til at fitte disse observationer godt, er denne ikke lige så informativ, som tilfældet er for NOVO. I figurerne er ikke indlagt eksponentielle henfaldskurver, men disse estimers i det følgende for at sammenligne. Begge kurver er estimeret gennem lineær regression ved at foretage følgende omskrivninger, hvor h er lag-nummeret 13 For NOVO og TDC er γ* henholdsvis 3,708 og 9,222 ved henholdsvis 15 og 5 argumenter. 22

25 Hyperbolsk henfald SAC ch 2d F = 1 ln( SACF) = ln( c) + (2d 1) ln( h) (4.3a) Eksponentielt henfald SACF = ce β *h ln( SACF) = ln( c) + β * h (4.3b) Parametrene er estimeret og illustreret i tabel 4.3. sammen med forklaringsgraderne på regressionerne. Tabel 4.3. Resultater fra fittede kurver for SACF for lv NOVO,t og lv TDC,t Hyperbolsk Eksponentiel Aktie Ln(c) (2d-1) R 2 Ln(c) β R 2 NOVO -0, , ,771-1, , ,646 TDC -0, , ,825-1, , ,626 Det fremgår tydeligt af tabel 4.3, at kurverne med hyperbolsk henfald fitter bedre til SACF for begge aktier. Det bemærkes dog igen, at forklaringsgraden for TDC måske er kunstigt høj, idet det kun kan konkluderes, at hyperbolsk henfald fitter bedre til de første 23 observationer Korrelationen Serien med de realiserede korrelationer levede som tidligere beskrevet ikke op til vores forhåbninger. I ABDE (2001) gennemføres en analyse tilsvarende den ovenstående for den betingede korrelationsfordeling. I figur 4.3. vises et tidsserieplot for denne. 23

26 Figur 4.3. Line graph for korrelationen Korrelationsserien ser ud til at opføre sig pænt, og der er ikke signifikant autokorrelation ved nogen lags, vurderet ud fra Ljung-Box Q-statistikken. Det er derfor ikke fundet interessant at arbejde videre med denne serie. Der gennemføres derfor ikke ADF-test på serien, som det blev foretaget for de logaritmiske standardafvigelser i forrige afsnit, og serien bliver ikke inddraget i kommende afsnit om fraktionel integration. 5. Langtidshukommelse i de logaritmiske volatilitetstidsserier Identifikationen af long-memory processer, karakteriseret ved høj autokorrelation mellem observationer over store tidsintervaller, er efterhånden en meget udbredt disciplin. Disse stationære processer er karakteriseret ved en langsom hyperbolisk aftagende autokorrelationsfunktion i modsætning til det hurtigere eksponentielle aftag, der karakteriserer de traditionelle stationære tidsserier. I det kommende vil vi jf. ABDE (2001) fokusere på en mulig langtidshukommelse i tidsserierne for de realiserede log-standardafvigelser for henholdsvis NOVO og TDC. Afsnittet vil først kortfattet klarlægge teorien bag long-memory processer, hvor spektralanalysen bliver introduceret. Efterfølgende vil Geweke & Porter-Hudak s (GPH) log-periodogram-regression ligge til grund for en egentlig estimation af integrationsordenen, hvorunder en alternativ estimationsprocedure vil blive brugt som sammenligningsgrundlag. 24

27 5.1. Modellering af long-memory processer Betragt en tidsserie med autokorrelationsfunktion ρ k. For de traditionelle stationære tidsserier vil autokorrelationsfunktionen dø hurtigt ud med en eksponentiel udvikling, hvilket samtidig bevirker, at grænseværdien for summen af de nummeriske autokorrelationer konvergerer i stikprøven. Modsætningsvis vil samme grænseværdi ikke konvergere, men derimod divergere, hvis serien udviser lang hukommelse. Altså vil: ρk = (5.1) n k = 0 lim n Ved hjælp af lag-operatoren, L, kan en sådan serie dog stadig opskrives som hvid støj, hvilket i litteraturen kaldes en fraktionel differenset hvid støj tidsserie: 2 ( 1 ) d ε, ε ~IID ( 0, ) d yt = L yt = t t σ ε (5.2a) d 2 ( L) ( L) yt ( 1 L) ( L) ( L) yt t, t~iid ( 0, ε ) d 1 1 θ φ = θ φ = ε ε σ (5.2b) hvor (5.2a) kendetegner en ARFIMA( 0, d,0) θ ( L) 14, og (5.2b) en (,,, hvor ARFIMA p d q) φ ( L) er de respektive lag-polynomier med rødder udenfor enhedscirklen. Til illustration af teorien er det umiddelbart kun nødvendigt at fokusere på førstnævnte, hvorfor dette gøres i det følgende. og Jf. Mills (Esben Høg, 1993) kan (5.2a) omskrives gennem de autoregressive koefficienter, φ k, til: d t = φk t k = k = 0 y y εt (5.3) hvor de autoregressive koefficienter kan gengives ved en binomialrække, eller lettere gennem gammafunktionen: 14 Når d = 1 genkendes (5.2a) som den klassiske random walk uden drift. 25

28 Γ( ) ( ) ( 1) k d k d φk = ( 1) = k Γ d Γ k+ (5.4) For processen d yt = εt, hvor t ε er hvid støj og d < ½ kan det vises, at y t er stationær og invertibel med variansen: var ( y ) t ( 1 2d ) ( 1 d ) Γ = γ = Γ 0 2 (5.5) hvilken kan vises at være endelig når d < ½. Med viden omkring gammafunktionen kan der af udtrykket for autokorrelationsfunktionen (5.6) ses, at denne aftager hyperbolsk, hvis d < ½. 15 ( 1 d) ( k d) ( d) ( k 1 d) Γ Γ + ρk = Γ Γ + 2d 1 c k for k (5.6) Heraf fremkommer det, at autokorrelationsfunktionen for sådanne fraktionelt integrerede processer vedbliver signifikante endda ved lange lags, hvilket har givet anledning til navnet long-memory processer The frequency Domain Spektralanalysen Indtil nu har vi kun analyseret vores tidsserier i det, der kaldes tidsdomainet, hvilket skal forstås ved, at vi kun har analyseret seriernes tidsmæssige egenskaber. Enhver kovarians-stationær proces kan imidlertid ikke kun opskrives i tidsdomainet, men også i frekvensdomainet, hvorved spektralanalysen kan udføres 16. I frekvensdomainet er interessen centreret omkring, hvorledes bidraget er fra seriens forskellige periodiske komponenter. Disse komponenter behøver ikke nødvendigvis at blive identificeret som regulære cykler i et plot af serien. Faktisk forholder det sig ifølge Harvey (1993) således, at økonomiske tidsserier kun indeholder tendenser til cykliske bevægelser omkring 15 Se Butler (1996) og Whitcher & Jensen (2000). Deo & Hurvich (1999) viser eksplicit, at en serie siges at have long memory hvis 2d 1 korrelationsfunktionen har udseendet: ρ k ~ ck for k. 16 Se Hamilton (1994), s. 152ff. 26

29 en specifik frekvens. Det er med afsæt i netop dette spektrum eller den spektrale tæthedsfunktion, at vi ifølge GPH (1983) kan estimere den fraktionelle integrationsorden, d. Inden vi kaster os ud i spektralanalysen, er det nyttigt at have kendskab til sammenhængen mellem autokorrelationsfunktionen, der observeres i korrelogrammet, og spektrummet, der observeres i periodogrammet. Som nævnt er dette to sider af samme sag, hvorfor der er en direkte sammenhæng mellem eksistensen af høje autokorrelationer over store lags, og en stor dynamik i spektrummet ved lave frekvenser. 17 Ifølge Greene (2000) kan en tidsseries autokovariansfunktion opskrives ved dennes spektrum eller spektrale tæthedsfunktion som: k π y ( ) cos( ) γ = f ω kω dω (5.7) π hvor frekvenserne, ω j, for hvilke analysen gennemføres, er givet ved fourier frekvenserneω = 2 π j / T. Det er ifølge Hamilton (1994) en konvention, at der kun fokuseres på positive fre- j kvenser, men grundet symmetrien omkring ω = 0 kan (5.7) stadig estimeres. 18 Med denne information bag os er det nu intuitivt at fokusere kortfattet på selve teorien bag spektrummet for opgavens ARFIMA-proces Teorien bag spektralanalysen Omskrives den stationære ARFIMA( p, d, q) -proces i (5.2b) til: ( ) d 1 L y u u ( L) ( L) 1 =, = φ θ ε, (5.8) t t t t kan dennes spektrum opskrives som: i 2 2 ( ) 1 ω d d j ω ( ω ) 4sin ( ω /2) ( f = e f = f ω (5.9) y j u j j u j ) 17 Jf. Greene (2000), s. 769ff. 18 Da cos( ω ) = cos( ω) fy( ω) = f y( ω) er værdierne i hele spektrummet kendt når værdierne for ω er kendt i intervallet [0,π]. Se endvidere Greene (2000), s

30 Hvis u t i (5.8) er hvid støj, er spektrummet for denne givet ved ( ) ( ) 1 2 f ω 2π σ u j =. 19 Logtransformeres (5.9) fås et udtryk, hvor graden af fraktionel integration, d, ikke længere står i potensen, men som koefficient: u 2 ( ω ) = ( ω ) ( ω ) ln fy j ln fu j dln 4sin j / 2 (5.10) Hvis vi som Butler (1996) trækker ln ( 0) f u fra på begge sider af (5.10) og samtidig tillægger logperiodogrammet af y t, ln I y ( ω j ), hvilket er stikprøveestimatet på spektrummet, på begge sider og isolerer, får vi følgende: 2 ( ω ) = ( ) ( ω ) + ( ω ) ( ω ) + ( ) ( ) ln Iy j ln fu 0 dln 4sin j / 2 ln Iy j / fy j ln fu ω j / fu 0 (5.11) Udtrykket i (5.11) kan yderligere simplificeres når frekvensen mindskes, idet sidste led i (5.11) går mod nul når frekvensen, ω, går mod nul. Ifølge GPH (1993) er ln Iy( ω j) / fy( ω j) ω j, hvorfor GPH s log-periodogram-regression er baseret på følgende udtryk: IID over alle 2 ( ) ( ) ln I y ω j = α βln 4sin ω j / 2 + ν j for j = 1,.., K (5.12) hvor α og β er konsistente OLS estimater på henholdsvis ln 0 og d, og ν = ln I / ( ω ) f ( ω j) j y j y. Samtidig er K det største harmoniske ordinat (frekvens), der anvendes i ( ) analysen, således at 0 < K < g T, hvor g(t) er en upper-bound funktion for K. I litteraturen fastlægges g(t) apriori normalt til T λ, hvor T er stikprøvestørrelsen og 0,5 λ 0,7, idet dette giver det bedste empiriske resultat. Dog er valget af denne funktion ikke negligibelt, idet der ifølge Butler plim β d = 0. Denne diskussion har vi fravalgt, men (1996) eksisterer en funktion således, at T ( ) vi laver dog en kortfattet scenarieanalyse for at anskueliggøre estimaternes følsomhed overfor ændringer i λ. f u ( ) 19 Jf Hamilton (1994), s

31 De empiriske resultater af periodogram-regressionen Med inspiration fra GPH (1983) samt Butler (1996) er SAS anvendt til estimation af den fraktionelle integrations-parameter, d. Dette er gjort ved først at anvende det indbyggede modul Proc Spectra, der estimerer periodogrammet for den valgte serie, for derefter at køre regressionen i (5.12) gennem modulet Proc Reg. Dette har givet os følgende estimater for henholdsvis NOVO og TDC ved λ = 0,65: Tabel 5.1. De fraktionelle integrations parameter-estimater Variabel Koefficient Std. afv. t-stat P-værdi NOVO C <.0001 D <.0001 TDC C <.0001 D <.0001 Som der kan ses af tabellen, er begge estimater mindre end ½, hvorfor processerne er stationære. Dog er de af programmet estimerede standardafvigelser ikke anvendelig ifølge Deo & Hurvich (1999), idet deres resultater påviser, at parameteren, d, er asymptotisk normalfordelt med standardafvigelse π(24m) -½, hvor m er lig T λ. For vores resultater bevirker det, at den asymptotiske standardafvigelser kan beregnes til 0,066, hvilket ikke ændrer på konklusionerne, at den fraktionelle integrationsparameter for begge aktiers vedkommende er signifikant forskellig fra både 0 og 1. I nedenstående tabel ses vores simple scenarieanalyse, der tydeligt viser vores estimaters følsomhed overfor ændringer i λ. Tabel 5.2 Integrationsordenens følsomhed overfor stikprøvestørrelsen. λ Stikprøve d NOVO Std.afv. d TDC Std. afv. Asymp. std.afv 0, ,5141 0,1377 0,3043 0,1082 0,111 0, ,5032 0,1147 0,2628 0,0833 0,101 0, ,4413 0,0945 0,2156 0,0638 0,078 0, ,3781 0,0729 0,2591 0,0544 0,066 0, ,2986 0,0568 0,2765 0,0461 0,055 29

Konfidensintervaller og Hypotesetest

Konfidensintervaller og Hypotesetest Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller

Læs mere

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i.

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i. Repetition af vektor-regning Økonometri: Lektion 3 Matrix-formulering Fordelingsantagelse Hypotesetest Antag vi har to n-dimensionelle (søjle)vektorer a 1 b 1 a 2 a =. og b = b 2. a n b n Tænk på a og

Læs mere

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven. PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve

Læs mere

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17 nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse

Læs mere

Tema. Dagens tema: Indfør centrale statistiske begreber.

Tema. Dagens tema: Indfør centrale statistiske begreber. Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i

Læs mere

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning 1 Multipel regressions model Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning PSE (I17) ASTA - 11. lektion

Læs mere

Appendiks Økonometrisk teori... II

Appendiks Økonometrisk teori... II Appendiks Økonometrisk teori... II De klassiske SLR-antagelser... II Hypotesetest... VII Regressioner... VIII Inflation:... VIII Test for SLR antagelser... IX Reset-test... IX Plots... X Breusch-Pagan

Læs mere

Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model

Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model Reminder: Hypotesetest for én parameter Antag vi har model Økonometri: Lektion 4 F -test Justeret R 2 Aymptotiske resultater y = β 0 + β 1 x 2 + β 2 x 2 + + β k x k + u. Vi ønsker at teste hypotesen H

Læs mere

Out-of-sample forecast samt reestimation af ADAMs lønligning

Out-of-sample forecast samt reestimation af ADAMs lønligning Danmarks Statistik MODELGRUPPEN Arbejdspapir* Peter Agger Troelsen 31. oktober 2013 Out-of-sample forecast samt reestimation af ADAMs lønligning Resumé: Papiret reestimerer ADAMs lønligning og vurderer

Læs mere

Økonometri: Lektion 4. Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater

Økonometri: Lektion 4. Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater Økonometri: Lektion 4 Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater 1 / 35 Hypotesetest for én parameter Antag vi har model y = β 0 + β 1 x 2 + β 2 x 2 + + β k x k + u. Vi

Læs mere

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som MLR antagelserne Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som y = β 0 + β 1 x 1 + β 2 x 2 + + β k x k + u, hvor β 0, β 1, β 2,...,β k er ukendte parametere,

Læs mere

1. Intoduktion. Undervisningsnoter til Øvelse i Paneldata

1. Intoduktion. Undervisningsnoter til Øvelse i Paneldata 1 Intoduktion Før man springer ud i en øvelse om paneldata og panelmodeller, kan det selvfølgelig være rart at have en fornemmelse af, hvorfor de er så vigtige i moderne mikro-økonometri, og hvorfor de

Læs mere

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet Eksamen ved Københavns Universitet i Kvantitative forskningsmetoder Det Samfundsvidenskabelige Fakultet 14. december 2011 Eksamensnummer: 5 14. december 2011 Side 1 af 6 1) Af boxplottet kan man aflæse,

Læs mere

Module 4: Ensidig variansanalyse

Module 4: Ensidig variansanalyse Module 4: Ensidig variansanalyse 4.1 Analyse af én stikprøve................. 1 4.1.1 Estimation.................... 3 4.1.2 Modelkontrol................... 4 4.1.3 Hypotesetest................... 6 4.2

Læs mere

Økonometri 1. Inferens i den lineære regressionsmodel 2. oktober Økonometri 1: F8 1

Økonometri 1. Inferens i den lineære regressionsmodel 2. oktober Økonometri 1: F8 1 Økonometri 1 Inferens i den lineære regressionsmodel 2. oktober 2006 Økonometri 1: F8 1 Dagens program Opsamling om asymptotiske egenskaber: Asymptotisk normalitet Asymptotisk efficiens Test af flere lineære

Læs mere

PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006

PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006 PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006 I dag: To stikprøver fra en normalfordeling, ikke-parametriske metoder og beregning af stikprøvestørrelse Eksempel: Fiskeolie

Læs mere

Reestimation af importrelationer

Reestimation af importrelationer Danmarks Statistik MODELGRUPPEN Arbejdspapir Nis Mathias Schulte Matzen 28. november 211 Reestimation af importrelationer Resumé: Papiret estimerer import relationerne på to forskellige datasæt. Et korrigeret

Læs mere

Center for Statistik. Multipel regression med laggede responser som forklarende variable

Center for Statistik. Multipel regression med laggede responser som forklarende variable Center for Statistik Handelshøjskolen i København MPAS Tue Tjur November 2006 Multipel regression med laggede responser som forklarende variable Ved en tidsrække forstås i almindelighed et datasæt, der

Læs mere

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007 Rettevejledning til eksamen i Kvantitative metoder 1,. årsprøve. januar 007 I rettevejledningen henvises der til Berry and Lindgren "Statistics Theory and methods"(b&l) hvis ikke andet er nævnt. Opgave

Læs mere

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Normalfordelingen. Statistik og Sandsynlighedsregning 2 Normalfordelingen Statistik og Sandsynlighedsregning 2 Repetition og eksamen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange variable, blandt andet tilfældige fejl på

Læs mere

Betydningen af konjunktur og regelændringer for udviklingen i sygedagpengemodtagere

Betydningen af konjunktur og regelændringer for udviklingen i sygedagpengemodtagere DET ØKONOMISKE RÅD S E K R E T A R I A T E T d. 20. maj 2005 SG Betydningen af konjunktur og regelændringer for udviklingen i sygedagpengemodtagere Baggrundsnotat vedr. Dansk Økonomi, forår 2005, kapitel

Læs mere

Stokastiske stød til ADAMs adfærdsrelationer

Stokastiske stød til ADAMs adfærdsrelationer Danmarks Statistik MODELGRUPPEN Arbejdspapir Jacob Nørregård Rasmussen 29. september 2011 Stokastiske stød til ADAMs adfærdsrelationer Resumé: I dette papir aftrendes visse af de store makrovariable og

Læs mere

1 Regressionsproblemet 2

1 Regressionsproblemet 2 Indhold 1 Regressionsproblemet 2 2 Simpel lineær regression 3 2.1 Mindste kvadraters tilpasning.............................. 3 2.2 Prædiktion og residualer................................. 5 2.3 Estimation

Læs mere

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen

Statistik Lektion 3. Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen Statistik Lektion 3 Simultan fordelte stokastiske variable Kontinuerte stokastiske variable Normalfordelingen Repetition En stokastisk variabel er en funktion defineret på S (udfaldsrummet, der antager

Læs mere

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved Matematisk Modellering 1 (reeksamen) Side 1 Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved { 1 hvis x {1, 2, 3}, p X (x) = 3 0 ellers,

Læs mere

Normalfordelingen og Stikprøvefordelinger

Normalfordelingen og Stikprøvefordelinger Normalfordelingen og Stikprøvefordelinger Normalfordelingen Standard Normal Fordelingen Sandsynligheder for Normalfordelingen Transformation af Normalfordelte Stok.Var. Stikprøver og Stikprøvefordelinger

Læs mere

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 1 Regressionsproblemet 2 Simpel lineær regression Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 3

Læs mere

Kvantitative Metoder 1 - Forår 2007

Kvantitative Metoder 1 - Forår 2007 Dagens program Estimation: Kapitel 9.1-9.3 Estimation Estimationsfejlen Bias Eksempler Bestemmelse af stikprøvens størrelse Konsistens De nitioner påkonsistens Eksempler på konsistente og middelrette estimatorer

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

Appendiks 1. Tabel A1 Likviditetskrav for de analyserede handelsstrategier

Appendiks 1. Tabel A1 Likviditetskrav for de analyserede handelsstrategier Appendiks 1 Dette appendiks indeholder en oversigt over det højeste antal samtidigt replikerede handler og viser således det krav, der stilles til en investors samlede likvide beholdning for at følge en

Læs mere

Kvantitative Metoder 1 - Forår 2007

Kvantitative Metoder 1 - Forår 2007 Dagens program Kapitel 8.7, 8.8 og 8.10 Momenter af gennemsnit og andele kap. 8.7 Eksempel med simulationer Den centrale grænseværdisætning (Central Limit Theorem) kap. 8.8 Simulationer Normalfordelte

Læs mere

Produkt og marked - matematiske og statistiske metoder

Produkt og marked - matematiske og statistiske metoder Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 19, 2016 1/26 Kursusindhold: Sandsynlighedsregning og lagerstyring

Læs mere

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x) Formelsamlingen 1 Regneregler for middelværdier M(a + bx) a + bm X M(X+Y) M X +M Y Spredning varians og standardafvigelse VAR(X) 1 n n i1 ( X i - M x ) 2 Y a + bx VAR(Y) VAR(a+bX) b²var(x) 2 Kovariansen

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

Et eksempel på en todimensional normalfordeling Anders Milhøj September 2006

Et eksempel på en todimensional normalfordeling Anders Milhøj September 2006 Et eksempel på en todimensional normalfordeling Anders Milhøj September 006 I dette notat gennemgås et eksempel, der illustrerer den todimensionale normalfordelings egenskaber. Notatet lægger sig op af

Læs mere

Løsning til eksaminen d. 14. december 2009

Løsning til eksaminen d. 14. december 2009 DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,

Læs mere

Statistik for ankomstprocesser

Statistik for ankomstprocesser Statistik for ankomstprocesser Anders Gorst-Rasmussen 20. september 2006 Resumé Denne note er en kortfattet gennemgang af grundlæggende statistiske værktøjer, man kunne tænke sig brugt til at vurdere rimeligheden

Læs mere

Note om Monte Carlo metoden

Note om Monte Carlo metoden Note om Monte Carlo metoden Kasper K. Berthelsen Version 1.2 25. marts 2014 1 Introduktion Betegnelsen Monte Carlo dækker over en lang række metoder. Fælles for disse metoder er, at de anvendes til at

Læs mere

Løsning eksamen d. 15. december 2008

Løsning eksamen d. 15. december 2008 Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable

1/41. 2/41 Landmålingens fejlteori - Lektion 1 - Kontinuerte stokastiske variable Landmålingens fejlteori - lidt om kurset Landmålingens fejlteori Lektion 1 Det matematiske fundament Kontinuerte stokastiske variable - rw@math.aau.dk Institut for Matematiske Fag Aalborg Universitet Kursusholder

Læs mere

To samhørende variable

To samhørende variable To samhørende variable Statistik er tal brugt som argumenter. - Leonard Louis Levinsen Antagatviharn observationspar x 1, y 1,, x n,y n. Betragt de to tilsvarende variable x og y. Hvordan måles sammenhængen

Læs mere

Note til styrkefunktionen

Note til styrkefunktionen Teoretisk Statistik. årsprøve Note til styrkefunktionen Først er det vigtigt at gøre sig klart, at når man laver statistiske test, så kan man begå to forskellige typer af fejl: Type fejl: At forkaste H

Læs mere

Introduktion til Statistiske Modeller for Finansielle Tidsserier. Forelæsningsnoter til Finansiel Økonometri

Introduktion til Statistiske Modeller for Finansielle Tidsserier. Forelæsningsnoter til Finansiel Økonometri Introduktion til Statistiske Modeller for Finansielle Tidsserier Forelæsningsnoter til Finansiel Økonometri Jesper Lund mail@jesperlund.com http://www.jesperlund.com 14. marts 2006 1 Indledning Formålet

Læs mere

En Introduktion til SAS. Kapitel 5.

En Introduktion til SAS. Kapitel 5. En Introduktion til SAS. Kapitel 5. Inge Henningsen Afdeling for Statistik og Operationsanalyse Københavns Universitet Marts 2005 6. udgave Kapitel 5 T-test og PROC UNIVARIATE 5.1 Indledning Dette kapitel

Læs mere

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser Uge 43 I Teoretisk Statistik,. oktober 3 Simpel lineær regressionsanalyse Forudsigelser Fortolkning af regressionsmodellen Ekstreme observationer Transformationer Sammenligning af to regressionslinier

Læs mere

Schweynoch, 2003. Se eventuelt http://www.mathematik.uni-kassel.de/~fathom/projekt.htm.

Schweynoch, 2003. Se eventuelt http://www.mathematik.uni-kassel.de/~fathom/projekt.htm. Projekt 8.5 Hypotesetest med anvendelse af t-test (Dette materiale har været anvendt som forberedelsesmateriale til den skriftlige prøve 01 for netforsøget) Indhold Indledning... 1 χ -test... Numeriske

Læs mere

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau Hvad skal vi lave? 1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ. Teststatistik P-værdi Signifikansniveau 2 t-test for middelværdi Tosidet t-test for middelværdi Ensidet t-test for middelværdi

Læs mere

Fokus på Forsyning. Datagrundlag og metode

Fokus på Forsyning. Datagrundlag og metode Fokus på Forsyning I notatet gennemgås datagrundlaget for brancheanalysen af forsyningssektoren sammen med variable, regressionsmodellen og tilhørende tests. Slutteligt sammenfattes analysens resultater

Læs mere

Økonometri 1. Den simple regressionsmodel 11. september Økonometri 1: F2

Økonometri 1. Den simple regressionsmodel 11. september Økonometri 1: F2 Økonometri 1 Den simple regressionsmodel 11. september 2006 Dagens program Den simple regressionsmodel SLR : Én forklarende variabel (Wooldridge kap. 2.1-2.4) Motivation for gennemgangen af SLR Definition

Læs mere

Faktor- og konjunkturanalyse af efterspørgselskomponenter

Faktor- og konjunkturanalyse af efterspørgselskomponenter Danmarks Statistik MODELGRUPPEN Arbejdspapir* Peter Agger Troelsen 05.02.2015 Faktor- og konjunkturanalyse af efterspørgselskomponenter og store brancher i ADAM Resumé: I papiret sammenholdes konjunkturgab

Læs mere

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. Tema Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. (Fx. x. µ) Hypotese og test. Teststørrelse. (Fx. H 0 : µ = µ 0 ) konfidensintervaller

Læs mere

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen Landmålingens fejlteori Lektion Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ - rw@math.aau.dk Institut for Matematiske Fag Aalborg Universitet En stokastisk variabel er en variabel,

Læs mere

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18 Program 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18 Fordeling af X Stikprøve X 1,X 2,...,X n stokastisk X stokastisk. Ex (normalfordelt stikprøve)

Læs mere

Matematik A. Studentereksamen. Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet

Matematik A. Studentereksamen. Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet Matematik A Studentereksamen Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet stx11-matn/a-080501 Tirsdag den 8. maj 01 Forberedelsesmateriale til stx A Net MATEMATIK Der

Læs mere

Løsning til eksaminen d. 29. maj 2009

Løsning til eksaminen d. 29. maj 2009 DTU Informatik 02402 Introduktion til Statistik 20-2-01 LFF/lff Løsning til eksaminen d. 29. maj 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th

Læs mere

Indblik i statistik - for samfundsvidenskab

Indblik i statistik - for samfundsvidenskab Indblik i statistik - for samfundsvidenskab Læs mere om nye titler fra Academica på www.academica.dk Nikolaj Malchow-Møller og Allan H. Würtz Indblik i statistik for samfundsvidenskab Academica Indblik

Læs mere

Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ 2 -test og Goodness of Fit test.

Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ 2 -test og Goodness of Fit test. Lars Andersen: Anvendelse af statistik. Notat om deskriptiv statistik, χ -test og Goodness of Fit test. Anvendelser af statistik Statistik er et levende og fascinerende emne, men at læse om det er alt

Læs mere

Statistiske modeller

Statistiske modeller Statistiske modeller Statistisk model Datamatrice Variabelmatrice Hændelse Sandsynligheder Data Statistiske modeller indeholder: Variable Hændelser defineret ved mulige variabel værdier Sandsynligheder

Læs mere

Stokastiske processer og køteori

Stokastiske processer og køteori Stokastiske processer og køteori 9. kursusgang Anders Gorst-Rasmussen Institut for Matematiske Fag Aalborg Universitet 1 OPSAMLING EKSAKTE MODELLER Fordele: Praktiske til initierende analyser/dimensionering

Læs mere

1 Hb SS Hb Sβ Hb SC = , (s = )

1 Hb SS Hb Sβ Hb SC = , (s = ) PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.

Læs mere

Undervisningsnoter til øvelse i Panel Modeller. %, it. E(x kjs

Undervisningsnoter til øvelse i Panel Modeller. %, it. E(x kjs 4 I afsnit 3 beskæftigede vi os med 1EC modellen og viste, hvordan den kunne estimereres med FGLS - bla under forudsætning af, at det individspecifikke stokastiske led er ukorreleret med de forklarende

Læs mere

Kræver generelt at diverse ventetider er eksponentialfordelte. Faste rammer for serverdiscipliner mv. Svært at modellere ikke-standard køsystemer.

Kræver generelt at diverse ventetider er eksponentialfordelte. Faste rammer for serverdiscipliner mv. Svært at modellere ikke-standard køsystemer. Opsamling eksakte modeller Fordele Praktiske til initierende analyser/dimensionering Ofte nemme at regne på. Kan bruges til at løse optimeringsopgaver, som ellers ville kræve snedige simulationsdesigns.

Læs mere

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ Indhold 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) 2 1.1 Variation indenfor og mellem grupper.......................... 2 1.2 F-test for ingen

Læs mere

Appendiks A Anvendte test statistikker

Appendiks A Anvendte test statistikker Appendiks A Anvendte test statistikker Afhandlingen opdeler testene i henholdsvis parametriske og ikke-parametriske test. De første fire test er parametriske test, mens de ikke-parametriske test udgør

Læs mere

Uddybende beregninger til Produktivitetskommissionen

Uddybende beregninger til Produktivitetskommissionen David Tønners Uddybende beregninger til Produktivitetskommissionen I forlængelse af mødet i Produktivitetskommissionen og i anledning af e-mail fra Produktivitetskommissionen med ønske om ekstra analyser

Læs mere

Statistik Lektion 17 Multipel Lineær Regression

Statistik Lektion 17 Multipel Lineær Regression Statistik Lektion 7 Multipel Lineær Regression Polynomiel regression Ikke-lineære modeller og transformation Multi-kolinearitet Auto-korrelation og Durbin-Watson test Multipel lineær regression x,x,,x

Læs mere

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

Læs mere

Kvantitative metoder 2

Kvantitative metoder 2 Kvantitative metoder Heteroskedasticitet 11. april 007 KM: F18 1 Oversigt: Heteroskedasticitet OLS estimation under heteroskedasticitet (W.8.1-): Konsekvenser af heteroskedasticitet for OLS Gyldige test

Læs mere

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau... Indhold 1 Statistisk inferens: Hypotese og test 2 1.1 Nulhypotese - alternativ.................................. 2 1.2 Teststatistik........................................ 3 1.3 P-værdi..........................................

Læs mere

Kapitel 7 Forskelle mellem centraltendenser

Kapitel 7 Forskelle mellem centraltendenser Kapitel 7 Forskelle mellem centraltendenser Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 29 Indledning 1. z-test for ukorrelerede data 2. t-test for ukorrelerede data med ens

Læs mere

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Stikprøver og stikprøve fordelinger Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Statistik Statistisk Inferens: Prediktere og forekaste værdier af

Læs mere

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test Statistik Lektion 0 Ikkeparametriske metoder Repetition KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M. Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet March 1, 2013 Sandsynlighedsregning og lagerstyring Normalfordelingen

Læs mere

Eksempel på logistisk vækst med TI-Nspire CAS

Eksempel på logistisk vækst med TI-Nspire CAS Eksempel på logistisk vækst med TI-Nspire CAS Tabellen herunder viser udviklingen af USA's befolkning fra 1850-1910 hvor befolkningstallet er angivet i millioner: Vi har tidligere redegjort for at antallet

Læs mere

Bilag 7. SFA-modellen

Bilag 7. SFA-modellen Bilag 7 SFA-modellen November 2016 Bilag 7 Konkurrence- og Forbrugerstyrelsen Forsyningssekretariatet Carl Jacobsens Vej 35 2500 Valby Tlf.: +45 41 71 50 00 E-mail: kfst@kfst.dk Online ISBN 978-87-7029-650-2

Læs mere

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0 Hypotesetest Hypotesetest generelt Ingredienserne i en hypotesetest: Statistisk model, f.eks. X 1,,X n uafhængige fra bestemt fordeling. Parameter med estimat. Nulhypotese, f.eks. at antager en bestemt

Læs mere

Bilag 12 Regressionsanalysens tabeller og forklaringer

Bilag 12 Regressionsanalysens tabeller og forklaringer Bilag 12 Regressionsanalysens tabeller og forklaringer Regressionsanalysens tabeller og forklaringer Regressionsanalysen vil være delt op i 2 blokke. Første blok vil analysere hvor meget de tre TPB variabler

Læs mere

Simpel Lineær Regression

Simpel Lineær Regression Simpel Lineær Regression Mål: Forklare variablen y vha. variablen x. Fx forklare Salg (y) vha. Reklamebudget (x). Vi antager at sammenhængen mellem y og x er beskrevet ved y = β 0 + β 1 x + u. y: Afhængige

Læs mere

Matematisk modellering og numeriske metoder. Lektion 1

Matematisk modellering og numeriske metoder. Lektion 1 Matematisk modellering og numeriske metoder Lektion 1 Morten Grud Rasmussen 4. september, 2013 1 Ordinære differentialligninger ODE er 1.1 ODE er helt grundlæggende Definition 1.1 (Ordinære differentialligninger).

Læs mere

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse

Læs mere

Kvantitative Metoder 1 - Forår 2007. Dagens program

Kvantitative Metoder 1 - Forår 2007. Dagens program Dagens program Kapitel 7 Introduktion til statistik Organisering af data Diskrete variabler Kontinuerte variabler Beskrivende statistik Fraktiler Gennemsnit Empirisk varians og spredning Empirisk korrelationkoe

Læs mere

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/

Binomial fordeling. n f (x) = p x (1 p) n x. x = 0, 1, 2,...,n = x. x x!(n x)! Eksempler. Middelværdi np og varians np(1 p). 2/ Program: 1. Repetition af vigtige sandsynlighedsfordelinger: binomial, (Poisson,) normal (og χ 2 ). 2. Populationer og stikprøver 3. Opsummering af data vha. deskriptive størrelser og grafer. 1/29 Binomial

Læs mere

Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable

Repetition. Diskrete stokastiske variable. Kontinuerte stokastiske variable Normal fordelingen Normal fordelingen Egenskaber ved normalfordelingen Standard normal fordelingen Find sandsynligheder ud fra tabel Transformation af normal fordelte variable Invers transformation Repetition

Læs mere

4 Oversigt over kapitel 4

4 Oversigt over kapitel 4 IMM, 2002-09-14 Poul Thyregod 4 Oversigt over kapitel 4 Introduktion Hidtil har vi beskæftiget os med data. Når data repræsenterer gentagne observationer (i bred forstand) af et fænomen, kan det være bekvemt

Læs mere

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Ikke-parametriske metoder. Repetition Wilcoxon Signed-Rank Test Kruskal-Wallis Test Friedman Test Chi-i-anden Test Ikkeparametriske metoder Repetition Wilcoxon SignedRank Test KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,

Læs mere

Personlig stemmeafgivning

Personlig stemmeafgivning Ib Michelsen X 2 -test 1 Personlig stemmeafgivning Efter valget i 2005 1 har man udspurgt en mindre del af de deltagende, om de har stemt personligt. Man har svar fra 1131 mænd (hvoraf 54 % har stemt personligt

Læs mere

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1)

Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1) Kursus 02402: Besvarelser til øvelsesopgaver i uge 9 Opgave 10.1, side 282 (for 6. og 7. ed. af lærerbogen se/løs opgave 9.1) Som model benyttes en binomialfordeling, som beskriver antallet, X, blandt

Læs mere

Perspektiver i Matematik-Økonomi: Linær regression

Perspektiver i Matematik-Økonomi: Linær regression Perspektiver i Matematik-Økonomi: Linær regression Jens Ledet Jensen H2.21, email: jlj@imf.au.dk Perspektiver i Matematik-Økonomi: Linær regression p. 1/34 Program for i dag 1. Indledning: sammenhæng mellem

Læs mere

Matematisk modellering og numeriske metoder

Matematisk modellering og numeriske metoder Matematisk modellering og numeriske metoder Morten Grud Rasmussen 5. september 2016 1 Ordinære differentialligninger ODE er 1.1 ODE er helt grundlæggende Definition 1.1 (Ordinære differentialligninger).

Læs mere

University of Copenhagen. Notat om statistisk inferens Larsen, Martin Vinæs. Publication date: Document Version Peer-review version

University of Copenhagen. Notat om statistisk inferens Larsen, Martin Vinæs. Publication date: Document Version Peer-review version university of copenhagen University of Copenhagen Notat om statistisk inferens Larsen, Martin Vinæs Publication date: 2014 Document Version Peer-review version Citation for published version (APA): Larsen,

Læs mere

Teoretisk Statistik, 9 marts nb. Det forventes ikke, at alt materialet dækkes d. 9. marts.

Teoretisk Statistik, 9 marts nb. Det forventes ikke, at alt materialet dækkes d. 9. marts. Teoretisk Statistik, 9 marts 2005 Empiriske analoger (Kap. 3.7) Normalfordelingen (Kap. 3.12) Opsamling på Kap. 3 nb. Det forventes ikke, at alt materialet dækkes d. 9. marts. 1 Empiriske analoger Betragt

Læs mere

Kapitel 4 Sandsynlighed og statistiske modeller

Kapitel 4 Sandsynlighed og statistiske modeller Kapitel 4 Sandsynlighed og statistiske modeller Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 Indledning 2 Sandsynlighed i binomialfordelingen 3 Normalfordelingen 4 Modelkontrol

Læs mere

Deskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium

Deskriptiv statistik. Version 2.1. Noterne er et supplement til Vejen til matematik AB1. Henrik S. Hansen, Sct. Knuds Gymnasium Deskriptiv (beskrivende) statistik er den disciplin, der trækker de væsentligste oplysninger ud af et ofte uoverskueligt materiale. Det sker f.eks. ved at konstruere forskellige deskriptorer, d.v.s. regnestørrelser,

Læs mere

Estimation af bilkøbsrelationen med nye indkomst- og formueudtryk

Estimation af bilkøbsrelationen med nye indkomst- og formueudtryk Danmarks Statistik MODELGRUPPEN Arbejdspapir* Edith Madsen 21. juli 1997 Estimation af bilkøbsrelationen med nye indkomst- og formueudtryk Resumé: Papiret præsenterer en reestimationen af fcb-relationen.

Læs mere

Dagens Emner. Likelihood teori. Lineær regression (intro) p. 1/22

Dagens Emner. Likelihood teori. Lineær regression (intro) p. 1/22 Dagens Emner Likelihood teori Lineær regression (intro) p. 1/22 Likelihood-metoden M : X i N(µ,σ 2 ) hvor µ og σ 2 er ukendte Vi har, at L(µ,σ 2 ) = ( 1 2πσ 2)n/2 e 1 2σ 2 P n (x i µ) 2 er tætheden som

Læs mere

2 -test. Fordelingen er særdeles kompleks at beskrive med matematiske formler. 2 -test blev opfundet af Pearson omkring år 1900.

2 -test. Fordelingen er særdeles kompleks at beskrive med matematiske formler. 2 -test blev opfundet af Pearson omkring år 1900. 2 -fordeling og 2 -test Generelt om 2 -fordelingen 2 -fordelingen er en kontinuert fordeling, modsat binomialfordelingen som er en diskret fordeling. Fordelingen er særdeles kompleks at beskrive med matematiske

Læs mere

5.11 Middelværdi og varians Kugler Ydelse for byg [Obligatorisk opgave 2, 2005]... 14

5.11 Middelværdi og varians Kugler Ydelse for byg [Obligatorisk opgave 2, 2005]... 14 Module 5: Exercises 5.1 ph i blod.......................... 1 5.2 Medikamenters effektivitet............... 2 5.3 Reaktionstid........................ 3 5.4 Alkohol i blodet...................... 3 5.5

Læs mere

02402 Vejledende løsninger til Splus-opgaverne fra hele kurset

02402 Vejledende løsninger til Splus-opgaverne fra hele kurset 02402 Vejledende løsninger til Splus-opgaverne fra hele kurset Vejledende løsning SPL3.3.1 Der er tale om en binomialfordeling med n =10ogp=0.6, og den angivne sandsynlighed er P (X =4) som i bogen også

Læs mere

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Anvendt Statistik Lektion 7. Simpel Lineær Regression Anvendt Statistik Lektion 7 Simpel Lineær Regression 1 Er der en sammenhæng? Plot af mordraten () mod fattigdomsraten (): Scatterplot Afhænger mordraten af fattigdomsraten? 2 Scatterplot Et scatterplot

Læs mere