Tidsrækkeanalyse og multipel regression. - Økonometrisk dataanalyse af det danske ejerboligmarked

Størrelse: px
Starte visningen fra side:

Download "Tidsrækkeanalyse og multipel regression. - Økonometrisk dataanalyse af det danske ejerboligmarked"

Transkript

1 Tidsrækkeanalyse og multipel regression - Økonometrisk dataanalyse af det danske ejerboligmarked Mat-Øk6 projekt, forår 2012 Udarbejdet af gruppe G4-105 Institut for matematiske fag Aalborg Universitet

2 Aalborg University Department of Mathematics Frederik Bajers Vej 7G, DK-9220 Aalborg Ø, Denmark Phone , Fax

3 AALBORG UNIVERSITET INSTITUT FOR MATEMATISKE FAG TITEL: Tidsrækkeanalyse og multipel regression - Økonometrisk dataanalyse af det danske ejerboligmarked PROJEKT PERIODE: Fra 1. februar til 29. maj 2012 PROJEKTGRUPPE: Troels Otte Andersen Thomas Hvolby Anca Pircalabu Rikke Preisler Vilstrup VEJLEDER: Esben Høg OPLAGSTAL: 7 ANTAL SIDER: 100 SYNOPSIS: Denne rapport indeholder en statistisk analyse af boligpriserne på ejerlejligheder i Danmark, med udgandspunkt i et datasæt fra home, som består af oplysninger på handlede boliger fra 2002 til I rapportens første del beskrives teori for tidsrækkeanalyse, herunder ARIMAmodeller, og denne illustreres igennem eksempler. Teorien anvendes siden til at estimere en IMA(1,1) model for udviklingen af ejerlejligheders gennemsnitlige kvadratmeterpriser over tid, hvorefter vi udfører en modelkontrol. Slutteligt anvendes Holt-Winters én-periodes forecast til at forudsige boligpriserne. I rapportens anden del beskrives teorien for multipel regression, med henblik på at estimere en lineær model, som forklarer kontantpriserne på ejerlejligheder. I regressionen indgår forklarende variable såsom beliggenhed og boligareal. Der foretages en tolkning af de estimerede parametre, og modellen testes for multikollinearitet og signifikans vha. t- og F -test. Yderligere kontrollerer vi modellens funktionelle form ved at foretage RESET tests, hvorefter forskellige relevante interaktionsled tilføjes, med henblik på at forbedre modellen. Slutteligt foretages modelkontrol og kritik på den endelige model. Rapportens indhold er frit tilgængeligt, men offentliggørelse (med kildeangivelse) må kun ske efter aftale med forfatterne.

4 ii

5 Forord Dette projekt er udarbejdet af gruppe G4-105 på Mat-Øk6, d. 1. februar til d. 29. maj 2012 ved Det Teknisk-Naturvidenskabelige Fakultet, Institut for Matematiske Fag, ved Aalborg Universitet. Projektet er udarbejdet i samarbejde med vejleder Esben Høg. Referencer til ligninger er angivet i (), hvorimod referencer til kapitler, afsnit og figurer angives uden parenteser. Fodnoternes anvisning er ved et opløftet tal i fed, så der kan skelnes mellem fodnoter og potenser. Kildehenvisninger bliver angivet med [], hvori der vil stå forfatterens efternavn, udgivelsesår og evt. sidetal. Alle beviser afsluttes med, alle udledninger sluttes med og alle eksempler afsluttes med. Slutteligt i projektet er der 6 bilag, der benævnes med store bogstaver. Vi vil gerne rette en tak til for det modtagne datasæt. Aalborg den 29/ Thomas Hvolby Anca Pircalabu Troels Otte Andersen Rikke Preisler Vilstrup

6 iv

7 Indhold Forord ii Indledning 1 I Tidsrækkeanalyse 3 1 Tidsrækkeanalyse Afhængighedsmål for stokastiske processer ARMA modeller Forecasting Tidsrækkeanalyse af ejerlejligheders kontantpriser pr. m Datapræsentation Dataklargøring Valg af data Valg af model Stationaritet og invertibilitet Modelkontrol Forecasting Delkonklusion II Hedonisk modellering 37 3 Hedonisk modellering vha. lineære normale modeller Generelle lineære modeller Mindste kvadraters metode Opdeling af designmatricen

8 INDHOLD 3.4 Determinationskoefficienten R Lineære normale modeller Modellering af prisen på ejerlejligheder Valg af data for hele Danmark Prismodel for ejerlejligheder i hele landet Ny prismodel med interaktion Den endelige model Kritik af den endelige model Delkonklusion Konklusion 79 6 Perspektivering 81 Litteratur 82 A Statistiske egenskaber 85 A.1 AR(1) A.2 MA(1) B Differensligninger 87 C Beregning af Γ 1 for AR(1) 89 D Egenskaber ved projektionsmatricen 91 E R-koder til tidsrækkeanalyse 93 F R-koder til multipel regression 95 vi

9 Indledning I den danske økonomi spiller boligmarkedet en stor rolle. Handel med boliger fylder en stor del af privatforbruget, og derfor kan folks forventninger og optimisme aflæses i aktiviteten på boligmarkedet. Samtidig vil ændringer i boligpriserne skabe større eller mindre incitament for at opføre nye boliger, dvs. at boligpriserne har afgørende betydning for aktiviteten i byggebranchen, og derfor har boligmarkedet en stor betydning for konjunkturen [Det Økonomiske Råd, 2009]. Under finanskrisen, som startede i 2007, har det amerikanske boligmarked fået skylden for at have udløst krisen. Prisen på boliger blev skruet kunstigt i vejret, hvilket har resulteret i prisbobler på boligmarkederne i store dele af vesten. Efterhånden som boblerne er bristet, er økonomers interesse i boligprisernes udvikling og boligers prisfastsættelse vokset, hvilket ligeledes har gjort os interesserede i at skrive et projekt om boligmarkedet. Formålet med dette projekt er dels, at modellere boligprisen på ejerlejligheder som en tidsrække, for at undersøge tidskorrelation og den generelle udvikling på boligmarkedet inden for de observerede år, og dels at lave en model til prisfastsættelse af ejerlejligheder i Danmark. Til dette formål har vi modtaget et datasæt over solgte boliger i perioden januar 2002 til og med januar 2009, indeholdende ejendoms- og salgsinformation. Disse står beskrevet yderligere i afsnit 2.1. Vi vil i del I introducere tidsrækkeanalyse, som benyttes til at analysere vores første problemstilling, nemlig udviklingen af kvadratmeterprisen på ejerlejligheder. Vi vil anvende kvadratmeterprisen, for at få en pris, der kan sammenlignes uanset boligernes størrelse. Vi vil i denne del af projektet primært fokusere på ARMA og ARIMA-modeller, men vi vil også introducere bl.a. Holt-Winters forecast. Siden introduceres teorien for multipel regression i del II, herunder lineære modeller, med henblik på at behandle vores anden problemstilling, som er at modellere kontantprisen på ejerlejligheder i Danmark. I vores tilfælde, hvor boligens pris er bestemt ud fra karakteristika ved selve boligen, kaldes modellerne for hedoniske. Vi vil foretage en regression på logaritmen til priserne på ejerlejligheder i hele landet ud fra en række forklarende variable, givet ved boligens karakteristika. Efter parameterestimering vil vi foretage forskellige tests af modellens holdbarhed, herunder bl.a. t og F -test. Herefter vil vi introducere relevante interaktionsled, for at forbedre modellen.

10 INDLEDNING 2

11 Del I Tidsrækkeanalyse

12

13 Kapitel 1 Tidsrækkeanalyse Når data, som bliver observeret til forskellige tidspunkter, analyseres, kan der opstå problemer, hvis vi benytter statistisk modellering og inferens. De traditionelle statistiske metoder bygger på en antagelse om, at nærliggende observationer er uafhængige og identisk fordelte, og problemerne opstår derfor på grund af den indlysende korrelation mellem nærliggende observationer over tid. I stedet for at anvende konventionelle statistiske metoder, benyttes en anden tilgang kaldet tidsrækkeanalyse, som tager højde for tidskorrelationen. Det primære formål med tidsrækkeanalyse er at finde den matematiske model, som passer bedst muligt på dataene. Da vi ønsker at undersøge prisernes udvikling over tid, vil vi i dette kapitel introducere nogle grundlæggende begreber, samt forskellige regressionsmodeller og deres egenskaber. Dette kapitel er baseret på [Shumway og Stoffer, 2004, kap. 1-3] og [Cryer og Chan, 2008, kap. 9]. 1.1 Afhængighedsmål for stokastiske processer For en fuldstændig beskrivelse af en tidsrække, kan vi betragte den simultane fordeling, givet ved F (x 1, x 2,.., x k ) = P (X t1 x 1, X t2 x 2,.., X tk x k ), men da denne kan være svær at bestemme, betragter vi i stedet den marginale fordeling, F t (x) = P (X t x) med tilhørende marginal tæthedsfunktion f t (x) = F t (x). Et andet informativt mål er middelværdien, der er et vægtet gennemsnit af de mulige værdier X t kan antage. Middelværdien er givet ved µ t = E [X t ] = xf t (x)dx. To andre centrale begreber er kovarians og korrelation, som måler afhængigheden mellem to nærliggende værdier x s og x t.

14 KAPITEL 1. TIDSRÆKKEANALYSE Definition 1.1 (Autokovariansfunktionen) Autokovariansfunktionen er givet ved for alle s og t. γ(s, t) = Cov (x s, x t ) = E [(x s µ s )(x t µ t )] Autokovariansfunktionen måler den lineære afhængighed mellem to punkter til forskellige tidspunkter s og t. For meget jævne rækker forbliver autokovariansen stor, selv når de to tidspunkter er langt fra hinanden, hvorimod der for ujævne tidsrækker gælder, at autokovariansen er tæt på nul for store tidsafstande. Definition 1.2 (Autokorrelationsfunktionen) Autokorrelationsfunktionen (ACF) er givet ved ρ(s, t) = γ(s, t) γ(s, s)γ(t, t). Autokorrelationsfunktionen måler hvor forudsigelig x t er, givet x s som den eneste værdi. Dermed er autokorrelationsfunktionen et groft mål for vores evne til at forecaste rækken til tidspunkt t vha. værdien til tidspunkt s. Det skal bemærkes, at autokorrelationsfunktionen ikke er defineret, hvis variansen på tidsrækken enten er 0 eller uendelig stor Stationære tidsrækker Da der over tid kan være en regelmæssighed i tidsrækkernes adfærd, indføres begreberne streng stationaritet og svag stationaritet. Definition 1.3 (Streng stationaritet) En strengt stationær tidsrække er en, for hvilken der gælder, at P (X t1 x 1, X t2 x 2,..., X tk x k ) = P (X t1 +h x 1, X t2 +h x 2,..., X tk +h x k ) for alle k = 1, 2,... og x 1, x 2,..., x k, for alle tidspunkter t 1, t 2,..., t k, og alle tidsforskydninger h = 0, ±1, ±2,.... Definition 1.3 er ikke så anvendelig i praksis, da dens antagelser er for stærke. Derfor introduceres en anden version der kun pålægger betingelser på de første to momenter. Definition 1.4 (Svag stationaritet) En svagt stationær tidsrække x t er en process med endelig varians, således at i) middelværdien µ t er konstant, og ikke afhænger af tiden t, og ii) autokovariansfunktionen γ(s, t) kun afhænger af s og t gennem forskellen s t. Ved benyttelse af begrebet stationaritet vil der fremover menes svag stationaritet. 6

15 1.2. ARMA MODELLER Eksempel 1.5 I det følgende vurderes det, om tidsrækken x t = w t w t 3, hvor w t iid N (0, 1), er stationær. Vi starter med at undersøge, om middelværdien er konstant, E [x t ] = E [w t w t 3 ] = E [w t ] E [w t 3 ] = 0. Herefter undersøges det om variansen er endelig, Var [x t ] = Var [w t ] + Var [w t 3 ] = 2 og slutteligt betragtes autokovariansfunktionen, for at afgøre om den kun afhænger af tidsforskellen, γ x (t, t + h) = Cov (x t, x t+h ) = E [x t x t+h ] = E [(w t w t 3 )(w t+h w t+h 3 )] = E [w t w t+h ] + E [w t 3 w t+h 3 ] E [w t w t+h 3 ] E [w t 3 w t+h ] 1 for h = 3, 3, = 2 for h = 0, 0 ellers. Da middelværdien er konstant, variansen er endelig og autokovariansen kun afhænger af tidsforskellen, følger det af definition 1.4, at tidsrækken er stationær. For at lette notationen til senere brug indføres følgende Definition 1.6 (Backshift operator) Backshift operatoren defineres ved B k x t = x t k. 1.2 ARMA modeller Givet en tidsrække {x t } er ARMA (Autoregressive moving average) modellen et værktøj til at kunne forstå tidsrækkens egenskaber, og måske forudsige fremtidige værdier. Modellen består af to dele, en autoregressiv (AR) del og en moving average (MA) del. Modellen angives sædvanligvis ved ARMA(p, q), hvor p er ordenen af den autoregressive del, og q er ordenen af moving average delen. I det følgende introduceres først de to modeller AR(p) og MA(q), hvorefter de sættes sammen til en ARMA(p, q) AR(p) Definition 1.7 (Autoregressiv model af orden p) En autoregressiv model af orden p, AR(p), er givet ved x t = φ 1 x t 1 + φ 2 x t φ p x t p + w t, (1.1) hvor x t er stationær, og φ 1, φ 2,..., φ p er konstante (φ p 0). Yderligere antages det, at w t iid N ( 0, σ 2 w). 7

16 KAPITEL 1. TIDSRÆKKEANALYSE I definition 1.7 har vi, uden tab af generalitet, antaget at middelværdien µ er 0. I det tilfælde hvor µ 0, erstattes x t i (1.1) med x t µ: x t µ = φ 1 (x t 1 µ) + φ 2 (x t 2 µ) + + φ p (x t p µ) + w t x t = α + φ 1 x t 1 + φ 2 x t φ p x t p + w t, hvor α = µ(1 φ 1 φ p ). Ved at benytte definition 1.6 kan AR(p) modellen i (1.1) omskrives til eller på mere koncentreret form (1 φ 1 B φ 2 B 2 φ p B p )x t = w t, φ(b)x t = w t, hvor φ(b) er det autoregressive polynomium af orden p. Bemærkning 1.8 (Specialtilfælde med p = 1) I det følgende betragtes AR(1) modellen givet ved x t = φx t 1 + w t, (1.2) hvor det er antaget at µ = 0. Ved at iterere tilbage k gange kan (1.2) omskrives til k 1 x t = φ k x t k + φ j w t j, k 1. (1.3) j=0 Hvis vi forudsætter, at x t er stationær, og at φ < 1, kan ligning (1.3) omskrives til følgende lineære proces x t = φ j w t j. (1.4) For en AR(1) model defineret ved (1.4) gælder følgende egenskaber: i) E [x t ] = 0, ii) Cov (x t, x t h ) = σ2 w φh 1 φ 2, h 0, iii) ρ(h) = φ h. j=0 For uddybende beregninger henvises til bilag A.1. I det ovenstående har vi udelukkende betragtet tilfældet med φ < 1, hvor vi ud fra egenskaberne kan konkludere, at AR(1) processen er stationær. Betragter vi derimod tilfældet hvor φ > 1, er processen også stationær, men den afhænger af fremtiden, og den kan derfor ikke anvendes i praksis [Shumway og Stoffer, 2004, p. 88]. Hvis φ = 1 haves en Random Walk, der som velkendt ikke er stationær. For at vi kan benytte denne, kan vi betragte førstedifferensen. Slutteligt haves tilfældet med φ = 1, hvor processen er alternerende, og dermed ikke stationær. 8

17 1.2. ARMA MODELLER Generelt gælder følgende for en AR(p) model i) Hvis rødderne til polynomiet φ(b) ligger på enhedscirklen, er processen {x t } ikke stationær. ii) Hvis rødderne ligger uden for enhedscirklen, er processen {x t } stationær og kausal 1. iii) Hvis rødderne ligger inden for enhedscirklen, er processen {x t } stationær men ikke kausal MA(q) Definition 1.9 (Moving average model af orden q) En moving average model af orden q, MA(q), er givet ved x t = w t + θ 1 w t 1 + θ 2 w t θ q w t q, (1.5) hvor der er q lags, og θ 1, θ 2,... θ q (θ q 0) er parametre. Yderligere antages det, at w t iid N ( 0, σ 2 w). Ved at benytte definition 1.6 kan MA(q) modellen i (1.5) omskrives til x t = θ(b)w t, hvor θ(b) = 1 + θ 1 B + θ 2 B θ q B q. Det skal bemærkes, at vi igen i definition 1.9 uden tab af generalitet har antaget, at µ er 0. Bemærkning 1.10 (Specialtilfælde med q = 1) I det følgende betragtes MA(1) modellen givet ved hvor det er antaget at µ = 0. x t = w t + θw t 1, (1.6) For en MA(1) model defineret ved (1.6) gælder følgende egenskaber: i) E [x t ] = 0, (1 + θ 2 )σw 2 for h = 0, ii) Cov (x t, x t+h ) = θσw 2 for h = 1, 0 for h > 1. { θ for h = 1, iii) ρ(h) = (1+θ 2 ) 0 for h > 1. For uddybende beregninger henvises til bilag A.2. For en MA(1) gælder der i modsætning til en AR(1), at x t kun er korreleret med den foregående værdi x t 1. Derudover kan det bemærkes, at modellen er stationær for alle værdier af parametrene θ 1,..., θ q. 1 Kausal betyder, at der er en årsagssammenhæng, dvs. at der er et forhold mellem årsag og virkning. Hvis processen afhænger af fremtiden er den stationær, men den er ikke kausal. 9

18 KAPITEL 1. TIDSRÆKKEANALYSE MA(1) modellen i (1.6) kan alternativt repræsenteres ved en uendelig ordens autoregressiv model, AR( ). Ligning (1.6) omskrives til w t = x t θw t 1 Højresiden i (1.7) kan skrives som = x t θx t 1 + θ 2 x t 2 θ 3 x t (1.7) ( θ) j x t j, for θ < 1, (1.8) j=0 hvilket er en uendelig ordens autoregressiv model. Yderligere kan ligning (1.6) vha. backshift operatoren også omskrives til og af udtryk (1.8) og (1.9) ses det, at θb x t = w t, (1.9) θb x t = ( θ) j x t j. (1.10) Af (1.10) ses det, at MA(1) modellen er invertibel hvis og kun hvis θ < 1. j=0 Generelt gælder følgende for en MA(q) model i) MA(q) er pr. definition stationær. ii) Hvis rødderne til polynomiet θ(b) ligger uden for enhedscirklen, er processen {x t } invertibel. Efter nu at have præsenteret AR(p) og MA(q) vil vi gå videre og sammensætte disse til en ARMA(p, q) model ARMA(p, q) Definition 1.11 En tidsrække {x t } for t = 0, ±1, ±2,... er en ARMA(p, q), hvis den er stationær, og x t = φ 1 x t φ p x t p + w t + θ 1 w t θ q w t q, (1.11) med φ p 0, θ q 0, og σ 2 w > 0. Yderligere antages det, at w t iid N ( 0, σ 2 w). Hvis tidsrækken {x t } har middelværdi µ 0, sætter vi α = µ(1 φ 1 φ p ) og skriver ligning (1.11) som x t = α + φ 1 x t φ p x t p + w t + θ 1 w t θ q w t q. Tidsrækken i (1.11) kan vha. backshift operatoren også skrives som φ(b)x t = θ(b)w t. 10

19 1.2. ARMA MODELLER Parameter overflødighed, invertibilitet og kausalitet for en ARMA(p, q) proces Vi kan komme ud for følgende problemer med en ARMA(p, q): i) Modeller med parameter overflødighed 2, ii) stationære AR modeller, som afhænger af fremtiden, og iii) MA modeller, som ikke er entydige 3. Pga. de ovenstående problemer introducerer vi nogle yderligere restriktioner på modellens parametre. Definition 1.12 AR og MA polynomierne defineres ved φ(z) = 1 φ 1 z φ p z p, hvor φ p 0, for AR, og θ(z) = 1 + θ 1 z + + θ p z p, hvor θ p 0, for MA, hvor z er et komplekst tal. Problemet med parameter overflødighed kan løses ved at kræve, at φ(z) og θ(z) ikke har nogen fælles faktor. Definition 1.13 En ARMA(p,q) er kausal hvis og kun hvis φ(z) 0 når z 1, hvilket vil sige, at rødderne til φ ligger uden for enhedscirklen. Ovenstående definition er ensbetydende med, at tidsrækken {x t } kan skrives som hvor ψ(b) = ψ j B j og j=0 kan bestemmes ved at løse ψ(z) = x t = ψ j w t j = ψ(b)w t, (1.12) j=0 ψ j <. Koefficienterne i den lineære proces i (1.12) j=0 j=0 ψ j z j = 1 + q j=1 θ jz j 1 p j=1 φ jz j = θ(z) φ(z). Ved at kræve, at en ARMA(p, q) er kausal, undgår vi problemer med fremtidsafhængige AR modeller, se evt. bemærkning Det vil sige modeller, hvis karakteristiske polynomier har en eller flere fælles rødder. 3 Vi kan f.eks. komme ud for, at forskellige parametre giver de samme autokovarianser. Det kan derfor være svært at skelne mellem to modeller. 11

20 KAPITEL 1. TIDSRÆKKEANALYSE Definition 1.14 En ARMA(p,q) er invertibel hvis og kun hvis θ(z) = 0 når z > 1, hvilket vil sige, at rødderne til θ ligger uden for enhedscirklen. Ovenstående definition er ensbetydende med, at tidsrækken {x t } kan skrives som hvor π(b) = π j B j og j=0 kan bestemmes ved at løse π(b)x t = π j x t j = w t, (1.13) j=0 π j <. Koefficienterne i den lineære proces i (1.13) j=0 π(z) = j=0 π j z j = 1 p j=1 φ jz j 1 + q j=1 θ jz j = φ(z) θ(z). For at undgå problemer med MA modeller, der ikke er entydig bestemte, vælges den MA model som tillader en AR( ) repræsentation. Definition 1.14 er derfor løsning på det sidste problem Bestemmelse af ordenen af AR og MA processer I de ovenstående afsnit er teorien for AR og MA modeller blevet introduceret, men ofte er ordenen af tidsrækken ikke givet på forhånd. Vi vil derfor i dette afsnit belyse to funktioner, ACF og PACF, som kan hjælpe med til at bestemme hhv. p og q. ACF for MA(q) Vi indleder med at undersøge autokorrelationsfunktionen, ACF, for en MA(q) proces x t = θ(b)w t. Da x t er en endelig linearkombination af w t er, er processen stationær med middelværdi q E [x t ] = θ j E [w t j ] = 0, j=0 hvor θ 0 = 1, og med autokovariansfunktion 4 q γ(h) = Cov (x t, x t h ) = Cov θ j w t j, j=0 k=0 j=0 q θ k w t h k k=0 ( q q ) = E θ j w t j θ k w t h k = q j=0 k=0 q θ j θ k E [w t j w t h k ], 4 Beregningerne er uddybet ift. [Shumway og Stoffer, 2004, p. 102]. 12

21 1.2. ARMA MODELLER hvor E [w t j w t h k ] = Derved bliver autokovariansen { σ 2 w for j = h + k, 0 for j h + k. γ(h) = { σ 2 w q h k=0 θ kθ k+h for 0 h q, 0 for h > q. (1.14) Ved at dividere ligning (1.14) med variansen γ(0) fås ACF for en MA(q) ρ(h) = { q h k=0 θ kθ k+h 1+θ θ2 q for 1 h q, 5 0 for h > q. (1.15) Af ligning (1.15), ses det at ACF vil skære af efter q lags, dvs. at ACF kun vil have ikke-nul autokorrelationer for de lags, der er med i modellen. ACF for AR(p) I tillæg til det ovenstående vil vi bestemme ACF for en AR process. Vi tager udgangspunkt i en AR(2) proces, hvorefter vi generaliserer resultaterne til en AR(p) model. Antag at x t = φ 1 x t 1 + φ 2 x t 1 + w t, er en kausal AR(2) proces. Vi multiplicerer modellen med x t h for h > 0, og tager middelværdien på begge sider E [x t x t h ] = φ 1 E [x t 1 x t h ] + φ 2 E [x t 2 x t h ] + E [w t x t h ]. Ved at benytte det faktum at E [x t ] = 0, og at der for h > 0 gælder, at fås E [w t x t h ] = 0 γ(h) = φ 1 γ(h 1) + φ 2 γ(h 2), h = 1, 2,... (1.16) Ligning (1.16) kan genkendes som en af Yule-Walker ligningerne, se evt. definition Ved at dividere ligning (1.16) med variansen γ(0) fås en differensligning for processens ACF ρ(h) φ 1 ρ(h 1) φ 2 ρ(h 2) = 0, h = 1, 2,... (1.17) Begyndelsesbetingelserne er ρ(0) = 1 og ρ(1) = φ 1 /(1 φ 2 ). 6 Vi benytter teorien for den homogene differensligning af orden 2, hvor vi lader z 1 og z 2 være rødderne til det tilhørende karakteristiske polynomium, φ(z) = 0 = 1 φ 1 z φ 2 z 2. Da vi har antaget, at modellen er kausal, ved vi fra afsnit 1.2.1, at rødderne skal ligge uden for enhedscirklen, dvs. at z 1 > 1 og z 2 > 1. Vi betragter løsningerne til de følgende 3 tilfælde: 5 Da der altid gælder, at ρ(0) = 1, udelades h = 0 6 Begyndelsesbetingelserne fås ved at evaluere ligning (1.17) i h = 0, og ved at huske på at ρ(1) = ρ( 1) 13

22 KAPITEL 1. TIDSRÆKKEANALYSE i) Når z 1 og z 2 er reelle og forskellige, fås følgende løsningsform ρ(h) = c 1 z h 1 + c 2 z h 2, (1.18) så ρ(h) eksponentielt hurtigt vil gå mod 0 for h. ii) Når z 1 og z 2 er reelle og lig med hinanden, z 1 = z 2 (= z 0 ), fås følgende løsningsform ρ(h) = z h 0 (c 1 + c 2 h), (1.19) så ρ(h) eksponentielt hurtigt vil gå mod 0 for h. iii) Når z 1 = z 2, dvs. at de er et komplex konjugeret par, så er c 2 = c 1, og følgende løsningsform fås ρ(h) = c 1 z 1 h + c 1 z h 1. Igen ses det at ρ(h) vil gå eksponentielt hurtigt mod 0 for h, men den vil gå mod 0 i dæmpede sinussvingninger [Shumway og Stoffer, 2004, p. 99]. De ovenstående resultater kan generaliseres til en AR(p), hvor Yule-Walker ligningen er givet ved ρ(p) φ 1 ρ(h 1) φ p ρ(h p) = 0, h p. (1.20) Vi lader z 1,..., z r være rødderne til det tilhørende karakteristiske polynomium φ(z) = 0 = 1 φ 1 z φ p z p, hvor hver rod har multiplicitet m 1,..., m r, og hvor summen af multipliciteterne er lig med p. Den generelle løsning til (1.20) er givet ved ρ(h) = z1 h P 1(h) + z2 h P 2(h) + + zr h P r (h), hvor P j (h) er et polynomium i h af grad m j 1. For uddybende bemærkninger om løsninger til differensligninger henvises der til bilag B. I det ovenstående har vi set, at ACF kan give os information omkring ordenen af en MA(q) model, men at ACF for en AR(p) ikke kan fortælle os noget om ordenen. Vi ønsker derfor at finde en funktion for en AR(p) model, der opfører sig som ACF gør for en MA(q) model. I tidsrækkeanalyse har den partielle autokorrelationsfunktion, PACF, en vigtig rolle, da den kan hjælpe med til at identificere graden af lags i den autoregressive model. Definition 1.15 (Den partielle autokorrelations funktion) Den partielle autokorrelationsfunktion (PACF) af en stationær proces {x t }, betegnet φ hh for h = 1, 2,..., er givet ved Yderligere gælder der til lag 1, at φ hh = Corr (x t+h ˆx t+h, x t ˆx t ), h 2. 7 (1.21) φ 11 = Corr (x t+1, x t ) = ρ(1). 7 I ligning (1.21) er ˆx t+h givet ved ˆx t+h = β 1x t+h 1 + β 2x t+h 2 + [ + β h 1 x t+1, hvor ˆx t+h er den linearkombination af {x t+h 1, x t+h 2,..., x t+1} som minimerer E (x t+h h 1 j=1 ]. αjxt+j)2 Yderligere er ˆx t givet ved ˆx t = β 1x t+1 + β 2x t β h 1 x t+h 1. 14

23 1.2. ARMA MODELLER Både (x t+h ˆx t+h ) og (x t ˆx t ) er ukorrelerede med {x t+1,..., x t+h 1 }. 8 PACF angiver korrelationen mellem x t+h og x t, hvor den lineære afhængighed med de mellemliggende værdier {x t+1,..., x t+h 1 } er fjernet. Ligning (1.21) kan også skrives som den betingede autokorrelation mellem x t+h og x t, dvs. at φ hh = Corr (x t, x t+h x t+1,..., x t+h 1 ). (1.22) For en AR model, vil den teoretiske PACF skære af efter modellens orden. 9 Dvs. at de partielle autokorrelationer i teorien er 0 efter dette punkt, og at antallet af ikkenul partielle autokorrelationer giver ordenen af AR modellen. For en MA model, vil den teoretiske PACF ikke skære af, men i stedet aftage mod 0. Eksempel 1.16 I figur 1.1 ses ACF og PACF for en AR(2) model givet ved x t = 0.6x t 1 0.8x t 2 + w t. Her ses det, at ACF, som tidligere beskrevet, aftager mod 0. Vi kan derfor ikke konkludere, hvilken orden AR modellen har ud fra denne. I stedet betragtes PACF, som skærer af efter lag 2, hvilket stemmer overens med, at vi har en AR model af orden 2. ACF PACF lag lag Figur 1.1: ACF og PACF for en AR(2) med parametrene φ 1 = 0.6 og φ 2 = 0.8 I figur 1.2 ses ACF og PACF for en MA(2) model givet ved x t = 0.6w t + 0.8w t 1. Her ses det, at ACF skærer af efter lag 2, hvilket er i overensstemmelse med den ovenstående teori. Yderligere ses det, at PACF aftager mod 0, og at vi derfor ikke kan konkludere ordenen af modellen ud fra denne. 8ˆx t+h er den fittede værdi af x t+h efter regression af x t+h på x t+1,..., x t+h 1, dvs. at (x t+h ˆx t+h ) er residualerne fra denne regression. Generelt gælder der for OLS i lineær regression, at residualerne er ukorrelerede og ortogonale med de forklarende variable. 9 Vi kan f.eks. skrive en AR(2) som x t = φ 1x t 1 + φ 2x t 2 + 0x t 3 + w t, hvor de partielle autokorrelationer svarer til koefficienterne φ 1, φ 2,..., og herved ses det at korrelationen mellem x t og x t 3 givet de mellemliggende værdier er 0. 15

24 KAPITEL 1. TIDSRÆKKEANALYSE ACF PACF lag lag Figur 1.2: ACF og PACF for en MA(2) med parametrene φ 1 = 0.6 og φ 2 = Parameter estimering Lad os antage, at der haves n observationer x 1, x 2,..., x n, hvor disse følger en kausal og invertibel ARMA(p, q), og at ordenen af ARMA modellen er kendt. Formålet med dette afsnit er at estimere de p + q + 2 parametre i modellen, dvs. estimere µ, σ 2 w, φ 1,..., φ p, θ 1,..., θ q. I det følgende introduceres to metoder, som kan benyttes til at estimere de ukendte parametre, moment estimator metoden og maksimum likelihood. Fremgangsmåden i disse metoder belyses ved at betragte AR modeller, for at lette beregningerne samt notationen. Moment estimator metoden I dette afsnit antages det, at µ = 0. Moment estimator metoden fører ikke altid til de optimale estimater, men i dette afsnit betragtes et tilfælde, hvor brugen af metoden resulterer i de efficiente estimater, nemlig AR(p) modeller. For en AR model af orden p, x t = φ 1 x t φ p x t p + w t, kan de p + 1 parametre bestemmes vha. opstillingen af Yule-Walker ligningerne. Definition 1.17 Yule-Walker ligningerne for en AR(p) model er givet ved γ(h) = φ 1 γ(h 1) φ p γ(h p), h = 1, 2,..., p, σ 2 w = γ(0) φ 1 γ(1)... φ p γ(p). (1.23) (1.24) På matrix form kan Yule-Walker ligningerne udtrykkes ved Γ p φ = γ p (1.25) σ 2 w = γ(0) φ γ p, (1.26) hvor Γ p er den symmetriske p p varians-kovarians matrix. 16

25 1.2. ARMA MODELLER Da vi arbejder med moment estimator metoden, kan γ(h) erstattes med ˆγ(h) 10. Slutteligt omskrives ligning (1.25) og (1.26), for at få følgende Yule-Walker estimater: ˆφ = ˆΓ 1 p ˆγ p, ˆσ 2 w = γ(0) ˆγ p ˆΓ 1 p ˆγ p. Der henvises til bilag C for en teoretisk beregning af den inverse varians-kovarians matrix, Γ 1, for en AR(1). For AR(p) modeller med en stor observationsmængde gælder der, at Yule-Walker estimaterne er tilnærmelsesvis normalfordelte, og at ˆσ 2 w er tæt på den sande σ 2 w [Shumway og Stoffer, 2004, pp. 122 og ]. Som allerede nævnt i indledningen af dette afsnit er de estimater vi finder vha. Yule- Walker ligningerne de optimale estimater, når der arbejdes med en AR(p) model. Grunden til dette er, at AR(p) modeller er lineære modeller, og estimaterne vi får vha. moment estimator metoden svarer derfor til de estimater, vi vil få ved benyttelse af mindste kvadraters metode, se afsnit 3.2. Hvis vi derimod anvender moment estimator metoden på MA eller ARMA modeller, som er ikke-lineære i parametrene, vil estimaterne ikke være optimale [Shumway og Stoffer, 2004, p. 123]. Maksimum likelihood estimater For overskuelighedens skyld betragtes tilfældet med en kausal AR(1), for at belyse fremgangsmåden i denne estimeringsmetode. Vi lader x t = φx t 1 + w t, (1.27) hvor φ < 1 og w t iid N ( 0, σ 2 w). Envidere antages det, at µ = 0. Givet data, dvs. givet x 1, x 2,..., x n, vil vi finde likelihoodfunktionen L(φ, σ 2 w) = f(x 1, x 2,..., x n φ, σ 2 w). (1.28) Da vi arbejder med en AR(1), kan (1.28) omskrives til L(φ, σ 2 w) = f(x 1 φ, σ 2 w)f(x 2 x 1, φ, σ 2 w) f(x n x n 1, φ, σ 2 w). (1.29) Det fremgår af ligning (1.29), at vi skal finde den betingede og ubetingede simultane fordeling af (x 1,..., x n ). I (1.27) er x t givet x t 1 en lineær funktion af det normalfordelte støjled w t, og den betingede fordeling af x t er dermed også normalfordelt, dvs. at x t x t 1 N ( φx t 1, σ 2 w). Med den ubetingede fordeling af x t menes der fordelingen af x t, når x t 1, x t 2,... er ukendte. I det tilfælde er x t også ( normalfordelt, og den ubetingede fordeling af x t bliver, ifølge bilag A.1, x t N 0, σ 2 w 1 φ 2 ). 10ˆγ(h) = n 1 n h t=1 (x t+h x)(x t x). 17

26 KAPITEL 1. TIDSRÆKKEANALYSE Ud fra det ovenstående kan vi opstille likelihood funktionen [ ] L(φ, σw) 2 = (2πσw) 2 (n 1) 2 exp 1 n 2σw 2 (x t φx t 1 ) 2 t=2 ( ) 2πσ w exp [ 1 ] φ2 1 φ 2 2σ 2 x2 1 = (1 φ 2 ) 1 2 (2πσ 2 w ) n 2 [ ( n )] exp 1 2σ 2 (x t φx t 1 ) 2 + (1 φ 2 )x 2 1. (1.30) t=2 Når der haves mange observationer er effekten af f(x 1 φ, σw) 2 meget lille. Vi kan derfor vælge at benytte os af den betingede likelihood, i stedet for den i (1.30). Den betingede likelihood bliver L(φ, σ 2 w x 1 ) = (2πσ 2 w) (n 1) 2 exp [ 1 2σ 2 w ] n (x t φx t 1 ) 2. (1.31) Det betingede maksimum likelihood estimat for σw 2 fås ved at differentiere (1.31) mht. σw, 2 og sætte udtrykket lig 0: L(φ, σw x 2 ( ) [ ] 1 ) σw 2 = (2π) (n 1) (n 1) 2 σw (n+1) exp 1 n 2 2σw 2 (x t φx t 1 ) 2 t=2 [ ] + (2π) (n 1) 2 σw (n 1) exp 1 n 2σw 2 (x t φx t 1 ) 2 1 n 2σ 4 (x t φx t 1 ) 2, t=2 w t=2 [ ] 0 = (2π) (n 1) 2 exp 1 n 2σw 2 (x t ˆφx t 1 ) 2 t=2 [ ] n + 1 σw n 1 + σw n+1 1 n 2 2σw 4 (x t ˆφx t 1 ) 2 t=2 = n + 1 σw n 1 + σ n 3 1 n w (x t 2 2 ˆφx t 1 ) 2 = 1 2 σ n 1 w [ (n 1) + σw 2 = (n 1) + σ 2 w t=2 t=2 n (x t ˆφx t 1 ) 2 ] t=2 n (x t ˆφx t 1 ) 2. t=2 Det betingede maksimum likelihood estimat for σ 2 w bliver ˆσ 2 w = n (x t ˆφx t 1 ) 2 t=2 n 1. (1.32) Det betingede maksimum likelihood estimat for φ fås ved at differentiere (1.31) mht. φ, og sætte udtrykket lig 0: [ ] L(φ, σw x 2 1 ) = (2π) (n 1) 2 σw (n 1) exp 1 n φ 2σw 2 (x t φx t 1 ) 2 1 n σw 2 (x t φx t 1 )x t 1, 18 t=2 t=2

27 1.2. ARMA MODELLER 0 = (2π) (n 1) = 2 σw (n 1) exp n (x t φx t 1 )x t 1 = t=2 [ 1 2σ 2 w ] n (x t φx t 1 ) 2 t=2 n x t x t 1 t=2 n t=2 φx 2 t 1. 1 σ 2 w n (x t φx t 1 )x t 1 Det betingede maksimum likelihood estimat for φ bliver n x t x t 1 t=2 ˆφ =. (1.33) n t=2 x 2 t 1 Det fremgår af ligning (1.33), at variansen kan ignoreres, når vi estimerer φ. Det skal dog bemærkes, at variansen skal bruges til at bestemme standard fejlene for φ estimatet. 11 Af ligning (1.33) kan det også ses, at ˆφ ˆρ(1). Dette vil sige, at maksimum likelihood estimatet for φ er tilnærmelsesvis det samme som Yule-Walker estimatet for φ i tilfældet med en AR(1). Da samme fremgangsmåde som i eksemplet med AR(1) kan benyttes til at finde maksimum likelihood estimaterne for en normal ARMA(p, q) model, vil vi ikke gennemgå lignende beregninger for ARMA(p, q) modeller. Det skal dog bemærkes, at det kan være svært at opstille likelihood funktionen som en eksplicit funktion af parametrene. Man kan derfor med fordel skrive likelihood funktionen vha. én-periodes prædiktionsfejl x t x t 1 t ARIMA(p, d, q) Førstedifferensen af en tidsrække {x t } defineres ved t=2 x t = x t x t 1 = (1 B)x t, (1.34) og kan benyttes til at fjerne en lineær eller stokastisk trend. Hvis trenden derimod ikke er lineær kan vi benytte højere ordens differenser. Definition 1.18 (Højere ordens differens) Differenser af orden d er givet ved d = (1 B) d. I det følgende indføres den integrerede ARMA model, også kaldet ARIMA. ARIMA er en udvidelse af ARMA modellerne som tager højde for differenser. Definition 1.19 En tidsrække {x t } siges at være en ARIMA(p, d, q), hvis er en ARMA(p, q). Generelt skrives modellen som d x t = (1 B) d x t (1.35) φ(b)(1 B) d x t = θ(b)w t. 11 Beregningerne for Maksimum likelihood estimaterne er uddybet ift. [Shumway og Stoffer, 2004, p. 126]. 19

28 KAPITEL 1. TIDSRÆKKEANALYSE Differensen d vil i praksis være 0 eller 1, men hvis en proces er eksplosivt voksende, kan det være nødvendigt at benytte d = 2, for at gøre den stationær. 1.3 Forecasting En metode til at kontrollere modellens evne til at fitte tidsrækken på, er ved at ekskludere de sidste værdier fra tidsrækken, og efterfølgende forsøge at estimere dem vha. modellen, givet resten af tidsrækken. Derefter kan de estimerede værdier sammenlignes med de værdier, der blev ekskluderet fra tidsrækken, for at vurdere modellen. Denne metode kaldes forecasting, og kan foretages på observeret data, men det er også muligt at forecaste fremtidige værdier for at opnå en forudsigelse af tidsrækkens udvikling. For at forecaste x n+m givet x = (x n,..., x 1 ) skal vi finde den model, der giver den mindste prædiktionsfejl, altså minimere mean square prediction error, givet ved E [ (x n+m x n n+m) 2 x ]. (1.36) I det følgende udledes prædiktoren for x n+m givet x, x n n+m, ud fra (1.36), samt den tilsvarende prædiktionsfejl P n n+m. Vi kan omskrive (1.36) ved at anvende c = x n n+m således, at hvilket kan forlænges til Minimum af g(c) findes ved at løse g(c) = E [ (x n+m c) 2 x ], g(c) = 2E [ x 2 n+m x ] 2cE [x n+m x] + c 2. g (c) = 2E [x n+m x] + 2c = 0, hvorfra det ses, at prædiktionen på den m te forecastede værdi er givet ved middelværdien [Cryer og Chan, 2008, app. F] x n n+m = E [x n+m x]. Hvis det antages at modellen er lineær, og derfor at prædiktoren bliver på formen x n n+m = α 0 + n α k x k, (1.37) hvor α 0, α 1,..., α n er reelle koefficienter, så gælder følgende egenskab. Bemærkning 1.20 (BLP for stationære processer) Den bedste lineære prædiktor, x n n+m = α 0 + n k=1 α kx k, af x n+m givet x for m 1 findes ved at løse hvor x 0 = 1 for α 0, α 1,..., α n. k=1 E [ (x n+m x n n+m)x k ] = 0, k = 0, 1,..., n, (1.38) 20

29 1.3. FORECASTING Ligningerne i (1.38) kaldes prædiktionsligningerne og anvendes til at løse for koefficienterne {α 0, α 1,..., α n }. Det antages, at E [x i ] = µ for alle i, og dermed giver prædiktionsligningen med k = 0, at E [ (x n+m x n n+m) 1 ] = 0 E [ x n n+m] = E [xn+m ] = µ. Ved at tage middelværdien i (1.37) fås, at µ = α 0 + ( n α k µ α 0 = µ 1 k=1 ) n α k, k=1 således at BLP bliver n x n n+m = µ + α k (x k µ). k=1 Hvis vi lader et underrum W være udspændt af (1, x 1,..., x n ), så vides det fra (1.37), at prædiktionen x n n+m er indeholdt i W. Fra projektionssætningen (sætning 3.3) er x n n+m givet ved projektionen af x n+m på et underrum W, således at prædiktionsfejlene (x n n+m x n+m ) er ortogonale med prædiktionsvariablene (1, x 1,..., x n ). Dette betyder, at vi kan trække middelværdien E [x i ] = µ fra alle variable, således at det kan antages, at middelværdien på de forecastede værdier er lig 0. Hvis vi derfor antager at µ = 0, og derfor at α 0 = 0, kan vi skrive (1.37) med m = 1 som x n n+1 = φ n1 x n + φ n2 x n φ nn x 1 = φ n x, hvor φ ij er de α er, der opfylder prædiktionsligningerne (1.38), givet ved ( E x n+1 n φ nj x n+1 j )x n+1 k = 0, for k = 1,..., n. j=1 Eftersom E [x j x i ] = γ(j i) bliver dette til n φ nj γ(k j) = γ(k), j=1 Γ n φ n = γ n, for k = 1,..., n hvor Γ n er en n n varians-kovarians matrix, φ n = (φ n1,..., φ nn ) er en n 1 vektor, og γ n = (γ(1),..., γ(n)) er en n 1 vektor. Varians-kovarians matricen Γ n er pr. definition positiv semi-definit. Fra projektionssætningen (sætning 3.3) vides det, at x n n+1 er entydigt bestemt, så hvis Γ n er singulær, vil den stadig kun have den ene løsning. Hvis Γ n er ikke-singulær, er elementerne i φ n entydigt bestemte og givet ved φ n = Γ 1 n γ n. 21

30 KAPITEL 1. TIDSRÆKKEANALYSE Forecasting af ARMA-modeller For ARMA-modeller, som er beskrevet i afsnit 1.2, vides det at Γ n er positiv definit [Shumway og Stoffer, 2004, p. 111], da σw 2 > 0 og γ(h) 0 når h. Prædiktionsfejlen, der optræder ved minimum mean square error prædiktion én periode frem, findes ved følgende beregning Pn+1 n = E [ (x n+1 x n n+1) 2] = E [ = E x 2 n+1 2γn Γ 1 n xx n+1 + γn Γ 1 n = γ(0) 2γ n Γ 1 n = γ(0) γ n Γ 1 n γ n, γ n + γ nγ 1 n da E [ xx ] = Γ n og E [xx n+1 ] = γ n. [ (x n+1 φ n x) 2] [ = E (x n+1 γn Γ 1 n x) 2] Γ n Γ 1 n γ n xx Γ 1 n γ n ] For kausale og invertible ARMA-modeller findes der en lettere måde at udtrykke forecastet på end prædiktionsligningerne i (1.38), og modellen antages derfor at være kausal og invertibel i resten af afsnittet. I stedet for at betragte prædiktoren x n n+m, baseret på {x n,..., x 1 }, anvender vi en prædiktor, der er baseret på informationsmængden for x n xn+m = E [xn+m xn, xn 1,..., x0, x 1,... ]. Vi betragter den kausale og invertible form af x n+m, se afsnit 1.2.4, x n+m = ψ j w n+m j, ψ 0 = 1 w n+m = j=0 π j x n+m j, π 0 = 1. j=0 (1.39) (1.40) Da fejlleddene w t har forventet værdi 0 for t > n, mens de har en observeret værdi for t n, { 0, for t > n, w t = E [w t x n, x n 1,... ] = (1.41) w t, for t n, kan den betingede forventning til x n+m fra (1.39) omskrives til x n+m = E [x n+m x n, x n 1,... ] = ψ j w n+m j = j=0 Prædiktionsfejlen kan vha. (1.42) bestemmes til Pn+m n = E [ (x n+m x n+m ) 2] = E ψ j w n+m j j=0 2 m 1 = E ψ j w n+m j = σw 2 j=0 m 1 j=0 ψ j w n+m j. (1.42) j=m 2 ψ j w n+m j j=m ψ 2 j. (1.43) Da x n+m sjældent er det samme som prædiktoren x n n+m, kan prædiktionsligningerne med fordel anvendes, hvis stikprøve størrelsen er lille. Men hvis stikprøvestørrelsen er stor, vil de blive approksimativt lige store. 22

31 1.3. FORECASTING Bemærkning 1.21 Prædiktionsfejlene er korrelerede, således at der for k 1 gælder, at m 1 E [(x n+m x n+m )(x n+m+k x n+m+k )] = σ 2 j=0 ψ j ψ j+k Forecasting ARIMA I afsnit blev ARIMA-modeller gennemgået og i dette afsnit vil vi udvide vores forecasting til at omfatte ARIMA-modeller. Hvis en tidsrække {x t } følger en ARIMA(p, d, q) model, ved vi fra definition 1.19, at y t = (1 B) d x t følger en ARMA(p, q), og dermed kan teorien fra afsnit bruges til at forecaste ỹ n+m. For d = 1 kan x n+m estimeres til x n+1 = x n + ỹ n+1. x n+2 = x n+1 + ỹ n+2 = x n + ỹ n+2 + ỹ n+1. x n+m = x n + m ỹ n+j, (1.44) j=1 hvor x n er observeret og (ỹ n+1,..., ỹ n+m ) er forecastet vha. teorien fra afsnit Prædiktionsfejl for ARIMA(p, 1, q) Prædiktionsfejlen er givet ved hvor det fra (1.44) gælder, at P n n+m = E [ (x n+m x n+m ) 2], (1.45) x n+m x n+m = m (y n+j ỹ n+j ). (1.46) j=1 Hvis det antages at y t er kausal, kan denne skrives på formen i (1.39), og prædiktoren ỹ t kan skrives på formen i (1.42) y n+m = ψ k w n+m k og ỹ n+m = k=0 Udtrykkene i (1.47) benyttes til at omskrive (1.46) til x n+m x n+m = = j=1 k=0 ( j 1 ψ k w n+m k. (1.47) k=m m ψ k w n+j k ψ k w n+j k m j=1 k=j ) ψ k w n+j k. (1.48) k=0 23

32 KAPITEL 1. TIDSRÆKKEANALYSE Herefter kan (1.48) substitueres ind i (1.45), så vi har at Pn+m n = E [ (x n+m x n+m ) 2] m = E j=1 ( j 1 k=0 ) 2 ψ k w n+j k = E [((ψ ψ m 1 )w n+1 + (ψ ψ m 2 )w n ψ 0 w n+m ) 2] = σw 2 ( (ψ0 + + ψ m 1 ) 2 + (ψ ψ m 2 ) ψ0 2 ), da E [w i w j ] = 0 for i j og E [ wi 2 ] = σ 2 w for alle i. Dermed fås følgende udtryk for prædiktionsfejlen ( m m j ) 2 Pn+m n = σw 2 ψ k. j=1 k= Holt-Winters forecast I dette afsnit vil vi udlede en speciel forecast metode kaldet Holt-Winters forecast. Vi vil betragte en tidsrække x t, som følger en ARIMA(0,1,1) også kaldet IMA(1,1) uden drift (α = 0), som kan opstilles som y t = x t x t 1 = w t + θw t 1. (1.49) Det antages at 1 < θ < 0, hvilket vil sige, at MA(1) modellen for y t er invertibel. Af notationsmæssige årsager anvendes λ = θ således, at y t = w t λw t 1. Under anvendelse af (1.41) bliver forecastet til y t således til ỹ t = E [y t ] = λw t 1. Heraf fås at w t = y t + λw t 1 = y t ỹ t. Da ỹ t = x t x t 1 kan forecastet for x t udtrykkes ved Således må der gælde, at x n+1 = x n + ỹ n+1 = x n λw n. w n = y n ỹ n = x n x n 1 ( x n x n 1 ) = x n x n. De ovenstående resultater kan nu anvendes til at omskrive forecastet på x t én periode frem til x n+1 = x n λw n = x n λ(x n x n ) = (1 λ)x n + λ x n. (1.50) Dette viser at forecastet på x t kan skrives som et vægtet gennemsnit af den forecastede afvigelse perioden før. Ved at iterere over (1.50) fås 24 x n+1 = (1 λ)x n + λ ((1 λ)x n 1 + λ x n 1 ) = (1 λ)x n + λ(1 λ)x n 1 + λ 2 ((1 λ)x n 2 + λ x n 2 ) = (1 λ) λ j x n j. (1.51) j=0

33 1.3. FORECASTING Vi har altså vist, at en IMA(1,1) kan skrives som en uendelig vægtet sum af de foregående observationer med eksponentielt aftagende vægte, da 0 < λ < 1. Udtrykket i (1.51) kaldes også for en EWMA model, Exponentially Weighted Moving Average. Betragter vi forecast to skridt frem, fås der vha. (1.51) x n+2 = (1 λ) x n+1 + λ j x n+1 j = (1 λ) x n+1 + λ λ j x n j j=1 = (1 λ) x n+1 + λ x n+1 = x n+1. Ved at fortsætte på samme måde kan det vises, at for k > 1 bliver forecastet k perioder frem lig forecastet én periode frem. Dette betyder at forecastet vil blive en horisontal linje for EWMA, hvilket understreger at modellen kun kan bruges til forecast én periode frem. Hvis vi ser bort fra antagelsen om, at driften α = 0, kan tidsrækken x t modelleres vha. en trend komponent α t i stedet for blot at tilføje α. Dette leder til følgende model x n+m = µ n + α n m, for m 1, (1.52) hvor µ t bestemmer niveauet. Vi betragter forecastet én periode frem, j=0 x n+1 = µ n + α n. (1.53) Vi anvender nu λ 0 til at opdatere µ t som en lineær funktion af x t og x t, på samme måde som i (1.50), og ved at substituere vha. (1.53) fås µ n+1 = (1 λ 0 )x n+1 + λ 0 x n+1 = (1 λ 0 )x n+1 + λ 0 (µ n + α n ). Ved at anvende v t = x t x t, kan vi simplificere udtrykket µ n+1 = (1 λ 0 )(µ n + α n + v n+1 ) + λ 0 (µ n + α n ) Tilsvarende kan α t vha. λ 1 skrives som = µ n + α n + (1 λ 0 )v n+1. (1.54) α n+1 = (1 λ 1 )(µ n+1 µ n ) + λ 1 ( µ n+1 µ n ) = (1 λ 1 )(µ n + α n + (1 λ 0 )v n+1 µ n ) + λ 1 α n = (1 λ 1 )(1 λ 0 )v n+1 + α n. (1.55) Parametrene λ 0 og λ 1 kan estimeres ved at minimere mean square error. Proceduren for én-periodes forecast foretages ved følgende procedure: 1. trin: Estimer λ 0 og λ 1 vha. minimum mean square error. 2. trin: Estimer µ n og α n fra (1.54) og (1.55). 3. trin: Beregn x n+1 vha. (1.53). 25

34 KAPITEL 1. TIDSRÆKKEANALYSE 26

35 Kapitel 2 Tidsrækkeanalyse af ejerlejligheders kontantpriser pr. m 2 Med udgangspunkt i teorien, der blev præsenteret i kapitel 1, vil vi analysere to tidsrækker, hvilke vi har dannet ud fra det datasæt, som vi har modtaget fra home. Disse tidsrækker repræsenterer ejerlejligheders kontantpriser pr. m 2 i to kommuner, Københavns Kommune og Aalborg Kommune. Formålet med denne databehandling er, at undersøge hvorvidt prisernes udvikling fra til kan modelleres vha. tidsrækkeanalyse. 2.1 Datapræsentation Vi har ved projektperiodens start fået udleveret et datasæt fra home bestående af handlede boliger. Til hver bolig er der i datasættet angivet følgende oplysninger: Beliggenhed Areal Afstand Årstal Antal Ja/nej Type Pris/værdi Dato Andre Adresse, region, kommune, postnr., by. Grundareal, boligareal, kælderareal, garage/carport. City, dagligvarer, skole, offentlig transport, strand. Opførelsesår, ombygningsår, nyt køkken, nyt tag, tilbygning, nye vinduer, nyt badeværelse, vurderingsår. Plan, værelser, soveværelser, toiletter. Elevator, gårdmiljø, altan, tæt ved vand. Varmeinstallation, ydervægge, tagdækning. Kontantpris, udbudspris, ejendomsværdi. Salgsdato, FormidAftDato. Boligtilstand (god/middel/dårlig), ejendomstype (ejerlejlighed, ideel anpart, nedlagt landbrug, rækkehus, samt villa (1 eller 2 familier)). Det skal dog bemærkes, at ikke alle boliger har alle oplysninger angivet. Alle boliger har desuden oplyst regions-, kommune- og ejendomstype ID ud fra talværdier.

36 KAPITEL 2. TIDSRÆKKEANALYSE AF EJERLEJLIGHEDERS KONTANTPRISER PR. M Dataklargøring Indledningsvis blev datasættet undersøgt og udbedret for fejl og/eller uoverensstemmelser (vha. Excel) ud fra de følgende kriterier: Opførelsesår De boliger, som havde opførelsesår enten før år 1500 eller efter 2009 blev undersøgt. Ved hjælp af et arkiv over solgte boliger på hjemmesiden 1 slettede vi de boliger, hvor hjemmesiden gav andre oplysninger eller hvis boligerne ikke kunne findes. Ombygningsår Alle boliger med ombygningsår enten lig med eller tidligere end opførelsesåret, samt ombygningsår efter 2009 blev alle sat lig med NULL, altså en ikke tilgængelig værdi. Kontantpris Boliger, som er handlet for et beløb under , blev undersøgt, og de boliger, hvor der var åbenlyse fejl i data, blev fjernet fra datasættet. Det blev ligeledes undersøgt, hvordan forholdet udbudspris/kontantpris var på boligerne. De boliger, hvor forholdet var større end 2 eller mindre end 1 2, blev undersøgt. Hvis der var åbenlyse fejl i kontantprisen, blev denne enten ændret eller boligen blev fjernet fra datasættet. Hvis der derimod var fejl i udbudsprisen blev denne ændret til NULL. De boliger, hvor det ikke var muligt at lokalisere fejlen, blev forsøgt fundet på Boliga, og alt efter søgningens resultat blev boligens data ændret eller slettet fra datasættet. Boligareal For alle boliger, som havde boligareal lig med 0, søgte vi igen på Boliga, og alt efter søgningens resultat blev boligens data enten ændret eller slettet fra datasættet. De boliger, som havde et boligareal på mindre end 30 m 2 blev undersøgt, og de boliger, hvor der var åbenlyse fejl i data, blev slettet. Den resterende databehandling er foretaget i R. 2.3 Valg af data For at begrænse os i dataanalysen har vi valgt kun at betragte ejerlejligheder inden for de to kommuner, København og Aalborg. Vi har desuden valgt kun at betragte de faktorer, som er indeholdt i datasættet, og dermed ikke at betragte eksogene faktorer såsom inflation, konjuktur og finanskrise. Grundet ovenstående begrænsninger ser vi på, hvilke fejlfaktorer vi kan finde i datasættet, som knytter sig til ejerlejligheder. Der er store grund- og/eller kælderarealer på nogle af ejerlejlighederne, og det tyder derfor på, at der er nogle fejlplacerede villaer. Da vi kan se, at vi uden betydning for mængden af data kan filtrere således, at vi kun betragter ejerlejligheder med et grundareal på 0, og et kælderareal på maks 10 m 2, er dette foretaget i databehandlingen. Til hver kommune konstrueres der en tidsrække, bestående af logaritmen til den gennemsnitlige kvadratmeterpris for alle handler pr. uge i datasættet. Hvis der ikke er handlet i løbet af ugen, er værdien sat til at være den samme som ugen før. Vi har dermed sikret os, at vi arbejder med regulære tidsrækker. Tidsrækkerne kan ses 1 På samles oplysninger om alle handlede boliger i Danmark. 28

37 2.4. VALG AF MODEL i figur 2.1. Ugerne følger ikke præcis de egentlige ugenumre, da vi har betragtet uge 1 som den januar De andre uger er defineret ift. uge 1. Begge tidsrækker går fra uge 1 i 2002 til uge 6 i 2009, og består derfor af 370 observationer. Indlæsning af data, samt konstruktion af tidsrække, for Københavns Kommune kan ses i R-kode E.1. R-koden for Aalborg Kommune er af samme type, hvorfor vi har valgt at udelade denne. logpris logpris Tid (a) Københavns Kommune Tid (b) Aalborg Kommune Figur 2.1: Ejerlejligheders kontantprisudvikling pr. m 2 i de to kommuner ( ) 2.4 Valg af model For at undersøge hvilken tidsrækkemodel, der skal anvendes på tidsrækkerne, er autokorrelationsfunktionerne plottet i figur 2.2. Figurerne viser, at korrelationerne aftager meget langsomt. 2 Dette, sammenholdt med PACF erne i figur 2.3 og prisudviklingerne i figur 2.1, viser, at tidsrækkerne ikke er stationære. Da tidsrækkerne ikke er stationære, er førstedifferenserne for tidsrækkerne plottet i figur 2.4. Ved at tage førstedifferenserne ses det, at middelværdien tilnærmelsesvis er lig med 0. Det antages, se bemærkning 2.1, at variansen er konstant over tid. ACF og PACF for førstedifferenserne er plottet i figur 2.5 og 2.6. ACF erne viser begge, at der kun optræder én periode med signifikant korrelation, mens PACF erne viser, at korrelationen gradvist nærmer sig 0 for begge tidsrækker. Hermed er førstedifferensen til tidsrækken stationær, hvilket vil sige, at vi kan anvende en ARIMAmodel på tidsrækken. Da figurerne viser så tydelige indikationer på, at førstedifferenserne følger en MA(1), har vi ikke følt det nødvendigt at foretage yderligere undersøgelser for valget af model. Ved at modellere begge tidsrækker med en ARIMA(0,1,1) fås følgende koefficienter vha. OLS-metoden i R: København : θ 1 = 0.75 Aalborg : θ 1 = 0.90 (2.1) Bemærkning 2.1 På trods af, at figur 2.1 og 2.4 antyder, at variansen ikke er konstant, antages der at være konstant varians på førstedifferenserne. Dette kan være problematisk, men en modellering af variansen er uden for rammerne for dette projekt. 2 Bemærk at lags er angivet i år. 29

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som MLR antagelserne Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som y = β 0 + β 1 x 1 + β 2 x 2 + + β k x k + u, hvor β 0, β 1, β 2,...,β k er ukendte parametere,

Læs mere

Center for Statistik. Multipel regression med laggede responser som forklarende variable

Center for Statistik. Multipel regression med laggede responser som forklarende variable Center for Statistik Handelshøjskolen i København MPAS Tue Tjur November 2006 Multipel regression med laggede responser som forklarende variable Ved en tidsrække forstås i almindelighed et datasæt, der

Læs mere

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen Landmålingens fejlteori Lektion Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ - rw@math.aau.dk Institut for Matematiske Fag Aalborg Universitet En stokastisk variabel er en variabel,

Læs mere

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Anvendt Statistik Lektion 8. Multipel Lineær Regression Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke

Læs mere

Økonometri: Lektion 2 Multipel Lineær Regression 1/27

Økonometri: Lektion 2 Multipel Lineær Regression 1/27 Økonometri: Lektion 2 Multipel Lineær Regression 1/27 Multipel Lineær Regression Sidst så vi på simpel lineær regression, hvor y er forklaret af én variabel. Der er intet, der forhindre os i at have mere

Læs mere

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17 nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse

Læs mere

Introduktion til Statistiske Modeller for Finansielle Tidsserier. Forelæsningsnoter til Finansiel Økonometri

Introduktion til Statistiske Modeller for Finansielle Tidsserier. Forelæsningsnoter til Finansiel Økonometri Introduktion til Statistiske Modeller for Finansielle Tidsserier Forelæsningsnoter til Finansiel Økonometri Jesper Lund mail@jesperlund.com http://www.jesperlund.com 14. marts 2006 1 Indledning Formålet

Læs mere

Simpel Lineær Regression: Model

Simpel Lineær Regression: Model Simpel Lineær Regression: Model Sidst så vi på simpel lineære regression. Det er en statisisk model på formen y = β 0 + β 1 x + u, hvor fejlledet u, har egenskaben E[u x] = 0. Dette betyder bl.a. E[y x]

Læs mere

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i.

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i. Repetition af vektor-regning Økonometri: Lektion 3 Matrix-formulering Fordelingsantagelse Hypotesetest Antag vi har to n-dimensionelle (søjle)vektorer a 1 b 1 a 2 a =. og b = b 2. a n b n Tænk på a og

Læs mere

Kvantitative Metoder 1 - Forår Dagens program

Kvantitative Metoder 1 - Forår Dagens program Dagens program Afsnit 6.1 Den standardiserede normalfordeling Normalfordelingen Beskrivelse af normalfordelinger: - Tæthed og fordelingsfunktion - Middelværdi, varians og fraktiler Lineære transformationer

Læs mere

Module 1: Lineære modeller og lineær algebra

Module 1: Lineære modeller og lineær algebra Module : Lineære modeller og lineær algebra. Lineære normale modeller og lineær algebra......2 Lineær algebra...................... 6.2. Vektorer i R n................... 6.2.2 Regneregler for vektorrum...........

Læs mere

Poul Thyregod, introslide.tex Specialkursus vid.stat. foraar Lad θ = θ(β) R k for β B R m med m k

Poul Thyregod, introslide.tex Specialkursus vid.stat. foraar Lad θ = θ(β) R k for β B R m med m k Dagens program: Likelihoodfunktion, begreber : Mandag den 4. februar Den generelle lineære model score-funktion: første afledede af log-likelihood har middelværdien nul observeret information: anden afledede

Læs mere

Økonometri 1. Dagens program. Den multiple regressionsmodel 18. september 2006

Økonometri 1. Dagens program. Den multiple regressionsmodel 18. september 2006 Dagens program Økonometri Den multiple regressionsmodel 8. september 006 Opsamling af statistiske resultater om den simple lineære regressionsmodel (W kap..5). Den multiple lineære regressionsmodel (W

Læs mere

Økonometri Lektion 1 Simpel Lineær Regression 1/31

Økonometri Lektion 1 Simpel Lineær Regression 1/31 Økonometri Lektion 1 Simpel Lineær Regression 1/31 Simpel Lineær Regression Mål: Forklare variablen y vha. variablen x. Fx forklare Salg (y) vha. Reklamebudget (x). Statistisk model: Vi antager at sammenhængen

Læs mere

Økonometri: Lektion 2 Multipel Lineær Regression 1/33

Økonometri: Lektion 2 Multipel Lineær Regression 1/33 Økonometri: Lektion 2 Multipel Lineær Regression 1/33 Simpel Lineær Regression: Model Sidst så vi på simpel lineære regression. Det er en statisisk model på formen y = β 0 +β 1 x +u, hvor fejlledet u,

Læs mere

Kvantitative metoder 2

Kvantitative metoder 2 Kvantitative metoder 2 Den multiple regressionsmodel 5. marts 2007 regressionsmodel 1 Dagens program Emnet for denne forelæsning er stadig den multiple regressionsmodel (Wooldridge kap. 3.4-3.5, E.2) Variansen

Læs mere

Økonometri 1. Den simple regressionsmodel 11. september Økonometri 1: F2

Økonometri 1. Den simple regressionsmodel 11. september Økonometri 1: F2 Økonometri 1 Den simple regressionsmodel 11. september 2006 Dagens program Den simple regressionsmodel SLR : Én forklarende variabel (Wooldridge kap. 2.1-2.4) Motivation for gennemgangen af SLR Definition

Læs mere

Kvantitative Metoder 1 - Efterår Dagens program

Kvantitative Metoder 1 - Efterår Dagens program Dagens program Afsnit 6.1. Ligefordelinger, fra sidst Den standardiserede normalfordeling Normalfordelingen Beskrivelse af normalfordelinger: - Tæthed og fordelingsfunktion - Middelværdi, varians og fraktiler

Læs mere

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Kursus 02402 Introduktion til Statistik Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup) Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse Bygning 324, Rum 220 Danmarks Tekniske

Læs mere

Den todimensionale normalfordeling

Den todimensionale normalfordeling Den todimensionale normalfordeling Definition En todimensional stokastisk variabel X Y siges at være todimensional normalfordelt med parametrene µ µ og når den simultane tæthedsfunktion for X Y kan skrives

Læs mere

Et eksempel på en todimensional normalfordeling Anders Milhøj September 2006

Et eksempel på en todimensional normalfordeling Anders Milhøj September 2006 Et eksempel på en todimensional normalfordeling Anders Milhøj September 006 I dette notat gennemgås et eksempel, der illustrerer den todimensionale normalfordelings egenskaber. Notatet lægger sig op af

Læs mere

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode Kursus 02402 Introduktion til Statistik Forelæsning 11: Kapitel 11: Regressionsanalyse Oversigt 1 Gennemgående eksempel: Højde og vægt 2 Korrelation 3 Per Bruun Brockhoff DTU Compute, Statistik og Dataanalyse

Læs mere

Module 3: Statistiske modeller

Module 3: Statistiske modeller Department of Statistics ST502: Statistisk modellering Pia Veldt Larsen Module 3: Statistiske modeller 31 ANOVA 1 32 Variabelselektion 4 321 Multipel determinationskoefficient 5 322 Variabelselektion med

Læs mere

Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable

Landmålingens fejlteori - Lektion 2 - Transformation af stokastiske variable Landmålingens fejlteori Lektion 2 Transformation af stokastiske variable - kkb@math.aau.dk http://people.math.aau.dk/ kkb/undervisning/lf12 Institut for Matematiske Fag Aalborg Universitet 1/31 Repetition:

Læs mere

Simpel Lineær Regression

Simpel Lineær Regression Simpel Lineær Regression Mål: Forklare variablen y vha. variablen x. Fx forklare Salg (y) vha. Reklamebudget (x). Vi antager at sammenhængen mellem y og x er beskrevet ved y = β 0 + β 1 x + u. y: Afhængige

Læs mere

1. Intoduktion. Undervisningsnoter til Øvelse i Paneldata

1. Intoduktion. Undervisningsnoter til Øvelse i Paneldata 1 Intoduktion Før man springer ud i en øvelse om paneldata og panelmodeller, kan det selvfølgelig være rart at have en fornemmelse af, hvorfor de er så vigtige i moderne mikro-økonometri, og hvorfor de

Læs mere

Dagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at

Dagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at Likelihood teori Lineær regression (intro) Dagens Emner Likelihood-metoden M : X i N(µ,σ 2 ) hvor µ og σ 2 er ukendte Vi har, at L(µ,σ 2 1 ) = ( 2πσ 2)n/2 e 1 2 P n (xi µ)2 er tætheden som funktion af

Læs mere

DesignMat Uge 1 Gensyn med forårets stof

DesignMat Uge 1 Gensyn med forårets stof DesignMat Uge 1 Gensyn med forårets stof Preben Alsholm Efterår 2010 1 Hovedpunkter fra forårets pensum 11 Taylorpolynomium Taylorpolynomium Det n te Taylorpolynomium for f med udviklingspunkt x 0 : P

Læs mere

Institut for Matematiske Fag Aalborg Universitet Specielt: Var(aX) = a 2 VarX 1/40. Lad X α, X β og X γ være stokastiske variable (vinkelmålinger) med

Institut for Matematiske Fag Aalborg Universitet Specielt: Var(aX) = a 2 VarX 1/40. Lad X α, X β og X γ være stokastiske variable (vinkelmålinger) med Repetition: Varians af linear kombination Landmålingens fejlteori Lektion 5 Fejlforplantning - rw@math.aau.dk Antag X 1, X,..., X n er uafhængige stokastiske variable, og Y er en linearkombination af X

Læs mere

Praktiske ting og sager: Forelæsninger tirsdag og torsdag kl i Kirkesalen, Studiestræde 38 Øvelser

Praktiske ting og sager: Forelæsninger tirsdag og torsdag kl i Kirkesalen, Studiestræde 38 Øvelser Uge 36 Velkommen tilbage Praktiske ting og sager: Forelæsninger tirsdag og torsdag kl. -2 i Kirkesalen, Studiestræde 38 Øvelser Hold -4 og 6: mandag og onsdag kl. 8-; start 3. september Hold 5: tirsdag

Læs mere

Chapter 3. Modulpakke 3: Egenværdier. 3.1 Indledning

Chapter 3. Modulpakke 3: Egenværdier. 3.1 Indledning Chapter 3 Modulpakke 3: Egenværdier 3.1 Indledning En vektor v har som bekendt både størrelse og retning. Hvis man ganger vektoren fra højre på en kvadratisk matrix A bliver resultatet en ny vektor. Hvis

Læs mere

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Anvendt Statistik Lektion 7. Simpel Lineær Regression Anvendt Statistik Lektion 7 Simpel Lineær Regression 1 Er der en sammenhæng? Plot af mordraten () mod fattigdomsraten (): Scatterplot Afhænger mordraten af fattigdomsraten? 2 Scatterplot Et scatterplot

Læs mere

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større

Læs mere

Matematisk modellering og numeriske metoder. Lektion 5

Matematisk modellering og numeriske metoder. Lektion 5 Matematisk modellering og numeriske metoder Lektion 5 Morten Grud Rasmussen 19. september, 2013 1 Euler-Cauchy-ligninger [Bogens afsnit 2.5, side 71] 1.1 De tre typer af Euler-Cauchy-ligninger Efter at

Læs mere

Løsning til eksaminen d. 14. december 2009

Løsning til eksaminen d. 14. december 2009 DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,

Læs mere

Statistik og Sandsynlighedsregning 2

Statistik og Sandsynlighedsregning 2 Statistik og Sandsynlighedsregning 2 Uafhængighed og reelle transformationer Helle Sørensen Uge 8, mandag SaSt2 (Uge 8, mandag) Uafh. og relle transf. 1 / 16 Program I dag: Uafhængighed af kontinuerte

Læs mere

hvor a og b er konstanter. Ved middelværdidannelse fås videre

hvor a og b er konstanter. Ved middelværdidannelse fås videre Uge 3 Teoretisk Statistik. marts 004. Korrelation og uafhængighed, repetition. Eksempel fra sidste gang (uge ) 3. Middelværdivektor, kovarians- og korrelationsmatrix 4. Summer af stokastiske variable 5.Den

Læs mere

Module 4: Ensidig variansanalyse

Module 4: Ensidig variansanalyse Module 4: Ensidig variansanalyse 4.1 Analyse af én stikprøve................. 1 4.1.1 Estimation.................... 3 4.1.2 Modelkontrol................... 4 4.1.3 Hypotesetest................... 6 4.2

Læs mere

! Variansen på OLS estimatoren. ! Multikollinaritet. ! Variansen i misspecificerede modeller. ! Estimat af variansen på fejlleddet

! Variansen på OLS estimatoren. ! Multikollinaritet. ! Variansen i misspecificerede modeller. ! Estimat af variansen på fejlleddet Dagens program Økonometri Den multiple regressionsmodel 4. februar 003 regressionsmodel Emnet for denne forelæsning er stadig den multiple regressionsmodel (Wooldridge kap. 3.4-3.5)! Opsamling fra sidst

Læs mere

To samhørende variable

To samhørende variable To samhørende variable Statistik er tal brugt som argumenter. - Leonard Louis Levinsen Antagatviharn observationspar x 1, y 1,, x n,y n. Betragt de to tilsvarende variable x og y. Hvordan måles sammenhængen

Læs mere

Tema. Dagens tema: Indfør centrale statistiske begreber.

Tema. Dagens tema: Indfør centrale statistiske begreber. Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i

Læs mere

Dagens Emner. Likelihood teori. Lineær regression (intro) p. 1/22

Dagens Emner. Likelihood teori. Lineær regression (intro) p. 1/22 Dagens Emner Likelihood teori Lineær regression (intro) p. 1/22 Likelihood-metoden M : X i N(µ,σ 2 ) hvor µ og σ 2 er ukendte Vi har, at L(µ,σ 2 ) = ( 1 2πσ 2)n/2 e 1 2σ 2 P n (x i µ) 2 er tætheden som

Læs mere

Vægte motiverende eksempel. Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl. Vægtet model. Vægtrelationen

Vægte motiverende eksempel. Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl. Vægtet model. Vægtrelationen Vægte motiverende eksempel Landmålingens fejlteori Lektion 4 Vægtet gennemsnit Fordeling af slutfejl - kkb@mathaaudk Institut for Matematiske Fag Aalborg Universitet Højdeforskellen mellem punkterne P

Læs mere

Modul 6: Regression og kalibrering

Modul 6: Regression og kalibrering Forskningsenheden for Statistik ST501: Science Statistik Bent Jørgensen Modul 6: Regression og kalibrering 6.1 Årsag og virkning................................... 1 6.2 Kovarians og korrelation...............................

Læs mere

Statistik og Sandsynlighedsregning 2

Statistik og Sandsynlighedsregning 2 Statistik og Sandsynlighedsregning 2 Lineære transformationer, middelværdi og varians Helle Sørensen Uge 8, onsdag SaSt2 (Uge 8, onsdag) Lineære transf. og middelværdi 1 / 15 Program I formiddag: Fordeling

Læs mere

Økonometri 1. Inferens i den lineære regressionsmodel 2. oktober Økonometri 1: F8 1

Økonometri 1. Inferens i den lineære regressionsmodel 2. oktober Økonometri 1: F8 1 Økonometri 1 Inferens i den lineære regressionsmodel 2. oktober 2006 Økonometri 1: F8 1 Dagens program Opsamling om asymptotiske egenskaber: Asymptotisk normalitet Asymptotisk efficiens Test af flere lineære

Læs mere

Kvantitative metoder 2

Kvantitative metoder 2 Kvantitative metoder Heteroskedasticitet 11. april 007 KM: F18 1 Oversigt: Heteroskedasticitet OLS estimation under heteroskedasticitet (W.8.1-): Konsekvenser af heteroskedasticitet for OLS Gyldige test

Læs mere

Lineære 1. ordens differentialligningssystemer

Lineære 1. ordens differentialligningssystemer enote enote Lineære ordens differentialligningssystemer Denne enote beskriver ordens differentialligningssystemer og viser, hvordan de kan løses enoten er i forlængelse af enote, der beskriver lineære

Læs mere

Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl

Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl Landmålingens fejlteori Lektion 4 Vægtet gennemsnit Fordeling af slutfejl - kkb@math.aau.dk http://people.math.aau.dk/ kkb/undervisning/lf13 Institut for Matematiske Fag Aalborg Universitet 1/1 Vægtet

Læs mere

Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl

Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl Landmålingens fejlteori Lektion 4 Vægtet gennemsnit Fordeling af slutfejl - rw@math.aau.dk Institut for Matematiske Fag Aalborg Universitet 1/36 Estimation af varians/spredning Antag X 1,...,X n stokastiske

Læs mere

Module 12: Mere om variansanalyse

Module 12: Mere om variansanalyse Module 12: Mere om variansanalyse 12.1 Parreded observationer.................. 1 12.2 Faktor med 2 niveauer (0-1 variabel)......... 3 12.3 Tosidig variansanalyse med tilfældig virkning..... 9 12.3.1 Uafhængighedsbetragtninger..........

Læs mere

Økonometri: Lektion 4. Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater

Økonometri: Lektion 4. Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater Økonometri: Lektion 4 Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater 1 / 35 Hypotesetest for én parameter Antag vi har model y = β 0 + β 1 x 2 + β 2 x 2 + + β k x k + u. Vi

Læs mere

INSTITUT FOR MATEMATISKE FAG c

INSTITUT FOR MATEMATISKE FAG c INSTITUT FOR MATEMATISKE FAG c AALBORG UNIVERSITET FREDRIK BAJERS VEJ 7 G 9220 AALBORG ØST Tlf.: 96 35 89 27 URL: www.math.aau.dk Fax: 98 15 81 29 E-mail: bjh@math.aau.dk Dataanalyse Sandsynlighed og stokastiske

Læs mere

Oversigt over emner. Punktestimatorer: Centralitet(bias) og efficiens

Oversigt over emner. Punktestimatorer: Centralitet(bias) og efficiens Oversigt Oversigt over emner 1 Punkt- og intervalestimation Punktestimatorer: Centralitet(bias) og efficiens 2 Konfidensinterval Konfidensinterval for andel Konfidensinterval - normalfordelt stikprøve

Læs mere

Produkt og marked - matematiske og statistiske metoder

Produkt og marked - matematiske og statistiske metoder Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 19, 2016 1/26 Kursusindhold: Sandsynlighedsregning og lagerstyring

Læs mere

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede fordelinger (kap. 4) Middelværdi og varians (kap. 3-4) Fordelingsresultater

Læs mere

Økonometri 1. Inferens i den lineære regressionsmodel 25. september Økonometri 1: F6 1

Økonometri 1. Inferens i den lineære regressionsmodel 25. september Økonometri 1: F6 1 Økonometri 1 Inferens i den lineære regressionsmodel 25. september 2006 Økonometri 1: F6 1 Oversigt: De næste forelæsninger Statistisk inferens: hvorledes man med udgangspunkt i en statistisk model kan

Læs mere

Lineær Algebra F08, MØ

Lineær Algebra F08, MØ Lineær Algebra F08, MØ Vejledende besvarelser af udvalgte opgaver fra Ugeseddel 3 og 4 Ansvarsfraskrivelse: Den følgende vejledning er kun vejledende. Opgaverne kommer i vilkårlig rækkefølge. Visse steder

Læs mere

Vejledende besvarelser til opgaver i kapitel 14

Vejledende besvarelser til opgaver i kapitel 14 Vejledende besvarelser til opgaver i kapitel 14 Opgave 1 a) Det første trin i opstillingen af en hypotesetest er at formulere to hypoteser, hvoraf den ene støtter den teori vi vil teste, mens den anden

Læs mere

Kvantitative Metoder 1 - Forår Dagens program

Kvantitative Metoder 1 - Forår Dagens program Dagens program Kontinuerte fordelinger Simultane fordelinger Kovarians og korrelation Uafhængighed Betingede fordelinger - Middelværdi og varians - Sammenhæng med uafhængighed 1 Figur 1: En tæthedsfunktion

Læs mere

Multipel Lineær Regression

Multipel Lineær Regression Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer

Læs mere

Fejlforplantning. Landmålingens fejlteori - Lektion 5 - Fejlforplantning. Repetition: Varians af linear kombination. Eksempel: Vinkelberegning

Fejlforplantning. Landmålingens fejlteori - Lektion 5 - Fejlforplantning. Repetition: Varians af linear kombination. Eksempel: Vinkelberegning Fejlforplantning Landmålingens fejlteori Lektion 5 Fejlforplantning - kkb@math.aau.dk http://people.math.aau.dk/ kkb/undervisning/lf13 Landmåling involverer ofte bestemmelse af størrelser som ikke kan

Læs mere

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET. NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET. Eksamen i Statistik 1 Tag-hjem prøve 1. juli 2010 24 timer Alle hjælpemidler er tilladt. Det er tilladt at skrive med blyant og benytte viskelæder,

Læs mere

Kvantitative metoder 2

Kvantitative metoder 2 Kvantitative metoder 2 Specifikation og dataproblemer 2. maj 2007 KM2: F22 1 Program Specifikation og dataproblemer, fortsat (Wooldridge kap. 9): Betydning af målefejl Dataudvælgelse: Manglende observationer

Læs mere

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge

Statistik og Sandsynlighedsregning 2. Repetition og eksamen. Overheads til forelæsninger, mandag 7. uge Statistik og Sandsynlighedsregning 2 Repetition og eksamen Overheads til forelæsninger, mandag 7. uge 1 Normalfordelingen Erfaringsmæssigt er normalfordelingen velegnet til at beskrive variationen i mange

Læs mere

Økonometri lektion 5 Multipel Lineær Regression. Inferens Modelkontrol Prædiktion

Økonometri lektion 5 Multipel Lineær Regression. Inferens Modelkontrol Prædiktion Økonometri lektion 5 Multipel Lineær Regression Inferens Modelkontrol Prædiktion Multipel Lineær Regression Data: Sæt af oservationer (x i, x i,, x ki, y i, i,,n y i er den afhængige variael x i, x i,,

Læs mere

Lineære differentialligningers karakter og lineære 1. ordens differentialligninger

Lineære differentialligningers karakter og lineære 1. ordens differentialligninger enote 11 1 enote 11 Lineære differentialligningers karakter og lineære 1. ordens differentialligninger I denne note introduceres lineære differentialligninger, som er en speciel (og bekvem) form for differentialligninger.

Læs mere

Bilag 12 Regressionsanalysens tabeller og forklaringer

Bilag 12 Regressionsanalysens tabeller og forklaringer Bilag 12 Regressionsanalysens tabeller og forklaringer Regressionsanalysens tabeller og forklaringer Regressionsanalysen vil være delt op i 2 blokke. Første blok vil analysere hvor meget de tre TPB variabler

Læs mere

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte

Læs mere

Økonometri 1. Dagens program. Den simple regressionsmodel 15. september 2006

Økonometri 1. Dagens program. Den simple regressionsmodel 15. september 2006 Dagens program Økonometri Den simple regressionsmodel 5. september 006 Den simple lineære regressionsmodel (Wooldridge kap.4-.6) Eksemplet fortsat: Løn og uddannelse på danske data Funktionel form Statistiske

Læs mere

Konfidensintervaller og Hypotesetest

Konfidensintervaller og Hypotesetest Konfidensintervaller og Hypotesetest Konfidensinterval for andele χ -fordelingen og konfidensinterval for variansen Hypoteseteori Hypotesetest af middelværdi, varians og andele Repetition fra sidst: Konfidensintervaller

Læs mere

Modul 12: Regression og korrelation

Modul 12: Regression og korrelation Forskningsenheden for Statistik ST01: Elementær Statistik Bent Jørgensen Modul 12: Regression og korrelation 12.1 Sammenligning af to regressionslinier........................ 1 12.1.1 Test for ens hældning............................

Læs mere

Modulpakke 3: Lineære Ligningssystemer

Modulpakke 3: Lineære Ligningssystemer Chapter 4 Modulpakke 3: Lineære Ligningssystemer 4. Homogene systemer I teknikken møder man meget ofte modeller der leder til systemer af koblede differentialligninger. Et eksempel på et sådant system

Læs mere

Appendiks Økonometrisk teori... II

Appendiks Økonometrisk teori... II Appendiks Økonometrisk teori... II De klassiske SLR-antagelser... II Hypotesetest... VII Regressioner... VIII Inflation:... VIII Test for SLR antagelser... IX Reset-test... IX Plots... X Breusch-Pagan

Læs mere

Økonometri: Lektion 7 Emne: Prædiktionsintervaller, RESET teset, proxy variable og manglende data.

Økonometri: Lektion 7 Emne: Prædiktionsintervaller, RESET teset, proxy variable og manglende data. Økonometri: Lektion 7 Emne: Prædiktionsintervaller, RESET teset, proxy variable og manglende data. 1 / 32 Motivation Eksempel: Savings = β 0 + β 1 Income + u Vi ved allerede, hvordan vi estimerer regresseionlinjen:

Læs mere

Heisenbergs usikkerhedsrelationer. Abstrakt. Hvorfor? Funktionsrum. Nils Byrial Andersen Institut for Matematik. Matematiklærerdag 2013

Heisenbergs usikkerhedsrelationer. Abstrakt. Hvorfor? Funktionsrum. Nils Byrial Andersen Institut for Matematik. Matematiklærerdag 2013 Heisenbergs usikkerhedsrelationer Nils Byrial Andersen Institut for Matematik Matematiklærerdag 013 1 / 17 Abstrakt Heisenbergs usikkerhedsrelationer udtrykker at man ikke på samme tid både kan bestemme

Læs mere

Statistik Lektion 4. Variansanalyse Modelkontrol

Statistik Lektion 4. Variansanalyse Modelkontrol Statistik Lektion 4 Variansanalyse Modelkontrol Eksempel Spørgsmål: Er der sammenhæng mellem udetemperaturen og forbruget af gas? Y : Forbrug af gas (gas) X : Udetemperatur (temp) Scatterplot SPSS: Estimerede

Læs mere

Landmålingens fejlteori - Lektion 5 - Fejlforplantning

Landmålingens fejlteori - Lektion 5 - Fejlforplantning Landmålingens fejlteori Lektion 5 Fejlforplantning - kkb@math.aau.dk Institut for Matematiske Fag Aalborg Universitet 1/30 Fejlforplantning Landmåling involverer ofte bestemmelse af størrelser som ikke

Læs mere

Lineære 1. ordens differentialligningssystemer

Lineære 1. ordens differentialligningssystemer enote enote Lineære ordens differentialligningssystemer Denne enote beskriver ordens differentialligningssystemer og viser, hvordan de kan løses enoten er i forlængelse af enote, der beskriver lineære

Læs mere

Statistiske principper

Statistiske principper Statistiske principper 1) Likelihood princippet - Maximum likelihood estimater - Likelihood ratio tests - Deviance 2) Modelbegrebet - Modelkontrol 3) Sufficient datareduktion 4) Likelihood inferens i praksis

Læs mere

Statistik for ankomstprocesser

Statistik for ankomstprocesser Statistik for ankomstprocesser Anders Gorst-Rasmussen 20. september 2006 Resumé Denne note er en kortfattet gennemgang af grundlæggende statistiske værktøjer, man kunne tænke sig brugt til at vurdere rimeligheden

Læs mere

Stokastiske processer og køteori

Stokastiske processer og køteori Stokastiske processer og køteori 3. kursusgang Anders Gorst-Rasmussen Institut for Matematiske Fag Aalborg Universitet 1 SIDSTE GANG Ankomstproces T 1, T 2,... (ankomsttid per kunde) til køsystem. Modellér

Læs mere

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Lineær regression. Simpel regression. Model. ofte bruges følgende notation: Lineær regression Simpel regression Model Y i X i i ofte bruges følgende notation: Y i 0 1 X 1i i n i 1 i 0 Findes der en linie, der passer bedst? Metode - Generel! least squares (mindste kvadrater) til

Læs mere

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression Logistisk Regression Repetition Fortolkning af odds Test i logistisk regression Logisitks Regression: Repetition Y {0,} binær afhængig variabel X skala forklarende variabel π P( Y X x) Odds(Y X x) π /(-π

Læs mere

Teoretisk Statistik, 9 marts nb. Det forventes ikke, at alt materialet dækkes d. 9. marts.

Teoretisk Statistik, 9 marts nb. Det forventes ikke, at alt materialet dækkes d. 9. marts. Teoretisk Statistik, 9 marts 2005 Empiriske analoger (Kap. 3.7) Normalfordelingen (Kap. 3.12) Opsamling på Kap. 3 nb. Det forventes ikke, at alt materialet dækkes d. 9. marts. 1 Empiriske analoger Betragt

Læs mere

Uge 10 Teoretisk Statistik 1. marts 2004

Uge 10 Teoretisk Statistik 1. marts 2004 1 Uge 10 Teoretisk Statistik 1. marts 004 1. u-fordelingen. Normalfordelingen 3. Middelværdi og varians 4. Mere normalfordelingsteori 5. Grafisk kontrol af normalfordelingsantagelse 6. Eksempler 7. Oversigt

Læs mere

Algebra - Teori og problemløsning

Algebra - Teori og problemløsning Algebra - Teori og problemløsning, januar 05, Kirsten Rosenkilde. Algebra - Teori og problemløsning Kapitel -3 giver en grundlæggende introduktion til at omskrive udtryk, faktorisere og løse ligningssystemer.

Læs mere

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved

Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved Matematisk Modellering 1 (reeksamen) Side 1 Opgave 1 Betragt to diskrete stokastiske variable X og Y. Antag at sandsynlighedsfunktionen p X for X er givet ved { 1 hvis x {1, 2, 3}, p X (x) = 3 0 ellers,

Læs mere

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. Tema Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. (Fx. x. µ) Hypotese og test. Teststørrelse. (Fx. H 0 : µ = µ 0 ) konfidensintervaller

Læs mere

Matematisk Modellering 1 Cheat Sheet

Matematisk Modellering 1 Cheat Sheet By a team of brave computer scientists: Mads P. Buch, Tobias Brixen, Troels Thorsen, Peder Detlefsen, Mark Gottenborg, Peter Krogshede - 1 Contents 1 Basalt 3 1.1 Varianser...............................

Læs mere

Statistik Lektion 17 Multipel Lineær Regression

Statistik Lektion 17 Multipel Lineær Regression Statistik Lektion 7 Multipel Lineær Regression Polynomiel regression Ikke-lineære modeller og transformation Multi-kolinearitet Auto-korrelation og Durbin-Watson test Multipel lineær regression x,x,,x

Læs mere

Økonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol

Økonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol Økonometri: Lektion 5 Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol 1 / 35 Veksekvirkning: Motivation Vi har set på modeller som Price

Læs mere

Lidt om fordelinger, afledt af normalfordelingen

Lidt om fordelinger, afledt af normalfordelingen IMM, 2002-10-10 Poul Thyregod Lidt om fordelinger, afledt af normalfordelingen 1 Introduktion I forbindelse med inferens i normalfordelinger optræder forskellige fordelinger, der er afledt af normalfordelingen,

Læs mere

Jeg foretager her en kort indføring af polynomier over såvel de reelle som

Jeg foretager her en kort indføring af polynomier over såvel de reelle som Polynomier, rødder og division Sebastian Ørsted 20. november 2016 Jeg foretager her en kort indføring af polynomier over såvel de reelle som de komplekse tal, hvor fokus er på at opbygge værktøjer til

Læs mere

Kursusgang 3 Matrixalgebra Repetition

Kursusgang 3 Matrixalgebra Repetition Kursusgang 3 Repetition - froberg@mathaaudk http://peoplemathaaudk/ froberg/oecon3 Institut for Matematiske Fag Aalborg Universitet 12 september 2008 1/12 Lineære ligningssystemer Et lineært ligningssystem

Læs mere

Kvantitative metoder 2

Kvantitative metoder 2 Kvantitative metoder 2 Inferens i den lineære regressionsmodel 7. marts 2007 regressionsmodel 1 Opgave fra sidst (Gauss-Markov teoremet) Opgave: Vis at hvis M = I X X X X 1 ( ' ) ' er M idempoten dvs der

Læs mere

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05 Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

Module 9: Residualanalyse

Module 9: Residualanalyse Mathematical Statistics ST6: Linear Models Bent Jørgensen og Pia Larsen Module 9: Residualanalyse 9 Rå residualer 92 Standardiserede residualer 3 93 Ensidig variansanalyse 4 94 Studentiserede residualer

Læs mere

DesignMat Den komplekse eksponentialfunktion og polynomier

DesignMat Den komplekse eksponentialfunktion og polynomier DesignMat Den komplekse eksponentialfunktion og polynomier Preben Alsholm Uge 8 Forår 010 1 Den komplekse eksponentialfunktion 1.1 Definitionen Definitionen Den velkendte eksponentialfunktion x e x vil

Læs mere

Indblik i statistik - for samfundsvidenskab

Indblik i statistik - for samfundsvidenskab Indblik i statistik - for samfundsvidenskab Læs mere om nye titler fra Academica på www.academica.dk Nikolaj Malchow-Møller og Allan H. Würtz Indblik i statistik for samfundsvidenskab Academica Indblik

Læs mere