Optimering i Moderne Portefølje Teori

Aalborg universitet P3-3. semestersprojekt Optimering i Moderne Portefølje Teori 15. december 2011

AAUINSTITUT FOR MATEMATISKE FAG TITEL: Optimering - Lineær programmering - Moderne Portefølje Teori PROJEKT PERIODE: Fra 2. september 2011 til 16. december 2011 PROJEKTGRUPPE: Mie Vestergaard Andersen Marita Stavø Johansen Malene Møller Larsen Jacob Bitsch Nørgaard VEJLEDER: Horia Cornean OPLAGSTAL: 7 ANTAL SIDER: 64 c Gruppe G3-113 MAT-ØK

Synopsis Dette projekt beskæftiger sig med optimering og i denne forbindelse med matematisk programmering. Projektet er todelt, således den første del er matematisk orienteret, mens den anden del belyser matematisk programmering set fra en økonomisk synsvinkel. Den første del indeholder en introduktion til lineær programmering og her introduceres også to sætninger, som er centrale for lineær programmering. Disse vil senere blive bevist ved hjælp af forskellig teori, herunder for eksempel kontinuitet, differentiabilitet og åbne og lukkede mængder. Efterfølgende beskrives forskellige løsningsmetoder til at løse lineære programmeringsproblemer. Her introduceres blandt andet simplex metoden og den geometriske metode. Anden del af projektet beskæftiger sig med moderne portefølje teori, og hvordan denne teori kan sammenkobles med matematisk programmering. I denne forbindelse beskrives også Harry Markowitz Mean-variance model. Herefter er der en gennemgang af, hvordan man ud fra kursværdier kan finde de konstanter som Harry Markowitz model bygger på. Samtidig indgår der også en diskussion omkring denne model og hvilke problemer, som er forbundet med denne. Aalborg den 15. december 2011 Malene Møller Larsen Mie Vestergaard Andersen Marita Stavø Johansen Jacob Bitsch Nørgaard 1

Indhold Indhold 3 1 Indledning 5 1.1 Problemformulering......................... 6 I Lineær programmering 7 2 Introduktion til lineær programmering 8 2.1 Hovedsætningerne.......................... 12 3 Teori 15 3.1 Lineære funktioner.......................... 15 3.2 Funktioner af én variabel...................... 17 3.2.1 Åbne og lukkede intervaller................. 17 3.2.2 Grænser............................ 18 3.2.3 Kontinuitet.......................... 19 3.2.4 Differentiabilitet....................... 20 3.2.5 Ekstremum.......................... 21 3.3 Funktioner af flere variable..................... 21 3.3.1 Åbne og lukkede mængder.................. 21 3.3.2 Kontinuitet.......................... 22 3.3.3 Differentiabilitet....................... 23 3.3.4 Ekstremum.......................... 24 3.3.5 Gradient............................ 25 3.4 Kritiske punkter........................... 26 3

INDHOLD 4 Bevis for hovedsætningerne 27 5 Løsningsmetoder til lineære programmeringsproblemer 31 5.1 Den geometriske metode....................... 31 5.2 Den algebraiske metode....................... 33 5.3 Simplex metoden........................... 36 II Portefølje teori 41 6 Introduktion til moderne portefølje teori 42 6.1 Moderne portefølje teori....................... 42 7 Mean-variance modellen 47 7.1 Kritik af Mean-variance modellen.................. 48 8 Databehandling 51 8.1 Analyse af datapunkterne...................... 53 9 Omformulering af Mean-variance modellen 55 10 Konklusion 57 Litteratur 59 4

1 Indledning Når man i matematik snakker optimering, så er det studiet af problemer, hvor et givet problem skal formuleres matematisk og derefter løses ved at finde en optimal værdi. Denne værdi kan derefter fortolkes til at give den bedst mulige løsning til problemet. Det matematiske grundlag for optimering er det, at vi har mulighed for at differentiere og undersøge funktioner for at finde frem til, hvordan de opfører sig over intervaller og domæner. En måde at løse optimeringsproblemer på er ved hjælp af matematisk programmering. Matematisk programmering er en fællesbetegnelse for formuleringer af problemer, hvor en given objektfunktion af flere variable skal optimeres under hensyntagen til en eller flere bibetingelser. I dette projekt lægges der især vægt på lineær programmering. Vi har valgt at give projektet en økonomisk vinkel ved at føre matematisk programmering sammen med moderne portefølje teori. Dette er en teori om diversificering og trade-off mellem risiko og forventet udbytte. Denne model bygger på Mean-variance modellen, som er udviklet af Harry Markowitz. Hvis man skulle lave den perfekte investering ville man søge en model, der giver et højt afkast kombineret med en lav risiko. I virkeligheden er det næsten umuligt at finde sådan en investering. Derfor er det ikke overraskende, at der er mange, som bruger tid på at udvikle metoder og strategier for at komme tættere på denne perfekte investering. Men ingen model er så populær, eller så overbevisende som moderne portefølje teori. Selvom modellen har mødt en del kritik, er den stadig populær, om dog i en forenklet udgave. Den ligger også til grund for mange centrale teorier i finansiel økonomi. I et forsøg på at finde den optimale sammensætning af aktiver, bruger modellen netop matematisk programmering. 5

KAPITEL 1. INDLEDNING 1.1 Problemformulering I forhold til matematisk programmering og moderne portefølje teori, ønsker vi at undersøge, om det er muligt at finde en metode, hvorpå Mean-variance modellens konstanter kan bestemmes. Dette leder os frem til følgende problemformulering og problemstillinger. Er det muligt at bestemme Mean-variance modellens konstanter ved hjælp af behandling af statistisk data? Problemstillinger: Hvad er lineær programmering, og hvilke løsningsmetoder kan anvendes til at løse et lineært programmeringsproblem? Hvor findes løsningen til et lineært programmeringsproblem geometrisk set? Hvad er moderne portefølje teori og Mean-variance modellen, og hvordan kan disse relateres til matematisk programmering? 6

Del I Lineær programmering 7

2 Introduktion til lineær programmering Dette kapitel er baseret på [Lay, 2005] og omhandler en introduktion til lineær programmering. Lineær programmering er en metode, som bruges til at finde den optimale løsning til en given problemstilling. Et eksempel på dette kunne fx være en virksomhed, som ønsker at optimere deres produktionsniveau således, at deres profit bliver maksimal. Virksomhedens arbejdskraft og materialer er imidlertid begrænset, hvilket medfører, at det optimale produktionsniveau skal findes under disse betingelser. Et andet eksempel kunne være et økonomisk problem, hvor man ønsker at maksimere sit afkast i forhold til at investere i aktier - se eksempel 2. Lineær programmering kan mere formelt, defineres som følgende. Et lineært programmeringsproblem består af et antal lineære uligheder 1 med variablene x 1,..., x n og en lineær funktion f(x). f : R n R. Som det tidligere er antydet, består problemet nu i at finde en løsning x, som enten maksimerer eller minimerer f(x). Funktionen f(x) kaldes også for objektfunktionen, og de lineære uligheder betegnes som bibetingelser. Generelt kan det lineære programmeringsproblem opstilles som følgende. Givet c R n, b R m og A R m n. Find x R n så følgende løses Maksimér (Max) under bibetingelserne (u.b.b.) f(x) = c x Ax b x 0. 1 Kan også bestå af ligheder, men disse kan omskrives til uligheder.

Her er c, b og x vektorer, hvilket vil sige, at det lineære programmeringsproblem også kan opstilles som følgende. Givet b = b 1., c = c 1. og en matrix A = [ a ij ], b m c n hvor b R m og c R n. Find x = x 1. x n R så følgende løses Max u.b.b. og f(x 1,..., x n ) = c 1 x 1 + c 2 x 2 +... + c n x n a 11 x 1 + a 12 x 2 +... + a 1n x n b 1 a 21 x 1 + a 22 x 2 +... + a 2n x n b 2. a m1 x 1 + a m2 x 2 +... + a mn x n b m x j 0 for j = 1,..., n. Formelt set betegner man den del af R n, som opfylder bibetingelserne med D, altså D = {x R n Ax b}, A R m n, b R m og F beskriver værdimængden for objektfunktionen defineret over D, F = {e R f(d) = e}. Løsninger x som opfylder Ax b samt x 0 kaldes for brugbare løsninger, som ligger i den brugbare mængde, altså D. Hvis der findes en vektor m D, der opfylder f(m) = maxf(x), x D, så kaldes m for den optimale løsning. Vi gennemgår nu to eksempler på økonomiske problemer, der viser, hvordan det lineære programmeringsproblem kan opstilles. Disse tager udgangspunkt i investeringsproblemer. 9

KAPITEL 2. INTRODUKTION TIL LINEÆR PROGRAMMERING Eksempel 1 En investor planlægger at investere 12.000 kr. i hhv. investeringspuljer, indskudsbeviser og en højrente konto (1). Pga. risikoen der er forbundet med investeringspuljer, vil hun ikke investere mere i dem end summen af indskudsbeviser og højrente kontoen sammenlagt (2). Samtidig skal det, hun investerer i højrentekontoen være mindst halvdelen af beløbet for indskudsbeviser (3). Det forventede afkast af investeringspuljer er 11 procent, indskudsbeviser er 8 procent og højrentekontoen er 6 procent (4). Spørgsmålet er så, hvor meget hun skal investere i de mulige investeringsposter for at få det maksimale udbytte, når man tager hendes kriterier med i beslutningsprocessen. Vi vil dog ikke løse problemet, men kun vise hvordan problemet opstilles. Dette spørgsmål kan matematisk formuleres vha. lineær programmering. Vi starter med at tildele de forskellige investeringsposter variable: Investeringspuljer:= x 1 Indskudsbeviser:= x 2 Højrentekontoen:= x 3 Fra punkt (1) får vi betingelsen, at summen af de tre poster ikke må overstige 12.000 kr. Dette kan formuleres som ligningen x 1 + x 2 + x 3 12.000. Kriteriet fra punkt (2) siger, at investeringspuljer ikke må overstige summen af de to andre poster, hvilket kan skrives som og dette kan formuleres som x 1 x 2 + x 3, x 1 x 2 x 3 0. Det tredje kriterium som opstilles fra punkt (3), kræver at højrentekontoen skal udgøre minimum halvdelen af indskudsbeviser. Dette kriterium beskriver vi med ligningen x 2 2 x 3 som kan omformuleres til 1 2 x 2 x 3 0. Det fjerde og sidste punkt (4) giver objektfunktionen f(x) = 1, 11x 1 + 1, 08x 2 + 1, 06x 3. 10

Hvis vi kombinerer disse fire punkter til et lineært programmeringsproblem, hvor f(x) skal maksimeres under bibetingelserne (1), (2) og (3), så kommer det til at se således ud. Max f(x) = 1, 11x 1 + 1, 08x 2 + 1, 06x 3 u.b.b. x 1 x 2 x 3 0 1 2 x 2 x 3 0 x 1 + x 2 + x 3 12.000 og x 1, x 2, x 3 0. Eksempel 2 Det antages, at der er 10.000 kr til rådighed til at investere i aktierne A og B. Køber man aktie A så forventes det, at man får et afkast på 3,5 %. Køber man derimod aktie B så forventes det, at man får et afkast på 4,9 %. Aktie A koster 5 kr pr. stk., mens aktie B koster 20 kr pr. stk. Derudover gælder det, at man kun kan købe en B aktie, hvis man har to A aktier. Dette kan formuleres som et lineært programmeringsproblem. Aktie A betegnes som x 1 og aktie B betegnes som x 2. Max 1, 035x 1 + 1, 049x 2 u.b.b. 5x 1 + 20x 2 10000 2x 1 + x 2 0 x 1, x 2 0. Her er vektorerne c, b og x og matricen A givet ved c = [ 1, 035 1, 049 ] [ 10000, b = 0 ] [ x1, x = x 2 ] og A = [ 5 20 2 1 ]. Bibetingelsen 2x 1 + x 2 0 er omskrevet fra ligningen x 2 2x 1, som kommer fra begrænsningen af, at en B aktie kun kan købes, hvis man har to A aktier. Den anden bibetingelse kommer fra, at A aktier koster 5 kr pr. stk., mens B aktier koster 20 kr pr. stk, og at der kan investeres for 10.000 kr i alt. Objektfunktionen 1, 035x 1 + 1, 049x 2 kommer fra det forventede afkast af aktie A og aktie B. 11

KAPITEL 2. INTRODUKTION TIL LINEÆR PROGRAMMERING Hvis man i stedet ønsker at minimere objektfunktionen f(x), så kan det lineære programmeringsproblem omskrives således og bibetingelser som kan omskrives til Max f(x) a i1 x 1 +... + a in x n b i a i1 x 1... a in x n b i. Hvis bibetingelserne består af lineære ligninger, så kan disse omskrives til lineære uligheder således. a i1 x 1 +... + a in x n = b i kan omskrives til og a i1 x 1 +... + a in x n b i a i1 x 1... a in x n b i. 2.1 Hovedsætningerne I forbindelse med det lineære programmeringsproblem kan der opstå to situationer, hvorved det ikke kan lade sig gøre at finde en optimal løsning. Hvis bibetingelserne er uløselige, er D den tomme mængde, hvilket vil sige at problemet ikke kan løses. Hvis objektfunktionen ikke er begrænset opadtil, så har problemet ikke en løsning. Dette leder os frem til hovedsætning 1. Hovedsætning 1 (Eksistens af ekstremum) Hvis den brugbare mængde D, er den ikke-tomme mængde, og hvis objektfunktionen er begrænset på D, så har objektfunktionen mindst én optimal værdi. Denne sætning giver altså retningslinjer for, hvornår objektfunktionen har én optimal værdi og derved om den kan optimeres givet en brugbar mængde, D. Sætningen fortæller dog ikke noget om, hvor den optimale værdi findes. Dette belyses yderligere i hovedsætning 2. Hovedsætning 2 (Placering af ekstremum) Givet D R n, K = {1,..., k} og en funktion f : D R. Hvis der x j D, j K eller så er x M, x m et hjørnepunkt af D. M K således at f(x M ) = max f(x) m K således at f(x m ) = min f(x), 12

2.1. HOVEDSÆTNINGERNE Det skal bemærkes at f(x M ), f(x m ) fra hovedsætning 2 ikke nødvendigvis er entydigt bestemt. Der kan altså være flere x j D, der giver den samme funktionsværdi. Hovedsætning 2 siger altså kun, at mindst én af disse værdier tages i et hjørne af D. For at bevise de to foregående hovedsætninger, vil vi nu introducere noget grundlæggende teori og definere nogle centrale begreber. 13

3Teori For matematisk at kunne formulere hvad det vil sige, at maksimum og/eller minimum af en funktion defineret over et domæne tages i et hjørne af domænet, bruger vi nogle definitioner fra matematisk analyse. Dette kapitel er baseret på [of Maryland, 2011], [Wade, 2010], [Adams, 2010] og [Schilling, 2007]. Vi vil starte med at formulere, hvad der menes med lineære funktioner. 3.1 Lineære funktioner I forbindelse med lineær programmering beskæftiger vi os udelukkende med lineære funktioner. Dvs. funktioner, der opfylder definition 3.1. 3.1 Definition Funktionen f : R n R er lineær hvis og kun hvis, den opfylder følgende 1. f(x + y) = f(x) + f(y) x, y R n. 2. f(ax) = af(x) a R, x R n. Det kan vises, at det indre produkt mellem to vektorer, c og x, er en lineær funktion, hvis elementerne i c er konstanter, og elementerne i x er uafhængige variable. Eksempel 3 Vis, at funktionen f, der er givet ved er lineær jf. definition 3.1. f(x) = c x c, x R n, 15

KAPITEL 3. TEORI Funktionen f kan skrives på formen f(x 1, x 2,..., x n ) = c 1 x 1 + c 2 x 2 + + c n x n x, c R n. Derved kan det vises, at f opfylder det første krav. f(x + y) = c (x + y) = c 1 (x 1 + y 1 ) + + c n (x n + y n ) = c 1 x 1 + c 1 y 1 + + c n x n + c n y n = c 1 x 1 + + c n x n + c 1 y 1 + + c n y n = c x + c y = f(x) + f(y). Og funktionen opfylder også det andet krav. f(ax) = c (xa) = c 1 (x 1 a) + + c n (x 1 a) = a(c 1 x 1 + + c n x n ) = a(c x) = af(x). Tilsvarende gælder det, at en sammensat funktion, der består af to lineære funktioner, også er lineær. Eksempel 4 Antag, at funktionerne f og g er lineære jf. definition 3.1, hvor f : R n R og g : R n R n. Vis, at er lineær. (f g)(x) = f(g(x)) f(g(x)) : R n R Funktionerne f og g er givet ved g(x) := Ax, A = [a jp ] R n n, x R n f(x) := c x x, c R n. Den sammensatte funktion ser dermed således ud n m (f g)(x) = c (Ax) = c j x p a jp. j=1 p=1 16

3.2. FUNKTIONER AF ÉN VARIABEL Man kan nu vise, at den sammensatte funktion opfylder det første krav. n m (f g)(x + y) = c j a jp (x p + y p ) = j=1 p=1 n m c j a jp x p + j=1 p=1 j=1 p=1 n m c j a jp y p = (f g)(x) + (f g)(y). Det andet krav er også opfyldt. n m k ((f g)(x)) = k c j a jp x p j=1 p=1 j=1 p=1 n m = c j a jp x p k = (f g)(kx). Dette resultat illustrerer at, hvis en lineær funktion er sammensat med en anden lineær funktion, så er resultatet også en lineær funktion. 3.2 Funktioner af én variabel De funktioner, vi beskæftiger os med i dette afsnit, er funktioner af én variabel. f : R R. Dette gør vi for at give et overblik over, hvad der menes med de forskellige begreber. 3.2.1 Åbne og lukkede intervaller 3.2 Definition (Åbne og lukkede intervaller) Lad a og b være reelle tal. Et lukket interval er en mængde på formen [a, b] := {x R a x b}. Et åbent interval er en mængde på formen (a, b) := {x R a < x < b}. 17

KAPITEL 3. TEORI Et interval kan enten være åbent, lukket eller begge dele. I det sidste tilfælde vil det være en mængde på formen [a, b) := {x R a x < b} eller (a, b] := {x R a < x b}. Et åbent interval er altså et lukket interval i R, hvor endepunkterne ikke hører med til mængden. 3.3 Definition (Begrænset interval) Lad E R og a E. Et interval E er begrænset hvis og kun hvis, M R således, at a M a E. 3.2.2 Grænser 3.4 Definition (Grænser) For f : R R siges det, at f(x) går mod L, når x går mod a, hvilket skrives som lim f(x) = L, x a hvis der gælder følgende. For ethvert ε > 0 eksisterer der et δ > 0, som afhænger af ε, f og a, sådan at hvis x a < δ medfører at f(x) L < ε. I definition 3.4 siger vi, at f(x) har grænsen L, når x går mod a. Dette betyder egentligt, at vi kan sikre, at fejlen f(x) L er mindre end enhver tilladt tolerance, ligegyldig hvor lille, ved at tage x tæt nok på a, men ikke lig med a. ε repræsenterer altså størrelsen af den tilladte fejl. δ i definition 3.4 repræsenterer differensen x a, som bestemmer, hvor tæt x skal være på a for at sikre, at fejlen er inden for den tilladte tolerance. Hvis ε er et hvilket som helst positivt tal, så skal vi kunne sikre at f(x) L < ε ved at begrænse x således, at x er tæt på, men ikke lig med a. Afstanden x a < δ er altså den afstand, som repræsenterer tæt nok på, men ikke lig med a. Her afhænger δ af ε. Hvis det kan lade sig gøre, at finde sådan et δ for ethvert positivt tal ε, så kan det altså konkluderes, at lim f(x) eksistere og er x a lig med L. I henhold til grænser bør det også nævnes, at eksistensen af en grænse kun afhænger af værdierne af f(x) for x tæt på, men ikke lig med a. Det vil altså sige, at selvom f(x) er defineret i x = a, så eksisterer grænsen for f(x) når x går mod a ikke nødvendigvis og er heller ikke nødvendigvis lig med f(a). For 18

3.2. FUNKTIONER AF ÉN VARIABEL at grænsen er lig med f(a), så skal f(x) være defineret på et åbent interval indeholdende x = a, og grafen for f skal gå ubrudt gennem punktet (a, f(a)). 3.5 Definition (Højre grænse) For f : R R siges det, at f(x) har højre grænse L i punktet a, hvilket skrives som lim f(x) = L, x a+ hvis følgende er opfyldt. x tilhører domænet af f og for ethvert ε > 0 eksisterer der et δ > 0, hvor δ afhænger af ε, sådan at hvis x a < δ medfører at f(x) L < ε. Venstre grænse er analog med højre grænse fra definition 3.5. Det vil altså sige, at selvom en grænse ikke kan eksistere i et endepunkt af intervallet, så kan den stadig have en højre eller venstre grænse i punktet. Derudover gælder det, at grænsen af f(x) (når x går mod a) eksisterer, når den højre og venstre grænse af f(x) (når x går mod a) eksisterer og er lig med hinanden. Det vil altså sige, at grænsen i definition 3.4 eksisterer, når den højre og venstre grænse eksisterer og er lig med hinanden. 3.2.3 Kontinuitet 3.6 Definition (Kontinuitet i et punkt) En funktion f defineret på et åbent interval indeholdende punktet a, siges at være kontinuert i punktet a, hvis lim f(x) = f(a), x a hvilket betyder, hvis der for ethvert ε > 0 eksisterer et δ > 0 sådan, at x a < δ så medfører det, at f(x) f(a) < ε. Det vil altså sige, hvis lim x a f(x) ikke eksisterer eller eksisterer, men ikke er lig med f(a), så er f diskontinuert i punktet a. 3.7 Definition (Kontinuitet på et interval) En funktion f er kontinuert på et interval hvis og kun hvis, f er kontinuert i ethvert punkt på intervallet. Hvis det er tilfældet med et endepunkt i et lukket interval, så behøver f kun at være kontinuert på den ene side. Det vil altså sige, at f er kontinuert på intervallet [a, b], hvis lim f(t) = f(x) t x for alle x som opfylder a < x < b, og hvor lim f(t) = f(a) og lim f(t) = f(b). t a+ t b 19

KAPITEL 3. TEORI Her kaldes lim f(t) = f(a) og lim f(t) = f(b) for hhv. højre og venstre t a+ t b kontinuitet. Hvis et punkt a ligger i et åbent interval, som er indeholdt i domænet for funktionen, så kaldes punktet a for et indre punkt af domænet. Hvis dette ikke er tilfældet, så kaldes punktet a for et endepunkt af domænet. 3.2.4 Differentiabilitet 3.8 Definition (Differentiabilitet i et punkt) Et interval, I R, en funktion f : I R siges at være differentiabel i et punkt a I hvis og kun hvis, f er defineret på et åbent interval I indeholdende a, og hvor f f(a + h) f(a) (a) := lim h 0 h eksisterer. I dette tilfælde kaldes f (a) for den afledte af f i punktet a. En funktion f er ikke differentiabel i et punkt a, hvis grafen for funktionen af f i punktet (a, f(a)) enten har en lodret tangentlinje eller ikke har en entydig tangentlinje. En funktion f er differentiabel på et interval, hvis f er differentiabel i alle punkter på intervallet. Dette er beskrevet i følgende definition. 3.9 Definition (Differentiabilitet på et interval) Lad I R være et ikke-degenereret interval 1. 1. En funktion f : I R er differentiabel på I hvis og kun hvis, f f(a + h) f(a) (a) := x a lim h x I eksisterer og er endelig for alle a I. 2. En funktion f er kontinuert differentiabel på I hvis og kun hvis, f eksisterer og er kontinuert på I. Definition 3.8 medfører, at f kun er differentiabel på et interval I := [a, b], hvis følgende gælder f +(a) = lim h 0+ f(a + h) f(a), f h (b) = lim h 0 f(b + h) f(b), h idet f ikke er differentiabel i endepunkter, da grænsen fra den ene side ikke eksisterer. f er altså kun differentiabel på et interval [a, b], hvis f er differentiabel i alle punkter på det åbne interval og når f +(a) og f (b) begge eksisterer. Det gælder om en funktion, der er differentiabel i et punkt, at den altid er kontinuert i punktet. Det omvendte gælder dog ikke. En funktion kan godt være kontinuert i et punkt, men ikke differentiabel. 1 Jf. s. 13 i [Wade, 2010] 20

3.3. FUNKTIONER AF FLERE VARIABLE 3.2.5 Ekstremum 3.10 Definition (Ekstremum på R) Lad a R, E R og f : R R. f(a) siges at være et ekstremum for f hvis og kun hvis, et af følgende kriterier er opfyldt. f(a) f(x), x R. f(a) f(x), x R. Hvis det opfylder det første kriterium, siges f(a) at være et maksimum for f. Hvis det opfylder det andet kriterium, siges f(a) at være et minimum for f. 3.11 Definition (Ekstrumumspunkter) Hvis I er lukket og begrænset og f : I R er kontinueret på I og M = sup f(x) og m = inf f(x), x I x I så eksisterer der punkter x M, x m I, hvorom det gælder, at f(x M ) = M og f(x m ) = m. Endvidere kalder vi M og m for hhv. maksimum og minimum for funktionen f. 3.3 Funktioner af flere variable De funktioner vi beskæftiger os med i dette afsnit, er funktioner af flere variable. f : R n R. Dette gør vi, fordi disse er centrale for lineære programmeringsproblemer. 3.3.1 Åbne og lukkede mængder I dette afsnit defineres åbne og lukkede mængder i R n vha. bolde. En åben og en lukket bold i R n defineres på følgende måde. 3.12 Definition (Bold) Lad a R n. 1. For ethvert r > 0 er den åbne bold, med centrum i a og radius r, punktmængden: B r (a) := {x R n x a < r }. 21

KAPITEL 3. TEORI 2. For ethvert r 0 er den lukkede bold med centrum i a og radius r, punktmængden: B r (a) := {x R n x a r }. En åben bold i R, med centrum i a og radius r, er intervallet (a r, a + r), og den tilsvarende lukkede bold er intervallet [a r, a + r]. Den åbne bold med centrum i a og radius r indeholder ingen punkter på randen; {x R n x a = r }. Derimod gælder det, at den lukkede bold med centrum i a og radius r indeholder alle randpunkterne. For at generalisere begreberne åbne og lukkede mængder endnu mere, siger man, at hvert element af en åben mængde, E R n ligger inden i E. Det vil sige, elementet er omgivet af andre elementer i E. Lukkede mængder opfylder ikke dette, men det gør deres komplementær-mængde. Dette fører os videre til følgende definition. 3.13 Definition (Åbne og lukkede mængder) Lad n N og V, E R n. 1. V siges at være åbent (i R n ) hvis og kun hvis, der for alle a V er et ε > 0 sådan at B ε (a) V. 2. E siges at være lukket (i R n ) hvis og kun hvis, E c er åbent. 3.14 Definition (Begrænset mængde) Lad E R n og a E. En mængde E er begrænset hvis og kun hvis, M R så a < M a E. 3.3.2 Kontinuitet 3.15 Definition (Kontinuitet på en mængde) Lad E, E R n og f : E R. f er kontinuert i a E hvis og kun hvis, der for ethvert ε > 0 findes et δ > 0 således, at x a < δ og x E medfører, at f(a) f(x) < ε. f siges at være kontinuert på E hvis og kun hvis, f er kontinuert i alle x E. 22

3.3. FUNKTIONER AF FLERE VARIABLE Vi viser nu, hvordan det kan bestemmes om en funktion f, er kontinuert på en mængde. Dette ses i det følgende eksempel. Eksempel 5 Vis, at den lineære funktion f : R n R, er kontinuert på hele R n. f(x) = c x Givet en funktion f : R n R, f(a) = c x. For et a R n vis, at x a < δ medfører, at f(x) f(a) < ε. Bevis Antag, at c 0, c = den Euklidiske afstand 2. For et givet ε > 0, eksisterer der et δ afhængig af ε således, at f(x) f(a) < ε, når x a < δ. Vha. Cauchy-Schwarz 3 uligheden ved vi, at Tag δ ε := ε 1+ c. Det gælder, at ε, når f(x) f(a) = c (x a) c x a. x a < δ ε f(x) f(a) c δ ε = c 1 + c ε < ε. Dette resultat gælder a R n. Derved kan vi konkludere, at funktionen f(x) = c x, er kontinuert på hele R n. 3.3.3 Differentiabilitet 3.16 Definition (Differentiabilitet på en mængde) En funktion f : R n R siges at være differentiabel i et punkt a R n, hvis den opfylder følgende. L a (R n, R m ) 23

KAPITEL 3. TEORI således, at f(x) f(a) L a (x a) lim = 0. x a x a Vi vil nu vise, at en lineær funktion fra R n til R er differentiabel. Eksempel 6 Vis, at funktionen f(x) = c x er differentiabel i et punkt a R n. Matricen, der er tilknyttet den lineære transformation, som er f, er givet ved L a (x) = c x, som er lig med funktionen selv. Dette medfører således, at som bliver til f(x) f(a) L a (x a) lim = 0, x a x a c x c a c (x a) lim = 0. x a x a Grænsen er altså klart lig med 0. Funktionen f, er derfor differentiabel jf. definition 3.16. 3.3.4 Ekstremum Vi vil her bruge bolde til at definere maksimum af en funktion i et domæne. Det gøres på følgende måde. 3.17 Definition (Maksimum/Minimum) Lad V være åben i R n, a V og antag, at f : V R. 1. f(a) er lokalt minimum for f hvis og kun hvis, der eksisterer et r > 0 sådan at f(a) f(x) for alle x B r (a). 2. f(a) er lokalt maksimum for f hvis og kun hvis, der eksisterer et r > 0 sådan at f(a) f(x) for alle x B r (a). 3. f(a) er et lokalt ekstremum for f hvis og kun hvis, f(a) er lokalt maksimum eller lokalt minimum for f. 24

3.3. FUNKTIONER AF FLERE VARIABLE Givet en funktion f : R n R og en bold B r (a) med centrum a og radius r og hvor B r (a) R n. Det lokale maksimum findes i intervallet ( r, r), altså maxf(b r (a)) = a. For at finde det absolutte maksimum udvides bolden og derved øges r, så intervallet ( r, r) dækker hele R n. Derved kan det absolutte maksimum findes. 3.3.5 Gradient Begrebet gradient beskrives, da dette skal bruges til at definere, hvor der er tale om kritiske punkter for en funktion. 3.18 Definition (Gradient) I ethvert punkt (x 1, x 2,..., x n ) hvor den første partielle afledte af en funktion f(x 1, x 2,..., x n ) eksisterer, kan gradient vektoren f(x 1, x 2,..., x n ) defineres som f(x 1, x 2,..., x n ) = f e 1 + f e 2 + + f e n, x 1 x 2 x n hvor e j er enhedsvektoren fra origo til enhedspunktet på den j te koordinatakse. Gradienten refererer til de partielle afledte af en funktion f af flere variable. Her er e 1 enhedsvektoren i første-koordinatens retning, e 2 er enhedsvektoren i anden-koordinatens retning osv. Gradienten af en funktion peger i den retning, hvor funktionen øges mest, mens længden af gradienten angiver, hvor kraftigt funktionen ændrer sig i gradientens retning. Det vil altså sige, at gradienten af en funktion er 0, når vi, uanset hvilken vej vi bevæger os, ikke kan øge funktionsværdien yderligere. Derudover gælder det, at gradienten står vinkelret på niveaufladerne for funktionen 4. Gradienten har altså en geometrisk betydning i forhold til at optimere funktioner af flere variabler på en begrænset mængde. Vi viser nu, hvordan gradienten til en funktion f kan bestemmes, hvilket ses i det følgende eksempel. Eksempel 7 Find gradienten til funktionen f, givet ved f(x) = c x, c, x R n, f(x) R. 4 [Adams, 2010] s. 715 25

KAPITEL 3. TEORI Af definition 3.18 ses det, at f(x) = f x 1. f x n = c, x R. Bemærk: f(x) 0, x R n så længe c 0. 3.4 Kritiske punkter Maksimum og minimum for en funktion er de værdier, vi søger, når vi prøver at hhv. maksimere eller minimere en funktion. Hvordan disse er defineret, vil vi nu komme nærmere ind på. Når man prøver at finde sådanne værdier, vil det være hjælpsomt at kunne opstille en liste med kandidater til et sådan punkt (lokalt maksimum eller minimum). 3.19 Definition (Kritiske punkter) Givet D R n. Kandidater til kritiske punkter for en funktion, f : D R, skal opfylde en af disse tre betingelser. 1. f(x) = 0 2. f(x) eksisterer ikke (Singulært punkt 5 ). 3. Punktet tilhører randen af D. Mht. ekstremum og lineære funktioner er det værd at bemærke, at for lineære funktioner er et lokalt ekstremum også et globalt ekstremum. Dette skyldes, at lineære funktioner ikke har fortegnsskift over et domæne. selv. 5 Et singulært punkt er et punkt på grafen for f, hvor grafen knækker eller skærer sig 26

4 Bevis for hovedsætningerne Vi vil i dette afsnit introducere et par hjælpesætninger samt noget teori og bevise hhv. hovedsætning 1 og hovedsætning 2. D R n, hvor D er lukket og begrænset er, jf. Heine-Borel sætningen fra [Wade, 2010] ækvivalent med, at D er følgekompakt (i R n ). At D er følgekompakt vil sige, at {x n } n 1 D, {x nk } k 1 således at x nk k x n D. Bevis (for Hovedsætning 1) Antag, at sup f(x) = S, S R. x D Dette medfører, at hvis S := S 1 n, 4.1 Lemma n > 0 så er S ikke længere sup x D f(x). {x n } n 1 D således, at f(x n ) n S. Vi definerer, y n := f(x n ). Når S 1 n < S kan S ikke længere være en øvre grænse, da S var den mindste øvre grænse. Der må derfor findes en værdi, som er større. Denne kan skrives på formen f(x n ). Dette medfører, at S 1 n < f(x n) S. Da D er følgekompakt, så x nk k x D. Ud fra at f er kontinuert, ved vi, at y n have samme grænse. Dvs., at f(x ) = S. k f(x ). {y nk } og {y n } skal Hvis x M := x, så vil x M være et maksimum for f. Vi har derved bevist, at f : D R har et maksimum, hvis D er lukket og begrænset. 27

KAPITEL 4. BEVIS FOR HOVEDSÆTNINGERNE Det ovenstående bevis er ikke et konstruktivt bevis, hvilket vil sige, at vi altså ikke viser, hvorledes man kan finde et maksimum. Beviset er et eksistens bevis, der viser at under givne omstændigheder, så eksisterer der et maksimum. Hvor dette findes, vil vi beskæftige os med i det næste bevis. Beviset for minimum er analogt, og vi konkluderer derfor, at hovedsætning 1 er gyldig. 4.1 Definition (Indre domæne) En funktion, f : D R, hvor D := {x R n Ax b}. Vi noterer det indre domæne af D med o D, hvor Ax < b betyder, at o D := {x R n Ax < b}, a 1 x < b i,..., a m x < b m. Det kan bevises, at o D er en åben mængde, hvilket kan gøres vha. bolde. Vi vil dog udelade dette bevis fra vores projekt. 4.2 Lemma Antag, at funktionen f fra definition 4.1 er lineær. Så gælder det, at max f(x) max f(x). x D o x D Bevis (for lemma 4.2) Antag, at max f(x) > max f(x). x D o x D Det betyder, at x M således, at f(x M ) = 0. Men ifølge eksempel 7 er f(x) = c, x D. Dette er i strid med antagelsen, hvilket beviser lemma 4.2. Nu har vi introduceret den teori, der ligger til grund for det følgende bevis, og vi vil sammenfatte dette. Bevis (for hovedsætning 2) Givet et lineært programmeringsproblem: Max f(x) = c x u.b.b. Ax b A R m n, b R m, x, c R n, 1 n < m, hvor f er kontinuert (jf. definition 3.7) og differentiabel (jf. definition 3.16). Den brugbare mængde er defineret som punkter, der opfylder D := {x R n Ax b}. 28

Det indre domæne af den brugbare mængde er som beskrevet i definition 4.1. Lad også den brugbare mængde være begrænset, da vi således er garanteret, at der eksisterer en optimal værdi for f. Kandidater til en optimal værdi er ekstrema, der opfylder definition 3.19. Vi vil derfor undersøge den brugbare mængde for punkter, der opfylder disse betingelser. o Vha. af lemma 4.2 kan vi udelukke punkter der ligger i D, da værdier der ligger på randen vil have den samme eller højere værdi. Vi tjekker derfor randen af domænet, givet ved D n 1 = n {x R n a i x = b i, Ax b} i=1 og det indre domæne af dette er givet ved D n 1 = n {x R n a i x = b i, Ax < b}. i=1 Da vi ved, at en lineær funktion, sammensat med en lineær funktion, er lineær fra eksempel 4, kan vi nu anvende lemma 4.2 på disse to mængder. Derved kommer vi frem til, at vi ikke kan finde et ekstremum i det indre domæne. Vi beskæftiger os derefter med randen af D n 1. Disse trin kan gentages, indtil vi har begrænset os til D 1 = n {x R n a i x b i, Ax = b}, i=1 som er linjer i det n-dimensionelle rum. Det indre domæne af dette vil være åbne intervaller og endepunkterne vil være hjørnepunkter af D. Når vi benytter lemma 4.2 kan vi udelukke de åbne intervaller og vi har derved bevist, at kandidater til en optimal værdi skal findes i et hjørne af den brugbare mængde. Beviset for hovedsætning 2 kan også bruges til at illustrere, hvordan man finder en løsning for et lineært programmeringsproblem. Nemlig ved at undersøge alle hjørnepunkterne af den brugbare mængde og så vælge den hvortil den højeste funktionsværdi er tilknyttet i forhold til objektfunktionen. Hvis vi kigger på eksempel 1, så kan denne løses vha. metoden fra bevis 4.3 på følgende måde. List alle hjørnepunkterne i den brugbare mængde. Tabel 4.1 viser hjørnepunkterne af den brugbare mængde. Vi kan se, at punktet med funktionsværdien lig 13100 er den højeste værdi. Det er et større arbejde at finde alle hjørnepunkter for et problem og evaluere objektfunktionens værdi i alle disse punkter. Derfor vil vi i det næste kapitel beskæftige os med nogle bedre løsningsmetoder, som alle bygger på beviset for hovedsætning 2. 29

KAPITEL 4. BEVIS FOR HOVEDSÆTNINGERNE Punkt Værdi af objektfunktion (6000, 0, 6000) 13020 (0, 0, 0) 0 (0, 8000, 4000) 12880 (0, 0, 12000) 12720 (6000, 4000, 2000) 13100 Tabel 4.1: Hjørnepunkter af D for eksempel 1. 30

5 Løsningsmetoder til lineære programmeringsproblemer Dette kapitel er baseret på kapitel 9 i [Lay, 2005], [Proffesor G. Srinivasan, 2008] og [Proffesor G. Srinivasan, 2010]. Her beskrives, hvordan det lineære programmeringsproblem kan løses. Vi introducerer først den geometriske løsning, hvorefter den algebraiske løsning beskrives. Derudover forklares sammenhængen mellem disse to løsninger. Til sidst introduceres den løsningsmetode, som kaldes for simplex. I dette kapitel kigger vi på et maksimeringsproblem i forhold til vores lineære programmeringsproblem. 5.1 Den geometriske metode Den geometriske metode går kort sagt ud på, at man tegner bibetingelserne for sit lineære programmeringsproblem ind i et koordinatsystem, hvilket ses i figur 5.1. De blå linjer på grafen repræsenterer bibetingelserne, og den sorte linje repræsenterer objektfunktionen. De røde linjer repræsenterer niveaulinjer, som er parallelle med objektfunktionen. Det blå område på grafen betegnes som den brugbare mængde (D), og ethvert punkt i dette område opfylder alle bibetingelserne. Området, som ikke inkluderer randen, kaldes for det indre domæne. Hvis man vælger et tilfældig punkt i det indre domæne, vil det altid være muligt at finde punkter som er bedre end det valgte punkt, hvilket vil sige at objektfunktionen antager højere værdier. Det vil altså sige, at man enten kan bevæge sig til venstre, højre, opad eller nedad. Hvis objektfunktionens koefficienter er negative, vil man opnå bedre værdier for objektfunktionen ved at bevæge sig til venstre eller nedad. Er koefficienterne derimod positive, vil man opnå bedre værdier for objektfunktionen ved at bevæge sig til højre eller opad. Dette svarer altså til, man bevæger sig i gradientens retning, jf. defintion 3.18. Når man bevæger sig i gradientens retning vil man på et tidspunkt nå til randen. Dette er vist i figur 5.2. Her er den sorte linje objektfunktion, og de sorte pile repræsenterer gradienten, mens den røde stiplede linje er en niveaulinje. 31

KAPITEL 5. LØSNINGSMETODER TIL LINEÆRE PROGRAMMERINGSPROBLEMER Gradienten står vinkelret på niveaulinjerne. For at finde den optimale løsning til det lineære programmeringsproblem, starter man i et tilfældigt punkt, her (0, 0). Derefter bevæger man sig i gradientens retning, indtil man når randen. Herefter bevæger man sig langs niveaulinjen (her til højre), før man igen bevæger sig opad i gradientens retning. Dette princip gentages, indtil man står i et punkt, hvor man ikke kan bevæge sig længere i gradientens retning, og her er så maksimum. Punkter på randen vil altid dominere punkter, som ligger i det indre domæne, hvilket vil sige, at punkter på randen altid vil antage højere værdier med hensyn til objektfunktionen, i forhold til punkter i det indre domæne. Det vil altså sige, at vi kun er interesseret i punkter som ligger på randen, da objektfunktionen er lineær. Vælger man et punkt på randen, vil der altid være et punkt som dominerer i forhold til det valgte punkt, hvis man bevæger sig langs randen - enten opad eller nedad. Det vil altså sige, vi kun kigger på hjørnepunkterne, når vi skal finde en løsning til vores problem, idet det er her objektfunktionen antager de højeste værdier. Vi vælger altså det hjørnepunkt med højest værdi, idet vi derved opnår den optimale løsning til problemet. Dette kan også ses, hvis objektfunktionen maksimeres, således at niveaulinjerne bevæger sig i den retning hvor objektfunktionen øges. Det sidste punkt som niveaulinjerne rammer, inden de forlader den brugbare mængde er altså det hjørnepunkt, hvor den optimale løsning opnås. Figur 5.1: Geometrisk metode (niveau linjer) Det skal dog nævnes, at den geometriske løsningsmetode ikke kan anvendes på lineære programmeringsproblemer af flere dimensioner. Grunden til dette er beskrevet i det følgende. 5.1 Definition (Dimension af et lineært problem) Objektfunktionen definerer dimensionen af det lineære programmeringsproblem, idet den specificerer, hvor mange uafhængige variable, der indgår i problemet. 32

5.2. DEN ALGEBRAISKE METODE Figur 5.2: Geometrisk metode (gradient) Den generelle lineære objektfunktion har n uafhængige variable, f(x 1, x 2,, x n ) = c 1 x 1 + c 2 x 2 + + c n x n. Et sådanne problem har så dimensionen n, da denne funktion er en lineær afbildning fra R n til R. Intuitivt gælder det, når dim(d) 3 kan en grafisk løsningsmetode benyttes. Dette skyldes ganske enkelt, at man ikke vil være i stand til, grafisk at illustrere den brugbare mængde i rum med dimension større end 3. 5.2 Den algebraiske metode Den algebraiske metode kan, i modsætning til den geometriske metode, anvendes på lineære programmeringsproblemer af flere dimensioner, jf. definition 5.1. Denne metode går ud på at lave bibetingelserne (som er uligheder) om til lineære ligninger. Dette gøres ved at tilføje slackvariable til bibetingelserne som således bliver omdannet til ligninger i stedet for uligheder. Disse slackvariable bidrager dog ikke til objektfunktionen, hvilket vil sige, de ingen indflydelse har på den optimale værdi af objektfunktionen. Vi har n variable og m ligninger. Vores objektfunktion er givet ved f(x) = c x, hvor x D. Antallet af variable i objektfunktionen er så givet ved { x j x x j 0, j = 1,..., n} = n, 33

KAPITEL 5. LØSNINGSMETODER TIL LINEÆRE PROGRAMMERINGSPROBLEMER svarende til antallet af variable i bibetingelserne. Ved at tilføje slackvariable får vi følgende system af ligninger a 1 x b 1 a 1 x + y 1 = b 1 a 2 x b 2 a 2 x + y 2 = b 2. a m x b m. a m x + y m = b m, hvor y 1, y 2,..., y m 0 repræsenterer slackvariable, vektorerne a 1, a 2,..., a m er søjlevektorer i matricen A. Ved indførelse af slackvariablene får vi altså nu n+m variable. For at løse ligningerne er vi nødt til at holde nogen af variablene faste, fordi vi har flere variable end ligninger. Vi har m ligninger og n + m variable. Kombinationer for den algebraiske løsningsmetode noteres (n + m)c m. 5.2 Definition Lad (n + m)c m være antallet af kombinationer man kan vælge m ud af (n + m) elementer, så er (n + m)c m := (n + m)! n!m! ( ) n + m = m Det er altså antallet af kombinationer for, hvor mange forskellige måder man kan vælge m variable ud fra de (n + m), der er til rådighed efter, at slackvariablene er tilført. Det bliver med denne formel gjort uden gentagelser, altså det der hedder Counting Combinations 1. Der er altså ikke nogen kombinationer, der står anført i modsat rækkefølge (x 1 x 2 og x 2 x 1 ), da dette ville være det samme punkt i domænet. Vi vælger altid at sætte de faste variable til 0. Man kunne også at have valgt et arbitrært ikke-negativt tal (ikke-negativ, da x 0). Variable fastsat til 0 kaldes også for ikke-basis variable. Antallet af variable, som skal fastsættes, er så givet ved (n + m) m = n. Vi kigger nu på de tilbageværende m variable, som kaldes for basis variable. Vi vurderer objektfunktionen, hvis vi får en basis brugbar løsning, hvilket vil sige en løsning inden for den brugbare mængde, hvor de faste værdier er sat til 0. Ikke-basis løsninger er løsninger, hvor de faste værdier er sat til ikkenegative værdier. Vi er imidlertid ikke interesseret i disse løsninger, da disse løsninger svarer til punkter i det indre domæne. Som vi så fra den geometriske metode, så vil det altid være muligt at finde bedre punkter med hensyn til objektfunktionen i forhold til det valgte punkt. Sættes de faste værdier til 0, får vi netop de punkter, som svarer til hjørnepunkterne i den geometriske metode. Dette vil sige, vi her opnår de højeste værdier for vores objektfunktion. Antallet af løsninger til vores problem er så givet ved (n+m)c m, jf. definition 5.2. Vi vurderer objektfunktionen for alle disse løsninger, hvis det er brugbare 1 På side 171 i [Ullman, 1992] 34

5.2. DEN ALGEBRAISKE METODE løsninger og vælger så den løsning med højest værdi, hvilket svarer til vores optimale løsning til vores lineære programmeringsproblem. Vi vil nu gennemgå et eksempel på et lineært programmeringsproblem, som bliver løst vha. den algebraiske løsningsmetode. Eksempel 8 Løs eksempel 1 vha. den algebraiske løsningsmetode. Først konverterer vi ulighederne, fra bibetingelserne, til ligheder. Fra eksemplet ved vi, at bibetingelserne er givet ved Disse bliver så til x 1 x 2 x 3 0 1 2 x 2 x 3 0 x 1 + x 2 + x 3 12.000. x 1 x 2 x 3 + x 4 = 0 1 2 x 2 x 3 + x 5 = 0 x 1 + x 2 + x 3 + x 6 = 12.000. Der er nu tre variable, tre slackvariable og tre ligninger. Vi skal holde tre variable konstante (=0), og løse ligningerne for de resterende tre variable. Dette kan jf. definition 5.2 gøres på (3 + 3)C 3 := (3 + 3)! 3!3! ( ) 3 + 3 = = 20 3 forskellige måder. Dette er illustreret i tabel 5.1. Ud af de 20 løsninger er der kun 13, der opfylder ikke-negativitets-kravet. Ud af de 13 er der en løsning, der giver en højere funktionsværdi end de andre. Dette er den optimale løsning med x 1 = 6000, x 2 = 4000, x 3 = 2000 og en funktionsværdi på 13100. Dette er altså den optimale løsning til eksempel 1. Der er dog nogle problemer med den algebraiske metode. Et af disse problemer er at metoden også medtager ikke-brugbare løsninger. Problemet med dette er, at man bruger tid på at udregne løsninger som man alligevel ikke kan bruge. Derudover så medtager metoden alle brugbare løsninger, hvilket ikke er optimalt, da man egentlig kun ønsker at få bedre og bedre værdier i forhold til objektfunktionen. Det sidste problem er, at metoden ikke fortæller, hvilken 35

KAPITEL 5. LØSNINGSMETODER TIL LINEÆRE PROGRAMMERINGSPROBLEMER Variable Faste ( =0 ) Løsning Funktionsværdi Brugbare x 4, x 5, x 6 x 1, x 2, x 3 x 6 = 12000, x 4 = x 5 0 x 1, x 2, x 3 x 4, x 5, x 6 x 1 = 6000, x 2 = 4000, x 3 = 2000 13100 x 1, x 2, x 4 x 3, x 5, x 6 x 1 = 12000, x 2 = 0, x 4 = 12000 13320 x 1, x 2, x 5 x 3, x 4, x 6 x 1 = x 2 = 6000, x 5 = 3000 13140 x 1, x 2, x 6 x 3, x 4, x 5 x 1 = x 2 = 0, x 6 = 12000 0 x 1, x 3, x 4 x 2, x 5, x 6 x 1 = x 4 = 12000, x 3 = 0 13320 x 1, x 3, x 5 x 2, x 4, x 6 x 1 = x 3 = x 5 = 6000 13020 x 1, x 3, x 6 x 2, x 4, x 5 x 1 = x 3 = 0, x 6 = 12000 0 x 1, x 4, x 5 x 2, x 3, x 6 x 1 = x 4 = 12000, x 5 = 0 13320 x 1, x 4, x 6 x 2, x 3, x 5 x 1 = x 4 = 12000, x 6 = 0 13320 x 1, x 5, x 6 x 2, x 3, x 4 x 1 = x 5 = x 6 = 0 0 x 2, x 3, x 4 x 1, x 5, x 6 x 2 = 8000, x 3 = 4000, x 4 = 12000 12880 x 2, x 3, x 5 x 1, x 4, x 6 - x 2, x 3, x 6 x 1, x 4, x 5 x 2 = x 3 = 0, x 6 = 12000 0 x 2, x 4, x 5 x 1, x 3, x 6 x 2 = x 4 = 12000, x 5 = 6000 12960 x 2, x 4, x 6 x 1, x 3, x 5 x 2 = x 4 = 0, x 6 = 12000 0 x 2, x 5, x 6 x 1, x 3, x 4 x 2 = x 5 = 0, x 6 = 12000 0 x 3, x 4, x 5 x 1, x 2, x 6 x 4 = x 5 = 12000, x 3 = 12000 12720 x 3, x 4, x 6 x 1, x 2, x 5 x 3 = x 4 = 0, x 6 = 12000 0 x 3, x 5, x 6 x 1, x 2, x 4 x 3 = x 5 = 0, x 6 = 12000 0 Tabel 5.1: Den algebraiske løsningsmetode på eksempel 1. løsning der er den optimale. Man kan altså i princippet få den optimale løsning ved første udregning, men man kan ikke afgøre, om det er den optimale løsning, før man har udregnet alle løsningerne. En metode som ikke har disse ulemper, er altså en bedre metode. Simplex metoden, som er en videreudvikling af den algebraiske metode, har ikke disse ulemper. Vi gennemgår derfor simplex metoden i næste afsnit. 5.3 Simplex metoden Simplex metoden benytter en algoritme til at løse det lineære programmeringsproblem. Helt generelt går simplex metoden ud på følgende. 1. Vælg et ekstremumspunkt (et hjørnepunkt) x i den brugbare mængde. 2. Undersøg alle kanter af D, der mødes i x. Hvis ikke objektfunktionen f kan øges ved at bevæge sig langs en af disse kanter, så er x den optimale løsning. 3. Hvis f kan øges ved at bevæge sig langs en eller flere af disse kanter, så følges den kant, hvor f øges mest, og man flytter til ekstremumspunktet af D i den modsatte ende. 4. Gentag fra skridt 2. 36

5.3. SIMPLEX METODEN Da værdien af f altid øges, vil man aldrig komme igennem det samme ekstremumspunkt flere gange, og man vil altid ende med den optimale løsning (hvis der er en) inden for et endeligt antal skridt, da der er et endeligt antal ekstremumspunkter. Hvis problemet er ubegrænset, vil man før eller siden ende på den grænseløse kant i skridt 3, hvor f så vil øges uden grænse. Simplex algoritmen fungerer på følgende måde. Simplex algoritmen 1. Omskriv bibetingelserne fra uligheder til ligninger ved at tilføje slack variable. Lad M være en variabel svarende til objektfunktionen, og skriv følgende ligning under bibetingelserne. (Objektfunktion) M = 0 2. Opskriv simplex tabellen. Slack variablene (og M) danner første basis brugbare løsning. 3. Tjek den nederste række af tabellen. Hvis alle indgangene til venstre for den lodrette linje er ikke-negative, så er løsningen optimal. Hvis nogle er negative, så vælges den variabel x k, hvor indgangen i den nederste række er mest negativ. 4. Tilføj x k til løsningen. Dette gøres ved, at pivotere på den positive indgang a pk, som har det mindste forhold b i. Den nye basis brugbare løsning a ik inkluderer og indsnævrer værdien af M. 5. Gentag processen, startende med trin 3, indtil alle indgangene i den nederste række er ikke-negative. I denne algoritme er der to ting, der kan gå galt: I trin 4 kan der komme en negativ indgang i den nederste række i kolonne x k, men ingen positiv indgang a ik i søjlen over den. Hvis dette er tilfældet, vil det ikke være muligt at finde et pivot element, der kan bringe x k ind i løsningen. Dette svarer til tilfældet, hvor objektfunktionen er ubegrænset og ikke har en optimal løsning. Den anden ting, der kan gå galt opstår også i trin 4. Det mindste forhold b i a ik kan forekomme i mere end en række. Når det sker, vil den næste tabel have mindst en basis variabel der er lig med 0, og i de følgende tabeller vil værdien af M måske være konstant. Vi benytter simplex algoritmen på et eksempel. 37

KAPITEL 5. LØSNINGSMETODER TIL LINEÆRE PROGRAMMERINGSPROBLEMER Vi har følgende maksimeringsproblem Max 2x 1 + 3x 2 + 4x 3 u.b.b. 30x 1 + 20x 2 + 10x 3 200 5x 2 + 10x 3 100 4x 1 + 2x 3 50 x 1, x 2, x 3 0. x 1 x 2 x 3 x 4 x 5 x 6 M 30 20 10 1 0 0 0 200 0 5 10 0 1 0 0 100 4 0 2 0 0 1 0 50-2 -3-4 0 0 0 1 0 Tabel 5.2: Simplex: tabel 1 x 1 x 2 x 3 x 4 x 5 x 6 M 30 20 10 1 0 0 0 200 1 1 0 2 1 0 10 0 0 10 4 0 2 0 0 1 0 50-2 -3-4 0 0 0 1 0 Tabel 5.3: Simplex: tabel 2 x 1 x 2 x 3 x 4 x 5 x 6 M 30 15 0 1-1 0 0 100 1 1 0 2 1 0 10 0 0 10 4-1 0 0 1 5 1 0 30 2-2 -1 0 0 5 0 1 40 Tabel 5.4: Simplex: tabel 3 x 1 x 2 x 3 x 4 x 5 x 6 M 1 1 1 2 0 30 1 10 30 0 0 3 1 1 0 2 1 0 10 0 0 10 0-3 0 2 15 1 50 15 1 0 3 1 1 140 0 0 0 15 3 0 1 3 Tabel 5.5: Simplex: tabel 4 I tabel 5.2 er den første simplex tabel stillet op, hvor der er indført slackvariable. Disse er x 4, x 5, x 6 og det første pivot element er markeret med en firkant. Dette optræder i søjlen x 3, hvilket skyldes at den mest negative værdi i den nederste række befinder sig i denne søjle. Vi finder nu det mindste forhold: 200 10 10. = 20, 100 10 = 10 og 50 2 = 25. Det vil altså sige, at vi skal pivotere omkring I tabel 5.3 og tabel 5.4 ses det, at der er nuller både under og over pivotelementet. Vi finder derfor det næste pivotelement, hvilket gøres på samme måde 38

5.3. SIMPLEX METODEN som før. På denne måde fås, at vi skal pivotere omkring 30, hvilket er markeret med en firkant. I tabel 5.5 fås den basis brugbare løsning. x 1 = 10 3, x 3 = 10 og x 6 = 50 3 x 2 = x 4 = x 5 = 0 M = 140 3. Det vil altså sige, at den optimale løsning fås når x 1 = 10 3, x 2 = 0 og x 3 = 10, hvilket giver en funktionsværdi på 140 3, hvilket er den optimale værdi for vores maksimeringsproblem. 39

Del II Portefølje teori 41

6 Introduktion til moderne portefølje teori De følgende kapitler om moderne portefølje teori kapitel bygger på [Christensen, 2009] kapitel 3 m.fl., [Wikipedia, 2011a], [Wikipedia, 2011b], [Krotscheck, 2011], [Institut, 2011] og [Konno, 1991]. 6.1 Moderne portefølje teori I dette afsnit gennemgås det, der kaldes for den moderne portefølje teori. Denne teori bygger primært på den portefølje teori som Harry M. Markowitz og William F. Sharpe grundlagde, og som de modtog nobelprisen i økonomi for i 1990. En af grundene til, at man er interesseret i moderne portefølje teori, er at man ønsker en måde, hvorpå man kan investere sine penge bedst muligt i forhold til afkast og risiko. Det ideelle ville altså være en portefølje, som med sikkerhed ville give et højt afkast uden, at der var nogen risiko forbundet med det. Sådan forholder det sig imidlertid ikke i praksis. Moderne portefølje teori belyser blandt andet denne problemstilling. Når vi snakker om en portefølje så kan denne bestå af aktiver som obligationer, aktier og råvarer. Et af hovedprincipperne i portefølje teorien er, at de aktiver man kan investere i er forbundet med en risiko af større eller mindre grad. Dette betyder altså, at det ikke er muligt at vide, hvad det forventede afkast af aktivet bliver. Det forventede afkast opgøres i det følgende som procent. Moderne portefølje teori går som tidligere antydet ud på at minimere risikoen for et givet forventet afkast. Man kan alternativt maksimere det forventede afkast for en given risiko. Hele konceptet bag moderne portefølje teori er diversificering. Dette går groft sagt ud på at fordele sine penge på aktiver i forskellige grupper således, at hvis aktiverne i en gruppe mister værdi, så øges værdien af aktiverne i den anden gruppe. Dette er for eksempel tilfældet med aktier og obligationer. En af grundene til dette er, at obligationer påvirkes negativt af høj inflation, mens aktier er stabile, hvis ikke stigende, under høj inflation. 1 Dette 1 [Invest, 2011]

6.1. MODERNE PORTEFØLJE TEORI har den fordel, at risikoen for at miste penge bliver betydeligt nedsat, men samtidig vil afkastet heller ikke være så højt som, hvis man kun havde investeret i en gruppe af aktiver. Det er imidlertid meget fornuftigt at bytte et højere afkast ud med en reduceret risiko. Dette skyldes, at hvis man investerer mange penge og ofte med høj risiko, så vil man på et eller andet tidspunkt tabe penge. Moderne portefølje teori antager, at investorer er risikomodvillige. Dette betyder at, hvis man har to porteføljer med det samme forventet afkast, så vil investorerne vælge den portefølje med mindst risiko. Investorerne vil kun tage en højere risiko, hvis det kompenseres med et højere forventet afkast. Omvendt skal en investor, der ønsker et højt forventet afkast, godtage en høj risiko. Inden moderne portefølje teori forklares yderligere, er vi først nødt til at introducere følgende begreber. Standardafvigelsen eller risiko er betegnelser, som bruges til at beskrive den overordnede variation i kursværdien af et aktiv. Kigger man for eksempel på aktier og obligationer, så forbindes aktier med en høj risiko, hvilket betyder at kursværdien på en aktie kan ændre sig drastisk i løbet af meget kort tid. Hvis man kigger på obligationer, så forbindes disse som oftest med en meget lav risiko, hvilket vil sige, at man antager, at kursværdien er forholdsvis stabil. Ko-varians er et andet begreb som benyttes i forhold til moderne portefølje teori. Dette begreb bruges i forhold til to aktiver som man ønsker at finde sammenhængen mellem. Det vil altså sige, at ko-variansen, mellem to aktiver, er forholdet mellem den relative risiko af begge aktiver. Denne ko-varians antager værdier fra 1 til 1. Det kan også være tilfældet, at ko-variansen ikke eksisterer, hvilket betyder, at den er 0. Dette sker, hvis der ingen relation er mellem to aktiver. Hvis en ko-varians mellem to aktiver derimod er positiv, betyder det at, hvis kursværdien af et aktiv stiger, så vil kursværdien af det andet aktiv med stor sandsynlighed også stige. De to aktiver vil altså følge hinanden. Hvis ko-variansen mellem to aktiver er negativ, betyder det at, hvis kursværdien af et aktiv stiger, så vil kursværdien af det andet aktiv højst sandsynligt falde. Det vil altså sige, at udviklingen i kursen mellem de to aktiver er modsatrettede. Her og i afsnit 6.1 er det antaget, at ko-variansen går fra 1 til 1, hvilket er gjort for at illustrere betydningen af denne. I praksis er dette ikke nødvendigvis tilfældet. Denne antagelse betyder også, at man ved en ko-varians på 1 er sikker på at, hvis kursværdien af et aktiv stiger, så vil kursværdien af det andet aktiv også stige. På samme gælder det, at for en ko-varians på 1, hvis vi har et aktiv, hvor kursværdien stiger, så vil kursværdien af det andet aktiv falde. Ko-variansen kan illustreres grafisk, hvilket ses i figur 6.1. Her ses på en portefølje med to aktiver, hvor det samtidig antages, at ko-variansen mellem de to aktiver enten er 1 eller 1. Den røde rette linje i figur 6.1 repræsenter en ko-varians på 1, mens den grå linje repræsenterer en ko-varians på 1. I forbindelse med aktiver, skal risikofrie aktiver også nævnes. Som nævnt tidligere så forbindes obligationer med en lav risiko, hvilket er en af grundene til at korte statsobligationer antages at være et risikofrit aktiv. Derudover har kortsigtede statsobligationer høj likviditet. 43

KAPITEL 6. INTRODUKTION TIL MODERNE PORTEFØLJE TEORI Figur 6.1: Ko-variansen mellem to aktiver Det sidste begreb, som beskrives i forhold til den moderne portefølje teori er, det som kaldes for Capital Allocation Line (CAL). Dette er en linje, som beskriver alle porteføljer, der kan konstrueres ud fra to porteføljer 2. Det vil altså sige, at den røde linje og den grå linje i figur 6.1 er en CAL. I det følgende antages det, at ko-variansen mellem to aktiver hverken er 1 eller 1, hvilket betyder, at CAL mellem to aktiver ikke vil være rette linjer. Vi tilføjer nu et risikofrit aktiv til vores portefølje bestående af to aktiver, hvilket vil sige vi nu har en portefølje bestående af tre aktiver. Et risikofrit aktiv har ikke selv nogen kursvariation, og kan derfor hverken have negativ eller positiv ko-varians med en anden portefølje. Som et resultat af dette, vil CAL mellem et risikofrit aktiv og en portefølje være en ret linje. Det er nu muligt at investere i tre aktiver. En investor ønsker imidlertid at optimere sin portefølje med hensyn til risikoen. Dette betyder altså, at man ønsker at finde det optimale punkt på CAL mellem aktiv 1 og aktiv 2, hvor en given stigning i risikoen ikke resulterer i en tilsvarende eller større stigning i afkastet. Dette er vist i figur 6.2, som det punkt, hvor CAL for det risikofrie aktiv (den røde rette linje) er tangent til CAL mellem aktiv 1 og aktiv 2. For at udvide modellen til at kunne omfatte mange aktiver indføres den efficiente rand. Den efficiente rand svarer egentlig til en CAL for hele markedet. Det vil altså sige, at den efficiente rand er grænsen for alle mulige kombinationer af porteføljer, hvilket svarer til alle mulige CAL er. Da risiko-/afkastraten for aktiver altid reduceres, når de kombineres med et mindre risikofyldt aktiv vil man højst kunne opnå en risiko svarende til den, der er forbundet med det mest risikofyldte aktiv. Derfor vil mængden af alle porteføljer være begrænset opadtil som vist i figur 6.3. De blå linjer er CAL mellem to aktiver, mens de små grå prikker er mulige porteføljer. Den røde linje repræsenterer den efficiente rand. Den efficiente rand beskriver altså de optimale kombinationer mellem aktiver set i forhold til den ønskede risiko, eller det forventede afkast. Vi har altså nu beskrevet moderne portefølje teori, og hvordan man kan 2 En portefølje kan også bestå af kun et aktiv. 44

6.1. MODERNE PORTEFØLJE TEORI Figur 6.2: Tangent porteføljen Figur 6.3: Den efficiente rand finde den optimale portefølje ud fra en given mængde af aktiver, et risikofrit aktiv og afkast/risiko forbundet med aktiverne. En anden måde, hvorpå man kan finde den optimale portefølje er ved hjælp af en kombination af matematisk programmering og moderne portefølje teori. Dette beskrives i næste kapitel. 45

7 Mean-variance modellen I det følgende beskrives Harry Markowitz model, som kaldes for Mean-variance modellen. Mean-variance modellen bliver dog ikke brugt i praksis, idet der er nogen problemer forbundet med modellen, hvilket vi kommer ind på senere i dette afsnit. Mean-variance modellen er dog et godt udgangspunkt for en investeringsportefølje og som tidligere nævnt bygger moderne portefølje teori på denne model. Mean-variance modellen anvender ikke lineær programmering, som vi har beskrevet i første del af projektet, men derimod kvadratisk programmering. I denne form for matematisk programmering indeholder objektfunktionen led af 2. grad, hvilket adskiller sig fra objektfunktionen i det lineære programmeringsproblem. Bibetingelserne er lineære i kvadratisk programmering, og samtidig gælder det, at variablene, som indgår, skal være ikke-negative. I denne forbindelse anvender kvadratisk programmering altså samme princip som lineær programmering (jf. kapitel 2). Derudover gælder det også, at bibetingelserne enten kan være uligheder eller ligheder (som kan omskrives til uligheder), og objektfunktionen kan maksimeres eller minimeres. Mean-variance modellen bygger på forskellige begreber. Det første som introduceres, er det forventede afkast af porteføljen pr. periode. n r(x 1,..., x n ) = E R j x j = j=1 n E[R j ]x j. Her er R j en vilkårlig variabel, der repræsenterer afkastraten pr. periode på aktivet S j, hvor j = 1,..., n. x j er mængden af penge, som investeres i et aktiv S j, ud af den totale pengemængde M 0. E er den matematiske forventning og r(x 1,..., x n ) er det forventede afkast af porteføljen pr. periode. En investor vil fortrække en højst mulig r(x 1,..., x n ). Samtidig ønsker investor, at risikoen skal være mindst mulig. Her er risikoen defineret ved hjælp af standardafvigelsen. Standardafvigelsen af afkastet pr. periode er givet ved j=1 47

KAPITEL 7. MEAN-VARIANCE MODELLEN 2 σ(x 1,..., x n ) = E n n R j x j R j x j. j=1 j=1 σ(x 1,..., x n ) repræsenterer den samlede risiko af porteføljen. Det er nu muligt at formulere optimeringsproblemet for porteføljen som et kvadratisk programmeringsproblem. Min u.b.b. n n σ ij x i x j i=1 j=1 n r j x j ρm 0 j=1 n x j = M 0 j=1 0 x j u j, j = 1,..., n. Her er r j = E[R j ] og σ ij = E[(R i r i )(R j r j )] og ρ er parametren, der repræsenterer den minimale afkastrate krævet af en investor. Derudover gælder det, at ρ er afkastraten for investeringen og ρ > 1. x j = M 0 betyder, at alle pengene skal investeres og σ ij er ko-variansen mellem aktiv S j og S i. u j er det maksimale, der kan investeres i aktiv S j. Under den antagelse, at M 0 < u i i, så kan begrænsningen med u j fjernes fra problemet. Denne model er gældende hvis og kun hvis, R j er symmetrisk normalfordelt og hvis en investor er risikomodvillig, dvs. at han fortrækker en mindre standardafvigelse/risiko frem for en større. I det næste afsnit diskuteres Mean-variance modellen, og hvilke problemer der er forbundet den. 7.1 Kritik af Mean-variance modellen Kompleksiteten i beregningerne n(n + 1) For at lave modellen skal man lave beregninger for at opstille matricen 2 med σ ij. Dette kommer af, at matricen er symmetrisk. Dette kan gøres ved enten at bruge historiske data eller fremtidige prognoser for aktivernes kursudvikling. Disse beregninger vil være meget omfattende. Endvidere er det vanskeligt at løse så omfattende programmeringsproblemer, hvis n 48

7.1. KRITIK AF MEAN-VARIANCE MODELLEN antallet af aktiver, er over for eksempel 500 1. Dette kan løses ved, at introducere nogle antagelser i modellen, som mindsker den krævende mængde beregninger. Men hvis antagelserne ikke er præcise eller gyldige, så vil modellen ikke være brugbar. Risiko Investorernes opfattelse i forhold til risiko og fordelingen af priser på aktiver. Mange investorer er ikke overbevist om gyldigheden af at bruge standardafvigelsen som et mål for risiko 2. Transaktionsomkostninger og vedligeholdelse En optimal løsning, x = (x 1,..., x n ), til et omfattende programmeringsproblem vil sædvanligvis indeholde mange elementer, der er forskellige fra nul. Faktisk forventes mindst 100-200 komponenter i x at være positive, når n bevæger sig over 1000. Dette betyder, at investor skal købe mange forskellige aktiver. I praksis er dette ikke optimalt, da transaktionsomkostningerne og de omkostninger, der er forbundet med at vedligeholde en portefølje med så mange aktiver, vil være meget høje. Dette problem kan løses ved hjælp af heltalsprogrammering, da man således kun får hele antal aktier i løsningen. Heltalsprogrammering er kort sagt en begrænsning, som gør, at kun heltallige løsninger, til et optimeringsproblem, kan godkendes. Dette er ikke brugbart i praksis, da disse problemer normalt er svære at løse 3. Minimumsværdier Nogle af elementerne i x kan resultere i, at den mængde penge der investeres i et givent aktiv, ligger under den mindste værdi, der kan investeres i det aktiv. Dette medfører, at man står med ekstra ressourcer som bagefter skal allokeres, hvilket ikke er optimalt. Man kan delvist løse dette problem ved at sætte x j til mindst at antage en minimumsværdi. En konsekvens af at gøre dette er, at man tvinger modellen til at sætte x j > 0, hvilket ikke nødvendigvis er optimalt. Dette skyldes, at man således ikke kan vælge ikke at have et givet aktiv med. De inkluderes derfor alle i porteføljen. Det risikofrie aktiv Det aktiv, som benyttes som det risikofrie aktiv, er ikke risikofrit. Alle aktiver der giver et højere afkast end markedsrenten er forbundet med en eller anden form for risiko. Man benytter tit statsobligationer med kort løbetid som mål for det risikofrie aktiv, hvilket også er beskrevet i afsnit 6.1. Det vi har set i den senere tid er, at statsobligationer ikke er lig med et garanteret afkast. Dette ses blandt andet i Grækenland, hvor de græske statsobligationers værdi er blevet halveret på grund af Grækenlands gældskrise 4. Det forventede afkast Et af de største kritikpunkter af Mean-variance modellen er, at den bruger historiske data eller økonomiske prognoser til at beskrive den forventede afkastrate på aktiverne. Hvis det er historiske data, der bliver brugt, så skal man stille 1 [Konno, 1991] 2 [Konno, 1991] 3 [denstoredanske.dk, 2011] 4 [Bladet, 2011] 49

KAPITEL 7. MEAN-VARIANCE MODELLEN nogle krav til sine data. For eksempel, hvis man bruger middelværdien som forventet afkast, så kræves det at datapunkterne er symmetrisk normalfordelt omkring middelværdien, hvilket sjældent er tilfældet. Tilsvarende er det svært at finde en matematisk sammenhæng, der beskriver udviklingen i kursen. Hvis man bruger en økonomisk prognose, så ligger der nogle antagelser til grunde for denne. Antagelser som kan være for simple til, at prognosen er realistisk. Generelt kan man sige, at det i praksis er umuligt at genplacere tidligere afkast for et aktiv eller forudsige et aktivs fremtidige afkast. Dette skyldes, at der er mange variable, der har indvirkning på markedet for aktiver. Flere end vi kan regne på, og mange som vi ikke kan måle. For eksempel bliver markedet for aktiver påvirket af frygt for økonomiske kriser, rygter om og forventninger til firmaer, som måske ikke afspejler virkeligheden, samt personlige incitamenter. Med disse kritikpunkter for øje er Mean-variance modellen ikke fuldstændig ubrugelig. Den giver et godt udgangspunkt for udformningen af porteføljer som så ved hjælp af økonomiske argumenter og erfaring med kursudviklinger kan tilpasses, så den danner et realistisk billede af afkastet. Der vil altid være en risiko forbundet med at investere penge i noget, som ikke kan kvantificeres 100 %. Heldigvis er markedet for aktiver konstrueret således, at afkastet på aktiver afspejler den risko, der er forbundet med dem. Vi vil i det næste afsnit vise, hvorledes Mean-variance modellen kan benyttes på et lille udsnit af det danske marked for aktiver. 50

8 Databehandling Vi vil i dette kapitel beskrive, hvordan koefficienterne til Mean-variance modellen kan beregnes. Til at starte med introduceres den danske børs og hvilke aktiver, vi har valgt at fokusere på. Dataene for disse aktiver bruger vi til at beregne koefficienterne for Mean-variance modellen. NASDAQ OMX Nordic Copenhagen er den danske børs. Her handles med værdipapirer for danske firmaer, der er børsnoterede. Da der er mange firmaer noteret på NASDAQ OMX Nordic Copenhagen, vil vi ikke beskæftige os med dem alle, men kun et lille udsnit. Vi har valgt at fokusere på fem aktieselskaber og en obligation. Disse er Maersk A Maersk B Carlsberg A Carlsberg B Novo Nordisk B Statsobligationer (2002-5%) De datapunkter, der knytter sig til datasættene for selskaberne, spænder over to år; fra 2009 til og med 2011. Disse data bruges senere til at vise, hvordan koefficienterne til Mean-variance modellen kan beregnes. Vi introducerer først metoderne, som vi vil bruge til dette. Disse er som følger. Observationer (kursværdier) over en tidsperiode noteres som KV t. Vi definerer ændringen i kursværdien til tidspunkt t, som R i t for aktiv S i, hvor R i t := KV t = 1 + KV t KV t 1 KV t. (8.1) 51

KAPITEL 8. DATABEHANDLING Som det forventede afkast benyttes det geometriske gennemsnit (GM), hvor r i = E[R i ] := n n Rt. i (8.2) t=1 Variansen for R i er defineret ved n ( σ i2 t=1 R i := t r i). (8.3) n Sammenhængen mellem to aktiver, S i og S j, defineres vha. formlen for kovarians n Cov(S i, S j (Rt i r i )(R j t r j ) ) =. (8.4) n t=1 Disse sammenhænge er kun gyldige, hvis R i er symmetrisk normalfordelt. En af de input som mean-variance modellen tager er en matrice der specificere sammenhængen mellem aktivernes prisændringer. Denne kaldes ko-varians matricen og er givet ved σ 11 σ 12 σ 13 σ 14 σ 15 σ 16 σ 21 σ 22 σ 23 σ 24 σ 25 σ 26 Σ := σ 31 σ 32 σ 33 σ 34 σ 35 σ 36 σ 41 σ 42 σ 43 σ 44 σ 45 σ 46, σ 51 σ 52 σ 53 σ 54 σ 55 σ 56 σ 61 σ 62 σ 63 σ 64 σ 65 σ 66 hvor σ ii = σ i2. Disse kommer når man bruger ligning 8.4 på to aktiver. I tabel 8.1 er de værdier, vi har beregnet for vores aktiver opgjort. Disse værdier bygger på tal hentet med Datastream Advanced 5.0 d. 5. december 2011. De er beregnet i excel med de tidligere forklarede formler. Pga. datasættenes størrelse (n 500) vil disse ikke være vedlagt i projektet. (i) Navn (R i ) n r i σ i2 (1) Maersk A 718 1 + 2, 905 10 6 2, 47074 10 4 (2) Maersk B 718 1 + 2, 883 10 5 0.000530805 (3) Carlsberg A 718 1 + 3, 95 10 4 5, 1 10 4 (4) Carlsberg B 718 1 + 5, 74 10 4 4, 93 10 4 (5) Novo Nordisk 718 1 + 8, 74 10 4 2, 86 10 4 (6) Statsobligationer (2002 5%) 1061 1 + 1, 6047 10 5 2, 445952 10 5 Tabel 8.1: Tabel over de beregnede værdier for aktiverne Vha. formlen fra ligning 8.1 bestemmer vi den procentvise stigning i kursværdien. I den tredje søjle af tabel 8.1 bruger vi ligning 8.2 på de førnævnte procentvise stigninger for at få en værdi for den matematiske forventning til aktivets forventede afkast. Dernæst bruger vi i den fjerde og sidste søjle ligning 8.3 til at få et udtryk for den risiko der er forbundet med aktiverne. 52

8.1. ANALYSE AF DATAPUNKTERNE (1) (2) (3) (1) 2, 47 10 4 3, 61 10 1 1, 29 10 1 (2) 3, 61 10 1 5, 31 10 4 1, 29 10 1 (3) 1, 29 10 1 1, 29 10 1 5, 10 10 4 (4) 1, 38 10 1 1, 38 10 1 2, 85 10 1 (5) 5, 60 10 2 5, 60 10 2 4, 00 10 2 (6) 3, 90 10 3 4, 45 10 3 9, 29 10 3 (4) (5) (6) (1) 1, 38 10 1 5, 60 10 2 3, 90 10 3 (2) 1, 38 10 1 5, 60 10 2 4, 45 10 3 (3) 2, 85 10 1 4, 00 10 2 9, 29 10 3 (4) 4, 93 10 4 3, 87 10 2 9, 00 10 3 (5) 3, 87 10 2 2, 86 10 4 3, 12 10 3 (6) 9, 00 10 3 3, 12 10 3 2, 45 10 5 Tabel 8.2: Ko-varians mellem aktiverne fra tabel 8.1 I tabel 8.2 vises ko-varians mellem aktiverne fra tabel 8.1. Elementerne i tabel 8.2 er beregnet ved at benytte ligning 8.4 på datasættene for to aktiver. Dette er gjort mellem alle seks aktiver, hvilket giver en 6 6 matrix. I diagonalen af matricen har vi risikoen for aktivet, da σ ii = σ i2 som nævnt tidligere. Dette er de konstanter der skal bruges for at kunne lave en portefølje optimering vha. moderne porteføljeteori, herunder Mean-variance modellen. 8.1 Analyse af datapunkterne I dette afsnit vil vi se på, hvordan de data vi har fundet passer på teorien, og hvorledes disse vil passe ind i en evt. beregning af en optimal portefølje. Grunden, til at vi analyserer på dataene, er for at kunne vurdere, hvorvidt de vil være gyldige som input til Mean-variance modellen. Ifølge teorien omkring det forventede afkast af et aktiv burde vi have, at afkastet af alle aktierne skulle lægge over statsobligationen. Dette skyldes den større risiko, som teoretisk set er forbundet med dem. Vi kan se i tabel 8.1, at 0 < r 1 < r 2 < r 6 < r 3 < r 4 < r 5 < 1 + 10 3, hvilket vil sige at både Mearsk A og B aktierne har et forventet afkast, der ligger under obligationens afkast. Carlsberg A og B ligger over obligationen, og det aktiv med det højeste forventede afkast er således Novo Nordisk B. Dette er lidt i modstrid med teorien, da vi ville have forventet at Mearsk A og B havde et højere forventet afkast end obligationen. Dette kan skyldes, at 53

KAPITEL 8. DATABEHANDLING siden disse tal bygger på historiske data, så har Mearsk måske haft en dårlig periode og de overordnede stigninger i kursværdien er således blevet negligeret af den dårlige periode. Dette gør det desværre endnu sværere at genplacere deres forventede afkast, da dette jo er betinget af den overordnede finansielle situation. Hvis vi ser på variansen som et mål for risikoen forbundet med aktivet, så vil vi ifølge teorien forvente at se obligationen som den med lavest varians. Fra tabel 8.1 har vi, at 0 < σ 62 < σ 12 < σ 52 < σ 42 < σ 32 < σ 22 < 5, 5 10 4. Ud fra ovenstående kan vi se, at vores data passer ganske fint med teorien. Obligationen er det aktiv med lavest risiko. Hvis vi kigger på ko-variansen, så vil vi ifølge teorien forvente, at aktierne og obligationen har en negativ relation med hinanden. Desuden er det en god hypotese, at Maersk A og B vil have en høj positiv relation og det samme burde gælde med Carlsberg A og B. Fra tabel 8.2 kan vi se, at ko-variansen mellem obligationen og aktierne er negativ for alle aktierne. Dette passer perfekt med teorien, der siger at aktier og obligationer begge afhænger af inflation, men aktier stiger i værdi under høj inflation, mens obligationer falder i værdi. Derfor er det også logisk, at disse skulle have en negativ ko-varians, og dette stemmer også overens med vores data. Mht. de indbyrdes ko-varianser så kan vi se, at σ 12 =3, 61 10 1 σ 34 =2, 85 10 1, hvilket er betydelig større end σ 15 =5, 6 10 2 σ 25 =5, 6 10 2 σ 35 =4 10 2 σ 45 =3, 87 10 2. Vi kan ud fra ovenstående se, at Maersk A og B svinger sammen i kursværdi, og det samme gælder for Carlsberg A og B. Dette passer godt med teorien omkring, hvordan kursværdierne for aktiver bør opføre sig i forhold til hinanden. Vi kan hermed konkludere, at vores datasæt passer rimelig godt sammen med teorien, og at disse vil være brugbare i en model til optimering af en portefølje. Vi vil dog ikke anbefale, at man bruger disse tal som mål for aktivernes afkast eller risiko, da de tal vi her har beregnet skal tages med forbehold. Dette skyldes den forsimplede beregning af værdierne. 54

9 Omformulering af Mean-variance modellen Et af problemerne med Mean-variance modellen er, at objektfunktionen ikke er lineær. En løsning til dette er som følger 1. Objektfunktionen fra Mean-variance modellen (et mål for risikoen for den samlede portefølje) er givet ved σ(x) = n j=1 i=1 n σ ij x i x j. I artiklen [Konno, 1991] bevises det, at denne er tilnærmelsesvis lig med n w(x) := E (R j x j E[R j ]x j ), j=1 men med den undtagelse, at w(x) > σ(x). w(x) kaldes for mean-absolut deviation. Hvis man antager, at E[R j ] = r j := T t=1 r jt T, så kan w(x) skrives som w(x) 1 T T n (r jt r j )x j. t=1 j=1 For at lette notationen definerer vi 1 [Konno, 1991] a jt := r jt r j, 55

KAPITEL 9. OMFORMULERING AF MEAN-VARIANCE MODELLEN og vi får således en objektfunktion, der skal minimeres min 1 T n T a jt x j. t=1 j=1 For yderligere at lette notationen definerer vi n y t := a jt x j. j=1 Dette kan således beskrives som det følgende lineære programmeringsproblem. Min u.b.b. 1 T T t=1 y t n a jt x j j=1 = y t n r j x j ρm 0 j=1. n x j M 0 j=1 og 0 x j u j j {1,..., n} Dette er et lineært programmeringsproblem, og disse kan løses relativt nemt vha. simplex algoritmen. Antagelsen om at σ(x) kan erstattes med w(x) er en forsimpling af problemet, da vi ikke længere medtager, hvordan aktiverne påvirker hinanden. Dette kan også være grunden til, at w(x) > σ(x), da ko-variansen kan være med til at mindske den samlede risiko. 56

10 Konklusion Vi har i dette projekt beskrevet lineær programmering, som er en metode som især bruges inden for økonomiens verden. Denne metode bruges til at optimere forskellige økonomiske problemstillinger. Dette gøres ved hjælp af en objektfunktion og bibetingelser, som opstilles ud fra problemets begrænsninger. Det lineære programmeringsproblem kan løses på flere forskellige måder. En af metoderne er den geometriske metode, hvor objektfunktionen og bibetingelserne indtegnes i et koordinatsystem. Bibetingelserne danner tilsammen en brugbar mængde, hvilket er det område, hvor de brugbare løsninger til problemet findes. Den optimale løsning fås i et af hjørnepunkterne tilhørende den brugbare mængde. Dette kan bevises ved hjælp af forskellig teori blandt andet åbne og lukkede mængder og differentiabilitet. Den geometriske metode har dog den ulempe, at den kun kan anvendes på problemer af tre dimensioner. Hvis man skal løse lineære programmeringsproblemer af flere dimensioner, så anvendes simplex metoden, som bygger på den algebraiske metode. Simplex metoden bygger på en algoritme, som går ud på, at man indfører slackvariable til sit problem. Herefter opstilles en tabel med bibetingelserne, objektfunktionen og slackvariablene. Man anvender herefter algoritmen, indtil man har fundet den optimale løsning. Vi har i anden del af dette projekt belyst sammenhængen mellem matematisk programmering, herunder lineær programmering og kvadratisk programmering og moderne portefølje teori. Denne teori går kort sagt ud på at sammensætte en portefølje således, at man opnår så højt et afkast som muligt, men med mindst risiko. Teorien bag moderne portefølje teori bygger på Mean-variance modellen, som anvender kvadratisk programmering. Dette vil sige, at objektfunktionen indeholder led af 2. grad. Det er dog muligt at simplificere modellen således, at objektfunktionen også er lineær, som vi så i det lineære programmeringsproblem. Derudover indeholder Mean-variance modellen konstanter, som ikke er bestemt. Vi har forsøgt at bestemme værdierne for disse konstanter ved hjælp af historiske data. Vi har således bestemt værdier for variansen, ko-variansen og det forventede afkast. Disse værdier stemmer også overens med teorien tilhørende til Mean-variance modellen. 57

Litteratur [Adams, 2010] Adams, R. A. (2010). Calculus, A complete course. Pearson Education, Inc., seventh edition. Kapitel 1, afsnit 12.7 samt Appendiks III. [Bladet, 2011] Bladet, E. (2011). http://ekstrabladet.dk/kup/dinepenge/ article1646373.ece. Hjemmeside. d. 7. [Christensen, 2009] Christensen, M. (2009). Aktie investering, volume 1. Juristog økonomforbundet, 3. edition. [denstoredanske.dk, 2011] denstoredanske.dk (2011). http://www. denstoredanske.dk/it,_teknik_og_naturvidenskab/matematik_ og_statistik/operationsanalyse_og_matematisk_programmering/ heltalsprogrammering. Hjemmeside. D. 8. [Institut, 2011] Institut, T. B. (2011). http://www.brandes.com/institute/ Documents/Past$%$20Future$%$20MPT$%$20081604.pdf. Hjemmeside. d. 15. [Invest, 2011] Invest, J. (2011). http://jyskeinvest.dk/wps/portal/ji/ afdelingerogkurser/afdelingoverblik/afdelingrisiko?portfolioid= 2. Hjemmeside. d. 30. [Konno, 1991] Konno, H. (1991). Mean-absolute deviation portfolio optimization model and its applications to tokyo stock market. Management Science, 37(5). Hentet fra JSTORE. [Krotscheck, 2011] Krotscheck (2011). http://www.krotscheck.net/2008/ 02/24/modern-investment-theory.html. Hjemmeside. d. 4. [Lay, 2005] Lay, D. C. (2005). chapter 9. Pearson International Edition, third edition. [of Maryland, 2011] of Maryland, U. (2011). http://www2.math.umd.edu/ ~lvrmr//2009-2010-f/classes/math246/calculus/derivatives.pdf. Hjemmeside. d. 26. [Proffesor G. Srinivasan, 2008] Proffesor G. Srinivasan, Department of Management Studies, I. M. (2008). http://www.youtube.com/user/nptelhrd# grid/user/05350a31e6c09b7a. Youtube video. Lec-1, Lec-2, Lec-3. [Proffesor G. Srinivasan, 2010] Proffesor G. Srinivasan, Department of Management Studies, I. M. (2010). http://www.youtube.com/user/nptelhrd# grid/user/004010fea702502f. Youtube vidoe. Lec-1. [Schilling, 2007] Schilling, A. (2007). chapter 6. Definition 6.1.1. side 62. [Ullman, 1992] Ullman, J. D. (1992). chapter Four. W. H. Freeman. Fundet på http://infolab.stanford.edu/~ullman/focs/ch04.pdf. [Wade, 2010] Wade, W. R. (2010). An Introduction To Analysis. Pearson Education, Inc., fourth edition. 59

LITTERATUR [Wikipedia, 2011a] Wikipedia (2011a). http://da.wikipedia.org/wiki/ Kovarians. Hjemmeside. d. 12. [Wikipedia, 2011b] Wikipedia (2011b). http://en.wikipedia.org/wiki/ Modern_portfolio_theory. Hjemmeside. d. 18. 60