Rettevejledning til Økonomisk Kandidateksamen 2007II. Kvantitative Metoder 2: Tag-hjem eksamen

Rettevejledning til Økonomisk Kandidateksamen 2007II Kvantitative Metoder 2: Tag-hjem eksamen Der skal for hver studerende foretages en samlet bedømmelse af tag-hjem gruppeopgaven og den individuelle 2-timers prøve uden hjælpemidler. Vurderingsgrundlaget for tag-hjem eksamen er selve opgavebesvarelsen og bilaget. Programmer og data bedømmes som sådan ikke, men er anvendt f.eks. til at opklare eventuelle følgefejl og lignende i besvarelsen, og til at checke at der ikke er sket samarbejde udenfor den enkelte gruppe. Det indgår i vurderingen, om besvarelsen samlet set er konsistent og indenfor de angivne rammer formår at belyse den overordnede problemstilling, der rejses i opgaven. I opgaveteksten er det anført, at besvarelsen højst må fylde 21 sider (inkl. forsiden) og derudover 20 sider bilag. Overskrides omfanget af opgavebesvarelsen, skal det vægtes negativt i den samlede bedømmelse. Hvor der udføres hypotesetest forventes der redegjort for de opstillede hypoteser, den anvendte teststatistik og fordeling samt signifikansniveauet for testet (i rettevejledningen benyttes 5% signifikansniveau hvis ikke andet er nævnt). Henvisninger i rettevejledningen henviser til lærebogen Wooldridge Introductory Econometrics, 3. udgave, hvis intet andet er nævnt. Opgaven besvares ud fra individualiserede datasæt. Hvor der i vejledningen er angivet konkrete numeriske resultater og konklusioner, er disse baseret på afleveringsnummer 117. Resultater for andre eksamensnumre kan fås ved at køre det vedlagte SAS program VEJL2007II_KM2.sas med det relevante afleveringsnummer, samt de udleverede macro- og data-filer. Konklusionerne med andre afleveringsnumre vil derfor kunne afvige fra denne vejledning. Opgave 1 a) Data beskrives ved en tabel, som angiver gennemsnit, varians (eller standardafvigelse) samt evt. min og max for variablerne i model (1.1). For dummyvariablerne afspejler tabellen den andel af stikprøven, som falder i kategorien. Hovedtræk i data og eventuelle afvigende observationer kommenteres. Famdir og Fambest krydstabuleres. Direktørposten besættes ofte indenfor familien, hvis bestyrelsen er relativt familietung. b) Kontingens tabel opstilles for Branche og Famdir. Fordeling mellem familiedirektør og ikke-familiedirektør er ret konstant over brancher (med undtagelse af branche 8 som har relativt få virksomheder). c) Der udføres et Q-test for nulhypotesen, at fordeling mellem familiedirektør og ikkefamiliedirektør er homogen over brancher overfor et generelt alternativ. Det forventede antal familiedirektører er i underkanten af det krævede for gyldigheden af Q-testet. Testet har en høj p-værdi, så der er ingen signifikant afhængighed. 1

Opgave 2 a) Model (1.1) skal beskrives med konkret henvisning til de variabler, der indgår (kontinuerte variabler, transformationer, dummyvariabler) uden at inddrage estimerede værdier af koefficienter, standardfejl, forklaringsgrad, eller lignende. Alt andet lige fortolkningen af parameteren β skal ske konkret i forhold til, at Famdir er en dummyvariabel med ikkefamiliedirektør som referencekategori. δ20 er koefficient til årsdummien for 2000 med 1981 som reference. Fortegn for β : Introduktionen nævner modsatrettede intuitive effekter, men citerer empiri som viser en negativ effekt. Relevante alternativer er tosidede eller ensidet negativ. Det valg man træffer, bør afspejle sig senere i opgaven. Fx betyder en forventning om en negativ effekt, at man bør vælge en en-sidet negativ alternativhypotese i opgave 2.d).ii. b) Tabellen skal opstilles. Kommentarerne bør gå på forventet fortegn. Hvis der kommenteres på signifikans må det ske med udgangspunkt i de robuste standardfejl, da MLR.5 endnu ikke er afprøvet. c) i) De to plot udføres og kommenteres konkret i relation til MLR.5. Spredningen på residualerne viser ingen tydelig afhængighed, især ikke når man tager højde for at datatætheden er mindre for de mere ekstreme værdier af den variabel, der plottes overfor. Konklusion: Homoskedasticitet. ii) Hypotesetest udføres jf SAS programmet og på baggrund af F-test størrelsen eller nr 2 må det konkluderes, at der er homoskedasticitet. d) Testene bør udføres på grundlag af den almindelige kovariansmatrix for OLS estimatoren i lyset af konklusionen under c). Både her og i resten af opgaven vil brug af robust kovariansmatrix blive accepteret, hvis der argumenteres eksplicit for dette ud fra robusthed overfor konklusionen om homoskedasticitet eller hvis der testes påny. Alle de indledningsvist nævnte forhold vedr. de anvendte test skal kommenteres. i) og iii) udføres som F-test. ii) kan klares med et t-test eller et F-test. e) i) Omsætningen dannes som Oms=exp(lnOms) og indsættes som en generel kvadratisk funktion i stedet for lnoms i den forsimplede model som er beskrevet i opgaveteksten. Der kan opstå numeriske problemer i TEST proceduren i SAS. Problemet kan løses ved at reskalere Oms fx med en faktor 1000 (der er ikke tale om perfekt multikollinearitet) eller testet kan laves manuelt. Signifikansen af den kvadratiske specifikation testes med et F-test for samlet signifikans af både Oms og kvadreret Oms evt. suppleret med et t-test på det kvadratiske led alene. Samlet set er leddene signifikante. Isoleret set er det kvadratiske led insignifikant, hvilket betyder at en lineær specifikation vil være fyldestgørende. 2 ii) R beregnes for begge modeller (ikke R 2, da der er forskelligt antal forklarende variabler) og viser sig at være højest for den kvadratiske model. iii) Predikteret værdi fra den ene model indsættes i den anden model og omvendt. Signifikansen af hver af de tilføjede variabler testes med et t-test. Predikteret værdi fra kvadratisk model er signifikant i log-modellen, men ikke omvendt. Resultatet peger i retning af at den kvadratiske model er bedst. 2

iv) Der skal laves en graf af de to estimerede funktioner mod Oms. Den kvadratiske funktion er i praksis lineær på grund af en meget lille koefficient til det kvadratiske led. Diagrammet kan eventuelt indeholde de faktiske observationer også. Heraf fremgår det at set i forhold til spredningen på de faktiske observationer er der kun små forskelle mellem de to funktionsformer. Den samlede konklusion bliver, at den kvadratiske funktion er bedst. f) Der skal træffes et begrundet valg mellem de estimerede modeller. Forenklingen af modellen svarende til d) iii) kan accepteres. En lineær eller kvadratisk funktion kan være at foretrække frem for log-specifikation ud fra e), men i praksis er forskellen ikke stor. Svaret skal fokusere på estimatet af β som uanset valg af model ligger omkring -0.2. Valget af direktør indenfor familien har en stor, negativ effekt på firmaets kurs/indre værdi, alt andet lige. Kritikken kan fx fremhæve, at konsistensen af dette estimat afhænger af gyldigheden af antagelserne om modellen, herunder antagelsen om at Famdir er ukorreleret med fejlleddet (hvilket følger af MLR.). Udeladte variabler som både er korreleret med tilbøjeligheden til familieovertagelse af direktørposten og med aktiemarkedets reaktion på skiftet, fx årsagen til skiftet (sygdom, alder, skandale, regnskabsrod, ), kunne være et problem for MLR.. Opgave 3 a) i) Der skal konstrueres en variabel, der angiver de to delperioder og denne variabel skal krydses med Famdir i en tabel. Tendensen i stikprøven svarer til den generelle tendens, idet fordelingen mellem familie- og ikke-familieoverdragelser går fra at være fifty-fifty til at være 1:2. Dette kan evt. bekræftes ved at udføre et test for uafhængighed mellem de to variabler. Nulhypotesen om uafhængighed afvises markant. ii) Nej, nepotisme-effekten er givet ved koefficienten β, som i model (1.1) er forudsat at gælde i alle perioder. Modellen indeholder årsdummier, men de tillader blot at det generelle niveau for kurs/indre værdi ændringer ved direktørskift er forskelligt i forskellige år i perioden. iii) Årsdummier udelades men modellen udvides med periodedummien fra a) og dens interaktioner med de forklarende variabler i (1.1). Der skal udføres et test for signifikansen af periodedummien og dens interaktioner for at undersøge, om der er generelle forskelle mellem perioderne. F-testet viser, at samme model kan accepteres i begge delperioder. Givet homoskedasticitet kan testet alternativt foretages om et Chow-test, hvor model (1.1) uden årsdummier køres for hver af de to delperioder. Om nepotisme-effekten varierer mellem de to delperioder afgøres ved et test på interaktionen mellem β og periodedummien. Der er ikke signifikant forskel. b) i) D-i-D estimatet skal beregnes fx ud fra proc means eller ved en simpel regression af KIaendr på Famdir og en konstant. Estimatet ligger omkring -0.2. ii) Signifikans kan afgøres ved et t-test ud fra den simple regression. Effekten er særdeles signifikant. 3

Opgave iii) D-i-D estimatoren er OLS estimatoren i den simple model. Betingelserne for konsistens er derfor givet ved SLR.1-, evt. kan SLR. slækkes til kun at kræve fravær af korrelation mellem fejlleddet og Famdir. Der bør her diskuteres konkret, hvilke faktorer der kunne være årsag til en sådan korrelation. Firmaets størrelse fx målt ved lnoms kunne være en kandidat. Men det fremgik af opgave 2, at variablen ikke er signifikant. a) i) For at undersøge om nepotisme-effekten er betinget af kvaliteten af college skal der indgå en interaktionseffekt mellem lsc og Famdir i modellen. For ikke at pålægge en arbitrær restriktion på niveaueffekten bør lsc også indgå. Det relevante test er et t-test for signifikansen af interaktionsleddet, evt. også et F-test for begge led hvor lsc indgår. Modellen bør her opskrives eksplicit med symboler. Man kan arbejde med den oprindelige model (1.1) eller med en reduceret model, hvor insignifikante led er fjernet. ii) lsc skal konstrueres ud fra col_level. Der estimeres en positiv (men insignifikant) niveaueffekt af lsc, så der er ikke som udgangspunkt en negativ effekt af en direktør med lsc bachelorgrad. Men hvis lsc direktøren samtidig er familiedirektør, bliver den samlede effekt ca. -0.. iii) Konklusionen bliver, at der findes en alt-andet lige nepotisme-effekt, som slår stærkt igennem hvis den familieudnævnte direktør har en svag uddannelsesmæssig baggrund. b) i) Fejlleddet bør opdeles i en tids-invariant ai og en idiosynkratisk del u it, hvor sidstnævnte varierer både over tid og individer. Den tidsinvariante del kan indeholde firmaspecifikke faktorer, som ikke varierer mellem perioderne før og efter direktørskiftet. Den kan derimod ikke indeholde direktør-specifikke faktorer (fx lederevner), da direktøren jo netop udskiftes. ii) Førstedifferens modellen skal opfylde SLR.1-, det vil blandt andet sige at uit skal være ukorreleret med Famdir (førstedifferensen af denne er lig den oprindelige variabel) og at der er variation i Famdir. iii) Der er variation i Famdir under de i opgaven givne forudsætninger. Det er tvivlsomt at forudsætte at uit er ukorreleret med Famdir. Valget af familiedirektør eller ej kan meget vel netop afhænge af (forskelle) i direktørspecifikke karakteristika: fx at en afgående direktør er meget dygtig og derfor har magt til at sikre, at hans knap så dygtige søn får overdraget direktørstolen. iv) Der skal foretages en IV analyse med Diralder som instrument. Der skal kommenteres på to betingelser: Diralder er meget stærkt (negativt) korreleret med Famdir, så instrumentet må betragtes som stærkt. Dette kan ses ved en hjælpregression. Antagelsen om exogenitet af instrumentet er dog tvivlsom i lyset af diskussionen under iii), idet familiedirektører i gennemsnit er meget yngre (og formodentlig har mindre erfaring). Når IV analysen gennemføres konstaterer man desuden, at der ikke er signifikante tegn på, at Famdir er endogen. Men gyldigheden af den konklusion afhænger af gyldigheden af instrumentet.

Opgave 5 Her fokuseres på et konkret resultat af den hidtidige analyse. Det afgørende er at det præciseres, hvilket resultat det er man efterprøver, at valget motiveres (hvorfor det kan være interessant at se på netop dette aspekt af resultaterne, se fx i introduktionen), og at analysen kan gennemføres ud fra det givne datasæt. Den valgte model bør skrives op med symboler. Det oplagte valg er den tilsyneladende meget robuste nepotisme-effekt. Variablerne i datasættet giver forskellige muligheder. I den vejledende SAS-løsning er der set på en model, som specificeres med overskudsgraden som afhængig variabel (nævnes i introduktionen); en model med forsknings- og udviklingsvariabel (jf forskningstung i introduktionen); en model, hvor den tiltrædende direktørs køn tages med (jf at der skelnes mellem døtre og sønner i introduktionen); og en analyse af et datasæt, som er uden de to mest oplagte outliers. Alternativt kan man se på andre estimatorer, fx FGLS hvis man vurderer at der er et problem med heteroskedasticitet, eller undersøge andre bud på instrumentvariabler. Opgave 6 a) I dette spørgsmål skal de studerende vise, at de har overblik over de forskellige modeller, og er i stand til at lave en overskuelig tabel, som sammenholder de vigtigste analyser. Desuden skal de kunne gøre rede for, hvordan de enkelte modeller forholder sig til hinanden. De studerende skal anføre, hvilken model de foretrækker, og anføre hvorfor denne foretrækkes. Den foretrukne model bør indeholde de variabler, der er indgår signifikant i analysen. Fokus i kommentaren bør være på, hvordan estimatet af nepotismeeffekten varierer over modellerne. b) Den overordnede konklusion bør være, at der findes en negativ effekt af overdragelse af direktørposten indenfor familien og at den kan tolkes som en nepotisme-effekt. I relation til danske virksomheder kan man jf introduktionen pege på, at der kan være positive effekter forbundet med godt kendskab til virksomheden, som måske særligt gør sig gældende i små virksomheder. En typisk dansk virksomhed vil være mindre end de børsnoterede amerikanske virksomheder i analysen og nepotisme-effekten er måske derfor tilsvarende mindre udtalt. 5