Generel illustration af SAS Enterprise Guide projekt:

Relaterede dokumenter
Pårørende( involvering fakta og evidens

Appendiks 1: Selektering i Orbis

Hyldespjældet anno 2035 BILAG. En overordnet analyse af renoveringsbehovet i Hyldespjældet i relation til den energipolitiske milepæl for 2035.

Appendiks Økonometrisk teori... II

Fokus på Forsyning. Datagrundlag og metode

Bilag 12 Regressionsanalysens tabeller og forklaringer

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

KIFs støtteordning. KIFs støtteordning

Analysestrategi. Lektion 7 slides kompileret 27. oktober :24 p.1/17

Anvendt Statistik Lektion 8. Multipel Lineær Regression

(studienummer) (underskrift) (bord nr)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Statistik Lektion 4. Variansanalyse Modelkontrol

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i.

Statistik Lektion 17 Multipel Lineær Regression

Kvantitative metoder 2

Multipel Lineær Regression

Løsning til eksamen d.27 Maj 2010

Statistik FSV 4. semester 2014 Øvelser Uge 2: 11. februar

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Økonometri 1. Inferens i den lineære regressionsmodel 2. oktober Økonometri 1: F8 1

To samhørende variable

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

(studienummer) (underskrift) (bord nr)

Appendiks A Anvendte test statistikker

Opsamling Modeltyper: Tabelanalyse Logistisk regression Generaliserede lineære modeller Log-lineære modeller

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet

Simpel Lineær Regression

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Økonometri 1. Dagens program. Den simple regressionsmodel 15. september 2006

Lineær regression. Simpel regression. Model. ofte bruges følgende notation:

Økonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol

1 Hb SS Hb Sβ Hb SC = , (s = )

Test for strukturelle ændringer i investeringsadfærden

Økonomisk Kandidateksamen 2004II Økonometri 1. Læsefærdigheder hos skoleelever i Danmark

Eksportørgevinst i eksportrelationen

Reestimation af importrelationer

Rettevejledning til Økonomisk Kandidateksamen 2007II. Kvantitative Metoder 2: Tag-hjem eksamen

Statistik II 4. Lektion. Logistisk regression

! Proxy variable. ! Målefejl. ! Manglende observationer. ! Dataudvælgelse. ! Ekstreme observationer. ! Eksempel: Lønrelation (på US data)

REFERAT. A. Valg af referent - Hans B. Godkendelse af mødereferater (åben + lukket) fra den 8. april Godkendt

Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)

Hypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j

Rettevejledning til Økonomisk Kandidateksamen 2007II. Økonometri 1

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Rettevejledning til Økonomisk Kandidateksamen 2005I, Økonometri 1

Økonometri, ugeseddel 8 Hold 1 1/4-2003

Kvantitative metoder 2

Økonometri Lektion 1 Simpel Lineær Regression 1/31

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

Opgave I II III IV V VI Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar

Løsninger til kapitel 14

Standardformular STANDARDFORMULAR 1

Oversigtsblad. over tilblivelsen af "Haandbog i Verdens-Historien" III, Fase. 229*

Produkt og marked - matematiske og statistiske metoder

Industri FLERE TAL. Industri

Industri FLERE TAL. Industri

Statistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test

Løsning til eksaminen d. 14. december 2009

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]

Multipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model

Frødalen, afd Hillerød

GN Store Nord A/S VAT number XBRL REVIEW REPORT

Danmarks Tekniske Universitet Side?? af 20 sider

Bornerim, Remser og Lege

Økonometri 1 Forår 2006 Ugeseddel 11

Statistik Lektion 16 Multipel Lineær Regression

Multipel Lineær Regression. Polynomiel regression Ikke-lineære modeller og transformation Multi-kolinearitet Auto-korrelation og Durbin-Watson test

Appendiks - Speciale ITU 2002 Offline XML Datavarehus. Figuroversigt. Afsnit 1 Figur 1.1 Fiktiva s nuværende datastruktur

Økonometri: Lektion 6 Emne: Heteroskedasticitet

University of Copenhagen. Notat om statistisk inferens Larsen, Martin Vinæs. Publication date: Document Version Peer-review version

Løsning eksamen d. 15. december 2008

Program. 1. Varianskomponent-modeller (Random Effects) 2. Transformation af data. 1/12

Bilag I. ~ i ~ Oversigt BILAG II MATEMATISK APPENDIKS. The Prisoner s Dilemma THE PRISONER S DILEMMA INTRODUKTION I RELATION TIL SAMORDNET PRAKSIS

Center for Statistik. Multipel regression med laggede responser som forklarende variable

ØVELSER Statistik, Logistikøkonom Lektion 8 og 9: Simpel og multipel lineær regression

Danmarks Tekniske Universitet Side 1 af 19 sider

1 Regressionsproblemet 2

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning

Side 1 af 21 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december Kursus navn og nr: Introduktion til Statistik, 02402

Økonometri B i R. Sebastian Barfort.

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

1 Multipel lineær regression

Den personlige skattepligtige indkomst

Out-of-sample forecast samt reestimation af ADAMs lønligning

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom

A. Valg af referent (Rækkefølge inkl. suppleanter) Anders er valgt Ny rækkefølge (fra næste møde er): Hans, Lars, Camilla, Christian, Anders

5.11 Middelværdi og varians Kugler Ydelse for byg [Obligatorisk opgave 2, 2005]... 14

Økonometri: Lektion 2 Multipel Lineær Regression 1/27

Reestimation af uddannelsessøgende til modelversion okt15

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Økonometri: Lektion 4. Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater

Økonometri 1. Oversigt. Mere om dataproblemer Gentagne tværsnit og panel data I

Supplerende dokumentation af boligligningerne

Introduktion til GLIMMIX

Transkript:

Bilagsoversigt: Bilag 1: Dokumentation af data og data flow i SAS Enterprise Guide... II Bilag 2: Søgekriterier i Orbis... X Bilag 3: Dummy-variable for år... XI Bilag 4: Modelkørsel på modificeret Jones-model pr. år i perioden 2006-2011... XII Bilag 5: Forudsætningstests for estimation af modificeret Jones-model... XV Bilag 6: Modelkørsel på modificeret Jones-model på grupperede perioder (2006-2007 hhv. 2008-2011)... XX Bilag 7: Forudsætningstests på incitamentsvariable... XXI Bilag 8: Forudsætningstests på endelig baglæns optrevlet model 2006-2007...XXXI Bilag 9: Forudsætningstests på endelig baglæns optrevlet model 2008-2011... XXXIV Bilag 10: Modelkørsel på incitamentsmodel 2006-2007... XXXVIII Bilag 11: Modelkørsel på incitamentsmodel 2008-2011... XXXIX Bilag 12: Antal selskaber pr. land i stikprøven... XL I

Bilag 1: Dokumentation af data og data flow i SAS Enterprise Guide For at eksekvere SAS-programmerne bag denne afhandling, behøves der blot en lokal installation af SAS Enterprise Guide v. 4.3 med fuld SAS Foundation 9.3 samt fuld SAS STAT licens. Kopiér folderen <CD-ROM-DREV>\Orbis_SAS_data fra vedlagte CD-ROM til computerens C: drev. Gå derefter til folderen C:\Orbis_SAS_Data\SAS_programs og udvælg de relevante programmer. Programmerne er nummererede i kronologisk rækkefølge. Alle væsentlige datasæt er eksporteret både som SAS-tabeller og Excel-filer, ligesom outputs fra deskriptive statistikker og regressioner er placeret naturligt i foldere som html-filer. I nedenstående gennemgang er folder- og filnavne endvidere præsenteret. SAS Enterprise Guide er et intuitivt peg- og klik-værktøj, som betyder, at langt de fleste operationer i systemet kan klares uden programmørviden. Det har dog været nødvendigt at indsætte rigtig SAS-kode i Enterprise Guide-projekterne, da ikke alt i indeværende kunne løses via standardfunktionalitet. Da SAS Enterprise Guide kører på en del af SAS Foundation, er der mulighed for at eksekvere samtlige SAS-procedurer i Enterprise Guide, hvorved der ikke er nogen begrænsninger i SAS Enterprise Guide, hvorfor bl.a. hele SAS STAT pakken er til rådighed. Det har været nødvendigt at udvikle ekstra kode til håndtering af labels (kolonnebeskrivelser efter datatransformationer), til winsorizing af variable samt til regressioner med heteroskedasticitetkonsistente standardafvigelser. SAS Enterprise Guide-pogrammerne er placeret i folderen: <CD-ROM-DREV>\Orbis_SAS_Data\SAS_programs med filtype.egp. Det er kun muligt at åbne programmerne med en installeret SAS Enterprise Guide version 4.3. Generel illustration af SAS Enterprise Guide projekt: II

Step 1: Formål: Generering af en datatabel indeholdende alle finansielle data til kørsel af Jones-modeller Program: 1_Create_raw_data Efter udtræk fra Orbis databasen, er data hentet til i alt 3.txt-filer. Orbis har en begrænsning på antallet af kolonner, der kan eksporteres, hvorfor der er eksporteret to filer; nemlig Total_data_1 og Total_data_2, som er placeret på C:\Orbis_SAS_Data\0_Orbis_raw_data. Disse filer er sammensat ud fra den unikke selskabskode. Antallet af selskaber i udtrækket er 2.884. For Orbis filtervalg, se venligst udtræksstrategien fra Orbis C:\Orbis_SAS_Data\0_Orbis_raw_data i filen Search_criteria.xlsx samt beskrivelsen af valgene i afhandlingen eller evt. bilag 2. Orbis-udtrækket pr. datatype (fx total assets) pr. år er kolonner, og det ønskes at sammenflette 7 kolonner til én (år fra 2005 til 2011). Dette gøres ved at transponere alle numeriske kolonner til en værdi-kolonne. Herefter benyttes det, at beskrivelsen på alle kolonner pr. datatype er konsistent, nemlig '[Total assets] th EUR 2011', hvor [XXXX] er pr. år, th er tusinder, [XXXXXX] er datatypen. Denne beskrivelse deles i to, dvs. en year-kolonne indeholdende [XXXX] og en variabel-kolonne indeholdende '[XXXXXX] th eur'. Herved kan data transponeres endnu engang, denne gang ved at få hver datatype (regnskabspost) tilbage på kolonnerne, dog for alle år pr. datatype. Tabellen indeholder nu 20.188 observationer (2.884 selskaber * 7 år) pga. datatransponeringen. Rådata fra kørslen er blevet eksporteret både som SAS-tabel og som xls-fil (2005-2011) i folderen C:\Orbis_SAS_data\SAS_cleaned_data. Se fil transposed_raw_data.sas7bdat og transposed_raw_data.xls. Endelig er samtlige data for Vestas Wind Systems A/S (DK10403782) blevet kontrolleret for datavaliditet for 2011 og 2010. Alle de behandlede data er korrekte for Vestas Wind Systems A/S - både mht. reliabilitet (indeholder Orbis-databasen korrekte tal?) og fuldstændighed (er alle de korrekte regnskabsposter blevet trukket ud?). III

Step 2: Formål: At skabe en tabel, så det vides, om selskaberne bruger hhv. big4-revisor, og om der har været skift i ledelsen Program: 1_1_Create_raw_data_auditor_management Udtrækket Total_data_3 benyttes, igen placeret C:\Orbis_SAS_Data\0_Orbis_raw_data. Funktionalitet fra Orbis med samtlige udfyldte linjer virker desværre ikke. Derfor mangler der selskabsnavn og selskabsnummer ud for de linjer, hvor der er flere advisors eller flere personer i ledelsen. Derfor skabes via specialprogram disse linjer, så selskabsnummer og selskabsnavn altid er udfyldt. Ledelsesskift: Der antages et ledelsesskift, når en ny person er indtrådt i topledelsen i det givne år. Hvis ingen nyindtrædelser i topledelsen, betragtes dette som intet ledelsesskift. Hvis en person forlader ledelsen, er det ikke opfattet som et ledelsesskift (Orbis-databasen har ganske få observationer vedr. dato for ledelsesskift, hvorfor det ikke virker som et validt datafelt). Big4 auditor: Det antages, at Big4 er KPMG, PwC, Ernst & Young samt Deloitte. Der søges efter disse virksomhedsnavne i auditor -kolonnen. Det bemærkes, at Orbis-databasen kun indeholder den nuværende revisor, men ikke historiske data herom, så hvis et selskab i nogle af årene ikke har haft en Big4 auditor, er det ikke muligt at opdage dette. Derfor vil alle, som har Big4 auditor pt. (regnskabsår 2011) få en kode med Big4 auditor. Er et selskab gået væk fra at have Big4 i perioden, vil dette ligeledes ikke fremgå, men blot få kategoriseringen ikke-big4. Der er enkelte selskaber, som har flere revisorer fra Big4, men her behandles selskabet, som om selskabet blot har én Big4 revisor. Både tabeller for ledelsesskift og big4 auditor er blevet eksporteret til C:\Orbis_SAS_Data\1_SAS_cleaned_data som hhv. både.sas-tabeller og.xls-filer. IV

Step 3: Formål: Danne en SAS-tabel med transformerede winsorized data til regression Program: 2_Create_regres_data_all_incl_winsorization Der tages udgangspunkt i de rådata, som er skabt via SAS-programmet 1_Create_raw_data.egp. Først flyttes kolonner rundt, så det giver fornuftig mening. Derefter skabes kolonner med t-1 værdier for de relevante datatyper, så delta-variable kan beregnes. Specialprogram designet via open code i SAS-projektet for at beregne t-1 værdier. Efter deltavariable er beregnet, fjernes år 2005, så datasættet mindskes fra 20.188 til 17.304 observationer. Grunddata, som benyttes til variable i den modificerede Jones-model og Kothari-inspirerede modificerede Jones-model bliver behandlet med 98 % winsorization, hvilket vil sige, at værdier under 1. percentilen udskiftes med 1. percentilværdien, og værdier over 99. percentilen udskiftes med 99. percentilen. Makro til brug for winsorizing er inspireret af: http://www.unc.edu/~ballr/macros/winsorize_truncate.sas. Makroen kan ses på C:\Orbis_SAS_Data\SAS_macros\Winsorize.sas og benyttet i indeværende program for de relevante variable (regnskabsposter, som indgår i Jones model). Dernæst skabes de variable, som skal bruges i Jones-regressionen til generering af fejlled (de styrbare periodiseringer). Følgende variable er beregnet til den modificerede Jones-model: TA_ (Absolutte værdier) TA REV-REC PPE Alle er deflateret med Total Assets (t-1). Alle beregnede variable er kontrolleret med udgangspunkt i Vestas Wind Systems A/S for 2010 og 2011. Slutteligt er samtlige deskriptive statistikker på grunddata for hele perioden (2006-2011) samt pr. år både før og efter winsorization eksporteret til html-filer placeret i folderen C:\Orbis_SAS_Data\3_SAS_regression_output med præfiks Statistics*.html. Ved generering af beregnede variable smider SAS Enterprise Guide labels (beskrivelsen på kolonnen) væk. Derfor er der lavet et program, som genskriver disse. Fejlen i programmet er dokumenteret her: http://support.sas.com/kb/41/731.html V

Step 4: Formål: At skabe en tabel med dummy- og kontrolvariable til regression på fejlleddet (styrbare periodiseringer) fra den modificerede Jones-model. Program: 3_Create_dummy_and_control_variables_for_error_term_regressions Først genereres en tabel med stamdata. Herefter skabes følgende variable: X1 - X5: År 2006-2011: Tages ud fra Annual reporting year X6: Gæld / egenkapital Beregnes ud fra tidligere anvendte variable X7: Ledelsesskift Se specialprogram vedr. ledelsesskift og revisor X8: Profit omkring 0 Der tages +/- 0,5 % af omsætningen. Er profitten mindre end +0,5 % af omsætningen eller større end -0,5 % af omsætningen, er profitten omkring 0 X9: Negativ indtjening Profit før skat negativ eller 0 X10: Revisor Se specialprogram vedr. ledelsesskift og revisor X11: Markedsværdi Log-transformeret variabel af markedsværdien i mio. EUR X12: Retslig tilstand To retstraditioner common law (GB-IE) vs. code law X13: Vækst i omsætning Ændring i omsætning (år (t) minus sidste år (t-1)) / omsætning sidste år (t-1) Tabellen er herefter klar til at modtage fejlled fra modificeret Jones-model til brug for hypotese 3. VI

Step 5: Formål: At lave plots for at verificere en lineær sammenhæng mellem forklaret variabel og forklarende variable Program: 4_Assumptions_tests Der laves plots for 1. Modificeret Jones-model data (winsorized) for at sikre lineære sammenhænge mellem deflaterede totale periodiseringer og de forklarende variable (hypotese 1 + 2). 2. For incitamentsmodellen (hypotese 3) sikres den lineære sammenhæng mellem modellens kontinuerte variable for såvel perioden 2006-2007 som for 2008-2011 og de styrbare periodiseringer (det estimerede fejlled). VII

Step 6: Formål: At lave et program, som har alle regressioner til brug for afhandlingens hypotese 1-3 Program: 5_Regression_analysis_all Programmet er bygget op på baggrund af to tabeller: 1. Winsorized_Jones_data (fra step 3) 2. Alle incitaments- og kontrolvariable (benævnt X1-X13) til brug for regression på fejlled fra den modificerede Jones-model / den Kothari-inspirerede modificerede Jones-model (fra step 4) Så vidt muligt er alle forudsætningstests en del af output for de enkelte regressioner. F.s.v. angår plots m.v. henvises dog til programmet i forrige step. Beskrivelserne dækker programmet "oppefra og ned" Fuld model for perioden 2006-2011: Først er der på winsorized data lavet en modificeret Jones OLS-regression til brug for besvarelse af hypotese 1 omhandlende, hvorvidt der kan påvises resultatstyring i perioden 2006-2011. Det estimerede fejlled er gemt i en separat tabel, hvor der tilføjes incitaments- og kontrolvariable via nøglerne selskabsnummer og år samt laves deskriptiv statistik. Endelig køres fejlled imod samtlige incitaments- og kontrolvariable for at se, hvilke incitamenter, der kan forklare resultatstyringen i hele perioden. Ovenstående modificerede Jones-model estimeres også via OLS-regression per år. OLS laves ligeledes på den Kothari-inspirerede modificerede Jones-model med ROA for at sammenligne med grundmodellen. I afhandlingen argumenteres for, at der opdeles i perioder hhv. før og under finanskrisen. Perioden 2006-2007: Der tages udelukkende udgangspunkt i data for perioden 2006-2007. OLSregression som for hhv. hypotese 2 og hypotese 3, deskriptiv statistik på fejlleddet samt en baglæns trinvis eliminering af insignifikante variable. Perioden 2008-2011: Der tages udelukkende udgangspunkt i data for perioden 2008-2011. Dvs. OLS-regression for hhv. hypotese 2 og hypotese 3, deskriptiv statistik på fejlleddet samt en baglæns trinvis eliminering af insignifikante variable Da det viser sig, at der er problemer med heteroskedasticitet for regressioner vedr. hypotese 3, laves i bunden af programmet kørsel med heteroskedasticitet-konsistente statistikker for incitamentshypotesen for perioden 2006-2007 samt for perioden 2008-2011, og for den baglæns VIII

trinvise eliminering for perioden 2008-2011 estimeres endnu engang OLS-regression, denne gang med proc reg-proceduren med optionen "/white" 1. 1 White 1980 IX

Bilag 2: Søgekriterier i Orbis Product name Orbis Update number 100 Software version 127.00 Data update 01/06/2012 (n 10000) Username Aarhus Business School-6415 Export date 02/06/2012 Step result Search result 1. All active companies and companies with unknown situation 84,805,531 84,805,531 2. Accounting practice: IFRS (International Financial Reporting Standards) 3. World region/country/region in country: Eastern Europe, Western Europe 4. BvD major sectors: 01. Primary sector, 02. Food, beverages, tobacco, 03. Textiles, wearing apparel, leather, 04. Wood, cork, paper, 05. Publishing, printing, 06. Chemicals, rubber, plastics, non-metallic products, 07. Metals & metal products, 08. Machinery, equipment, furniture, recycling, 09. Gas, Water, Electricity, 10. Construction, 11. Wholesale & retail trade, 12. Hotels & restaurants, 13. Transport, 14. Post & telecommunications, 17. Other services, 19. Education, Health 1,267,002 1,179,047 54,175,965 1,165,818 79,896,021 1,151,195 5. Current assets: All companies with a known value, 2011, 2010, 2009, 2008, 2007, 2006, 2005, for all the selected periods 709,049 3,855 6. Cash & cash equivalent: All companies with a known value, 2011, 2010, 2009, 2008, 2007, 2006, 2005, for all the selected periods 550,483 3,396 7. Current liabilities: All companies with a known value, 2011, 2010, 2009, 2008, 2007, 2006, 2005, for all the selected periods 711,966 3,396 8. Depreciation & Amortization: All companies with a known value, 2011, 2010, 2009, 2008, 2007, 2006, 2005, for all the selected periods 274,184 2,959 9. Total assets: All companies with a known value, 2011, 2010, 2009, 2008, 2007, 2006, 2005, for all the selected periods 721,058 2,959 10. Tangible fixed assets: All companies with a known value, 2011, 2010, 2009, 2008, 2007, 2006, 2005, for all the selected periods 706,978 2,959 11. Operating revenue (Turnover): All companies with a known value, 2011, 2010, 2009, 2008, 2007, 2006, 2005, for all the selected periods 575,988 2,893 12. Debtors: All companies with a known value, 2011, 2010, 2009, 2008, 2007, 2006, 2005, for all the selected periods 656,129 2,888 13. P/L before tax: All companies with a known value, 2011, 2010, 2009, 2008, 2007, 2006, 2005, for all the selected periods 405,966 2,884 Boolean search : 1 And 2 And 3 And 4 And 5 And 6 And 7 And 8 And 9 And 10 And 11 And 12 And 13 TOTAL 2,884 X

Bilag 3: Dummy-variable for år Angående dummy-variable for årene gælder følgende: XI

Bilag 4: Modelkørsel på modificeret Jones-model pr. år i perioden 2006-2011 2006: 2007: XII

2008: 2009: XIII

2010: 2011: XIV

Bilag 5: Forudsætningstests for estimation af modificeret Jones-model Forudsætninger 2 : 1. Forholdet mellem den afhængige variabel (Y) og de uafhængige variable (X) er lineært og givet ved ligningen 2. X erne er ikke-stokastiske variable, og der er ikke nogen nøjagtigt lineær relation mellem to eller flere af de uafhængige variable, dvs. multicollinearitet må ikke være et problem 3. Fejlleddet har en forventet værdi på 0 for alle observationer 4. Fejlleddet har en konstant varians for alle observationer, dvs. homoskedasticitet skal være til stede 5. Fejlleddene tilhørende de forskellige observationer er uafhængige og derfor ukorrelerede 3, dvs. der må ikke være autokorrelation til stede 6. Fejlleddet er normalfordelt Forudsætning 1: Dette testes vha. scatter plots, hvor observationerne for de uafhængige variable afbilledes i plottet ift. den afhængige variabel, dvs. totale periodiseringer. 2 Pindyck & Rubinfeld 1998, p. 86 3 Pindyck & Rubinfeld 1998, p. 159 XV

Af ovenstående scatter plots ses en tydelig lineær sammenhæng mellem den afhængige variabel, deflaterede totale periodiseringer, og de forklarende variable hver for sig, dvs. hhv. deflateret invers total aktivsum fra foregående år, deflateret ændring i kontantsalg og deflaterede materielle anlægsaktiver. Forudsætning 2: XVI

Her ses på, hvorvidt nogen af X-variablene kan skrives som en funktion af de øvrige X-variable. Såfremt dette er tilfældet, er der direkte afhængighed mellem nogle af X-variablene, hvilket ville indikere multicollinearitet. I så fald kan det evt. afhjælpe problemet at pille en af disse variable ud af modellen. Alternativt kan variablene evt. kombineres eller transformeres. Det ses her, at ingen af de forklarende variable har Variance Inflation Factors (VIF) over 5, hvormed det kan konkluderes, at der ikke er tegn på multicollinearitet. Forudsætning 3: Det ses her, at fejlleddet har et gennemsnit på næsten 0, hvormed forudsætningen kan antages at være opfyldt. Histogram: Af histogrammet ses det desuden, at residualerne for observationerne samler sig pænt omkring 0 med en lille overvægt til plussiden, men alt i alt viser dette ligeledes, at det er rimeligt at antage, at forudsætningen om en forventet værdi for fejlleddet på 0 er opfyldt. Forudsætning 4: XVII

Forudsætningen om, at der skal være en konstant varians på fejlleddet for alle observationer, dvs. homoskedasticitet, testes her ved at foretage et 2 -test, hvor H 0 = 1 2 = 2 2 =... = n 2, hvor n er lig antallet af observationer (homoskedasticitet) og H 1 1 2 2 2 =... n 2 (heteroskedasticitet) 4. Da p-værdien på 0,5537 er større end α på 0,05, er der ikke belæg for at afvise H 0 med 95 % sikkerhed. Forudsætningen om homoskedasticitet må dermed antages at være opfyldt. Forudsætning 5: Denne forudsætning ses der ofte brud på ved tidsseriedata, idet fejlled forbundet med observationer i en given periode går videre over i kommende perioder 5. Et sådant brud kan bevirke, at OLSregressionens standardafvigelser angives mindre end de sande standardafvigelser og dermed skævvredet i nedadgående retning 6. I sidste ende fører det til, at estimationens parameterestimater vises som mere præcise end de reelt er, hvormed der vil være en øget fejlagtig tendens til at afvise H 0 -hypotesen, selvom den måske ikke burde afvises 7. Durbin Watson-testet anvendes her til at teste for, om fejlleddene er ukorrelerede 8. Idet Durbin Watson-statistikken her er på 1,923 og dermed under 2, indikerer dette en lidt positiv seriel 4 Pindyck & Rubinfeld 1998, pp. 152-159 5 Pindyck & Rubinfeld 1998, p. 159 6 Pindyck & Rubinfeld 1998, p. 159 7 Pindyck & Rubinfeld 1998, p. 159 8 Pindyck & Rubinfeld 1998, p. 164 XVIII

korrelation. Da tallet dog er meget tæt på 2, kan det dog tilnærmelsesvist konkluderes, at der ikke er seriel korrelation til stede mellem fejlleddene 9. Forudsætning 6: Hvorvidt fejlleddet er normalfordelt kan testes vha. et histogram, hvor residualfordelingen sættes over for normalfordelingen. Pga. langt flere end 100 observationer i stikprøven anses denne forudsætning for opfyldt 10. Denne antagelse bestyrkes endvidere af, at der i datasættet er foretaget winsorization, hvormed evt. outliers er blevet korrigeret. 9 Pindyck & Rubinfeld 1998, p. 165 10 Florida State University 2011 XIX

Bilag 6: Modelkørsel på modificeret Jones-model på grupperede perioder (2006-2007 hhv. 2008-2011) XX

Bilag 7: Forudsætningstests på incitamentsvariable Nedenstående forudsætninger testes for modellerne for test på incitamentsvariablene for såvel perioden 2006-2007 som perioden 2008-2011. Forudsætninger 11 : 1. Forholdet mellem den afhængige variabel (Y) og de uafhængige variable (X) er lineært og givet ved ligningen 2. X erne er ikke-stokastiske variable, og der er ikke nogen nøjagtigt lineær relation mellem to eller flere af de uafhængige variable, dvs. multicollinearitet må ikke være et problem 3. Fejlleddet har en forventet værdi på 0 for alle observationer 4. Fejlleddet har en konstant varians for alle observationer, dvs. homoskedasticitet skal være til stede 5. Fejlleddene tilhørende de forskellige observationer er uafhængige og derfor ukorrelerede 12, dvs. der må ikke være autokorrelation til stede 6. Fejlleddet er normalfordelt 11 Pindyck & Rubinfeld 1998, p. 86 12 Pindyck & Rubinfeld 1998, p. 159 XXI

Test for perioden 2006-2007 Forudsætning 1: Dette testes vha. scatter plots, hvor observationerne for de uafhængige variable afbilledes i plottet ift. den afhængige variabel, dvs. de styrbare periodiseringer deflateret med total aktivsum fra det foregående år. Dog afbilledes dummy-variablene ikke i scatter plots, idet de kun kan antage værdierne 0 og 1. XXII

Af ovenstående scatter plots ses en tydelig lineær sammenhæng mellem den afhængige variabel, deflaterede styrbare periodiseringer, og de forklarende variable hver for sig, dvs. hhv. gældsratioen, logaritmen til markedsværdien ultimo året og salgsvækst. Forudsætning 2: Her ses på, hvorvidt nogen af X-variablene kan skrives som en funktion af de øvrige X-variable. Såfremt dette er tilfældet, er der direkte afhængighed mellem nogle af X-variablene, hvilket ville XXIII

indikere multicollinearitet. I så fald kan det evt. afhjælpe problemet at pille en af disse variable ud af modellen. Alternativt kan variablene evt. kombineres eller transformeres. Det ses her, at ingen af de forklarende variable har Variance Inflation Factors (VIF) over 5, hvormed det kan konkluderes, at der ikke er tegn på multicollinearitet. Forudsætning 3: Det ses her, at fejlleddet har et gennemsnit på næsten 0, hvormed forudsætningen kan antages at være opfyldt. Histogram: Af histogrammet ses det desuden, at residualerne for observationerne samler sig pænt omkring 0 med en lille overvægt til minussiden, men alt i alt viser dette ligeledes, at det er rimeligt at antage, at forudsætningen om en forventet værdi for fejlleddet på 0 er opfyldt. Forudsætning 4: XXIV

Forudsætningen om, at der skal være en konstant varians på fejlleddet for alle observationer, dvs. homoskedasticitet, testes her ved at foretage et 2 -test, hvor H 0 = 1 2 = 2 2 =... = n 2, hvor n er lig antallet af observationer (homoskedasticitet) og H 1 1 2 2 2 =... n 2 (heteroskedasticitet) 13. Da p-værdien på 0,0005 er mindre end α på 0,05, forkastes H 0 med 95 % sikkerhed. Forudsætningen om homoskedasticitet kan dermed ikke antages at være opfyldt. Forudsætning 5: Denne forudsætning ses der ofte brud på ved tidsseriedata, idet fejlled forbundet med observationer i en given periode går videre over i kommende perioder 14. Et sådant brud kan bevirke, at OLSregressionens standardafvigelser angives mindre end de sande standardafvigelser og dermed skævvredet i nedadgående retning 15. I sidste ende fører det til, at estimationens parameterestimater vises som mere præcise end de reelt er, hvormed der vil være en øget fejlagtig tendens til at afvise H 0 -hypotesen, selvom den måske ikke burde afvises 16. Durbin Watson-testet anvendes her til at teste for, om fejlleddene er ukorrelerede 17. Idet Durbin Watson-statistikken her er på 1,713 og dermed under 2, indikerer dette en lidt positiv seriel korrelation. Da tallet dog er forholdsvist tæt på 2, kan det dog tilnærmelsesvist konkluderes, at der ikke er seriel korrelation til stede mellem fejlleddene 18. Forudsætning 6: Hvorvidt fejlleddet er normalfordelt kan testes vha. et histogram, hvor residualfordelingen sættes over for normalfordelingen. Pga. langt flere end 100 observationer i stikprøven anses denne forudsætning for opfyldt 19. 13 Pindyck & Rubinfeld 1998, pp. 152-159 14 Pindyck & Rubinfeld 1998, p. 159 15 Pindyck & Rubinfeld 1998, p. 159 16 Pindyck & Rubinfeld 1998, p. 159 17 Pindyck & Rubinfeld 1998, p. 164 18 Pindyck & Rubinfeld 1998, p. 165 19 Florida State University 2011 XXV

Test for perioden 2008-2011 Forudsætning 1: Dette testes vha. scatter plots, hvor observationerne for de uafhængige variable afbilledes i plottet ift. den afhængige variabel, dvs. de styrbare periodiseringer deflateret med total aktivsum fra det foregående år. Dog afbilledes dummy-variablene ikke i scatter plots, idet de kun kan antage værdierne 0 og 1. XXVI

Af ovenstående scatter plots ses en lineær sammenhæng mellem den afhængige variabel, deflaterede styrbare periodiseringer, og de forklarende variable hver for sig, dvs. hhv. gældsratioen, logaritmen til markedsværdien ultimo året og salgsvækst. Forudsætning 2: XXVII

Her ses på, hvorvidt nogen af X-variablene kan skrives som en funktion af de øvrige X-variable. Såfremt dette er tilfældet, er der direkte afhængighed mellem nogle af X-variablene, hvilket ville indikere multicollinearitet. I så fald kan det evt. afhjælpe problemet at pille en af disse variable ud af modellen. Alternativt kan variablene evt. kombineres eller transformeres. Det ses her, at ingen af de forklarende variable har Variance Inflation Factors (VIF) over 5, hvormed det kan konkluderes, at der ikke er tegn på multicollinearitet. Forudsætning 3: Det ses her, at fejlleddet har et gennemsnit meget tæt på 0, hvormed forudsætningen kan antages at være opfyldt. Histogram: Af histogrammet ses det desuden, at residualerne for observationerne samler sig pænt omkring 0 med en lille overvægt til minussiden, men alt i alt viser dette ligeledes, at det er rimeligt at antage, at forudsætningen om en forventet værdi for fejlleddet på 0 er opfyldt. Forudsætning 4: XXVIII

Forudsætningen om, at der skal være en konstant varians på fejlleddet for alle observationer, dvs. homoskedasticitet, testes her ved at foretage et 2 -test, hvor H 0 = 1 2 = 2 2 =... = n 2, hvor n er lig antallet af observationer (homoskedasticitet) og H 1 1 2 2 2 =... n 2 (heteroskedasticitet) 20. Da p-værdien på under 0,0001 er meget mindre end α på 0,05, forkastes H 0 med 95 % sikkerhed. Forudsætningen om homoskedasticitet kan dermed ikke antages at være opfyldt. Forudsætning 5: Denne forudsætning ses der ofte brud på ved tidsseriedata, idet fejlled forbundet med observationer i en given periode går videre over i kommende perioder 21. Et sådant brud kan bevirke, at OLSregressionens standardafvigelser angives mindre end de sande standardafvigelser og dermed skævvredet i nedadgående retning 22. I sidste ende fører det til, at estimationens parameterestimater vises som mere præcise end de reelt er, hvormed der vil være en øget fejlagtig tendens til at afvise H 0 -hypotesen, selvom den måske ikke burde afvises 23. Durbin Watson-testet anvendes her til at teste for, om fejlleddene er ukorrelerede 24. Idet Durbin Watson-statistikken her er på 1,997, kan dette konkluderes at være så tæt på 2, at der ikke er seriel korrelation af betydning til stede mellem fejlleddene. Dog er tallet lidt lavere end 2, hvilket indikerer en lidt positiv korrelation 25. Forudsætning 6: 20 Pindyck & Rubinfeld 1998, pp. 152-159 21 Pindyck & Rubinfeld 1998, p. 159 22 Pindyck & Rubinfeld 1998, p. 159 23 Pindyck & Rubinfeld 1998, p. 159 24 Pindyck & Rubinfeld 1998, p. 164 25 Pindyck & Rubinfeld 1998, p. 165 XXIX

Hvorvidt fejlleddet er normalfordelt kan testes vha. et histogram, hvor residualfordelingen sættes over for normalfordelingen. Pga. langt flere end 100 observationer i stikprøven anses denne forudsætning for opfyldt 26. 26 Florida State University 2011 XXX

Bilag 8: Forudsætningstests på endelig baglæns optrevlet model 2006-2007 Nedenstående forudsætninger testes her for den endelige model til test på incitamentsvariable for perioden 2006-2007 efter trinvis eliminering af insignifikante variable. Dog testes kun de forudsætninger, hvis opfyldelse kan have ændret sig efter optrevlingen. Forudsætninger 27 : 1. Forholdet mellem den afhængige variabel (Y) og de uafhængige variable (X) er lineært og givet ved ligningen 2. X erne er ikke-stokastiske variable, og der er ikke nogen nøjagtigt lineær relation mellem to eller flere af de uafhængige variable, dvs. multicollinearitet må ikke være et problem 3. Fejlleddet har en forventet værdi på 0 for alle observationer 4. Fejlleddet har en konstant varians for alle observationer, dvs. homoskedasticitet skal være til stede 5. Fejlleddene tilhørende de forskellige observationer er uafhængige og derfor ukorrelerede 28, dvs. der må ikke være autokorrelation til stede 6. Fejlleddet er normalfordelt Forudsætning 1: Se under bilag 7 Forudsætning 2: 27 Pindyck & Rubinfeld 1998, p. 86 28 Pindyck & Rubinfeld 1998, p. 159 XXXI

Her ses på, hvorvidt nogen af X-variablene kan skrives som en funktion af de øvrige X-variable. Såfremt dette er tilfældet, er der direkte afhængighed mellem nogle af X-variablene, hvilket ville indikere multicollinearitet. I så fald kan det evt. afhjælpe problemet at pille en af disse variable ud af modellen. Alternativt kan variablene evt. kombineres eller transformeres. Det ses her, at ingen af de forklarende variable har Variance Inflation Factors (VIF) over 5, hvormed det kan konkluderes, at der ikke er tegn på multicollinearitet. Forudsætning 3: Det ses her, at fejlleddet har et gennemsnit meget tæt på 0, hvormed forudsætningen kan antages at være opfyldt. Histogram: Af histogrammet ses det desuden, at residualerne for observationerne samler sig pænt omkring 0 med en lille overvægt til minussiden, men alt i alt viser dette ligeledes, at det er rimeligt at antage, at forudsætningen om en forventet værdi for fejlleddet på 0 er opfyldt. Forudsætning 4: XXXII

Forudsætningen om, at der skal være en konstant varians på fejlleddet for alle observationer, dvs. homoskedasticitet, testes her ved at foretage et 2 -test, hvor H 0 = 1 2 = 2 2 =... = n 2, hvor n er lig antallet af observationer (homoskedasticitet) og H 1 1 2 2 2 =... n 2 (heteroskedasticitet) 29. Da p-værdien er større end α på 0,05, fastholdes H 0 med 95 % sikkerhed. Forudsætningen om homoskedasticitet kan dermed antages at være opfyldt. I den endelige model er der altså ikke længere tale om brud på denne forudsætning for perioden 2006-2007. Forudsætning 5: Se under bilag 7 Forudsætning 6: Hvorvidt fejlleddet er normalfordelt kan testes vha. et histogram, hvor residualfordelingen sættes over for normalfordelingen. Pga. langt flere end 100 observationer i stikprøven anses denne forudsætning for opfyldt 30. 29 Pindyck & Rubinfeld 1998, pp. 152-159 30 Florida State University 2011 XXXIII

Bilag 9: Forudsætningstests på endelig baglæns optrevlet model 2008-2011 Nedenstående forudsætninger testes her for den endelige model til test på incitamentsvariable for perioden 2008-2011 (finanskriseperioden) efter trinvis eliminering af insignifikante variable. Dog testes kun de forudsætninger, hvis opfyldelse kan have ændret sig efter optrevlingen. Forudsætninger 31 : 1. Forholdet mellem den afhængige variabel (Y) og de uafhængige variable (X) er lineært og givet ved ligningen 2. X erne er ikke-stokastiske variable, og der er ikke nogen nøjagtigt lineær relation mellem to eller flere af de uafhængige variable, dvs. multicollinearitet må ikke være et problem 3. Fejlleddet har en forventet værdi på 0 for alle observationer 4. Fejlleddet har en konstant varians for alle observationer, dvs. homoskedasticitet skal være til stede 5. Fejlleddene tilhørende de forskellige observationer er uafhængige og derfor ukorrelerede 32, dvs. der må ikke være autokorrelation til stede 6. Fejlleddet er normalfordelt Forudsætning 1: Se under bilag 7 Forudsætning 2: 31 Pindyck & Rubinfeld 1998, p. 86 32 Pindyck & Rubinfeld 1998, p. 159 XXXIV

Her ses på, hvorvidt nogen af X-variablene kan skrives som en funktion af de øvrige X-variable. Såfremt dette er tilfældet, er der direkte afhængighed mellem nogle af X-variablene, hvilket ville indikere multicollinearitet. I så fald kan det evt. afhjælpe problemet at pille en af disse variable ud af modellen. Alternativt kan variablene evt. kombineres eller transformeres. Det ses her, at ingen af de forklarende variable har Variance Inflation Factors (VIF) over 5, hvormed det kan konkluderes, at der ikke er tegn på multicollinearitet. Forudsætning 3: Det ses her, at fejlleddet har et gennemsnit meget tæt på 0, hvormed forudsætningen kan antages at være opfyldt. Histogram: Af histogrammet ses det desuden, at residualerne for observationerne samler sig pænt omkring 0, hvorfor det er rimeligt at antage, at forudsætningen om en forventet værdi for fejlleddet på 0 er opfyldt. Forudsætning 4: XXXV

Forudsætningen om, at der skal være en konstant varians på fejlleddet for alle observationer, dvs. homoskedasticitet, testes her ved at foretage et 2 -test, hvor H 0 = 1 2 = 2 2 =... = n 2, hvor n er lig antallet af observationer (homoskedasticitet) og H 1 1 2 2 2 =... n 2 (heteroskedasticitet) 33. Da p-værdien er meget mindre end α på 0,05, forkastes H 0 med 95 % sikkerhed. Forudsætningen om homoskedasticitet kan dermed ikke antages at være opfyldt. Derfor anvendes heteroskedasticitetkonsistente standardfejl (HCSE) 34 til at korrigere herfor, og konklusionerne på testresultaterne for perioden 2008-2011 baseres på de nye t-statistikker og det nye F-test etc. Forudsætning 5: Denne forudsætning ses der ofte brud på ved tidsseriedata, idet fejlled forbundet med observationer i en given periode så går videre over i kommende perioder 35. Et sådant brud kan bevirke, at OLSregressionens standardafvigelser angives mindre end de sande standardafvigelser og dermed skævvredet i nedadgående retning 36. I sidste ende fører det til, at estimationens parameterestimater vises som mere præcise end de reelt er, hvormed der vil være en øget fejlagtig tendens til at afvise H 0 -hypotesen, selvom den måske ikke burde afvises 37. Durbin Watson-testet anvendes her til at teste for, om fejlleddene er ukorrelerede 38. Idet Durbin Watson-statistikken her er på 1,998, kan dette konkluderes at være så tæt på 2, at der ikke er seriel korrelation af betydning til stede mellem fejlleddene. Dog er tallet lidt lavere end 2, hvilket indikerer en lidt positiv korrelation 39. 33 Pindyck & Rubinfeld 1998, pp. 152-159 34 Bauwhede 2001, pp. 230-231 + Dai 2007, p. 359, note 5 + p. 361, note 6 + White 1980 35 Pindyck & Rubinfeld 1998, p. 159 36 Pindyck & Rubinfeld 1998, p. 159 37 Pindyck & Rubinfeld 1998, p. 159 38 Pindyck & Rubinfeld 1998, p. 164 39 Pindyck & Rubinfeld 1998, p. 165 XXXVI

Forudsætning 6: Hvorvidt fejlleddet er normalfordelt kan testes vha. et histogram, hvor residualfordelingen sættes over for normalfordelingen. Pga. langt flere end 100 observationer i stikprøven anses denne forudsætning for opfyldt 40. 40 Florida State University 2011 XXXVII

Bilag 10: Modelkørsel på incitamentsmodel 2006-2007 XXXVIII

Bilag 11: Modelkørsel på incitamentsmodel 2008-2011 XXXIX

Bilag 12: Antal selskaber pr. land i stikprøven XL