Generel illustration af SAS Enterprise Guide projekt:

Transkript

1 Bilagsoversigt: Bilag 1: Dokumentation af data og data flow i SAS Enterprise Guide... II Bilag 2: Søgekriterier i Orbis... X Bilag 3: Dummy-variable for år... XI Bilag 4: Modelkørsel på modificeret Jones-model pr. år i perioden XII Bilag 5: Forudsætningstests for estimation af modificeret Jones-model... XV Bilag 6: Modelkørsel på modificeret Jones-model på grupperede perioder ( hhv )... XX Bilag 7: Forudsætningstests på incitamentsvariable... XXI Bilag 8: Forudsætningstests på endelig baglæns optrevlet model XXXI Bilag 9: Forudsætningstests på endelig baglæns optrevlet model XXXIV Bilag 10: Modelkørsel på incitamentsmodel XXXVIII Bilag 11: Modelkørsel på incitamentsmodel XXXIX Bilag 12: Antal selskaber pr. land i stikprøven... XL I

2 Bilag 1: Dokumentation af data og data flow i SAS Enterprise Guide For at eksekvere SAS-programmerne bag denne afhandling, behøves der blot en lokal installation af SAS Enterprise Guide v. 4.3 med fuld SAS Foundation 9.3 samt fuld SAS STAT licens. Kopiér folderen <CD-ROM-DREV>\Orbis_SAS_data fra vedlagte CD-ROM til computerens C: drev. Gå derefter til folderen C:\Orbis_SAS_Data\SAS_programs og udvælg de relevante programmer. Programmerne er nummererede i kronologisk rækkefølge. Alle væsentlige datasæt er eksporteret både som SAS-tabeller og Excel-filer, ligesom outputs fra deskriptive statistikker og regressioner er placeret naturligt i foldere som html-filer. I nedenstående gennemgang er folder- og filnavne endvidere præsenteret. SAS Enterprise Guide er et intuitivt peg- og klik-værktøj, som betyder, at langt de fleste operationer i systemet kan klares uden programmørviden. Det har dog været nødvendigt at indsætte rigtig SAS-kode i Enterprise Guide-projekterne, da ikke alt i indeværende kunne løses via standardfunktionalitet. Da SAS Enterprise Guide kører på en del af SAS Foundation, er der mulighed for at eksekvere samtlige SAS-procedurer i Enterprise Guide, hvorved der ikke er nogen begrænsninger i SAS Enterprise Guide, hvorfor bl.a. hele SAS STAT pakken er til rådighed. Det har været nødvendigt at udvikle ekstra kode til håndtering af labels (kolonnebeskrivelser efter datatransformationer), til winsorizing af variable samt til regressioner med heteroskedasticitetkonsistente standardafvigelser. SAS Enterprise Guide-pogrammerne er placeret i folderen: <CD-ROM-DREV>\Orbis_SAS_Data\SAS_programs med filtype.egp. Det er kun muligt at åbne programmerne med en installeret SAS Enterprise Guide version 4.3. Generel illustration af SAS Enterprise Guide projekt: II

3 Step 1: Formål: Generering af en datatabel indeholdende alle finansielle data til kørsel af Jones-modeller Program: 1_Create_raw_data Efter udtræk fra Orbis databasen, er data hentet til i alt 3.txt-filer. Orbis har en begrænsning på antallet af kolonner, der kan eksporteres, hvorfor der er eksporteret to filer; nemlig Total_data_1 og Total_data_2, som er placeret på C:\Orbis_SAS_Data\0_Orbis_raw_data. Disse filer er sammensat ud fra den unikke selskabskode. Antallet af selskaber i udtrækket er For Orbis filtervalg, se venligst udtræksstrategien fra Orbis C:\Orbis_SAS_Data\0_Orbis_raw_data i filen Search_criteria.xlsx samt beskrivelsen af valgene i afhandlingen eller evt. bilag 2. Orbis-udtrækket pr. datatype (fx total assets) pr. år er kolonner, og det ønskes at sammenflette 7 kolonner til én (år fra 2005 til 2011). Dette gøres ved at transponere alle numeriske kolonner til en værdi-kolonne. Herefter benyttes det, at beskrivelsen på alle kolonner pr. datatype er konsistent, nemlig '[Total assets] th EUR 2011', hvor [XXXX] er pr. år, th er tusinder, [XXXXXX] er datatypen. Denne beskrivelse deles i to, dvs. en year-kolonne indeholdende [XXXX] og en variabel-kolonne indeholdende '[XXXXXX] th eur'. Herved kan data transponeres endnu engang, denne gang ved at få hver datatype (regnskabspost) tilbage på kolonnerne, dog for alle år pr. datatype. Tabellen indeholder nu observationer (2.884 selskaber * 7 år) pga. datatransponeringen. Rådata fra kørslen er blevet eksporteret både som SAS-tabel og som xls-fil ( ) i folderen C:\Orbis_SAS_data\SAS_cleaned_data. Se fil transposed_raw_data.sas7bdat og transposed_raw_data.xls. Endelig er samtlige data for Vestas Wind Systems A/S (DK ) blevet kontrolleret for datavaliditet for 2011 og Alle de behandlede data er korrekte for Vestas Wind Systems A/S - både mht. reliabilitet (indeholder Orbis-databasen korrekte tal?) og fuldstændighed (er alle de korrekte regnskabsposter blevet trukket ud?). III

4 Step 2: Formål: At skabe en tabel, så det vides, om selskaberne bruger hhv. big4-revisor, og om der har været skift i ledelsen Program: 1_1_Create_raw_data_auditor_management Udtrækket Total_data_3 benyttes, igen placeret C:\Orbis_SAS_Data\0_Orbis_raw_data. Funktionalitet fra Orbis med samtlige udfyldte linjer virker desværre ikke. Derfor mangler der selskabsnavn og selskabsnummer ud for de linjer, hvor der er flere advisors eller flere personer i ledelsen. Derfor skabes via specialprogram disse linjer, så selskabsnummer og selskabsnavn altid er udfyldt. Ledelsesskift: Der antages et ledelsesskift, når en ny person er indtrådt i topledelsen i det givne år. Hvis ingen nyindtrædelser i topledelsen, betragtes dette som intet ledelsesskift. Hvis en person forlader ledelsen, er det ikke opfattet som et ledelsesskift (Orbis-databasen har ganske få observationer vedr. dato for ledelsesskift, hvorfor det ikke virker som et validt datafelt). Big4 auditor: Det antages, at Big4 er KPMG, PwC, Ernst & Young samt Deloitte. Der søges efter disse virksomhedsnavne i auditor -kolonnen. Det bemærkes, at Orbis-databasen kun indeholder den nuværende revisor, men ikke historiske data herom, så hvis et selskab i nogle af årene ikke har haft en Big4 auditor, er det ikke muligt at opdage dette. Derfor vil alle, som har Big4 auditor pt. (regnskabsår 2011) få en kode med Big4 auditor. Er et selskab gået væk fra at have Big4 i perioden, vil dette ligeledes ikke fremgå, men blot få kategoriseringen ikke-big4. Der er enkelte selskaber, som har flere revisorer fra Big4, men her behandles selskabet, som om selskabet blot har én Big4 revisor. Både tabeller for ledelsesskift og big4 auditor er blevet eksporteret til C:\Orbis_SAS_Data\1_SAS_cleaned_data som hhv. både.sas-tabeller og.xls-filer. IV

5 Step 3: Formål: Danne en SAS-tabel med transformerede winsorized data til regression Program: 2_Create_regres_data_all_incl_winsorization Der tages udgangspunkt i de rådata, som er skabt via SAS-programmet 1_Create_raw_data.egp. Først flyttes kolonner rundt, så det giver fornuftig mening. Derefter skabes kolonner med t-1 værdier for de relevante datatyper, så delta-variable kan beregnes. Specialprogram designet via open code i SAS-projektet for at beregne t-1 værdier. Efter deltavariable er beregnet, fjernes år 2005, så datasættet mindskes fra til observationer. Grunddata, som benyttes til variable i den modificerede Jones-model og Kothari-inspirerede modificerede Jones-model bliver behandlet med 98 % winsorization, hvilket vil sige, at værdier under 1. percentilen udskiftes med 1. percentilværdien, og værdier over 99. percentilen udskiftes med 99. percentilen. Makro til brug for winsorizing er inspireret af: Makroen kan ses på C:\Orbis_SAS_Data\SAS_macros\Winsorize.sas og benyttet i indeværende program for de relevante variable (regnskabsposter, som indgår i Jones model). Dernæst skabes de variable, som skal bruges i Jones-regressionen til generering af fejlled (de styrbare periodiseringer). Følgende variable er beregnet til den modificerede Jones-model: TA_ (Absolutte værdier) TA REV-REC PPE Alle er deflateret med Total Assets (t-1). Alle beregnede variable er kontrolleret med udgangspunkt i Vestas Wind Systems A/S for 2010 og Slutteligt er samtlige deskriptive statistikker på grunddata for hele perioden ( ) samt pr. år både før og efter winsorization eksporteret til html-filer placeret i folderen C:\Orbis_SAS_Data\3_SAS_regression_output med præfiks Statistics*.html. Ved generering af beregnede variable smider SAS Enterprise Guide labels (beskrivelsen på kolonnen) væk. Derfor er der lavet et program, som genskriver disse. Fejlen i programmet er dokumenteret her: V

6 Step 4: Formål: At skabe en tabel med dummy- og kontrolvariable til regression på fejlleddet (styrbare periodiseringer) fra den modificerede Jones-model. Program: 3_Create_dummy_and_control_variables_for_error_term_regressions Først genereres en tabel med stamdata. Herefter skabes følgende variable: X1 - X5: År : Tages ud fra Annual reporting year X6: Gæld / egenkapital Beregnes ud fra tidligere anvendte variable X7: Ledelsesskift Se specialprogram vedr. ledelsesskift og revisor X8: Profit omkring 0 Der tages +/- 0,5 % af omsætningen. Er profitten mindre end +0,5 % af omsætningen eller større end -0,5 % af omsætningen, er profitten omkring 0 X9: Negativ indtjening Profit før skat negativ eller 0 X10: Revisor Se specialprogram vedr. ledelsesskift og revisor X11: Markedsværdi Log-transformeret variabel af markedsværdien i mio. EUR X12: Retslig tilstand To retstraditioner common law (GB-IE) vs. code law X13: Vækst i omsætning Ændring i omsætning (år (t) minus sidste år (t-1)) / omsætning sidste år (t-1) Tabellen er herefter klar til at modtage fejlled fra modificeret Jones-model til brug for hypotese 3. VI

7 Step 5: Formål: At lave plots for at verificere en lineær sammenhæng mellem forklaret variabel og forklarende variable Program: 4_Assumptions_tests Der laves plots for 1. Modificeret Jones-model data (winsorized) for at sikre lineære sammenhænge mellem deflaterede totale periodiseringer og de forklarende variable (hypotese 1 + 2). 2. For incitamentsmodellen (hypotese 3) sikres den lineære sammenhæng mellem modellens kontinuerte variable for såvel perioden som for og de styrbare periodiseringer (det estimerede fejlled). VII

8 Step 6: Formål: At lave et program, som har alle regressioner til brug for afhandlingens hypotese 1-3 Program: 5_Regression_analysis_all Programmet er bygget op på baggrund af to tabeller: 1. Winsorized_Jones_data (fra step 3) 2. Alle incitaments- og kontrolvariable (benævnt X1-X13) til brug for regression på fejlled fra den modificerede Jones-model / den Kothari-inspirerede modificerede Jones-model (fra step 4) Så vidt muligt er alle forudsætningstests en del af output for de enkelte regressioner. F.s.v. angår plots m.v. henvises dog til programmet i forrige step. Beskrivelserne dækker programmet "oppefra og ned" Fuld model for perioden : Først er der på winsorized data lavet en modificeret Jones OLS-regression til brug for besvarelse af hypotese 1 omhandlende, hvorvidt der kan påvises resultatstyring i perioden Det estimerede fejlled er gemt i en separat tabel, hvor der tilføjes incitaments- og kontrolvariable via nøglerne selskabsnummer og år samt laves deskriptiv statistik. Endelig køres fejlled imod samtlige incitaments- og kontrolvariable for at se, hvilke incitamenter, der kan forklare resultatstyringen i hele perioden. Ovenstående modificerede Jones-model estimeres også via OLS-regression per år. OLS laves ligeledes på den Kothari-inspirerede modificerede Jones-model med ROA for at sammenligne med grundmodellen. I afhandlingen argumenteres for, at der opdeles i perioder hhv. før og under finanskrisen. Perioden : Der tages udelukkende udgangspunkt i data for perioden OLSregression som for hhv. hypotese 2 og hypotese 3, deskriptiv statistik på fejlleddet samt en baglæns trinvis eliminering af insignifikante variable. Perioden : Der tages udelukkende udgangspunkt i data for perioden Dvs. OLS-regression for hhv. hypotese 2 og hypotese 3, deskriptiv statistik på fejlleddet samt en baglæns trinvis eliminering af insignifikante variable Da det viser sig, at der er problemer med heteroskedasticitet for regressioner vedr. hypotese 3, laves i bunden af programmet kørsel med heteroskedasticitet-konsistente statistikker for incitamentshypotesen for perioden samt for perioden , og for den baglæns VIII

9 trinvise eliminering for perioden estimeres endnu engang OLS-regression, denne gang med proc reg-proceduren med optionen "/white" 1. 1 White 1980 IX

10 Bilag 2: Søgekriterier i Orbis Product name Orbis Update number 100 Software version Data update 01/06/2012 (n 10000) Username Aarhus Business School-6415 Export date 02/06/2012 Step result Search result 1. All active companies and companies with unknown situation 84,805,531 84,805, Accounting practice: IFRS (International Financial Reporting Standards) 3. World region/country/region in country: Eastern Europe, Western Europe 4. BvD major sectors: 01. Primary sector, 02. Food, beverages, tobacco, 03. Textiles, wearing apparel, leather, 04. Wood, cork, paper, 05. Publishing, printing, 06. Chemicals, rubber, plastics, non-metallic products, 07. Metals & metal products, 08. Machinery, equipment, furniture, recycling, 09. Gas, Water, Electricity, 10. Construction, 11. Wholesale & retail trade, 12. Hotels & restaurants, 13. Transport, 14. Post & telecommunications, 17. Other services, 19. Education, Health 1,267,002 1,179,047 54,175,965 1,165,818 79,896,021 1,151, Current assets: All companies with a known value, 2011, 2010, 2009, 2008, 2007, 2006, 2005, for all the selected periods 709,049 3, Cash & cash equivalent: All companies with a known value, 2011, 2010, 2009, 2008, 2007, 2006, 2005, for all the selected periods 550,483 3, Current liabilities: All companies with a known value, 2011, 2010, 2009, 2008, 2007, 2006, 2005, for all the selected periods 711,966 3, Depreciation & Amortization: All companies with a known value, 2011, 2010, 2009, 2008, 2007, 2006, 2005, for all the selected periods 274,184 2, Total assets: All companies with a known value, 2011, 2010, 2009, 2008, 2007, 2006, 2005, for all the selected periods 721,058 2, Tangible fixed assets: All companies with a known value, 2011, 2010, 2009, 2008, 2007, 2006, 2005, for all the selected periods 706,978 2, Operating revenue (Turnover): All companies with a known value, 2011, 2010, 2009, 2008, 2007, 2006, 2005, for all the selected periods 575,988 2, Debtors: All companies with a known value, 2011, 2010, 2009, 2008, 2007, 2006, 2005, for all the selected periods 656,129 2, P/L before tax: All companies with a known value, 2011, 2010, 2009, 2008, 2007, 2006, 2005, for all the selected periods 405,966 2,884 Boolean search : 1 And 2 And 3 And 4 And 5 And 6 And 7 And 8 And 9 And 10 And 11 And 12 And 13 TOTAL 2,884 X

11 Bilag 3: Dummy-variable for år Angående dummy-variable for årene gælder følgende: XI

12 Bilag 4: Modelkørsel på modificeret Jones-model pr. år i perioden : 2007: XII

13 2008: 2009: XIII

14 2010: 2011: XIV

15 Bilag 5: Forudsætningstests for estimation af modificeret Jones-model Forudsætninger 2 : 1. Forholdet mellem den afhængige variabel (Y) og de uafhængige variable (X) er lineært og givet ved ligningen 2. X erne er ikke-stokastiske variable, og der er ikke nogen nøjagtigt lineær relation mellem to eller flere af de uafhængige variable, dvs. multicollinearitet må ikke være et problem 3. Fejlleddet har en forventet værdi på 0 for alle observationer 4. Fejlleddet har en konstant varians for alle observationer, dvs. homoskedasticitet skal være til stede 5. Fejlleddene tilhørende de forskellige observationer er uafhængige og derfor ukorrelerede 3, dvs. der må ikke være autokorrelation til stede 6. Fejlleddet er normalfordelt Forudsætning 1: Dette testes vha. scatter plots, hvor observationerne for de uafhængige variable afbilledes i plottet ift. den afhængige variabel, dvs. totale periodiseringer. 2 Pindyck & Rubinfeld 1998, p Pindyck & Rubinfeld 1998, p. 159 XV

16 Af ovenstående scatter plots ses en tydelig lineær sammenhæng mellem den afhængige variabel, deflaterede totale periodiseringer, og de forklarende variable hver for sig, dvs. hhv. deflateret invers total aktivsum fra foregående år, deflateret ændring i kontantsalg og deflaterede materielle anlægsaktiver. Forudsætning 2: XVI

17 Her ses på, hvorvidt nogen af X-variablene kan skrives som en funktion af de øvrige X-variable. Såfremt dette er tilfældet, er der direkte afhængighed mellem nogle af X-variablene, hvilket ville indikere multicollinearitet. I så fald kan det evt. afhjælpe problemet at pille en af disse variable ud af modellen. Alternativt kan variablene evt. kombineres eller transformeres. Det ses her, at ingen af de forklarende variable har Variance Inflation Factors (VIF) over 5, hvormed det kan konkluderes, at der ikke er tegn på multicollinearitet. Forudsætning 3: Det ses her, at fejlleddet har et gennemsnit på næsten 0, hvormed forudsætningen kan antages at være opfyldt. Histogram: Af histogrammet ses det desuden, at residualerne for observationerne samler sig pænt omkring 0 med en lille overvægt til plussiden, men alt i alt viser dette ligeledes, at det er rimeligt at antage, at forudsætningen om en forventet værdi for fejlleddet på 0 er opfyldt. Forudsætning 4: XVII

18 Forudsætningen om, at der skal være en konstant varians på fejlleddet for alle observationer, dvs. homoskedasticitet, testes her ved at foretage et 2 -test, hvor H 0 = 1 2 = 2 2 =... = n 2, hvor n er lig antallet af observationer (homoskedasticitet) og H =... n 2 (heteroskedasticitet) 4. Da p-værdien på 0,5537 er større end α på 0,05, er der ikke belæg for at afvise H 0 med 95 % sikkerhed. Forudsætningen om homoskedasticitet må dermed antages at være opfyldt. Forudsætning 5: Denne forudsætning ses der ofte brud på ved tidsseriedata, idet fejlled forbundet med observationer i en given periode går videre over i kommende perioder 5. Et sådant brud kan bevirke, at OLSregressionens standardafvigelser angives mindre end de sande standardafvigelser og dermed skævvredet i nedadgående retning 6. I sidste ende fører det til, at estimationens parameterestimater vises som mere præcise end de reelt er, hvormed der vil være en øget fejlagtig tendens til at afvise H 0 -hypotesen, selvom den måske ikke burde afvises 7. Durbin Watson-testet anvendes her til at teste for, om fejlleddene er ukorrelerede 8. Idet Durbin Watson-statistikken her er på 1,923 og dermed under 2, indikerer dette en lidt positiv seriel 4 Pindyck & Rubinfeld 1998, pp Pindyck & Rubinfeld 1998, p Pindyck & Rubinfeld 1998, p Pindyck & Rubinfeld 1998, p Pindyck & Rubinfeld 1998, p. 164 XVIII

19 korrelation. Da tallet dog er meget tæt på 2, kan det dog tilnærmelsesvist konkluderes, at der ikke er seriel korrelation til stede mellem fejlleddene 9. Forudsætning 6: Hvorvidt fejlleddet er normalfordelt kan testes vha. et histogram, hvor residualfordelingen sættes over for normalfordelingen. Pga. langt flere end 100 observationer i stikprøven anses denne forudsætning for opfyldt 10. Denne antagelse bestyrkes endvidere af, at der i datasættet er foretaget winsorization, hvormed evt. outliers er blevet korrigeret. 9 Pindyck & Rubinfeld 1998, p Florida State University 2011 XIX

20 Bilag 6: Modelkørsel på modificeret Jones-model på grupperede perioder ( hhv ) XX

21 Bilag 7: Forudsætningstests på incitamentsvariable Nedenstående forudsætninger testes for modellerne for test på incitamentsvariablene for såvel perioden som perioden Forudsætninger 11 : 1. Forholdet mellem den afhængige variabel (Y) og de uafhængige variable (X) er lineært og givet ved ligningen 2. X erne er ikke-stokastiske variable, og der er ikke nogen nøjagtigt lineær relation mellem to eller flere af de uafhængige variable, dvs. multicollinearitet må ikke være et problem 3. Fejlleddet har en forventet værdi på 0 for alle observationer 4. Fejlleddet har en konstant varians for alle observationer, dvs. homoskedasticitet skal være til stede 5. Fejlleddene tilhørende de forskellige observationer er uafhængige og derfor ukorrelerede 12, dvs. der må ikke være autokorrelation til stede 6. Fejlleddet er normalfordelt 11 Pindyck & Rubinfeld 1998, p Pindyck & Rubinfeld 1998, p. 159 XXI

22 Test for perioden Forudsætning 1: Dette testes vha. scatter plots, hvor observationerne for de uafhængige variable afbilledes i plottet ift. den afhængige variabel, dvs. de styrbare periodiseringer deflateret med total aktivsum fra det foregående år. Dog afbilledes dummy-variablene ikke i scatter plots, idet de kun kan antage værdierne 0 og 1. XXII

23 Af ovenstående scatter plots ses en tydelig lineær sammenhæng mellem den afhængige variabel, deflaterede styrbare periodiseringer, og de forklarende variable hver for sig, dvs. hhv. gældsratioen, logaritmen til markedsværdien ultimo året og salgsvækst. Forudsætning 2: Her ses på, hvorvidt nogen af X-variablene kan skrives som en funktion af de øvrige X-variable. Såfremt dette er tilfældet, er der direkte afhængighed mellem nogle af X-variablene, hvilket ville XXIII

24 indikere multicollinearitet. I så fald kan det evt. afhjælpe problemet at pille en af disse variable ud af modellen. Alternativt kan variablene evt. kombineres eller transformeres. Det ses her, at ingen af de forklarende variable har Variance Inflation Factors (VIF) over 5, hvormed det kan konkluderes, at der ikke er tegn på multicollinearitet. Forudsætning 3: Det ses her, at fejlleddet har et gennemsnit på næsten 0, hvormed forudsætningen kan antages at være opfyldt. Histogram: Af histogrammet ses det desuden, at residualerne for observationerne samler sig pænt omkring 0 med en lille overvægt til minussiden, men alt i alt viser dette ligeledes, at det er rimeligt at antage, at forudsætningen om en forventet værdi for fejlleddet på 0 er opfyldt. Forudsætning 4: XXIV

25 Forudsætningen om, at der skal være en konstant varians på fejlleddet for alle observationer, dvs. homoskedasticitet, testes her ved at foretage et 2 -test, hvor H 0 = 1 2 = 2 2 =... = n 2, hvor n er lig antallet af observationer (homoskedasticitet) og H =... n 2 (heteroskedasticitet) 13. Da p-værdien på 0,0005 er mindre end α på 0,05, forkastes H 0 med 95 % sikkerhed. Forudsætningen om homoskedasticitet kan dermed ikke antages at være opfyldt. Forudsætning 5: Denne forudsætning ses der ofte brud på ved tidsseriedata, idet fejlled forbundet med observationer i en given periode går videre over i kommende perioder 14. Et sådant brud kan bevirke, at OLSregressionens standardafvigelser angives mindre end de sande standardafvigelser og dermed skævvredet i nedadgående retning 15. I sidste ende fører det til, at estimationens parameterestimater vises som mere præcise end de reelt er, hvormed der vil være en øget fejlagtig tendens til at afvise H 0 -hypotesen, selvom den måske ikke burde afvises 16. Durbin Watson-testet anvendes her til at teste for, om fejlleddene er ukorrelerede 17. Idet Durbin Watson-statistikken her er på 1,713 og dermed under 2, indikerer dette en lidt positiv seriel korrelation. Da tallet dog er forholdsvist tæt på 2, kan det dog tilnærmelsesvist konkluderes, at der ikke er seriel korrelation til stede mellem fejlleddene 18. Forudsætning 6: Hvorvidt fejlleddet er normalfordelt kan testes vha. et histogram, hvor residualfordelingen sættes over for normalfordelingen. Pga. langt flere end 100 observationer i stikprøven anses denne forudsætning for opfyldt Pindyck & Rubinfeld 1998, pp Pindyck & Rubinfeld 1998, p Pindyck & Rubinfeld 1998, p Pindyck & Rubinfeld 1998, p Pindyck & Rubinfeld 1998, p Pindyck & Rubinfeld 1998, p Florida State University 2011 XXV

26 Test for perioden Forudsætning 1: Dette testes vha. scatter plots, hvor observationerne for de uafhængige variable afbilledes i plottet ift. den afhængige variabel, dvs. de styrbare periodiseringer deflateret med total aktivsum fra det foregående år. Dog afbilledes dummy-variablene ikke i scatter plots, idet de kun kan antage værdierne 0 og 1. XXVI

27 Af ovenstående scatter plots ses en lineær sammenhæng mellem den afhængige variabel, deflaterede styrbare periodiseringer, og de forklarende variable hver for sig, dvs. hhv. gældsratioen, logaritmen til markedsværdien ultimo året og salgsvækst. Forudsætning 2: XXVII

28 Her ses på, hvorvidt nogen af X-variablene kan skrives som en funktion af de øvrige X-variable. Såfremt dette er tilfældet, er der direkte afhængighed mellem nogle af X-variablene, hvilket ville indikere multicollinearitet. I så fald kan det evt. afhjælpe problemet at pille en af disse variable ud af modellen. Alternativt kan variablene evt. kombineres eller transformeres. Det ses her, at ingen af de forklarende variable har Variance Inflation Factors (VIF) over 5, hvormed det kan konkluderes, at der ikke er tegn på multicollinearitet. Forudsætning 3: Det ses her, at fejlleddet har et gennemsnit meget tæt på 0, hvormed forudsætningen kan antages at være opfyldt. Histogram: Af histogrammet ses det desuden, at residualerne for observationerne samler sig pænt omkring 0 med en lille overvægt til minussiden, men alt i alt viser dette ligeledes, at det er rimeligt at antage, at forudsætningen om en forventet værdi for fejlleddet på 0 er opfyldt. Forudsætning 4: XXVIII

29 Forudsætningen om, at der skal være en konstant varians på fejlleddet for alle observationer, dvs. homoskedasticitet, testes her ved at foretage et 2 -test, hvor H 0 = 1 2 = 2 2 =... = n 2, hvor n er lig antallet af observationer (homoskedasticitet) og H =... n 2 (heteroskedasticitet) 20. Da p-værdien på under 0,0001 er meget mindre end α på 0,05, forkastes H 0 med 95 % sikkerhed. Forudsætningen om homoskedasticitet kan dermed ikke antages at være opfyldt. Forudsætning 5: Denne forudsætning ses der ofte brud på ved tidsseriedata, idet fejlled forbundet med observationer i en given periode går videre over i kommende perioder 21. Et sådant brud kan bevirke, at OLSregressionens standardafvigelser angives mindre end de sande standardafvigelser og dermed skævvredet i nedadgående retning 22. I sidste ende fører det til, at estimationens parameterestimater vises som mere præcise end de reelt er, hvormed der vil være en øget fejlagtig tendens til at afvise H 0 -hypotesen, selvom den måske ikke burde afvises 23. Durbin Watson-testet anvendes her til at teste for, om fejlleddene er ukorrelerede 24. Idet Durbin Watson-statistikken her er på 1,997, kan dette konkluderes at være så tæt på 2, at der ikke er seriel korrelation af betydning til stede mellem fejlleddene. Dog er tallet lidt lavere end 2, hvilket indikerer en lidt positiv korrelation 25. Forudsætning 6: 20 Pindyck & Rubinfeld 1998, pp Pindyck & Rubinfeld 1998, p Pindyck & Rubinfeld 1998, p Pindyck & Rubinfeld 1998, p Pindyck & Rubinfeld 1998, p Pindyck & Rubinfeld 1998, p. 165 XXIX

30 Hvorvidt fejlleddet er normalfordelt kan testes vha. et histogram, hvor residualfordelingen sættes over for normalfordelingen. Pga. langt flere end 100 observationer i stikprøven anses denne forudsætning for opfyldt Florida State University 2011 XXX

31 Bilag 8: Forudsætningstests på endelig baglæns optrevlet model Nedenstående forudsætninger testes her for den endelige model til test på incitamentsvariable for perioden efter trinvis eliminering af insignifikante variable. Dog testes kun de forudsætninger, hvis opfyldelse kan have ændret sig efter optrevlingen. Forudsætninger 27 : 1. Forholdet mellem den afhængige variabel (Y) og de uafhængige variable (X) er lineært og givet ved ligningen 2. X erne er ikke-stokastiske variable, og der er ikke nogen nøjagtigt lineær relation mellem to eller flere af de uafhængige variable, dvs. multicollinearitet må ikke være et problem 3. Fejlleddet har en forventet værdi på 0 for alle observationer 4. Fejlleddet har en konstant varians for alle observationer, dvs. homoskedasticitet skal være til stede 5. Fejlleddene tilhørende de forskellige observationer er uafhængige og derfor ukorrelerede 28, dvs. der må ikke være autokorrelation til stede 6. Fejlleddet er normalfordelt Forudsætning 1: Se under bilag 7 Forudsætning 2: 27 Pindyck & Rubinfeld 1998, p Pindyck & Rubinfeld 1998, p. 159 XXXI

32 Her ses på, hvorvidt nogen af X-variablene kan skrives som en funktion af de øvrige X-variable. Såfremt dette er tilfældet, er der direkte afhængighed mellem nogle af X-variablene, hvilket ville indikere multicollinearitet. I så fald kan det evt. afhjælpe problemet at pille en af disse variable ud af modellen. Alternativt kan variablene evt. kombineres eller transformeres. Det ses her, at ingen af de forklarende variable har Variance Inflation Factors (VIF) over 5, hvormed det kan konkluderes, at der ikke er tegn på multicollinearitet. Forudsætning 3: Det ses her, at fejlleddet har et gennemsnit meget tæt på 0, hvormed forudsætningen kan antages at være opfyldt. Histogram: Af histogrammet ses det desuden, at residualerne for observationerne samler sig pænt omkring 0 med en lille overvægt til minussiden, men alt i alt viser dette ligeledes, at det er rimeligt at antage, at forudsætningen om en forventet værdi for fejlleddet på 0 er opfyldt. Forudsætning 4: XXXII

33 Forudsætningen om, at der skal være en konstant varians på fejlleddet for alle observationer, dvs. homoskedasticitet, testes her ved at foretage et 2 -test, hvor H 0 = 1 2 = 2 2 =... = n 2, hvor n er lig antallet af observationer (homoskedasticitet) og H =... n 2 (heteroskedasticitet) 29. Da p-værdien er større end α på 0,05, fastholdes H 0 med 95 % sikkerhed. Forudsætningen om homoskedasticitet kan dermed antages at være opfyldt. I den endelige model er der altså ikke længere tale om brud på denne forudsætning for perioden Forudsætning 5: Se under bilag 7 Forudsætning 6: Hvorvidt fejlleddet er normalfordelt kan testes vha. et histogram, hvor residualfordelingen sættes over for normalfordelingen. Pga. langt flere end 100 observationer i stikprøven anses denne forudsætning for opfyldt Pindyck & Rubinfeld 1998, pp Florida State University 2011 XXXIII

34 Bilag 9: Forudsætningstests på endelig baglæns optrevlet model Nedenstående forudsætninger testes her for den endelige model til test på incitamentsvariable for perioden (finanskriseperioden) efter trinvis eliminering af insignifikante variable. Dog testes kun de forudsætninger, hvis opfyldelse kan have ændret sig efter optrevlingen. Forudsætninger 31 : 1. Forholdet mellem den afhængige variabel (Y) og de uafhængige variable (X) er lineært og givet ved ligningen 2. X erne er ikke-stokastiske variable, og der er ikke nogen nøjagtigt lineær relation mellem to eller flere af de uafhængige variable, dvs. multicollinearitet må ikke være et problem 3. Fejlleddet har en forventet værdi på 0 for alle observationer 4. Fejlleddet har en konstant varians for alle observationer, dvs. homoskedasticitet skal være til stede 5. Fejlleddene tilhørende de forskellige observationer er uafhængige og derfor ukorrelerede 32, dvs. der må ikke være autokorrelation til stede 6. Fejlleddet er normalfordelt Forudsætning 1: Se under bilag 7 Forudsætning 2: 31 Pindyck & Rubinfeld 1998, p Pindyck & Rubinfeld 1998, p. 159 XXXIV

35 Her ses på, hvorvidt nogen af X-variablene kan skrives som en funktion af de øvrige X-variable. Såfremt dette er tilfældet, er der direkte afhængighed mellem nogle af X-variablene, hvilket ville indikere multicollinearitet. I så fald kan det evt. afhjælpe problemet at pille en af disse variable ud af modellen. Alternativt kan variablene evt. kombineres eller transformeres. Det ses her, at ingen af de forklarende variable har Variance Inflation Factors (VIF) over 5, hvormed det kan konkluderes, at der ikke er tegn på multicollinearitet. Forudsætning 3: Det ses her, at fejlleddet har et gennemsnit meget tæt på 0, hvormed forudsætningen kan antages at være opfyldt. Histogram: Af histogrammet ses det desuden, at residualerne for observationerne samler sig pænt omkring 0, hvorfor det er rimeligt at antage, at forudsætningen om en forventet værdi for fejlleddet på 0 er opfyldt. Forudsætning 4: XXXV

36 Forudsætningen om, at der skal være en konstant varians på fejlleddet for alle observationer, dvs. homoskedasticitet, testes her ved at foretage et 2 -test, hvor H 0 = 1 2 = 2 2 =... = n 2, hvor n er lig antallet af observationer (homoskedasticitet) og H =... n 2 (heteroskedasticitet) 33. Da p-værdien er meget mindre end α på 0,05, forkastes H 0 med 95 % sikkerhed. Forudsætningen om homoskedasticitet kan dermed ikke antages at være opfyldt. Derfor anvendes heteroskedasticitetkonsistente standardfejl (HCSE) 34 til at korrigere herfor, og konklusionerne på testresultaterne for perioden baseres på de nye t-statistikker og det nye F-test etc. Forudsætning 5: Denne forudsætning ses der ofte brud på ved tidsseriedata, idet fejlled forbundet med observationer i en given periode så går videre over i kommende perioder 35. Et sådant brud kan bevirke, at OLSregressionens standardafvigelser angives mindre end de sande standardafvigelser og dermed skævvredet i nedadgående retning 36. I sidste ende fører det til, at estimationens parameterestimater vises som mere præcise end de reelt er, hvormed der vil være en øget fejlagtig tendens til at afvise H 0 -hypotesen, selvom den måske ikke burde afvises 37. Durbin Watson-testet anvendes her til at teste for, om fejlleddene er ukorrelerede 38. Idet Durbin Watson-statistikken her er på 1,998, kan dette konkluderes at være så tæt på 2, at der ikke er seriel korrelation af betydning til stede mellem fejlleddene. Dog er tallet lidt lavere end 2, hvilket indikerer en lidt positiv korrelation Pindyck & Rubinfeld 1998, pp Bauwhede 2001, pp Dai 2007, p. 359, note 5 + p. 361, note 6 + White Pindyck & Rubinfeld 1998, p Pindyck & Rubinfeld 1998, p Pindyck & Rubinfeld 1998, p Pindyck & Rubinfeld 1998, p Pindyck & Rubinfeld 1998, p. 165 XXXVI

37 Forudsætning 6: Hvorvidt fejlleddet er normalfordelt kan testes vha. et histogram, hvor residualfordelingen sættes over for normalfordelingen. Pga. langt flere end 100 observationer i stikprøven anses denne forudsætning for opfyldt Florida State University 2011 XXXVII

38 Bilag 10: Modelkørsel på incitamentsmodel XXXVIII

39 Bilag 11: Modelkørsel på incitamentsmodel XXXIX

40 Bilag 12: Antal selskaber pr. land i stikprøven XL