Bilagsoversigt: Bilag 1: Dokumentation af data og data flow i SAS Enterprise Guide... II Bilag 2: Søgekriterier i Orbis... X Bilag 3: Dummy-variable for år... XI Bilag 4: Modelkørsel på modificeret Jones-model pr. år i perioden 2006-2011... XII Bilag 5: Forudsætningstests for estimation af modificeret Jones-model... XV Bilag 6: Modelkørsel på modificeret Jones-model på grupperede perioder (2006-2007 hhv. 2008-2011)... XX Bilag 7: Forudsætningstests på incitamentsvariable... XXI Bilag 8: Forudsætningstests på endelig baglæns optrevlet model 2006-2007...XXXI Bilag 9: Forudsætningstests på endelig baglæns optrevlet model 2008-2011... XXXIV Bilag 10: Modelkørsel på incitamentsmodel 2006-2007... XXXVIII Bilag 11: Modelkørsel på incitamentsmodel 2008-2011... XXXIX Bilag 12: Antal selskaber pr. land i stikprøven... XL I
Bilag 1: Dokumentation af data og data flow i SAS Enterprise Guide For at eksekvere SAS-programmerne bag denne afhandling, behøves der blot en lokal installation af SAS Enterprise Guide v. 4.3 med fuld SAS Foundation 9.3 samt fuld SAS STAT licens. Kopiér folderen <CD-ROM-DREV>\Orbis_SAS_data fra vedlagte CD-ROM til computerens C: drev. Gå derefter til folderen C:\Orbis_SAS_Data\SAS_programs og udvælg de relevante programmer. Programmerne er nummererede i kronologisk rækkefølge. Alle væsentlige datasæt er eksporteret både som SAS-tabeller og Excel-filer, ligesom outputs fra deskriptive statistikker og regressioner er placeret naturligt i foldere som html-filer. I nedenstående gennemgang er folder- og filnavne endvidere præsenteret. SAS Enterprise Guide er et intuitivt peg- og klik-værktøj, som betyder, at langt de fleste operationer i systemet kan klares uden programmørviden. Det har dog været nødvendigt at indsætte rigtig SAS-kode i Enterprise Guide-projekterne, da ikke alt i indeværende kunne løses via standardfunktionalitet. Da SAS Enterprise Guide kører på en del af SAS Foundation, er der mulighed for at eksekvere samtlige SAS-procedurer i Enterprise Guide, hvorved der ikke er nogen begrænsninger i SAS Enterprise Guide, hvorfor bl.a. hele SAS STAT pakken er til rådighed. Det har været nødvendigt at udvikle ekstra kode til håndtering af labels (kolonnebeskrivelser efter datatransformationer), til winsorizing af variable samt til regressioner med heteroskedasticitetkonsistente standardafvigelser. SAS Enterprise Guide-pogrammerne er placeret i folderen: <CD-ROM-DREV>\Orbis_SAS_Data\SAS_programs med filtype.egp. Det er kun muligt at åbne programmerne med en installeret SAS Enterprise Guide version 4.3. Generel illustration af SAS Enterprise Guide projekt: II
Step 1: Formål: Generering af en datatabel indeholdende alle finansielle data til kørsel af Jones-modeller Program: 1_Create_raw_data Efter udtræk fra Orbis databasen, er data hentet til i alt 3.txt-filer. Orbis har en begrænsning på antallet af kolonner, der kan eksporteres, hvorfor der er eksporteret to filer; nemlig Total_data_1 og Total_data_2, som er placeret på C:\Orbis_SAS_Data\0_Orbis_raw_data. Disse filer er sammensat ud fra den unikke selskabskode. Antallet af selskaber i udtrækket er 2.884. For Orbis filtervalg, se venligst udtræksstrategien fra Orbis C:\Orbis_SAS_Data\0_Orbis_raw_data i filen Search_criteria.xlsx samt beskrivelsen af valgene i afhandlingen eller evt. bilag 2. Orbis-udtrækket pr. datatype (fx total assets) pr. år er kolonner, og det ønskes at sammenflette 7 kolonner til én (år fra 2005 til 2011). Dette gøres ved at transponere alle numeriske kolonner til en værdi-kolonne. Herefter benyttes det, at beskrivelsen på alle kolonner pr. datatype er konsistent, nemlig '[Total assets] th EUR 2011', hvor [XXXX] er pr. år, th er tusinder, [XXXXXX] er datatypen. Denne beskrivelse deles i to, dvs. en year-kolonne indeholdende [XXXX] og en variabel-kolonne indeholdende '[XXXXXX] th eur'. Herved kan data transponeres endnu engang, denne gang ved at få hver datatype (regnskabspost) tilbage på kolonnerne, dog for alle år pr. datatype. Tabellen indeholder nu 20.188 observationer (2.884 selskaber * 7 år) pga. datatransponeringen. Rådata fra kørslen er blevet eksporteret både som SAS-tabel og som xls-fil (2005-2011) i folderen C:\Orbis_SAS_data\SAS_cleaned_data. Se fil transposed_raw_data.sas7bdat og transposed_raw_data.xls. Endelig er samtlige data for Vestas Wind Systems A/S (DK10403782) blevet kontrolleret for datavaliditet for 2011 og 2010. Alle de behandlede data er korrekte for Vestas Wind Systems A/S - både mht. reliabilitet (indeholder Orbis-databasen korrekte tal?) og fuldstændighed (er alle de korrekte regnskabsposter blevet trukket ud?). III
Step 2: Formål: At skabe en tabel, så det vides, om selskaberne bruger hhv. big4-revisor, og om der har været skift i ledelsen Program: 1_1_Create_raw_data_auditor_management Udtrækket Total_data_3 benyttes, igen placeret C:\Orbis_SAS_Data\0_Orbis_raw_data. Funktionalitet fra Orbis med samtlige udfyldte linjer virker desværre ikke. Derfor mangler der selskabsnavn og selskabsnummer ud for de linjer, hvor der er flere advisors eller flere personer i ledelsen. Derfor skabes via specialprogram disse linjer, så selskabsnummer og selskabsnavn altid er udfyldt. Ledelsesskift: Der antages et ledelsesskift, når en ny person er indtrådt i topledelsen i det givne år. Hvis ingen nyindtrædelser i topledelsen, betragtes dette som intet ledelsesskift. Hvis en person forlader ledelsen, er det ikke opfattet som et ledelsesskift (Orbis-databasen har ganske få observationer vedr. dato for ledelsesskift, hvorfor det ikke virker som et validt datafelt). Big4 auditor: Det antages, at Big4 er KPMG, PwC, Ernst & Young samt Deloitte. Der søges efter disse virksomhedsnavne i auditor -kolonnen. Det bemærkes, at Orbis-databasen kun indeholder den nuværende revisor, men ikke historiske data herom, så hvis et selskab i nogle af årene ikke har haft en Big4 auditor, er det ikke muligt at opdage dette. Derfor vil alle, som har Big4 auditor pt. (regnskabsår 2011) få en kode med Big4 auditor. Er et selskab gået væk fra at have Big4 i perioden, vil dette ligeledes ikke fremgå, men blot få kategoriseringen ikke-big4. Der er enkelte selskaber, som har flere revisorer fra Big4, men her behandles selskabet, som om selskabet blot har én Big4 revisor. Både tabeller for ledelsesskift og big4 auditor er blevet eksporteret til C:\Orbis_SAS_Data\1_SAS_cleaned_data som hhv. både.sas-tabeller og.xls-filer. IV
Step 3: Formål: Danne en SAS-tabel med transformerede winsorized data til regression Program: 2_Create_regres_data_all_incl_winsorization Der tages udgangspunkt i de rådata, som er skabt via SAS-programmet 1_Create_raw_data.egp. Først flyttes kolonner rundt, så det giver fornuftig mening. Derefter skabes kolonner med t-1 værdier for de relevante datatyper, så delta-variable kan beregnes. Specialprogram designet via open code i SAS-projektet for at beregne t-1 værdier. Efter deltavariable er beregnet, fjernes år 2005, så datasættet mindskes fra 20.188 til 17.304 observationer. Grunddata, som benyttes til variable i den modificerede Jones-model og Kothari-inspirerede modificerede Jones-model bliver behandlet med 98 % winsorization, hvilket vil sige, at værdier under 1. percentilen udskiftes med 1. percentilværdien, og værdier over 99. percentilen udskiftes med 99. percentilen. Makro til brug for winsorizing er inspireret af: http://www.unc.edu/~ballr/macros/winsorize_truncate.sas. Makroen kan ses på C:\Orbis_SAS_Data\SAS_macros\Winsorize.sas og benyttet i indeværende program for de relevante variable (regnskabsposter, som indgår i Jones model). Dernæst skabes de variable, som skal bruges i Jones-regressionen til generering af fejlled (de styrbare periodiseringer). Følgende variable er beregnet til den modificerede Jones-model: TA_ (Absolutte værdier) TA REV-REC PPE Alle er deflateret med Total Assets (t-1). Alle beregnede variable er kontrolleret med udgangspunkt i Vestas Wind Systems A/S for 2010 og 2011. Slutteligt er samtlige deskriptive statistikker på grunddata for hele perioden (2006-2011) samt pr. år både før og efter winsorization eksporteret til html-filer placeret i folderen C:\Orbis_SAS_Data\3_SAS_regression_output med præfiks Statistics*.html. Ved generering af beregnede variable smider SAS Enterprise Guide labels (beskrivelsen på kolonnen) væk. Derfor er der lavet et program, som genskriver disse. Fejlen i programmet er dokumenteret her: http://support.sas.com/kb/41/731.html V
Step 4: Formål: At skabe en tabel med dummy- og kontrolvariable til regression på fejlleddet (styrbare periodiseringer) fra den modificerede Jones-model. Program: 3_Create_dummy_and_control_variables_for_error_term_regressions Først genereres en tabel med stamdata. Herefter skabes følgende variable: X1 - X5: År 2006-2011: Tages ud fra Annual reporting year X6: Gæld / egenkapital Beregnes ud fra tidligere anvendte variable X7: Ledelsesskift Se specialprogram vedr. ledelsesskift og revisor X8: Profit omkring 0 Der tages +/- 0,5 % af omsætningen. Er profitten mindre end +0,5 % af omsætningen eller større end -0,5 % af omsætningen, er profitten omkring 0 X9: Negativ indtjening Profit før skat negativ eller 0 X10: Revisor Se specialprogram vedr. ledelsesskift og revisor X11: Markedsværdi Log-transformeret variabel af markedsværdien i mio. EUR X12: Retslig tilstand To retstraditioner common law (GB-IE) vs. code law X13: Vækst i omsætning Ændring i omsætning (år (t) minus sidste år (t-1)) / omsætning sidste år (t-1) Tabellen er herefter klar til at modtage fejlled fra modificeret Jones-model til brug for hypotese 3. VI
Step 5: Formål: At lave plots for at verificere en lineær sammenhæng mellem forklaret variabel og forklarende variable Program: 4_Assumptions_tests Der laves plots for 1. Modificeret Jones-model data (winsorized) for at sikre lineære sammenhænge mellem deflaterede totale periodiseringer og de forklarende variable (hypotese 1 + 2). 2. For incitamentsmodellen (hypotese 3) sikres den lineære sammenhæng mellem modellens kontinuerte variable for såvel perioden 2006-2007 som for 2008-2011 og de styrbare periodiseringer (det estimerede fejlled). VII
Step 6: Formål: At lave et program, som har alle regressioner til brug for afhandlingens hypotese 1-3 Program: 5_Regression_analysis_all Programmet er bygget op på baggrund af to tabeller: 1. Winsorized_Jones_data (fra step 3) 2. Alle incitaments- og kontrolvariable (benævnt X1-X13) til brug for regression på fejlled fra den modificerede Jones-model / den Kothari-inspirerede modificerede Jones-model (fra step 4) Så vidt muligt er alle forudsætningstests en del af output for de enkelte regressioner. F.s.v. angår plots m.v. henvises dog til programmet i forrige step. Beskrivelserne dækker programmet "oppefra og ned" Fuld model for perioden 2006-2011: Først er der på winsorized data lavet en modificeret Jones OLS-regression til brug for besvarelse af hypotese 1 omhandlende, hvorvidt der kan påvises resultatstyring i perioden 2006-2011. Det estimerede fejlled er gemt i en separat tabel, hvor der tilføjes incitaments- og kontrolvariable via nøglerne selskabsnummer og år samt laves deskriptiv statistik. Endelig køres fejlled imod samtlige incitaments- og kontrolvariable for at se, hvilke incitamenter, der kan forklare resultatstyringen i hele perioden. Ovenstående modificerede Jones-model estimeres også via OLS-regression per år. OLS laves ligeledes på den Kothari-inspirerede modificerede Jones-model med ROA for at sammenligne med grundmodellen. I afhandlingen argumenteres for, at der opdeles i perioder hhv. før og under finanskrisen. Perioden 2006-2007: Der tages udelukkende udgangspunkt i data for perioden 2006-2007. OLSregression som for hhv. hypotese 2 og hypotese 3, deskriptiv statistik på fejlleddet samt en baglæns trinvis eliminering af insignifikante variable. Perioden 2008-2011: Der tages udelukkende udgangspunkt i data for perioden 2008-2011. Dvs. OLS-regression for hhv. hypotese 2 og hypotese 3, deskriptiv statistik på fejlleddet samt en baglæns trinvis eliminering af insignifikante variable Da det viser sig, at der er problemer med heteroskedasticitet for regressioner vedr. hypotese 3, laves i bunden af programmet kørsel med heteroskedasticitet-konsistente statistikker for incitamentshypotesen for perioden 2006-2007 samt for perioden 2008-2011, og for den baglæns VIII
trinvise eliminering for perioden 2008-2011 estimeres endnu engang OLS-regression, denne gang med proc reg-proceduren med optionen "/white" 1. 1 White 1980 IX
Bilag 2: Søgekriterier i Orbis Product name Orbis Update number 100 Software version 127.00 Data update 01/06/2012 (n 10000) Username Aarhus Business School-6415 Export date 02/06/2012 Step result Search result 1. All active companies and companies with unknown situation 84,805,531 84,805,531 2. Accounting practice: IFRS (International Financial Reporting Standards) 3. World region/country/region in country: Eastern Europe, Western Europe 4. BvD major sectors: 01. Primary sector, 02. Food, beverages, tobacco, 03. Textiles, wearing apparel, leather, 04. Wood, cork, paper, 05. Publishing, printing, 06. Chemicals, rubber, plastics, non-metallic products, 07. Metals & metal products, 08. Machinery, equipment, furniture, recycling, 09. Gas, Water, Electricity, 10. Construction, 11. Wholesale & retail trade, 12. Hotels & restaurants, 13. Transport, 14. Post & telecommunications, 17. Other services, 19. Education, Health 1,267,002 1,179,047 54,175,965 1,165,818 79,896,021 1,151,195 5. Current assets: All companies with a known value, 2011, 2010, 2009, 2008, 2007, 2006, 2005, for all the selected periods 709,049 3,855 6. Cash & cash equivalent: All companies with a known value, 2011, 2010, 2009, 2008, 2007, 2006, 2005, for all the selected periods 550,483 3,396 7. Current liabilities: All companies with a known value, 2011, 2010, 2009, 2008, 2007, 2006, 2005, for all the selected periods 711,966 3,396 8. Depreciation & Amortization: All companies with a known value, 2011, 2010, 2009, 2008, 2007, 2006, 2005, for all the selected periods 274,184 2,959 9. Total assets: All companies with a known value, 2011, 2010, 2009, 2008, 2007, 2006, 2005, for all the selected periods 721,058 2,959 10. Tangible fixed assets: All companies with a known value, 2011, 2010, 2009, 2008, 2007, 2006, 2005, for all the selected periods 706,978 2,959 11. Operating revenue (Turnover): All companies with a known value, 2011, 2010, 2009, 2008, 2007, 2006, 2005, for all the selected periods 575,988 2,893 12. Debtors: All companies with a known value, 2011, 2010, 2009, 2008, 2007, 2006, 2005, for all the selected periods 656,129 2,888 13. P/L before tax: All companies with a known value, 2011, 2010, 2009, 2008, 2007, 2006, 2005, for all the selected periods 405,966 2,884 Boolean search : 1 And 2 And 3 And 4 And 5 And 6 And 7 And 8 And 9 And 10 And 11 And 12 And 13 TOTAL 2,884 X
Bilag 3: Dummy-variable for år Angående dummy-variable for årene gælder følgende: XI
Bilag 4: Modelkørsel på modificeret Jones-model pr. år i perioden 2006-2011 2006: 2007: XII
2008: 2009: XIII
2010: 2011: XIV
Bilag 5: Forudsætningstests for estimation af modificeret Jones-model Forudsætninger 2 : 1. Forholdet mellem den afhængige variabel (Y) og de uafhængige variable (X) er lineært og givet ved ligningen 2. X erne er ikke-stokastiske variable, og der er ikke nogen nøjagtigt lineær relation mellem to eller flere af de uafhængige variable, dvs. multicollinearitet må ikke være et problem 3. Fejlleddet har en forventet værdi på 0 for alle observationer 4. Fejlleddet har en konstant varians for alle observationer, dvs. homoskedasticitet skal være til stede 5. Fejlleddene tilhørende de forskellige observationer er uafhængige og derfor ukorrelerede 3, dvs. der må ikke være autokorrelation til stede 6. Fejlleddet er normalfordelt Forudsætning 1: Dette testes vha. scatter plots, hvor observationerne for de uafhængige variable afbilledes i plottet ift. den afhængige variabel, dvs. totale periodiseringer. 2 Pindyck & Rubinfeld 1998, p. 86 3 Pindyck & Rubinfeld 1998, p. 159 XV
Af ovenstående scatter plots ses en tydelig lineær sammenhæng mellem den afhængige variabel, deflaterede totale periodiseringer, og de forklarende variable hver for sig, dvs. hhv. deflateret invers total aktivsum fra foregående år, deflateret ændring i kontantsalg og deflaterede materielle anlægsaktiver. Forudsætning 2: XVI
Her ses på, hvorvidt nogen af X-variablene kan skrives som en funktion af de øvrige X-variable. Såfremt dette er tilfældet, er der direkte afhængighed mellem nogle af X-variablene, hvilket ville indikere multicollinearitet. I så fald kan det evt. afhjælpe problemet at pille en af disse variable ud af modellen. Alternativt kan variablene evt. kombineres eller transformeres. Det ses her, at ingen af de forklarende variable har Variance Inflation Factors (VIF) over 5, hvormed det kan konkluderes, at der ikke er tegn på multicollinearitet. Forudsætning 3: Det ses her, at fejlleddet har et gennemsnit på næsten 0, hvormed forudsætningen kan antages at være opfyldt. Histogram: Af histogrammet ses det desuden, at residualerne for observationerne samler sig pænt omkring 0 med en lille overvægt til plussiden, men alt i alt viser dette ligeledes, at det er rimeligt at antage, at forudsætningen om en forventet værdi for fejlleddet på 0 er opfyldt. Forudsætning 4: XVII
Forudsætningen om, at der skal være en konstant varians på fejlleddet for alle observationer, dvs. homoskedasticitet, testes her ved at foretage et 2 -test, hvor H 0 = 1 2 = 2 2 =... = n 2, hvor n er lig antallet af observationer (homoskedasticitet) og H 1 1 2 2 2 =... n 2 (heteroskedasticitet) 4. Da p-værdien på 0,5537 er større end α på 0,05, er der ikke belæg for at afvise H 0 med 95 % sikkerhed. Forudsætningen om homoskedasticitet må dermed antages at være opfyldt. Forudsætning 5: Denne forudsætning ses der ofte brud på ved tidsseriedata, idet fejlled forbundet med observationer i en given periode går videre over i kommende perioder 5. Et sådant brud kan bevirke, at OLSregressionens standardafvigelser angives mindre end de sande standardafvigelser og dermed skævvredet i nedadgående retning 6. I sidste ende fører det til, at estimationens parameterestimater vises som mere præcise end de reelt er, hvormed der vil være en øget fejlagtig tendens til at afvise H 0 -hypotesen, selvom den måske ikke burde afvises 7. Durbin Watson-testet anvendes her til at teste for, om fejlleddene er ukorrelerede 8. Idet Durbin Watson-statistikken her er på 1,923 og dermed under 2, indikerer dette en lidt positiv seriel 4 Pindyck & Rubinfeld 1998, pp. 152-159 5 Pindyck & Rubinfeld 1998, p. 159 6 Pindyck & Rubinfeld 1998, p. 159 7 Pindyck & Rubinfeld 1998, p. 159 8 Pindyck & Rubinfeld 1998, p. 164 XVIII
korrelation. Da tallet dog er meget tæt på 2, kan det dog tilnærmelsesvist konkluderes, at der ikke er seriel korrelation til stede mellem fejlleddene 9. Forudsætning 6: Hvorvidt fejlleddet er normalfordelt kan testes vha. et histogram, hvor residualfordelingen sættes over for normalfordelingen. Pga. langt flere end 100 observationer i stikprøven anses denne forudsætning for opfyldt 10. Denne antagelse bestyrkes endvidere af, at der i datasættet er foretaget winsorization, hvormed evt. outliers er blevet korrigeret. 9 Pindyck & Rubinfeld 1998, p. 165 10 Florida State University 2011 XIX
Bilag 6: Modelkørsel på modificeret Jones-model på grupperede perioder (2006-2007 hhv. 2008-2011) XX
Bilag 7: Forudsætningstests på incitamentsvariable Nedenstående forudsætninger testes for modellerne for test på incitamentsvariablene for såvel perioden 2006-2007 som perioden 2008-2011. Forudsætninger 11 : 1. Forholdet mellem den afhængige variabel (Y) og de uafhængige variable (X) er lineært og givet ved ligningen 2. X erne er ikke-stokastiske variable, og der er ikke nogen nøjagtigt lineær relation mellem to eller flere af de uafhængige variable, dvs. multicollinearitet må ikke være et problem 3. Fejlleddet har en forventet værdi på 0 for alle observationer 4. Fejlleddet har en konstant varians for alle observationer, dvs. homoskedasticitet skal være til stede 5. Fejlleddene tilhørende de forskellige observationer er uafhængige og derfor ukorrelerede 12, dvs. der må ikke være autokorrelation til stede 6. Fejlleddet er normalfordelt 11 Pindyck & Rubinfeld 1998, p. 86 12 Pindyck & Rubinfeld 1998, p. 159 XXI
Test for perioden 2006-2007 Forudsætning 1: Dette testes vha. scatter plots, hvor observationerne for de uafhængige variable afbilledes i plottet ift. den afhængige variabel, dvs. de styrbare periodiseringer deflateret med total aktivsum fra det foregående år. Dog afbilledes dummy-variablene ikke i scatter plots, idet de kun kan antage værdierne 0 og 1. XXII
Af ovenstående scatter plots ses en tydelig lineær sammenhæng mellem den afhængige variabel, deflaterede styrbare periodiseringer, og de forklarende variable hver for sig, dvs. hhv. gældsratioen, logaritmen til markedsværdien ultimo året og salgsvækst. Forudsætning 2: Her ses på, hvorvidt nogen af X-variablene kan skrives som en funktion af de øvrige X-variable. Såfremt dette er tilfældet, er der direkte afhængighed mellem nogle af X-variablene, hvilket ville XXIII
indikere multicollinearitet. I så fald kan det evt. afhjælpe problemet at pille en af disse variable ud af modellen. Alternativt kan variablene evt. kombineres eller transformeres. Det ses her, at ingen af de forklarende variable har Variance Inflation Factors (VIF) over 5, hvormed det kan konkluderes, at der ikke er tegn på multicollinearitet. Forudsætning 3: Det ses her, at fejlleddet har et gennemsnit på næsten 0, hvormed forudsætningen kan antages at være opfyldt. Histogram: Af histogrammet ses det desuden, at residualerne for observationerne samler sig pænt omkring 0 med en lille overvægt til minussiden, men alt i alt viser dette ligeledes, at det er rimeligt at antage, at forudsætningen om en forventet værdi for fejlleddet på 0 er opfyldt. Forudsætning 4: XXIV
Forudsætningen om, at der skal være en konstant varians på fejlleddet for alle observationer, dvs. homoskedasticitet, testes her ved at foretage et 2 -test, hvor H 0 = 1 2 = 2 2 =... = n 2, hvor n er lig antallet af observationer (homoskedasticitet) og H 1 1 2 2 2 =... n 2 (heteroskedasticitet) 13. Da p-værdien på 0,0005 er mindre end α på 0,05, forkastes H 0 med 95 % sikkerhed. Forudsætningen om homoskedasticitet kan dermed ikke antages at være opfyldt. Forudsætning 5: Denne forudsætning ses der ofte brud på ved tidsseriedata, idet fejlled forbundet med observationer i en given periode går videre over i kommende perioder 14. Et sådant brud kan bevirke, at OLSregressionens standardafvigelser angives mindre end de sande standardafvigelser og dermed skævvredet i nedadgående retning 15. I sidste ende fører det til, at estimationens parameterestimater vises som mere præcise end de reelt er, hvormed der vil være en øget fejlagtig tendens til at afvise H 0 -hypotesen, selvom den måske ikke burde afvises 16. Durbin Watson-testet anvendes her til at teste for, om fejlleddene er ukorrelerede 17. Idet Durbin Watson-statistikken her er på 1,713 og dermed under 2, indikerer dette en lidt positiv seriel korrelation. Da tallet dog er forholdsvist tæt på 2, kan det dog tilnærmelsesvist konkluderes, at der ikke er seriel korrelation til stede mellem fejlleddene 18. Forudsætning 6: Hvorvidt fejlleddet er normalfordelt kan testes vha. et histogram, hvor residualfordelingen sættes over for normalfordelingen. Pga. langt flere end 100 observationer i stikprøven anses denne forudsætning for opfyldt 19. 13 Pindyck & Rubinfeld 1998, pp. 152-159 14 Pindyck & Rubinfeld 1998, p. 159 15 Pindyck & Rubinfeld 1998, p. 159 16 Pindyck & Rubinfeld 1998, p. 159 17 Pindyck & Rubinfeld 1998, p. 164 18 Pindyck & Rubinfeld 1998, p. 165 19 Florida State University 2011 XXV
Test for perioden 2008-2011 Forudsætning 1: Dette testes vha. scatter plots, hvor observationerne for de uafhængige variable afbilledes i plottet ift. den afhængige variabel, dvs. de styrbare periodiseringer deflateret med total aktivsum fra det foregående år. Dog afbilledes dummy-variablene ikke i scatter plots, idet de kun kan antage værdierne 0 og 1. XXVI
Af ovenstående scatter plots ses en lineær sammenhæng mellem den afhængige variabel, deflaterede styrbare periodiseringer, og de forklarende variable hver for sig, dvs. hhv. gældsratioen, logaritmen til markedsværdien ultimo året og salgsvækst. Forudsætning 2: XXVII
Her ses på, hvorvidt nogen af X-variablene kan skrives som en funktion af de øvrige X-variable. Såfremt dette er tilfældet, er der direkte afhængighed mellem nogle af X-variablene, hvilket ville indikere multicollinearitet. I så fald kan det evt. afhjælpe problemet at pille en af disse variable ud af modellen. Alternativt kan variablene evt. kombineres eller transformeres. Det ses her, at ingen af de forklarende variable har Variance Inflation Factors (VIF) over 5, hvormed det kan konkluderes, at der ikke er tegn på multicollinearitet. Forudsætning 3: Det ses her, at fejlleddet har et gennemsnit meget tæt på 0, hvormed forudsætningen kan antages at være opfyldt. Histogram: Af histogrammet ses det desuden, at residualerne for observationerne samler sig pænt omkring 0 med en lille overvægt til minussiden, men alt i alt viser dette ligeledes, at det er rimeligt at antage, at forudsætningen om en forventet værdi for fejlleddet på 0 er opfyldt. Forudsætning 4: XXVIII
Forudsætningen om, at der skal være en konstant varians på fejlleddet for alle observationer, dvs. homoskedasticitet, testes her ved at foretage et 2 -test, hvor H 0 = 1 2 = 2 2 =... = n 2, hvor n er lig antallet af observationer (homoskedasticitet) og H 1 1 2 2 2 =... n 2 (heteroskedasticitet) 20. Da p-værdien på under 0,0001 er meget mindre end α på 0,05, forkastes H 0 med 95 % sikkerhed. Forudsætningen om homoskedasticitet kan dermed ikke antages at være opfyldt. Forudsætning 5: Denne forudsætning ses der ofte brud på ved tidsseriedata, idet fejlled forbundet med observationer i en given periode går videre over i kommende perioder 21. Et sådant brud kan bevirke, at OLSregressionens standardafvigelser angives mindre end de sande standardafvigelser og dermed skævvredet i nedadgående retning 22. I sidste ende fører det til, at estimationens parameterestimater vises som mere præcise end de reelt er, hvormed der vil være en øget fejlagtig tendens til at afvise H 0 -hypotesen, selvom den måske ikke burde afvises 23. Durbin Watson-testet anvendes her til at teste for, om fejlleddene er ukorrelerede 24. Idet Durbin Watson-statistikken her er på 1,997, kan dette konkluderes at være så tæt på 2, at der ikke er seriel korrelation af betydning til stede mellem fejlleddene. Dog er tallet lidt lavere end 2, hvilket indikerer en lidt positiv korrelation 25. Forudsætning 6: 20 Pindyck & Rubinfeld 1998, pp. 152-159 21 Pindyck & Rubinfeld 1998, p. 159 22 Pindyck & Rubinfeld 1998, p. 159 23 Pindyck & Rubinfeld 1998, p. 159 24 Pindyck & Rubinfeld 1998, p. 164 25 Pindyck & Rubinfeld 1998, p. 165 XXIX
Hvorvidt fejlleddet er normalfordelt kan testes vha. et histogram, hvor residualfordelingen sættes over for normalfordelingen. Pga. langt flere end 100 observationer i stikprøven anses denne forudsætning for opfyldt 26. 26 Florida State University 2011 XXX
Bilag 8: Forudsætningstests på endelig baglæns optrevlet model 2006-2007 Nedenstående forudsætninger testes her for den endelige model til test på incitamentsvariable for perioden 2006-2007 efter trinvis eliminering af insignifikante variable. Dog testes kun de forudsætninger, hvis opfyldelse kan have ændret sig efter optrevlingen. Forudsætninger 27 : 1. Forholdet mellem den afhængige variabel (Y) og de uafhængige variable (X) er lineært og givet ved ligningen 2. X erne er ikke-stokastiske variable, og der er ikke nogen nøjagtigt lineær relation mellem to eller flere af de uafhængige variable, dvs. multicollinearitet må ikke være et problem 3. Fejlleddet har en forventet værdi på 0 for alle observationer 4. Fejlleddet har en konstant varians for alle observationer, dvs. homoskedasticitet skal være til stede 5. Fejlleddene tilhørende de forskellige observationer er uafhængige og derfor ukorrelerede 28, dvs. der må ikke være autokorrelation til stede 6. Fejlleddet er normalfordelt Forudsætning 1: Se under bilag 7 Forudsætning 2: 27 Pindyck & Rubinfeld 1998, p. 86 28 Pindyck & Rubinfeld 1998, p. 159 XXXI
Her ses på, hvorvidt nogen af X-variablene kan skrives som en funktion af de øvrige X-variable. Såfremt dette er tilfældet, er der direkte afhængighed mellem nogle af X-variablene, hvilket ville indikere multicollinearitet. I så fald kan det evt. afhjælpe problemet at pille en af disse variable ud af modellen. Alternativt kan variablene evt. kombineres eller transformeres. Det ses her, at ingen af de forklarende variable har Variance Inflation Factors (VIF) over 5, hvormed det kan konkluderes, at der ikke er tegn på multicollinearitet. Forudsætning 3: Det ses her, at fejlleddet har et gennemsnit meget tæt på 0, hvormed forudsætningen kan antages at være opfyldt. Histogram: Af histogrammet ses det desuden, at residualerne for observationerne samler sig pænt omkring 0 med en lille overvægt til minussiden, men alt i alt viser dette ligeledes, at det er rimeligt at antage, at forudsætningen om en forventet værdi for fejlleddet på 0 er opfyldt. Forudsætning 4: XXXII
Forudsætningen om, at der skal være en konstant varians på fejlleddet for alle observationer, dvs. homoskedasticitet, testes her ved at foretage et 2 -test, hvor H 0 = 1 2 = 2 2 =... = n 2, hvor n er lig antallet af observationer (homoskedasticitet) og H 1 1 2 2 2 =... n 2 (heteroskedasticitet) 29. Da p-værdien er større end α på 0,05, fastholdes H 0 med 95 % sikkerhed. Forudsætningen om homoskedasticitet kan dermed antages at være opfyldt. I den endelige model er der altså ikke længere tale om brud på denne forudsætning for perioden 2006-2007. Forudsætning 5: Se under bilag 7 Forudsætning 6: Hvorvidt fejlleddet er normalfordelt kan testes vha. et histogram, hvor residualfordelingen sættes over for normalfordelingen. Pga. langt flere end 100 observationer i stikprøven anses denne forudsætning for opfyldt 30. 29 Pindyck & Rubinfeld 1998, pp. 152-159 30 Florida State University 2011 XXXIII
Bilag 9: Forudsætningstests på endelig baglæns optrevlet model 2008-2011 Nedenstående forudsætninger testes her for den endelige model til test på incitamentsvariable for perioden 2008-2011 (finanskriseperioden) efter trinvis eliminering af insignifikante variable. Dog testes kun de forudsætninger, hvis opfyldelse kan have ændret sig efter optrevlingen. Forudsætninger 31 : 1. Forholdet mellem den afhængige variabel (Y) og de uafhængige variable (X) er lineært og givet ved ligningen 2. X erne er ikke-stokastiske variable, og der er ikke nogen nøjagtigt lineær relation mellem to eller flere af de uafhængige variable, dvs. multicollinearitet må ikke være et problem 3. Fejlleddet har en forventet værdi på 0 for alle observationer 4. Fejlleddet har en konstant varians for alle observationer, dvs. homoskedasticitet skal være til stede 5. Fejlleddene tilhørende de forskellige observationer er uafhængige og derfor ukorrelerede 32, dvs. der må ikke være autokorrelation til stede 6. Fejlleddet er normalfordelt Forudsætning 1: Se under bilag 7 Forudsætning 2: 31 Pindyck & Rubinfeld 1998, p. 86 32 Pindyck & Rubinfeld 1998, p. 159 XXXIV
Her ses på, hvorvidt nogen af X-variablene kan skrives som en funktion af de øvrige X-variable. Såfremt dette er tilfældet, er der direkte afhængighed mellem nogle af X-variablene, hvilket ville indikere multicollinearitet. I så fald kan det evt. afhjælpe problemet at pille en af disse variable ud af modellen. Alternativt kan variablene evt. kombineres eller transformeres. Det ses her, at ingen af de forklarende variable har Variance Inflation Factors (VIF) over 5, hvormed det kan konkluderes, at der ikke er tegn på multicollinearitet. Forudsætning 3: Det ses her, at fejlleddet har et gennemsnit meget tæt på 0, hvormed forudsætningen kan antages at være opfyldt. Histogram: Af histogrammet ses det desuden, at residualerne for observationerne samler sig pænt omkring 0, hvorfor det er rimeligt at antage, at forudsætningen om en forventet værdi for fejlleddet på 0 er opfyldt. Forudsætning 4: XXXV
Forudsætningen om, at der skal være en konstant varians på fejlleddet for alle observationer, dvs. homoskedasticitet, testes her ved at foretage et 2 -test, hvor H 0 = 1 2 = 2 2 =... = n 2, hvor n er lig antallet af observationer (homoskedasticitet) og H 1 1 2 2 2 =... n 2 (heteroskedasticitet) 33. Da p-værdien er meget mindre end α på 0,05, forkastes H 0 med 95 % sikkerhed. Forudsætningen om homoskedasticitet kan dermed ikke antages at være opfyldt. Derfor anvendes heteroskedasticitetkonsistente standardfejl (HCSE) 34 til at korrigere herfor, og konklusionerne på testresultaterne for perioden 2008-2011 baseres på de nye t-statistikker og det nye F-test etc. Forudsætning 5: Denne forudsætning ses der ofte brud på ved tidsseriedata, idet fejlled forbundet med observationer i en given periode så går videre over i kommende perioder 35. Et sådant brud kan bevirke, at OLSregressionens standardafvigelser angives mindre end de sande standardafvigelser og dermed skævvredet i nedadgående retning 36. I sidste ende fører det til, at estimationens parameterestimater vises som mere præcise end de reelt er, hvormed der vil være en øget fejlagtig tendens til at afvise H 0 -hypotesen, selvom den måske ikke burde afvises 37. Durbin Watson-testet anvendes her til at teste for, om fejlleddene er ukorrelerede 38. Idet Durbin Watson-statistikken her er på 1,998, kan dette konkluderes at være så tæt på 2, at der ikke er seriel korrelation af betydning til stede mellem fejlleddene. Dog er tallet lidt lavere end 2, hvilket indikerer en lidt positiv korrelation 39. 33 Pindyck & Rubinfeld 1998, pp. 152-159 34 Bauwhede 2001, pp. 230-231 + Dai 2007, p. 359, note 5 + p. 361, note 6 + White 1980 35 Pindyck & Rubinfeld 1998, p. 159 36 Pindyck & Rubinfeld 1998, p. 159 37 Pindyck & Rubinfeld 1998, p. 159 38 Pindyck & Rubinfeld 1998, p. 164 39 Pindyck & Rubinfeld 1998, p. 165 XXXVI
Forudsætning 6: Hvorvidt fejlleddet er normalfordelt kan testes vha. et histogram, hvor residualfordelingen sættes over for normalfordelingen. Pga. langt flere end 100 observationer i stikprøven anses denne forudsætning for opfyldt 40. 40 Florida State University 2011 XXXVII
Bilag 10: Modelkørsel på incitamentsmodel 2006-2007 XXXVIII
Bilag 11: Modelkørsel på incitamentsmodel 2008-2011 XXXIX
Bilag 12: Antal selskaber pr. land i stikprøven XL