Generel illustration af SAS Enterprise Guide projekt:
|
|
- Agnete Paulsen
- 8 år siden
- Visninger:
Transkript
1 Bilagsoversigt: Bilag 1: Dokumentation af data og data flow i SAS Enterprise Guide... II Bilag 2: Søgekriterier i Orbis... X Bilag 3: Dummy-variable for år... XI Bilag 4: Modelkørsel på modificeret Jones-model pr. år i perioden XII Bilag 5: Forudsætningstests for estimation af modificeret Jones-model... XV Bilag 6: Modelkørsel på modificeret Jones-model på grupperede perioder ( hhv )... XX Bilag 7: Forudsætningstests på incitamentsvariable... XXI Bilag 8: Forudsætningstests på endelig baglæns optrevlet model XXXI Bilag 9: Forudsætningstests på endelig baglæns optrevlet model XXXIV Bilag 10: Modelkørsel på incitamentsmodel XXXVIII Bilag 11: Modelkørsel på incitamentsmodel XXXIX Bilag 12: Antal selskaber pr. land i stikprøven... XL I
2 Bilag 1: Dokumentation af data og data flow i SAS Enterprise Guide For at eksekvere SAS-programmerne bag denne afhandling, behøves der blot en lokal installation af SAS Enterprise Guide v. 4.3 med fuld SAS Foundation 9.3 samt fuld SAS STAT licens. Kopiér folderen <CD-ROM-DREV>\Orbis_SAS_data fra vedlagte CD-ROM til computerens C: drev. Gå derefter til folderen C:\Orbis_SAS_Data\SAS_programs og udvælg de relevante programmer. Programmerne er nummererede i kronologisk rækkefølge. Alle væsentlige datasæt er eksporteret både som SAS-tabeller og Excel-filer, ligesom outputs fra deskriptive statistikker og regressioner er placeret naturligt i foldere som html-filer. I nedenstående gennemgang er folder- og filnavne endvidere præsenteret. SAS Enterprise Guide er et intuitivt peg- og klik-værktøj, som betyder, at langt de fleste operationer i systemet kan klares uden programmørviden. Det har dog været nødvendigt at indsætte rigtig SAS-kode i Enterprise Guide-projekterne, da ikke alt i indeværende kunne løses via standardfunktionalitet. Da SAS Enterprise Guide kører på en del af SAS Foundation, er der mulighed for at eksekvere samtlige SAS-procedurer i Enterprise Guide, hvorved der ikke er nogen begrænsninger i SAS Enterprise Guide, hvorfor bl.a. hele SAS STAT pakken er til rådighed. Det har været nødvendigt at udvikle ekstra kode til håndtering af labels (kolonnebeskrivelser efter datatransformationer), til winsorizing af variable samt til regressioner med heteroskedasticitetkonsistente standardafvigelser. SAS Enterprise Guide-pogrammerne er placeret i folderen: <CD-ROM-DREV>\Orbis_SAS_Data\SAS_programs med filtype.egp. Det er kun muligt at åbne programmerne med en installeret SAS Enterprise Guide version 4.3. Generel illustration af SAS Enterprise Guide projekt: II
3 Step 1: Formål: Generering af en datatabel indeholdende alle finansielle data til kørsel af Jones-modeller Program: 1_Create_raw_data Efter udtræk fra Orbis databasen, er data hentet til i alt 3.txt-filer. Orbis har en begrænsning på antallet af kolonner, der kan eksporteres, hvorfor der er eksporteret to filer; nemlig Total_data_1 og Total_data_2, som er placeret på C:\Orbis_SAS_Data\0_Orbis_raw_data. Disse filer er sammensat ud fra den unikke selskabskode. Antallet af selskaber i udtrækket er For Orbis filtervalg, se venligst udtræksstrategien fra Orbis C:\Orbis_SAS_Data\0_Orbis_raw_data i filen Search_criteria.xlsx samt beskrivelsen af valgene i afhandlingen eller evt. bilag 2. Orbis-udtrækket pr. datatype (fx total assets) pr. år er kolonner, og det ønskes at sammenflette 7 kolonner til én (år fra 2005 til 2011). Dette gøres ved at transponere alle numeriske kolonner til en værdi-kolonne. Herefter benyttes det, at beskrivelsen på alle kolonner pr. datatype er konsistent, nemlig '[Total assets] th EUR 2011', hvor [XXXX] er pr. år, th er tusinder, [XXXXXX] er datatypen. Denne beskrivelse deles i to, dvs. en year-kolonne indeholdende [XXXX] og en variabel-kolonne indeholdende '[XXXXXX] th eur'. Herved kan data transponeres endnu engang, denne gang ved at få hver datatype (regnskabspost) tilbage på kolonnerne, dog for alle år pr. datatype. Tabellen indeholder nu observationer (2.884 selskaber * 7 år) pga. datatransponeringen. Rådata fra kørslen er blevet eksporteret både som SAS-tabel og som xls-fil ( ) i folderen C:\Orbis_SAS_data\SAS_cleaned_data. Se fil transposed_raw_data.sas7bdat og transposed_raw_data.xls. Endelig er samtlige data for Vestas Wind Systems A/S (DK ) blevet kontrolleret for datavaliditet for 2011 og Alle de behandlede data er korrekte for Vestas Wind Systems A/S - både mht. reliabilitet (indeholder Orbis-databasen korrekte tal?) og fuldstændighed (er alle de korrekte regnskabsposter blevet trukket ud?). III
4 Step 2: Formål: At skabe en tabel, så det vides, om selskaberne bruger hhv. big4-revisor, og om der har været skift i ledelsen Program: 1_1_Create_raw_data_auditor_management Udtrækket Total_data_3 benyttes, igen placeret C:\Orbis_SAS_Data\0_Orbis_raw_data. Funktionalitet fra Orbis med samtlige udfyldte linjer virker desværre ikke. Derfor mangler der selskabsnavn og selskabsnummer ud for de linjer, hvor der er flere advisors eller flere personer i ledelsen. Derfor skabes via specialprogram disse linjer, så selskabsnummer og selskabsnavn altid er udfyldt. Ledelsesskift: Der antages et ledelsesskift, når en ny person er indtrådt i topledelsen i det givne år. Hvis ingen nyindtrædelser i topledelsen, betragtes dette som intet ledelsesskift. Hvis en person forlader ledelsen, er det ikke opfattet som et ledelsesskift (Orbis-databasen har ganske få observationer vedr. dato for ledelsesskift, hvorfor det ikke virker som et validt datafelt). Big4 auditor: Det antages, at Big4 er KPMG, PwC, Ernst & Young samt Deloitte. Der søges efter disse virksomhedsnavne i auditor -kolonnen. Det bemærkes, at Orbis-databasen kun indeholder den nuværende revisor, men ikke historiske data herom, så hvis et selskab i nogle af årene ikke har haft en Big4 auditor, er det ikke muligt at opdage dette. Derfor vil alle, som har Big4 auditor pt. (regnskabsår 2011) få en kode med Big4 auditor. Er et selskab gået væk fra at have Big4 i perioden, vil dette ligeledes ikke fremgå, men blot få kategoriseringen ikke-big4. Der er enkelte selskaber, som har flere revisorer fra Big4, men her behandles selskabet, som om selskabet blot har én Big4 revisor. Både tabeller for ledelsesskift og big4 auditor er blevet eksporteret til C:\Orbis_SAS_Data\1_SAS_cleaned_data som hhv. både.sas-tabeller og.xls-filer. IV
5 Step 3: Formål: Danne en SAS-tabel med transformerede winsorized data til regression Program: 2_Create_regres_data_all_incl_winsorization Der tages udgangspunkt i de rådata, som er skabt via SAS-programmet 1_Create_raw_data.egp. Først flyttes kolonner rundt, så det giver fornuftig mening. Derefter skabes kolonner med t-1 værdier for de relevante datatyper, så delta-variable kan beregnes. Specialprogram designet via open code i SAS-projektet for at beregne t-1 værdier. Efter deltavariable er beregnet, fjernes år 2005, så datasættet mindskes fra til observationer. Grunddata, som benyttes til variable i den modificerede Jones-model og Kothari-inspirerede modificerede Jones-model bliver behandlet med 98 % winsorization, hvilket vil sige, at værdier under 1. percentilen udskiftes med 1. percentilværdien, og værdier over 99. percentilen udskiftes med 99. percentilen. Makro til brug for winsorizing er inspireret af: Makroen kan ses på C:\Orbis_SAS_Data\SAS_macros\Winsorize.sas og benyttet i indeværende program for de relevante variable (regnskabsposter, som indgår i Jones model). Dernæst skabes de variable, som skal bruges i Jones-regressionen til generering af fejlled (de styrbare periodiseringer). Følgende variable er beregnet til den modificerede Jones-model: TA_ (Absolutte værdier) TA REV-REC PPE Alle er deflateret med Total Assets (t-1). Alle beregnede variable er kontrolleret med udgangspunkt i Vestas Wind Systems A/S for 2010 og Slutteligt er samtlige deskriptive statistikker på grunddata for hele perioden ( ) samt pr. år både før og efter winsorization eksporteret til html-filer placeret i folderen C:\Orbis_SAS_Data\3_SAS_regression_output med præfiks Statistics*.html. Ved generering af beregnede variable smider SAS Enterprise Guide labels (beskrivelsen på kolonnen) væk. Derfor er der lavet et program, som genskriver disse. Fejlen i programmet er dokumenteret her: V
6 Step 4: Formål: At skabe en tabel med dummy- og kontrolvariable til regression på fejlleddet (styrbare periodiseringer) fra den modificerede Jones-model. Program: 3_Create_dummy_and_control_variables_for_error_term_regressions Først genereres en tabel med stamdata. Herefter skabes følgende variable: X1 - X5: År : Tages ud fra Annual reporting year X6: Gæld / egenkapital Beregnes ud fra tidligere anvendte variable X7: Ledelsesskift Se specialprogram vedr. ledelsesskift og revisor X8: Profit omkring 0 Der tages +/- 0,5 % af omsætningen. Er profitten mindre end +0,5 % af omsætningen eller større end -0,5 % af omsætningen, er profitten omkring 0 X9: Negativ indtjening Profit før skat negativ eller 0 X10: Revisor Se specialprogram vedr. ledelsesskift og revisor X11: Markedsværdi Log-transformeret variabel af markedsværdien i mio. EUR X12: Retslig tilstand To retstraditioner common law (GB-IE) vs. code law X13: Vækst i omsætning Ændring i omsætning (år (t) minus sidste år (t-1)) / omsætning sidste år (t-1) Tabellen er herefter klar til at modtage fejlled fra modificeret Jones-model til brug for hypotese 3. VI
7 Step 5: Formål: At lave plots for at verificere en lineær sammenhæng mellem forklaret variabel og forklarende variable Program: 4_Assumptions_tests Der laves plots for 1. Modificeret Jones-model data (winsorized) for at sikre lineære sammenhænge mellem deflaterede totale periodiseringer og de forklarende variable (hypotese 1 + 2). 2. For incitamentsmodellen (hypotese 3) sikres den lineære sammenhæng mellem modellens kontinuerte variable for såvel perioden som for og de styrbare periodiseringer (det estimerede fejlled). VII
8 Step 6: Formål: At lave et program, som har alle regressioner til brug for afhandlingens hypotese 1-3 Program: 5_Regression_analysis_all Programmet er bygget op på baggrund af to tabeller: 1. Winsorized_Jones_data (fra step 3) 2. Alle incitaments- og kontrolvariable (benævnt X1-X13) til brug for regression på fejlled fra den modificerede Jones-model / den Kothari-inspirerede modificerede Jones-model (fra step 4) Så vidt muligt er alle forudsætningstests en del af output for de enkelte regressioner. F.s.v. angår plots m.v. henvises dog til programmet i forrige step. Beskrivelserne dækker programmet "oppefra og ned" Fuld model for perioden : Først er der på winsorized data lavet en modificeret Jones OLS-regression til brug for besvarelse af hypotese 1 omhandlende, hvorvidt der kan påvises resultatstyring i perioden Det estimerede fejlled er gemt i en separat tabel, hvor der tilføjes incitaments- og kontrolvariable via nøglerne selskabsnummer og år samt laves deskriptiv statistik. Endelig køres fejlled imod samtlige incitaments- og kontrolvariable for at se, hvilke incitamenter, der kan forklare resultatstyringen i hele perioden. Ovenstående modificerede Jones-model estimeres også via OLS-regression per år. OLS laves ligeledes på den Kothari-inspirerede modificerede Jones-model med ROA for at sammenligne med grundmodellen. I afhandlingen argumenteres for, at der opdeles i perioder hhv. før og under finanskrisen. Perioden : Der tages udelukkende udgangspunkt i data for perioden OLSregression som for hhv. hypotese 2 og hypotese 3, deskriptiv statistik på fejlleddet samt en baglæns trinvis eliminering af insignifikante variable. Perioden : Der tages udelukkende udgangspunkt i data for perioden Dvs. OLS-regression for hhv. hypotese 2 og hypotese 3, deskriptiv statistik på fejlleddet samt en baglæns trinvis eliminering af insignifikante variable Da det viser sig, at der er problemer med heteroskedasticitet for regressioner vedr. hypotese 3, laves i bunden af programmet kørsel med heteroskedasticitet-konsistente statistikker for incitamentshypotesen for perioden samt for perioden , og for den baglæns VIII
9 trinvise eliminering for perioden estimeres endnu engang OLS-regression, denne gang med proc reg-proceduren med optionen "/white" 1. 1 White 1980 IX
10 Bilag 2: Søgekriterier i Orbis Product name Orbis Update number 100 Software version Data update 01/06/2012 (n 10000) Username Aarhus Business School-6415 Export date 02/06/2012 Step result Search result 1. All active companies and companies with unknown situation 84,805,531 84,805, Accounting practice: IFRS (International Financial Reporting Standards) 3. World region/country/region in country: Eastern Europe, Western Europe 4. BvD major sectors: 01. Primary sector, 02. Food, beverages, tobacco, 03. Textiles, wearing apparel, leather, 04. Wood, cork, paper, 05. Publishing, printing, 06. Chemicals, rubber, plastics, non-metallic products, 07. Metals & metal products, 08. Machinery, equipment, furniture, recycling, 09. Gas, Water, Electricity, 10. Construction, 11. Wholesale & retail trade, 12. Hotels & restaurants, 13. Transport, 14. Post & telecommunications, 17. Other services, 19. Education, Health 1,267,002 1,179,047 54,175,965 1,165,818 79,896,021 1,151, Current assets: All companies with a known value, 2011, 2010, 2009, 2008, 2007, 2006, 2005, for all the selected periods 709,049 3, Cash & cash equivalent: All companies with a known value, 2011, 2010, 2009, 2008, 2007, 2006, 2005, for all the selected periods 550,483 3, Current liabilities: All companies with a known value, 2011, 2010, 2009, 2008, 2007, 2006, 2005, for all the selected periods 711,966 3, Depreciation & Amortization: All companies with a known value, 2011, 2010, 2009, 2008, 2007, 2006, 2005, for all the selected periods 274,184 2, Total assets: All companies with a known value, 2011, 2010, 2009, 2008, 2007, 2006, 2005, for all the selected periods 721,058 2, Tangible fixed assets: All companies with a known value, 2011, 2010, 2009, 2008, 2007, 2006, 2005, for all the selected periods 706,978 2, Operating revenue (Turnover): All companies with a known value, 2011, 2010, 2009, 2008, 2007, 2006, 2005, for all the selected periods 575,988 2, Debtors: All companies with a known value, 2011, 2010, 2009, 2008, 2007, 2006, 2005, for all the selected periods 656,129 2, P/L before tax: All companies with a known value, 2011, 2010, 2009, 2008, 2007, 2006, 2005, for all the selected periods 405,966 2,884 Boolean search : 1 And 2 And 3 And 4 And 5 And 6 And 7 And 8 And 9 And 10 And 11 And 12 And 13 TOTAL 2,884 X
11 Bilag 3: Dummy-variable for år Angående dummy-variable for årene gælder følgende: XI
12 Bilag 4: Modelkørsel på modificeret Jones-model pr. år i perioden : 2007: XII
13 2008: 2009: XIII
14 2010: 2011: XIV
15 Bilag 5: Forudsætningstests for estimation af modificeret Jones-model Forudsætninger 2 : 1. Forholdet mellem den afhængige variabel (Y) og de uafhængige variable (X) er lineært og givet ved ligningen 2. X erne er ikke-stokastiske variable, og der er ikke nogen nøjagtigt lineær relation mellem to eller flere af de uafhængige variable, dvs. multicollinearitet må ikke være et problem 3. Fejlleddet har en forventet værdi på 0 for alle observationer 4. Fejlleddet har en konstant varians for alle observationer, dvs. homoskedasticitet skal være til stede 5. Fejlleddene tilhørende de forskellige observationer er uafhængige og derfor ukorrelerede 3, dvs. der må ikke være autokorrelation til stede 6. Fejlleddet er normalfordelt Forudsætning 1: Dette testes vha. scatter plots, hvor observationerne for de uafhængige variable afbilledes i plottet ift. den afhængige variabel, dvs. totale periodiseringer. 2 Pindyck & Rubinfeld 1998, p Pindyck & Rubinfeld 1998, p. 159 XV
16 Af ovenstående scatter plots ses en tydelig lineær sammenhæng mellem den afhængige variabel, deflaterede totale periodiseringer, og de forklarende variable hver for sig, dvs. hhv. deflateret invers total aktivsum fra foregående år, deflateret ændring i kontantsalg og deflaterede materielle anlægsaktiver. Forudsætning 2: XVI
17 Her ses på, hvorvidt nogen af X-variablene kan skrives som en funktion af de øvrige X-variable. Såfremt dette er tilfældet, er der direkte afhængighed mellem nogle af X-variablene, hvilket ville indikere multicollinearitet. I så fald kan det evt. afhjælpe problemet at pille en af disse variable ud af modellen. Alternativt kan variablene evt. kombineres eller transformeres. Det ses her, at ingen af de forklarende variable har Variance Inflation Factors (VIF) over 5, hvormed det kan konkluderes, at der ikke er tegn på multicollinearitet. Forudsætning 3: Det ses her, at fejlleddet har et gennemsnit på næsten 0, hvormed forudsætningen kan antages at være opfyldt. Histogram: Af histogrammet ses det desuden, at residualerne for observationerne samler sig pænt omkring 0 med en lille overvægt til plussiden, men alt i alt viser dette ligeledes, at det er rimeligt at antage, at forudsætningen om en forventet værdi for fejlleddet på 0 er opfyldt. Forudsætning 4: XVII
18 Forudsætningen om, at der skal være en konstant varians på fejlleddet for alle observationer, dvs. homoskedasticitet, testes her ved at foretage et 2 -test, hvor H 0 = 1 2 = 2 2 =... = n 2, hvor n er lig antallet af observationer (homoskedasticitet) og H =... n 2 (heteroskedasticitet) 4. Da p-værdien på 0,5537 er større end α på 0,05, er der ikke belæg for at afvise H 0 med 95 % sikkerhed. Forudsætningen om homoskedasticitet må dermed antages at være opfyldt. Forudsætning 5: Denne forudsætning ses der ofte brud på ved tidsseriedata, idet fejlled forbundet med observationer i en given periode går videre over i kommende perioder 5. Et sådant brud kan bevirke, at OLSregressionens standardafvigelser angives mindre end de sande standardafvigelser og dermed skævvredet i nedadgående retning 6. I sidste ende fører det til, at estimationens parameterestimater vises som mere præcise end de reelt er, hvormed der vil være en øget fejlagtig tendens til at afvise H 0 -hypotesen, selvom den måske ikke burde afvises 7. Durbin Watson-testet anvendes her til at teste for, om fejlleddene er ukorrelerede 8. Idet Durbin Watson-statistikken her er på 1,923 og dermed under 2, indikerer dette en lidt positiv seriel 4 Pindyck & Rubinfeld 1998, pp Pindyck & Rubinfeld 1998, p Pindyck & Rubinfeld 1998, p Pindyck & Rubinfeld 1998, p Pindyck & Rubinfeld 1998, p. 164 XVIII
19 korrelation. Da tallet dog er meget tæt på 2, kan det dog tilnærmelsesvist konkluderes, at der ikke er seriel korrelation til stede mellem fejlleddene 9. Forudsætning 6: Hvorvidt fejlleddet er normalfordelt kan testes vha. et histogram, hvor residualfordelingen sættes over for normalfordelingen. Pga. langt flere end 100 observationer i stikprøven anses denne forudsætning for opfyldt 10. Denne antagelse bestyrkes endvidere af, at der i datasættet er foretaget winsorization, hvormed evt. outliers er blevet korrigeret. 9 Pindyck & Rubinfeld 1998, p Florida State University 2011 XIX
20 Bilag 6: Modelkørsel på modificeret Jones-model på grupperede perioder ( hhv ) XX
21 Bilag 7: Forudsætningstests på incitamentsvariable Nedenstående forudsætninger testes for modellerne for test på incitamentsvariablene for såvel perioden som perioden Forudsætninger 11 : 1. Forholdet mellem den afhængige variabel (Y) og de uafhængige variable (X) er lineært og givet ved ligningen 2. X erne er ikke-stokastiske variable, og der er ikke nogen nøjagtigt lineær relation mellem to eller flere af de uafhængige variable, dvs. multicollinearitet må ikke være et problem 3. Fejlleddet har en forventet værdi på 0 for alle observationer 4. Fejlleddet har en konstant varians for alle observationer, dvs. homoskedasticitet skal være til stede 5. Fejlleddene tilhørende de forskellige observationer er uafhængige og derfor ukorrelerede 12, dvs. der må ikke være autokorrelation til stede 6. Fejlleddet er normalfordelt 11 Pindyck & Rubinfeld 1998, p Pindyck & Rubinfeld 1998, p. 159 XXI
22 Test for perioden Forudsætning 1: Dette testes vha. scatter plots, hvor observationerne for de uafhængige variable afbilledes i plottet ift. den afhængige variabel, dvs. de styrbare periodiseringer deflateret med total aktivsum fra det foregående år. Dog afbilledes dummy-variablene ikke i scatter plots, idet de kun kan antage værdierne 0 og 1. XXII
23 Af ovenstående scatter plots ses en tydelig lineær sammenhæng mellem den afhængige variabel, deflaterede styrbare periodiseringer, og de forklarende variable hver for sig, dvs. hhv. gældsratioen, logaritmen til markedsværdien ultimo året og salgsvækst. Forudsætning 2: Her ses på, hvorvidt nogen af X-variablene kan skrives som en funktion af de øvrige X-variable. Såfremt dette er tilfældet, er der direkte afhængighed mellem nogle af X-variablene, hvilket ville XXIII
24 indikere multicollinearitet. I så fald kan det evt. afhjælpe problemet at pille en af disse variable ud af modellen. Alternativt kan variablene evt. kombineres eller transformeres. Det ses her, at ingen af de forklarende variable har Variance Inflation Factors (VIF) over 5, hvormed det kan konkluderes, at der ikke er tegn på multicollinearitet. Forudsætning 3: Det ses her, at fejlleddet har et gennemsnit på næsten 0, hvormed forudsætningen kan antages at være opfyldt. Histogram: Af histogrammet ses det desuden, at residualerne for observationerne samler sig pænt omkring 0 med en lille overvægt til minussiden, men alt i alt viser dette ligeledes, at det er rimeligt at antage, at forudsætningen om en forventet værdi for fejlleddet på 0 er opfyldt. Forudsætning 4: XXIV
25 Forudsætningen om, at der skal være en konstant varians på fejlleddet for alle observationer, dvs. homoskedasticitet, testes her ved at foretage et 2 -test, hvor H 0 = 1 2 = 2 2 =... = n 2, hvor n er lig antallet af observationer (homoskedasticitet) og H =... n 2 (heteroskedasticitet) 13. Da p-værdien på 0,0005 er mindre end α på 0,05, forkastes H 0 med 95 % sikkerhed. Forudsætningen om homoskedasticitet kan dermed ikke antages at være opfyldt. Forudsætning 5: Denne forudsætning ses der ofte brud på ved tidsseriedata, idet fejlled forbundet med observationer i en given periode går videre over i kommende perioder 14. Et sådant brud kan bevirke, at OLSregressionens standardafvigelser angives mindre end de sande standardafvigelser og dermed skævvredet i nedadgående retning 15. I sidste ende fører det til, at estimationens parameterestimater vises som mere præcise end de reelt er, hvormed der vil være en øget fejlagtig tendens til at afvise H 0 -hypotesen, selvom den måske ikke burde afvises 16. Durbin Watson-testet anvendes her til at teste for, om fejlleddene er ukorrelerede 17. Idet Durbin Watson-statistikken her er på 1,713 og dermed under 2, indikerer dette en lidt positiv seriel korrelation. Da tallet dog er forholdsvist tæt på 2, kan det dog tilnærmelsesvist konkluderes, at der ikke er seriel korrelation til stede mellem fejlleddene 18. Forudsætning 6: Hvorvidt fejlleddet er normalfordelt kan testes vha. et histogram, hvor residualfordelingen sættes over for normalfordelingen. Pga. langt flere end 100 observationer i stikprøven anses denne forudsætning for opfyldt Pindyck & Rubinfeld 1998, pp Pindyck & Rubinfeld 1998, p Pindyck & Rubinfeld 1998, p Pindyck & Rubinfeld 1998, p Pindyck & Rubinfeld 1998, p Pindyck & Rubinfeld 1998, p Florida State University 2011 XXV
26 Test for perioden Forudsætning 1: Dette testes vha. scatter plots, hvor observationerne for de uafhængige variable afbilledes i plottet ift. den afhængige variabel, dvs. de styrbare periodiseringer deflateret med total aktivsum fra det foregående år. Dog afbilledes dummy-variablene ikke i scatter plots, idet de kun kan antage værdierne 0 og 1. XXVI
27 Af ovenstående scatter plots ses en lineær sammenhæng mellem den afhængige variabel, deflaterede styrbare periodiseringer, og de forklarende variable hver for sig, dvs. hhv. gældsratioen, logaritmen til markedsværdien ultimo året og salgsvækst. Forudsætning 2: XXVII
28 Her ses på, hvorvidt nogen af X-variablene kan skrives som en funktion af de øvrige X-variable. Såfremt dette er tilfældet, er der direkte afhængighed mellem nogle af X-variablene, hvilket ville indikere multicollinearitet. I så fald kan det evt. afhjælpe problemet at pille en af disse variable ud af modellen. Alternativt kan variablene evt. kombineres eller transformeres. Det ses her, at ingen af de forklarende variable har Variance Inflation Factors (VIF) over 5, hvormed det kan konkluderes, at der ikke er tegn på multicollinearitet. Forudsætning 3: Det ses her, at fejlleddet har et gennemsnit meget tæt på 0, hvormed forudsætningen kan antages at være opfyldt. Histogram: Af histogrammet ses det desuden, at residualerne for observationerne samler sig pænt omkring 0 med en lille overvægt til minussiden, men alt i alt viser dette ligeledes, at det er rimeligt at antage, at forudsætningen om en forventet værdi for fejlleddet på 0 er opfyldt. Forudsætning 4: XXVIII
29 Forudsætningen om, at der skal være en konstant varians på fejlleddet for alle observationer, dvs. homoskedasticitet, testes her ved at foretage et 2 -test, hvor H 0 = 1 2 = 2 2 =... = n 2, hvor n er lig antallet af observationer (homoskedasticitet) og H =... n 2 (heteroskedasticitet) 20. Da p-værdien på under 0,0001 er meget mindre end α på 0,05, forkastes H 0 med 95 % sikkerhed. Forudsætningen om homoskedasticitet kan dermed ikke antages at være opfyldt. Forudsætning 5: Denne forudsætning ses der ofte brud på ved tidsseriedata, idet fejlled forbundet med observationer i en given periode går videre over i kommende perioder 21. Et sådant brud kan bevirke, at OLSregressionens standardafvigelser angives mindre end de sande standardafvigelser og dermed skævvredet i nedadgående retning 22. I sidste ende fører det til, at estimationens parameterestimater vises som mere præcise end de reelt er, hvormed der vil være en øget fejlagtig tendens til at afvise H 0 -hypotesen, selvom den måske ikke burde afvises 23. Durbin Watson-testet anvendes her til at teste for, om fejlleddene er ukorrelerede 24. Idet Durbin Watson-statistikken her er på 1,997, kan dette konkluderes at være så tæt på 2, at der ikke er seriel korrelation af betydning til stede mellem fejlleddene. Dog er tallet lidt lavere end 2, hvilket indikerer en lidt positiv korrelation 25. Forudsætning 6: 20 Pindyck & Rubinfeld 1998, pp Pindyck & Rubinfeld 1998, p Pindyck & Rubinfeld 1998, p Pindyck & Rubinfeld 1998, p Pindyck & Rubinfeld 1998, p Pindyck & Rubinfeld 1998, p. 165 XXIX
30 Hvorvidt fejlleddet er normalfordelt kan testes vha. et histogram, hvor residualfordelingen sættes over for normalfordelingen. Pga. langt flere end 100 observationer i stikprøven anses denne forudsætning for opfyldt Florida State University 2011 XXX
31 Bilag 8: Forudsætningstests på endelig baglæns optrevlet model Nedenstående forudsætninger testes her for den endelige model til test på incitamentsvariable for perioden efter trinvis eliminering af insignifikante variable. Dog testes kun de forudsætninger, hvis opfyldelse kan have ændret sig efter optrevlingen. Forudsætninger 27 : 1. Forholdet mellem den afhængige variabel (Y) og de uafhængige variable (X) er lineært og givet ved ligningen 2. X erne er ikke-stokastiske variable, og der er ikke nogen nøjagtigt lineær relation mellem to eller flere af de uafhængige variable, dvs. multicollinearitet må ikke være et problem 3. Fejlleddet har en forventet værdi på 0 for alle observationer 4. Fejlleddet har en konstant varians for alle observationer, dvs. homoskedasticitet skal være til stede 5. Fejlleddene tilhørende de forskellige observationer er uafhængige og derfor ukorrelerede 28, dvs. der må ikke være autokorrelation til stede 6. Fejlleddet er normalfordelt Forudsætning 1: Se under bilag 7 Forudsætning 2: 27 Pindyck & Rubinfeld 1998, p Pindyck & Rubinfeld 1998, p. 159 XXXI
32 Her ses på, hvorvidt nogen af X-variablene kan skrives som en funktion af de øvrige X-variable. Såfremt dette er tilfældet, er der direkte afhængighed mellem nogle af X-variablene, hvilket ville indikere multicollinearitet. I så fald kan det evt. afhjælpe problemet at pille en af disse variable ud af modellen. Alternativt kan variablene evt. kombineres eller transformeres. Det ses her, at ingen af de forklarende variable har Variance Inflation Factors (VIF) over 5, hvormed det kan konkluderes, at der ikke er tegn på multicollinearitet. Forudsætning 3: Det ses her, at fejlleddet har et gennemsnit meget tæt på 0, hvormed forudsætningen kan antages at være opfyldt. Histogram: Af histogrammet ses det desuden, at residualerne for observationerne samler sig pænt omkring 0 med en lille overvægt til minussiden, men alt i alt viser dette ligeledes, at det er rimeligt at antage, at forudsætningen om en forventet værdi for fejlleddet på 0 er opfyldt. Forudsætning 4: XXXII
33 Forudsætningen om, at der skal være en konstant varians på fejlleddet for alle observationer, dvs. homoskedasticitet, testes her ved at foretage et 2 -test, hvor H 0 = 1 2 = 2 2 =... = n 2, hvor n er lig antallet af observationer (homoskedasticitet) og H =... n 2 (heteroskedasticitet) 29. Da p-værdien er større end α på 0,05, fastholdes H 0 med 95 % sikkerhed. Forudsætningen om homoskedasticitet kan dermed antages at være opfyldt. I den endelige model er der altså ikke længere tale om brud på denne forudsætning for perioden Forudsætning 5: Se under bilag 7 Forudsætning 6: Hvorvidt fejlleddet er normalfordelt kan testes vha. et histogram, hvor residualfordelingen sættes over for normalfordelingen. Pga. langt flere end 100 observationer i stikprøven anses denne forudsætning for opfyldt Pindyck & Rubinfeld 1998, pp Florida State University 2011 XXXIII
34 Bilag 9: Forudsætningstests på endelig baglæns optrevlet model Nedenstående forudsætninger testes her for den endelige model til test på incitamentsvariable for perioden (finanskriseperioden) efter trinvis eliminering af insignifikante variable. Dog testes kun de forudsætninger, hvis opfyldelse kan have ændret sig efter optrevlingen. Forudsætninger 31 : 1. Forholdet mellem den afhængige variabel (Y) og de uafhængige variable (X) er lineært og givet ved ligningen 2. X erne er ikke-stokastiske variable, og der er ikke nogen nøjagtigt lineær relation mellem to eller flere af de uafhængige variable, dvs. multicollinearitet må ikke være et problem 3. Fejlleddet har en forventet værdi på 0 for alle observationer 4. Fejlleddet har en konstant varians for alle observationer, dvs. homoskedasticitet skal være til stede 5. Fejlleddene tilhørende de forskellige observationer er uafhængige og derfor ukorrelerede 32, dvs. der må ikke være autokorrelation til stede 6. Fejlleddet er normalfordelt Forudsætning 1: Se under bilag 7 Forudsætning 2: 31 Pindyck & Rubinfeld 1998, p Pindyck & Rubinfeld 1998, p. 159 XXXIV
35 Her ses på, hvorvidt nogen af X-variablene kan skrives som en funktion af de øvrige X-variable. Såfremt dette er tilfældet, er der direkte afhængighed mellem nogle af X-variablene, hvilket ville indikere multicollinearitet. I så fald kan det evt. afhjælpe problemet at pille en af disse variable ud af modellen. Alternativt kan variablene evt. kombineres eller transformeres. Det ses her, at ingen af de forklarende variable har Variance Inflation Factors (VIF) over 5, hvormed det kan konkluderes, at der ikke er tegn på multicollinearitet. Forudsætning 3: Det ses her, at fejlleddet har et gennemsnit meget tæt på 0, hvormed forudsætningen kan antages at være opfyldt. Histogram: Af histogrammet ses det desuden, at residualerne for observationerne samler sig pænt omkring 0, hvorfor det er rimeligt at antage, at forudsætningen om en forventet værdi for fejlleddet på 0 er opfyldt. Forudsætning 4: XXXV
36 Forudsætningen om, at der skal være en konstant varians på fejlleddet for alle observationer, dvs. homoskedasticitet, testes her ved at foretage et 2 -test, hvor H 0 = 1 2 = 2 2 =... = n 2, hvor n er lig antallet af observationer (homoskedasticitet) og H =... n 2 (heteroskedasticitet) 33. Da p-værdien er meget mindre end α på 0,05, forkastes H 0 med 95 % sikkerhed. Forudsætningen om homoskedasticitet kan dermed ikke antages at være opfyldt. Derfor anvendes heteroskedasticitetkonsistente standardfejl (HCSE) 34 til at korrigere herfor, og konklusionerne på testresultaterne for perioden baseres på de nye t-statistikker og det nye F-test etc. Forudsætning 5: Denne forudsætning ses der ofte brud på ved tidsseriedata, idet fejlled forbundet med observationer i en given periode så går videre over i kommende perioder 35. Et sådant brud kan bevirke, at OLSregressionens standardafvigelser angives mindre end de sande standardafvigelser og dermed skævvredet i nedadgående retning 36. I sidste ende fører det til, at estimationens parameterestimater vises som mere præcise end de reelt er, hvormed der vil være en øget fejlagtig tendens til at afvise H 0 -hypotesen, selvom den måske ikke burde afvises 37. Durbin Watson-testet anvendes her til at teste for, om fejlleddene er ukorrelerede 38. Idet Durbin Watson-statistikken her er på 1,998, kan dette konkluderes at være så tæt på 2, at der ikke er seriel korrelation af betydning til stede mellem fejlleddene. Dog er tallet lidt lavere end 2, hvilket indikerer en lidt positiv korrelation Pindyck & Rubinfeld 1998, pp Bauwhede 2001, pp Dai 2007, p. 359, note 5 + p. 361, note 6 + White Pindyck & Rubinfeld 1998, p Pindyck & Rubinfeld 1998, p Pindyck & Rubinfeld 1998, p Pindyck & Rubinfeld 1998, p Pindyck & Rubinfeld 1998, p. 165 XXXVI
37 Forudsætning 6: Hvorvidt fejlleddet er normalfordelt kan testes vha. et histogram, hvor residualfordelingen sættes over for normalfordelingen. Pga. langt flere end 100 observationer i stikprøven anses denne forudsætning for opfyldt Florida State University 2011 XXXVII
38 Bilag 10: Modelkørsel på incitamentsmodel XXXVIII
39 Bilag 11: Modelkørsel på incitamentsmodel XXXIX
40 Bilag 12: Antal selskaber pr. land i stikprøven XL
Pårørende( involvering fakta og evidens
Vi stræber efter at forbedre patientsikkerheden og skabe et sundhedsvæsen, hvor patienterne i højere grad ser og mærker, at det er til for dem. c/o Hvidovre Hospital P610 Kettegård Alle 30 2650 Hvidovre
Læs mereAppendiks 1: Selektering i Orbis
Appendiksoversigt Appendiks 1: Selektering i Orbis... I Appendiks 2: Finanstilsynets gruppe inddeling af banker... II Appendiks 3: Korrelationsmatrix for behandlede variable til udlånsvækst... III Appendiks
Læs mereHyldespjældet anno 2035 BILAG. En overordnet analyse af renoveringsbehovet i Hyldespjældet i relation til den energipolitiske milepæl for 2035.
Hyldespjældet anno 2035 BILAG En overordnet analyse af renoveringsbehovet i Hyldespjældet i relation til den energipolitiske milepæl for 2035. Udarbejdet af DTU BYG ved Diana Lauritsen Jun nov 2012 Bilag
Læs mereAppendiks Økonometrisk teori... II
Appendiks Økonometrisk teori... II De klassiske SLR-antagelser... II Hypotesetest... VII Regressioner... VIII Inflation:... VIII Test for SLR antagelser... IX Reset-test... IX Plots... X Breusch-Pagan
Læs mereFokus på Forsyning. Datagrundlag og metode
Fokus på Forsyning I notatet gennemgås datagrundlaget for brancheanalysen af forsyningssektoren sammen med variable, regressionsmodellen og tilhørende tests. Slutteligt sammenfattes analysens resultater
Læs mereBilag 12 Regressionsanalysens tabeller og forklaringer
Bilag 12 Regressionsanalysens tabeller og forklaringer Regressionsanalysens tabeller og forklaringer Regressionsanalysen vil være delt op i 2 blokke. Første blok vil analysere hvor meget de tre TPB variabler
Læs mereAnvendt Statistik Lektion 9. Variansanalyse (ANOVA)
Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:
Læs mereKIFs støtteordning. KIFs støtteordning
KIFs støtteordning KIFs bestyrelse har udarbejdet en støtteordning, som skal være med til at skabe overskuelige rammer for hvordan KIF støtter den enkelte aktive atlet i arbejdet mod bedre resultater.
Læs mereAnalysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17
nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse
Læs mereAnvendt Statistik Lektion 8. Multipel Lineær Regression
Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke
Læs mere(studienummer) (underskrift) (bord nr)
Danmarks Tekniske Universitet Side 1 af 18 sider. Skriftlig prøve: 14. december 2009 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)
Læs mereAnvendt Statistik Lektion 9. Variansanalyse (ANOVA)
Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:
Læs mereStatistik Lektion 4. Variansanalyse Modelkontrol
Statistik Lektion 4 Variansanalyse Modelkontrol Eksempel Spørgsmål: Er der sammenhæng mellem udetemperaturen og forbruget af gas? Y : Forbrug af gas (gas) X : Udetemperatur (temp) Scatterplot SPSS: Estimerede
Læs mereTænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i.
Repetition af vektor-regning Økonometri: Lektion 3 Matrix-formulering Fordelingsantagelse Hypotesetest Antag vi har to n-dimensionelle (søjle)vektorer a 1 b 1 a 2 a =. og b = b 2. a n b n Tænk på a og
Læs mereStatistik Lektion 17 Multipel Lineær Regression
Statistik Lektion 7 Multipel Lineær Regression Polynomiel regression Ikke-lineære modeller og transformation Multi-kolinearitet Auto-korrelation og Durbin-Watson test Multipel lineær regression x,x,,x
Læs mereKvantitative metoder 2
Kvantitative metoder Heteroskedasticitet 11. april 007 KM: F18 1 Oversigt: Heteroskedasticitet OLS estimation under heteroskedasticitet (W.8.1-): Konsekvenser af heteroskedasticitet for OLS Gyldige test
Læs mereMultipel Lineær Regression
Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer
Læs mereLøsning til eksamen d.27 Maj 2010
DTU informatic 02402 Introduktion til Statistik Løsning til eksamen d.27 Maj 2010 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th edition]. Opgave I.1
Læs mereStatistik FSV 4. semester 2014 Øvelser Uge 2: 11. februar
Århus 6. februar 2014 Morten Frydenberg Statistik FSV 4. semester 2014 Øvelser Uge 2: 11. februar Til disse øvelser har I brug for fishoil1.dta, der indeholder data fra det fiskeolie forsøg vi så på ved
Læs mereAnvendt Statistik Lektion 7. Simpel Lineær Regression
Anvendt Statistik Lektion 7 Simpel Lineær Regression 1 Er der en sammenhæng? Plot af mordraten () mod fattigdomsraten (): Scatterplot Afhænger mordraten af fattigdomsraten? 2 Scatterplot Et scatterplot
Læs mereØkonometri 1. Inferens i den lineære regressionsmodel 2. oktober Økonometri 1: F8 1
Økonometri 1 Inferens i den lineære regressionsmodel 2. oktober 2006 Økonometri 1: F8 1 Dagens program Opsamling om asymptotiske egenskaber: Asymptotisk normalitet Asymptotisk efficiens Test af flere lineære
Læs mereTo samhørende variable
To samhørende variable Statistik er tal brugt som argumenter. - Leonard Louis Levinsen Antagatviharn observationspar x 1, y 1,, x n,y n. Betragt de to tilsvarende variable x og y. Hvordan måles sammenhængen
Læs mere3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve
Læs mere(studienummer) (underskrift) (bord nr)
Danmarks Tekniske Universitet Side 1 af 21 sider. Skriftlig prøve: 27. maj 2010 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af (studienummer)
Læs mereAppendiks A Anvendte test statistikker
Appendiks A Anvendte test statistikker Afhandlingen opdeler testene i henholdsvis parametriske og ikke-parametriske test. De første fire test er parametriske test, mens de ikke-parametriske test udgør
Læs mereOpsamling Modeltyper: Tabelanalyse Logistisk regression Generaliserede lineære modeller Log-lineære modeller
Opsamling Modeltyper: Tabelanalyse Logistisk regression Binær respons og kategorisk eller kontinuerte forklarende variable. Generaliserede lineære modeller Normalfordelt respons og kategoriske forklarende
Læs mereEksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet
Eksamen ved Københavns Universitet i Kvantitative forskningsmetoder Det Samfundsvidenskabelige Fakultet 14. december 2011 Eksamensnummer: 5 14. december 2011 Side 1 af 6 1) Af boxplottet kan man aflæse,
Læs mereSimpel Lineær Regression
Simpel Lineær Regression Mål: Forklare variablen y vha. variablen x. Fx forklare Salg (y) vha. Reklamebudget (x). Vi antager at sammenhængen mellem y og x er beskrevet ved y = β 0 + β 1 x + u. y: Afhængige
Læs mereUge 43 I Teoretisk Statistik, 21. oktober Forudsigelser
Uge 43 I Teoretisk Statistik,. oktober 3 Simpel lineær regressionsanalyse Forudsigelser Fortolkning af regressionsmodellen Ekstreme observationer Transformationer Sammenligning af to regressionslinier
Læs mereProgram: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19
Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19 For test med signifikansniveau α: p < α forkast H 0 2/19 p-værdi Betragt tilfældet med test for H 0 : µ = µ 0 (σ kendt). Idé: jo større
Læs mereØkonometri 1. Dagens program. Den simple regressionsmodel 15. september 2006
Dagens program Økonometri Den simple regressionsmodel 5. september 006 Den simple lineære regressionsmodel (Wooldridge kap.4-.6) Eksemplet fortsat: Løn og uddannelse på danske data Funktionel form Statistiske
Læs mereLineær regression. Simpel regression. Model. ofte bruges følgende notation:
Lineær regression Simpel regression Model Y i X i i ofte bruges følgende notation: Y i 0 1 X 1i i n i 1 i 0 Findes der en linie, der passer bedst? Metode - Generel! least squares (mindste kvadrater) til
Læs mereØkonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol
Økonometri: Lektion 5 Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol 1 / 35 Veksekvirkning: Motivation Vi har set på modeller som Price
Læs mere1 Hb SS Hb Sβ Hb SC = , (s = )
PhD-kursus i Basal Biostatistik, efterår 2006 Dag 6, onsdag den 11. oktober 2006 Eksempel 9.1: Hæmoglobin-niveau og seglcellesygdom Data: Hæmoglobin-niveau (g/dl) for 41 patienter med en af tre typer seglcellesygdom.
Læs mereTest for strukturelle ændringer i investeringsadfærden
d. 6.10.2016 De Økonomiske Råds Sekretariat Test for strukturelle ændringer i investeringsadfærden Dette notat redegør for de stabilitetstest af forskellige tidsserier vedrørende investeringsadfærden i
Læs mereØkonomisk Kandidateksamen 2004II Økonometri 1. Læsefærdigheder hos skoleelever i Danmark
Økonomisk Kandidateksamen 2004II Økonometri 1 Læsefærdigheder hos skoleelever i Danmark Praktiske anvisninger til individuel tag-hjem eksamen i Økonometri 1: Start med at sikre dig at du kan få adgang
Læs mereEksportørgevinst i eksportrelationen
Danmarks Statistik MODELGRUPPEN Arbejdspapir* Ivanna Blagova 4. maj 2016 Eksportørgevinst i eksportrelationen Resumé: Nogle muligheder for at inkludere eksportørgevinst i eksportrelationen er undersøgt.
Læs mereReestimation af importrelationer
Danmarks Statistik MODELGRUPPEN Arbejdspapir Nis Mathias Schulte Matzen 28. november 211 Reestimation af importrelationer Resumé: Papiret estimerer import relationerne på to forskellige datasæt. Et korrigeret
Læs mereRettevejledning til Økonomisk Kandidateksamen 2007II. Kvantitative Metoder 2: Tag-hjem eksamen
Rettevejledning til Økonomisk Kandidateksamen 2007II Kvantitative Metoder 2: Tag-hjem eksamen Der skal for hver studerende foretages en samlet bedømmelse af tag-hjem gruppeopgaven og den individuelle 2-timers
Læs mereStatistik II 4. Lektion. Logistisk regression
Statistik II 4. Lektion Logistisk regression Logistisk regression: Motivation Generelt setup: Dikotom(binær) afhængig variabel Kontinuerte og kategoriske forklarende variable (som i lineær reg.) Eksempel:
Læs mere! Proxy variable. ! Målefejl. ! Manglende observationer. ! Dataudvælgelse. ! Ekstreme observationer. ! Eksempel: Lønrelation (på US data)
Dagens program Økonometri 1 Specifikation, og dataproblemer 10. april 003 Emnet for denne forelæsning er specifikation (Wooldridge kap. 9.-9.4)! Proxy variable! Målefejl! Manglende observationer! Dataudvælgelse!
Læs mereREFERAT. A. Valg af referent - Hans B. Godkendelse af mødereferater (åben + lukket) fra den 8. april Godkendt
Dato: 12. juni 2019 Referat fra bestyrelsesmøde mandag den 7. maj 2019, kl. 18:50 Afbud: Camilla REFERAT A. Valg af referent - Hans B. Godkendelse af mødereferater (åben + lukket) fra den 8. april 2019
Læs mereLøsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06)
Afdeling for Biostatistik Bo Martin Bibby 23. november 2006 Løsning til eksamensopgaven i Basal Biostatistik (J.nr.: 1050/06) Vi betragter 4699 personer fra Framingham-studiet. Der er oplysninger om follow-up
Læs mereHypoteser om mere end to stikprøver ANOVA. k stikprøver: (ikke ordinale eller højere) gælder også for k 2! : i j
Hypoteser om mere end to stikprøver ANOVA k stikprøver: (ikke ordinale eller højere) H 0 : 1 2... k gælder også for k 2! H 0ij : i j H 0ij : i j simpelt forslag: k k 1 2 t-tests: i j DUER IKKE! Bonferroni!!
Læs mereRettevejledning til Økonomisk Kandidateksamen 2007II. Økonometri 1
Rettevejledning til Økonomisk Kandidateksamen 2007II Økonometri 1 Vurderingsgrundlaget for tag-hjem eksamen er selve opgavebesvarelsen og bilaget. Programmer og data bedømmes som sådan ikke, men er anvendt
Læs mereKursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo
Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte
Læs mereRettevejledning til Økonomisk Kandidateksamen 2005I, Økonometri 1
Rettevejledning til Økonomisk Kandidateksamen 005I, Økonometri Vurderingsgrundlaget er selve opgavebesvarelsen og bilaget, inklusive det afleverede SAS program. Materialet på diskette/cd bedømmes som sådan
Læs mereØkonometri, ugeseddel 8 Hold 1 1/4-2003
1 Modeller/diagrammer med dummy er Disse tre diagrammer ligger til grund for gruppearbejdet. a) Generel regressions model g = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 +..+ β n x n + u i, Hvor i =1,.n g b) Model
Læs mereKvantitative metoder 2
Kvantitative metoder 2 Specifikation og dataproblemer 2. maj 2007 KM2: F22 1 Program Specifikation og dataproblemer, fortsat (Wooldridge kap. 9): Betydning af målefejl Dataudvælgelse: Manglende observationer
Læs mereØkonometri Lektion 1 Simpel Lineær Regression 1/31
Økonometri Lektion 1 Simpel Lineær Regression 1/31 Simpel Lineær Regression Mål: Forklare variablen y vha. variablen x. Fx forklare Salg (y) vha. Reklamebudget (x). Statistisk model: Vi antager at sammenhængen
Læs mereMLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som
MLR antagelserne Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som y = β 0 + β 1 x 1 + β 2 x 2 + + β k x k + u, hvor β 0, β 1, β 2,...,β k er ukendte parametere,
Læs mereOpgave I II III IV V VI Spørgsmål (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) Svar 5 4 4 2 3 1 1 5 4 1
Danmarks Tekniske Universitet Side 1 af 18 sider. Skriftlig prøve: 1. juni 2005 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle sædvanlige Dette sæt er besvaret af (navn)
Læs mereLøsninger til kapitel 14
Opgave 14.1 a) Linjetilpasningsplottet bliver: Løsninger til kapitel 14 Idet datapunkterne ligger tæt på og jævnt fordelt omkring den rette linje, så ser det ud til, at der med rimelighed er tale om en
Læs mereStandardformular STANDARDFORMULAR 1
1 Bilag 1 Standardformular STANDARDFORMULAR 1 1) Identiteten på det selskab, som er udsteder af den underliggende aktie, hvortil der er knyttet stemmerettigheder, herunder selskabets fulde navn og selskabsform:
Læs mereOversigtsblad. over tilblivelsen af "Haandbog i Verdens-Historien" III, Fase. 229*
fase* 229, Oversigtsblad over tilblivelsen af "Haandbog i VerdensHistorien" III, Fase. 229* Forarbejder; referat af Moncada's kataloniertog (1836) 1. til indledning; "NyaarsTiden" 2. til indledning; "NyaarsTiden"
Læs mereProdukt og marked - matematiske og statistiske metoder
Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet February 19, 2016 1/26 Kursusindhold: Sandsynlighedsregning og lagerstyring
Læs mereIndustri FLERE TAL. Industri
FLERE TAL Konjunkturbarometer for en Ordre- omsætningsindeks for Produktionsindeks for Lagerbeholdninger ens omsætning fordelt på varer 1 Råvare- tjenesteundesøgelse for en 1 Flere tal Måneds- kvartalsudgivelser:
Læs mereIndustri FLERE TAL. Industri
FLERE TAL Konjunkturbarometer for en Ordre- omsætningsindeks for Produktionsindeks for Lagerbeholdninger ens omsætning fordelt på varer 1 Råvare- tjenesteundesøgelse for en 1 Flere tal Måneds- kvartalsudgivelser:
Læs mereStatistik Lektion 20 Ikke-parametriske metoder. Repetition Kruskal-Wallis Test Friedman Test Chi-i-anden Test
Statistik Lektion 0 Ikkeparametriske metoder Repetition KruskalWallis Test Friedman Test Chiianden Test Run Test Er sekvensen opstået tilfældigt? PPPKKKPPPKKKPPKKKPPP Et run er en sekvens af ens elementer,
Læs mereLøsning til eksaminen d. 14. december 2009
DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,
Læs mereKursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo
Kursusindhold: Produkt og marked - matematiske og statistiske metoder Rasmus Waagepetersen Institut for Matematiske Fag Aalborg Universitet Sandsynlighedsregning og lagerstyring Normalfordelingen og Monte
Læs mereAnvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]
Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af
Læs mereMultipel regression. M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model
Multipel regression M variable En afhængig (Y) M-1 m uafhængige / forklarende / prædikterende (X 1 til X m ) Model Y j 1 X 1j 2 X 2j... m X mj j eller m Y j 0 i 1 i X ij j BEMÆRK! j svarer til individ
Læs mereFrødalen, afd Hillerød
Dato: 18. november 2018 Referat af bestyrelsesmøde mandag den 12. november 2018, kl. 19:00 Referat: A. Valg af referent (ny rækkefølge Lars på sidste møde) Anders er valgt B. Godkendelse af mødereferater
Læs mereGN Store Nord A/S VAT number XBRL REVIEW REPORT
GN Store Nord A/S VAT number 24 25 78 43 XBRL REVIEW REPORT Bemærk at dette er en gennemgangsrapport - en læsbar udgave af den dannede XBRL-fil. Denne rapport skal ikke indberettes til Erhvervsstyrelsen,
Læs mereDanmarks Tekniske Universitet Side?? af 20 sider
Danmarks Tekniske Universitet Side?? af 20 sider Skriftlig prøve: 15. december 2004 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle Dette sæt er besvaret af eksaminant
Læs mereBornerim, Remser og Lege
Danske Bornerim, Remser og Lege videlnkkende efter Folkemunde samlede og til Dels optegnede af Evald Tang Kristensen. Århus. Jacob Zcuners Bogtrykkeri. I Kommission hos Karl Schonberg i Kjobenhavn. 1896.
Læs mereØkonometri 1 Forår 2006 Ugeseddel 11
Økonometri 1 Forår 2006 Ugeseddel 11 Program for øvelserne: Gruppearbejde og plenumdiskussion Introduktion til SAS øvelser SAS øvelser Øvelsesopgave 5: Paneldata estimation af indkomstligninger på danske
Læs mereStatistik Lektion 16 Multipel Lineær Regression
Statistik Lektion 6 Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk
Læs mereMultipel Lineær Regression. Polynomiel regression Ikke-lineære modeller og transformation Multi-kolinearitet Auto-korrelation og Durbin-Watson test
Multipel Lineær Regression Polynomiel regression Ikke-lineære modeller og transformation Multi-kolinearitet Auto-korrelation og Durbin-Watson test Multipel lineær regression x,x,,x k uafhængige variable
Læs mereAppendiks - Speciale ITU 2002 Offline XML Datavarehus. Figuroversigt. Afsnit 1 Figur 1.1 Fiktiva s nuværende datastruktur
Figuroversigt 1. Kapitel Testdata Afsnit 1 Figur 1.1 Fiktiva s nuværende datastruktur Afsnit 2 Figur 1.2 Fiktiva s fremtidige datastruktur Afsnit 3 Figur 1.3 Datamodel for forhandler databaser Afsnit 4
Læs mereØkonometri: Lektion 6 Emne: Heteroskedasticitet
Økonometri: Lektion 6 Emne: Heteroskedasticitet 1 / 32 Konsekvenser af Heteroskedasticitet Antag her (og i resten) at MLR.1 til MLR.4 er opfyldt. Antag MLR.5 ikke er opfyldt, dvs. vi har heteroskedastiske
Læs mereUniversity of Copenhagen. Notat om statistisk inferens Larsen, Martin Vinæs. Publication date: Document Version Peer-review version
university of copenhagen University of Copenhagen Notat om statistisk inferens Larsen, Martin Vinæs Publication date: 2014 Document Version Peer-review version Citation for published version (APA): Larsen,
Læs mereLøsning eksamen d. 15. december 2008
Informatik - DTU 02402 Introduktion til Statistik 2010-2-01 LFF/lff Løsning eksamen d. 15. december 2008 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition, 7th
Læs mereProgram. 1. Varianskomponent-modeller (Random Effects) 2. Transformation af data. 1/12
Program 1. Varianskomponent-modeller (Random Effects) 2. Transformation af data. 1/12 Dæktyper og brændstofforbrug Data fra opgave 10.43, side 360: cars 1 2 3 4 5... radial 4.2 4.7 6.6 7.0 6.7... belt
Læs mereBilag I. ~ i ~ Oversigt BILAG II MATEMATISK APPENDIKS. The Prisoner s Dilemma THE PRISONER S DILEMMA INTRODUKTION I RELATION TIL SAMORDNET PRAKSIS
Oversigt BILAG I I THE PRISONER S DILEMMA INTRODUKTION I RELATION TIL SAMORDNET PRAKSIS I I II BILAG II III GENNEMSIGTIGHEDENS BETYDNING III MATEMATISK APPENDIKS V GENERELT TILBAGEDISKONTERINGSFAKTOREN
Læs mereCenter for Statistik. Multipel regression med laggede responser som forklarende variable
Center for Statistik Handelshøjskolen i København MPAS Tue Tjur November 2006 Multipel regression med laggede responser som forklarende variable Ved en tidsrække forstås i almindelighed et datasæt, der
Læs mereØVELSER Statistik, Logistikøkonom Lektion 8 og 9: Simpel og multipel lineær regression
! ØVELSER Statistik, Logistikøkonom Lektion 8 og 9: Simpel og multipel lineær regression Eksempel 1 AT OPSTILLE EN SIMPEL LINEÆR REGRESSIONSMODEL - GENNEMGÅS AF JAKOB Et stort lager måler løbende sine
Læs mereDanmarks Tekniske Universitet Side 1 af 19 sider
Danmarks Tekniske Universitet Side 1 af 19 sider Skriftlig prøve: 2. juni 2004 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle sædvanlige Dettesæterbesvaretafeksaminant
Læs mere1 Regressionsproblemet 2
Indhold 1 Regressionsproblemet 2 2 Simpel lineær regression 3 2.1 Mindste kvadraters tilpasning.............................. 3 2.2 Prædiktion og residualer................................. 5 2.3 Estimation
Læs mereAnvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele
Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Motiverende eksempel Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning
Læs mereMindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning
1 Regressionsproblemet 2 Simpel lineær regression Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning 3
Læs mereSide 1 af 21 sider. Danmarks Tekniske Universitet. Skriftlig prøve: 15. december 2003. Kursus navn og nr: Introduktion til Statistik, 02402
Danmarks Tekniske Universitet Side 1 af 21 sider Skriftlig prøve: 15. december 2003 Kursus navn og nr: Introduktion til Statistik, 02402 Tilladte hjælpemidler: Alle sædvanlige Dette sæt er besvaret af
Læs mereØkonometri B i R. Sebastian Barfort.
Økonometri B i R Sebastian Barfort sebastian.barfort@econ.ku.dk Hvis man gerne vil igang med R, men har svært ved den stejle læringskurve, kan nedenstående måske fungere som en slags guide. For at have
Læs mereAnvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]
Anvendt Statistik Lektion 6 Kontingenstabeller χ 2 -test [ki-i-anden-test] 1 Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination
Læs mere1 Multipel lineær regression
1 Multipel lineær regression Regression med 2 eksponeringsvariable Fortolkning og estimation AnovaTabel og multipel R 2 Ensidet variansanalyse: Dummy kodning Kovariansanalyse og effektmodifikation Tosidet
Læs mereDen personlige skattepligtige indkomst
Danmarks Statistik MODELGRUPPEN Arbejdspapir Birgitte A. Mathiesen 10. marts 1994 Den personlige skattepligtige indkomst Resumé: Formålet med dette papir er at reestimere relationen for skattepligtig indkomst.
Læs mereOut-of-sample forecast samt reestimation af ADAMs lønligning
Danmarks Statistik MODELGRUPPEN Arbejdspapir* Peter Agger Troelsen 31. oktober 2013 Out-of-sample forecast samt reestimation af ADAMs lønligning Resumé: Papiret reestimerer ADAMs lønligning og vurderer
Læs mereLandmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen
Landmålingens fejlteori Lektion Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ - rw@math.aau.dk Institut for Matematiske Fag Aalborg Universitet En stokastisk variabel er en variabel,
Læs mereStatistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom
Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab Eksamensopgave E05 Socialklasse og kronisk sygdom Data: Tværsnitsundersøgelse fra 1986 Datamaterialet indeholder: Køn, alder, Højest opnåede
Læs mereA. Valg af referent (Rækkefølge inkl. suppleanter) Anders er valgt Ny rækkefølge (fra næste møde er): Hans, Lars, Camilla, Christian, Anders
Dato: 14. april 2019 Referat af bestyrelsesmøde mandag den 8. april 2019, kl. 19:00 Afbud fra Camilla & Lars Referat: A. Valg af referent (Rækkefølge inkl. suppleanter) Anders er valgt Ny rækkefølge (fra
Læs mere5.11 Middelværdi og varians Kugler Ydelse for byg [Obligatorisk opgave 2, 2005]... 14
Module 5: Exercises 5.1 ph i blod.......................... 1 5.2 Medikamenters effektivitet............... 2 5.3 Reaktionstid........................ 3 5.4 Alkohol i blodet...................... 3 5.5
Læs mereØkonometri: Lektion 2 Multipel Lineær Regression 1/27
Økonometri: Lektion 2 Multipel Lineær Regression 1/27 Multipel Lineær Regression Sidst så vi på simpel lineær regression, hvor y er forklaret af én variabel. Der er intet, der forhindre os i at have mere
Læs mereReestimation af uddannelsessøgende til modelversion okt15
Danmarks Statistik MODELGRUPPEN Arbejdspapir* Laurits Rømer Hjorth 5. oktober 2015 Reestimation af uddannelsessøgende til modelversion okt15 Resumé: Relationen for uddannelsessøgende reestimeres til modelversion
Læs mereAnvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele
Anvendt Statistik Lektion 5 Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele Motiverende eksempel Antal minutter brugt på rengøring/madlavning: Rengøring/Madlavning
Læs mereØkonometri: Lektion 4. Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater
Økonometri: Lektion 4 Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater 1 / 35 Hypotesetest for én parameter Antag vi har model y = β 0 + β 1 x 2 + β 2 x 2 + + β k x k + u. Vi
Læs mereØkonometri 1. Oversigt. Mere om dataproblemer Gentagne tværsnit og panel data I
Oversigt Økonometri 1 Mere om dataproblemer Gentagne tværsnit og panel data I Info om prøveeksamen Mere om proxyvariabler og målefejl fra sidste gang. Selektion og dataproblemer Intro til nyt emne: Observationer
Læs mereSupplerende dokumentation af boligligningerne
Danmarks Statistik MODELGRUPPEN Arbejdspapir* Ralph Bøge Jensen 13. september 2010 Supplerende dokumentation af boligligningerne Resumé: Papiret skal ses som et supplement til den nye Dec09-ADAM dokumentation
Læs mereIntroduktion til GLIMMIX
Introduktion til GLIMMIX Af Jens Dick-Nielsen jens.dick-nielsen@haxholdt-company.com 21.08.2008 Proc GLIMMIX GLIMMIX kan bruges til modeller, hvor de enkelte observationer ikke nødvendigvis er uafhængige.
Læs mere