Rettevejledning til Økonomisk Kandidateksamen 6II, Økonometri Vurderingsgrundlaget er selve opgavebesvarelsen og bilaget. Programmer og data, som er aleveret elektronisk, bedømmes som sådan ikke, men er anvendt.eks. til at opklare eventuelle ølgeejl og lignende i besvarelsen, og til at checke at opgaven er besvaret individuelt. Ved bedømmelsen er der taget udgangspunkt i den vægtning a opgaverne, der er anørt i opgaveteksten. I den samlede bedømmelse indgår desuden en vurdering a, om besvarelsen samlet set er konsistent og indenor de angivne rammer ormår at belyse den overordnede problemstilling, der rejses i opgaven. I opgaveteksten er det anørt, at besvarelsen højst må ylde 6 sider (inkl. orsiden og derudover 5 sider bilag. Overskrides omanget a opgavebesvarelsen, skal det vægtes negativt i den samlede bedømmelse. Hvor der udøres hypotesetest orventes der redegjort or de opstillede hypoteser, den anvendte teststatistik og ordeling samt signikansniveauet or testet (i rettevejledningen benyttes 5% signikansniveau hvis ikke andet er nævnt. Henvisninger i rettevejledningen henviser til lærebogen Wooldridge Introductory Econometrics, 3. udgave hvis intet andet er nævnt. Opgaven besvares ud ra individualiserede datasæt. Hvor der i vejledningen er angivet konkrete numeriske resultater og konklusioner, er disse baseret på eksamensnummer 7. Resultater or andre eksamensnumre kan ås ved at køre det vedlagte SAS program VEJL6II.sas med det relevante eksamensnummer, samt de udleverede macro- og data-iler. Konklusionerne med andre eksamensnumre kan deror avige ra denne vejledning. Opgave Spørgsmål a: Fortolkning a modellen i Fortolkningen a parametrene: β kan ortolkes som det approksimative procentvise akast a et års ekstra uddannelse alt andet lige. Parameteren orventes at være positiv. Det giver ikke mening at lave alt andet lige ortolkninger a parameteren β 3 alene, idet det ikke er muligt at variere variablen alder uden at variere variablen alder. Parametrene β og β 3 kan ortolkes som eekten a alder på lønnen. Vi orventer et aldende akast med alderen, så deror orventes at β 3 <. ii Parameteren β optræder ikke i model (, idet model ( remkommer ved at tage ørste derenser i model (. Spørgsmål b: Beskrivelse a data i Data beskrives ved en tabel, som angiver gennemsnit, varians (eller standardavigelse samt evt. min og ma. Kommentarer vedr. tabellen bør indeholde en kort diskussion a, om der er oplagte problemer med data. Det kan bemærkes, at der indes en 49-årig kvinde i data, som har en anciennitet på 55 år. Dette tyder på, at der er måleejl i data.
ii En krydstabel med srudd og trudd eller en tabel over srudd-trudd opstilles. Tabellen viser, at der i de leste tilælde er overensstemmelse mellem egen og tvillingens rapportering a data. Korrelationen mellem disse to variable er også høj ca.,67. Opgave Spørgsmål a i I dette spørgsmål rapporteres OLS estimaterne a model (. Der bør ikke kommenteres på evt. signikans a estimaterne, da man endnu ikke har checket or gyldigheden a OLS variansen (da MLR 5 muligvis ikke er opyldt. ii De studerende skal nævne at orudsætningerne or at OLS er konsistent og middelret er at antagelserne MLR-MLR4 er opyldt. Desuden bør de også kunne pege på, at antagelsen MLR 4 ( Ev ( X = hvor X er vektoren a regressorer, sandsynligvis ikke er opyldt på grund a ability bias (uobserverbare evner er korrelerede med uddannelsesniveauet. Dette vil medøre at OLS estimatoren ikke er middelret eller konsistent. Spørgsmål b i De studerende skal gøre rede or, at model ( kan ås ved at lave ørste derenser a model (. Ideen med transormationen er at jerne den del a det observerede ejlled, som har med evner at gøre. Uobserverbare evner kan give anledning til biased estimater, idet disse evner har betydning or lønnen og kan være korreleret med uddannelse. Hvis evner udelukkende er genetisk betinget, vil transormationen jerne evnerne ra det transormerede ejlled, idet man nu udelukkende kigger på orskelle imellem genetisk identiske tvillinger. Hvis evner også er bestemt a andre aktorer, er det ikke sikkert, at transormationen vil jerne evnerne ra det uobserverbare ejlled. ii OLS estimationen a model ( udøres, og estimationsresultaterne rapporteres. Der bør ikke kommenteres på evt. signikans a estimaterne, da man endnu ikke har checket or gyldigheden a OLS variansen (da MLR 5 muligvis ikke er opyldt. De studerende bør bemærke, at OLS estimaterne a model ( og ( aviger meget, hvilket tyder på, at antagelse MLR 4 ikke er opyldt or model (. Spørgsmål c i De studerende bør udøre og rapportere graiske test a residualerne, som vil kunne asløre heteroskedasticitet (.eks. residualerne (eller residualerne i anden plottet mod en eller lere a de orklarende variable eller den prædikterede værdi a den ahængige variabel. Konklusionen er at der ingen tegn er på heteroskedasticitet. ii Breuch-Pagan test or heteroskedasticitet udøres ved at lave ølgende hjælperegression: uˆ = δ + δ ( srudd srudd + δ ( London London + δ ( gt gt + 3 δ4( anciennitet anciennitet + δ5( deltid deltid + ejl, hvor û er residualerne ra OLS regressionen a (. Hvis regressionen har signikant orklaringsgrad, er det tegn på heteroskedasticitet. Nulhypotesen H : δ = δ = δ3 = δ4 = δ5 = er en hypotese om homoskedasticitetet. Testet kan udøres som et F-test or hjælperegressionens orklaringsgrad. F-teststørrelsen F=,9 er appro. F(5,84-ordelt med p-værdien p=,7. Udøres testet i stedet som et LM test ås
Spørgsmål d teststørrelsen til LM = nr = 9,339 = 6,43. Teststørrelsen er asymp. χ (5, og p- værdien er her p=,66. I begge tilælde kan nulhypotesen ikke avises. Altså ikke tegn på heteroskedasticitet. I dette spørgsmål bør de studerende redegøre or hvilken hypotese som testes, samt anøre teststørrelsen, dens ordeling og drage den rigtige konklusion på baggrund a testet. Desuden kan det anøres, at antagelsen MLR 6 (normalitet a ejlleddet ikke er undersøgt, så deror benyttes de asymptotiske resultater. De asymptotiske resultater orudsætter et stort antal observationer, hvilket er opyldt her (9 observationer. i I denne opgave testes hypotesen H : β =,8 mod et dobbeltsidet alternativ ( H: β, 8. Teststørrelsen kan udregnes som en F-teststørrelse (eller t-teststørrelse som er appro. F-ordel med (,85 rihedsgrader. F-teststørrelsen er bestemt til,9 med en p-værdi på,89. Anvendes et 5 % signikansniveau kan hypotesen ikke avises, dvs. vi kan ikke avise, at akastet a uddannelse er 8, %. ii Der bør i besvarelsen skelnes mellem, at model ( ikke indeholder variablen alder (og deror ikke identicerer en evt. eekt på lønnen og om alder som sådan er med til at bestemme lønnen I denne opgave testes lg. hypotese H : β = β 4 5 = β6 = β7 =. Teststørrelsen kan udregnes som en F- teststørrelse som er appro. F-ordelt med (4,85 rihedsgrader. F-teststørrelsen er bestemt til,67 med en p-værdi på,65. Anvendes et 5 % signikansniveau kan hypotesen ikke avises. Dvs. vi kan ikke avise, at uddannelse udelukkende er bestemt a uddannelsesniveauet og aktorer som er ælles or begge tvillinger.eks. alder, opvækstvilkår og orældres karakteristika. Spørgsmål e De studerende bør bemærke at akastet til anciennitet er estimeret til ca. % i model (, mens det er -, % i model (. Forskellen kan skyldes ability bias, idet ability bias vil betyde at alle OLSestimatorne i model ( er inkonsistente. Desuden kan det bemærkes at orskellen mellem de to estimater kan ikke orklares med ringe variation i variablen anciennitet anciennitet (der indes nemlig en betydelig variation i denne variabel. Det kan dog bemærkes, at der sandsynligvis optræder måleejl i anciennitet (j. spørgsmål.b.ii. Studerende kan evt. bemærke at måleejl i model ( vil give større bias (j. spørgsmål 3.b. Spørgsmål i I model ( er eekten a alder (og alder kvadreret ikke identiceret, ordi variationen i alder indenor et tvillingpar per deinition er. Deror er det ikke muligt på baggrund a tvillingestudier at estimere eekten a alder. ii De studerende bør redegøre or, hvorledes model ( kan udvides, således at man tillader, at akastet a uddannelse ahænger a alderen. Den udvidede model kan se således ud: 3
Opgave 3 Spørgsmål a ln( timeløn ln( timeløn = β ( srudd srudd + β ( London London 4 + β5( gt gt + β6( anciennitet anciennitet + β7( deltid deltid + β8(( srudd srudd alder + v v Besvarelser som også inkluderer interaktionsled mellem uddannelse og alder kvadreret skal også regnes or korrekt besvarelse. Estimeres modellen, inder man, at akastet a uddannelse er atagende med alder (eller stigende med ødselsår. Dette kan ortolkes således, at akastet a uddannelse er højere or yngre ødselskohorter (muligvis ordi kvaliteten a uddannelsen er blevet orbedret. De studerende skal gøre rede or, hvordan de udører de orskellige estimationer og test. Desuden skal de på baggrund a testene være i stand til at drage de rigtige konklusioner. i. De studerende bør begrunde, hvoror måleejl i uddannelsesvariablen betyder, at OLS estimatoren a model ( er inkonsistent. Her er det nok at bemærke, at det antages, at det er klassiske måleejl og dereter reerere til det generelle resultat om måleejl i de orklarende variable. For at opnå konsistente estimater kan IV estimation anvendes, hvor variablen med s måleejl (srudd er den endogene variabel (korreleret med ejlleddet v = u βe. Som instrument or srudd anvendes den anden tvillings oplysninger om uddannelseslængden (trudd. Denne variabel kan anvendes som instrument, idet den opylder de to betingelser: Betingelse : trudd er korreleret med srudd: s t cov( srudd, trudd = cov( udd + e, udd + e s t t s = var( udd + cov( e, udd + cov( e, udd + cov( e, e = var( udd + + + > Betingelse : trudd er ukorreleret med ejlleddet t s cov( trudd, v = cov( udd + e, u βe t s t s = cov( udd, u + cov( e, u βcov( udd, e βcov( e, e Da MLR 4 er opyldt or den sande model ølger det at cov( udd, u =. A antagelserne i t s opgaven remgår det at e er ukorreleret med e og u og hera ølger at cov( e t, u = cov( e t, e s =. Endelig gælder der at måleejlene er klassiske måleejl så deror s er cov( e, udd =. Hera sluttes at cov( trudd, v =. ii. De studerende bør redegøre or den reducerede orm regression: srudd = π + πalder + πalder + π3london + π4gt + π anciennitet + π deltid + π trudd + E 5 6 7 og opstille og teste ølgende hypotese: H : π 7 = 4
Teststørrelsen er t-ordelt med 37 rihedsgrader. t-teststørrelsen er bestemt til 6, med en tilhørende p-værdi<,. Hypotesen avises, hvilket betyder, at Betingelse kan antages at være opyldt. iii. IV-estimationen kan udøres ved at inkludere residualen Ê ra den reducerede orm regression i spørgsmål 3.a.ii.: ln( timeløn = β + βsrudd + βalder + β3alder + β4london + β5gt + β ˆ 6anciennitet + β7deltid + ρe + ejl Denne OLS regression giver IV-estimaterne (dog med orkerte standardejl, samt mulighed or at udøre et test or eogenitet. Testet udøres ved at teste hypotesen H : ρ = (srudd er eogen. Teststørrelsen er t-ordelt. Teststørrelsen er her bestemt til,7, og den tilhørende p-værdi er,863. Hera sluttes at hypotesen ikke kan avises, altså det tyder ikke på, at srudd er endogen, hvilket betyder, at OLS estimaterne bør anvendes rem or IV estimaterne, da de er mere eiciente. iv. IV estimaterne og standardejl opskrives. Det bemærkes, at testet or eogenitet ikke kunne avises, hvilket tyder på, at srudd er en eogen variabel, og OLS estimation deror bør oretrækkes. Estimationsresultaterne viser, at akastet til uddannelse er estimeret til 5,8 %. v. I dette spørgsmål bør der redegøres or, at variablen trudd kun kan anvendes som instrument, hvis antagelsen cov( udd, u = er opyldt. Hvis uobserverbare evner påvirker løn og uddannelse, er det urealistisk at antage at cov( udd, u =. Spørgsmål b I denne delopgave skal de studerende udlede orskellige udtryk. En korrekt besvarelse kræver, at der præcist bliver redegjort or, hvorledes de enkelte udregninger er lavet. I rettevejledningen er redegjort or en mulig besvarelse, andre måder at udlede de relevante størrelser på kan også være korrekte. i. Udledning : OLS-estimatoren (når ˆ β = erstattes med er givet ved: ( y ( Det benyttes nu at y = β + β + u βe idet ˆ β = (, ( β + β + u βe i ( ( ( ( u ( e = β + β + β ( ( ( (, i ( ( u ( e = β + β + β ( ( ( Grænsen i sandsynlighed kan nu udregnes til. 5
ˆ cov(, u cov(, e p lim β = β + β var( var( σ = β+ β σ + σ hvor det sidste lighedstegn ølger a at cov(, u = cov( + e, u = cov(, u + cov( e, u = + = (j. antagelserne MLR4 er opyldt or modellen og cov(, e = cov( + e, e = σ og σ var( = var( + e = σ + σ. Den asymptotiske bias er givet ved β. σ σ + ii. Udledning : OLS estimatoren i en ørste derens model er givet ved: ˆ β = FD ( ( y y ( Det benyttes nu at y y = β( + ( u u β( e e idet ˆ β = FD ( ( β ( + u u β ( e e ( ( ( u u ( ( e e = β + β ( (, i Grænsen i sandsynlighed kan nu udregnes til ˆ cov(, u u cov(, e e FD p lim β = β+ β var( var( σ σ = β + β = β β ( ( σ + σ σ σ + σ σ Det næstsidste lighedstegn ølger a: cov(, u u = cov(, u + cov(, u cov(, u cov(, u = cov(, e e = cov(, e + cov(, e cov(, e cov(, e var( = σ + σ + + = var( + var( cov(, = ( σ + σ + ( σ + σ σ = ( σ + σ σ > σ β. ( σ + σ σ Den asymptotiske bias er givet ved iii. Ved at sammenligne den asymptotiske bias i de to tilælde ses at bias er størst i ørste derens modellen når σ > (i det konkrete tilælde vil det sige at der er en positiv korrelation mellem tvillingernes sande uddannelse. Problemet med måleejl bliver altså større i en ørste derens model. 6
Opgave 4 Spørgsmål a I denne opgave skal de studerende selv gøre rede or, hvorledes de vil tage højde or både ability bias og måleejl. i. De studerende bør tage udgangspunkt i model (. Det bør her bemærkes, at model ( tager højde or ability bias men ikke or måleejl. For at korrigere or måleejl i variablen srudd srudd, skal instrument variabel estimatoren bruges. Instrumentet or srudd srudd er trudd trudd. Argumentet or at benytte denne variabel som instrument ølger a begrundelsen i spørgsmål 3.a.i. ii. I dette spørgsmål skal de studerende gennemøre en IV-estimation (dvs. de tre trin beskrevet i opgave 3.a.ii-3.a.iv. Første trin viser, at instrumentet er korreleret med den endogene variabel (testet or svage instrumenter er -,43 (t-ordelt med 85 rihedsgrader og p- værdien<.. I trin to testes or eogenitet a den potentielt endogene variabel. Testet kan ikke avise, at variablen er eogen (t-testet er -,6 som er t-ordelt med 84 rihedsgrader. IV estimationen kan udøres, og man inder så, at akastet a uddannelse er estimeret til 8, % per år. Spørgsmål b I denne del a opgaven skal nye variable vedr. rygning anvendes. i. Andelen a rygere er ca. 33 % og en beregning a den gennemsnitlige uddannelseslængde or rygere og ikke rygere er hhv. 3,3 år og 4,6 år. Der er altså en markant og signikant orskel på,3 års uddannelse mellem rygere og ikke rygere. Rygere ved 8 år har generelt en lavere uddannelse. ii. Undersøges ordelingen a rygere inden or tvillingpar, ses at der er 57 % a tvillingparrene, hvor ingen ryger, 4 % hvor begge ryger og 9 % hvor den ene ryger men ikke den anden. Beregnes orskellen i uddannelseslængde udelukkende på baggrund a orskelle inden or tvillingpar er orskellen kun,4 år og ikke længere signikant. Her er det vigtigt at tage højde or, at den rygende tvilling ikke nødvendigvis er tvilling nr.. De studerende bør bemærke, at en del a samvariationen mellem rygning og uddannelseslængde ormodentligt skyldes andre underliggende aktorer.eks. amiliebaggrund (som er ælles or tvillingerne. iii. De studerende bør her tage udgangspunkt i model ( og anvende rygning sm, sm, som instrument or den endogene variabel srudd srudd. Her er der lere muligheder, idet man kan anvende rygning alene som instrument eller sammen med instrumentet ra opgave 4.a ( trudd trudd. IV-estimationen bekræter dog, hvad der blev vist i spørgsmål 4.b.i nemlig at rygning er et svagt instrument. De studerende bør her bemærke, at det ikke giver mening at ortsætte IV estimationen, hvor rygning alene anvendes som instrument. Det bør også diskuteres om instrumentet aktisk er eogen. 7
Opgave 5 Denne del a opgaven bør remstå som en samlet konklusion på hele opgaven. De studerende behøver ikke at inddrage noget nyt her men blot på en overskuelig måde sammenatte deres hovedkonklusioner ra hele opgaven. Spørgsmål a I dette spørgsmål skal de studerende vise, at de har overblik over de orskellige modeller, og at de er i stand til at lave overskuelige tabeller, som sammenholder de vigtigste analyser, de har lavet i opgave -4. Desuden skal de kunne gøre rede or, hvordan de enkelte modeller orholder sig til hinanden. De studerende skal anøre, hvilken model de oretrækker, og anøre hvoror denne oretrækkes. Der er ikke et entydigt svar på dette spørgsmål (test or eogenitet kan ikke orkastes, så OLS estimatoren er konsistent, så her bør lægges vægt på, at de studerende kan argumentere or deres valg. Desuden kan det bemærkes at ability bias giver et or højt estimat a akastet a uddannelse, mens måleejl vil give anledning til en nedad bias i akastet a uddannelse. Det kan også bemærkes, at problemet med måleejl bliver større i model ( (estimationerne baseret på ørste derenser, hvilket bekræter de teoretiske resultater. Spørgsmål b I dette spørgsmål skal de studerende diskutere, hvorledes deres estimat a akastet a uddannelse orholder sig til det privatøkonomiske akast a uddannelse, som er opgjort i bilaget. I bilaget kan man i igur. alæse, at det privatøkonomiske akast a uddannelse i UK er ca. 4 %, altså væsentlig højere end det estimerede akast. I besvarelsen bør de studerende nævne en eller lere grunde til at deres estimat er orskelligt ra bilaget. De studerende kan.eks. pege på: Beregningerne i bilaget tager højde or at der både er gevinster og omkostninger orbundet med uddannelse (se tabel.6. Beregningerne i opgaven er udelukkende baseret på gevinsterne ved uddannelse. Beregningerne i opgaven tager altså ikke højde or løntab under uddannelse samt studieagt. Dette vil dog medøre at akast a uddannelse er estimeret højere i opgaven end i bilaget (altså den modsatte eekt a hvad vi ser Når gevinsterne ved uddannelse opgøres i bilaget tages der også højde or at højere uddannelse giver højere beskætigelse. Gevinsten a uddannelse kommer deror både ra en højere løn men også en højere beskætigelsesgrad. I opgaven okuseres udelukkende på den højere løn. - Dette vil medøre at estimatet a kastet a uddannelse bliver lavere i opgaven end i bilaget. I bilaget er beregningerne a løngevinsten opgjort eter skat. Et progressivt skattesystem vil bevirke at akastet eter skat vil blive mindre end ør skat. - Dette vil medøre at akast a uddannelse er estimeret højere i opgaven end i bilaget (altså den modsatte eekt a hvad vi ser I bilaget er beregningerne baseret på en repræsentativ person der har løn og produktivitet svarende til gennemsnittet i UK. I beregningerne i er baseret udelukkende på kvinder (og tvillinger. Det er ikke entydigt hvorledes dette vil påvirke estimatet a kastet i opgaven sammenlignet med bilaget. 8