Rettevejledning til Økonomisk Kandidateksamen 2005II, Økonometri 1

Rettevejlednng tl Økonomsk Kanddateksamen 005II, Økonometr 1 Vurderngsgrundlaget er selve opgavebesvarelsen og blaget, nklusve det afleverede SAS program. Materalet på dskette/cd bedømmes som sådan kke, men er anvendt tl at opklare eventuelle følgefejl og lgnende besvarelsen og tl at checke at opgaven er besvaret ndvduelt. Ved bedømmelsen blver der taget udgangspunkt den anførte vægtnng af opgaverne. Der ndgår en vurderng af, om besvarelsen samlet set er konsstent og formår at belyse den overordnede problemstllng ndenfor de angvne rammer. Besvarelsen må højest fylde 16 sder (nkl. forsden) og derudover 15 sders blag. Overskrdelser skal vægtes negatvt den samlede bedømmelse. Hvor der udføres hypotesetest forventes de r redegjort for de opstllede hypoteser, hvlken teststatstk der er anvendt, dens fordelng samt sgnfkansnveauet for testet ( rettevejlednngen benyttes 5% sgnfkansnveau hvs kke andet er nævnt). Opgaven besvares ud fra et ndvdualsere t datasæt. Hvor der vejlednngen er angvet konkrete numerske resultater og konklusoner er de opnået på grundlag af eksamensnummer 117. Resultater for andre eksamensnumre kan fås ved at køre det vedlagte SAS program VEJL005II.sas med de makro- og datafler, der blev udleveret sammen med opgaven. Det kan lede tl andre konklusoner på vsse test, som så vl være korrekt svar for det pågældende eksamensnummer. Opgave 1 a. ) Parameteren ndgår en paneldata model (1.1) som er en lneær ( parametrene) regressonsmodel og kan fortolkes som en alt-andet-lge effekt på log-tmelønnen af at ændre værden af unon fra nul tl en. Den procentvse ændrng tmelønnen er approxmatvt gvet ved 100 gange parameteren. Det forventede fortegn tl parameteren kan fx begrundes at være postvt ud fra et argument om, at lønmodtagerne har større forhandlngsstyrke, hvs jobbet er overenskomstdækket.

) Varablerne d81 t, d8,..., t d 87t er tdsdummyer for de enkelte år med 1980 som refererencekategor. Dummyerne fanger den udvklng tmelønnen og de forklarende varabler over td, som er fælles for ndvderne. b. ) En tabel med udvalgte karakterstka, fx gennemsnt, varans (eller standardafvgelse), evt. mn og max af de varabler, der ndgår model (1.1). Der skal være en kort dskusson af data. Fx bemærkes meget stor sprednng tmelønnen (her ndgår både varaton over td og over ndvder), at næsten ¾ af personerne kke tlhører grupperne black eller hspan, at ca. ¼ af observatonerne vedrører personer overenskomstdækkede jobs og at næsten halvdelen af observatonerne vedrører gfte personer. Sdstnævnte er ret bemærkelsesværdgt set lyset af, at der er tale om mænd alderen mellem 17 og 30 år (alderen kan beregnes ud fra exper og educ). ) Varablen YEAR bruges tl at nddele observatonerne og gennemsnt og standardafvgelse for log-tmelønnen hhv. organserngsgraden skal beregnes for hvert af årene. Resultaterne skal opstlles en overskuelg tabel. Den gennemsntlge tmeløn stger år for år (ndeholder både nflatons- og reallønseffekter). Samlet er der tale om en gennemsntlg lønstgnng på ca. 35% over peroden. Lønsprednngen form af standardafvgelsen på log-tmelønnen for et gvet år falder frem tl 1984, øges 1985 og aftager derefter. Sprednngen er altså relatvt konstant mens lønnveauet stger. Organserngsgraden lgger ret konstant mellem 4 og 5% frem tl 1984, for derefter at falde tl 1-% 1985 og 1986, for endelg at sprnge tlbage tl 7% 1987. Altså ngen entydg tendens. Opgave a. ) Parameterestmater skal angves. Der bør kke kommenteres på størrelse, fortegn eller sgnfkans, da de opgvne forudsætnnger hverken skrer konsstens ( a kan være korreleret med en eller flere forklarende varabler) eller effcens. Ifølge datadokumentatonen er det ndvdualserede datasæt et tlfældgt udvalg fra det datasæt, der lgger tl grund for Table 14.. V forventer derfor kun at se tlfældge forskelle mellem estmaterne (og en tendens tl ldt større standardafvgelser). Dette skal underbygges med en konkret sammenlgnng for ˆβ 6 og ˆβ 7.

) I så fald er OLS estmaterne kke konsstent eller mddelrette skøn på parametrene. De estmerer altså kke alt andet lge effekterne af de forklarende varabler på log-tmelønnen, men er skæve på grund af korrelatonen mellem en eller flere forklarende varabler og de uobserverede ndvd-specfkke effekter a. Hvs formålet er at estmere sådanne effekter er Pooled OLS estmaterne altså kke brugbare. b. ) Lgnng (1.) fremkommer ved at (1.1) for 1980 fratrækkes den tlsvarende lgnng for 1987. Heraf ses at konstantleddet (1.) blver α0 = 7β4 + δ 7d871987 = 7β4 + δ7. Det skal bemærkes at exper forøges med 7 for alle personer datasættet og tdsdummen for 1987 har værden 1. ) Fejlleddet (1.) er Dv1987 = a + u1987 a u1980 = u1987 u1980 = Du1987. FE.3 skrer at Du 1987 kke er korreleret med de forklarende varabler (1.). Også de øvrge antagelser FE.1, FE. og FE.4 er antaget at være opfyldt for (1.1) (for FE.4 kan de tdsnvarante regressorer educ, black og hspan ndfortolkes a. Altså opnås der konsstente estmater af de nævnte koeffc enter tl tdsvarerende varabler. ) Estmatonsresultater skal rapporteres og der skal foretages en konkret sammenlgnng for ˆβ 6 og ˆβ 7. Ægteskabspræmen forsvnder stort set og fagforenngspræmen halveres. Der er således stor forskel forhold tl Pooled OLS estmater, hvlket må tlskrves at sdstnævnte er skæve som følge af korrelaton mellem uobserverede tds-nvarante ndvdspecfkke effekter og regressorerne (1.1), som kke betyder noget for resultaterne (1.), hvor a er elmneret. c. ) Grafsk analyse : Som mnmum forventes et kommenteret plot af resdualerne mod de predkterede værder, evt. også et plot mod expersq. ) Breusch-Pagan test for heteroskedastctet: Ud over de generelle krav vedrørende rapporterng af hypotesetest skal en fuldstændg besvarelse beskrve hjælperegressonen, der lgger tl grund for testet (enten LM eller F-test) og redegøre konkret for, at nulhypotesen om homoskedastctet kke kan afvses (hverken af LM- eller F-testet).

Man skal ord klart formulere konklusoner på baggrund af testene. Der bør gøres rede for, at man kan benytte OLS estmaterne fra (1.) og deres almndelge standardfejl, da alle antagelserne FE.1-6 er opfyldt (FE.6 følger af at personerne er tlfældgt udvalgte fra populatonen). d. ) Nulhypotesen er β 7 = 0 (ngen fagforenngspræme). Afhængg af konkluson under 1.a. argumenteres for et ensdet postvt alternatv, β 7 > 0, eller et dobbeltsdet alternatv og testet ndrettes derefter. Hypotesen skal testes ud fra resultaterne fra. b. (kke. a.). Nulhypotesen afvses, altså er der en (postv) effekt. ) Selvom kun expersq optræder drekte lgnng (1.) (da ændrngen exper er den samme for alle personer og derfor kke kan adsklles fra den generelle tdseffekt), vl en hypotese om at erfarng kke har nogen effekt kunne afvses ved blot at vse at expersq er sgnfkant lgnngen. Den relevante nulhypotese er β 5 = 0. Der skal argumenteres for alternatvet og hypotesen skal testes ud fra resultaterne fra. b. (kke. a.). Nulhypotesen afvses, altså er der en effekt af erfarng. e. ) Dummyvarablerne NE, NC og S 1987 føjes tl model (1.) som estmeres med OLS og sgnfkansen af dummyerne testes. De er kke sgnfkante, hverken enkeltvst eller samlet. Dummyvarablerne tllader, at der set forhold tl referencekategoren resten af USA - kan være regonale forskelle lønstgnngstakten afhængg af, hvor personen er bosddende 1987. Men det er der altså kke tegn på her. ) Det skal bemærkes at den udvdede udgave af (1.) alene medtager bopælen 1987. Modeller lange dfferenser som (1.) fremkommer ved at se på en model af typen (1.1) på to forskellge tdspunkter. Model (1.1) skal nddrages redegørelsen. Her er det 1980 og 1987 og v ser på varablerne ændrnger mellem de to år. Hvs de regonale områdedummyer skal overleve denne transformaton må de ndgå som nteraktonsled med tdsdummyer. Udvdes (1.1) med et sæt af regressorer, hvor NE, NC og S nteragerer med alle tdsdummyerne δ1,..., δ 7 fås netop den her betragtede udvdede udgave af (1.). Imdlertd tager en sådan model kun højde for regonale forskelle lønændrngerne, men kke de

ntale regonale lønnvauer. Inkluderer man også NE, NC og S den udvdede udgave af (1.1) tllader man sådanne nveauforskelle. Tl gengæld vl der optræde lange dfferens - led af typen D NE, D NC og D S modellen. De vl kun være nul, hvs alle personer bor samme regon 1980 og 1987. Der er data personer som flytter regon og v må derfor konkludere at den foreslåede udvdelse af model (1.) ndebærer den noget besynderlge restrkton, at der kun er regonale forskelle lønudvklngen forhold tl 1980, men kke de ntale nveauer. f. ) Af FE.3 følger, at forventnngen tl fejlleddet (1.), Du 1987, gvet de forklarende varabler modellen er nul. For både person A og person B kan den forventede lønændrng bestemmes ud fra (1.). Uddannelse og etnsk gruppe-varabler er uændrede over td. Begge personer er gft både 1980 og 1987, dvs. Dmarred falder ud af (1.). Endelg har de samme arbejdsmarkedserfarng, dvs. Dexpersq bdrager ens og falder ud sammenlgnngen mellem personer ne. Tlbage blver Dunon som er 1 for person A og 0 for person B. Den forventede forskel lønændrngen blver således koeffcenten tl Dunon som er β 7. Estmatet fra opgave.b på bass af (1.) bør angves som et mddelret og konsstent skøn på denne forskel. ) Antagelserne om modellen sger kke noget om korrelatonen mellem a og de forklarende varabler, fx unon. Hvs korrelatonen er forskellg fra nul vl den forventede 1987-løn som beskrevet af (1.1) afhænge af den konkrete værd af den uobservede ndvd - effekt a for hver af de to personer A og B. V kan kke ud fra det opgvne bestemme denne forventnng. Opgave 3 a. ) Modellen udvdes med nteraktonsled mellem unon og black hhv. hspan med koeffcenterne (fx) β 8 og β 9. Der skal argumenteres for at fagforenngspræmen blver β + β for black -gruppen, β7 + β9 for hspan-gruppen og β 7 for den etnske 7 8 referencekategor.

) OLS estmaton skal udføres på den udvdede model for alle 480 observatoner og der skal ske en konkret beregnng af alle tre fagforenngspræmer. ) Der skal redegøres for, at en kausal fortolknng af OLS estmaterne som effekten af overenskomstdæknng (at gå fra unon = 0 tl unon = 1) kræver, at fejlleddet kke er korreleret med de forklarende varabler, herunder unon dummyen og dens nteraktoner med etnske dummyer. Der må fx kke være uobserverede varabler med effekt på lønnen, som har overvejende høje re (eller lavere) værd afhængg af, om jobbet er dækket af en overenskomst. Der skal konkret tages stllng tl forudsætnngen og vurderes, at den er tvvlsom. Valget af et job med overenskomstdæknng eller ej kan sagtens være afhænggt af varabler, der kke er medtaget modellen (fx offentlg versus prvat sektor eller ndvdets grad af rskoaverson). v) Hvs de udeladte faktorer er nvarante over td for det enkelte ndvd er de repræsenteret (1.1) af a. Der skal konkret argumenteres for at Wthn estmatoren elmnerer a og dermed de problemer der lgger en evt. korrelaton mellem a og de forklarende varabler. Koeffcenter tl tdsvarerende varabler kan estmer es konsstent. I (1.1) kan koeffcenterne tl educ, black og hspan derfor kke estmeres med Wthn. For exper gælder det, at ford alle er kontnuert beskæftgelse, kan effekten kke adsklles fra tdsdummerne. I forhold tl de etnske fagforenngspræmer er det tlstrækkelgt at nteraktonsleddene har varaton over td for nogle ndvder. Altså at der nden for hver af de tre etnske grupper er nogen, der skfter fagforenngsstatus. v) Der skal udføres en Wthn estmaton (fx med proc tscsreg) af den udvdede model. Estmater og standardfejl på koeffcenter tl de forklarende varabler skal rapporteres, gerne en tabel. Der bør være en forklarng på, hvordan exper og tdsdummerne ndgår estmatonen. v) Der skal udføres test for hver gr uppe : β7 + β8 = 0 afvses og for black -gruppen er præmen sgnfkant postv; β7 + β9 = 0 kan kke afvses og for hspan-gruppen er præmen

negatv, men kke sgnfkant; og β 7 = 0 afvses så for den etnske referencekategor er præmen sgnfkant postv. Testene skal udføres ud fra Wthn estmaterne (kke fra OLS). b. Teoropgave: ) Gvet x, a og s er varansen på fejlledet u t omvendt proportonal med længde n af uddannelsen, s. Da s kke varerer over td vl varansen være konstant for det enkelte ndvd. Begge elementer skal ndgå kommentaren. ) Vl se på en fxed effect estmator, fx første -dfferens (FD) estmatoren, det Cov( s, a ) 0og Cov( x, a ) 0, t = 1, betyder at fx OLS og RE estmatoren vl være t skæv. Wthn estmatoren er ækvvalent ford T=. Første dfferenser på (1.3) gver lgnngen: y = γ, 1,,...,, x + u = n (*) For at vse at FD er mddelret kan man verfcere antagelserne FD.1-4 Wooldrdge, sde 458-9. FD.1 og FD.4: s er tds-nvarant, men ved at defnere a% = γ1s + a fås modellen på formen y = γ x + a% + u, = 1,,..., n, t = 1,,..., T, som opfylder FD.1. Der er kun en t t t regressor (*). Det må forudsættes at den faktsk varerer, dvs. nogle ndvder skfter fra at være dækket af en overenskomst tl kke at være det eller omvendt mellem perode 1 og. FD. er OK pr. antagelse opgaven. FD.3: Mddelværden af u t er nul uanset værderne af x, a og s og derfor også uanset værden af a% = γ1s + a. Hermed er FD.3 opfyldt. Samlet opfylder FD anvendt på (1.3) betngelserne for mddelret estmaton. ) For at FD anvendt på (1.3) er BLUE må også FD.5 og FD.6 være opfyldt, dvs. konstant varans på tværs af ndvder og ngen kovarans mellem dem. Det gælder at u t varerer tlfældgt over ndvder og data fremkommer som en tlfældg stkprøve, hvorfor FD.6 gælder. FD.5 holder dermod kke. Af (1.4) følger nemlg at σ Var( u x, s, a) = Eu ( x, s, a) + Eu ( 1 x, s, a ) = (hvor krydsleddene s forsvnder da u t varerer tlfældgt over td). Formen på heteroskedastcteten er kendt og den bedste lneære mddelrette estmator kan derfor opnås med WLS. Konkret skal leddene lgnngen (*) multplceres med s så det

transformede fejlled af u% = s u får varansen som kke varerer over ndvder. σ Varu (% xsa,, ) = svar( u xsa,, ) = s = σ s Opgave 4 a. Den gennemsntlge forskel tmelønnen mellem observatoner for personer byen og på landet skal beregnes. I forhold tl defntonen af rur er det mest naturlgt at regne land mnus by. Forskelle n er negatv og 13-14 procent. I land/by præmen ønsker v at tage højde for observerede forskelle mellem land- og byjobs. Det sker kke ved beregnngen af dette summarske gennemsnt. Tl sammenlgnng kan man evt. se på en OLS regresson som korrgerer for observerede varabler, men den gver ca. samme resultat form af en negatv koeffcent tl rur. b. Denne del af opgaven er åben. Mulghederne begrænses af de tlgængelge data, som bør udnyttes bedst mulgt. Modellerne skal opstlles med varabler og nteraktonsled, der ntroducerer begge forklarngerne. I lyset af de sgnfkante etnske forskelle fagforenngspræmen fra opgave 3 bør de etnske nteraktonsled med unon også medtages modellen. Mobltetsforklarngen bygger på personlge og famlemæssge forhold. Varabler datasættet som er relaterede tl sådanne forhold er marred (gfte personer må ofte flytte ægtefællen med, hvs de skfter mellem land- og byjobs og er derfor som udgangspunkt mndre moble) og hlth som angver at personen har et sundhedsmæssgt problem (og derfor også må antages at være mndre mobl). Begge varabler bør begrundes og nddrages, herunder som nteraktonsled med rur. Segmenterngsforklarngen bygger på forskelle fagforenngspræmen mellem by og land og unon og dens etnske nteraktonsled bør nddrages som nteraktonsled med rur. Begge forklarnger kan som udgangspunkt ndbygges en stor model. Det potentelle problem med korrelaton med udeladte ndvd-specfkke løndetermnanter ekssterer fortsat form af systematske forskelle mellem personer byen og på landet. Der bør derfor anvendes en form for fxed effect estmator, kke OLS eller RE. Mest nærlggende vl være at bruge Wthn estmatoren. Første -dfferenser eller lange

dfferenser vl også være OK den forstand, at de nævnte estmatorer alle elmnerer den ndvd-specfkke tds-nvarante effekt, men mndre effcent. c. Den eller de foreslåede regressoner skal gennemføres. Mstanken om nkonsstent OLS estmaton synes bekræftet af, at rur ved Wthn estmaton får en postv (om end kke særlg sgnfkant) koeffcent tl fordel for landjobs. Test af de to forklarnger udføres som hypotesetest af de foreslåede modeludvdelser. Der fndes kke evdens for nogen af forklarnger ne. Der skal konkluderes at ngen af de foreslåede forklarnger synes at bdrage tl bestemmelsen af land/by lønpræmen. Det kan konstateres at hvs man som Wthn estmatonen alene udnytter lønvaratoner for personer, der faktsk flytter mellem land og by, får man vendt fortegnet på løneffekten. Konklusonen blver derfor, at land/by lønpræmen må tlskrves uobserverede ndvdeffekter, som overvejende påvrker lønnen negatvt blandt personer på landet og postvt for personer byen. d. Datasættet gve r ret begrænsede mulgheder. En hypotese kunne være, at den summarske lønforskel smpelthen er en brancheeffekt. Mest nærlggende er det, at landbrugsjob gver lavere løn uanset personens karakterstka og at folk med landbrugsjob sagens natur hovedsage lgt bor på landet. Det har modellerne hdtl kke taget højde for. Der er branchedummer datasættet. Hvs man nkluderer et fuldt sæt dummer (fx med MAN som referencekategor) og bruger Wthn estmaton, får man godt nok en negatv løneffekt af et landbrugsjob, men stadg et postvt estmat af koeffcenten tl rur. Opgave 5 Denne del af besvarelsen bør fremstå som en samlet og overskuelg konkluson på hele opgaven. I besvarelsen skal de r demonstreres overblk over de forskellge tmelønsmodeller og evne tl at lave en overskuelg tabel, som sammenholder analyserne fra Opgave.a,.b og 3.a. Ikke alle parametre estmeres hvert tlfælde, men nspraton tl tabellens opbygnng fås fra Table 14. som opgaveteksten henvser tl. Kommentaren skal væ re fokuseret på overenskomstvarablen og der skal være en klart formuleret konkluson for, hvad der er det (eller de) foretrukne estmat(er) og om der er en sgnfkant effekt af overenskomstdæknng på tmelønnen. Det er der, hvert fald for vsse etnske grupper, og de forelggende resultater synes kke at strde mod en kausal fortolknng af effekten.