Rettevejledning til Økonomisk Kandidateksamen 2004I, Økonometri 1

Relaterede dokumenter
Kvantitative metoder 2

Rettevejledning til Økonomisk Kandidateksamen 2005I, Økonometri 1

Rettevejledning til Økonomisk Kandidateksamen 2007II. Økonometri 1

Økonometri 1. Inferens i den lineære regressionsmodel 2. oktober Økonometri 1: F8 1

Rettevejledning til Økonomisk Kandidateksamen 2007II. Kvantitative Metoder 2: Tag-hjem eksamen

Økonomisk Kandidateksamen 2004I Økonometri 1. Kvinders arbejdsudbud

Økonometri 1. Dummyvariabler 13. oktober Økonometri 1: F10 1

Økonometri 1. Inferens i den lineære regressionsmodel 25. september Økonometri 1: F6 1

Rettevejledning til Økonomisk Kandidateksamen 2008II. Kvantitative Metoder 2: Tag-hjem eksamen

Kvantitative metoder 2

Økonometri: Lektion 6 Emne: Heteroskedasticitet

Økonometri 1. Den simple regressionsmodel 11. september Økonometri 1: F2

! Proxy variable. ! Målefejl. ! Manglende observationer. ! Dataudvælgelse. ! Ekstreme observationer. ! Eksempel: Lønrelation (på US data)

! Variansen på OLS estimatoren. ! Multikollinaritet. ! Variansen i misspecificerede modeller. ! Estimat af variansen på fejlleddet

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007

Kvantitative metoder 2

Kvantitative metoder 2

Lagrange multiplier test. Økonometri: Lektion 6 Håndtering ad heteroskedasticitet. Konsekvenser af Heteroskedasticitet

Økonometri 1. Oversigt. Mere om dataproblemer Gentagne tværsnit og panel data I

Kvantitative metoder 2

Økonometri: Lektion 6 Emne: Heteroskedasticitet

Kvantitative metoder 2

Appendiks Økonometrisk teori... II

! Husk at udfylde spørgeskema 3. ! Lineær sandsynlighedsmodel. ! Eksempel. ! Mere om evaluering og selvselektion

Økonometri: Lektion 2 Multipel Lineær Regression 1/27

Økonometri 1. Dagens program. Den multiple regressionsmodel 18. september 2006

Økonomisk Kandidateksamen 2006II Økonometri 1. Afkastet af uddannelse for britiske tvillingepar

Økonometri 1. Dagens program. Den simple regressionsmodel 15. september 2006

Økonometri 1. Prediktion. Dummyvariabler 9. oktober Økonometri 1: F9 1

Økonometri 1. Dagens program: Afslutningsforelæsning 23. maj 2007

Uge 13 referat hold 4

Rettevejledning til Økonomisk Kandidateksamen 2006II, Økonometri 1

Økonomisk Kandidateksamen 2004II Økonometri 1. Læsefærdigheder hos skoleelever i Danmark

Vejledende besvarelser til opgaver i kapitel 14

Økonometri 1. Målsætning for Økonometri 1. Dagens program: Afslutningsforelæsning 16. December 2005

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Effekten af indvandring på indfødte danskeres løn og beskæftigelse

Reestimation af importrelationer

Økonometri 1 Efterår 2006 Ugeseddel 11

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

1. Intoduktion. Undervisningsnoter til Øvelse i Paneldata

Referat : af Gruppearbejde Økonometri1 øvelsestime ugeseddel 7 dato 26/3 2003, Hold 4

Økonomisk Kandidateksamen 2003II Økonometri 1. Værdisætning af skov

W.2 Simpel lineær regression: Egenskaber ved OLS: Forudsagte værdier og residualer: Et residual:

Økonometri, ugeseddel 8 Hold 1 1/4-2003

Wooldridge, kapitel 19: Carrying out an Empirical Project. Information og spørgsmål vedr. eksamen. Økonometri 1: Afslutningsforelæsning 2

Simpel Lineær Regression: Model

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Økonometri 1. Gentagne tværsnit (W ): Opsamling. Gentagne tværsnit og paneldata. Gentagne Tværsnit og Paneldata II.

Økonometri: Lektion 2 Multipel Lineær Regression 1/33

Økonometri: Lektion 7 Emne: Prædiktionsintervaller, RESET teset, proxy variable og manglende data.

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression

Out-of-sample forecast samt reestimation af ADAMs lønligning

Økonometri 1. FunktioneI form i den lineære regressionsmodel 19. oktober Dagens program

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Statistik II 4. Lektion. Logistisk regression

Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i.

Økonometri 1 Forår 2006 Ugeseddel 11

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

Økonometri: Lektion 4. Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater

1 Regressionsproblemet 2

Konfidensintervaller og Hypotesetest

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning

Analysestrategi. Lektion 7 slides kompileret 27. oktober :24 p.1/17

Undervisningsnoter til øvelse i Panel Modeller. %, it. E(x kjs

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Kvantitative metoder 2

Fokus på Forsyning. Datagrundlag og metode

Dagens program. Praktisk information:

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Løsninger til kapitel 14

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Kvantitative metoder 2

Statistik Lektion 4. Variansanalyse Modelkontrol

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

Økonometri Lektion 1 Simpel Lineær Regression 1/31

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

Økonometri 1. Kvalitative variabler. Kvalitative variabler. Dagens program. Kvalitative variable 8. marts 2006

Tema. Dagens tema: Indfør centrale statistiske begreber.

Bilag 12 Regressionsanalysens tabeller og forklaringer

Kapitel 7 Forskelle mellem centraltendenser

Center for Statistik. Multipel regression med laggede responser som forklarende variable

Kvantitative metoder 2

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Anvendt Statistik Lektion 7. Simpel Lineær Regression

De variable, som er inkluderet i de forskellige modeller, er følgende:

Module 4: Ensidig variansanalyse

Kvantitative metoder 2

Eksportørgevinst i eksportrelationen

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

Økonometri 1. Interne evalueringer af forelæsninger. Kvalitative variabler. Dagens program. Dummyvariabler 21. oktober 2004

Reestimation af uddannelsessøgende

Betydningen af konjunktur og regelændringer for udviklingen i sygedagpengemodtagere

Kapitel 11 Lineær regression

Forelæsning 11: Kapitel 11: Regressionsanalyse

Transkript:

Rettevejledning til Økonomisk Kandidateksamen 004I, Økonometri Vurderingsgrundlaget er selve opgavebesvarelsen og bilaget. Programmer og data som er afleveret på diskette/cd bedømmes som sådan ikke, men er anvendt fx til at opklare eventuelle følgefejl og lignende i besvarelsen og til at checke at opgaven er besvaret individuelt. Ved bedømmelsen er der taget udgangspunkt i den vægtning af opgaverne, der er anført i opgaveteksten. I den samlede bedømmelse indgår desuden en vurdering af, om besvarelsen samlet set er konsistent og indenfor de angivne rammer formår at belyse den overordnede problemstilling, der rejses i opgaven. Hvor der udføres hypotesetest forventes der redegjort for de opstillede hypoteser, den anvendte teststatistik og fordeling samt signifikansniveauet for testet (i rettevejledningen benyttes 5% signifikansniveau hvis ikke andet er nævnt). Da opgaven er besvaret ud fra individualiserede datasæt er der ikke her angivet konkrete numeriske resultater. Disse kan fås ved at køre det vedlagte SAS program FACIT.sas med det relevante eksamensnummer. Vi har kun angivet retningen af de mere robuste konklusioner. I opgaveteksten er det anført at besvarelsen højest må fylde 5 sider og derudover 0 sider bilag. Overskrides omfanget af opgavebesvarelsen, skal det vægtes negativt i den samlede bedømmelse. Opgave i) De studerende skal gøre rede for, at modellen (.) er en lineær (i parametrene) regressionsmodel som beskriver sammenhængen mellem gifte kvinders arbejdsudbud og en række forklarende variable, som karakteriserer kvinden og hendes familie. Der kan evt. gives kommentarer vedr. hvilken type af forklarende variable, som indgår i modellen. ii) Fortolkningen af parameteren β er størrelsen af den absolutte ændring i den betingede middelværdi for arbejdsudbuddet i timer ved én enheds ændring i anden indkomst regnet i $.000. Fortolkningen af parameteren β er størrelsen af den absolutte ændring i den betingede middelværdi for arbejdsudbuddet i timer ved en relativ ændring i lønnen. iii) $ >0 eller $ <0 (afhængig af substitutions- og indkomsteffekt), $ <0 og $ 5 <0. Svarene bør begrundes. Spørgsmål b Data beskrives ved en tabel, som angiver gennemsnit, varians (eller standardafvigelse) evt. min og max. Kommentarer vedr. tabellen bør indeholde en kort diskussion af, om der er oplagte problemer med data (det er der ikke). Det kan bemærkes, at der er rimelig variation i arbejdsudbudsvariablen. Spørgsmål c I dette spørgsmål skal de studerende pege på, at man kan finde den gnsn. effekt på timetallet for de kvinder som allerede har et positivt arbejdsudbud - af et løntilskud ud fra et estimat af

koefficienten $, beregnet på grundlag af det foreliggende datasæt. Det kræver at man er villig til at antage, at graden hvormed løntilskuddet overvæltes i lønnen er kendt. Opgave I dette spørgsmål rapporteres OLS estimaterne af model (.). Der bør ikke kommenteres på evt. signifikans af estimaterne, da man endnu ikke har checket for gyldigheden af OLS variansen. OLS estimaterne er middelrette og konsistente, da MLR - MLR 4 antages at være opfyldt. Da man endnu ikke ved, om antagelse MLR 5 er opfyldt, kan man ikke slutte, at OLS estimaterne er efficiente. Spørgsmål b i) Den grafiske analyse laves ved at plotte OLS residualerne fra model () mod et udvalg af de forklarende variable. Alternativt kan de kvadrerede residualer plottes mod et udvalg af de forklarende variable. Den grafiske analyse tyder ikke på heteroskedasticitet. ii) Det generelle Breusch-Pagan test udføres ved at lave en hjælperegression af û på regressorerne i (.). Hvis regressionen har signifikant forklaringsgrad er det tegn på heteroskedasticitet. Hvad enten testet laves som et F-test for hjælperegressionens forklaringsgrad eller et LM-test kan nulhypotesen om homoskedasticitet ikke afvises. iii) Breush-Pagan testet for om alder er en variansstyrende variabel udføres ved at lave følgende hjælperegression û = τ0 + τage + w. Homoskedasticitet kan testes ved et t-test på τ. Hypotesen om homoskedasticitet kan ikke afvises. De studerende bør udover at komme frem til de rigtige konklusioner vedr. heteroskedasticitet også være i stand til præcist at formulere den hypotese, de tester. Desuden bør det her bemærkes, at man, når man har homoskedastiske fejlled, kan anvende standardfejl fra OLS regressionen og at t- og F-test er pålidelige (hvilket ikke vil være tilfældet, hvis der er heteroskedasticitet). Spørgsmål c i) Timelønnen kan være endogen fordi arbejdende kvinder med lav løn vil have tendens til at have uobserverede faktorer, som gør at de arbejder trods den lave løn (en lav reservationsløn ), eller omvendt at kvinder der udbyder meget arbejdskraft fordi de har smag for arbejde også er højproduktive og derfor har en høj løn. Derved bliver timeløn og fejlled korrelerede i stikprøven af arbejdende kvinder. En anden forklaring er, at timelønnen er opgivet med målefejl. ii) exper og exper skal være korrelerede med lønnen, men ukorrelerede med uobserverede faktorer som har betydningen for arbejdsudbuddet, dvs. med fejlleddet u. iii) Resultater af OLS på den reducerede form ligning for log wage rapporteres. iv) Der skal udføres et F-test af nulhypotesen om at exper og exper ikke indgår i den reducerede form for log wage. Alternativet er at mindst en af koefficienterne er

Spørgsmål d forskellig fra nul. Hypotesen forkastes klart. Testet kan bruges til at vurdere om exper og exper opfylder det første krav (jf. spm c.ii) til et instrument. Det er tilfældet her. Beregn residualerne ˆv fra model (.) og indsæt dem som ekstra regressor i model (.). OLS resultaterne rapporteres og der udføres et signifikanstest af ˆv. Nulhypotesen er at log wage er eksogen og koefficienten til ˆv er nul, alternativet at den er forskellig fra nul. T-statistikken er numerisk meget stor og nulhypotesen forkastes. Timelønnen er faktisk endogen i model (.). Spørgsmål e Resultaterne af SLS fx ved hjælp af Proc syslin rapporteres her. Spørgsmål f Hvis begge instrumenter er gyldige må de være asymptotisk ukorrelerede med fejlleddet fra SLSregressionen. R i hjælperegr. af ressls på alle eksogene variable er lille og testet for overidentifikation nr med n=4 obs. giver en tilsvarende lav teststatistik, som skal sammenlignes med en χ fordeling med frihedsgrad. Nulhypotesen er at begge instrumenter er gyldige, hvilket ikke kan forkastes. Spørgsmål g IV-estimationen giver de konsistente estimater for model (.). Testene skal således baseres på resultater fra spm. e. I denne opgave bør de studerende kunne opskrive hypotesen, udføre testet samt drage de rigtige konklusioner på baggrund af testene. i) Nulhypotesen er H 0 : β = 0. Alternativhypotesen skal formuleres således at den er konsistent med opgave, spørgsmål a, ii). T-teststørrelsen er asymptotisk standard normal fordelt. Hypotesen afvises. ii) Nulhypotesen er H 0 : β = 0. Alternativhypotesen skal formuleres således at den er konsistent med opgave, spørgsmål a, ii). T-teststørrelsen er asymptotisk standard normal fordelt. Hypotesen kan ikke afvises. iii) Hypoteserne er H 0 : β 5 = β 6 H : β 5 β 6. Kan fx testes ved at definere variablen kidstot=kidslt6+kidsge6. Under H 0 at børn af begge aldergrupper indgår på samme måde i modellen er koefficienten til kidsge6 (eller kidslt6) nul, når den inkluderes sammen med kidstot. T-teststørrelsen er asymptotisk standard normal fordelt, p-værdien er stor og vi kan ikke forkaste at børn i begge aldersgrupper indgår på samme måde i modellen. Alternativt kan testet udføres som et F-test med TEST proceduren i SAS. Spørgsmål h dhours dhours i). Fra (.) fås β = =. Et estimat af elasticiteten af antal arbejdstimer d log( wage) dwage / wage mht. timelønnen er da 3

ˆ β ε hours, wage = hours For 600 timer/år er ε hours, wage ca..5, for 300 timer/år ca.. og for 000 timer/år ca. 0.7. Elasticiteterne er positive som forventet og aftager med antallet af arbejdstimer. De forekommer meget store fx i forhold til de danske estimater, der er nævnt i introduktionen til opgaven. ii). Effekt af fast løntilskud: wage=4$/h: ˆ β *(ln(4.5)-ln(4.00))= ca. 90 timer/år wage=8$/h: ˆ β *(ln(8.5)-ln(8.00))= ca. 45 timer/år Effekt af 4% løntilskud. wage=4$/h: ˆ β *(ln(4*.04)-ln(4))= ˆ β *ln(.04) = ca. 60 timer/år wage=8$/h: = ca. 60 timer/år Opgave 3 i). OLS estimaterne rapporteres. Under de i opgaven givne antagelser vil MLR.-MLR.4 være opfyldt og estimaterne vil derfor være middelrette og konsistente. Der vil dog per konstruktion være et problem med heteroskedasticitet, hvorfor OLS ikke er efficient. Der bør derfor ikke kommenteres på signifikans. ii). Nulhypotesen i begge test er at der ikke er en systematisk samvariation mellem fejlledsvariansen fra (.3) og udføres på grundlag af uˆ = inlf -inlf. Breusch-Pagan udføres ved at lave en hjælperegression af û på regressorerne i z. Hvad enten testet laves som et F-test for hjælperegressionens forklaringsgrad eller et LM-test bliver nulhypotesen om homoskedasticitet klart afvist. White s test kan udføres ved at lave følgende hjælperegression: û = τ 0 + τinlf + τinlf + w, Testet for homoskedasticitet udføres ved at teste følgende hypotese H0 : τ = τ = 0(homoskedasticitet). Testet kan udføres som et F-test eller et LM test. Hvis testet udføres som et LM test kan teststørrelsen bestemmes som R n, hvor R stammer fra hjælperegressionen, og n er antal observationer. Teststørrelsen er χ -fordelt med frihedsgrader. Nulhypotesen kan klart afvises, dvs. fejlleddene er heteroskedastiske. White s test kan alternativt udføres med alle forklarende variable, deres kvadrater og alle interaktionsled. iii). Den lineære sandsynlighedsmodel kan prediktere sandsynligheder uden for [0,]-intervallet, men i dette datasæt sker det kun for et meget lille mindretal af kvinderne, så det bør ikke bekymre. Værre er det, at modellen (.3) indebærer konstante marginale effekter på sandsynligheden for at deltage i arbejdsstyrken. Det betyder fx at effekten af ekstra $.000 4

non-wife-income på ssh. for deltagelse er den samme uanset niveauet for alle modellens variable. At modellen ikke tillader forskellig effekt for småbarn nummer et og to, kunne dog klares med dummies også i den lineære model. Spørgsmål b i). Logit modellen estimeres med maximum likelihood. Nulhypotesen er δ 5 = 0 og alternativet bør være δ 5 0. Testet udføres fx som et Wald test på grundlag af t-teststørrelsen for ˆ δ 5. Nulhypotesen kan ikke forkastes. ii). Kidsge6 udelades af modellen.variablen kidslt6 antager værdierne 0,,. Opgaven løses fx ved at definere dummies: sbarn= hvis der er et småbarn eller mere; sbarn= hvis der småbørn. Dermed gælder kidslt6=sbarn+sbarn. Den urestrikterede model er da... + δ4( sbarn) + γ 4( sbarn) +... Nulhypotesen er at et ekstra barns effekt på indekset er uafh. af om antallet af småbørn er 0 eller, dvs. δ4 = γ 4. Pålægges denne restriktion fås... + δ ( sbarn) + γ ( sbarn) +... =... δ ( sbarn + sbarn)... =... δ kidslt6... 4 4 4 4 Så LR-testet udføres ved at estimere den urestrikterede model, dernæst den restrikterede pålagt restriktion ( δ 4 = γ 4 ). Test-værdien findes som (log Lr log Lur) hvor likelihood værdierne er fra hhv. den restrikterede og den urestrikterede model. Teststørrelsen er fordelt som χ () og har en meget stor P-værdi. Vi kan ikke forkaste at antallet af småbørn indgår lineært i indekset. iii). Den foretrukne model er modellen hvor antallet af småbørn indgår lineært (og antallet af større børn er udeladt). Logit-ssh. beregnes for alle 3 værdier af kidslt6 (og de resterende variable fastholdt på de angivne niveauer). Det giver P(inlf= x,kidslt6=0)= ca. 0.7 P(inlf= x,kidslt6=)= ca. 0.35 P(inlf= x,kidslt6=)= ca. 0. Ændringen i ssh. fra ingen småbørn til et småbarn er da: ca. -0,35 Ændringen i ssh. fra et småbarn til to småbørn er: ca. -0,4 Spørgsmål c γ i). Ved differentiation fås at den marginale effekt er nul hvisγ + γ z = 0, så z = > 0. For γ γ > 0 og γ < 0 bliver z > 0. Da γ < 0 er der tale om et maximumspunkt og fortegnene for den marginale effekt bliver som angivet i teksten. ii). Arbejdsmarkedserfaring exper indgår på den måde, der er beskrevet i i). Det betyder at den marginale effekt af erfaring er positiv men aftagende, hvilket forekommer rimeligt nok, men at der i princippet vil der være store værdier af exper, hvor den marginale effekt på 5

arbejdsudbuddet bliver negativ. Indsættes estimaterne fås at den marginale effekt af erfaring på deltagelsessandsynligheden når nul ved ca. 3 års erfaring. Kun 3 kvinder har en erfaring som overstiger dette og den praktiske betydning for resultaterne er derfor ringe. Opgave 4 Opgave 4.a har en temmelig åben karakter og der er generelt flere mulige metoder. Her er nævnt nogle eksempler. b) i) Kræver at den observerede log-timeløn og log-(-marginalskatten) er ukorrelerede. En tilstrækkelig betingelse herfor er en konstant marginalskat, som da blot ændrer konstantleddet. Ikke særligt realistisk og stemmer dårligt fx med et plot af mtr overfor wage. ii) Hvis ikke marginalskatten er konstant bliver budgetlinjen (i et forbrug/fritidsdiagram) ikke- lineær (evt. stykkevis lineær). Hvis man antager, at det kun er kvindens lønindkomst som bestemmer den marginale skatteprocent, ville en estimation med log(wage*(-marg.skat)) i stedet for lwage kunne anvendes. Datasættet giver fx mulighed for at beregne timelønnen efter (marginal)skat og lade den indgå i modellen i stedet for wage. Det bør her bemærkes, at lønnen som vist i opgave er endogen og at det også gælder efter-skat lønnen, som må instrumenteres. Man kunne også tænke sig at lade log (wage) og marginalskatten indgå hver for sig og teste restriktionen til efter-skat lønnen. Med exper og exper som instrumenter giver det eksakt identifikation, men der er andre variabler i datasættet, som muligvis vil kunne anvendes som instrumenter, fx uddannelsesvariabler. I så fald bør der argumenteres for gyldigheden af disse og udføres de relevante test svarende til opgave c-f. Et simpelt plot af marginalskatten overfor earnings viser klart at der i data er meget stor heterogenitet i marginalskatten for samme niveau af kvindens lønindkomst. i) Betragt regressionsligningen hours = λ 0 + λ ln( wage*) + u. Hvis earnings er opgjort med målefejl har vi earnings* earnings / e wage* = hours = hours. Indsat i regr. giver dette earnings / e earnings hours = λ0 + λln + u = λ0 + λln λln e + u hours hours Da vil ln earnings generelt være korreleret med det sammensatte fejlled. Situationen svarer til en hours klassisk målefejlsmodel og OLS vil være inkonsistent. For at IV estimationen fra opg..e. fortsat er brugbar, må vi endvidere kræve, at exper og exper er ukorreleret med målefejlen ln(e). 6

ii) Betragt igen ligningen hours = λ 0 + λ ln( wage*) + u. Nu antages hours målt med additiv fejl. Vi har da (med genbrug af symbolet e): earnings hours* = λ0 + λln + u hours * earnings hours e = λ0 + λln + u hours e earnings earnings hours = λ0 + λln + u + e = λ0 + λln + ξ( hours, e) + u + e hours e hours I den nederste regression er ξ en ikke-lineær funktion af målefejlen. Det sammensatte fejlled ξ (.)+u+e vil generelt være korreleret med earnings og OLS derfor inkonsistent. Det er ikke nogen klassisk målefejlsmodel pga. ikke-lineariteten og den omstændighed, at målefejlen optræder både på højre- og venstresiden. Derfor kan de analytiske resultater i pensum ikke bruges her. Man kunne alternativt lave et simulationseksperiment, hvor man fx bruger faktiske observationer af variablerne, antager specifikke fordelinger for målefejlen og for fejlleddet, og givne værdier af parametrene λ0 og λ. Anvendelsen af OLS på et stort antal genererede datasæt vil give et bud på inkonsistensen i OLS estimatoren under den mere generelle målefejlsmodel. Det vil givetvis være svært at udlede noget generelt fra disse simulationer. Opgave 5 Denne del af opgaven bør fremstå som en samlet konklusion på hele opgaven. De studerende behøver ikke at inddrage noget nyt her men blot på en overskuelig måde at sammenfatte deres hovedkonklusioner fra hele opgaven. I dette spørgsmål skal de studerende vise, at de har overblik over de forskellige modeller, og at de er i stand til at lave overskuelige tabeller, som sammenholder de vigtigste analyser, de har lavet i opgave -4 for henholdsvis time- og deltagelsesbeslutningen. Desuden skal de kunne gøre rede for, hvordan de enkelte modeller forholder sig til hinanden. De studerende skal anføre, hvilken model de foretrækker, og anføre hvorfor denne foretrækkes. Spørgsmål b I dette spørgsmål skal de studerende diskutere forskelle mellem de amerikanske og de danske resultater. Begge estimater er positive, men de amerikanske elasticiteter, der blev beregnet i opgave. h er meget større end de danske, der er refereret i introduktionen. De danske estimater er et gennemsnit over forskellige indkomstgrupper, men de amerikanske estimater er meget højere uanset timetal, så det forklarer næppe forskellene. På grundlag af det foreliggende materiale kunne man fx pege på: 7

Generelt har kvinder formentlig en mere varig og stabil tilknytning til arbejdsmarkedet i dagens Danmark end i USA 0 år tidligere, hvor kvinder i højere grad udgjorde en form for arbejdskraftsreserve. De amerikanske tal vedrører alene gifte kvinder, mens de danske (formentlig) er for alle kvinder (indenfor givne aldersgrænser). Der er formentlig væsentligt flere deltidsansatte i de amerikanske tal fra 975 end i den danske undersøgelse er fra 996. Det kan forklare noget af forskellen, idet vores undersøgelser tyder på, at lavere timetal (fx deltidsbeskæftigelse) giver højere elasticitet. Der er institutionelle forskelle, fx i adgangen til organiseret børnepasning mellem de to lande og perioder. Vi får ikke noget at vide om metoderne bag de danske estimater. I de amerikanske tal giver korrektionen for endogenitet af timelønnen en langt højere effekt på timetallet. En hypotese kunne derfor være, at det ikke i de danske analyser var lykkedes fuldt ud at tage højde for endogeniteten af lønnen (men det forbliver en hypotese) og at der var en negativ bias i de danske estimater. Omvendt kunne man tænke sig, at der i de danske analyser var taget bedre hensyn til skattestrukturen. 8