Kvantitative metoder 2 Forår 2007 Ugeseddel 9

Relaterede dokumenter
Økonometri 1 Efterår 2006 Ugeseddel 13

Økonometri 1 Efterår 2006 Ugeseddel 9

Kvantitative metoder 2 Forår 2007 Ugeseddel 10

Økonometri 1. Avancerede Paneldata Metoder I 24.november F18: Avancerede Paneldata Metoder I 1

Kvantitative metoder 2

Kvantitative metoder 2

Økonometri 1. Avancerede Paneldata Metoder II Introduktion til Instrumentvariabler 27. november 2006

Økonometri 1. Heteroskedasticitet 27. oktober Økonometri 1: F12 1

Ugeseddel 8. Gruppearbejde:

Kvantitative metoder 2

Kvantitative metoder 2

Indtjening, konkurrencesituation og produktudvikling i danske virksomheder

Økonomisk Kandidateksamen 2005II Økonometri 1. Lønpræmier

Økonometri 1. Test for heteroskedasticitet. Test for heteroskedasticitet. Dagens program. Heteroskedasticitet 26. oktober 2005

Rettevejledning til Økonomisk Kandidateksamen 2007I, Økonometri 1

Eksamen på Økonomistudiet 2007-I. Fag: Økonometri 1. Årsprøvefag januar Tag-hjem opgave

Landbrugets efterspørgsel efter Kunstgødning. Angelo Andersen

Fagblok 4b: Regnskab og finansiering 2. del Hjemmeopgave kl til kl

Forberedelse til den obligatoriske selvvalgte opgave

Økonometri 1. Lineær sandsynlighedsmodel. Hvad nu hvis den afhængige variabel er en kvalitativ variabel (med to kategorier)?

Beregning af strukturel arbejdsstyrke

Rettevejledning til Økonomisk Kandidateksamen 2005II, Økonometri 1

Prøveeksamen Indtjening, konkurrencesituation og produktudvikling i danske virksomheder Kommenteret vejledende besvarelse

Økonometri 1 Efterår 2006 Ugeseddel 11

Økonometri 1. Interne evalueringer. Interne evalueringer. Dagens program. Heteroskedaticitet (Specifikation og dataproblemer) 2.

Statistik II Lektion 4 Generelle Lineære Modeller. Simpel Lineær Regression Multipel Lineær Regression Flersidet Variansanalyse (ANOVA)

Statikstik II 4. Lektion. Generelle Lineære Modeller

Kvantitative metoder 2

Opsamling. Simpel/Multipel Lineær Regression Logistisk Regression Ikke-parametriske Metoder Chi-i-anden Test

6. SEMESTER Epidemiologi og Biostatistik Opgaver til 3. uge, fredag

Luftfartens vilkår i Skandinavien

Bilag 6: Økonometriske

Økonometri 1. Lineær sandsynlighedsmodel (Wooldridge 8.5). Dagens program: Heteroskedasticitet 30. oktober 2006

Økonometri 1. For mange variable i modellen. For få variable. Dagens program. Den multiple regressionsmodel 21. september 2004

Lineær regressionsanalyse8

EKSAMEN I MATEMATIK-STATISTIK, 27. JANUAR 2006, KL 9-13

Statistik II Lektion 5 Modelkontrol. Modelkontrol Modelsøgning Større eksempel

Økonometri lektion 7 Multipel Lineær Regression. Testbaseret Modelkontrol

Regressionsanalyse. Epidemiologi og Biostatistik. 1.Simpel lineær regression (Kapitel 11) systolisk blodtryk og alder

Økonometri 1. Instrumentvariabelestimation 26. november Plan for IV gennemgang. Exogenitetsantagelsen. Exogenitetsantagelsen for OLS

Husholdningsbudgetberegner

Økonometri 1. Funktionel form. Funktionel form (fortsat) Dagens program. Den simple regressionsmodel 14. september 2005

TALTEORI Følger og den kinesiske restklassesætning.

Økonometri 1 Forår 2006 Ugeseddel 11

Samarbejdet mellem jobcentre og a-kasser inden for FTFområdet

Anvendt Statistik Lektion 10. Regression med både kvantitative og kvalitative forklarende variable Modelkontrol

Langsigtet efterspørgsel efter transport

Statistik Lektion 15 Mere Lineær Regression. Modelkontrol Prædiktion Multipel Lineære Regression

Binomialfordelingen. Erik Vestergaard

Anvendt Statistik Lektion 10. Regression med både kvantitative og kvalitative forklarende variable Modelsøgning Modelkontrol

Økonometri 1 Forår 2003 Ugeseddel 10: Prøveeksamen. Indtjening, konkurrencesituation og produktudvikling i danske virksomheder. Om opgavens formål:

Morten Frydenberg Biostatistik version dato:

Udvikling af en metode til effektvurdering af Miljøstyrelsens Kemikalieinspektions tilsyn og kontrol

Indtjening, konkurrencesituation og produktudvikling i danske virksomheder

Real valutakursen, ε, svinger med den nominelle valutakurs P P. Endvidere antages prisniveauet i ud- og indland at være identisk, hvorved

χ 2 -fordelte variable

Vi ønsker også at teste hypoteser om parametrene. F.eks: Kan µ tænkes at være 0 (eller anden fast, kendt værdi)? Eksempel: dollarkurser

TO-BE BRUGERREJSE // Personligt tillæg

DCI Nordsjælland Helsingrsgade SiR 3400 Hillerød Telefon Fax

Vægtet model. Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl. Vægte. Vægte: Eksempel. Definition: Vægtrelationen

TO-BE BRUGERREJSE // Tænder

SERVICE BLUEPRINTS KY selvbetjening 2013

Salg af kirkegrunden ved Vejleå Kirke - opførelse af seniorboliger. hovedprincipper for et salg af kirkegrunden, som vi drøftede på voii møde.

Tabsberegninger i Elsam-sagen

NOTAT:Benchmarking: Roskilde Kommunes serviceudgifter i regnskab 2014

Statistik II Lektion 5 Modelkontrol. Modelkontrol Modelsøgning Større eksempel

Statikstik II 3. Lektion. Multipel Logistisk regression Generelle Lineære Modeller

Fastlæggelse af strukturel arbejdsstyrke

Prøveeksamen Indtjening, konkurrencesituation og produktudvikling i danske virksomheder Kommenteret vejledende besvarelse

Medarbejderhåndbog. Velkommen som medarbejder i SIKA Rengøring A/S

Handleplan for Myndighed (Handicap og Socialpsykiatri)

Kulturel spørgeguide. Psykiatrisk Center København. Dansk bearbejdelse ved Marianne Østerskov. Januar udgave. Kulturel spørgeguide Jan.

Sandsynlighedsregning 12. forelæsning Bo Friis Nielsen

Binomialfordelingen: april 09 GJ

Økonometri 1. Oversigt. Mere om dataproblemer Gentagne tværsnit og panel data I

Der må ikke udelades omkostninger, som er nævnt i vejledningen, ligesom der kun må indberettes de omkostninger, der er nævnt i vejledningen.

Estimation af CES - forbrugssystemet med og uden dynamik: -fcf/fcfv sammenhold med fcv/fcfv -fct/fcts sammenhold med fcs/fcts

HVIS FOLK OMKRING DIG IKKE VIL LYTTE, SÅ KNÆL FOR DEM OG BED OM TILGIVELSE, THI SKYLDEN ER DIN. Fjordor Dostojevskij

Kvantitative metoder 2

TO-BE BRUGERREJSE // Fødder

Organisationsmanual. Organisationen bag SIKA Rengøring A/S

NOTAT: Benchmarking: Roskilde Kommunes serviceudgifter i regnskab 2013

Repetition. Forårets højdepunkter

Prøveeksamen Indtjening, konkurrencesituation og produktudvikling i danske virksomheder Kommenteret vejledende besvarelse

Validering og test af stokastisk trafikmodel

Prøveeksamen Indtjening, konkurrencesituation og produktudvikling i danske virksomheder Kommenteret vejledende besvarelse

PRODUKTIONSEFFEKTEN AF AVL FOR HANLIG FERTILITET I DUROC

Marco Goli, Ph.D, & Shahamak Rezaei. Den Sociale Højskole København & Roskilde Universitetscenter

Statistik Lektion 14 Simpel Lineær Regression. Simpel lineær regression Mindste kvadraters metode Kovarians og Korrelation

Indledning ELEVPLAN FOR [NAVN] CPR [ ]

Rettevejledning til Økonomisk Kandidateksamen 2006I, Økonometri 1

Nøglebegreber: Objektivfunktion, vægtning af residualer, optimeringsalgoritmer, parameterusikkerhed og korrelation, vurdering af kalibreringsresultat.

Økonometri 1. Definition og motivation. Definition og motivation. Dagens program. Den multiple regressionsmodel 21. september 2005

! Proxy variable. ! Målefejl. ! Manglende observationer. ! Dataudvælgelse. ! Ekstreme observationer. ! Eksempel: Lønrelation (på US data)

DLU med CES-nytte. Resumé:

FTF dokumentation nr Viden i praksis. Hovedorganisation for offentligt og privat ansatte

Kvantitative metoder 2

Introduktion Online Rapport Din skridt-for-skridt guide til den nye Online Rapport (OLR) Online Rapport

Note til Generel Ligevægt

Dokumentation: Husprisanalysens andet trin: Efterspørgsel efter fravær af støj

Transkript:

Kvanttatve metoder 2 Forår 2007 Ugeseddel 9 Program for øvelserne: Introdukton af problemstllng og datasæt Gruppearbejde SAS øvelser Paneldata for tlbagetræknngsalder Ugesedlen analyserer et datasæt med oplysnnger om den planlagte alder for tlbagetræknng fra arbejdsmarkedet og en række demografske, helbredsmæssge og økonomske forhold. 1 I debatten om, hvordan velfærdssamfundet skres, er tlbagetræknngsalderen ofte blevet nævnt. Velfærdskommssonen skrev den 7. december 2005 st resume: hvs v fortsat skal have råd tl de velfærdsydelser, v ønsker [ ] stller det krav om, at tlbagetræknngsalderen skal være højere og følge levetden. Hensgten med denne opgave er emprsk at undersøge, hvordan helbred, uddannelse samt økonomske forhold påvrker den planlagte alder for tlbagetræknngen fra arbejdsmarkedet. Dokumentaton af data: 2 Data er et bearbejdet udtræk fra ældredatabasen, som er en ntervewundersøgelse vedrørende ældres forhold. Det antages at de personer som ndgår ældredatabasen er fremkommet ved en tlfældg stkprøve af ældre Danmark. Datasættet ndeholder en række nformatoner om 634 personer, som observeres årene 1997 og 2002. Der er således alt 1268 observatoner datasættet. Alle personerne er født 1945 og alle var beskæftgelse 1997 og de efterfølgende 5 år frem tl og med 2002. Data lgger på øvelseshjemmesden som TBPANEL.SAS7BDAT. 1 Ugesedlen er baseret på et uddrag af eksamensopgaven 2006I Økonometr 1. Datasættet er udvalgt fra eksamensopgaven med eksamensnummer 118. 2 Data er venlgst stllet tl rådghed af Mona Larsen, SFI (http://www.sf.dk/sw2036.asp).

Varabellste: Tlbagetræknngsalder: tbalder Personens planlagte alder for tlbagetræknng fra arbejdsmarkedet (Spørgsmålet ntervewundersøgelsen lyder Hvornår regner De med at holde op [med at arbejde]? ). Demografske forhold: kvnde Dummy for kvnde enlg Dummy for enlg dudd1 Dummy for ufaglært (referencekategoren er vderegående uddannelse) dudd2 Dummy for faglært (referencekategoren er vderegående uddannelse) Arbejdsmarkeds- og helbredsforhold: erfar Antal års arbejdsmarkedserfarng helbred Dummy for dårlgt (selvvurderet) helbred Forventede ndkomstforhold: penson Den (skønnede) årlge offentlge pensonsudbetalng og lgn. (førtdspenson, efterløn eller folkepenson) ved tlbagetræknng 1000 kr. kpenbelob Den (skønnede) årlge udbetalng fra kaptalpenson ved tlbagetræknng 1000 kr. Øvrge varable: lbnr Løbenummer for ndvd d2002 Dummy for 2002 Model: Opgaven tager udgangspunkt en paneldata model for den planlagte tlbagetræknngsalder: tbalder = β + β enlg + β helbred + β dudd1 + β dudd2 + β erfar + β penson t 0 1 t 2 t 3 t 4 t 5 t 6 + β kpenbelob + β d2002 + β kvnde + β penson kvnde + v 7 t 8 t 9 t 10 t t (1.1) hvor repræsenterer ndvderne = 1,2,...,634, og t er peroderne t = 1, 2, sådan at t=1 svarer tl 1997 og t=2 tl 2002. Fejlleddet v t er summen af to komponenter: Varablen a repræsenterer uobserveret heterogentet, dvs. en uobserveret faktor som er specfk for hvert ndvd og konstant over td; leddet u t varerer både over ndvder og peroder, dvs. uobserverede faktorer, der ændrer sg over td og påvrker den forventede tlbagetræknngsalder for ndvd.

Gruppearbejde: 1. Dskutér om parametrene model (1.1) kan estmeres konsstent ved at anvende OLS på observatonerne for alle ndvder og begge peroder. Hvlke antagelser skal gvet fald være opfyldt for de uobserverede fejlledskomponenter, a og u t? [Hnt: Prøv at gve nogle bud på, hvlke konkrete (men uobserverede) faktorer der kan være ndeholdt a og ut og vurdér på den baggrund, om MLR.1-4 kan være opfyldt for (1.1).] 2. Kan det antages at betngelserne for konsstent estmaton ud fra førstedfferenser af varablerne, FD.1-4 (Wooldrdge sde 483), er opfyldt? Hvlke antagelser skal så fald være opfyldt for de uobserverede fejlledskomponenter, a og u t? SAS-øvelser: Én gruppe bedes skrve en kort opsamlng (½-1 sde) af spørgsmål 5. og sende den tl rasmus.jorgensen@econ.ku.dk senest mandag kl. 12.00. 1. Sorterng af paneldata Du får brug for at kunne sortere et SAS datasæt efter ndvd og perode. Som eksempel sorteres datasættet TBPANEL over et nyt datasæt, TBPANELS, der er sorteret efter varablen lbnr og - ndenfor hver værd af lbnr - efter varablen d2002. Du kan bruge følgende procedure tl at sortere data: proc sort data=mylb.tbpanel out=tbpanels; by lbnr d2002; run; Husk at erstatte mylb med det lbname, hvor dt datasæt lgger. Tjek det sorterede datasæt va Vewtable. Hvlke varable varerer over td for den enkelte person ( denne aldersgruppe)? 2. Databeskrvelse Beskrv de varable, som ndgår model (1.1) med udgangspunkt dt datasæt. Gør dette ved at opstlle tabeller med relevante karakterstka for varablerne: En tabel for hvert af de to år for de varable, der varerer over td samt en tabel for de tdsnvarante varable. Kommenter kort på tabellerne og dskutér udvklngen de tre varable tbalder, helbred og erfar fra 1997 tl 2002. [Hnt: Proc Means kan benyttes med en BY kommandolne, fx BY d2002. Det kræver at datasættet først er sorteret efter den samme BY-varabel.]

3. Pooled OLS estmaton på data for begge peroder Estmér model (1.1) ved hjælp af en OLS regresson på det poolede datasæt af alle personer og begge peroder. Undersøg følgende påstande vedr. tlbagetræknngsmønstret for mænd og kvnder: a) Betydnngen af størrelsen af penson er den samme for mænds og kvnders planlagte tlbagetræknng. Formuler hypotesen og udfør det relevante test. b) Størrelsen af offentlge pensonsudbetalng har ngen betydnng for kvnders planlagte tlbagetræknng. Formuler hypotesen og udfør det relevante test. Brug et test der er baseret på et robust estmat af kovaransmatrcen for OLS estmatoren, hvs du skønner at det er nødvendgt. Overvej om den poolede regresson gver konsstente estmater af koeffcenterne model (1.1). Vl det være bedre kun at foretage OLS regressonen på det ene af de to tværsnt (det vl sge enten 1997-data eller 2002-data)? 4. Første Dfferens (FD) estmaton Udfør Første Dfferens (FD) estmaton for model (1.1). Først beregnes forskellen (=dfferensen) mellem observatonen af hver varabel 1997 og 2002. Denne forskel beregnes for alle personer. Herefter udføres OLS på førstedfferenserne. For at danne førstedfferenser fx af varablen for tlbagetræknngsalder, Dtbalder, kan man bruge følgende programstump: data dffdata ; set tbpanels ; Dtbalder = tbalder - lag(tbalder) ; f lbnr = lag(lbnr) ; run ; Hvorfor er det vgtgt, at nputdata tl beregnngen er sorteret? Hvlken rolle spller IF sætnngen DATA trnnet? Tjek ved hjælp af Vewtable, at det transformerede datasæt blver som ønsket. Hvor mange brugbare observatoner er der DIFFDATA? Udfør OLS estmatonen på førstedfferenserne. Overvej hvlke varabler der kan ndgå denne regresson: Hvlke parametre model (1.1) kan estmeres en FD estmaton? Hvorfor er det kke mulgt at estmere β 5 og β 8? Hvordan tolker du konstantleddet? Er det mulgt at estmere β 10? Hvorfor? Overvej om de to påstande, a) og b) fra spørgsmål 3, kan undersøges på grundlag af FD estmaterne. Udfør undersøgelsen, hvs det er mulgt.

Tager FD-estmatoren højde for potentelle problemer med den poolede OLS estmator, som du anvendte spørgsmål 3? 5. Sammenfat resultaterne Sammenfat dne resultater form af en kommenteret tabel. Tabellen skal rapportere de estmater af koeffcenter model (1.1), du har opnået med pooled OLS og med FD estmaton. Kommentér på tabellen, herunder hvorledes de forskellge modeller forholder sg tl hnanden, og hvlke(t) sæt af estmater du vl lægge tl grund for dn vurderng af bestemmelsen af, hvad der er afgørende for den planlagte tlbagetræknngsalder Danmark. Hvad kan man ud fra dne analyser sge om, hvlke faktorer der er bestemmende for tlbagetræknngsalderen for 1945 årgangen Danmark? Hjemmearbejde Lav resten af SAS-øvelserne, hvs det kke er nået tl øvelserne. Teor opgave: Førstedfferens estmaton en model med målefejl (beregnet tdsforbrug: 30 mn). Betragt følgende model: y = + x + u = n t = () t β0 β1 t t, 1,2,...,, 1,2 hvor x er den sande men uobserverbare værd af den forklarende varabel. V antager at () opfylder antagelserne SLR1-4. I stedet for x observeres x = x + e, hvor e er en klasssk målefejl. Antag at følgende gælder: t t t Ee ( ) = 0, var( e) = σ, var( x)= σ, Ex ( ) = 0, t= 1, 2 2 2 t t 0 t x t cov( et, xs ) = 0, t = 1, 2 og s = 1, 2. For en pooled estmaton af y på de observerede x værder og en konstant gælder standardresultatet om attenuaton bas: 2 2 ˆ σx ˆ σ0 plm β1 = β1 hvlket betyder at plm β 2 2 1 β1 = β1 2 2 σ x + σ0 σx + σ0 som er den asymptotske bas. Betragt stedet en førstedfferens regresson, der er defneret ud fra de parvst sammenhørende observatoner for hvert ndvd de to peroder:

y y = β ( x x ) + w w () 2 1 1 2 1 2 1 hvor wt er et fejlled. Antag desuden at målefejlene er ukorrelerede, cov( e 1, e 2) = 0, mens de sande værder af den forklarende varabel er postvt korrelerede over td, cov( x, x ) = σ > 0. a) Vs, at OLS estmatoren for β 1 for denne regresson, ( 2 1)( 2 1) ˆ FD x x y y β 1 = 2 ( x 2 x 1) er nkonsstent og udregn den asymptotske bas. 1 2 12 [Hnt: Fnd et udtryk for w t fra () og brug det når du ndsætter formlen for ˆ β FD. Husk at cov( x1, x 2) 0 når du beregner var( x 2 x 1).] b) Sammenlgn den asymptotske bas fra førstedfferens regresson a) med resultatet for den poolede OLS regresson.