Estimation af Uddannelsesafkast

Størrelse: px
Starte visningen fra side:

Download "Estimation af Uddannelsesafkast"

Transkript

1 Estimation af Uddannelsesafkast Morten Roed Sørensen Vejledere: Mette Ejrnæs og Lars Even Rasmussen Opponent: IngerLise Wolf-Jensen Afleveret: 18.maj 1999 Indhold: 1 Indledning 2 Økonometrisk Metode 3 Data 4 Empirisk Analyse 5 Andre Undersøgelser 6 Konklusion 7 Litteraturhenvisninger 8 Appendix A 9 Appendix B 10 Appendix C 11 Appendix D 12 Appendix E

2 1 Indledning Vigtigheden af at folk får en uddannelse har i mange år været et mantra i Danmark såvel som andre steder. Uddannelsesinvesteringer ses som en afgørende faktor til forklaring af den økonomisk vækst, og dette vil formentlig ikke blive mindre vigtigt i fremtiden. Et tilfredsstillende uddannelsesniveau for befolkningen kan dog ikke nødvendigvis sikres ved blot at øge bevillingerne over finansloven. Det er ligeledes vigtigt at kigge på de individuelle incitamenter for valg af uddannelse. Alt andet lige må det kunne forventes, at personlige investeringer i uddannelse er større, jo mere den ekstra uddannelse trækker lønnen opad. Formålet med dette oplæg er, at estimere hvad fuldførelsen af et års ekstra uddannelse betyder for et individs årlige lønindkomst i Danmark. Specielt vil der blive lagt vægt på de økonometriske problemstillinger, en sådan estimation vil blive mødt med. Af disse kan f.eks. nævnes, at uobserverbare evner komplicerer estimationen, ligesom det relativt konstante individuelle uddannelsesniveau over tid i sammenhæng med korrelation mellem fejlled og forklarende variable nødvendiggør instrument variabel metode. I næste afsnit opstilles modellen, og de økonometriske problemstillinger knyttet til estimationen af uddannelsesafkast beskrives. Specielt vil der blive lagt vægt på gennemgangen af en metode udviklet af Hausman og Taylor [3] til estimation af afkastet. Efter dette følger en beskrivelse af de benyttede data og herefter selve den empiriske analyse. Der rundes af med en sammenligning af de estimerede uddannelsesafkast fra denne og andre undersøgelser foretaget på danske data og endelig en konklusion. 2 Økonometrisk Metode For at estimere et troværdigt uddannelsesafkast er det nødvendigt at benytte nogle mere komplicerede økonometriske metoder end den gængse OLS estimation. Årsagen til dette skyldes, at uobserverbare individuelle evner må forventes at spille en afgørende rolle for individers indkomst. Denne antagelse bringer et panel datasæt over individer på bane som et centralt element i estimationen af uddannelsesafkast. Med paneldata bliver det nemlig muligt at neutralisere de uobserverbare individuelle effekter. Indenfor paneldata findes to grundlæggende modeller - fixed effects modellen og random effects (one-way error component modellen). I fixed effects modellen antages individerne at have et fast 2

3 individuelt konstantled og ellers samme hældningsparametre og varians. I random effects modellen antages individerne tilgengæld at have samme konstantled og hælningsparametre men også en individ specifik stokastisk komponent. Umiddelbart kan valget af begge modeller teoretisk forsvares, så udslagsgivende for valget bliver, at i random effects modellen kan paremetrene til tidsinvariante variable estimeres i modsætning til i fixed effect modellen. Da uddannelse, som tidligere nævnt, er så godt som tidsinvariant for individerne, nødvendiggør hele problemstillingen, at random effects modellen vælges. Modellen kan derfor skrives som følger: (1) ln(w it ) x it z i v it v it. i it,. i iid(0,1. ) og it iid(0,1 ) hvor x og z er de tidsvarierende hhv. tidsinvarierende variable og w er logaritmen til den årlige lønindkomst. De individ specifikke varianser,, antages at være uafhængigt fordelt med. i middelværdi nul og varians, mens den usystematiske komponent,, ligeledes antages at være 1. it uafhængigt fordelt med middelværdi nul og variansen blokdiagonal, da den individuelle varians har strukturen:. Modellens variansstruktur bliver 1 (2) Mi 1 #I T 1. #ii hvor i er en t gange t vektor af et-taller, og efficient estimation af modellens parametre kræver derfor FGLS estimation. Dette udføres via standard metoden. To hjælperegressioner udføres, within og between estimationen, og residualerne herfra benyttes til at estimere varianstrukturen og transformere modellen, hvorefter almindelig OLS vil frembringe konsistente og efficiente parameter estimater. At denne metode er BLUE, bygger dog på en kraftig antagelse om, at de forklarende variable er ukorrelerede med fejlledet; en antagelse der ikke kan forventes at være opfyldt i dette tilfælde. Hvis. i er et (uobserverbart) mål for evner, må det forventes, at der er korrelation mellem fejlledet og omfanget af udddannelse, og FGLS vil derfor være biased. For at finde ud af om der er korrelation mellem fejlledet og de forklarende variable, kan Hausman- 3

4 testet benyttes. Dette test udnytter, at withinestimatoren, selv med korrelation, vil være konsistent, mens FGLS estimatoren under sådanne forhold vil være biased. En stor afvigelse mellem de to estimatorer vil derfor tyde på fejlledskorrelation og behov for instrumenter i random effects modellen. Viser Hausman-testet at der er misspecifikation i modellen, er der afgørende forskel på metoden til at finde konsistente estimatorer alt afhængig af, om der er tale om tidsvarierende eller tidsinvarierende variable. For en tidsvarierende forklarende variabel, være korrelerede med fejlleddet, idet within estimatoren blot kan benyttes. For en tidsinvarierende forklarende variabel, fejlleddet,, der er mistænkt for at x it, er det ikke det store problem at få konsistente estimatorer, v it, der er mistænkt for at være korreleret med z i, er det umiddelbart sværere at få konsistente estimatorer, idet nogle brugbare v it instrumenter skal findes. Traditionelt ledes efter variable, der ikke har været inddraget i modellen, men som formodes at være korreleret med variablen den skal erstatte og ikke med fejlleddet. Når eksempelvis uddannelsesniveau instrumenteres er familiebaggrundsvariable som forældres uddannelsesniveau ofte inddraget. Problemet med disse instrumenter - udover det ofte manglende kendskab/adgang til disse variable - er, at også disse variable kan være korreleret med fejlledet. Dette vil jo ske, når individers uobserverbare evner er korreleret med forældrenes uddannelsesniveau, hvilket ikke kan udelukkes a priori. Hausman og Taylor [3] har udviklet en alternativ instrument variabel metode og selv anvendt den ved estimation af uddannelsesafkast. Modellen er som angivet i ligning (1), blot splittes de forklarende variable op i to grupper; x1 it og z1 i er de forklarende variable, der antages ikke at være korreleret med fejlledet, mens x2 it og z2 i er de variable, der forventes at være årsagen til inkonsistensen af FGLS. Som instrument for x2 it og z2 i bruges individ-gennemsnittetene for x1 it variablene,. Hausman-Taylor metoden kræver derfor ikke indførelsen af nye variable i x1 i. modellen, men udnytter derimod informationen fra de tidsvarierende forklarende variable, der ikke er korreleret med fejlledet. Den ene betingelse, for at et instrument er gyldigt, er derfor opfyldt via antagelsen om, idet instrumenterne således per definition ikke er korreleret med fejlleddet. x1 it Den anden betingelse for et instruments gyldighed, dvs. betingelsen om at instrumenterne skal være korreleret med de instrumenterede variable, vil blive godtgjort af selve estimationen af modellens parametre. Et meget upræcist estimat vil nemlig være tegn på ringe korrelation. 4

5 HT metoden stopper dog ikke ved instrumentvariabel estimationen. Det er nemlig også muligt at teste den nye model for om korrelationen mellem fejlleddet og de forklarende variable er blevet elimineret ved et nyt Hausman-test. Dette er igen muligt, da within-estimationen altid vil sikre, at HT parameterestimaterne kan sammenlignes med et konsistent, omend inefficient, estimat for de tidsvarierende parametre. En lidt mere formel gennemgang vil både tydeliggøre HT metoden og hvordan selve estimationen er grebet an. Først estimeres within transformationen, y it y i. ( x it ) # w fejl,der sikrer et konsistent estimat for parametrene til de tidsvarierende variable, og som benyttes i modellens følgende Hausman-tests. Lad,, og udvid ligningen, jf. appendix A, til følgende: d y i. # ˆ w (3) ˆd z i #. i fejl I fravær af misspecifikation vil OLS på denne ligning være konsistent. Er dette ikke opfyldt, må instrumenter nødvendigvis introduceres, hvis skal estimeres konsistent. Identifikation kræver, at der er mindst lige så mange instrumenter, som der er variable, der skal instrumenteres, dvs. k1g2, hvor k1 og g2 er antallet af x1 hhv. z2 variable. 2SLS estimatoren bliver da: (4) (z #pa #z) 1 #z #pa #d hvor pa er projektionsmatricen for instrumenterne 1 a [x1 i., z1 i ]. I dette første trin af HT metoden er det således lykkedes, hvis antagelserne ellers holder, at estimere nogle konsistente, men inefficiente, parametre til såvel de tidsvarierende som de tidsinvarierende variable. For at teste diverse hypoteser om modellens parametre, og ikke mindst for at udføre et nyt Hausman test for misspecifikation, er det imidlertid nødvendigt at beregne nogle efficiente parameter estimater. Til denne beregning udnyttes, at første trin af HT metoden har givet et konsistent, omend inefficient, skøn for variansstrukturen beregnet ud fra within og between regressionernes residualer, og ud fra kendskab til disse kan en parameter, theta, beregnes ( ( 1 /(1. T #1 )) 0.5 ). OLS på flg. modeltransformation vil da, jf. Hausman og Taylor [3], give asymptotisk efficiente estimater for både og : 1 z1 i inddrages som instrumenter, men sikrer ikke identifikation. Dette kræver mindst lige så mange x1 som z2 variable. 5

6 (5) P A # (Y it (1 ˆ)#Y i. ) P A # [X it (1 ˆ)#X i. ] P A #ˆZ i fejl Et nyt specifikationstest kan nu udføres på de tidsvarierende parametre, hvor de efficiente parametre estimeret vha. HT-metoden ( estimationen ( ): ˆ W ˆ HT ) sammenlignes med det konsistente estimat fra within (6) ( ˆHT ˆW ) #[var( ˆW ) var( ˆHT )] 1 #(ˆHT ˆW ) $ 2 (k1 g2) Bemærk at specifikationstestet kræver, at der skal være flere x1 end z2 variable; altså flere tidsvarierende instrumenter end tidsinvariante variable der kræver instrumentering. Accepteres hypotesen om at begge estimater er konsistente, er det derved tegn på, at parametervektorerne ˆ HT og ˆ HT er efficiente og unbiased estimatorer for modellens tidsvarierende såvel som tidsinvarierende variable. 3 Data Datagrundlaget for den empiriske analyse er et udtræk fra IDA databasen. Udtrækket indeholder observationer fordelt på 2786 forskellige individer i perioden fra 1980 til Panelet er ubalanceret idet antallet af observationer fra hvert individ svinger fra én til 15 observationer. Den afhængige variabel i analysen er logaritmen til den årlige lønindkomst i 1980 priser. Uddannelsesvariablen dækker over årslængden af individers almen- og erhvervsuddannelse, mens erfaringsvariablen i estimationerne enten approximeres ved individernes alder eller der bruges en IDA-variabel for individernes arbejdsmarkedserfaring. Individernes heterogenitet forsøges der at tages højde for ved at inddrage forskellige baggrundsvariable. Der indføres en dummy for personer med direktørstillinger og en dummy for ledende funktionærer, idet disse stillinger kan forventes at få et ekstra afkast uafhængigt af andre ting. Ligeledes indføres dummyier, hvis bopælen er indenfor hovedstadsområdet eller i bykommuner, således at personer med bopæl i landkommuner bliver baseline. Enlige udstyres også med en dummy, da det meget vel er muligt, at disse personers adfærd på arbejdsmarkedet adskiller sig fra gifte personers adfærd. Branchedummyier defineres, og ligesom uddannelsesvariablen er individers tilhørsforhold tilnærmelsesvist at betragte som tidsinvariant. Endelig indgår en variabel, både lineært og kvadreret, der opfanger lændgen af et individs arbejdsløshedsperiode indenfor et givet år. Skalaen går fra nul til hundrede, hvor 6

7 hundrede svarer til, at personen har været fuldtidsarbejdsløs gennem hele det pågældende år. Udover disse variable, der opfanger individuel heterogenitet, skal der også tages højde for de mere generelle påvirkninger, der forekommer over tid, såsom konjunkturstød og reallønsfremgang. Der kontrolleres for dette ved hjælp af årsdummyier. Det er nødvendigt at 'trimme' data inden selve estimationerne påbegyndes. Grunden til dette er, at fortolkningen af estimaterne kun giver mening, hvis individerne er ens i den forstand, at de alle er fuldt tilknyttet arbejdsmarkedet. Eksempelvis vil en universitetsuddannet 'frivillig' hjemmegående person ikke have nogen lønindkomst, hvilket dog vil være forkert at fortolke som et negativt uddannelsesafkast. Datasættet søges derfor trimmet på forskellige måder således at de tilbageværende personer tilnærmelsesvist kan siges at få en løn der - alt andet lige - svarer til deres oparbejdede kvalifikationer og uobserverbare evner. Først frasorteres alle individer, der direkte er kategoriserede som værende uden for arbejdsmarkedet og desuden selvstændige, da aflønningen af disse formentlig ikke kan beskrives ved denne model. Dette er eksempelvis pensionister, fuldtidsstuderende, orlovsmodtagere, førtidspensionister og efterlønsmodtagere. Alle personer under tyve år frasorteres ligeledes, da deres tilknytning til arbejdsmarkedet ofte vil være af midlertid karakter inden en videregående uddannelse påbegyndes, og lønnen derfor ikke nødvendigvis svarer til deres reelle kvalifikationer og uobserverbare evner. Dernæst udskilles deltidsbeskæftidige for bedst muligt at sikre, at lønindkomsten svarer til samme tidsmæssige arbejdsindsats, hvilket dog stadig efterlader betydelige målefejlsproblemer. Endelig slettes observationerne for de individer, hvis lønindkomst er på under kroner. Dette gøres, fordi det antages, at personer med så lav en lønindkomst ikke er fuldt tilknyttet arbejdsmarkedet, selvom de ikke benytter en af tilbagetrækningsordningerne på arbejdsmarkedet (eksempelvis hjemmegående personer). Et indtryk af hvordan denne trimning påvirker data, kan fås ved at kigge på udviklingen i gennemsnittene for udvalgte variable i et givet år, jf. tabel 1. Hvert eneste kriterie for trimning af datasættet ses at føre til gennemsnitlig mere individuel erfaring og uddannelse ligesom den årlige lønindkomst stiger betragteligt. Dette er ikke overraskende set i lyset af, at de slettede observationer er personer uden for eller med en løs tilknytning til arbejdsmarkedet. Da disse personer næppe udgør et tilfældigt sample af populationen, må der 7

8 forventes at være et selektionsproblem. Havde disse personer nemlig været tilknyttet arbejdsmarkedet, var de formentlig blevet ringere aflønnet i forhold til de personer allerede i job - givet samme observerbare karakteristika. Hvis dette er tilfældet, må det forventes, at det estimerede uddannelsesafkast er et øvre skøn. Tabel 1, Gennemsnit for udvalgte variable og antal observationer i datasæt (1990). MÆND: Oprindelig datasæt - personer uden for arb.stk - personer under tyve år - ikke fuldtidsansatte - personer med indkomst<30000 Erfaring, år ,1 14,6 15,5 Uddannelse, år 9,6 10,5 10,6 10,7 10,9 Alder, år 40,8 37,5 39,4 39,2 39,4 Årsledigh.gr., pct 7 8,8 9,2 9,8 4,4 lønindkomst, kr Antal obs KVINDER: Erfaring, år 7,4 9,5 10,3 10,7 11,5 Uddannelse, år 9,1 10,5 10,6 10,9 11,1 Alder, år 41,9 36,9 38,6 37,1 37,2 Årsledigh.gr., pct. 7,7 10,3 10,9 13 6,3 lønindkomst, kr Antal obs Trimningen af personer med indkomster under kroner i årlig indkomst medfører mærkbart lavere årsledighedsgrader for både mænd og kvinder. Dette er, som nævnt, gjort for at slette personer uden reel tilknytning til arbejdsmarkedet, men mere ekstreme observationer - personer hårdt ramt af ledighed - slettes ligeledes. Dette vil også tendere til skabelsen af et selektionsproblem. En sidste bemærkning til tabellen skal knytte sig til antallet af observationer. For mændenes vedkommende slettes 48 procent af observationerne i 1990, mens hele 60 procent slettes for kvindernes vedkommende. Dette skyldes kvindernes relativt lave erhvervsfrekvens, hvilket har den yderligere effekt at deres lønindkomst stiger relativt mest i forhold til mændenes ved trimningen af data. For udviklingen over tid for udvalgte variable henvises til appendix B. Af figuren fremgår det bla. 8

9 at lønindkomsterne i faste priser har været svagt faldende fra 1980 til 1985 for begge køn, hvorefter de har været stigende resten af den observerede periode med undtagelse af enkelte år. Det gennemsnitlige uddannelsesniveau er steget i perioden fra omkring 9,5 år til over 11 år for begge køns vedkommende. Dette afspejler at de nye, yngre generationer på arbejdsmarkedet har et højere uddannelsesniveau i forhold til de ældre generationer, der har forladt arbejdsmarkedet i perioden. 4 Empirisk Analyse Estimationerne foretages særskilt for kønnene og som udgangspunkt estimeres FGLS for følgende model: ln( årsløn it ) erfaring it # 1 erfaring 2 it # 2 direktør it # 3 (7) ledende funktionær it # 4 København it # 5 by it # 6 enlig it # 7 årsledighedsgrad it # 8 årsledighedsgrad 2 it # 9 konstant # 1 uddannelse # 2 # 3 18 år t # 1 14 hvor variablen dækker over sytten forskellige r. Der eksperimenteres med forskellige specifikationer for begge køn, jf. appendix C og D. Den første estimation for mændenes lønligning er within estimationen, der er konsistent uanset om fejlledet skulle være korreleret med nogle af de forklarende variable. Parameterestimaterne virker rimelige. Et års erfaring resulterer i en fem procent højere løn, men effekten er aftagende jo mere erfaring personen er i besiddelse af. En direktørstilling giver et signifikant bidrag på ca. tolv procent ligesom en bopæl i København har en signifikant positiv effekt. En stigning i årsledighedsgraden på et procent point fører ikke uventet til en signifikant lavere årlig lønindkomst på en procent. Næste estimation er FGLS, der estimerer uddannelsesafkastet til to procent, men Hausmanteststørrelsen, beregnet ved hjælp af ligning (6), afslører, at der er misspecifikation og derfor biased resultater. Dette bringer Hausman-Taylor metoden på banen. I første omgang instrumenteres uddannelse med 9

10 gennemsnittene for alle de tidsvarierende variable inkluderet i within-estimationen samt med variablene. Hausman-teststørrelsen tyder imidlertidig stadig på misspecifikation, hvilket fører til en ny Hausman-Taylor estimation, hvor erfaringsvariablene tillige er instrumenteret. Da hypotesen om at fejlleddet ikke er korreleret med en af de forklarende variable endnu engang afvises, forsøges endelig også med årsledighedsgraden instrumenteret og udeladelse af de kvadrede størrelser. Heller ikke dette får dog bugt med fejlledskorrelationen. Det bemærkes at specielt estimatet for erfaringsparameteren afviger fra within-estimationen under Hausman-Taylor estimationerne, hvilket tyder på, at individernes erfaring er korreleret med deres fejlled. At instrumenteringen for erfaringsparameteren ikke kan overkomme misspecifikationsproblemerne, kan eventuelt skyldes dårlige instrumenter. Der er herefter estimeret en model hvor IDA's erfaringsvariabel er udskiftet med individernes alder. Det må forventes at alder er korreleret med erfaring, men ikke med fejlleddet, således at risikoen for fejlledskorrelation formindskes. Som det fremgår af sidste kolonne i appendix C, lykkedes det med denne specifikation at få accepteret en model på fem procents signifikans niveau, hvor uddannelsesafkastet er estimeret til 3,1 procent. I denne estimation giver alder et positivt afkast, men det er ikke så højt som det konsistente erfaringsafkast tidligere estimeret, grundet den ikke-perfekte kollinaritet. Som i den første within-estimation giver en direktørstilling, en bopæl i København og en lavere årsledighedsgrad et signifikant positivt bidrag til den årlige lønindkomst. I forhold til den tilsvarende model estimeret med OLS ses det, at når der tages hensyn til panelstrukturen, øges det estimerede uddannelsesafkast, og færre parametre bliver signifikante. Det sidste følger af, at OLS generelt undervurderer standardfejlene, når der er tale om en random effects model. At FGLS fører til et højere estimat for uddannelseafkast end OLS, er måske mere overraskende. Er der positiv korrelation mellem uddannelse og uobserverbare evner, ville OLS overvurdere afkastet, men modeller hvor uddannelseslængden endogeniseres, vil kunne frembringe en negativ korrelation mellem uddannelse og uobserverbare evner, jf. Hausman og Taylor [3]. At OLS undervurderer uddannelsesafkastet, er da også et resultat, både Hausman og Taylor [3] samt Hanus og Lolk [2] finder frem til. Når uddannelsesafkastet forsøges estimeret for kvinder gentages problemerne fra estimationen af det mandlige uddannelsesafkast. Den første within-estimation, der inkluderer IDA's erfaringsvariable opgjort udfra ATP, fører til et lidt højere afkast af erfaring i forhold til mændenes 10

11 estimation samt et signifikant positivt afkast for en lederstilling, jf appendix D. Hausman-testet i FGLS estimationen fører til en afvisning af hypotesen om, at fejlleddet ikke er korreleret med de forklarende variable, hvorefter der forsøges med Hausman-Taylor metoden. Først instrumenteres uddannelse, hvilket ikke reducerer misspecifikationsproblemet, men når der derefter instrumenteres for både uddannelse og erfaringsvariablene, accepteres modellen lige netop på ti procents signifikansniveau. I denne model er uddannelsesafkastet estimeret til hele 7,4 procent, men estimatet er også meget upræcist. Som hos mændene forsøges det også her at udskifte erfaringsvariablen med alder. Denne model accepteres på fem procents niveau, og uddannelsesafkastet bliver 2,5 procent, hvilket både er mere præcist og mere troværdigt end det foregående estimat. Ligesom ved mændenes estimation undervurderer OLS uddannelsesafkastet. 5 Andre Undersøgelser Sammenlignes denne undersøgelses resultater med andre estimerede uddannelsesafkast fra Danmark, synes der at være en rimelig overensstemmelse, jf. appendix E. Generelt svinger estimaterne en del, men for det meste estimeres mændenes afkast til at være større end kvindernes, hvilket også er fundet i denne undersøgelse. De forskellige undersøgelser har lagt vægt på at estimere uddannelsesafkast for forskellige kategorier, hvilket, set i sammenhæng med varierende datagrundlag og metoder, forklarer de varierende skøn. Det skal bemærkes, at det klart højeste estimat, der stammer fra Buus Kristensens undersøgelse, også er det estimat, der er fremkommet ved brug af den mest afvigende metode. I forhold til de andre undersøgelser er der nemlig ikke brugt nogen individoplysninger, jf. Hanus og Lolk [2]. 6 Konklusion En korrekt estimation af uddannelsesafkast kræver et panel datasæt og specificeringen af en random effects model. Dette skyldes, at uobserverbare individuelle evner må forventes at spille en vigtig rolle i bestemmelsen af individers lønnivaeu, og at uddannelsesniveau er så godt som tidsinvariant for et individ allerede tilknyttet arbejdsmarkedet. Problemet med random effects modellen er imidlertid, at korrelation mellem fejlled og forklarende variable ofte kan forekomme, hvad det også gjorde i denne undersøgelses estimationer. Problemet søgtes løst ved hjælp af den gennemgåede Hausman-Taylor metode men mislykkedes - måske fordi den primære årsag til misspecifikationen var erfaringsvariablen, og at instrumenterne for denne var upræcise. I stedet approximeredes erfaringsvariablen med alder, hvilket øjensynligt eliminerede fejlledskorrelationen, 11

12 og gjorde instrumentering af uddannelse, eksempelvis via Hausman-Taylor metoden, overflødig. De endelige estimater for uddannelsesafkastet blev 3,1 og 2,5 procent for mænd hhv. kvinder. Dette må betragtes som et øvre skøn pga. tilstedeværelsen af selektionsproblemer. 7 Litteraturhenvisninger [1] Ejrnæs,M. og Rasmussen,L.: Noter til øvelse i paneldata, [2] Hanus,N. og Lolk,K.: Investering i Human Kapital, speciale nr. A-130, [3] Hausman,J. og Taylor,W.: Panel Data and Unobservable Individual Effects, Econometrica, vol. 49, No. 6, s , [4] Johnston,J. og Dinardo,J.: Econometric Methods, McGraw-Hill,

13 Appendix A P v og Q v er idempotente matricer. P v omtransformerer en matrice af observationer til en individgennemsnitsmatrice; individgennemsnitsmatricen. Q v omtransformerer til en matrice indeholdende afvigelser fra Da ˆ w ( x it x it ) 1 x itỹit ( x it Q v x it ) 1 x it Q v y it gælder følgende omskrivning: d y i. ˆw P v y it ( x it Q v x it ) [ P v ( x it Q v x it ) 1 x it Q v ] y it 1 x it Q v y it [ P v ( x it Q v x it ) 1 x it Q v ] #[ x it z i. i it ] ( x it Q v x it ) 1 x it Q v x it z i ( x it Q v x it ) 1 x it Q v z i. i (x it Q v x it ) 1 x it Q v. i i. ( x it Q v x it ) 1 x it Q v it z i. i [ P v (x it Q v x it ) 1 x it Q v ] it idet. it Q v z i 0 og Q v. i 0, og hvor sidste led er et usystematisk fejlled givet antagelserne om 13

14 Appendix B Gennemsnitlig lønindkomst og uddannelseslængde for mænd og kvinder 14

15 Appendix C Parameterestimater for mænd Within FGLS HT 1) HT 2) HT 3) OLS FGLS Uddannelse - 0,0194 *) (5,55) 0,0439 *) (4,10) 0,0438 *) (4,11) 0,0433 *) (3,80) 0,0131 *) (5,52) 0,0309 *) (8,01) Erfaring 0,0470 *) (13,11) 0,0492 *) (15,33) 0,0495 *) (15,01) 0,0531 *) (14,93) 0,0226 *) (14,67) - - Erf. kvadreret -0,0010 *) (-9,27) -0,0010 *) (-9,80) -0,0010 *) (-9,77) -0,0011 *) (-9,83) Alder ,0059 *) (8,16) 0,0140 *) (16,32) Direktør 0,1185 *) (3,64) 0,1274 *) (4,08) 0,1199 *) (3,74) 0,1186 *) (3,72) 0,1271 *) (3,46) 0,2849 *) (7,55) 0,1397 *) (3,93) Leder 0,0215 (0,93) 0,0267 (1,22) 0,0222 (0,99) 0,0209 (0,93) 0,0287 (1,24) 0,1122 *) (5,26) 0,0302 (1,32) København 0,0879 **) (1,67) 0,0922 *) (2,38) 0,0957 *) (2,21) 0,0992 *) (2,29) 0,1077 *) (2,42) 0,0979 *) (5,61) 0,1033 *) (2,50) Bykommune 0,0032 (0,12) 0,0091 (0,38) 0,0066 (0,27) 0,0073 (0,29) 0,0055 (0,22) 0,0325 **) (1,95) 0,0101 (0,41) Enlig 0,0021 (0,17) 0,0025 (0,20) 0,0015 (0,12) 0,0023 (0,19) -0,0215 **) (-1,65) -0,0043 (-0,31) -0,0176 (-1,36) Årsledh.grad -0,0104 *) (-8,75) -0,0102 (-8,40) -0,0102 *) (-8,39) -0,0101 *) (-8,31) -0,0094 *) (-21,2) -0,0165 *) (-13,26) -0,0113 *) (-9,83) Årsledh.grad kvadreret (0,86) (0,81) (0,81) (0,7923) - 0,0001 *) (3,47) (1,37) Andre variable år Obs Individer Hausmanteststørrelse , , , ,37 Anm.: t-værdier i parentes. Within-estimationen med alder som forklarende variabel er ikke vist i tabellen. 1) Uddannelse instrumenteret, 2) uddannelse, erfaring og erfaring kvadreret instrumenteret, 3) uddannelse, erfaring og årsledighedsgrad instrumenteret, *) signifikant på fem procents niveau, **) signifikant på ti procents niveau. 15

16 Appendix D Parameterestimater for kvinder Within FGLS HT 1) HT 2) OLS FGLS Uddannelse - 0,0189 *) (6,32) 0,0379 *) (3,09) 0,0743 *) (3,38) 0,0094 *) (4,81) 0,0245 *) (7,75) Erfaring 0,0540 *) (16,6) 0,0554 *) (18,02) 0,0550 *) (17,57) 0,0581 *) (17,47) - - Erf. kvadreret -0,0013 *) (-14,81) -0,0013 *) (-15,06) -0,0013 *) (-15,0) -0,0013 *) (-15,08) - - Alder ,0042 *) (6,97) 0,0091 *) (11,91) Direktør 0,1124 *) (4,06) 0,1269 *) (4,92) 0,1201 *) (4,50) 0,1126 *) (4,14) 0,3157 *) (12,27) 0,1673 *) (5,65) Leder 0,0977 *) (4,63) 0,0983 *) (4,87) 0,0976 *) (4,77) 0,0950 *) (4,60) 0,1434 *) (7,41) 0,1249 *) (5,90) København 0,0497 (1,11) 0,0569 (1,62) 0,0563 (1,51) 0,0559 (1,40) 0,0757 *) (4,52) 0,0415 (1,16) Bykommune -0,0129 (-0,41) -0,0092 (-0,33) -0,0100 (-0,35) -0,0110 (-0,3701) 0,0044 (0,26) -0,0139 (-0,44) Enlig -0,0385 (-2,97) -0,0403 *) (-3,21) -0,0404 *) (-3,19) -0,0386 *) (-3,02) -0,1236 *) (-9,78) -0,0798 (-6,28) Årsledh.grad -0,0124 *) (-11,73) -0,0121 *) (-11,23) -0,0121 *) (-11,18) -0,0121 *) (-11,19) -0,0171 *) (-15,27) -0,0131 *) (-9,83) Årsledh.grad kvadreret (0,35) (0,28) (0,26) (0,2530) 0,0001 *) (3,24) (1,37) Andre variable år Obs Individer Hausmanteststørrelse , , , ,37 Anm.: t-værdier i parentes. Within-estimationen med alder som forklarende variabel er ikke vist i tabellen. 1) Uddannelse instrumenteret, 2) uddannelse, erfaring og erfaring kvadreret instrumenteret, *) signifikant på fem procents niveau, **) signifikant på ti procents niveau. 16

17 Appendix E Estimerede uddannelsesafkast i denne og andre undersøgelser, procent Mænd Kvinder Denne undersøgelse: 3,1 2,5 Hanus og Lolk (98): Yngste generationer 5,4 2,8 Mellemste generationer 2 3,4 Ældste generationer 2,3 2,3 Smith (89): Funktionærer 4,3 1,2 Faglærte 1,4 Ufaglærte 0 0 Øvrige 2,2 1,4 Buus Kristensen (92): Hovedstaden 8,8 9,3 Provinsen 9,3 9,3 Pedersen, Schmid-Sørensen, Smith, Westergård-Nielsen (88): Privat 4,2 0 Offentlig 6 1,9 Larsen og Smith (88): Samlet, korrigeret for lønkorrektion 2 1,9 Rosholm og Smith (96): Funktionærer, offentlig 4,1 2,7 Funktionærer, privat 4,7 3,5 Ufaglærte, offentlig 0-0,4 Ufaglærte, privat 0,9 0 Anm: Oversigten er fundet i Hanus og Lolk [2]. 17

Undervisningsnoter til øvelse i Panel Modeller. %, it. E(x kjs

Undervisningsnoter til øvelse i Panel Modeller. %, it. E(x kjs 4 I afsnit 3 beskæftigede vi os med 1EC modellen og viste, hvordan den kunne estimereres med FGLS - bla under forudsætning af, at det individspecifikke stokastiske led er ukorreleret med de forklarende

Læs mere

Kvantitative metoder 2

Kvantitative metoder 2 Kvantitative metoder Heteroskedasticitet 11. april 007 KM: F18 1 Oversigt: Heteroskedasticitet OLS estimation under heteroskedasticitet (W.8.1-): Konsekvenser af heteroskedasticitet for OLS Gyldige test

Læs mere

Økonometri 1 Efterår 2006 Ugeseddel 11

Økonometri 1 Efterår 2006 Ugeseddel 11 Økonometri 1 Efterår 2006 Ugeseddel 11 Program for øvelserne: Gruppearbejde og plenumdiskussion Introduktion til SAS øvelser SAS øvelser Øvelsesopgave: Paneldata estimation Sammenhængen mellem alder og

Læs mere

Uddannelses afkast i Danmark

Uddannelses afkast i Danmark Københavns Universitet Økonomisk Institut Uddannelses afkast i Danmark Af: Inger Lise Wolff-Jensen Opponent: Dorte Grinderslev Vejledere: Mette Ejrnæs og Lars Even Rasmussen 1 Indholdfortegnelse 1. Indledning...3

Læs mere

1. Intoduktion. Undervisningsnoter til Øvelse i Paneldata

1. Intoduktion. Undervisningsnoter til Øvelse i Paneldata 1 Intoduktion Før man springer ud i en øvelse om paneldata og panelmodeller, kan det selvfølgelig være rart at have en fornemmelse af, hvorfor de er så vigtige i moderne mikro-økonometri, og hvorfor de

Læs mere

Den samlede model til estimation af lønpræmien er da givet ved:

Den samlede model til estimation af lønpræmien er da givet ved: Lønpræmien Lønpræmien i en branche kan indikere, om konkurrencen er hård eller svag i branchen. Hvis der er svag konkurrence mellem virksomhederne i branchen, vil det ofte give sig udslag i både højere

Læs mere

Økonometri 1 Forår 2006 Ugeseddel 11

Økonometri 1 Forår 2006 Ugeseddel 11 Økonometri 1 Forår 2006 Ugeseddel 11 Program for øvelserne: Gruppearbejde og plenumdiskussion Introduktion til SAS øvelser SAS øvelser Øvelsesopgave 5: Paneldata estimation af indkomstligninger på danske

Læs mere

Kvantitative metoder 2

Kvantitative metoder 2 Gentagne tværsnit og paneldata Kvantitative metoder 2 Gentagne tværsnit og panel data II 9. maj 2007 I dag: To-periode panel data: Følger de samme individer over to perioder (13.3-4) Unobserved effects

Læs mere

Økonometri 1. Den simple regressionsmodel 11. september Økonometri 1: F2

Økonometri 1. Den simple regressionsmodel 11. september Økonometri 1: F2 Økonometri 1 Den simple regressionsmodel 11. september 2006 Dagens program Den simple regressionsmodel SLR : Én forklarende variabel (Wooldridge kap. 2.1-2.4) Motivation for gennemgangen af SLR Definition

Læs mere

Baggrundsnotat: Søskendes uddannelsesvalg og indkomst

Baggrundsnotat: Søskendes uddannelsesvalg og indkomst 17. december 2013 Baggrundsnotat: Søskendes uddannelsesvalg og indkomst Dette notat redegør for den økonometriske analyse af indkomstforskelle mellem personer med forskellige lange videregående uddannelser

Læs mere

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17

Analysestrategi. Lektion 7 slides kompileret 27. oktober 200315:24 p.1/17 nalysestrategi Vælg statistisk model. Estimere parametre i model. fx. lineær regression Udføre modelkontrol beskriver modellen data tilstrækkelig godt og er modellens antagelser opfyldte fx. vha. residualanalyse

Læs mere

Kvantitative metoder 2

Kvantitative metoder 2 Kvantitative metoder 2 Specifikation og dataproblemer 30. april 2007 KM2: F21 1 Program for de to næste forelæsninger Emnet er specifikation og dataproblemer (Wooldridge kap. 9) Fejlleddet kan være korreleret

Læs mere

Økonometri 1. Gentagne tværsnit (W ): Opsamling. Gentagne tværsnit og paneldata. Gentagne Tværsnit og Paneldata II.

Økonometri 1. Gentagne tværsnit (W ): Opsamling. Gentagne tværsnit og paneldata. Gentagne Tværsnit og Paneldata II. Gentagne tværsnit (W 13.1-): Opsamling. Økonometri 1 Gentagne Tværsnit og Paneldata II Kombinerer tværsnit indsamlet på forskellige tidspunkter. Partial pooling: Tillader koefficienterne til nogle af variablerne

Læs mere

Kvantitative metoder 2

Kvantitative metoder 2 Kvantitative metoder 2 Den multiple regressionsmodel 5. marts 2007 regressionsmodel 1 Dagens program Emnet for denne forelæsning er stadig den multiple regressionsmodel (Wooldridge kap. 3.4-3.5, E.2) Variansen

Læs mere

Kvantitative metoder 2

Kvantitative metoder 2 Kvantitative metoder 2 Specifikation og dataproblemer 2. maj 2007 KM2: F22 1 Program Specifikation og dataproblemer, fortsat (Wooldridge kap. 9): Betydning af målefejl Dataudvælgelse: Manglende observationer

Læs mere

! Husk at udfylde spørgeskema 3. ! Lineær sandsynlighedsmodel. ! Eksempel. ! Mere om evaluering og selvselektion

! Husk at udfylde spørgeskema 3. ! Lineær sandsynlighedsmodel. ! Eksempel. ! Mere om evaluering og selvselektion Dagens program Økonometri 1 Dummy variable 4. marts 003 Emnet for denne forelæsning er kvalitative variable i den multiple regressionsmodel (Wooldridge kap. 7.5-7.6+8.1)! Husk at udfylde spørgeskema 3!

Læs mere

! Proxy variable. ! Målefejl. ! Manglende observationer. ! Dataudvælgelse. ! Ekstreme observationer. ! Eksempel: Lønrelation (på US data)

! Proxy variable. ! Målefejl. ! Manglende observationer. ! Dataudvælgelse. ! Ekstreme observationer. ! Eksempel: Lønrelation (på US data) Dagens program Økonometri 1 Specifikation, og dataproblemer 10. april 003 Emnet for denne forelæsning er specifikation (Wooldridge kap. 9.-9.4)! Proxy variable! Målefejl! Manglende observationer! Dataudvælgelse!

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Økonometri: Lektion 2 Multipel Lineær Regression 1/27

Økonometri: Lektion 2 Multipel Lineær Regression 1/27 Økonometri: Lektion 2 Multipel Lineær Regression 1/27 Multipel Lineær Regression Sidst så vi på simpel lineær regression, hvor y er forklaret af én variabel. Der er intet, der forhindre os i at have mere

Læs mere

, i ' 1,...,N ; t ' 1,...,T, - i.i.d.(0,f 2, ), ) ' 0, E(, it. x kjs. œ i,t,s,j,k.

, i ' 1,...,N ; t ' 1,...,T, - i.i.d.(0,f 2, ), ) ' 0, E(, it. x kjs. œ i,t,s,j,k. 3 Den model, som vi gennemgående skal arbejde med i øvelsen, er»one-way Error Component«Modellen (1EC) Modellen specificeres på følgende måde: y it ' x it $ % µ i %, it, i ' 1,,N ; t ' 1,,T, hvor y it

Læs mere

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA) Anvendt Statistik Lektion 9 Variansanalyse (ANOVA) 1 Undersøge sammenhæng Undersøge sammenhænge mellem kategoriske variable: χ 2 -test i kontingenstabeller Undersøge sammenhæng mellem kontinuerte variable:

Læs mere

Simpel Lineær Regression: Model

Simpel Lineær Regression: Model Simpel Lineær Regression: Model Sidst så vi på simpel lineære regression. Det er en statisisk model på formen y = β 0 + β 1 x + u, hvor fejlledet u, har egenskaben E[u x] = 0. Dette betyder bl.a. E[y x]

Læs mere

Økonometri: Lektion 2 Multipel Lineær Regression 1/33

Økonometri: Lektion 2 Multipel Lineær Regression 1/33 Økonometri: Lektion 2 Multipel Lineær Regression 1/33 Simpel Lineær Regression: Model Sidst så vi på simpel lineære regression. Det er en statisisk model på formen y = β 0 +β 1 x +u, hvor fejlledet u,

Læs mere

Hver anden vil benytte øget åbningstid i dagtilbud

Hver anden vil benytte øget åbningstid i dagtilbud Børnefamiliers dagtilbud og arbejdsliv 17. maj 18 Hver anden vil benytte øget åbningstid i dagtilbud Halvdelen af alle lønmodtagere med børn mellem -13 år ville benytte sig af udvidede åbningstider i deres

Læs mere

Wooldridge, kapitel 19: Carrying out an Empirical Project. Information og spørgsmål vedr. eksamen. Økonometri 1: Afslutningsforelæsning 2

Wooldridge, kapitel 19: Carrying out an Empirical Project. Information og spørgsmål vedr. eksamen. Økonometri 1: Afslutningsforelæsning 2 Økonometri 1 Afslutningsforelæsning 19. maj 2003 Økonometri 1: Afslutningsforelæsning 1 Evalueringer Kun 23 har udfyldt evalueringsskemaerne ud af ca. 120 tilmeldte til eksamen Resultatet kan ses på hjemmesiden

Læs mere

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i.

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i. Repetition af vektor-regning Økonometri: Lektion 3 Matrix-formulering Fordelingsantagelse Hypotesetest Antag vi har to n-dimensionelle (søjle)vektorer a 1 b 1 a 2 a =. og b = b 2. a n b n Tænk på a og

Læs mere

Økonometri, ugeseddel 8 Hold 1 1/4-2003

Økonometri, ugeseddel 8 Hold 1 1/4-2003 1 Modeller/diagrammer med dummy er Disse tre diagrammer ligger til grund for gruppearbejdet. a) Generel regressions model g = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 +..+ β n x n + u i, Hvor i =1,.n g b) Model

Læs mere

Økonometri 1. Oversigt. Mere om dataproblemer Gentagne tværsnit og panel data I

Økonometri 1. Oversigt. Mere om dataproblemer Gentagne tværsnit og panel data I Oversigt Økonometri 1 Mere om dataproblemer Gentagne tværsnit og panel data I Info om prøveeksamen Mere om proxyvariabler og målefejl fra sidste gang. Selektion og dataproblemer Intro til nyt emne: Observationer

Læs mere

Out-of-sample forecast samt reestimation af ADAMs lønligning

Out-of-sample forecast samt reestimation af ADAMs lønligning Danmarks Statistik MODELGRUPPEN Arbejdspapir* Peter Agger Troelsen 31. oktober 2013 Out-of-sample forecast samt reestimation af ADAMs lønligning Resumé: Papiret reestimerer ADAMs lønligning og vurderer

Læs mere

Beskæftigelsesudvalget BEU Alm.del endeligt svar på spørgsmål 38 Offentligt

Beskæftigelsesudvalget BEU Alm.del endeligt svar på spørgsmål 38 Offentligt Beskæftigelsesudvalget 2015-16 BEU Alm.del endeligt svar på spørgsmål 38 Offentligt Folketingets Beskæftigelsesudvalg lov@ft.dk Ikke-medlem af udvalget (MFU) Yildiz Akdogan yildiz.akdogan@ft.dk Beskæftigelsesministeriet

Læs mere

Økonometri 1. Dagens program. Den multiple regressionsmodel 18. september 2006

Økonometri 1. Dagens program. Den multiple regressionsmodel 18. september 2006 Dagens program Økonometri Den multiple regressionsmodel 8. september 006 Opsamling af statistiske resultater om den simple lineære regressionsmodel (W kap..5). Den multiple lineære regressionsmodel (W

Læs mere

Økonometri 1. Dagens program. Den simple regressionsmodel 15. september 2006

Økonometri 1. Dagens program. Den simple regressionsmodel 15. september 2006 Dagens program Økonometri Den simple regressionsmodel 5. september 006 Den simple lineære regressionsmodel (Wooldridge kap.4-.6) Eksemplet fortsat: Løn og uddannelse på danske data Funktionel form Statistiske

Læs mere

Økonometri 1. Prediktion. Dummyvariabler 9. oktober Økonometri 1: F9 1

Økonometri 1. Prediktion. Dummyvariabler 9. oktober Økonometri 1: F9 1 Økonometri 1 Prediktion. Dummyvariabler 9. oktober 2006 Økonometri 1: F9 1 Program frem til efterårsferien Om goodness-of-fit, prediktion og residualer (kap. 6.3-4) Kvalitative egenskaber i den multiple

Læs mere

Indledning...1. Analyse af lønforskellen mellem kvinder og mænd...2

Indledning...1. Analyse af lønforskellen mellem kvinder og mænd...2 Ligelønsanalyse sammenligning af privatansatte kvinder og mænds løn Ref. PIL/- 17.02.2016 Indledning I dette notat præsenteres resultater fra en analyse af lønforskellen mellem mænd og kvinder. Analysen

Læs mere

Effekten af indvandring på indfødte danskeres løn og beskæftigelse

Effekten af indvandring på indfødte danskeres løn og beskæftigelse d. 22.05.2017 Brian Krogh Graversen (DØRS) Effekten af indvandring på indfødte danskeres løn og beskæftigelse I kapitlet Udenlandsk arbejdskraft i Dansk Økonomi, forår 2017 analyseres det, hvordan indvandringen

Læs mere

Fokus på Forsyning. Datagrundlag og metode

Fokus på Forsyning. Datagrundlag og metode Fokus på Forsyning I notatet gennemgås datagrundlaget for brancheanalysen af forsyningssektoren sammen med variable, regressionsmodellen og tilhørende tests. Slutteligt sammenfattes analysens resultater

Læs mere

Betydningen af konjunktur og regelændringer for udviklingen i sygedagpengemodtagere

Betydningen af konjunktur og regelændringer for udviklingen i sygedagpengemodtagere DET ØKONOMISKE RÅD S E K R E T A R I A T E T d. 20. maj 2005 SG Betydningen af konjunktur og regelændringer for udviklingen i sygedagpengemodtagere Baggrundsnotat vedr. Dansk Økonomi, forår 2005, kapitel

Læs mere

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser Uge 43 I Teoretisk Statistik,. oktober 3 Simpel lineær regressionsanalyse Forudsigelser Fortolkning af regressionsmodellen Ekstreme observationer Transformationer Sammenligning af to regressionslinier

Læs mere

! Variansen på OLS estimatoren. ! Multikollinaritet. ! Variansen i misspecificerede modeller. ! Estimat af variansen på fejlleddet

! Variansen på OLS estimatoren. ! Multikollinaritet. ! Variansen i misspecificerede modeller. ! Estimat af variansen på fejlleddet Dagens program Økonometri Den multiple regressionsmodel 4. februar 003 regressionsmodel Emnet for denne forelæsning er stadig den multiple regressionsmodel (Wooldridge kap. 3.4-3.5)! Opsamling fra sidst

Læs mere

Appendiks Økonometrisk teori... II

Appendiks Økonometrisk teori... II Appendiks Økonometrisk teori... II De klassiske SLR-antagelser... II Hypotesetest... VII Regressioner... VIII Inflation:... VIII Test for SLR antagelser... IX Reset-test... IX Plots... X Breusch-Pagan

Læs mere

Økonometri: Lektion 6 Emne: Heteroskedasticitet

Økonometri: Lektion 6 Emne: Heteroskedasticitet Økonometri: Lektion 6 Emne: Heteroskedasticitet 1 / 32 Konsekvenser af Heteroskedasticitet Antag her (og i resten) at MLR.1 til MLR.4 er opfyldt. Antag MLR.5 ikke er opfyldt, dvs. vi har heteroskedastiske

Læs mere

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som MLR antagelserne Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som y = β 0 + β 1 x 1 + β 2 x 2 + + β k x k + u, hvor β 0, β 1, β 2,...,β k er ukendte parametere,

Læs mere

INDVANDRERES TILKNYTNING TIL ARBEJDSMARKEDET

INDVANDRERES TILKNYTNING TIL ARBEJDSMARKEDET Januar 2003 Af Anita Vium - Direkte telefon: 33 55 77 24 Resumé: INDVANDRERES TILKNYTNING TIL ARBEJDSMARKEDET Indvandrere har større ledighed, mindre erhvervsdeltagelse og dermed lavere beskæftigelse end

Læs mere

5. Dynamiske Modeller

5. Dynamiske Modeller 5. En af styrkerne ved paneldata er, som det også blev diskuteret i afsnit 1, at det er muligt både at beskrive de statistiske processer på både langt og kort sigt ved at udnytte både tværsnits- og panelegenskaberne

Læs mere

Kvantitative metoder 2

Kvantitative metoder 2 Kvalitative egenskaber og dummyvariabler Kvantitative metoder 2 Dummyvariabler 28. marts 2007 Vi har (hovedsagligt) set på kvantitative variabler (løn, priser, forbrug, indkomst, )... Men hvad med kvalitative

Læs mere

Økonometri 1. Målsætning for Økonometri 1. Dagens program: Afslutningsforelæsning 16. December 2005

Økonometri 1. Målsætning for Økonometri 1. Dagens program: Afslutningsforelæsning 16. December 2005 Dagens program: Økonometri 1 Afrunding og perspektivering af Økonometri 1. Opfølgning af introduktionsforelæsningen. Wooldridge, kapitel 19: Carrying out an Empirical Project Oversigt over økonometriske

Læs mere

De variable, som er inkluderet i de forskellige modeller, er følgende:

De variable, som er inkluderet i de forskellige modeller, er følgende: DUL II. Undersøgelse af hvilke faktorer, der er væsentlige for at understøtte, at der er klare og veltilrettelagte mål tilstede i arbejdet med elevernes læring Følgende er en statistisk analyse af ovenstående

Læs mere

Økonometri 1. Inferens i den lineære regressionsmodel 2. oktober Økonometri 1: F8 1

Økonometri 1. Inferens i den lineære regressionsmodel 2. oktober Økonometri 1: F8 1 Økonometri 1 Inferens i den lineære regressionsmodel 2. oktober 2006 Økonometri 1: F8 1 Dagens program Opsamling om asymptotiske egenskaber: Asymptotisk normalitet Asymptotisk efficiens Test af flere lineære

Læs mere

Økonometri 1. Dagens program: Afslutningsforelæsning 23. maj 2007

Økonometri 1. Dagens program: Afslutningsforelæsning 23. maj 2007 Dagens program: Økonometri 1 Afslutningsforelæsning 23. maj 2007 6-trins procedure til IV estimation. Afrunding af IV: Rygning og fødselsvægt. Afrunding og perspektivering af Kvant 2. Opfølgning af introduktionsforelæsningen.

Læs mere

Ligelønsanalyse sammenligning af offentligt ansatte kvinder og mænds løn

Ligelønsanalyse sammenligning af offentligt ansatte kvinder og mænds løn Ligelønsanalyse sammenligning af offentligt ansatte kvinder og mænds løn Indledning Ref. KAB/- 28.02.2017 I dette notat præsenteres resultater fra en analyse af lønforskellen mellem mænd og kvinder. Analysen

Læs mere

Økonometri 1. Dummyvariabler 13. oktober Økonometri 1: F10 1

Økonometri 1. Dummyvariabler 13. oktober Økonometri 1: F10 1 Økonometri 1 Dummyvariabler 13. oktober 2006 Økonometri 1: F10 1 Dagens program Dummyvariabler i den multiple regressionsmodel (Wooldridge kap. 7.3-7.6) Dummy variabler for kvalitative egenskaber med flere

Læs mere

Baggrundsnotat: Undervisningstimer på universitetet

Baggrundsnotat: Undervisningstimer på universitetet 17. december 2013 Baggrundsnotat: Undervisningstimer på universitetet Dette notat redegør for den økonometriske analyse af sammenhængen mellem undervisningstid og indkomst i afsnit 5.3 i Analyserapport

Læs mere

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven. PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve

Læs mere

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Stikprøver og stikprøve fordelinger Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader Statistik Statistisk Inferens: Prediktere og forekaste værdier af

Læs mere

Bilag 12 Regressionsanalysens tabeller og forklaringer

Bilag 12 Regressionsanalysens tabeller og forklaringer Bilag 12 Regressionsanalysens tabeller og forklaringer Regressionsanalysens tabeller og forklaringer Regressionsanalysen vil være delt op i 2 blokke. Første blok vil analysere hvor meget de tre TPB variabler

Læs mere

Rettevejledning til Økonomisk Kandidateksamen 2007II. Økonometri 1

Rettevejledning til Økonomisk Kandidateksamen 2007II. Økonometri 1 Rettevejledning til Økonomisk Kandidateksamen 2007II Økonometri 1 Vurderingsgrundlaget for tag-hjem eksamen er selve opgavebesvarelsen og bilaget. Programmer og data bedømmes som sådan ikke, men er anvendt

Læs mere

Statistik II 1. Lektion. Analyse af kontingenstabeller

Statistik II 1. Lektion. Analyse af kontingenstabeller Statistik II 1. Lektion Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller Logistisk regression

Læs mere

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Anvendt Statistik Lektion 8. Multipel Lineær Regression Anvendt Statistik Lektion 8 Multipel Lineær Regression 1 Simpel Lineær Regression (SLR) y Sammenhængen mellem den afhængige variabel (y) og den forklarende variabel (x) beskrives vha. en SLR: ligger ikke

Læs mere

Dansk Erhvervs gymnasieeffekt - sådan gør vi

Dansk Erhvervs gymnasieeffekt - sådan gør vi Dansk Erhvervs gymnasieeffekt - sådan gør vi FORMÅL Formålet har været at undersøge, hvor dygtige de enkelte gymnasier er til at løfte elevernes faglige niveau. Dette kan man ikke undersøge blot ved at

Læs mere

Dansk Erhvervs gymnasieanalyse Sådan gør vi

Dansk Erhvervs gymnasieanalyse Sådan gør vi METODENOTAT Dansk Erhvervs gymnasieanalyse Sådan gør vi FORMÅL Formålet med analysen er at undersøge, hvor dygtige de enkelte gymnasier er til at løfte elevernes faglige niveau. Dette kan man ikke undersøge

Læs mere

Psykisk arbejdsmiljø og stress

Psykisk arbejdsmiljø og stress Psykisk arbejdsmiljø og stress - Hvilke faktorer har indflydelse på det psykiske arbejdsmiljø og medarbejdernes stress Marts 2018 Konklusion Denne analyse forsøger at afklare, hvilke faktorer der påvirker

Læs mere

De afviste ansøgere til videregående uddannelser

De afviste ansøgere til videregående uddannelser De afviste ansøgere til videregående uddannelser Indhold Sammenfatning... 3 Problemstillingen... 4 Data... 5 Mobilitet i uddannelserne... 8 Arbejdsmarkedsstatus for afviste og optagne... 11 Konklusion...

Læs mere

Markante sæsonudsving på boligmarkedet

Markante sæsonudsving på boligmarkedet N O T A T Markante sæsonudsving på boligmarkedet 9. marts 0 Denne analyse estimerer effekten af de sæsonudsving, der præger prisudviklingen på boligmarkedet. Disse priseffekter kan være hensigtsmæssige

Læs mere

Lagrange multiplier test. Økonometri: Lektion 6 Håndtering ad heteroskedasticitet. Konsekvenser af Heteroskedasticitet

Lagrange multiplier test. Økonometri: Lektion 6 Håndtering ad heteroskedasticitet. Konsekvenser af Heteroskedasticitet Lagrange multiplier test Et alternativ til F -testet af en eller flere parametre. Økonometri: Lektion 6 Håndtering ad heteroskedasticitet Antag vi har model: y = β 0 + β 1 x 2 + + β k x k + u. Vi ønsker

Læs mere

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter Program Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve Helle Sørensen E-mail: helle@math.ku.dk I formiddag: Øvelse: effekt af diæter. Repetition fra sidst... Parrede og ikke-parrede

Læs mere

Løsning til eksaminen d. 14. december 2009

Løsning til eksaminen d. 14. december 2009 DTU Informatik 02402 Introduktion til Statistik 200-2-0 LFF/lff Løsning til eksaminen d. 4. december 2009 Referencer til Probability and Statistics for Engineers er angivet i rækkefølgen [8th edition,

Læs mere

Multipel Lineær Regression

Multipel Lineær Regression Multipel Lineær Regression Trin i opbygningen af en statistisk model Repetition af MLR fra sidst Modelkontrol Prædiktion Kategoriske forklarende variable og MLR Opbygning af statistisk model Specificer

Læs mere

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd I dag Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik SaSt) Helle Sørensen Først lidt om de sidste uger af SaSt. Derefter statistisk analyse af en enkelt

Læs mere

Dansk Erhvervs gymnasieeffekt - sådan gjorde vi

Dansk Erhvervs gymnasieeffekt - sådan gjorde vi Dansk Erhvervs gymnasieeffekt - sådan gjorde vi INDHOLD Formålet har været at undersøge, hvor dygtige de enkelte gymnasier er til at løfte elevernes faglige niveau. Dette kan man ikke undersøge blot ved

Læs mere

KLYNGEANALYSE. Kvantitativ analyse til gruppering af fastholdelsesfleksjobbere. Viden og Analyse / CCFC

KLYNGEANALYSE. Kvantitativ analyse til gruppering af fastholdelsesfleksjobbere. Viden og Analyse / CCFC Grupper af fastholdelsesfleksjobbere før og efter reformen 2013 KLYNGEANALYSE Kvantitativ analyse til gruppering af fastholdelsesfleksjobbere 13. oktober 2017 Viden og Analyse / CCFC 1. Indledning I forbindelse

Læs mere

Simpel Lineær Regression

Simpel Lineær Regression Simpel Lineær Regression Mål: Forklare variablen y vha. variablen x. Fx forklare Salg (y) vha. Reklamebudget (x). Vi antager at sammenhængen mellem y og x er beskrevet ved y = β 0 + β 1 x + u. y: Afhængige

Læs mere

Økonometri 1. Kvalitative variabler. Kvalitative variabler. Dagens program. Kvalitative variable 8. marts 2006

Økonometri 1. Kvalitative variabler. Kvalitative variabler. Dagens program. Kvalitative variable 8. marts 2006 Dagens program Økonometri 1 Kvalitative variable 8. marts 2006 Kvalitative variabler som forklarende variabler i en lineær regressionsmodel (Wooldridge kap. 7.1-7.4) Kvalitative variabler generelt Dummy

Læs mere

Køber gifte kvinder flere aktier?

Køber gifte kvinder flere aktier? Køber gifte kvinder flere aktier? Baggrund og resumé Finansrådet undersøger i denne analyse, hvordan ændringer i ægteskabsstatus påvirker kvinders og mænds deltagelse på aktiemarkedet og deres risikovillighed.

Læs mere

Estimation af bilkøbsrelationen med nye indkomst- og formueudtryk

Estimation af bilkøbsrelationen med nye indkomst- og formueudtryk Danmarks Statistik MODELGRUPPEN Arbejdspapir* Edith Madsen 21. juli 1997 Estimation af bilkøbsrelationen med nye indkomst- og formueudtryk Resumé: Papiret præsenterer en reestimationen af fcb-relationen.

Læs mere

Tema. Dagens tema: Indfør centrale statistiske begreber.

Tema. Dagens tema: Indfør centrale statistiske begreber. Tema Dagens tema: Indfør centrale statistiske begreber. Model og modelkontrol Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse. konfidensintervaller Vi tager udgangspunkt i Ex. 3.1 i

Læs mere

Appendiks A. Entreprenørskabsundervisning i befolkningen, specielt blandt unge

Appendiks A. Entreprenørskabsundervisning i befolkningen, specielt blandt unge Appendiks A. Entreprenørskabsundervisning i befolkningen, specielt blandt unge Redegørelsen ovenfor er baseret på statistiske analyser, der detaljeres i det følgende, et appendiks for hvert afsnit. Problematikken

Læs mere

Unge afgiver rask væk personlige oplysninger for at få adgang til sociale medier

Unge afgiver rask væk personlige oplysninger for at få adgang til sociale medier Af: Juniorkonsulent Christoffer Thygesen og cheføkonom Martin Kyed Notat 6. februar 06 Unge afgiver rask væk personlige oplysninger for at få adgang til sociale medier Analysens hovedresultater Kun hver

Læs mere

Referat : af Gruppearbejde Økonometri1 øvelsestime ugeseddel 7 dato 26/3 2003, Hold 4

Referat : af Gruppearbejde Økonometri1 øvelsestime ugeseddel 7 dato 26/3 2003, Hold 4 Referat : af Gruppearbejde Økonometri1 øvelsestime ugeseddel 7 dato 26/3 2003, Hold 4 Spm1 Den udvidede model med de to strukturelle variable sk og sh: g i (60-00) = B 0 + B 1 *log(y i ) + B 2 [ log(sk

Læs mere

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007 Rettevejledning til eksamen i Kvantitative metoder 1,. årsprøve. januar 007 I rettevejledningen henvises der til Berry and Lindgren "Statistics Theory and methods"(b&l) hvis ikke andet er nævnt. Opgave

Læs mere

Ligelønsanalyse sammenligning af lønniveau offentligt ansatte i kommuner og regioner

Ligelønsanalyse sammenligning af lønniveau offentligt ansatte i kommuner og regioner Ligelønsanalyse sammenligning af lønniveau offentligt ansatte i kommuner og regioner Indledning I dette notat analyseres lønforskelle mellem kvindelige og mandlige djøfere, som er ansat i det offentlige

Læs mere

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ Indhold 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) 2 1.1 Variation indenfor og mellem grupper.......................... 2 1.2 F-test for ingen

Læs mere

Økonometri: Lektion 6 Emne: Heteroskedasticitet

Økonometri: Lektion 6 Emne: Heteroskedasticitet Økonometri: Lektion 6 Emne: Heteroskedasticitet 1 / 34 Lagrange multiplier test Et alternativ til F -testet af en eller flere parametre. Antag vi har model: Vi ønsker at teste hypotesen y = β 0 + β 1 x

Læs mere

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Anvendt Statistik Lektion 7. Simpel Lineær Regression Anvendt Statistik Lektion 7 Simpel Lineær Regression 1 Er der en sammenhæng? Plot af mordraten () mod fattigdomsraten (): Scatterplot Afhænger mordraten af fattigdomsraten? 2 Scatterplot Et scatterplot

Læs mere

Metodenotat FLIS sammenligningskommuner 2016-data

Metodenotat FLIS sammenligningskommuner 2016-data Metodenotat FLIS sammenligningskommuner 2016-data Dette notat præsenterer metoden bag beregningen af de modeller, der anvendes til bestemmelse af sammenligningskommuner i FLIS. Den seneste beregning er

Læs mere

Økonomisk Kandidateksamen 2006II Økonometri 1. Afkastet af uddannelse for britiske tvillingepar

Økonomisk Kandidateksamen 2006II Økonometri 1. Afkastet af uddannelse for britiske tvillingepar Økonomisk Kandidateksamen 2006II Økonometri 1 Afkastet af uddannelse for britiske tvillingepar Praktiske anvisninger til individuel tag-hjem eksamen i Økonometri 1: Start med at sikre dig, at du kan få

Læs mere

TIL RAPPORTEN DANSKE LØNMODTAGERES ARBEJDSTID EN REGISTERBASERET ANALYSE, SFI DET NATIONALE FORSKNINGSCENTER FOR VELFÆRD 09:03.

TIL RAPPORTEN DANSKE LØNMODTAGERES ARBEJDSTID EN REGISTERBASERET ANALYSE, SFI DET NATIONALE FORSKNINGSCENTER FOR VELFÆRD 09:03. 05:2009 ARBEJDSPAPIR Mette Deding Trine Filges APPENDIKS TIL RAPPORTEN DANSKE LØNMODTAGERES ARBEJDSTID EN REGISTERBASERET ANALYSE, SFI DET NATIONALE FORSKNINGSCENTER FOR VELFÆRD 09:03. FORSKNINGSAFDELINGEN

Læs mere

Analyse: Her bor de dårlige betalere

Analyse: Her bor de dårlige betalere Analyse: Her bor de dårlige betalere 11. juni 2013 Resumé At være registreret i RKI kan have store negative økonomiske og sociale konsekvenser både for den enkelte og samfundet. Antallet af de såkaldte

Læs mere

Københavnske ejerlejlighedspriser en meget begrænset indikator for hele landets boligmarked

Københavnske ejerlejlighedspriser en meget begrænset indikator for hele landets boligmarked N O T A T Københavnske ejerlejlighedspriser en meget begrænset indikator for hele landets boligmarked Baggrund og resume Efter i årevis at have rapporteret om et fastfrosset boligmarked, har de danske

Læs mere

Økonometri 1. FunktioneI form i den lineære regressionsmodel 19. oktober Dagens program

Økonometri 1. FunktioneI form i den lineære regressionsmodel 19. oktober Dagens program Dagens program Økonometri 1 FunktioneI form i den lineære regressionsmodel 19. oktober 004 Mere om funktionel form (kap 6.) Log transformation Kvadratisk form Interaktionseffekter Goodness of fit (kap.

Læs mere

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet Eksamen ved Københavns Universitet i Kvantitative forskningsmetoder Det Samfundsvidenskabelige Fakultet 14. december 2011 Eksamensnummer: 5 14. december 2011 Side 1 af 6 1) Af boxplottet kan man aflæse,

Læs mere

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen 1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

Læs mere

Kvantitative Metoder 1 - Efterår Dagens program

Kvantitative Metoder 1 - Efterår Dagens program Dagens program Estimation: Kapitel 9.7-9.10 Estimationsmetoder kap 9.10 Momentestimation Maximum likelihood estimation Test Hypoteser kap. 10.1 Testprocedure kap 10.2 Teststørrelsen Testsandsynlighed 1

Læs mere

Nyt studie: Lavere arveafgift kan sænke arbejdsudbuddet

Nyt studie: Lavere arveafgift kan sænke arbejdsudbuddet Nyt studie: Lavere arveafgift kan sænke arbejdsudbuddet Et nyt studie fra Norges svar på Danmarks Statistik, Statistisk Sentralbyrå, viser, at arvinger i Norge, der modtager en arv, der er større end gennemsnitsarven,

Læs mere

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05 Statistik 7. gang 9. HYPOTESE TEST Hypotesetest ved 6 trins raket! : Trin : Formuler hypotese Spørgsmål der ønskes testet vha. data H : Nul hypotese Formuleres som en ligheds hændelse H eller H A : Alternativ

Læs mere

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0 Hypotesetest Hypotesetest generelt Ingredienserne i en hypotesetest: Statistisk model, f.eks. X 1,,X n uafhængige fra bestemt fordeling. Parameter med estimat. Nulhypotese, f.eks. at antager en bestemt

Læs mere

Økonometri Lektion 1 Simpel Lineær Regression 1/31

Økonometri Lektion 1 Simpel Lineær Regression 1/31 Økonometri Lektion 1 Simpel Lineær Regression 1/31 Simpel Lineær Regression Mål: Forklare variablen y vha. variablen x. Fx forklare Salg (y) vha. Reklamebudget (x). Statistisk model: Vi antager at sammenhængen

Læs mere

Overordnet set skelnes der mellem to former for mobilitet: Geografisk og faglig mobilitet.

Overordnet set skelnes der mellem to former for mobilitet: Geografisk og faglig mobilitet. Geografisk mobilitet 1. Indledning En mobil arbejdsstyrke er afgørende for et velfungerende arbejdsmarked. Mobilitet viser sig ved, at den enkelte lønmodtager er villig og i stand til at søge beskæftigelse

Læs mere

Kapitel 11 Lineær regression

Kapitel 11 Lineær regression Kapitel 11 Lineær regression Peter Tibert Stoltze stat@peterstoltze.dk Elementær statistik F2011 1 / 1 Indledning Vi modellerer en afhængig variabel (responset) på baggrund af en uafhængig variabel (stimulus),

Læs mere

Befolkningsudviklingen og dekomponering af Theilindekset

Befolkningsudviklingen og dekomponering af Theilindekset d. 10.11.2016 Marie Møller Kjeldsen (DORS) Befolkningsudviklingen og dekomponering af Theilindekset I notatet beskrives, hvordan Theil-indekset kan dekomponeres, og indekset anvendes til at dekomponere

Læs mere

Ligelønsanalyse sammenligning af privatansatte kvinder og mænds løn

Ligelønsanalyse sammenligning af privatansatte kvinder og mænds løn Ligelønsanalyse sammenligning af privatansatte kvinder og mænds løn Indledning I dette notat analyseres lønforskelle mellem privat ansatte kvinder og mænd. Analysen er gennemført på baggrund af Djøf Privats

Læs mere