Uddannelses afkast i Danmark

Relaterede dokumenter

1. Intoduktion. Undervisningsnoter til Øvelse i Paneldata

Den samlede model til estimation af lønpræmien er da givet ved:

Estimation af Uddannelsesafkast

Eksempel på besvarelse af spørgeordet Hvad kan udledes (beregn) inkl. retteark.

Økonometri 1. Den simple regressionsmodel 11. september Økonometri 1: F2

Kønsbestemt lønforskel? Analyse på baggrund af IDAs lønstatistik om forskel på privatansatte kvinder og mænds løn

Økonometri 1. Oversigt. Mere om dataproblemer Gentagne tværsnit og panel data I

Indledning...1. Analyse af lønforskellen mellem kvinder og mænd...2

Økonometri 1. Gentagne tværsnit (W ): Opsamling. Gentagne tværsnit og paneldata. Gentagne Tværsnit og Paneldata II.

Kvantitative metoder 2

Skilsmisse - Alvorlige tal om bløde temaer. Michael Svarer Institut for Økonomi Aarhus Universitet

Betydningen af konjunktur og regelændringer for udviklingen i sygedagpengemodtagere

Minianalyse: En kvart million borgere med dårlige færdigheder i Region Hovedstaden

Kvantitative metoder 2

I 2012 havde de 68-årige (årgang 1944) samme beskæftigelsesfrekvens som de 67-årige (årgang 1941) havde i 2008.

Mobning på arbejdspladsen. En undersøgelse af oplevelser med mobning blandt STEM-ansatte

VÆKST I UFAGLÆRTE JOB I 2006 MEN DE BESÆTTES AF UNGE

Charlotte Møller Nikolajsen

5. Dynamiske Modeller

! Husk at udfylde spørgeskema 3. ! Lineær sandsynlighedsmodel. ! Eksempel. ! Mere om evaluering og selvselektion

Effekten af indvandring på indfødte danskeres løn og beskæftigelse

Økonometri 1. Dummyvariabler 13. oktober Økonometri 1: F10 1

Eksamen ved. Københavns Universitet i. Kvantitative forskningsmetoder. Det Samfundsvidenskabelige Fakultet

Behov for uddannelsesløft blandt indvandrere

INDVANDRERES TILKNYTNING TIL ARBEJDSMARKEDET

Lønudvikling i Erhverv i alt og branchen Finansiering og forsikring, indeks 2008= K1 2011K3 2012K1 2011K4 2012K2 2013K2 2012K3 2013K3 2012K4

HK s lønstatistik 2007

Ralph Bøge Jensen 20. december Lønligningen. Resumé:

Analyse af nystartende elever og omgængere i grundskolens børnehaveklasse. Baseret på data for skoleåret 2010/11

Ligelønsanalyse sammenligning af offentligt ansatte kvinder og mænds løn

Eksempel på logistisk vækst med TI-Nspire CAS

Bryder børnene den sociale arv og får en ungdomsuddannelse?

E-HANDEL 2013 INTERNETUNDERSØGELSE FORETAGET AF MEGAFON JULI post på din måde

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Københavnske ejerlejlighedspriser en meget begrænset indikator for hele landets boligmarked

Bilag 12 Regressionsanalysens tabeller og forklaringer

Seksuel chikane på arbejdspladsen. En undersøgelse af oplevelser med seksuel chikane i arbejdslivet blandt STEM-ansatte

Hovedresultater fra registeranalyse. Fra uddannelse til første job med handicap. April Gennemført af: Pluss Leadership VIA University College

Fri og uafhængig Selvstændiges motivation

Analyse af dagpengesystemet

Afkast til human kapital i Danmark,

- hvor går de hen? Viborg Katedralskole Stx

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Rettevejledning til Økonomisk Kandidateksamen 2007II. Kvantitative Metoder 2: Tag-hjem eksamen

Unges brug af tandpleje

Notat. Notat om produktivitet og lange videregående uddannelser. Martin Junge. Oktober

At bruge sin dyrebare tid på frivilligt arbejde -En analyse af hvem der bruger mest tid på frivilligt arbejde og hvorfor?

Økonometri 1. Prediktion. Dummyvariabler 9. oktober Økonometri 1: F9 1

Management Summary Arbejdsmarkedsundersøgelse 2010

Ligelønsanalyse sammenligning af offentligt ansatte kvinder og mænds løn

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007

3 DANSKERNES ALKOHOLVANER

Bilag 5: Økonometriske analyser af energispareindsatsens. (Cointegration) Energistyrelsen. Marts 2015

Et eksempel på en todimensional normalfordeling Anders Milhøj September 2006

Danske unges gældsadfærd

Overgangsanalyse for de udsatte unge i forberedende tilbud - Et selekteringsproblem

To samhørende variable

En statistikstuderendes bekendelser Søren Wengel Mogensen

Transkript:

Københavns Universitet Økonomisk Institut Uddannelses afkast i Danmark Af: Inger Lise Wolff-Jensen Opponent: Dorte Grinderslev Vejledere: Mette Ejrnæs og Lars Even Rasmussen 1

Indholdfortegnelse 1. Indledning...3 2. Problemformulering...3 3. Arbejdsmarkedsteori...4 4. Datamaterialet...5 5. Model...7 5.1 Fixed effekt modellen...8 5.2 Random effekt...9 5.3 Hausmann test...9 6. Resultater...10 7. Afsluttende bemærkninger...13 8. Konklusion...14 2

1. Indledning Denne øvelse skal tage udgangspunkt i Panel Data. Panel Data er en speciel type datasæt, der modsat f.eks. tværsnitsdata eller rene tidsserier udemærker sig ved, at variere over både tid og individ. Dermed er der mulighed for at arbejde med meget store datasæt, hvilket gør estimationerne mere sikre. Panel Data består af data, der er indsamlet over flere år. Familier, virksomheder, kommuner eller lande er udvalgt for derefter, at blive observeret. For familier betyder dette, at de bliver spurgt de samme spørgsmål år efter år igennem en lang årrække. En afgørende ting i Panel Data er, at antal observationer er langt større end årrække, d.v.s. antal år. Kap 2 vil være en nærmere beskrivelse af, hvad jeg egentlig vil belyse i denne opgave. I kap. 3 vil der kort blive gennemgået arbejdsmarkedsteori ud fra lønfunktionen. I kap 4 vil jeg beskrive, hvilke variable jeg har valgt at benytte og hvorfor. Som i kap. 3 vil der i kap. 5 blive gennemgået de teoretiske modeller, der vil blive benyttet til de test, hvis resultater vil blive gennemgået i kap. 6. Endelig sluttes af med en opsamling samt konkluderende bemærkninger. 2. Problemformulering I denne opgave vil jeg se på lønudviklingen i forhold til individernes erhvervserfaring på arbejdsmarkedet. Dette gøres ved hjælp af IDA databasen, der består af arbejdsmarkedstal fra årene 1980 til 1993. Datasættet er ubalanceret, hvilket vil sige, at ikke alle individer er observeret over lige mange år. Nogle er kun observeret over 5 år og andre helt op til 12 år. Dette skyldes deres fødselstidspunkt, da individerne først kan komme i betragtning efter det 15 år, og ikke vil være i datamaterialet når de dør. Derved bliver der en vis udskiftning i datamaterialet. Det interessante bliver ikke, hvilket lønniveau individerne ligger på, men i højere grad deres lønstigning. Erhvervserfaring bliver den tidsafhængige variabel, der bliver en del af de forklarende variable, hvor også uddannelsesniveau findes. Jeg vil inddele uddannelsesniveau i 3 grupper. Der vil være en gruppe for de personer, der kunne har en studentereksamen eller anden ungdomsudddannelse, samt for dem med kun 7, 9 3

eller 10 års skolegang samt en gruppe for individer med en videregående udddannelse f.eks. folkeskolelærer, økonomer osv. 3. Arbejdsmarkedsteori Human Capital er et udtryk for et optimerende individs beslutning om investering i uddannelse, der kan give et fremtidigt afkast i form af højere løn. Investeringen kan være alt lige fra skolegang, efteruddannelse til erfaring på arbejdsmarkedet. Human Capital kan ikke flyttes eller sælges fra f.eks. person til person, og er derfor ikke tidsafhængig, eller afhængig af sted, men alene af det enkelte individ, der har erhvervet denne kapital. For at individet får størst mulig afkast af sin erhvervede viden fra skolebænken må det antages, at denne foregår tidligt i individets livscyklus, da afkastperioden dermed bliver lang. Dette betyder dog også, at tiden hvor individet kan erhverve viden via erfaring også bliver forlænget. Ved sådanne teoretiske overvejelser, bliver der dog ikke taget udgangspunkt i det enkelte individ, men i en generel lønfunktion. 1 En lønfunktion kunne f.eks.se ud som følger: W i = W (S i, Z) Hvor W i er løn for individ i, S i et mål for antal år i skolen og Z er andre relevante karakteristika, hvilket kunne være erfaring på arbejdsmarkedet. Der er dog visse problemer ved en sådan model, for der er andre faktorer, der er afgørende for, at nogle individer kun får en 9. klasse afgangsprøve og andre en kandidatgrad. Dette kunne f.eks. være påvirkning fra omgivelserne, eller det enkelte individs intelligens. Spørgsmålet man må stille sig er, om intelligens kan måles, og hvis dette er tilfældet, hvordan og om det skal indgå på lige fod med f.eks. erfaring og uddannelse i den estimerede model? 4. Datamaterialet. Datamaterialet der benyttes, er et udtræk af IDA, som er et datasæt over Arbejdsmarkedstal. 1 Fallon og Verry p. 149 4

Heri er der 32.000 observationer, hvor alle observationer naturligvis ikke er nødvendige. Jeg har derfor startet med at reducere datasættet efter de variable, jeg mener er nødvendige for at udføre de relevante test. Jeg har startet med at fjerne alle de variable, jeg ikke fandt vigtige. Dette har f.eks. været variable som: BARN06, der angiver hvorvidt familierne har et barn i alderen 0-6 år, BOPGEOK1, der angiver om individet bor i hovedstaden, de større byer eller på landet. Det kunne naturligvis være interessant at teste om lønniveauet Vest for Storebælt er højere eller lavere end Øst for Storebælt. I denne opgave er det dog som tidligere nævnt lønstigningerne og ikke niveauerne, der er det afgørende. Det vigtigste i denne opgave er, hvilken udddannelse individerne har, og ikke hvilken uddannelse de er igang med. Derfor har jeg valgt at slette IGUD, der angiver igangværende uddannelse. Løn kan opgøres på mange måder, og der er derfor også i IDA flere variable, der giver information om dette. BRINDKP er en af disse, og den står for bruttoindkomst. Denne samt LONINDP som er lønindkomst over et helt år har jeg valgt at slette til fordel for timelønningerne. Jeg vil senere begrunde hvorfor jeg har foretrukket timelønnen frem for de to andre variable. TLONKVAL er et timelønsskøn som jeg heller ikke har fundet vigtigt, dette er behæftet med en del usikkerhed, og derfor ikke videre relevant. At skelne mellem mænd og kvinders løn er interessant, og det kunne også være interessant at se på gifte kvinders løn i forhold til ugifte, eller familier med og uden børn. Dette er dog ikke formålet med opgaven, og derfor er også variablen CSTATP blevet slettet. ANSAAR angiver, hvor mange år individet har været ansat på arbejdspladsen. Denne variabel kunne have været med. Erfaringen forsvinder dog ikke, bare fordi personen skifter arbejdsplads. Derfor har jeg ment, at der var andre variable, der beskrev erfaringen bedre. Ville man have undersøgt lønstigninger/fald fra f.eks. offentlig til privat sektor kunne variablen ANSXTILB måske have været velegnet. Den opgør ansættelsesændring i forhold til året før, der er dog i dette datamateriale så få, der har skiftet arbejdsplads, at det ikke vil være muligt at få nogle ordentlige resultater ud af dette, og den bliver derfor slettet. ATPAR angiver antal år som lønmodtager, igen en variabel der ken diskuteres, hvorvidt den skal slettes eller ej. Jeg har valgt at slette denne, da jeg ikke finder det vigtigt, hvor længe 5

individerne har været lønmodtagere, sålænge jeg kender deres timeløn, og derigennem kan se, hvorvidt de har været i arbejde eller ej. HDTIDP er en tilsvarende variabel, der beskriver tilknytningen til arbejdsmarkedet for lønmodtagere. Denne er udeladt med samme argument som ATPAR. På denne måde er datasættet nu blevet reduceret fra ca. 32.000 observationer til ca 12.000 observationer. Det er dog ikke noget mål i sig selv at reducere datasættet. Målet skulle være kun at have de relevante variable med, når der senere skal estimeres. Jeg vil nu gennemgå de variable, jeg har vurderet var vigtigst for problemløsningen, samt hvordan jeg har behandlet data, så de egner sig til mit brug. KON2 står for køn, der er en dummy-variabel. Her står 1 for mænd og 0 for kvinder. Denne variabel skal benyttes, når der undersøges for mænd og kvinders lønstigninger. Disse indgår med ca lige stor andel dog med en let overvægt af kvinder. ALDERP angiver individernes alder. Denne variabel samt AAR har jeg ikke behandlet, de er medtaget for let at kunne kontrollerer output. PSTILLP står for primære arbejdstilling, d.v.s., hvorvidt der er tale om faglærte arbejdere, lønmodtagere eller pensionister. Jeg har valgt at udelade selvstændige, efterlønsmodtagere, pensionister og folk under uddannelse, da disse grupper ikke har nogen indtægt. Gruppen af selvstændige har nok en løn, men de er til en vis grad også istand til selv at fastsætte denne, og de kan derfor ødelægge statistikken, og er på den baggrund udeladt. Jeg har derimod beholdt de arbejdsløse, ikke fordi de har nogen indtægt mens, de er arbejdsløse, men fordi de ikke nødvendigvis er arbejdsløse hele perioden. DB9P er primær branchekode, d.v.s., hvilken branche individerne tilhører. Det vil være relevant at inddele denne i en dummy-variabel 1, hvis der er tale om den private sektor, og 0 hvis det er den offentlige sektor. Dette vil betyde, at forholdet de to brancher imellem vil være 70/30 til den private sektor. Jeg har omdøbt variablen til branche. 6

Individernes erfaring på arbejdsmarkedet opgøres ved hjælp af to variable: ERH79P og ERHP. Den første er for årene før 1979, og den anden årene fra 1980 til 1993, den samlede variabel har jeg kaldt erf. For at inddele individerne i grupper skal benyttes variablerne ALMUD som er almen udddannelse dvs. op til gymnasialeuddannelser, og ERHVS der står for erhvervsuddannelser fra gymnasialniveau op til kandidatniveau. Disse to variable skal bruges for at inddele individerne i passende grupper, afhængig af hvor mange år de har gået i skole. Først skal begge variable opgøres i år og ikke i måneder. For at få rimeligt store grupper slås folk med 7-10 års skolegang sammen til en gruppe, der udgør ca. 55% af datamaterialet. Den anden gruppe består af folk med en ungdomsuddannelse dvs. gymnasiet, HH samt læræingeuddannelser. Denne gruppe udgør omring 30% af datamaterialet. Den sidste gruppe er folk med en middellang uddannelse og kandidater dvs. alt fra fysioterapeuter til Cand.Polit er, gruppen udgør ca 15% af datamaterialet. Jeg har ikke valgt at lade kandidater være en gruppe for sig, da de kun udgør små 10% af det samlede datamateriale, og der derfor vil være for få observationer. Variablen hedder uddtype. 5. Model Jeg vil benytte Fixed Effect modelen, hvor hver gruppe har sit eget individuelle niveau, dvs. skæring med y-aksen for den endogene variabel, løn. Der skal derfor testes for, om de forklarende variable har samme hældningskoefficient eller ej. For at udelukke kollinearitet mellem den individspecifikke effekt og den tidsvariante forklarende variabel (erfaring), benyttes en within-transformation Ved at lave denne transformation forsvinder den individspecifikke variabel. Dermed kan den tidsinvariante variabel ikke indgå som forklarende variabel, og dermed er kollinearitet væk. Jeg vil også bruge random effect modellen, for at se hvilken model der beskriver datamaterialet bedst. Jeg vil slutte af med et Hausmann test. 7

5.1 Fixed effect model 1 Ved at teste for om der er fælles hældningskoefficient, vil det blive klart om de tre grupper stiger lige meget i løn i forhold til den erfaring, de får på arbejdsmarkedet. I fixed effect modellen opfattes den individspecifikke effekt α i som en fast indivis specifik effekt, der ikke kan forklares af de forklarende variable. Modellen kan generelt formuleres: llon it = α i + β 1 erf + β 2 branche + β 3 kon + β 4 uddtype + ε it Hvor der gælder, at ε it iid (0, σ 2 ε). llon er den forklarede variabel(log til lønnen), der afhænger af individet samt af tiden. α it er skæringen med y-aksen, den individspecifikke effekt, som er fixed effect. De forklarende variable er erf, branche, kon og uddtype. Af disse er erf den tidsafhængige variabel, da erfaring som bekendt er noget man får over tid, kon og branche er dummy-variable. Ved hjælp af dette kan β estimatet for de forklarende variable udregnes. S = N i=1 ε i ε i = N i=1 (y i - α i * - X i β) (y i - α i * - X i β) Den første aflede mht. β findes, og derved fås: β* = [ N i=1 T i=1 (x it - x i )(x it - x i ) ] -1 [ N i=1 T i=1 (x it - x i )(y it - y i )] Der er her sket en transformation ved hjælp af within, hvilket betyder, at den tidsinvariante variabel ikke indgår som forklarende variabel. 5.2 Random effect Random effect minder på mange måder om Fixed effect, men der er dog betydelig forskel. Som navnet antyder, er der her tale om et stokastisk led, hvilket er den individspecifikke effekt. Dette ændrer modellen til: llon it = β 1 erf + β 2 branche + β 3 kon + β 4 uddtype + v it hvor v it = α it + ε it ; α it iid ( 0, σ 2 ε) ε it iid (0, σ 2 ε ) E(α i ε it ) = 0 1 Hsiao Analysis of Panel Data p. 29-32 8

Dvs. hvor der i fixed effect modellen gjaldt, at α it er ukorreleret med de forklarende variable, gælder der i random effect netop det modsatte. Her er α it korreleret med de forklarende variable. OLS er ikke efficient, ihvertfald ikke sammenlignet med FGLS og heller ikke konsistent 1, hvilket gør, at OLS ikke vil være helt ideel at bruge. 5.3 Wu - Hausmann test Den individspecifikke effekt kan både være stokastisk eller fast. For at afgøre, hvad den egentlig er, kan benyttes et Wu-Hausmann test 2. Dette kan gøres ved, at teste fixed effecten mod random effecten ved hjælp af følgende formel: H = ( β RE - β FE ) ( FE - RE ) -1 (β RE -β FE ) χ2(k) Hypoteserne er : H 0 : E( X it µ i ) = 0 H 1 : E(X it µ i ) 0 I nul-hypotesen testes for om erfaring er ukorreleret med det individspecifikke led. Under H 0 er både β FE og β RE konsistente. Under H 1 er β FE konsistens og β RE biased. For at kunne benytte fgls skulle der gælde, at det samlede fejlled (individ specifikke og tidsvarierende) ikke er korreleret med de forklarende variable. Her vil det betyde, at der bliver testet på om arbejdsmarkedserfaring og uddannelseslængde er eksogen i forhold til en individspecifik effekt. I within transformationen testet kun på de tidsvarierende variable, dvs. erfaring og branche indgår altså i testet, men biased fra de andre variable kan give udslag. Bliver H 0 afvist kan det betyde, at erfaring er endogen, men det kan ligeså vel betyde, at en af de andre forklarende variable er endogen. 1 Johnston p. 391 2 Johnston pp. 403-404 9

6. Resultater Jeg har for at kunne beskrive lønudviklingen i forhold til individernes erfaring på arbejdsmarkedet og deres uddannelsesniveau lavet forskellige test. Teoretisk er disse beskrevet i tidligere afsnit, men hvad har det så ført til rent empirisk? I appendix A er resultaterne for ols, under forskellige test. Jeg har først testet hele datasættet uden at skelne til, hvilket uddannelesesniveau det enkelte individ havde. Her giver 1 års mere erfaring på arbejdsmarkedet 2 kr./time. Det giver små 5 kr. mere at være ansat i den private sektor frem for den offentlige, og måske den mindste overraskelse får mænd 11 kr. mere i timen end kvinder. For within estimatet se appendix C, skal der som tidligere nævnt gælde, at de tidsinvariante variable ikke indgår som forklarende variable. Dette betyder at der kun kan findes estimater for hhv. erfaring og branche. Resultaterne bliver en del anderledes end for ols, 7,7 kr. for 1 års mere erfaring, og kun 2,6 kr. mere for at arbejde i den private sektor frem for den offentlige sektor. Variansen for branche er dog temmelig høj, hele 9,5. De tilsvarende resultater er fundet, udregnet ved hjælp af fgls, hvilket ses i appendix B. I forhold til ols er de mest interessante resultater estimatet for køn og konstantledet. Estimatet for køn giver 1,15, hvilket er langt lavere end det tilsvarende tal for ols. Samtidig ses, at standardafvigelsen for estimatet er på 1,8 hvilket er meget højt. Konstantledet er også betydeligt lavere end kostant ledet for ols; 19,13. Her ses også at standardafvigelsen er meget høj på 2,08. Hvilken af de to modeller beskriver da hele datasættet bedst. Dette kan som tidligere nævnt afgøres ved et Hausmann test. H = 260 χ 2 (4), dette betyder at nulhypotesen klart afvises. Det betyder så, at der er korrelation mellem det individspecifikke led og de forklarende variable. Dermed er fgls biased og fixed effect modellen beskriver hele datasættet bedst. Vurderes de tilsvarende tal for de tre uddannelsesgrupper 1, 2 og 3, som står for hhv. uddannelse op til 10 klasse, erhvervsrelateret uddannelse og ungdomsuddanelser og den sidste gruppe, der er videregående uddanelser. I gruppe 1 er de to vigtigste ols estimater, se appendic A, skæring med y-aksen og estimatet for branche. De nyuddannnede i denne gruppe starter med en begyndelsesløn på 67 kr i timen, 10

og de stiger over tid med ca. 2 kr. i timen. I denne gruppe er det mod forventning den offentlige sektor, der giver den højeste løn, hvilket vil sige ca. 4 kr mere end i den private sektor. Dette kan måske skyldes, at jobmulighederne i f.eks. kommunerne er større. For within estimaterne er fortegnene de samme som for ols, erfaring giver hele 6 kr. mere i timen, derimod er forskellen på den private sektor og den offentlige sektor meget lille, som det ses i appendix C. For det tilsvarende test i fgls (appendix B)er det eneste der skilder sig afgørende fra ols værdierne, estimatet for køn. Ved ols fik mændene en højere timeløn, mændene tjener også mere ved dette test, men ikke så meget mere, kun små 6 kr i timen. Den tilhørende standardafvigelse er på 2,26, hvilket måske kunne angive noget autokorrelation. Igen kan Hausmann testet afgører hvilken model der beskriver datamaterialet bedst. H = 89,33 χ 2 (3) dette test afvises også meget klart. Så igen kan konkluderes, at fixed effect modellen er bedst. Ses på gruppe 2 sker skæring med y-aksen for ols ved de 61 kr dvs. ca. 10 kr lavere end for gruppe 1. Forskellen på mænd og kvinder er i denne gruppe ikke så stor som i den første gruppe, kun på 9 kr.. Dette kan skyldes fagforeningens større angagement i denne gruppes ligeløn. Som i gruppe 1 giver 1 års mere erfaring på arbejdsmarkedet ca. 2,5 kr. i timen, så på dette punkt minder grupperne meget om hinanden. I gruppe 2 er det imodsætning til gruppe 1 ikke nogen fordel, at arbejde i den offentlige sektor, da man får små 9 kr. mere i timen i den private sektor. Within estimatet er her meget interessant, da det her er mere fordelagtigt, at arbejde i den offentlige sektor. Standardafvigelsen er dog helt oppe på 4,5, hvilket kunne antyde at estimatet var mindre godt. De tilsvarende tal for fgls (appendix B) angiver, at erfaring skulle give over 5 kr. mere i timen på års erfaring, standardafvigelsen er højere end ved ols, men dog stadig lav. Forskellen mellem kønnene er betydelig lavere end for det tilsvarende ols estimat, men her er standardafvigelsen også rimelig høj, hele 2,9. Dette kunne betyde, at der er større usikkerhed på dette tal. Igen har jeg foretaget et Hausmann test H = 74,09 χ 2 (3), hvilket igen afvises mindre sikkert, men dog stadig helt klart afvist. 11

Gruppe 3 er den mindste gruppe i datamaterialet, men også den gruppe der måske er mindst homogen. For ols estimaterne er udgangslønnen kun på 58 kr, hvilket er langt mindre end for de andre to grupper, erfaringen giver pr år tilgengæld 3 kr. mere i timen. Man starter nok lavt, men stiger hurtigere, og ender på et højere niveau end de andre to grupper, hvilket også ses i grafen appendix D. I denne gruppe er det klart en fordel, at arbejde i den private sektor, dette kan skyldes, at der her er flere job på private virksomheder som f.eks Novo, Carlsberg osv.. De ansatte i den private sektor tjener hele 19 kr. mere end deres kolleger i den offentlige sektor. Dette kan skyldes de mere decentrale lønforhandlinger, hvor man måske nok skeler til lønforhandlingerne i den offentlige sektor, men derefter individuelt forhandler. Dette betyder også, at lønningerne kan være meget forskellige indenfor gruppen, og dermed kan der også være nogle med meget høje lønninger der trækker gennemsnittet op. I denne gruppe er det lønmæssigt klart en fordel at være mand. Mændene tjener 19 kr mere i timen end kvinderne, hvad skyldes dette så? Nogle ville måske sige det er den manglende ligestilling, men dette mener jeg er en forhastet konklusion. Jeg mener i højere grad det skyldes, at mænd oftere end kvinder besætter lederstillinger, hvor lønnen er højere frem for stillinger længere nede i hierakiet. Det kan også skyldes kvindernes valg af arbejde og uddannelse. Der er en tendens til, at kvinderne vælger de mere bløde fag, hvorimod mændene vælger uddannelse og erhverv indenfor f.eks. ITbranchen, hvor lønniveauet er højere, og lønstigningerne også højere. Havde det været muligt, ville et test på om de enkelte erhverv indenfor gruppe inddelingen havde forskellig lønstigninger, dette gav datamaterialet dog ikke mulighed for. Dermed ville det have været muligt at teste på om det var de mandsdominerende erhvervs eller de kvinde dominerende erhverv der trækker lønnen op. Within antyder samme tendens, dog giver erfaring ifølge dette estimatet hele 8 kr. mere i timen, derimod giver det kun 11 kr. mere at være ansat i den private sektor frem for den offentlige, her er afvigelsen dog meget høj: 7,4. De tilsvarende tal for fgls viser, ligesom for gruppe 1 og 2, at erfaringen giver højere løn end hvad ols estimaterne angiver, dog uden der er en særlig høj standardafvigelse. For branche, 12

køn ligger fgls værdierne en del højere end for ols og i begge tilfælde er standardafvigelsen høj. For konstant ledet er standardafvigelsen også høj, men her er fgls lavere end ols. Hausmann testet s H 0 hypotese bliver også i dette tilfælde afvist, dog mindre klart end for de to andre grupper. For alle tre grupper gælder, at andelen af observationer i datamaterilalet udgør hhv. 50, 30 og 15 %, denne uligefordeling kan skyldes at der i den første gruppe er en del ældre med kun en 7 klasse eksamen. Der var tidligere stadig tendens til, at en del kvinder ikke fik en udd., hvilket for de yngre årgange ikke mere er tilfældet. I et forsøg på at gøre gruppernes størrelse mere lige, har jeg forsøgt med at fjerne de ældre af (alder>45 år) datamaterialet, og så foretager de samme test igen. Ved at fjerne de ældre, blev estimaterne ikke ændret stort, og andelen i de forskellige grupper blev heller ikke ændret. Deraf kan det konkluderes, at 50% af individerne i datamaterialet ikke får mere end en 10 klasses afgangseksamen, et resultat der kan være stor tvivl om rigtigheden af. Ifølge Danmarks statistik skulle tallet dog være godt nok, hvis der bliver regnet lidt på det. I mine beregninger har jeg ikke folk under uddannelse med, hvilket udgør ca. 20% 1 af en årgang 10 år efter grundskolen. Dermed ender man på ca. 30%, der ikke får mere end 10 års skole gang. 2 7. Afsluttende bemærkninger Empirisk arbejde er en meget langsommelig proces, og under arbejdet har jeg fundet test der ville have været gode at have med. Dette kunne bla. være Whites robustheds test, hvorved heteroscedasticitet med sikkerhed kunne af- eller bekræftet, dette samt en residualanalyse har jeg dog ikke haft tid til. Jeg har i opgaven benyttet timeløn, som løn variabel, men som tidligere beskrevet var der andre variable i datamaterialet der også kunne have beskrevet dette. Årsløn ville også have kunnet være brugt, og derved kunne jeg have sammenlignet resultaterne. Dette blev der dog heller ikke tid til. 1 Danmarks Statistik p. 35 2 Weekendavisen 7. - 11. maj 1999 13

8. Konklusion Jeg ville i opgaven klarlægge om der var en sammenhæng mellem folks uddannelse, erfaring og deres lønstigning over tid. For alle de 3 udd. grupper jeg valgte at inddele i, var der en klar tendens til, at lønnen steg med erfaringen hvilket også alt ander lige ville have været underligt. Det var dog klart, at gruppe 3 dvs. gruppe af vidr. udd. steg mest i løn, til min overraskelse var det dog også denne gruppe der havde den laveste udgangsløn. Gruppe 1 derimod lage ud med mest i løn fra starten, men havde tilgengæld den laveste stigning. Gruppernes forskellige størrelse kunne umiddelbart være en svaghed for testene, men da antal observationer er stort, tror jeg ikke det har haft en større betydning. Det mindst overraskende i hele denne undersøgelse har været forskellen mellem mænds of kvinders løn. Mænd tjener mere end kvinder, og dette gælder inden for alle grupper, dette er dog i særdeleshed gældende for gruppe 3. Forskellen på mænds og kvinders løn kan forklares af mange mere eller mindre saglige grunde. En af de mere saglige grunde kunne være at kvinderne blandt de ældre årgange i mange år har gået hjemme og derfor først sent er kommet ud på arbejdmarkedet dermed har de tabt en del års erfaring. Dette kunne måske have været eftervist ved at lave test af det re grupper under forudsætning af, at alle over 45 år ikke var med i datamaterialet. Det er nok heller ikke overraskende, at lønnen er højere i den private sektor end i den offentlige, det havde her været interressant hvis der også havde været opgjort hvor mange timer folk arbejdede, for at se om en evt. længere arbejdsdag i det private blev afspejlet i timelønnen. Modelmæssigt må det klart konkluderes, at fixed effect modellen beskriver datamaterialet bedst, alle de Hausmann test jeg har udført blev nul hypotesen klart afvist. 14

Litteraturliste Fallon og Verry (1988): Labour Market. Baltagi (1995): Econometric Analysis of Panel Data, Wiley, New York. Asplund et al.(1994): The Nordic Labour Market in the 1990 s, North Holland pp. 9-53. Johnston og Dinardo (1997): Econometric methods 4 udgave, McGraw-Hill. Lars Even Rasmussen: Undervisningsnoter til øvelse i paneldata, 1998. Nina Smith og Peder J. Pedersen(1995): The Welfare State and the Labour Market. Hsiao(1986): Analysis of Panel Data, Cambridge University press. 15

Appendix A β estimaterne ved OLS enhed : kr./arbejdstime Hele datasættet Uddtype = 1 Uddtype = 2 Uddtype = 3 Konstant 49,92 (1,16) 67,31 (1,11) 61,08 (1,53) 57,90 (2,30) Erf 2,30 (0,05) 2,23 (0,07) 2,41 (0,08) 2,90 (0,12) Branche 4,90 (0,87) -4,86 (1,20) 8,92 (1,37) 19,77 (1,86) Kon 10,91 (0,81) 11,66 (1,09) 9,16 (1,27) 19,40 (1,83) Uddtype 6,50 (0,52) Standardafvigelsen er angivet i parentes Appendix B β estimaterne ved fgls Hele datasættet Uddtype = 1 Uddtype = 2 Uddtype = 3 Konstant 19,14 (1,08) 51,33 (1,97) 29,06 (2,87) 24,35 (3,46) Erfaring 5,00 (0,08) 4,16 (0,11) 5,43 (0,11) 5,60 (0,17) Branche 6,01 (1,35) -1,64 (1,62) 2,67 (2,13) 24,73 (2,89) Køn 1,15 (1,82) 5,77 (2,26) 1,14 (2,89) 10,13 (3,68) Uddtype 8,18 (0,84) 16

Appendix C β estimaterne ved within Hele datasættet Uddtype = 1 Uddtype = 2 Uddtype = 3 Erfaring 7,73 (0,18) 6,89 (0,31) 7,18 (0,23) 8,26 (0,40) Branche 2,63 (3,08) -0,64 (3,80) -1,15 (4,50) 11,19 (7,41) Appendix D Graf for udviklingen i løn i forhold til erfaring, for hver uddannelsestype U D D T YPE=1 M L O N 150 140 130 120 110 100 90 80 70 60 0 1 0 2 0 3 0 4 0 ERF_T 17

UDDT YPE=2 MLON 170 160 150 140 130 120 110 100 90 80 70 60 50 0 10 20 30 40 ERF_T UDDT YPE=3 MLON 180 170 160 150 140 130 120 110 100 90 80 70 60 50 0 10 20 30 40 ERF_T 18