Økonometri 1. Kvalitative variabler. Kvalitative variabler. Dagens program. Kvalitative variable 8. marts 2006

Relaterede dokumenter
Kvantitative metoder 2

Økonometri 1. Prediktion. Dummyvariabler 9. oktober Økonometri 1: F9 1

Økonometri 1. FunktioneI form i den lineære regressionsmodel 19. oktober Dagens program

Økonometri 1. Interne evalueringer af forelæsninger. Kvalitative variabler. Dagens program. Dummyvariabler 21. oktober 2004

Økonometri 1. Dummyvariabler 13. oktober Økonometri 1: F10 1

! Husk at udfylde spørgeskema 3. ! Lineær sandsynlighedsmodel. ! Eksempel. ! Mere om evaluering og selvselektion

Kvantitative metoder 2

Indledning...1. Analyse af lønforskellen mellem kvinder og mænd...2

Kønsbestemt lønforskel? Analyse på baggrund af IDAs lønstatistik 2018 om forskel på privatansatte kvinder og mænds løn

Økonometri 1. Inferens i den lineære regressionsmodel 25. september Økonometri 1: F6 1

Økonometri 1. Dagens program. Den simple regressionsmodel 15. september 2006

Ligelønsanalyse sammenligning af lønniveau offentligt ansatte i kommuner og regioner

Ligelønsanalyse sammenligning af offentligt ansatte kvinder og mænds løn

Ligelønsanalyse sammenligning af privatansatte kvinder og mænds løn

Økonometri 1. Inferens i den lineære regressionsmodel 2. oktober Økonometri 1: F8 1

Kvantitative metoder 2

Ligelønsanalyse sammenligning af offentligt ansatte kvinder og mænds løn

Kvantitative metoder 2

Fokus på køns betydning for løn

Kvantitative metoder 2

Økonometri 1. Oversigt. Mere om dataproblemer Gentagne tværsnit og panel data I

Multipel Lineær Regression

Ligelønsanalyse sammenligning af privatansatte kvinder og mænds løn

! Variansen på OLS estimatoren. ! Multikollinaritet. ! Variansen i misspecificerede modeller. ! Estimat af variansen på fejlleddet

Ligelønsanalyse sammenligning af offentligt ansatte kvinder og mænds løn

Statistik Lektion 4. Variansanalyse Modelkontrol

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april

Kønsbestemt lønforskel? Analyse på baggrund af IDAs lønstatistik om forskel på privatansatte kvinder og mænds løn

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Indvandrere og efterkommere i foreninger er frivillige i samme grad som danskere

Lineær og logistisk regression

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Wooldridge, kapitel 19: Carrying out an Empirical Project. Information og spørgsmål vedr. eksamen. Økonometri 1: Afslutningsforelæsning 2

Sammenhængen mellem elevernes trivsel og elevernes nationale testresultater.

Hver anden vil benytte øget åbningstid i dagtilbud

Økonometri 1. Dagens program. Den multiple regressionsmodel 18. september 2006

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression

Baggrundsnotat: Søskendes uddannelsesvalg og indkomst

Den samlede model til estimation af lønpræmien er da givet ved:

! Proxy variable. ! Målefejl. ! Manglende observationer. ! Dataudvælgelse. ! Ekstreme observationer. ! Eksempel: Lønrelation (på US data)

Test og sammenligning af udvalgte regressionsmodeller Berit Christina Olsen forår 2008

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse

Privatansatte mænd bliver desuden noget hurtigere chef end kvinderne og forholdsvis flere ender i en chefstilling.

Benchmarking af kommunernes sagsbehandling antagelser, metode og resultater

Anvendt Statistik Lektion 8. Multipel Lineær Regression

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

Estimation af lønpræmier

Økonometri 1. Den simple regressionsmodel 11. september Økonometri 1: F2

Statistik II 1. Lektion. Analyse af kontingenstabeller

Eksempel på besvarelse af spørgeordet Hvad kan udledes (beregn) inkl. retteark.

Økonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol

TIL RAPPORTEN DANSKE LØNMODTAGERES ARBEJDSTID EN REGISTERBASERET ANALYSE, SFI DET NATIONALE FORSKNINGSCENTER FOR VELFÆRD 09:03.

I Danmark bliver 8% af mændene ledere, mens det kun gælder for 3,3% af kvinderne. Forskellen er således på 4,7 procentpoint.

De privatansatte kvinder taber lønkampen

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression

Morten Frydenberg 26. april 2004

Lønstatistik for privatansatte ph.d.er

1 Multipel lineær regression

1 Multipel lineær regression

Morten Frydenberg 14. marts 2006

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge

Logistisk regression

Analysen viser, at der er markant forskel på mandlige og kvindelige lederes chancer for topledelse.

Kvantitative metoder 2

Forelæsning 11: Kapitel 11: Regressionsanalyse

Indledning...2 Ledelsesgabet...2 Ledelsesgabet fordelt på karakteristika...4 Scenarier Om analysens metode og datagrundlag...

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse

Sådan skaber vi et bedre og længere seniorarbejdsliv

Faculty of Health Sciences. Logistisk regression: Kvantitative forklarende variable

Effekten af indvandring på indfødte danskeres løn og beskæftigelse

Økonometri 1. Dagens program: Afslutningsforelæsning 23. maj 2007

Personalesammensætning gør det offentlige løngab større. Af Jossi Steen-Knudsen, Niels Storm Knigge og Bjørn Tølbøll

Appendiks A. Entreprenørskabsundervisning i befolkningen, specielt blandt unge

Kausale modeller. Konstruktion og analyse

Psykisk arbejdsmiljø og stress

Uge 13 referat hold 4

Kønsbestemt lønforskel på det private arbejdsmarked

Generelle lineære modeller

Kønsbestemt lønforskel på det private arbejdsmarked

Økonometri, ugeseddel 8 Hold 1 1/4-2003

Statistik Lektion 16 Multipel Lineær Regression

Dansk Erhvervs gymnasieeffekt - sådan gør vi

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Dansk Erhvervs gymnasieanalyse Sådan gør vi

Højtuddannedes karriereveje til og fra staten---

Faktaark: Ledelsesgabet mellem kønnene er fortsat stort

Økonometri: Lektion 2 Multipel Lineær Regression 1/27

Velkommen til kurset. Teoretisk Statistik. Lærer: Niels-Erik Jensen

Kvantitative metoder 2

Økonometri: Lektion 2 Multipel Lineær Regression 1/33

Module 4: Ensidig variansanalyse

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

ØVELSER Statistik, Logistikøkonom Lektion 8 og 9: Simpel og multipel lineær regression

Kvantitative metoder 2

Simpel Lineær Regression: Model

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning

Transkript:

Dagens program Økonometri 1 Kvalitative variable 8. marts 2006 Kvalitative variabler som forklarende variabler i en lineær regressionsmodel (Wooldridge kap. 7.1-7.4) Kvalitative variabler generelt Dummy variable for kvalitative variable med to Dummy variable for kvalitative variable med flere end to Interaktionseffekter regressionsmodel 1 regressionsmodel 2 Kvalitative variabler Kvalitative variabler Indtil nu har vi (hovedsagligt) set på kvantitative variabler (løn, priser, forbrug, indkomst).. Men hvad med kvalitative variabler? Kvalitative variabler: Diskrete variabler Eksempler: Køn Kommune Sektor Arbejdstid (ikke arbejde, halvtid, fuld tid) Helbred (dårligt, middel, godt) I nogle tilfælde kan udfaldene af den kvalitative variabel rangordnes. Variablen kaldes så for ordinal Eksempler: arbejdstid og helbred regressionsmodel regressionsmodel 4 1

Kvalitative variabler med to Kvalitative variable med to For kvalitative variabler med to laves ofte en dummy variabel Dummy variabler Diskret variabel Antager kun værdien 0 og 1. Normalt antages værdien 1, når egenskaben er tilstede, f.eks. kvinde=1 når person er kvinde ellers 0 Dummy variable benyttes meget i regressionsmodeller Kategorien hvor Dummy = 0 kaldes reference-kategorien Dummy variable kaldes også for indikator variable og binære variable Dummy variable kan inkluderes i den multiple regressionsmodel som alm. forklarende variable Eks: lønrelationen log timeloni = β0 + β1uddi + β2erfaringi + βkvindei + εi hvor kvinde er en dummy variabel Lønforskellen mellem mænd og kvinder (med samme uddannelse og erfaring) og når antagelse MLR. 4 er opfyldt E(log( timelon ) udd, erfaring, kvinde = 1) E(log( timelon ) udd, erfaring, kvinde = 0) = β i i regressionsmodel 5 regressionsmodel 6 Eksempel på regressionsanalyse: Djøf undersøgelse Djøf har d. 8/9 2005 offentlig gjort en undersøgelse hvor man har sammenlignet lønniveauet for mænd og kvinder i hhv. den offentlige sektor og den private sektor. Ingen kønsmæssig lønforskel i off. Sektor Kvindelige og mandlige djøfere i den offentlige sektor har den samme løn, når de er på samme niveau og i samme funktion. Kønsmæssig lønforskel på 6 pct. i priv.sekt. Privatansatte kvindelige DJØFere i stillinger uden ledelsesansvar har en løn der udgør ca. 94 pct. af den løn deres mandlige kolleger får. I sammenligningen er der korrigeret for forskelle i ancienniet, uddannelse, branche mv. Selvom man korrigerer for disse forhold, er der således stadig en forskel på ca. 6 pct., der ikke umiddelbart kan forklares. Se http://www.djoef.dk/online/view_folder?id=148&attr_folder=f regressionsmodel 7 Djøf undersøgelser Analysen laves ved en regressionsanalyse. I analysen blandt ikkecheferne indgår alle de målelige forhold vi kan inddrage på basis af DJØF Privat s lønstatistik. Følgende variable indgår: Uddannelsesgruppe Geografi Kandidatår Branche Køn Regressionsanalysen viser, at alle de ovennævnte variable har signifikant betydning for lønnen. Kønnet har altså betydning for lønnen. Betinget af de andre variable udgør kvindernes løn 9,8 procent af mændenes løn. Når der er korrigeret for de målelige karakteristika, er der stadig en lønforskel på 6 procent der ikke umiddelbart kan forklares. regressionsmodel 8 2

Kvalitative variabler med to Kvalitative variabler med to Fortolkning af parameteren til dummy variablen: Parameteren til dummy variablen måler forskellen mellem de to Inkludering af en dummy variabel kan grafisk fortolkes som et skift i konstantleddet..men afkast af de øvrige forklarende variabler er de sammen for de to grupper Hvis den afh. var. er lineær -> parameteren fortolkes som en absolut forskel mellem to (når man kontrollerer for øvrige forklarende variable) Hvis den afh. var. i log -> parameteren fortolkes som en ca. procentuel forskel mellem to (når man kontrollerer for øvrige forklarende variable) Vil man have den eksakte procentuelle forskel skal følgende formel anvendes 100*[exp( β ) 1] Valg af referencegruppe: Hvad hvis vi i stedet havde inkluderet en dummy for mand? Man kan blot omparametrisere så får man den samme model (Husk mandi + kvindei = 1 ) Begge variable kan ikke inkluderes (hvis der også er et konstantled i modellen) -> Perfekt multikollinaritet regressionsmodel 9 regressionsmodel 10 Evaluering af programmer Et meget vigtigt eksempel på dummy variabler er program evaluation Eks: Effekten af jobtræningskurser Simpelt tilfælde: to grupper Treatment (forsøgs-) gruppen: dem som deltager i programmet control (kontrol) gruppen: dem som ikke deltager Parameteren til dummy variablen for treatment gruppen måler effekten af at have deltaget Det er dog meget tit at denne variabel er endogen (pga. den måde økonomiske data fremkommer) Kvalitative variabler med flere end to Hvad hvis den kvalitative variabel har m (og m>2) Generelt skal man lave m-1 dummy variabler Den kategori hvortil der ikke hører en dummy variabel kaldes reference kategorien Hvis man inkluderer m dummy variabler og et konstantled er der perfekt multikollinaritet Parametrene til dummy variablerne angiver forskellen mellem den pågældende kategori og reference kategorien Betyder valget af reference kategori noget? Nej, ikke for estimation, prediktioner Ja, fortolkningen af parametrene til dummy variablerne afhænger af reference kategorien regressionsmodel 11 regressionsmodel 12

Kvalitative variabler med flere end to Eksempel: Hvad hvis man brugte dummy variabler til at kontrollere for uddannelse Uddannelses for højeste fuldførte udd.: Folkeskole (udd<=9) 10. klasse (udd=10) Gymnasial ungdomsudd./erhvervsfaglig grundudd. (udd=11,12,1) Videregående uddannelse (udd>1) Model log timelon = γ + γ erfaring + γ kvinde + γ 10klasse + γ gym + γ videreg + ε i 0 1 i 2 i i 4 i 5 i i Kvalitative variabler med flere end to (fortsat) Hvilke fordele/ulemper er der ved at bruge dummy variabler? Fordele: generelt mere fleksibel form Ulempe: flere variabler i regressionen (tab af frihedsgrader) Test for betydning af den kvalitative variabel udføres ved et F-test for at alle parametrene til dummyerne er lig 0 regressionsmodel 1 regressionsmodel 14 Kvalitative variable med flere end to (fortsat) Eksempel: sammenligning af effekten af uddannelse 5.4 5.2 5 4.8 (mean) lon_d (mean) lon_u 5 10 15 20 uddaar Effekten af uddannelse Interaktionsled med to dummy variable Interaktionsled med dummy variable er helt analogt til interaktionsled med kvantitative variable og ofte anvendt Eksempel: Arbejdsudbud arbejdstid = β0 + β1kvindei + β2børni + εi Denne model er meget restriktiv (urealistisk), fordi man antager, at effekten af børn er uafhængig af køn Denne restriktion kan fjernes ved at introducere et interaktionsled arbejdstid = β ( * ) 0 + β1kvindei + β2børni + β børni kvindei + εi regressionsmodel 15 regressionsmodel 16 4

Interaktionsled med to dummy variable Eksempel: lønrelationen interaktion mellem køn og ægteskabelig status Hvorfor skal ægteskabelig status med i en lønrelation? Skal der en interaktionseffekt mellem køn og ægteskabelig status med? Interaktionsled med dummy variable og kvantitative variable Interaktionsled mellem dummy variable og kvantitative variable kan fortolkes som forskellig effekt (eller afkast) af den kvantitative variabel Grafisk kan det illustreres ved forskellige hældninger (se figur 7.2) Eksempel: Lønrelationen - afkastet af erfaring afhænger af køn log timelon = β + βudd + β erfaring + β kvinde + β ( erfaring * kvinde ) + ε i 0 1 i 2 i i 4 i i i log timelon = ( β + β kvinde ) + β udd + ( β + β kvinde )* erfaring + ε i 0 i 1 i 2 4 i i i regressionsmodel 17 regressionsmodel 18 Interaktionsled med dummy variable og kvantitative variable Tests β = Samme afkast af erfaring: Ingen forskel på mænd og kvinder: β 4 0 = β4 = 0 Næste gang: Husk næste forelæsning er næste onsdag d. 15/ Mere om kvalitative variable (resten af kap 7) Husk eksamenstilmelding i uge 10, 11 og 12 på Punkt KU (se http://www.econ.ku.dk/polit/studerende/eksa men/#tilmelding regressionsmodel 19 regressionsmodel 20 5