Kvantitative metoder 2

Relaterede dokumenter
Økonometri 1. Kvalitative variabler. Kvalitative variabler. Dagens program. Kvalitative variable 8. marts 2006

Økonometri 1. Prediktion. Dummyvariabler 9. oktober Økonometri 1: F9 1

Økonometri 1. Interne evalueringer af forelæsninger. Kvalitative variabler. Dagens program. Dummyvariabler 21. oktober 2004

Økonometri 1. FunktioneI form i den lineære regressionsmodel 19. oktober Dagens program

Økonometri 1. Dummyvariabler 13. oktober Økonometri 1: F10 1

! Husk at udfylde spørgeskema 3. ! Lineær sandsynlighedsmodel. ! Eksempel. ! Mere om evaluering og selvselektion

Indledning...1. Analyse af lønforskellen mellem kvinder og mænd...2

Ligelønsanalyse sammenligning af lønniveau offentligt ansatte i kommuner og regioner

Ligelønsanalyse sammenligning af privatansatte kvinder og mænds løn

Kvantitative metoder 2

Ligelønsanalyse sammenligning af offentligt ansatte kvinder og mænds løn

Ligelønsanalyse sammenligning af offentligt ansatte kvinder og mænds løn

Kønsbestemt lønforskel? Analyse på baggrund af IDAs lønstatistik 2018 om forskel på privatansatte kvinder og mænds løn

Ligelønsanalyse sammenligning af privatansatte kvinder og mænds løn

Estimation af lønpræmier

Ligelønsanalyse sammenligning af offentligt ansatte kvinder og mænds løn

Epidemiologi og Biostatistik Opgaver i Biostatistik Uge 10: 13. april

Den samlede model til estimation af lønpræmien er da givet ved:

Baggrundsnotat: Søskendes uddannelsesvalg og indkomst

Kvantitative metoder 2

Kønsbestemt lønforskel? Analyse på baggrund af IDAs lønstatistik om forskel på privatansatte kvinder og mænds løn

Økonometri 1. Oversigt. Mere om dataproblemer Gentagne tværsnit og panel data I

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Fokus på køns betydning for løn

Økonometri 1. Dagens program. Den simple regressionsmodel 15. september 2006

Økonometri 1. Inferens i den lineære regressionsmodel 2. oktober Økonometri 1: F8 1

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Lineær og logistisk regression

Multipel Lineær Regression

ØVELSER Statistik, Logistikøkonom Lektion 8 og 9: Simpel og multipel lineær regression

Privatansatte mænd bliver desuden noget hurtigere chef end kvinderne og forholdsvis flere ender i en chefstilling.

Statistik II Lektion 3. Logistisk Regression Kategoriske og Kontinuerte Forklarende Variable

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Eksamensopgave E05. Socialklasse og kronisk sygdom

De privatansatte kvinder taber lønkampen

Økonometri 1. Dagens program. Den multiple regressionsmodel 18. september 2006

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression

Lønstatistik for privatansatte ph.d.er

TIL RAPPORTEN DANSKE LØNMODTAGERES ARBEJDSTID EN REGISTERBASERET ANALYSE, SFI DET NATIONALE FORSKNINGSCENTER FOR VELFÆRD 09:03.

Adgangsgivende eksamen (udeladt kategori: Matematisk student med matematik på niveau A)

Statistik II 1. Lektion. Analyse af kontingenstabeller

Test og sammenligning af udvalgte regressionsmodeller Berit Christina Olsen forår 2008

Økonometri 1. Inferens i den lineære regressionsmodel 25. september Økonometri 1: F6 1

Multipel Linear Regression. Repetition Partiel F-test Modelsøgning Logistisk Regression

Statistik Lektion 4. Variansanalyse Modelkontrol

Faculty of Health Sciences. Logistisk regression: Kvantitative forklarende variable

Fokus på Forsyning. Datagrundlag og metode

Uge 13 referat hold 4

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse

Benchmarking af kommunernes sagsbehandling antagelser, metode og resultater

Hver anden vil benytte øget åbningstid i dagtilbud

ØVELSER Statistik, Logistikøkonom Lektion 8 og 9: Simpel og multipel lineær regression

Økonometri, ugeseddel 8 Hold 1 1/4-2003

Indvandrere og efterkommere i foreninger er frivillige i samme grad som danskere

Sådan skaber vi et bedre og længere seniorarbejdsliv

Eksempel på besvarelse af spørgeordet Hvad kan udledes (beregn) inkl. retteark.

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Morten Frydenberg 26. april 2004

Statistik II 4. Lektion. Logistisk regression

Kvantitative metoder 2

Løsning til øvelsesopgaver dag 4 spg 5-9

Morten Frydenberg 14. marts 2006

I Danmark bliver 8% af mændene ledere, mens det kun gælder for 3,3% af kvinderne. Forskellen er således på 4,7 procentpoint.

Personalesammensætning gør det offentlige løngab større. Af Jossi Steen-Knudsen, Niels Storm Knigge og Bjørn Tølbøll

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge

Logistisk regression

Økonometri: Lektion 2 Multipel Lineær Regression 1/27

Økonometri 1. Den simple regressionsmodel 11. september Økonometri 1: F2

Simpel Lineær Regression: Model

Indledning...2 Ledelsesgabet...2 Ledelsesgabet fordelt på karakteristika...4 Scenarier Om analysens metode og datagrundlag...

Sammenhængen mellem elevernes trivsel og elevernes nationale testresultater.

Økonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol

Kvantitative metoder 2

Wooldridge, kapitel 19: Carrying out an Empirical Project. Information og spørgsmål vedr. eksamen. Økonometri 1: Afslutningsforelæsning 2

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse

Appendiks A. Entreprenørskabsundervisning i befolkningen, specielt blandt unge

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

Rettevejledning til Økonomisk Kandidateksamen 2007II. Økonometri 1

Bilag S.1: Beskrivelse af beregningen af koefficienten på indvandrerbaggrund

Kønsbestemt lønforskel på det private arbejdsmarked

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk

Kvantitative metoder 2

Økonometri: Lektion 2 Multipel Lineær Regression 1/33

ØVELSER Statistik, Logistikøkonom Lektion 8 og 9: Simpel og multipel lineær regression // SVAR

Kvantitative metoder 2

Kvantitative metoder 2

Psykisk arbejdsmiljø og stress

Analysen viser, at der er markant forskel på mandlige og kvindelige lederes chancer for topledelse.

Økonometri 1. Gentagne tværsnit (W ): Opsamling. Gentagne tværsnit og paneldata. Gentagne Tværsnit og Paneldata II.

Module 4: Ensidig variansanalyse

Kønsbestemt lønforskel på det private arbejdsmarked

1 Multipel lineær regression

Kvantitative metoder 2

Poul Thyregod, introslide.tex Specialkursus vid.stat. foraar Lad θ = θ(β) R k for β B R m med m k

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

LØNFORSKELLE MELLEM OFFENTLIG OG PRIVAT SEKTOR

1 Multipel lineær regression

Dansk Erhvervs gymnasieeffekt - sådan gør vi

Dansk Erhvervs gymnasieanalyse Sådan gør vi

DANSKERE BEKYMRER SIG MERE OG MERE OVER BREXIT

Højtuddannedes karriereveje til og fra staten---

Transkript:

Kvalitative egenskaber og dummyvariabler Kvantitative metoder 2 Dummyvariabler 28. marts 2007 Vi har (hovedsagligt) set på kvantitative variabler (løn, priser, forbrug, indkomst, )... Men hvad med kvalitative egenskaber i regressionsmodellen? Køn Bopælskommune Sektor (offentlig/privat) Arbejdstid (ikke i arbejde, deltid, fuld tid) Helbred (dårligt, middel, godt) I nogle tilfælde kan udfaldene af den kvalitative egenskab rangordnes Kaldes så for ordinal Eksempler: arbejdstid, helbred KM2: F16 1 KM2: F16 2 1

Kvalitativ egenskab med to kategorier Kvalitativ egenskab med to kategorier For kvalitative egenskaber med to kategorier laves ofte en dummyvariabel Dummyvariabler: Diskret variabel Antager kun to værdier. Normalt antages værdien 1, når egenskaben er tilstede, f.eks. kvinde=1 når person er kvinde, ellers 0 Kategorien hvor dummy = 0 kaldes referencekategorien Dummyvariabler for to kategorier kaldes også for indikatorvariabler eller binære variabler KM2: F16 3 Dummyvariabler kan inkluderes i den multiple regressionsmodel som alm. forklarende variabler Eks: lønrelationen log timeloni = β0 + β1uddi + β2erfaringi + β3kvindei + ui hvor kvinde er en dummyvariabel Lønforskellen mellem mænd og kvinder (med samme uddannelse og erfaring) og når antagelse MLR.4 er opfyldt E(log( timeloni ) udd, erfaring, kvinde = 1) E(log( timelon ) udd, erfaring, kvinde = 0) = β i KM2: F16 4 3 2

Eksempel på regressionsanalyse med kvalitativ egenskab: DJØF lønundersøgelse DJØF lavede i 2006 (baseret på september 2005-tal) en undersøgelse, hvor man sammenligner lønniveauet for mænd og kvinder i hhv. den offentlige sektor og den private sektor. Ingen kønsmæssig lønforskel i den offentlige sektor: Kvindelige og mandlige djøf ere i den offentlige sektor har den samme løn, når de er på samme niveau og i samme funktion. Kønsmæssig lønforskel på 4 pct. i den private sektor: Privatansatte kvindelige DJØFere i stillinger uden ledelsesansvar har en løn der udgør ca. 96 pct. af den løn deres mandlige kolleger får. I sammenligningen er der korrigeret for forskelle i ancienniet, uddannelse, branche mv. Selvom man korrigerer for disse forhold, er der således stadig en forskel på ca. 4 pct., der ikke umiddelbart kan forklares. Se link til undersøgelsen på hjemmesiden. DJØF lønundersøgelse Analysen laves ved en regressionsanalyse. I analysen blandt ikkecheferne indgår alle de målelige forhold, der kan inddrages på basis af DJØF Privat s lønstatistik. Følgende variabler indgår: Uddannelsesgruppe Kandidatår Køn Geografi Branche Regressionsanalysen viser, at alle ovennævnte variabler har signifikant betydning for lønnen. Kønnet har altså betydning for lønnen. Betinget af de andre variabler udgør kvindernes løn 96,3 procent af mændenes løn. Når der er korrigeret for de målelige karakteristika, er der stadig en lønforskel på ca. 4 procent der ikke umiddelbart kan forklares. KM2: F16 5 KM2: F16 6 3

Kvalitativ egenskab med to kategorier Kvalitativ egenskab med to kategorier Fortolkning af parameteren til dummyvariablen: Koefficienten til dummyvariablen måler den forventede forskel mellem de to kategorier, alt andet lige Inkludering af en dummyvariabel kan grafisk fortolkes som et skift i konstantleddet..men koefficienterne til de øvrige forklarende variabler er ens for de to grupper Hvis den afhængige variabel indgår: Lineært (uden transformation) -> parameteren fortolkes som en absolut forskel mellem to kategorier (når man kontrollerer for øvrige forklarende variable) I logaritmer -> parameteren fortolkes som en ca. procentuel forskel mellem to kategorier (når man kontrollerer for øvrige forklarende variable) Vil man have den eksakte procentuelle forskel skal følgende formel anvendes 100*[exp( β ) 1] KM2: F16 7 Valg af referencegruppe: Hvad hvis vi i stedet havde inkluderet en dummy for mand? Man kan blot omparametrisere så får man den samme model (Husk mandi + kvindei = 1 ) Begge variabler kan ikke inkluderes samtidigt (hvis der også er et konstantled i modellen) -> Perfekt multikollinearitet ( dummyvariabelfælden ) KM2: F16 8 4

Evaluering af programmer Kvalitativ egenskab med flere end to kategorier Et meget vigtigt eksempel på dummyvariabler er program evaluering Eks: Hvad er effekten af et jobtræningskursus? Simpelt tilfælde: to grupper Treatment (forsøgs-) gruppen: dem som deltager i programmet Control (kontrol-) gruppen: dem som ikke deltager Parameteren til dummyvariablen for treatment - gruppen måler effekten af at have deltaget Det er dog meget tit at denne variabel er endogen (pga. den måde økonomiske data fremkommer) Hvad hvis den kvalitative egenskab har m kategorier (og m>2)? Generelt skal man lave m-1 dummy variabler Den kategori hvortil der ikke hører en dummy variabel kaldes reference kategorien Hvis man inkluderer m dummy variabler og et konstantled vil der være perfekt multikollinearitet Parametrene til dummy variablerne angiver forskellen mellem den pågældende kategori og referencekategorien Betyder valget af referencekategori noget? Nej, ikke for estimation, prediktioner, etc. Ja, fortolkningen af parametrene til dummyvariablerne afhænger af den konkrete referencekategori, der er valgt. KM2: F16 9 KM2: F16 10 5

Kvalitativ egenskab med flere end to kategorier Kvalitativ egenskab med flere end to kategorier Eksempel: Hvad sker der hvis man bruger dummyvariabler til at kontrollere for uddannelse i lønligningen? Uddannelseskategorier for højeste fuldførte uddannelse: Folkeskole (udd<10) 10. klasse (udd=10) Gymnasial ungdomsudd./erhvervsfaglig grundudd. (udd=11,12,13) Videregående uddannelse (udd>13) m=4 kategorier: Definerer 3 dummyvariabler: Model: log timelon = γ + γ erfaring + γ kvinde + γ 10klasse + γ gym + γ videreg + u i 0 1 i 2 i 3 i 4 i 5 i i Hvilke fordele/ulemper er der ved at bruge dummyvariabler? Fordele: Generelt mere fleksibel form Ulempe: Flere variabler i regressionen (tab af frihedsgrader) Test for betydning af den kvalitative egenskab udføres som et F-test for at alle parametrene til dummyerne er lig 0 KM2: F16 11 KM2: F16 12 6

Kvalitativ egenskab med flere end to kategorier Eksempel: Effekten af uddannelse Sammenligning af effekt af uddannelse målt lineært og som fire grupper 5.4 5.2 5 4.8 (mean) lon_d (mean) lon_u 5 10 15 20 uddaar Effekten af uddannelse NB er Parameteren til en dummyvariabel måler forskellen til referencekategorien. Valget af referencekategori dikterer fortolkningen af parametre til dummyvariabler. Dummyvariabler kan bruges til at gøre modellen mindre restriktiv: Tillader en mere fleksibel funktionel sammenhæng. KM2: F16 13 KM2: F16 14 7

Næste gang: Mandag Resten af kapitel 7: Interaktionsled med dummyvariabler Chow test Lineær sandsynlighedsmodel Obligatorisk opgave 2: På hjemmesiden fredag kl. 14. Introduceres ved forelæsningen mandag. KM2: F16 15 8