! Husk at udfylde spørgeskema 3. ! Lineær sandsynlighedsmodel. ! Eksempel. ! Mere om evaluering og selvselektion



Relaterede dokumenter
Økonometri 1. Dummyvariabler 13. oktober Økonometri 1: F10 1

Økonometri 1. Interne evalueringer af forelæsninger. Kvalitative variabler. Dagens program. Dummyvariabler 21. oktober 2004

Kvantitative metoder 2

Kvantitative metoder 2

! Variansen på OLS estimatoren. ! Multikollinaritet. ! Variansen i misspecificerede modeller. ! Estimat af variansen på fejlleddet

Økonometri 1. Dagens program. Den simple regressionsmodel 15. september 2006

Økonometri 1. Prediktion. Dummyvariabler 9. oktober Økonometri 1: F9 1

Kvantitative metoder 2

Økonometri 1. Kvalitative variabler. Kvalitative variabler. Dagens program. Kvalitative variable 8. marts 2006

Kvantitative metoder 2

! Proxy variable. ! Målefejl. ! Manglende observationer. ! Dataudvælgelse. ! Ekstreme observationer. ! Eksempel: Lønrelation (på US data)

Økonometri 1. Lineær sandsynlighedsmodel. Hvad nu hvis den afhængige variabel er en kvalitativ variabel (med to kategorier)?

Wooldridge, kapitel 19: Carrying out an Empirical Project. Information og spørgsmål vedr. eksamen. Økonometri 1: Afslutningsforelæsning 2

Økonometri 1. FunktioneI form i den lineære regressionsmodel 19. oktober Dagens program

Kvantitative metoder 2

Økonometri 1. Dagens program: Afslutningsforelæsning 23. maj 2007

Kvantitative Metoder 1 - Forår 2007

Økonometri 1. Målsætning for Økonometri 1. Dagens program: Afslutningsforelæsning 16. December 2005

Økonometri 1. Dagens program. Den multiple regressionsmodel 18. september 2006

Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model

Økonometri 1. Den simple regressionsmodel 11. september Økonometri 1: F2

Økonometri: Lektion 2 Multipel Lineær Regression 1/27

Statistik Lektion 17 Multipel Lineær Regression

Simpel Lineær Regression: Model

Økonometri 1. Inferens i den lineære regressionsmodel 2. oktober Økonometri 1: F8 1

Økonometri 1. Oversigt. Mere om dataproblemer Gentagne tværsnit og panel data I

SAS-øvelse: Vi starter ud med model et hvor x=(kvotient, eksald, halvaar, kvinde, MatB,, Gif).

W.2 Simpel lineær regression: Egenskaber ved OLS: Forudsagte værdier og residualer: Et residual:

Adgangsgivende eksamen (udeladt kategori: Matematisk student med matematik på niveau A)

Økonometri: Lektion 6 Emne: Heteroskedasticitet

Kvantitative Metoder 1 - Forår Dagens program

Appendiks Økonometrisk teori... II

1. Intoduktion. Undervisningsnoter til Øvelse i Paneldata

Økonometri, ugeseddel 8 Hold 1 1/4-2003

Lagrange multiplier test. Økonometri: Lektion 6 Håndtering ad heteroskedasticitet. Konsekvenser af Heteroskedasticitet

Økonometri: Lektion 2 Multipel Lineær Regression 1/33

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

Rettevejledning til Økonomisk Kandidateksamen 2005I, Økonometri 1

Økonometri: Lektion 6 Emne: Heteroskedasticitet

Uge 13 referat hold 4

Økonomisk Kandidateksamen 2003II Økonometri 1. Værdisætning af skov

Kvantitative metoder 2

Note om Monte Carlo eksperimenter

, i ' 1,...,N ; t ' 1,...,T, - i.i.d.(0,f 2, ), ) ' 0, E(, it. x kjs. œ i,t,s,j,k.

Statistik vejledende læreplan og læringsmål, efteråret 2013 SmartLearning

Økonometri 1. Inferens i den lineære regressionsmodel 25. september Økonometri 1: F6 1

Kvantitative Metoder 1 - Efterår Dagens program

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning

Undervisningsnoter til øvelse i Panel Modeller. %, it. E(x kjs

Kvantitative metoder 2

Rettevejledning til Økonomisk Kandidateksamen 2007II. Økonometri 1

Multipel Lineær Regression. Polynomiel regression Ikke-lineære modeller og transformation Multi-kolinearitet Auto-korrelation og Durbin-Watson test

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i.

Kvantitative metoder 2

Modul 7: Eksempler. 7.1 Beskrivende dataanalyse Diagrammer. Bent Jørgensen. Forskningsenheden for Statistik ST501: Science Statistik

BILAG 3: DETALJERET REDEGØ- RELSE FOR REGISTER- ANALYSER

Susanne Ditlevsen Institut for Matematiske Fag susanne

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Referat : af Gruppearbejde Økonometri1 øvelsestime ugeseddel 7 dato 26/3 2003, Hold 4

Analysestrategi. Lektion 7 slides kompileret 27. oktober :24 p.1/17

Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration

Fokus på Forsyning. Datagrundlag og metode

Statistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning

Økonometri 1. Inferens i den lineære regressionsmodel 25. september Oversigt: De næste forelæsninger

Økonometri: Lektion 4. Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater

Økonomisk Kandidateksamen 2004II Økonometri 1. Læsefærdigheder hos skoleelever i Danmark

Rettevejledning til Økonomisk Kandidateksamen 2004I, Økonometri 1

Module 12: Mere om variansanalyse

Normalfordelingen og Stikprøvefordelinger

Rettevejledning til Økonomisk Kandidateksamen 2007II. Kvantitative Metoder 2: Tag-hjem eksamen

Kvantitative Metoder 1 - Forår Dagens program

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Fagplan for statistik, efteråret 2015

Økonomisk Kandidateksamen 2006II Økonometri 1. Afkastet af uddannelse for britiske tvillingepar

Økonometri 1. Definition og motivation. Definition og motivation. Dagens program. Den multiple regressionsmodel 15. februar 2006

Statistik Lektion 4. Variansanalyse Modelkontrol

PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

To samhørende variable

Simpel Lineær Regression

Økonometri 1 Efterår 2006 Ugeseddel 11

De variable, som er inkluderet i de forskellige modeller, er følgende:

Økonometri 1. Gentagne tværsnit (W ): Opsamling. Gentagne tværsnit og paneldata. Gentagne Tværsnit og Paneldata II.

ØVELSER Statistik, Logistikøkonom Lektion 8 og 9: Simpel og multipel lineær regression

Statikstik II 2. Lektion. Lidt sandsynlighedsregning Lidt mere om signifikanstest Logistisk regression

Dagens Temaer. Test for lineær regression. Test for lineær regression - via proc glm. k normalfordelte obs. rækker i proc glm. p. 1/??

Kursus Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, ( , ) Per Bruun Brockhoff

ØVELSER Statistik, Logistikøkonom Lektion 8 og 9: Simpel og multipel lineær regression

Hypotese test. Repetition fra sidst Hypoteser Test af middelværdi Test af andel Test af varians Type 1 og type 2 fejl Signifikansniveau

Statistik II 4. Lektion. Logistisk regression

Multipel Lineær Regression

Rettevejledning til Kvantitative metoder 1, 2. årsprøve 18. juni timers prøve med hjælpemidler

Statistik Lektion 16 Multipel Lineær Regression

Kvantitative Metoder 1 - Forår 2007

a) Har måleresultaterne for de 2 laboranter samme varians? b) Tyder resultaterne på, at nogen af laboranterne måler med en systematisk fejl?

Note om Monte Carlo eksperimenter

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Transkript:

Dagens program Økonometri 1 Dummy variable 4. marts 003 Emnet for denne forelæsning er kvalitative variable i den multiple regressionsmodel (Wooldridge kap. 7.5-7.6+8.1)! Husk at udfylde spørgeskema 3! Hvad hvis den afhængige variabel er en kvalitative variable (med to kategorier)!!! Mere om evaluering og selvselektion! Introduktion til heteroskedasticitet Økonometri 1: Dummy variable 1 Økonometri 1: Dummy variable Hvad hvis den afhængige variabel er en kvalitative variabel (med to kateg.)! Indtil nu har vi betragtet den afhængige variabel som en kvantitativ variabel (løn, priser, forbrug, indkomst)! Afhængige variabel: " Diskret variabel med to værdier! Eksempler: " Deltagelse på arbejdsmarkedet eller ej " Bestået et kursus eller ej " Om man har bil eller ej " Videregående udd. eller ej " Har investeret i aktier eller ej " Firma gået konkurs eller ej! Når den afhængige variabel er en kvalitativ variabel med to kategorier, kan man lave en dummy variabel y=0 eller y=1! Regressionsmodellen y = β0 + β1x1+ βx + + βkxk + u! Denne model kaldes den lineær sandsynlighedsmodel (på engelsk Linear probability model LPM)! Fortolkningen af estimaterne i denne model er anderledes end i den alm. lineære regressionsmodel " Parameteren β j kan ikke fortolkes som ændringen i y givet en enhedsændring i x j Økonometri 1: Dummy variable 3 Økonometri 1: Dummy variable 4 1

Lineære sandsynlighedsmodel Lineære sandsynlighedsmodel! Hvis antagelsen MLR 3 er opfyldt: Eu ( x ) = 0! Er den betingede middelværdi af y E( y x) = β0 + β1x1+ βx + + βkxk! For binære variable gælder det E( y x) = 0*P( y = 0 x) + 1*P( y= 1 x) = P( y= 1 x)! Altså P( y = 1 x) = β0 + β1x1+ βx + + βkxk! Hvor P( y = 1 x) er respons sandsynligheden! Fortolkning af parameteren i en LPM:! Parametrene angiver ændringen i sandsynligheden for at y=1 som følge af, at de forklarende variable ændres med en enhed P( Y = 1 x) = β j xj! Sandsynligheden for y=0 (betinget på x) kan også udregnes som P( y = 0 x) = 1 P( y = 1 x)! LPM kan estimeres med OLS yˆ = ˆ β0 + ˆ β1x1+ ˆ βx ˆ + + βkxk! Hvor ŷ skal fortolkes som den predikterede sandsynlighed (for y=1) Økonometri 1: Dummy variable 5 Økonometri 1: Dummy variable 6! Ulemper ved LPM:! Prediktionerne er ikke 0 eller 1 som den afhængige variabel! Predikterede sandsynligheder kan være negative eller overstige 1! Normalt er den predikterede sandsynlighed mellem 0 og 1 omkring gennemsnittet af de forklarende variable! Gauss Markov antagelserne! LPM opfylder ikke antagelsen MLR 5 (Homoskedasticitet) V( y x) = σ! Variansen af y betinget på x kan udregnes til V( y x) = P( y = 1 x)*(1 P( y = 1 x))! Variansen afhænger altså af x Økonometri 1: Dummy variable 7 Økonometri 1: Dummy variable 8

! Egenskaber ved OLS estimatoren i LPM " OLS estimaterne er middelrette " Standardfejlene af estimaterne er ikke middelrette " F og t test ikke pålidelige! Hvordan kan problemerne med LPM løses?! Problemet med heteroskedasticitet kan løses ved at korrigere standardfejlene (dette ser vi på i kap. 8)! Det viser sig, at problemerne med heteroskedasticitet sjældent er alvorlige! Problemet med negative ssh og ssh over 1 kan kun løses ved at benytte en anden model end LPM. De nye modeller introduceres i kap. 17 Økonometri 1: Dummy variable 9 Økonometri 1: Dummy variable 10! Hvem er selvstændige i Danmark?! En model for hvem som vælger at være selvstændige i stedet for lønmodtagere! Data: register data (politdata) " Dataudvælgelse: " Data fra 1994 " Individer mellem 0-69 år " Kun lønmodtagere eller selvstændige " I alt 170 individer! Model: Lineære sandsynlighedsmodel " Afhængig variabel: dummy for selvstændige " Forklarende variable! Alder! Alder i anden! Uddannelse! Erhvervserfaring i 1993 (antal år som lønmodtager)! Kvinde! Dummyer for bopæl (Kbh, byer og land)! Arbejdsløshedsgraden (0-1000) Økonometri 1: Dummy variable 11 Økonometri 1: Dummy variable 1 3

! Regressionsmodel y = β + β alder + β alder + β udd + β erfar + 93 0 1 3 4 β kvinde + β dgeo+ β dgeo3+ β arbledg + u 5 6 7 8! Graf for predikteret sandsynlighed for et individ med flg karakteristika: " Udd=1, erfaring=10, mand, Kbh, arbledgr=0 " Alder=40, Udd=1, mand, Kbh, arbledgr=0! Parametrene estimeres ved OLS! Parametrene kan fortolkes som ændringer i sandsynlighed givet en ændring i en af de forklarende variable Økonometri 1: Dummy variable 13 Økonometri 1: Dummy variable 14 (mean) selvst (mean) ssh_hat_a (mean) selvst (mean) ssh_hat_e 1.6.4.5. 0 0 0 40 60 80 alder ultimo året predikteret sandsynlighed for selvstændig -. 0 10 0 30 erfaring_i predikteret sandsynlighed for selvstændig Økonometri 1: Dummy variable 15 Økonometri 1: Dummy variable 16 4

Evaluering af programmer Evaluering af programmer! Evaluering y = β0 + β1d + βx+ u! Hvor d er en dummy variabel (y=1 hvis deltagelse)! Hvorfor er det så problematisk at evaluere programmer?! Det er meget tit at deltagelse (d) er endogen (pga. den måde økonomiske data fremkommer)! Data er ikke fremkommet ved et kontrolleret eksperiment! Selv-selektion " Det er ikke tilfældigt, hvem som melder sig " Det kan være, at dem som får mest ud af kurset, også er dem som melder sig " Deltagelse kan være systematisk relateret til uobserverbare faktorer! Det betyder samlet, at antagelse MLR 3 ikke er opfyldt Eu ( xd, = 1) Eu ( xd, = 0)! Det betyder, at OLS estimatoren er ikke middelret Økonometri 1: Dummy variable 17 Økonometri 1: Dummy variable 18 Evaluering af programmer Heteroskedasticitet! Hvordan kan man så evaluere effekten af et program? " Der findes alternative estimationsmetoder, der under visse antagelser kan give middelrette estimatorer (dette vender vi tilbage til i kap. 15) " I nogle tilfælde kan problemet også løses, hvis man har information før og efter programmet introduceres for både treatmentgruppen og kontrolgruppen. Dette tilfælde kaldes panel data (det kommer der mere om i økonometri )! Definition af heteroskedasticitet! Konsekvenser af heteroskedasticitet (kap. 8.1)! Forsætter på torsdag med heteroskedasticitet Økonometri 1: Dummy variable 19 Økonometri 1: Dummy variable 0 5

Heteroskedasticitet (fortsat) Heteroskedasticitet (fortsat)! I kapitel 3 er antagelsen om homoskedasticitet introduceret:! Denne antagelse kan være meget restriktiv og derfor introduceres nu heteroskedasticitet! Definition:! Lineære multipel regressionsmodel y = β0 + β1x1+ βx + + βkxk + u! Under antagelserne MLR 1- MLR 4 er OLS middelret! Den 5. antagelse i Gauss Markov antagelserne er antagelsen om homoskedasticitet Vu ( x,, x) = σ 1 k! Hvis antagelsen MLR 5 ikke er opfyldt, kaldes fejlledene for heteroskedastiske! Konsekvenser af heteroskedasticitet " OLS stadig middelret " OLS stadig konsistent " R ikke påvirket af heteroskedasticitet Økonometri 1: Dummy variable 1 Økonometri 1: Dummy variable Heteroskedasticitet (fortsat)! Konsekvenser af heteroskedasticitet (fortsat) " Variansen af OLS estimaterne er ikke middelret " Konfidensinterval er ikke længere rigtigt konstrueret " T og F-test er ikke nødvendigvis t og F-fordelt (og derfor er disse test ikke pålidelige) " LM test er ikke nødvendigvis CHI-fordelt " OLS er ikke længere den bedste lineære middelrette estimator (BLUE) " Der findes en anden lineær middelret estimator med mindre varians " OLS er ikke længere asymptotisk efficient Økonometri 1: Dummy variable 3 6