Økonometri 1. Lineær sandsynlighedsmodel. Hvad nu hvis den afhængige variabel er en kvalitativ variabel (med to kategorier)?



Relaterede dokumenter
Kvantitative metoder 2

Økonometri 1. Heteroskedasticitet 27. oktober Økonometri 1: F12 1

Økonometri 1. Test for heteroskedasticitet. Test for heteroskedasticitet. Dagens program. Heteroskedasticitet 26. oktober 2005

Prøveeksamen Indtjening, konkurrencesituation og produktudvikling i danske virksomheder Kommenteret vejledende besvarelse

Økonometri 1 Efterår 2006 Ugeseddel 9

Statistik II Lektion 5 Modelkontrol. Modelkontrol Modelsøgning Større eksempel

! Husk at udfylde spørgeskema 3. ! Lineær sandsynlighedsmodel. ! Eksempel. ! Mere om evaluering og selvselektion

Opsamling. Simpel/Multipel Lineær Regression Logistisk Regression Ikke-parametriske Metoder Chi-i-anden Test

Kvantitative metoder 2

Kvantitative metoder 2

Kvantitative metoder 2

Økonometri 1. Lineær sandsynlighedsmodel (Wooldridge 8.5). Dagens program: Heteroskedasticitet 30. oktober 2006

Økonometri 1. Definition og motivation. Definition og motivation. Dagens program. Den multiple regressionsmodel 21. september 2005

Statistik Lektion 15 Mere Lineær Regression. Modelkontrol Prædiktion Multipel Lineære Regression

Landbrugets efterspørgsel efter Kunstgødning. Angelo Andersen

Statikstik II 4. Lektion. Generelle Lineære Modeller

Statistik II Lektion 4 Generelle Lineære Modeller. Simpel Lineær Regression Multipel Lineær Regression Flersidet Variansanalyse (ANOVA)

Økonometri lektion 7 Multipel Lineær Regression. Testbaseret Modelkontrol

Kvantitative metoder 2

Kvantitative metoder 2

Kvantitative metoder 2 Forår 2007 Ugeseddel 10

Statikstik II 3. Lektion. Multipel Logistisk regression Generelle Lineære Modeller

Økonometri 1 Efterår 2006 Ugeseddel 13

Lineær regressionsanalyse8

Økonometri 1. Interne evalueringer. Interne evalueringer. Dagens program. Heteroskedaticitet (Specifikation og dataproblemer) 2.

Scorer FCK "for mange" mål i det sidste kvarter?

Prøveeksamen Indtjening, konkurrencesituation og produktudvikling i danske virksomheder Kommenteret vejledende besvarelse

Vægtet model. Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl. Vægte. Vægte: Eksempel. Definition: Vægtrelationen

Prøveeksamen Indtjening, konkurrencesituation og produktudvikling i danske virksomheder Kommenteret vejledende besvarelse

Anvendt Statistik Lektion 10. Regression med både kvantitative og kvalitative forklarende variable Modelsøgning Modelkontrol

Økonometri 1. Avancerede Paneldata Metoder I 24.november F18: Avancerede Paneldata Metoder I 1

Økonometri 1. For mange variable i modellen. For få variable. Dagens program. Den multiple regressionsmodel 21. september 2004

Anvendt Statistik Lektion 10. Regression med både kvantitative og kvalitative forklarende variable Modelkontrol

Prøveeksamen Indtjening, konkurrencesituation og produktudvikling i danske virksomheder Kommenteret vejledende besvarelse

6. SEMESTER Epidemiologi og Biostatistik Opgaver til 3. uge, fredag

Logistisk regression. Logistisk regression. Probit model Fortolkning udfra latent variabel. Odds/Odds ratio

Økonometri 1. Avancerede Paneldata Metoder II Introduktion til Instrumentvariabler 27. november 2006

Vægtet model. Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl. Vægte. Vægte: Eksempel. Definition: Vægtrelationen

Antag X 1,..., X n stokastiske variable med fælles middelværdi µ og varians σ 2. Hvis µ er ukendt estimeres σ 2 ved 1/36.

Rettevejledning til Økonomisk Kandidateksamen 2007I, Økonometri 1

Ugeseddel 8. Gruppearbejde:

Morten Frydenberg Biostatistik version dato:

Bilag 6: Økonometriske

Indtjening, konkurrencesituation og produktudvikling i danske virksomheder

Regressionsanalyse. Epidemiologi og Biostatistik. 1.Simpel lineær regression (Kapitel 11) systolisk blodtryk og alder

Økonometri 1. Hvorfor simulationseksperimenter? Monte Carlo eksperimenter: Ideen. Inferens i den lineære regressionsmodel 28.

Økonometri 1. Interne evalueringer af forelæsninger. Kvalitative variabler. Dagens program. Dummyvariabler 21. oktober 2004

EKSAMEN I MATEMATIK-STATISTIK, 27. JANUAR 2006, KL 9-13

Statistik II Lektion 5 Modelkontrol. Modelkontrol Modelsøgning Større eksempel

Rettevejledning til Økonomisk Kandidateksamen 2005II, Økonometri 1

DLU med CES-nytte. Resumé:

Kvantitative metoder 2 Forår 2007 Ugeseddel 9

Sandsynlighedsregning 12. forelæsning Bo Friis Nielsen

2. Sandsynlighedsregning

Kvantitative metoder 2

Binomialfordelingen: april 09 GJ

Økonometri 1. Dummyvariabler 13. oktober Økonometri 1: F10 1

Husholdningsbudgetberegner

Vi ønsker også at teste hypoteser om parametrene. F.eks: Kan µ tænkes at være 0 (eller anden fast, kendt værdi)? Eksempel: dollarkurser

Økonometri 1. Funktionel form. Funktionel form (fortsat) Dagens program. Den simple regressionsmodel 14. september 2005

Økonometri 1. Dagens program. Den multiple regressionsmodel 18. september 2006

Fagblok 4b: Regnskab og finansiering 2. del Hjemmeopgave kl til kl

Notat om porteføljemodeller

Stadig ligeløn blandt dimittender

Udvikling af en metode til effektvurdering af Miljøstyrelsens Kemikalieinspektions tilsyn og kontrol

Binomialfordelingen. Erik Vestergaard

Luftfartens vilkår i Skandinavien

Morten Frydenberg Version: Thursday, 16 June 2011

Note til Generel Ligevægt

Beregning af strukturel arbejdsstyrke

Dagens Temaer. Test for lineær regression. Test for lineær regression - via proc glm. k normalfordelte obs. rækker i proc glm. p. 1/??

χ 2 -fordelte variable

Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model

Sandsynlighedsregning og statistik med binomialfordelingen

TEORETISKE MÅL FOR EMNET:

Kvantitative metoder 2

Fysik 3. Indhold. 1. Sandsynlighedsteori

Statistisk mekanik 13 Side 1 af 9 Faseomdannelse. Faseligevægt

TALTEORI Følger og den kinesiske restklassesætning.

Kreditrisiko efter IRBmetoden

Fastlæggelse af strukturel arbejdsstyrke

Undersøgelse af pris- og indkomstelasticiteter i forbrugssystemet - estimeret med AIDS

Forbedret Fremkommelighed i Aarhus Syd. Agenda. 1. Vurdering af forsøg Lukning af Sandmosevej

Konfidensinterval for µ (σ kendt)

Statistik Lektion 14 Simpel Lineær Regression. Simpel lineær regression Mindste kvadraters metode Kovarians og Korrelation

Nøglebegreber: Objektivfunktion, vægtning af residualer, optimeringsalgoritmer, parameterusikkerhed og korrelation, vurdering af kalibreringsresultat.

Økonometri 1 Forår 2003 Ugeseddel 10: Prøveeksamen. Indtjening, konkurrencesituation og produktudvikling i danske virksomheder. Om opgavens formål:

Variansanalyse (ANOVA) Repetition, ANOVA Tjek af model antagelser Konfidensintervaller for middelværdierne Tukey s test for parvise sammenligninger

Real valutakursen, ε, svinger med den nominelle valutakurs P P. Endvidere antages prisniveauet i ud- og indland at være identisk, hvorved

Kvantitative metoder 2

Inertimoment for arealer

Økonometri: Lektion 6 Emne: Heteroskedasticitet

Økonometri 1. Den simple regressionsmodel 11. september Økonometri 1: F2

Korrelation (kontrol af model) Regression (tilpasning af model) 1. Grad af fælles variation mellem X og Y. 2. Område og fordeling af sample data

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i.

! Variansen på OLS estimatoren. ! Multikollinaritet. ! Variansen i misspecificerede modeller. ! Estimat af variansen på fejlleddet

Økonometri 1. Inferens i den lineære regressionsmodel 25. september Oversigt: De næste forelæsninger

Indtjening, konkurrencesituation og produktudvikling i danske virksomheder

Måleusikkerhed i kalibrering Nr. : AB 11 Dato : Side : 1/3

Økonometri 1. Inferens i den lineære regressionsmodel 2. oktober Økonometri 1: F8 1

Transkript:

Dagens program Økonometr Heteroskedastctet 6. oktober 004 Hovedemnet for denne forelæsnng er heteroskedastctet (kap. 8.-8.3) Lneære sandsynlghedsmodel (kap 7.5) Konsekvenser af heteroskedastctet Hvordan kan man teste modeller med heteroskedastctet? Korrekton af varansen af OLS estmatoren Hypotesetest modeller med heteroskedastctet: t, F, W, LM Grafsk test Breusch-Pagan test Whte test Økonometr : Heteroskedastctet Økonometr : Heteroskedastctet Hvad nu hvs den afhængge varabel er en kvaltatv varabel (med to kategorer)? Indtl nu har v betragtet den afhængge varabel som en kvanttatv varabel (løn, prser, forbrug, ndkomst) Afhængge varabel: Dskret varabel med to værder Eksempler: Deltagelse på arbejdsmarkedet eller ej Bestået et kursus eller ej Om man har bl eller ej Vderegående udd. eller ej Har nvesteret akter eller ej Frma gået konkurs eller ej Lneær sandsynlghedsmodel Når den afhængge varabel er en kvaltatv varabel med to kategorer, kan man lave en dummyvarabel: y=0 eller y= Regressonsmodellen: y = β0 + βx+ βx + + βkxk + u Denne model kaldes den lneære sandsynlghedsmodel (på engelsk: Lnear probablty model, LPM) Fortolknngen af estmaterne denne model er anderledes end den alm. lneære regressonsmodel Parameteren β j kan kke fortolkes som ændrngen y gvet en enhedsændrng x j Økonometr : Heteroskedastctet 3 Økonometr : Heteroskedastctet 4

Lneær sandsynlghedsmodel Lneær sandsynlghedsmodel Hvs antagelsen MLR.3 er opfyldt: Eu ( x ) = 0 Er den betngede mddelværd af y E( y x) = β0 + βx+ βx + + βkxk For bnære varable gælder det E( y x) = 0*P( y = 0 x) + *P( y = x) = P( y = x) Altså P( y = x) = β0 + βx+ βx + + βkxk Hvor P( y = x) er respons sandsynlgheden Fortolknng af parameteren en LPM: Parametrene angver ændrngen sandsynlgheden for y= som følge af, at de forklarende varable ændres med en enhed P( y = x) = β j xj Sandsynlgheden for y=0 (betnget på x) kan også udregnes som P( y = 0 x) = P( y = x) LPM kan estmeres med OLS yˆ = ˆ β0 + ˆ βx+ ˆ βx ˆ + + βkxk Hvor ŷ skal fortolkes som den predkterede sandsynlghed (for y=) Økonometr : Heteroskedastctet 5 Økonometr : Heteroskedastctet 6 Lneær sandsynlghedsmodel Lneær sandsynlghedsmodel Ulemper ved LPM: Predktonerne er kke 0 eller, som de tlladte værder af den afhængge varabel Predkterede sandsynlgheder kan være negatve eller overstge Normalt lgger den predkterede sandsynlghed mellem 0 og, når man ser på værder af de forklarende varable der lgger omkrng gennemsnttet. Gauss Markov antagelserne: MLR.-4 kan godt være opfyldt for LPM LPM opfylder kke antagelsen MLR.5 (Homoskedastctet) V( y x) = σ Varansen af y betnget på x kan udregnes tl V( y x) = P( y = x)*( P( y = x)) Varansen afhænger altså af x Økonometr : Heteroskedastctet 7 Økonometr : Heteroskedastctet 8

Lneær sandsynlghedsmodel Heteroskedastctet Egenskaber ved OLS estmatoren LPM OLS estmaterne er mddelrette (gvet MLR.-4) Standardfejlene af estmaterne er kke mddelrette F og t test kke påldelge Problemet med heteroskedastctet kan løses ved at korrgere standardfejlene (dette ser v på kap. 8): Sjældent noget alvorlgt problem. Problemet med negatve ssh. og ssh. over kan kun løses ved at benytte en anden model end LPM. De nye modeller ntroduceres økonometr I kaptel 3 blev antagelsen om homoskedastctet ntroduceret: Samme varans på fejlleddet for alle Antagelsen kan være meget restrktv prakss og derfor vl v se på tlfælde med heteroskedastctet Defnton: Se på lneær multpel regressonsmodel y = β + β x + β x + + β x + u 0 k k Under antagelserne MLR.- MLR.4 er OLS mddelret og konsstent MLR.5 er antagelsen om homoskedastctet Vu ( x,, x) = σ k Økonometr : Heteroskedastctet 9 Økonometr : Heteroskedastctet 0 Heteroskedastctet (fortsat) Hvordan kan man teste modeller med heterosk.? Hvs MLR.5 kke er opfyldt, er fejlleddene heteroskedastske OLS estmatorens egenskaber ved heteroskedastctet: + OLS stadg mddelret og konsstent - Varansen af OLS estmaterne er kke mddelret - Konfdensntervallet er kke rgtgt konstrueret - t og F-test er kke nødvendgvs t og F-fordelt, LM test er kke nødvendgvs χ fordelt (og derfor er dsse test kke påldelge) OLS er kke længere den bedste lneære mddelrette estmator (BLUE): Der fndes andre lneære mddelrette estmatorer med mndre varans OLS er kke længere asymptotsk effcent Heteroskedastctet fejlleddet betyder, at et test der er baseret på OLS estmaton kun er gyldgt, hvs man korrgerer standardfejlene for heteroskedastctet. Tl det formål er der udvklet såkaldt heteroskedastctetsrobuste test. Antag: Modellen lder af heteroskedastctet af ukendt form: Vu ( x) = σ (#) V antager altså, at fejlleddet tl hver enhed (ndvd, frma, land) har sn egen varans (meget generel form) Homoskedastctet kan ses som et specaltlfælde hvor σ = σ for alle Økonometr : Heteroskedastctet Økonometr : Heteroskedastctet 3

Hvordan kan man teste modeller med heterosk.? Ideen er at opnå en estmator for varansen af OLS estmatoren, som er konsstent selvom om der er heteroskedastctet fejlleddet. Se på smpel lneær regressonsmodel: y = β0 + βx + u Udregn varansen af OLS estmatoren, når MLR.- MLR.4 er opfyldt, men den betngede varans af fejlleddet er gvet ved (#): MLR.5 holder kke. Varansen af OLS estmatoren er det generelle tlfælde gvet n ved ( x x) σ ˆ = V( β x ) = ( SST ) x Korrekton af varansen en smpel lneær regressonsmodel Leddene tælleren gves forskellg vægte, afhængg af Homoskedastctet: OLS varansen reduceres tl: V ( ˆ β x) = σ / SSTx Whte (980) har vst, at under svage betngelser vl en gyldg estmator af OLS varansen være gvet ved n ( x ˆ x) u ˆ ˆ = V( β x ˆ ) =, u er OLS resdualet. ( SSTx ) Heteroskedastctets-robust varans og heterosk. robuste standardfejl (Whte s standard errors). Beregnes fx med Proc Reg optonen ACOV SAS. σ Økonometr : Heteroskedastctet 3 Økonometr : Heteroskedastctet 4 Korrekton af varansen en multpel lneær regressonsmodel Varans af OLS estmatoren det generelle tlfælde: V( ˆ β X) = V[ X ' X) X ' u X] = ( X ' X) X ' V( u X) X( X ' X) = ( X ' X) X ' ΩX( X ' X) n X ' ΩX Behøver et konsstent estmat af: Σ= = σ xx ' n n = Whtes resultat: Estmeres konsstent af: S =Σ= n ˆ uˆ xx' n = Den robuste OLS varansmatrx kan derfor generelt estmeres som: ˆ ˆ( ) ( ' ) V β X n X X S ( X ' X ) = Test modeller med heteroskedastctet: Enkelt restrkton Heteroskedastctets-robust t-test: Hypotese: H : 0 βk = λ t-teststørrelse: ˆ βk λ t = s.. e hvor s.e. er heterosk. robust standardfejl på βˆ j t-teststørrelsen er asymptotsk standard normalfordelt For små datasæt er t-teststørrelserne kke nødvendgvs tæt på en t-fordelng Økonometr : Heteroskedastctet 5 Økonometr : Heteroskedastctet 6 4

Test modeller med heteroskedastctet: Flere restrktoner Hypotese: H : Rβ = r 0 hvor ß er en (k+)x vektor af parametre og R er en q x(k+) matrx og r er en q x vektor Heterosk. robust F-test kan beregnes ud fra robust kovarans Heterosk. robust Wald test: Wald-teststørrelsen W = R ˆ β r RVˆ ˆ β R R ˆ β r χ q ( )'( ( ) ') ( )~ ( ) Det er dette test som udføres ved brug af ACOV optonen SAS Eksempel Model for efterspørgsel efter cgaretter (Ex. 8.7) cgs = β + βlncome + β lprce + β educ + β age + β age + β rest + u 0 3 4 5 6 Est. Std.err Robust std. Err Const -3.63 4.08 5.5 Lncome 0.88 0.7 0.59 Lprce -0.75 5.77 6.0 Educ -0.50 0.6 0.6 Age -0.77 0.6 0.4 Age -0.0 0.00 0.00 Rest -.8..00 Økonometr : Heteroskedastctet 7 Økonometr : Heteroskedastctet 8 Eksempel Hypoteseprøvnng Hypotese H 0 : β = 0 t-teststørrelse 0.88 t = =. 0.7 Robust t-teststørrelsen 0.88 t R = =.48 0.59 Robust wald test W =.0 Test modeller med heteroskedastctet: Flere restrktoner Heterosk. robust LM test (se sde 63) Antag flg. model y = β + β x + β x + β x + β x + β x + u Hypotese Robust LM test 0 3 3 4 4 5 5 H : β = 0, β = 0 0 4 5 Trn : Estmer restrkterede model med OLS y = β + β x + β x + β x + u Og gem resdualerne 0 3 3 u Økonometr : Heteroskedastctet 9 Økonometr : Heteroskedastctet 0 5

Test modeller med heteroskedastctet: Flere restrktoner Trn : Estmer flg. hjælperegresson med OLS x4 = β0 + βx+ βx + β3x3+ r x5 = β0 + βx+ βx + β3x3+ r Og gem resdualerne r og r Trn 3: Dan et nyt sæt af varable χ () ru og ru og l = Trn 4: Estmer flg. hjælperegresson l = λ ru + λru + e LM-teststørrelsen er gvet ved n-ssr fra ovenstående regresson LM testet er asymptotsk χ () Hvornår er der heteoskedatctet? Hvornår er der prakss heteroskedatctet Data består af gennemsnt over forskellge antal observatoner F.eks. Per capta varable for forskellge lande Gennemsnts for forskellge kommuner Forkert funktonel form Hvs fejlleddet er proportonal med den afhængge varabel kan problemet nogle gange løses ved at lave en transformaton med logartmen Heteroskedastctet knytter sg tl den enkelte model og det enkelte datasæt Økonometr : Heteroskedastctet Økonometr : Heteroskedastctet Hvordan tester man for heteroskedastctet? Antag følgende model y = β + β x + β x + β x + u 0 k k hvor antagelserne MLR.-MLR.4 er opfyldt Hypotese: H0 : V( u x, x xk ) = σ Alternatv formulerng af hypotesen H0 : E( u x, x xk ) = σ Hvs hypotesen er forkert er E( u x, x x k ) en funkton af x erne Grafske test: Estmer modellen med OLS Udregn og gem OLS resdualerne Plot resdualerne eller de kvadrerede resdualer mod de forskellge forklarende varable eller den forudsagte værd af den afhængge varabel Se efter systematske mønstre sprednngen af resdualerne Økonometr : Heteroskedastctet 3 Økonometr : Heteroskedastctet 4 6

Hvs man antager en smpel lneær relaton u = δ0 + δx+ δx + + δkxk + v svarer nulhypotesen om homoskedastctet tl H0 : δ = δ = = δ k = 0 Denne hypotese kan testes ved at erstatte de sande fejlled med OLS resdualerne uˆ = δ0 + δx+ δx + + δkxk + w (*) Testet udføres enten som et F-test eller et LM test For store datasæt vl F og LM test have de sædvanlge fordelnger selvom man erstatter de sande fejlled med OLS resdualerne Regressonen (*) udføres og R u for denne regresson noteres F-teststørrelsen er gvet ved Ru / k F = ( R ) /( n k ) u Teststørrelsen er approx. F(k,n-k-)-fordelt under nulhypotesen (homoskedastctet) LM teststørrelsen LM = n* Ru, asympt. fordelt som χ ( k). Dette test blver ofte kaldt Breusch-Pagan testet Økonometr : Heteroskedastctet 5 Økonometr : Heteroskedastctet 6 Specaltlfælde af BP-testet: Hvs man mstænker, at varansen kun afhænger af en bestemt varabel. Testet udføres ved at regressere de kvadrerede resdualer på den pågældende varabel. Bemærk at antallet af frhedsgrader er ændret for både F-testet (antal frhedsgrader:,n--) og LM testet ( χ ( q) Alternatvt test: Whtes test for heteroskedastctet Betngelsen Eu ( x, x xk ) = σ kan erstattes af svagere betngelse: u skal være ukorreleret med alle forklarende varable (x j ), de forklarende varable anden (x j ) og alle krydsprodukterne (x j x l ) Antag v har en model med k=3 Hjælperegressonen for Whte s test û = δ + δ x + δ x + δ x + δ x + δ x + 0 3 3 4 5 δ x + δ x x + δ x x + δ x x + w 6 3 7 8 3 9 3 NB: 9 forklarende varable Hypotese H : δ = = δ = 0 0 9 Teststørrelsen fndes som et LM test LM = n R m m * u, asympt. fordelt som χ ( ), hvor er antal regressorer excl. konstantleddet hjælperegressonen ( ex: 9). Økonometr : Heteroskedastctet 7 Økonometr : Heteroskedastctet 8 7

Forenklet Whte s test: Hjælperegresson uˆ = δ0 + δyˆ+ δ ˆ y + w Hypotese H0 : δ = δ = 0 Testet konstrueres som LM = n R χ * u, asympt. fordelt som (). Fordelen ved dette test er at antallet af frhedsgrader er lavere Whte s test har asymptotsk gyldghed og er altså bedst for store datasæt Husk alle dsse test er udledt under forudsætnng af, at antagelserne MLR.-MLR.4 er opfyldt Hvs antagelse MLR.3 kke er opfyldt kan man få at test for homoskedastctet blver afvst selvom antagelsen MLR.5 er opfyldt Så afvsnng af homoskedastctet skal skyldes mere generelle former for msspecfkaton: Kaptel 9 Økonometr : Heteroskedastctet 9 Økonometr : Heteroskedastctet 30 Næste gang: Fredag den 9/0. Heteroskedastctet: Kaptel 8.4-8.5 Estmatorer, der tager højde for heteroskedastctet: Vægtet mndste kvadraters estmaton (WLS, FGLS) Ldt mere om den lneære sandsynlghedsmodel Økonometr : Heteroskedastctet 3 8