Dagens program Økonometr Heteroskedastctet 6. oktober 004 Hovedemnet for denne forelæsnng er heteroskedastctet (kap. 8.-8.3) Lneære sandsynlghedsmodel (kap 7.5) Konsekvenser af heteroskedastctet Hvordan kan man teste modeller med heteroskedastctet? Korrekton af varansen af OLS estmatoren Hypotesetest modeller med heteroskedastctet: t, F, W, LM Grafsk test Breusch-Pagan test Whte test Økonometr : Heteroskedastctet Økonometr : Heteroskedastctet Hvad nu hvs den afhængge varabel er en kvaltatv varabel (med to kategorer)? Indtl nu har v betragtet den afhængge varabel som en kvanttatv varabel (løn, prser, forbrug, ndkomst) Afhængge varabel: Dskret varabel med to værder Eksempler: Deltagelse på arbejdsmarkedet eller ej Bestået et kursus eller ej Om man har bl eller ej Vderegående udd. eller ej Har nvesteret akter eller ej Frma gået konkurs eller ej Lneær sandsynlghedsmodel Når den afhængge varabel er en kvaltatv varabel med to kategorer, kan man lave en dummyvarabel: y=0 eller y= Regressonsmodellen: y = β0 + βx+ βx + + βkxk + u Denne model kaldes den lneære sandsynlghedsmodel (på engelsk: Lnear probablty model, LPM) Fortolknngen af estmaterne denne model er anderledes end den alm. lneære regressonsmodel Parameteren β j kan kke fortolkes som ændrngen y gvet en enhedsændrng x j Økonometr : Heteroskedastctet 3 Økonometr : Heteroskedastctet 4
Lneær sandsynlghedsmodel Lneær sandsynlghedsmodel Hvs antagelsen MLR.3 er opfyldt: Eu ( x ) = 0 Er den betngede mddelværd af y E( y x) = β0 + βx+ βx + + βkxk For bnære varable gælder det E( y x) = 0*P( y = 0 x) + *P( y = x) = P( y = x) Altså P( y = x) = β0 + βx+ βx + + βkxk Hvor P( y = x) er respons sandsynlgheden Fortolknng af parameteren en LPM: Parametrene angver ændrngen sandsynlgheden for y= som følge af, at de forklarende varable ændres med en enhed P( y = x) = β j xj Sandsynlgheden for y=0 (betnget på x) kan også udregnes som P( y = 0 x) = P( y = x) LPM kan estmeres med OLS yˆ = ˆ β0 + ˆ βx+ ˆ βx ˆ + + βkxk Hvor ŷ skal fortolkes som den predkterede sandsynlghed (for y=) Økonometr : Heteroskedastctet 5 Økonometr : Heteroskedastctet 6 Lneær sandsynlghedsmodel Lneær sandsynlghedsmodel Ulemper ved LPM: Predktonerne er kke 0 eller, som de tlladte værder af den afhængge varabel Predkterede sandsynlgheder kan være negatve eller overstge Normalt lgger den predkterede sandsynlghed mellem 0 og, når man ser på værder af de forklarende varable der lgger omkrng gennemsnttet. Gauss Markov antagelserne: MLR.-4 kan godt være opfyldt for LPM LPM opfylder kke antagelsen MLR.5 (Homoskedastctet) V( y x) = σ Varansen af y betnget på x kan udregnes tl V( y x) = P( y = x)*( P( y = x)) Varansen afhænger altså af x Økonometr : Heteroskedastctet 7 Økonometr : Heteroskedastctet 8
Lneær sandsynlghedsmodel Heteroskedastctet Egenskaber ved OLS estmatoren LPM OLS estmaterne er mddelrette (gvet MLR.-4) Standardfejlene af estmaterne er kke mddelrette F og t test kke påldelge Problemet med heteroskedastctet kan løses ved at korrgere standardfejlene (dette ser v på kap. 8): Sjældent noget alvorlgt problem. Problemet med negatve ssh. og ssh. over kan kun løses ved at benytte en anden model end LPM. De nye modeller ntroduceres økonometr I kaptel 3 blev antagelsen om homoskedastctet ntroduceret: Samme varans på fejlleddet for alle Antagelsen kan være meget restrktv prakss og derfor vl v se på tlfælde med heteroskedastctet Defnton: Se på lneær multpel regressonsmodel y = β + β x + β x + + β x + u 0 k k Under antagelserne MLR.- MLR.4 er OLS mddelret og konsstent MLR.5 er antagelsen om homoskedastctet Vu ( x,, x) = σ k Økonometr : Heteroskedastctet 9 Økonometr : Heteroskedastctet 0 Heteroskedastctet (fortsat) Hvordan kan man teste modeller med heterosk.? Hvs MLR.5 kke er opfyldt, er fejlleddene heteroskedastske OLS estmatorens egenskaber ved heteroskedastctet: + OLS stadg mddelret og konsstent - Varansen af OLS estmaterne er kke mddelret - Konfdensntervallet er kke rgtgt konstrueret - t og F-test er kke nødvendgvs t og F-fordelt, LM test er kke nødvendgvs χ fordelt (og derfor er dsse test kke påldelge) OLS er kke længere den bedste lneære mddelrette estmator (BLUE): Der fndes andre lneære mddelrette estmatorer med mndre varans OLS er kke længere asymptotsk effcent Heteroskedastctet fejlleddet betyder, at et test der er baseret på OLS estmaton kun er gyldgt, hvs man korrgerer standardfejlene for heteroskedastctet. Tl det formål er der udvklet såkaldt heteroskedastctetsrobuste test. Antag: Modellen lder af heteroskedastctet af ukendt form: Vu ( x) = σ (#) V antager altså, at fejlleddet tl hver enhed (ndvd, frma, land) har sn egen varans (meget generel form) Homoskedastctet kan ses som et specaltlfælde hvor σ = σ for alle Økonometr : Heteroskedastctet Økonometr : Heteroskedastctet 3
Hvordan kan man teste modeller med heterosk.? Ideen er at opnå en estmator for varansen af OLS estmatoren, som er konsstent selvom om der er heteroskedastctet fejlleddet. Se på smpel lneær regressonsmodel: y = β0 + βx + u Udregn varansen af OLS estmatoren, når MLR.- MLR.4 er opfyldt, men den betngede varans af fejlleddet er gvet ved (#): MLR.5 holder kke. Varansen af OLS estmatoren er det generelle tlfælde gvet n ved ( x x) σ ˆ = V( β x ) = ( SST ) x Korrekton af varansen en smpel lneær regressonsmodel Leddene tælleren gves forskellg vægte, afhængg af Homoskedastctet: OLS varansen reduceres tl: V ( ˆ β x) = σ / SSTx Whte (980) har vst, at under svage betngelser vl en gyldg estmator af OLS varansen være gvet ved n ( x ˆ x) u ˆ ˆ = V( β x ˆ ) =, u er OLS resdualet. ( SSTx ) Heteroskedastctets-robust varans og heterosk. robuste standardfejl (Whte s standard errors). Beregnes fx med Proc Reg optonen ACOV SAS. σ Økonometr : Heteroskedastctet 3 Økonometr : Heteroskedastctet 4 Korrekton af varansen en multpel lneær regressonsmodel Varans af OLS estmatoren det generelle tlfælde: V( ˆ β X) = V[ X ' X) X ' u X] = ( X ' X) X ' V( u X) X( X ' X) = ( X ' X) X ' ΩX( X ' X) n X ' ΩX Behøver et konsstent estmat af: Σ= = σ xx ' n n = Whtes resultat: Estmeres konsstent af: S =Σ= n ˆ uˆ xx' n = Den robuste OLS varansmatrx kan derfor generelt estmeres som: ˆ ˆ( ) ( ' ) V β X n X X S ( X ' X ) = Test modeller med heteroskedastctet: Enkelt restrkton Heteroskedastctets-robust t-test: Hypotese: H : 0 βk = λ t-teststørrelse: ˆ βk λ t = s.. e hvor s.e. er heterosk. robust standardfejl på βˆ j t-teststørrelsen er asymptotsk standard normalfordelt For små datasæt er t-teststørrelserne kke nødvendgvs tæt på en t-fordelng Økonometr : Heteroskedastctet 5 Økonometr : Heteroskedastctet 6 4
Test modeller med heteroskedastctet: Flere restrktoner Hypotese: H : Rβ = r 0 hvor ß er en (k+)x vektor af parametre og R er en q x(k+) matrx og r er en q x vektor Heterosk. robust F-test kan beregnes ud fra robust kovarans Heterosk. robust Wald test: Wald-teststørrelsen W = R ˆ β r RVˆ ˆ β R R ˆ β r χ q ( )'( ( ) ') ( )~ ( ) Det er dette test som udføres ved brug af ACOV optonen SAS Eksempel Model for efterspørgsel efter cgaretter (Ex. 8.7) cgs = β + βlncome + β lprce + β educ + β age + β age + β rest + u 0 3 4 5 6 Est. Std.err Robust std. Err Const -3.63 4.08 5.5 Lncome 0.88 0.7 0.59 Lprce -0.75 5.77 6.0 Educ -0.50 0.6 0.6 Age -0.77 0.6 0.4 Age -0.0 0.00 0.00 Rest -.8..00 Økonometr : Heteroskedastctet 7 Økonometr : Heteroskedastctet 8 Eksempel Hypoteseprøvnng Hypotese H 0 : β = 0 t-teststørrelse 0.88 t = =. 0.7 Robust t-teststørrelsen 0.88 t R = =.48 0.59 Robust wald test W =.0 Test modeller med heteroskedastctet: Flere restrktoner Heterosk. robust LM test (se sde 63) Antag flg. model y = β + β x + β x + β x + β x + β x + u Hypotese Robust LM test 0 3 3 4 4 5 5 H : β = 0, β = 0 0 4 5 Trn : Estmer restrkterede model med OLS y = β + β x + β x + β x + u Og gem resdualerne 0 3 3 u Økonometr : Heteroskedastctet 9 Økonometr : Heteroskedastctet 0 5
Test modeller med heteroskedastctet: Flere restrktoner Trn : Estmer flg. hjælperegresson med OLS x4 = β0 + βx+ βx + β3x3+ r x5 = β0 + βx+ βx + β3x3+ r Og gem resdualerne r og r Trn 3: Dan et nyt sæt af varable χ () ru og ru og l = Trn 4: Estmer flg. hjælperegresson l = λ ru + λru + e LM-teststørrelsen er gvet ved n-ssr fra ovenstående regresson LM testet er asymptotsk χ () Hvornår er der heteoskedatctet? Hvornår er der prakss heteroskedatctet Data består af gennemsnt over forskellge antal observatoner F.eks. Per capta varable for forskellge lande Gennemsnts for forskellge kommuner Forkert funktonel form Hvs fejlleddet er proportonal med den afhængge varabel kan problemet nogle gange løses ved at lave en transformaton med logartmen Heteroskedastctet knytter sg tl den enkelte model og det enkelte datasæt Økonometr : Heteroskedastctet Økonometr : Heteroskedastctet Hvordan tester man for heteroskedastctet? Antag følgende model y = β + β x + β x + β x + u 0 k k hvor antagelserne MLR.-MLR.4 er opfyldt Hypotese: H0 : V( u x, x xk ) = σ Alternatv formulerng af hypotesen H0 : E( u x, x xk ) = σ Hvs hypotesen er forkert er E( u x, x x k ) en funkton af x erne Grafske test: Estmer modellen med OLS Udregn og gem OLS resdualerne Plot resdualerne eller de kvadrerede resdualer mod de forskellge forklarende varable eller den forudsagte værd af den afhængge varabel Se efter systematske mønstre sprednngen af resdualerne Økonometr : Heteroskedastctet 3 Økonometr : Heteroskedastctet 4 6
Hvs man antager en smpel lneær relaton u = δ0 + δx+ δx + + δkxk + v svarer nulhypotesen om homoskedastctet tl H0 : δ = δ = = δ k = 0 Denne hypotese kan testes ved at erstatte de sande fejlled med OLS resdualerne uˆ = δ0 + δx+ δx + + δkxk + w (*) Testet udføres enten som et F-test eller et LM test For store datasæt vl F og LM test have de sædvanlge fordelnger selvom man erstatter de sande fejlled med OLS resdualerne Regressonen (*) udføres og R u for denne regresson noteres F-teststørrelsen er gvet ved Ru / k F = ( R ) /( n k ) u Teststørrelsen er approx. F(k,n-k-)-fordelt under nulhypotesen (homoskedastctet) LM teststørrelsen LM = n* Ru, asympt. fordelt som χ ( k). Dette test blver ofte kaldt Breusch-Pagan testet Økonometr : Heteroskedastctet 5 Økonometr : Heteroskedastctet 6 Specaltlfælde af BP-testet: Hvs man mstænker, at varansen kun afhænger af en bestemt varabel. Testet udføres ved at regressere de kvadrerede resdualer på den pågældende varabel. Bemærk at antallet af frhedsgrader er ændret for både F-testet (antal frhedsgrader:,n--) og LM testet ( χ ( q) Alternatvt test: Whtes test for heteroskedastctet Betngelsen Eu ( x, x xk ) = σ kan erstattes af svagere betngelse: u skal være ukorreleret med alle forklarende varable (x j ), de forklarende varable anden (x j ) og alle krydsprodukterne (x j x l ) Antag v har en model med k=3 Hjælperegressonen for Whte s test û = δ + δ x + δ x + δ x + δ x + δ x + 0 3 3 4 5 δ x + δ x x + δ x x + δ x x + w 6 3 7 8 3 9 3 NB: 9 forklarende varable Hypotese H : δ = = δ = 0 0 9 Teststørrelsen fndes som et LM test LM = n R m m * u, asympt. fordelt som χ ( ), hvor er antal regressorer excl. konstantleddet hjælperegressonen ( ex: 9). Økonometr : Heteroskedastctet 7 Økonometr : Heteroskedastctet 8 7
Forenklet Whte s test: Hjælperegresson uˆ = δ0 + δyˆ+ δ ˆ y + w Hypotese H0 : δ = δ = 0 Testet konstrueres som LM = n R χ * u, asympt. fordelt som (). Fordelen ved dette test er at antallet af frhedsgrader er lavere Whte s test har asymptotsk gyldghed og er altså bedst for store datasæt Husk alle dsse test er udledt under forudsætnng af, at antagelserne MLR.-MLR.4 er opfyldt Hvs antagelse MLR.3 kke er opfyldt kan man få at test for homoskedastctet blver afvst selvom antagelsen MLR.5 er opfyldt Så afvsnng af homoskedastctet skal skyldes mere generelle former for msspecfkaton: Kaptel 9 Økonometr : Heteroskedastctet 9 Økonometr : Heteroskedastctet 30 Næste gang: Fredag den 9/0. Heteroskedastctet: Kaptel 8.4-8.5 Estmatorer, der tager højde for heteroskedastctet: Vægtet mndste kvadraters estmaton (WLS, FGLS) Ldt mere om den lneære sandsynlghedsmodel Økonometr : Heteroskedastctet 3 8