Kvantitative metoder Heteroskedasticitet 11. april 007 KM: F18 1
Oversigt: Heteroskedasticitet OLS estimation under heteroskedasticitet (W.8.1-): Konsekvenser af heteroskedasticitet for OLS Gyldige test på grundlag af OLS-estimation, selvom der er heteroskedasticitet: Korrektion af variansen Generelle hypotesetest under heteroskedasticitet Test for heteroskedasticitet (W.8.3): Grafiske test Formelle test: Breusch-Pagan test, White test Bedre (mere efficiente) estimatorer end OLS, når der er heteroskedasticitet (W.8.4): Weighted Least Squares (WLS) Feasible Generalized Least Squares (FGLS) Lineær sandsynlighedsmodel (W.8.5) KM: F18
Heteroskedasticitet I kapitel og 3 blev antagelsen om homoskedasticitet introduceret: Samme varians på fejlleddet for alle i Antagelsen kan være meget restriktiv i praksis. Derfor vil vi se på tilfælde med heteroskedasticitet MLR.5 er antagelsen om homoskedasticitet: Vu ( x,, x) = σ 1 k Alternativ: Modellen lider af heteroskedasticitet af ukendt form: Vu ( i x) = σ i Vi tillader altså, at fejlleddet til hver enhed (individ, firma, land) har sin egen varians (meget generel form) Homoskedasticitet kan ses som det specialtilfælde, hvor σ = σ for alle i i KM: F18 3
Konsekvenser af heteroskedasticitet for OLS Hvis MLR.5 ikke er opfyldt, siger vi at fejlleddene er heteroskedastiske OLS estimatorens egenskaber ved heteroskedasticitet: + OLS stadig middelret og konsistent (givet MLR.1-4) - Variansen af OLS estimaterne estimeres ikke middelret eller konsistent af de sædvanlige OLS-udtryk - Konfidensintervallet er ikke rigtigt konstrueret - t og F-test er ikke nødvendigvis t og F-fordelt, LM test er ikke nødvendigvis χ fordelt (og derfor er disse test ikke pålidelige) OLS er ikke længere den bedste lineære middelrette estimator (BLUE): Der findes andre lineære middelrette estimatorer med mindre varians OLS er ikke længere asymptotisk efficient KM: F18 4
OLS-baserede test under heteroskedasticitet Heteroskedasticitet i fejlleddet betyder, at test der er baseret på OLS estimation kun er gyldige, hvis man korrigerer standardfejlene for heteroskedasticitet. Heteroskedasticitets-konsistente eller -robuste test. Modellen lider af heteroskedasticitet af ukendt form: Vu ( x) = σ i White s estimator for variansen af OLS estimatoren er konsistent selvom om der er heteroskedasticitet i fejlleddet. i KM: F18 5
Hvornår forekommer heteroskedaticitet i praksis? Data består af størrelsesmæssigt meget heterogene enheder: Virksomheder, lande, skoler, Data består af gennemsnit (over forskellige antal observationer) Per capita værdier for forskellige lande Gennemsnit fx for forskellige kommuner eller skoler Forkert funktionel form: Hvis variansen på fejlleddet vokser med den afhængige variabel kan problemet nogen gange løses ved at lave en transformation med logaritmen Lineær sandsynlighedsmodel Heteroskedasticitet knytter sig til den enkelte model og det enkelte datasæt KM: F18 6
Hvordan tester man for heteroskedasticitet? Antag følgende model y = β0 + β1x1+ βx + βkxk + u hvor antagelserne MLR.1-MLR.4 er opfyldt Hypotese: H0 : V( u x1, x xk ) = σ Alternativ formulering af hypotesen H0 : E( u x1, x xk ) = σ Hvis hypotesen er forkert er E( u x1, x x k ) en funktion af x erne: Heteroskedasticitet Bemærk: Systematikken er i variansen på fejlleddet, ikke i middelværdien (givet at MLR.4 holder). KM: F18 7
Grafisk test for heteroskedasticitet Grafisk test: Estimer modellen med OLS og gem residualerne Plot residualerne (eller de kvadrerede residualer) mod: Forskellige forklarende variable: Kandidater er skalavariabler, fx omsætning (virksomheder), indkomst (individer/husholdninger) Den forudsagte værdi af den afhængige variabel Se efter systematiske mønstre i spredningen af residualerne: Variansen vokser i den variabel, der plottes imod: Trompet Variansen aftager i den variabel, der plottes imod: Omvendt trompet Varsom med at overfortolke, når der er forskel i datatæthed. KM: F18 8
Test for heteroskedasticitet: Breusch-Pagan Hvis man antager en simpel lineær relation u = δ0 + δ1x1+ δx + + δkxk + v svarer nulhypotesen om homoskedasticitet til H0 : δ1 = δ = = δk = 0 vs. H1 : mindst en 0 Denne hypotese kan testes ved at erstatte de sande fejlled med OLS residualerne ˆ = δ0 + δ1 1+ δ + + δk k + (*) u x x x w Testet udføres enten som et F-test eller et LM test For store datasæt vil F og LM test have de sædvanlige fordelinger selvom man har erstattet de sande fejlled med OLS residualerne. KM: F18 9
Test for heteroskedasticitet: Breusch- Pagan Regressionen (*) udføres og R u regression noteres F-teststørrelsen er givet ved F = R / k u (1 Ru ) /( n k 1) for denne Teststørrelsen er approx. F(k,n-k-1)-fordelt under nulhypotesen (homoskedasticitet) LM teststørrelsen LM = n R k * u, asympt. fordelt som χ ( ). KM: F18 10
Test for heteroskedasticitet Specialtilfælde af BP-testet: Hvis man mistænker, at variansen kun afhænger af en bestemt variabel. Testet udføres ved at regressere de kvadrerede residualer på den pågældende variabel. Bemærk at antallet af frihedsgrader er ændret for både F- testet (antal frihedsgrader: 1,n-1-1) og LM testet ( χ (1) ) Alternativt test: Whites test for heteroskedasticitet Betingelsen Eu ( x1, x xk ) = σ kan erstattes af svagere betingelse: u skal være ukorreleret med alle forklarende variable, de forklarende variable i anden og alle krydsprodukterne KM: F18 11
Test for heteroskedasticitet: Whites test Antag vi har en model med k=3 Hjælperegressionen for White s test û = δ + δ x + δ x + δ x + δ x + δ x + 0 1 1 3 3 4 1 5 NB: 9 forklarende variable Hypotese H : δ = = δ = 0 0 1 9 δ x + δ x x + δ x x + δ x x + w 6 3 7 1 8 1 3 9 3 Teststørrelsen findes som et LM test LM = nr, asympt. fordelt som χ ( m), hvor m er antal u regressorer excl. konstantleddet i hjælperegressionen (i ex: 9). KM: F18 1
Test for heteroskedasticitet: Whites test Forenklet White s test: Hjælperegression uˆ = δ0 + δ1yˆ+ δ ˆ y + w Hypotese H0 : δ1 = δ = 0 vs. H1 : mindst en 0 Testet konstrueres som LM = nr, asympt. fordelt som χ (). u Fordelen ved dette test er at antallet af regressorer i hjælperegressionen er lavere White s test har asymptotisk gyldighed og er altså bedst for store datasæt KM: F18 13
Test for heteroskedasticitet Test for heteroskedasticitet for cigareteksemplet: Grafiske test: Er der tegn på at variansen afhænger fx af indkomst eller alder? BP, White s test Husk alle disse test er udledt under forudsætning af, at antagelserne MLR.1-MLR.4 er opfyldt. Hvis antagelse MLR.4 ikke er opfyldt kan man få at test for homoskedasticitet bliver afvist selvom antagelsen MLR.5 er opfyldt. Så afvisning af homoskedasticitet skal skyldes mere generelle former for misspecifikation: Kapitel 9 KM: F18 14
NB er Antagelserne MLR.1- MLR.4, som sikrer at OLS middelret og konsistent, vedrører ikke variansen på fejlleddet. Heteroskedasticitet betyder systematik i variansen på fejlleddet, ikke i middelværdien (givet at MLR.3 holder). Gyldige hypotesetest kan baseres på den robuste kovariansmatrix for OLS estimatoren, selvom der er heteroskedasticitet. KM: F18 15
Næste gang: Mandag Estimation under heteroskedasticitet: Kapitel 8.4 Estimator der tager højde for heteroskedasticitet: Weighted Least Squares (WLS) KM: F18 16