Kvantitative metoder 2

Relaterede dokumenter
Økonometri: Lektion 6 Emne: Heteroskedasticitet

Kvantitative metoder 2

Lagrange multiplier test. Økonometri: Lektion 6 Håndtering ad heteroskedasticitet. Konsekvenser af Heteroskedasticitet

Økonometri: Lektion 6 Emne: Heteroskedasticitet

Kvantitative metoder 2

! Husk at udfylde spørgeskema 3. ! Lineær sandsynlighedsmodel. ! Eksempel. ! Mere om evaluering og selvselektion

Økonometri 1. Inferens i den lineære regressionsmodel 2. oktober Økonometri 1: F8 1

Økonometri 1. Dummyvariabler 13. oktober Økonometri 1: F10 1

Økonometri 1. Dagens program. Den multiple regressionsmodel 18. september 2006

Økonometri 1. Dagens program. Den simple regressionsmodel 15. september 2006

! Proxy variable. ! Målefejl. ! Manglende observationer. ! Dataudvælgelse. ! Ekstreme observationer. ! Eksempel: Lønrelation (på US data)

! Variansen på OLS estimatoren. ! Multikollinaritet. ! Variansen i misspecificerede modeller. ! Estimat af variansen på fejlleddet

Kvantitative metoder 2

Rettevejledning til Økonomisk Kandidateksamen 2004I, Økonometri 1

Økonometri 1. Den simple regressionsmodel 11. september Økonometri 1: F2

Økonometri 1. Inferens i den lineære regressionsmodel 25. september Økonometri 1: F6 1

Økonometri 1. Test for heteroskedasticitet. Test for heteroskedasticitet. Dagens program. Heteroskedasticitet 26. oktober 2005

Økonometri 1. Oversigt. Mere om dataproblemer Gentagne tværsnit og panel data I

Økonometri 1. Lineær sandsynlighedsmodel. Hvad nu hvis den afhængige variabel er en kvalitativ variabel (med to kategorier)?

Økonometri 1. Prediktion. Dummyvariabler 9. oktober Økonometri 1: F9 1

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i.

Kvantitative Metoder 1 - Forår 2007

Rettevejledning til Økonomisk Kandidateksamen 2005I, Økonometri 1

Økonometri: Lektion 2 Multipel Lineær Regression 1/27

Appendiks Økonometrisk teori... II

Økonometri 1. Dagens program: Afslutningsforelæsning 23. maj 2007

Økonometri 1. FunktioneI form i den lineære regressionsmodel 19. oktober Dagens program

Økonometri 1. Heteroskedasticitet 27. oktober Økonometri 1: F12 1

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

Simpel Lineær Regression: Model

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Kvantitative metoder 2

Rettevejledning til Økonomisk Kandidateksamen 2007II. Økonometri 1

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Økonometri: Lektion 2 Multipel Lineær Regression 1/33

Kvantitative metoder 2

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Undervisningsnoter til øvelse i Panel Modeller. %, it. E(x kjs

Analysestrategi. Lektion 7 slides kompileret 27. oktober :24 p.1/17

Rettevejledning til Økonomisk Kandidateksamen 2007II. Kvantitative Metoder 2: Tag-hjem eksamen

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007

Økonometri 1. Målsætning for Økonometri 1. Dagens program: Afslutningsforelæsning 16. December 2005

Forelæsning 11: Kapitel 11: Regressionsanalyse

W.2 Simpel lineær regression: Egenskaber ved OLS: Forudsagte værdier og residualer: Et residual:

Økonometri: Lektion 4. Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater

Økonometri Lektion 1 Simpel Lineær Regression 1/31

Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Statistik Lektion 4. Variansanalyse Modelkontrol

Økonometri: Lektion 7 Emne: Prædiktionsintervaller, RESET teset, proxy variable og manglende data.

Rettevejledning til Økonomisk Kandidateksamen 2008II. Kvantitative Metoder 2: Tag-hjem eksamen

Dagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at

Rettevejledning til Økonomisk Kandidateksamen 2006II, Økonometri 1

Økonometri 1. Lineær sandsynlighedsmodel (Wooldridge 8.5). Dagens program: Heteroskedasticitet 30. oktober 2006

Wooldridge, kapitel 19: Carrying out an Empirical Project. Information og spørgsmål vedr. eksamen. Økonometri 1: Afslutningsforelæsning 2

Kvantitative metoder 2

Økonometri 1. Definition og motivation. Definition og motivation. Dagens program. Den multiple regressionsmodel 15. februar 2006

Kvantitative Metoder 1 - Efterår Dagens program

Økonometri lektion 5 Multipel Lineær Regression. Inferens Modelkontrol Prædiktion

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Simpel Lineær Regression

Tema. Dagens tema: Indfør centrale statistiske begreber.

Dagens Emner. Likelihood teori. Lineær regression (intro) p. 1/22

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

1. Intoduktion. Undervisningsnoter til Øvelse i Paneldata

Kvantitative metoder 2

Modul 12: Regression og korrelation

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Konfidensintervaller og Hypotesetest

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Kvantitative metoder 2

1 Regressionsproblemet 2

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning

Hvad er danskernes gennemsnitshøjde? N = 10. X 1 = 169 cm. X 2 = 183 cm. X 3 = 171 cm. X 4 = 113 cm. X 5 = 174 cm

Multipel Lineær Regression

I dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt)

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Økonomisk Kandidateksamen 2006II Økonometri 1. Afkastet af uddannelse for britiske tvillingepar

Kvantitative metoder 2

Økonometri, ugeseddel 8 Hold 1 1/4-2003

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

Referat : af Gruppearbejde Økonometri1 øvelsestime ugeseddel 7 dato 26/3 2003, Hold 4

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

1 Hb SS Hb Sβ Hb SC = , (s = )

for drikkevandsselskaberne

Økonometri 1. Interne evalueringer af forelæsninger. Kvalitative variabler. Dagens program. Dummyvariabler 21. oktober 2004

Modul 7: Eksempler. 7.1 Beskrivende dataanalyse Diagrammer. Bent Jørgensen. Forskningsenheden for Statistik ST501: Science Statistik

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff

for drikkevandsselskaberne

Økonometri 1 Forår 2006 Ugeseddel 11

Estimation af bilkøbsrelationen med nye indkomst- og formueudtryk

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

To samhørende variable

Transkript:

Kvantitative metoder Heteroskedasticitet 11. april 007 KM: F18 1

Oversigt: Heteroskedasticitet OLS estimation under heteroskedasticitet (W.8.1-): Konsekvenser af heteroskedasticitet for OLS Gyldige test på grundlag af OLS-estimation, selvom der er heteroskedasticitet: Korrektion af variansen Generelle hypotesetest under heteroskedasticitet Test for heteroskedasticitet (W.8.3): Grafiske test Formelle test: Breusch-Pagan test, White test Bedre (mere efficiente) estimatorer end OLS, når der er heteroskedasticitet (W.8.4): Weighted Least Squares (WLS) Feasible Generalized Least Squares (FGLS) Lineær sandsynlighedsmodel (W.8.5) KM: F18

Heteroskedasticitet I kapitel og 3 blev antagelsen om homoskedasticitet introduceret: Samme varians på fejlleddet for alle i Antagelsen kan være meget restriktiv i praksis. Derfor vil vi se på tilfælde med heteroskedasticitet MLR.5 er antagelsen om homoskedasticitet: Vu ( x,, x) = σ 1 k Alternativ: Modellen lider af heteroskedasticitet af ukendt form: Vu ( i x) = σ i Vi tillader altså, at fejlleddet til hver enhed (individ, firma, land) har sin egen varians (meget generel form) Homoskedasticitet kan ses som det specialtilfælde, hvor σ = σ for alle i i KM: F18 3

Konsekvenser af heteroskedasticitet for OLS Hvis MLR.5 ikke er opfyldt, siger vi at fejlleddene er heteroskedastiske OLS estimatorens egenskaber ved heteroskedasticitet: + OLS stadig middelret og konsistent (givet MLR.1-4) - Variansen af OLS estimaterne estimeres ikke middelret eller konsistent af de sædvanlige OLS-udtryk - Konfidensintervallet er ikke rigtigt konstrueret - t og F-test er ikke nødvendigvis t og F-fordelt, LM test er ikke nødvendigvis χ fordelt (og derfor er disse test ikke pålidelige) OLS er ikke længere den bedste lineære middelrette estimator (BLUE): Der findes andre lineære middelrette estimatorer med mindre varians OLS er ikke længere asymptotisk efficient KM: F18 4

OLS-baserede test under heteroskedasticitet Heteroskedasticitet i fejlleddet betyder, at test der er baseret på OLS estimation kun er gyldige, hvis man korrigerer standardfejlene for heteroskedasticitet. Heteroskedasticitets-konsistente eller -robuste test. Modellen lider af heteroskedasticitet af ukendt form: Vu ( x) = σ i White s estimator for variansen af OLS estimatoren er konsistent selvom om der er heteroskedasticitet i fejlleddet. i KM: F18 5

Hvornår forekommer heteroskedaticitet i praksis? Data består af størrelsesmæssigt meget heterogene enheder: Virksomheder, lande, skoler, Data består af gennemsnit (over forskellige antal observationer) Per capita værdier for forskellige lande Gennemsnit fx for forskellige kommuner eller skoler Forkert funktionel form: Hvis variansen på fejlleddet vokser med den afhængige variabel kan problemet nogen gange løses ved at lave en transformation med logaritmen Lineær sandsynlighedsmodel Heteroskedasticitet knytter sig til den enkelte model og det enkelte datasæt KM: F18 6

Hvordan tester man for heteroskedasticitet? Antag følgende model y = β0 + β1x1+ βx + βkxk + u hvor antagelserne MLR.1-MLR.4 er opfyldt Hypotese: H0 : V( u x1, x xk ) = σ Alternativ formulering af hypotesen H0 : E( u x1, x xk ) = σ Hvis hypotesen er forkert er E( u x1, x x k ) en funktion af x erne: Heteroskedasticitet Bemærk: Systematikken er i variansen på fejlleddet, ikke i middelværdien (givet at MLR.4 holder). KM: F18 7

Grafisk test for heteroskedasticitet Grafisk test: Estimer modellen med OLS og gem residualerne Plot residualerne (eller de kvadrerede residualer) mod: Forskellige forklarende variable: Kandidater er skalavariabler, fx omsætning (virksomheder), indkomst (individer/husholdninger) Den forudsagte værdi af den afhængige variabel Se efter systematiske mønstre i spredningen af residualerne: Variansen vokser i den variabel, der plottes imod: Trompet Variansen aftager i den variabel, der plottes imod: Omvendt trompet Varsom med at overfortolke, når der er forskel i datatæthed. KM: F18 8

Test for heteroskedasticitet: Breusch-Pagan Hvis man antager en simpel lineær relation u = δ0 + δ1x1+ δx + + δkxk + v svarer nulhypotesen om homoskedasticitet til H0 : δ1 = δ = = δk = 0 vs. H1 : mindst en 0 Denne hypotese kan testes ved at erstatte de sande fejlled med OLS residualerne ˆ = δ0 + δ1 1+ δ + + δk k + (*) u x x x w Testet udføres enten som et F-test eller et LM test For store datasæt vil F og LM test have de sædvanlige fordelinger selvom man har erstattet de sande fejlled med OLS residualerne. KM: F18 9

Test for heteroskedasticitet: Breusch- Pagan Regressionen (*) udføres og R u regression noteres F-teststørrelsen er givet ved F = R / k u (1 Ru ) /( n k 1) for denne Teststørrelsen er approx. F(k,n-k-1)-fordelt under nulhypotesen (homoskedasticitet) LM teststørrelsen LM = n R k * u, asympt. fordelt som χ ( ). KM: F18 10

Test for heteroskedasticitet Specialtilfælde af BP-testet: Hvis man mistænker, at variansen kun afhænger af en bestemt variabel. Testet udføres ved at regressere de kvadrerede residualer på den pågældende variabel. Bemærk at antallet af frihedsgrader er ændret for både F- testet (antal frihedsgrader: 1,n-1-1) og LM testet ( χ (1) ) Alternativt test: Whites test for heteroskedasticitet Betingelsen Eu ( x1, x xk ) = σ kan erstattes af svagere betingelse: u skal være ukorreleret med alle forklarende variable, de forklarende variable i anden og alle krydsprodukterne KM: F18 11

Test for heteroskedasticitet: Whites test Antag vi har en model med k=3 Hjælperegressionen for White s test û = δ + δ x + δ x + δ x + δ x + δ x + 0 1 1 3 3 4 1 5 NB: 9 forklarende variable Hypotese H : δ = = δ = 0 0 1 9 δ x + δ x x + δ x x + δ x x + w 6 3 7 1 8 1 3 9 3 Teststørrelsen findes som et LM test LM = nr, asympt. fordelt som χ ( m), hvor m er antal u regressorer excl. konstantleddet i hjælperegressionen (i ex: 9). KM: F18 1

Test for heteroskedasticitet: Whites test Forenklet White s test: Hjælperegression uˆ = δ0 + δ1yˆ+ δ ˆ y + w Hypotese H0 : δ1 = δ = 0 vs. H1 : mindst en 0 Testet konstrueres som LM = nr, asympt. fordelt som χ (). u Fordelen ved dette test er at antallet af regressorer i hjælperegressionen er lavere White s test har asymptotisk gyldighed og er altså bedst for store datasæt KM: F18 13

Test for heteroskedasticitet Test for heteroskedasticitet for cigareteksemplet: Grafiske test: Er der tegn på at variansen afhænger fx af indkomst eller alder? BP, White s test Husk alle disse test er udledt under forudsætning af, at antagelserne MLR.1-MLR.4 er opfyldt. Hvis antagelse MLR.4 ikke er opfyldt kan man få at test for homoskedasticitet bliver afvist selvom antagelsen MLR.5 er opfyldt. Så afvisning af homoskedasticitet skal skyldes mere generelle former for misspecifikation: Kapitel 9 KM: F18 14

NB er Antagelserne MLR.1- MLR.4, som sikrer at OLS middelret og konsistent, vedrører ikke variansen på fejlleddet. Heteroskedasticitet betyder systematik i variansen på fejlleddet, ikke i middelværdien (givet at MLR.3 holder). Gyldige hypotesetest kan baseres på den robuste kovariansmatrix for OLS estimatoren, selvom der er heteroskedasticitet. KM: F18 15

Næste gang: Mandag Estimation under heteroskedasticitet: Kapitel 8.4 Estimator der tager højde for heteroskedasticitet: Weighted Least Squares (WLS) KM: F18 16