! Variansen på OLS estimatoren. ! Multikollinaritet. ! Variansen i misspecificerede modeller. ! Estimat af variansen på fejlleddet

Relaterede dokumenter
Kvantitative metoder 2

Økonometri 1. Dagens program. Den simple regressionsmodel 15. september 2006

Økonometri 1. Dagens program. Den multiple regressionsmodel 18. september 2006

! Proxy variable. ! Målefejl. ! Manglende observationer. ! Dataudvælgelse. ! Ekstreme observationer. ! Eksempel: Lønrelation (på US data)

Økonometri 1. For mange variable i modellen. For få variable. Dagens program. Den multiple regressionsmodel 21. september 2004

Økonometri 1. Den simple regressionsmodel 11. september Økonometri 1: F2

Økonometri 1. Definition og motivation. Definition og motivation. Dagens program. Den multiple regressionsmodel 15. februar 2006

Kvantitative metoder 2

Økonometri 1. Dummyvariabler 13. oktober Økonometri 1: F10 1

Økonometri: Lektion 2 Multipel Lineær Regression 1/27

! Husk at udfylde spørgeskema 3. ! Lineær sandsynlighedsmodel. ! Eksempel. ! Mere om evaluering og selvselektion

Simpel Lineær Regression: Model

Kvantitative metoder 2

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

Økonometri: Lektion 2 Multipel Lineær Regression 1/33

Økonometri: Lektion 6 Emne: Heteroskedasticitet

Økonometri 1. FunktioneI form i den lineære regressionsmodel 19. oktober Dagens program

Lagrange multiplier test. Økonometri: Lektion 6 Håndtering ad heteroskedasticitet. Konsekvenser af Heteroskedasticitet

Økonometri: Lektion 6 Emne: Heteroskedasticitet

Økonometri Lektion 1 Simpel Lineær Regression 1/31

Økonometri 1. Inferens i den lineære regressionsmodel 2. oktober Økonometri 1: F8 1

Økonometri 1. Oversigt. Mere om dataproblemer Gentagne tværsnit og panel data I

Kvantitative metoder 2

Økonometri 1. Inferens i den lineære regressionsmodel 29. september Økonometri 1: F7 1

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Økonometri 1. Prediktion. Dummyvariabler 9. oktober Økonometri 1: F9 1

Økonometri 1. Inferens i den lineære regressionsmodel 25. september Økonometri 1: F6 1

Kvantitative metoder 2

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i.

Kvantitative metoder 2

Simpel Lineær Regression

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Forelæsning 11: Kapitel 11: Regressionsanalyse

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Note om Monte Carlo eksperimenter

Kvantitative metoder 2

Økonometri 1. Interne evalueringer af forelæsninger. Kvalitative variabler. Dagens program. Dummyvariabler 21. oktober 2004

Appendiks Økonometrisk teori... II

1. Intoduktion. Undervisningsnoter til Øvelse i Paneldata

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse

Økonometri: Lektion 4. Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater

W.2 Simpel lineær regression: Egenskaber ved OLS: Forudsagte værdier og residualer: Et residual:

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Modul 6: Regression og kalibrering

Økonometri: Lektion 7 Emne: Prædiktionsintervaller, RESET teset, proxy variable og manglende data.

Økonometri lektion 5 Multipel Lineær Regression. Inferens Modelkontrol Prædiktion

1 Regressionsproblemet 2

Anvendt Statistik Lektion 7. Simpel Lineær Regression

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Afdeling for Biostatistik. Eksempel: Systolisk blodtryk

12. september Epidemiologi og biostatistik. Forelæsning 4 Uge 3, torsdag. Niels Trolle Andersen, Afdelingen for Biostatistik. Regressionsanalyse

Module 3: Statistiske modeller

Note om Monte Carlo eksperimenter

Referat : af Gruppearbejde Økonometri1 øvelsestime ugeseddel 7 dato 26/3 2003, Hold 4

Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model

Rettevejledning til Økonomisk Kandidateksamen 2005I, Økonometri 1

Undervisningsnoter til øvelse i Panel Modeller. %, it. E(x kjs

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge

Wooldridge, kapitel 19: Carrying out an Empirical Project. Information og spørgsmål vedr. eksamen. Økonometri 1: Afslutningsforelæsning 2

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning

Module 4: Ensidig variansanalyse

Lineær regression: lidt mere tekniske betragtninger om R 2 og et godt alternativ

Økonometri 1. Kvalitative variabler. Kvalitative variabler. Dagens program. Kvalitative variable 8. marts 2006

Lineære normale modeller (4) udkast

Kvantitative Metoder 1 - Forår 2007

Rettevejledning til Økonomisk Kandidateksamen 2007II. Økonometri 1

Økonometri, ugeseddel 8 Hold 1 1/4-2003

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

To samhørende variable

Opgave 11.4 side 316 (7ed: 11.4, side 352 og 6ed: 11.2, side 345)

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007

Rettevejledning til Økonomisk Kandidateksamen 2006II, Økonometri 1

Økonometri 1. Målsætning for Økonometri 1. Dagens program: Afslutningsforelæsning 16. December 2005

Statistik Lektion 4. Variansanalyse Modelkontrol

, i ' 1,...,N ; t ' 1,...,T, - i.i.d.(0,f 2, ), ) ' 0, E(, it. x kjs. œ i,t,s,j,k.

Statistik Lektion 16 Multipel Lineær Regression

Module 9: Residualanalyse

Økonometri 1. Gentagne tværsnit (W ): Opsamling. Gentagne tværsnit og paneldata. Gentagne Tværsnit og Paneldata II.

Center for Statistik. Multipel regression med laggede responser som forklarende variable

Økonometri 1. Dagens program: Afslutningsforelæsning 23. maj 2007

Økonometri: Lektion 5. Multipel Lineær Regression: Interaktion, log-transformerede data, kategoriske forklarende variable, modelkontrol

Nanostatistik: Lineær regression

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Hvad er danskernes gennemsnitshøjde? N = 10. X 1 = 169 cm. X 2 = 183 cm. X 3 = 171 cm. X 4 = 113 cm. X 5 = 174 cm

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

Rettevejledning til Økonomisk Kandidateksamen 2004I, Økonometri 1

Kapitel 11 Lineær regression

Økonomisk Kandidateksamen 2004II Økonometri 1. Læsefærdigheder hos skoleelever i Danmark

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Velkommen til kurset. Teoretisk Statistik. Lærer: Niels-Erik Jensen

Multipel regression. Data fra opgave 3 side 453: Multipel regressionsmodel: Y = α + β 1 x 1 + β 2 x 2 + ǫ. hvor ǫ N(0, σ 2 ).

Dagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at

Kvantitative metoder 2

Modul 11: Simpel lineær regression

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Rettevejledning til Økonomisk Kandidateksamen 2007II. Kvantitative Metoder 2: Tag-hjem eksamen

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

Analysestrategi. Lektion 7 slides kompileret 27. oktober :24 p.1/17

Transkript:

Dagens program Økonometri Den multiple regressionsmodel 4. februar 003 regressionsmodel Emnet for denne forelæsning er stadig den multiple regressionsmodel (Wooldridge kap. 3.4-3.5)! Opsamling fra sidst Udeladte variable! Variansen på OLS estimatoren! Multikollinaritet! Variansen i misspecificerede modeller! Estimat af variansen på felleddet! Gauss-Markov teoremet regressionsmodel Opsamling fra sidst Udeladte variable Variansen af OLS estimatoren! Udeladte (relevante) variable giver normalt biased estimater! I en model med to forklarende variable kan formlen for bias let udledes! I modeller med mere end to forklarende variable er det tit svært at vurdere retningen af biasen! Antagelse MLR 5 (homoskedasticitet): Var( u x,..., x ) = σ! Hvis antagelsen ikke er opfyldt, siges at felleddet er heteroskedastisk! Antagelsen er ikke opfyldt hvis variansen f.eks. er givet ved k Vu ( x,..., x) = σ x k regressionsmodel 3 regressionsmodel 4

Variansen på OLS estimatoren! Antagelsen MLR 5 kan også formuleres ved brug af matricer (se appendix E.): Vu ( X) = σ I! hvor I er en nxn identitetsmatrix! hvor X er en nx(k+) matrix, som indeholder de forklarende variable Variansen på OLS estimatoren! Antagelserne MLR -MLR 5 kaldes Gauss-Markov antagelserne! Teorem 3.! Under antagelserne MLR -MLR 5 er variansen af OLS estimatoren givet ved Var( ˆ β X ) = σ ( X ' X ) X er en nx(k+) matrix Parameteren $ er en (k+)x matrix (vektor) regressionsmodel 5 regressionsmodel 6 Variansen af OLS estimatoren Variansen af OLS estimatoren! Bevis (se appendix E.) (tavlegennemgang) regressionsmodel 7! Matrixformen for variansen er som regel lettest at arbede med! Til at fortolke variansen kan det være lettere at benytte følgende opskrivning af variansen ˆ σ var( β ) = SST( R ) n! hvor SST = ( xi x ) i=! og R stammer fra regressionen af x på de øvrige forklarende variable! Bevis for ovenstående opskrivning af variansen se appendix i kap. 3 regressionsmodel 8

Variansen.. Multikollinaritet! De tre komponenter i variansen! Variansen af felleddet: " Jo større varians på felleddet o større varians på alle estimaterne! Variationen i x " Jo større variation i x o mindre varians på estimatet β! Variation R " Jo tættere R er på 0 o mindre er variansen på estimatet β " Mindst varians opnås ved R =0 hvilket svarer til at x ukorreleret med de øvrige forklarende variable er " Jo tættere R er på o større er variansen på estimatet β! Multikollinaritet optræder, når R er tæt på! Følgerne af multikollinaritet: " Variansen på estimatet β vil være stor (se figur 3.)! Hvornår optræder multikollinarietet: " Når nogle af de forklarende variable er høt korreleret " Når der er få observationer " Hvis antagelsen MLR 4 er opfyldt er R altid forskellig fra regressionsmodel 9 regressionsmodel 0 Multikollinariet Variansen i misspecificerede modeller! Er det et problem, at der er multikollinaritet? " Det afhænger af hvor stor variansen på estimaterne bliver " Det afhænger af hvad analysen skal bruges til " Hø korrelation mellem nogle af de forklarende variable betyder ikke så meget, hvis det ikke er estimaterne til disse parametre, man primært er interesseret i! Hvad stiller man op med multikollinaritet " Indsaml mere data " Drop en eller flere variable fra modellen. Dette er dog langt fra altid en god ide (problemer med udeladte variable) regressionsmodel! Variansen i misspecificerede modeller illustreres ved et eksempel! Antag følgende model opfylder Gauss-Markov antagelserne: y = β + β x + β x + u 0! Vi har to estimator af β : " OLS estimatet fra MLR: ŷ = ˆ β0 + ˆ βx+ ˆ βx " OLS estimatet fra SLR: y! =! β0 +! βx! Variansen: Var( ˆ β x, x) = σ /( SST( R ) Var(! β x, x ) = σ /( SST ) regressionsmodel 3

Variansen i misspecificerede modeller! Den betingede varians af! β er altid mindre end (eller lig med) variansen af ˆβ! Hvis x og x er ukorreleret er variansen den samme og begge estimater middelrette! Hvis β =0 er begge estimater middelrette og! β har mindst varians. Altså! β foretrækkes! Hvis β 0 er middelret mens er biased. Variansen af! ˆβ! β β er mindst. Det er ikke oplagt hvilken estimator som foretrækkes. Estimatet på variansen af felleddet! Estimatet på felleddet udregnes stort set som i den simple regressionsmodel! Ud fra OLS estimaterne kan residualerne beregnes: uˆ ˆ ˆ ˆ i = yi β0 βxi... βkxik n ( uˆ ) i i=! Estimatet beregnes til: ˆ σ = n k! Nævneren er bestemt til at være antallet af frihedsgrader " (antal obs.) (antal estimerede parametre) regressionsmodel 3 regressionsmodel 4 Estimatet af variansen på felleddet! Teorem 3.3 " Hvis Gauss-Markov antagelserne (MLR - MLR 5) er opfyldt, er estimatet på variansen af felleddet middelret: ˆ E( σ ) = σ Gauss-Markov teoremet! Hvis Gauss-Markov antagelserne er opfyldt, kan man vise, at OLS estimatoren er den estimator, som har den mindste varians blandt lineære middelrette estimatorer! Hvorfor er det at vigtigt at bruge en estimator med mindst mulig varians?! OLS kaldes også BLUE for " Best (mindst varians) " Linear " Unbiased " Estimator regressionsmodel 5 regressionsmodel 6 4

Gauss-Markov teoremet! Teorem 3.4! Under Gauss-Markov antagelserne (MLR - MLR 5) gælder der, at OLS estimaterne for β 0, β,β,,β k er BLUE! Bevis (se appendix E.) (tavlegennemgang) regressionsmodel 7 5