Dagens program Økonometri Den multiple regressionsmodel 4. februar 003 regressionsmodel Emnet for denne forelæsning er stadig den multiple regressionsmodel (Wooldridge kap. 3.4-3.5)! Opsamling fra sidst Udeladte variable! Variansen på OLS estimatoren! Multikollinaritet! Variansen i misspecificerede modeller! Estimat af variansen på felleddet! Gauss-Markov teoremet regressionsmodel Opsamling fra sidst Udeladte variable Variansen af OLS estimatoren! Udeladte (relevante) variable giver normalt biased estimater! I en model med to forklarende variable kan formlen for bias let udledes! I modeller med mere end to forklarende variable er det tit svært at vurdere retningen af biasen! Antagelse MLR 5 (homoskedasticitet): Var( u x,..., x ) = σ! Hvis antagelsen ikke er opfyldt, siges at felleddet er heteroskedastisk! Antagelsen er ikke opfyldt hvis variansen f.eks. er givet ved k Vu ( x,..., x) = σ x k regressionsmodel 3 regressionsmodel 4
Variansen på OLS estimatoren! Antagelsen MLR 5 kan også formuleres ved brug af matricer (se appendix E.): Vu ( X) = σ I! hvor I er en nxn identitetsmatrix! hvor X er en nx(k+) matrix, som indeholder de forklarende variable Variansen på OLS estimatoren! Antagelserne MLR -MLR 5 kaldes Gauss-Markov antagelserne! Teorem 3.! Under antagelserne MLR -MLR 5 er variansen af OLS estimatoren givet ved Var( ˆ β X ) = σ ( X ' X ) X er en nx(k+) matrix Parameteren $ er en (k+)x matrix (vektor) regressionsmodel 5 regressionsmodel 6 Variansen af OLS estimatoren Variansen af OLS estimatoren! Bevis (se appendix E.) (tavlegennemgang) regressionsmodel 7! Matrixformen for variansen er som regel lettest at arbede med! Til at fortolke variansen kan det være lettere at benytte følgende opskrivning af variansen ˆ σ var( β ) = SST( R ) n! hvor SST = ( xi x ) i=! og R stammer fra regressionen af x på de øvrige forklarende variable! Bevis for ovenstående opskrivning af variansen se appendix i kap. 3 regressionsmodel 8
Variansen.. Multikollinaritet! De tre komponenter i variansen! Variansen af felleddet: " Jo større varians på felleddet o større varians på alle estimaterne! Variationen i x " Jo større variation i x o mindre varians på estimatet β! Variation R " Jo tættere R er på 0 o mindre er variansen på estimatet β " Mindst varians opnås ved R =0 hvilket svarer til at x ukorreleret med de øvrige forklarende variable er " Jo tættere R er på o større er variansen på estimatet β! Multikollinaritet optræder, når R er tæt på! Følgerne af multikollinaritet: " Variansen på estimatet β vil være stor (se figur 3.)! Hvornår optræder multikollinarietet: " Når nogle af de forklarende variable er høt korreleret " Når der er få observationer " Hvis antagelsen MLR 4 er opfyldt er R altid forskellig fra regressionsmodel 9 regressionsmodel 0 Multikollinariet Variansen i misspecificerede modeller! Er det et problem, at der er multikollinaritet? " Det afhænger af hvor stor variansen på estimaterne bliver " Det afhænger af hvad analysen skal bruges til " Hø korrelation mellem nogle af de forklarende variable betyder ikke så meget, hvis det ikke er estimaterne til disse parametre, man primært er interesseret i! Hvad stiller man op med multikollinaritet " Indsaml mere data " Drop en eller flere variable fra modellen. Dette er dog langt fra altid en god ide (problemer med udeladte variable) regressionsmodel! Variansen i misspecificerede modeller illustreres ved et eksempel! Antag følgende model opfylder Gauss-Markov antagelserne: y = β + β x + β x + u 0! Vi har to estimator af β : " OLS estimatet fra MLR: ŷ = ˆ β0 + ˆ βx+ ˆ βx " OLS estimatet fra SLR: y! =! β0 +! βx! Variansen: Var( ˆ β x, x) = σ /( SST( R ) Var(! β x, x ) = σ /( SST ) regressionsmodel 3
Variansen i misspecificerede modeller! Den betingede varians af! β er altid mindre end (eller lig med) variansen af ˆβ! Hvis x og x er ukorreleret er variansen den samme og begge estimater middelrette! Hvis β =0 er begge estimater middelrette og! β har mindst varians. Altså! β foretrækkes! Hvis β 0 er middelret mens er biased. Variansen af! ˆβ! β β er mindst. Det er ikke oplagt hvilken estimator som foretrækkes. Estimatet på variansen af felleddet! Estimatet på felleddet udregnes stort set som i den simple regressionsmodel! Ud fra OLS estimaterne kan residualerne beregnes: uˆ ˆ ˆ ˆ i = yi β0 βxi... βkxik n ( uˆ ) i i=! Estimatet beregnes til: ˆ σ = n k! Nævneren er bestemt til at være antallet af frihedsgrader " (antal obs.) (antal estimerede parametre) regressionsmodel 3 regressionsmodel 4 Estimatet af variansen på felleddet! Teorem 3.3 " Hvis Gauss-Markov antagelserne (MLR - MLR 5) er opfyldt, er estimatet på variansen af felleddet middelret: ˆ E( σ ) = σ Gauss-Markov teoremet! Hvis Gauss-Markov antagelserne er opfyldt, kan man vise, at OLS estimatoren er den estimator, som har den mindste varians blandt lineære middelrette estimatorer! Hvorfor er det at vigtigt at bruge en estimator med mindst mulig varians?! OLS kaldes også BLUE for " Best (mindst varians) " Linear " Unbiased " Estimator regressionsmodel 5 regressionsmodel 6 4
Gauss-Markov teoremet! Teorem 3.4! Under Gauss-Markov antagelserne (MLR - MLR 5) gælder der, at OLS estimaterne for β 0, β,β,,β k er BLUE! Bevis (se appendix E.) (tavlegennemgang) regressionsmodel 7 5