Økonometri 1. Definition og motivation. Definition og motivation. Dagens program. Den multiple regressionsmodel 15. februar 2006

Relaterede dokumenter
Kvantitative metoder 2

Økonometri 1. Dagens program. Den multiple regressionsmodel 18. september 2006

Økonometri 1. Definition og motivation. Definition og motivation. Dagens program. Den multiple regressionsmodel 21. september 2005

Økonometri 1. Inferens i den lineære regressionsmodel 29. september Økonometri 1: F7 1

! Variansen på OLS estimatoren. ! Multikollinaritet. ! Variansen i misspecificerede modeller. ! Estimat af variansen på fejlleddet

Kvantitative metoder 2

Økonometri 1. For mange variable i modellen. For få variable. Dagens program. Den multiple regressionsmodel 21. september 2004

Økonometri 1. Den simple regressionsmodel 11. september Økonometri 1: F2

Motivation. En tegning

Økonometri 1. Dagens program. Den simple regressionsmodel 15. september 2006

Simpel Lineær Regression. Opsplitning af variationen Determinations koefficient Variansanalyse F-test Model-kontrol

! Proxy variable. ! Målefejl. ! Manglende observationer. ! Dataudvælgelse. ! Ekstreme observationer. ! Eksempel: Lønrelation (på US data)

Kvantitative metoder 2

Økonometri 1. Funktionel form. Funktionel form (fortsat) Dagens program. Den simple regressionsmodel 14. september 2005

Kvantitative metoder 2

Rettevejledning til Økonomisk Kandidateksamen 2003II, Økonometri 1

Økonometri 1. Dummyvariabler 13. oktober Økonometri 1: F10 1

Dagens program. Estimation: Kapitel Eksempler på middelrette og/eller konsistente estimator (de sidste fra sidste forelæsning)

Statistik Lektion 8. Parrede test Test for forskel i andele Test for ens varians Gensyn med flyskræk!

24. januar Epidemiologi og biostatistik. Forelæsning 1 Uge 1, tirsdag. Niels Trolle Andersen, Afdelingen for Biostatistik.

Spørgsmål 3 (5 %) Bestem sandsynligheden for at et tilfældigt valgt vindue har en fejl ved listerne, når man ved at der er fejl i glasset.

Praktisk info. Statistisk analyse af en enkelt stikprøve: kendt eller ukendt varians Sandsynlighedsregning og Statistik (SaSt) I tirsdags.

Kvantitative metoder 2

hvor i er observationsnummeret, som løber fra 1 til stikprøvestørrelsen n, X i

Test i to populationer. Hypotesetest for parrede observationer Test for ens varians Gensyn med flyskræk!

Den flerdimensionale normalfordeling

Anvendt Statistik Lektion 3. Punkt- og intervalestimater Konfidensintervaller Valg af stikprøvestørrelse

Økonometri 1. FunktioneI form i den lineære regressionsmodel 19. oktober Dagens program

Løsninger til kapitel 7

Uge 40 I Teoretisk Statistik, 30. september 2003

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

13. februar Resumé: En statistisk analyse resulterer ofte i : Et estimat ˆ θ med en tilhørende se( ˆ θ )

Statistiske test. Efteråret 2010 Jens Friis, AAU. Hjemmeside :

Økonometri: Lektion 2 Multipel Lineær Regression 1/27

Stikprøvefordelinger og konfidensintervaller

Økonometri 1. Oversigt. Mere om dataproblemer Gentagne tværsnit og panel data I

Generelle lineære modeller

30. august Epidemiologi og biostatistik. Forelæsning 3 Uge 2, torsdag d. 8. september 2005 Michael Væth, Afdeling for Biostatistik.

vejer (med fortegn). Det vil vi illustrere visuelt og geometrisk for (2 2)-matricer og (3 3)-matricer i enote 6.

Indholdsfortegnelse Generelt Diskrete stokastiske variable: Kontinuerte stokastiske variable: Regneregler for stokastiske variable

Sætning: Middelværdi og varians for linearkombinationer. Lad X 1,X 2,...,X n være stokastiske variable. Da gælder. Var ( a 0 + a 1 X a n X n

Estimation ved momentmetoden. Estimation af middelværdiparameter

Simpel Lineær Regression: Model

Velkommen. Program. Statistik og Sandsynlighedsregning 2 Sandsynlighedstætheder og kontinuerte fordelinger på R. Praktiske ting og sager

29. januar Epidemiologi og biostatistik Forelæsning 2 Uge 1, torsdag 2. februar 2006 Michael Væth, Afdeling for Biostatistik.

Gamle eksamensopgaver. Diskret Matematik med Anvendelser (DM72) & Diskrete Strukturer(DM504)

Vejledende besvarelser til opgaver i kapitel 15

Statistik Lektion 7. Hypotesetest og kritiske værdier Type I og Type II fejl Styrken af en test Sammenligning af to populationer

Økonometri: Lektion 2 Multipel Lineær Regression 1/33

Økonometri 1. Inferens i den lineære regressionsmodel 2. oktober Økonometri 1: F8 1

Økonometri 1. Prediktion. Dummyvariabler 9. oktober Økonometri 1: F9 1

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

1 Punkt- og intervalestimation Punktestimatorer: Centralitet(bias) og efficiens... 2

antal gange krone sker i første n kast = n

DATV: Introduktion til optimering og operationsanalyse, Bin Packing Problemet

Kvantitative metoder 2

Asymptotisk optimalitet af MLE

Projekt 9.1 Regneregler for stokastiske variable middelværdi, varians og spredning

Elementær Matematik. Polynomier

Konfidens intervaller

Sammenligning af to grupper

Renteformlen. Erik Vestergaard

Supplerende noter II til MM04

! Husk at udfylde spørgeskema 3. ! Lineær sandsynlighedsmodel. ! Eksempel. ! Mere om evaluering og selvselektion

Introduktion til uligheder

Introduktion til uligheder

Statistik 8. gang 1 KONFIDENSINTERVALLER. Konfidensintervaller: kapitel 11. Valg og test af fordelingsfunktion

Kapitel 10 KALIBRERING AF STRØMNINGSMODEL

Du skal redegøre for løsning af ligninger og herunder behandle omformningsreglerne for ligninger.

Mikroøkonomi, matematik og statistik Eksamenshjemmeopgave december 2007

Projekt 4.8 De reelle tal og 1. hovedsætning om kontinuerte funktioner

Program. Ensidet variansanalyse Normalfordelingen. Antibiotika og nedbrydning af organisk materiale. Tegninger

Supplement til Kreyszig

Økonometri 1. Gentagne tværsnit (W ): Opsamling. Gentagne tværsnit og paneldata. Gentagne Tværsnit og Paneldata II.

Kvantitative metoder 2

9. Binomialfordelingen

Kvantitative metoder 2

Matematisk Modellering 1 Hjælpeark

Matematik A. Studentereksamen. Forberedelsesmateriale. Forsøg med digitale eksamensopgaver med adgang til internettet.

Økonometri 1. Inferens i den lineære regressionsmodel 25. september Økonometri 1: F6 1

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Giv eksempler på hvordan forskellige ligningstyper (lineære, eksponentielle eller potens) løses.

Giv eksempler på hvordan forskellige ligningstyper (lineære, eksponentielle eller potens) løses.

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i.

Formelsamling til statistik-del af metodekursus, 4. semester, lægevidenskab Version 3 (26/9-2011)

Kvantitative metoder 2

Økonometri Lektion 1 Simpel Lineær Regression 1/31

Diskrete og kontinuerte stokastiske variable

Meningsmålinger KLADDE. Thomas Heide-Jørgensen, Rosborg Gymnasium & HF, 2017

Claus Munk. kap. 1-3

Dagens forelæsning. Claus Munk. kap Obligationer Grundlæggende Intro. Obligationer Grundlæggende Intro. Obligationer Grundlæggende Intro

Simpel Lineær Regression

Undersøgelse af numeriske modeller

Analyse 1, Prøve maj 2009

STATISTIKNOTER Simple normalfordelingsmodeller

Økonometri 1. Instrumentvariabelestimation 26. november Plan for IV gennemgang. Exogenitetsantagelsen. Exogenitetsantagelsen for OLS

Referat : af Gruppearbejde Økonometri1 øvelsestime ugeseddel 7 dato 26/3 2003, Hold 4

Eksempel 10.1 En autoregressiv proces af orden 1 (ofte blot kaldet en AR(1)- proces) pårhar et opdateringsskema (10.1) med funktionen. for y R.

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

Transkript:

Dages program Økoometri De multiple regressiosmodel 5. februar 006 Emet for dee forelæsig er de multiple regressiosmodel (Wooldridge kap 3.-3.3+appedix E.-E.) Defiitio og motivatio Fortolkig af parametree i de multiple regressiosmodel Sammeligig af de simple og multiple regressiosmodel Regressio ude kostatled Middelrette OLS estimatorer For mage/for få variable regressiosmodel regressiosmodel Defiitio og motivatio Defiitio og motivatio De multiple regressiosmodel er e udvidelse af de simple regressiosmodel Defiitio: y = β0 + βx+ βx + + βkxk k forklarede variable: x,, x k Et kostatled k+ (ukedte) parametre: β0, β,..., βk u fejlled Atagelse E(u x,, x k )=0 regressiosmodel 3 Fordele ved de multiple regressiosmodel er: Ma ka eksplicit kotrollere for mage flere faktorer Det betyder, at disse faktorer ikke er ideholdt i u Det er forhåbetlig lettere at lave ceteris paribus fortolkiger Ma ka modellere mere geerelle fuktioelle former F.eks. modeller som y = β + β x+ β x 0 regressiosmodel 4

De multiple regressiosmodel på matrixform For observatioer ka vi opskrive y x x u β k 0 y x xk u β y =, X =, u = β = y x x u β k k y og u er e x matrix (vektor) X er e x(k+) matrix Parametere $ er e (k+)x matrix (vektor) Regressiosmodel på matrixform De multiple regressiosmodel ka skrives som: y = Xβ OLS estimatore ka udreges som i de simple regressiosmodel ved brug af momet metode Momet betigelse: E( X ' u ) = 0 regressiosmodel 5 regressiosmodel 6 Regressiosmodel på matrix form Fortolkig af OLS regressio OLS estimatore X ' uˆ = X '( y X ˆ β ) = 0 X ' y X ' X ˆ β = 0 ( X ' y) = ( X ' X) ˆ β Hvis (X X) er ivertibel (X har fuld rag) ka OLS estimatore udreges til ˆ β = ( X ' X) X ' y OLS estimatore ka også udledes ved at miimere uˆ i regressiosmodel 7 Fortolkig af OLS parametree Atag følgede model: y = β + β x + β x + + β x 0... k k De forudsagte værdi af y er givet ved yˆ = ˆ β0 + ˆ βx+ ˆ β ˆ x +... + βkxk Ædrigere i forudsagte værdi af y, = ˆ + ˆ + + ˆ yˆ β x β x... βk xk regressiosmodel 8

Fortolkig.. (fortsat) Eksempel: Timelø Fortolkige af estimatet for $ l : Ædrige i y år alle øvrige forklarede variable holdes kostate: y = ˆ β x ˆ l l De multiple regressiosmodel giver mulighed for at lave ceteris paribus fortolkiger, selvom data ikke er idsamlet så ekelte variable ka holdes kostate Vi beytter u data fra 994 i stedet for 980 Til dee aalyse af timelø itroduceres e y variabel: Arbejdsmarkedserfarig (baseret på ATP idbetaliger) målt i år Modelle som estimeres er givet ved: log( timelo) = β + β ( uddaelse) + β ( erfarig) 0 regressiosmodel 9 regressiosmodel 0 Fortolkig.. (fortsat) Fortolkig.. (fortsat) OLS estimatore er besværlig at opskrive (med midre ma aveder matrixforme) I tilfældet med to forklarede variable ka ma dog få et udtryk for OLS estimatere: Model y = β0 + βx+ βx ry i i ˆ Estimatet for $ ka skrives som β = ri Hvor r er residualere fra følgede OLS regressio x = δ + δ x + v 0 Residualere r ka altså fortolkes som de del af x som er ukorreleret med x r er effekte af x efter at have kotrolleret for x Estimatet af $ ka opås ved følgede procedure: Regresser x på x og udreg residualere r Regresser y på residualere r regressiosmodel regressiosmodel 3

OLS Residualer OLS residualer (fortsat) For OLS residualer fra de multiple regressiosmodel (med et kostatled) gælder følgede: Geemsittet af residualere er lig 0: ui ˆ = 0 = i Goodess of fit: Læs selv Dette er helt aalogt til de simple lieære regressiosmodel De empiriske kovarias mellem residualer og de forklarede variable er lig 0: ux ˆi ij 0 j,.., k = = = i Puktet ( yx,, x k ) er altid på på OLS regressiosliie regressiosmodel 3 regressiosmodel 4 Regressiosmodel ude kostatled Middelret OLS estimator Regressiosmodel ude kostatled estimeret med OLS y = βx+ βx +... + βkxk I dee model gælder: OLS residualere har ikke geemsit lig 0 R er re-defieret til og ka blive egativet SSR R = SSR= ( yi βxi βxi... βkxik) SST Hvis populatios modelle ideholder et kostatled, vil OLS estimatere af $, $ k være biased (ikke middelrette) Atagelser MLR (lieær i parametree): De afhægige variabel y ka beskrives ved følgede model: y = β + β x + β x + + β x 0.. k k MLR (tilfældig stikprøve): Vi har e tilfældig stikprøve (y i,x i,x i,.., x ik ),.., fra populatioe (se defiitio i appedix c.) regressiosmodel 5 regressiosmodel 6 4

Middelret..(fortsat) Middelret.. (fortsat) MLR 3 (ige perfekt multikolliaritet) I stikprøve (og i populatioe) ka ige af de forklarede variable skrives som e lieær fuktio af de øvrige De forklarede variable må godt være korreleret f.eks.: ka både x og x være forklarede variable Eksempler på perfekt multikolliaritet: log( ) β0 βlog( ) βlog( ) y = + x + x Alder og fødselsår (i tværsitsdata) Atallet af observatioer er lille (<k+) regressiosmodel 7 MLR 4 (betiget middelværdi af fejlled): Eu ( x, x,..., x ) = 0 k Grude til at MLR 4 ikke er opfyldt: Forkert fuktioel form (mere om dette i kap. 9) Udeladte variable, som er korreleret med e af de forklarede variable Målefejl i de forklarede variable (mere om dette i kap. 9) Hvis MLR 4 er opfyldt kaldes de forklarede variable for eksogee forklarede variable Hvis x j er korreleret med u kaldes x j for edoge forklarede variable regressiosmodel 8 Middelret.. (fortsat) For mage variable i modelle Teorem 3. Uder atagelse MLR -MLR 4 gælder: E( ˆ β ) = β j = 0,,.., k j Bevis laves som i appedix E. (tavlegeemgag) j Irrelevate variable i regressiosmodelle: Eksempel: De sade model (som opfylder MLR -MLR4) y = β0 + βx+ βx Regressiosmodelle som estimeres med OLS: yˆ = ˆ β + ˆ β x + ˆ β x + ˆ β x,..., i 0 i i 3 i3 Har det betydig for estimatere af β 0, β og β? Estimatere er stadig middelrette: E( ˆ β0) = β0, E( ˆ β) = β ˆ ˆ, E( β) = β, E( β3) = 0 Me iklusio af irrelevate variable påvirker variase af estimatere regressiosmodel 9 regressiosmodel 0 5

For få variable For få variable Udeladte relevate variable OLS estimatere er biased (ikke middelrette) Eksempel: De sade model (som opfylder MLR - 4) y = β + β x + β x 0 Regressiosmodelle som estimeres ved OLS yˆ ˆ ˆ i = β0 + βxi,..., Middelværdie af OLS estimatet ( xi x)( xi x) ˆ i E( β x, x) = β+ β = ( x x ) i regressiosmodel Bias β >0 β <0 Corr(x,x ) positiv Positiv bias Negativ bias Corr(x,x ) egativ Negativ Bias Positiv bias regressiosmodel 6