Kvantitative metoder 2

Relaterede dokumenter
! Proxy variable. ! Målefejl. ! Manglende observationer. ! Dataudvælgelse. ! Ekstreme observationer. ! Eksempel: Lønrelation (på US data)

Økonometri 1. Oversigt. Mere om dataproblemer Gentagne tværsnit og panel data I

Kvantitative metoder 2

Økonometri 1. Dagens program. Den simple regressionsmodel 15. september 2006

Kvantitative metoder 2

! Variansen på OLS estimatoren. ! Multikollinaritet. ! Variansen i misspecificerede modeller. ! Estimat af variansen på fejlleddet

Kvantitative metoder 2

Økonometri 1. Dagens program. Den multiple regressionsmodel 18. september 2006

Kvantitative metoder 2

Økonometri 1. Den simple regressionsmodel 11. september Økonometri 1: F2

Økonometri 1. Dummyvariabler 13. oktober Økonometri 1: F10 1

! Husk at udfylde spørgeskema 3. ! Lineær sandsynlighedsmodel. ! Eksempel. ! Mere om evaluering og selvselektion

Kvantitative Metoder 1 - Forår 2007

Økonometri: Lektion 2 Multipel Lineær Regression 1/27

Økonometri 1. Definition og motivation. Definition og motivation. Dagens program. Den multiple regressionsmodel 15. februar 2006

Økonometri 1. Inferens i den lineære regressionsmodel 2. oktober Økonometri 1: F8 1

Simpel Lineær Regression: Model

Undervisningsnoter til øvelse i Panel Modeller. %, it. E(x kjs

Økonometri 1. Dagens program: Afslutningsforelæsning 23. maj 2007

Økonometri: Lektion 2 Multipel Lineær Regression 1/33

Økonometri 1. Gentagne tværsnit (W ): Opsamling. Gentagne tværsnit og paneldata. Gentagne Tværsnit og Paneldata II.

W.2 Simpel lineær regression: Egenskaber ved OLS: Forudsagte værdier og residualer: Et residual:

Forelæsning 11: Kapitel 11: Regressionsanalyse

Wooldridge, kapitel 19: Carrying out an Empirical Project. Information og spørgsmål vedr. eksamen. Økonometri 1: Afslutningsforelæsning 2

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Økonometri 1. Målsætning for Økonometri 1. Dagens program: Afslutningsforelæsning 16. December 2005

Økonometri 1. FunktioneI form i den lineære regressionsmodel 19. oktober Dagens program

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

Økonometri 1. Prediktion. Dummyvariabler 9. oktober Økonometri 1: F9 1

Økonometri Lektion 1 Simpel Lineær Regression 1/31

Appendiks Økonometrisk teori... II

1. Intoduktion. Undervisningsnoter til Øvelse i Paneldata

Økonomisk Kandidateksamen 2006II Økonometri 1. Afkastet af uddannelse for britiske tvillingepar

Økonometri 1. Inferens i den lineære regressionsmodel 25. september Økonometri 1: F6 1

Rettevejledning til Kvantitative metoder 1, 2. årsprøve 18. juni timers prøve med hjælpemidler

Kvantitative metoder 2

Kvantitative metoder 2

Økonometri, ugeseddel 8 Hold 1 1/4-2003

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

Simpel Lineær Regression

Rettevejledning til Økonomisk Kandidateksamen 2007II. Økonometri 1

Statistik og Sandsynlighedsregning 2. IH kapitel 12. Overheads til forelæsninger, mandag 6. uge

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Tema. Dagens tema: Indfør centrale statistiske begreber.

Kvantitative metoder 2

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Normalfordelingen og Stikprøvefordelinger

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Teoretisk Statistik, 9 marts nb. Det forventes ikke, at alt materialet dækkes d. 9. marts.

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

Rettevejledning til Økonomisk Kandidateksamen 2007II. Kvantitative Metoder 2: Tag-hjem eksamen

Rettevejledning til Økonomisk Kandidateksamen 2005I, Økonometri 1

Analysestrategi. Lektion 7 slides kompileret 27. oktober :24 p.1/17

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

, i ' 1,...,N ; t ' 1,...,T, - i.i.d.(0,f 2, ), ) ' 0, E(, it. x kjs. œ i,t,s,j,k.

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i.

Økonometri 1 Efterår 2006 Ugeseddel 11

Kvantitative Metoder 1 - Efterår Dagens program

Økonometri: Lektion 6 Emne: Heteroskedasticitet

Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl

Rettevejledning til Økonomisk Kandidateksamen 2006II, Økonometri 1

Økonometri: Lektion 7 Emne: Prædiktionsintervaller, RESET teset, proxy variable og manglende data.

Referat : af Gruppearbejde Økonometri1 øvelsestime ugeseddel 7 dato 26/3 2003, Hold 4

Kvantitative Metoder 1 - Forår Dagens program

Landmålingens fejlteori - Lektion 2. Sandsynlighedsintervaller Estimation af µ Konfidensinterval for µ. Definition: Normalfordelingen

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Fokus på Forsyning. Datagrundlag og metode

Program. 1. Varianskomponent-modeller (Random Effects) 2. Transformation af data. 1/12

1 Ensidet variansanalyse(kvantitativt outcome) - sammenligning af flere grupper(kvalitativ

Økonometri 1 Forår 2006 Ugeseddel 11

Produkt og marked - matematiske og statistiske metoder

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Økonomisk Kandidateksamen 2004II Økonometri 1. Læsefærdigheder hos skoleelever i Danmark

Kvantitative Metoder 1 - Forår 2007

Rettevejledning til Økonomisk Kandidateksamen 2008II. Kvantitative Metoder 2: Tag-hjem eksamen

1 Hb SS Hb Sβ Hb SC = , (s = )

Oversigt. Kursus Introduktion til Statistik. Forelæsning 3: Kapitel 5: Kontinuerte fordelinger. Per Bruun Brockhoff.

Bilag 12 Regressionsanalysens tabeller og forklaringer

Uge 10 Teoretisk Statistik 1. marts 2004

De variable, som er inkluderet i de forskellige modeller, er følgende:

Velkommen til kurset. Teoretisk Statistik. Lærer: Niels-Erik Jensen

Rettevejledning til Økonomisk Kandidateksamen 2004I, Økonometri 1

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff

Forelæsning 3: Kapitel 5: Kontinuerte fordelinger

Statistik Lektion 4. Variansanalyse Modelkontrol

Landmålingens fejlteori - Repetition - Fordeling af slutfejl - Lektion 8

2 X 2 = Antal mygstik på enpersoniløbetaf1minut

Module 4: Ensidig variansanalyse

Lagrange multiplier test. Økonometri: Lektion 6 Håndtering ad heteroskedasticitet. Konsekvenser af Heteroskedasticitet

Vægte motiverende eksempel. Landmålingens fejlteori - Lektion4 - Vægte og Fordeling af slutfejl. Vægtet model. Vægtrelationen

grupper(kvalitativ exposure) Variation indenfor og mellem grupper F-test for ingen effekt AnovaTabel Beregning af p-værdi i F-fordelingen

Center for Statistik. Multipel regression med laggede responser som forklarende variable

Løsning eksamen d. 15. december 2008

Muligheder: NB: test for µ 1 = µ 2 i model med blocking ækvivalent med parret t-test! Ide: anskue β j som stikprøve fra normalfordeling.

Økonometri: Lektion 6 Emne: Heteroskedasticitet

Poul Thyregod, introslide.tex Specialkursus vid.stat. foraar Lad θ = θ(β) R k for β B R m med m k

Epidemiologi og biostatistik. Uge 3, torsdag. Erik Parner, Institut for Biostatistik. Regressionsanalyse

Transkript:

Kvantitative metoder 2 Specifikation og dataproblemer 2. maj 2007 KM2: F22 1

Program Specifikation og dataproblemer, fortsat (Wooldridge kap. 9): Betydning af målefejl Dataudvælgelse: Manglende observationer Endogen og eksogen dataudvælgelse Ekstreme og indflydelsesrige observationer Multiple choice: 4 spørgsmål (20 min.). KM2: F22 2

Målefejl Der må ofte antages at være målefejl i økonomiske data Mange grunde til at målefejl opstår: Spørgeskemaundersøgelser retrospektiv information Den præcise information, der svarer til det teoretiske begreb, findes ikke Tastefejl To hovedtilfælde: Målefejl i afhængig variabel Målefejl i en eller flere forklarende variabler KM2: F22 3

Målefejl i den afhængige variabel Antag følgende model y = β + β x + β x + + β x + u * 0 1 1 2 2 k k Modellen opfylder MLR.1-MLR.4 Desværre observerer man ikke y*. I stedet observeres y e 0 y = y* + e hvor kan opfattes som en målefejl For at kunne estimere modellen skal y* erstattes med y: y e = β + β x + β x + + β x + u 0 0 1 1 2 2 y = β0 + β1x1 + β2x2 + + βkxk + u+ e 0 0 k k KM2: F22 4

Målefejl i den afhængige variabel u+ e 0 Fejlleddet i den nye model: Hvornår giver OLS middelrette og konsistente estimater af β0, β1, β2,, βk? Under antagelserne Middelværdien af målefejlene er 0 Målefejlene er uafhængige af de forklarende variable vil den nye model med y opfylde MLR.1-MLR.4, og derfor er OLS middelret og konsistent. Hvis målefejlene ikke har middelværdi 0, men stadig er uafhængige af de forklarende variabler, vil OLS blot give et skævt estimat af β 0 KM2: F22 5

Målefejl i den afhængige variabel Variansen i det nye fejlled: Normalt antager man, at variansen af målefejlen er konstant. Så er antagelsen MLR.5 også opfyldt for den nye model. Hvis ikke giver det anledning til heteroskedasticitet Hvis målefejlene og u er ukorrelerede, er variansen Vu ( + e) = σ u + σ > σu 2 2 2 0 0 Variansen er større med målefejl -> større varians af parameterestimaterne. KM2: F22 6

Målefejl i den afhængige variabel Multiplikative målefejl y = y* a0 Målefejl som er proportionale med den afhængige variabel Hvis den afhængige variabel transformeres med log fås log( y) = log( y*) + log( a ) = log( y*) + e 0 0 KM2: F22 7

Målefejl i de forklarende variabler Antag følgende model: y = β + β x + u * 0 1 1 x* er uobserverbar. I stedet observeres x, som er givet ved x = x * + e 1 1 1 Antagelserne om målefejl: ( i) E( e ) = 0 1 ( ii) Cov( e, x ) = 0 1 1 x kan opfattes som en proxy for x* OLS er middelret og konsistent KM2: F22 8

Målefejl i de forklarende variabler At målefejlen er ukorreleret med det observerede x, er ofte en urealistisk antagelse Klassiske målefejl: Målefejlen er ukorreleret med den sande værdi af variablen. Antagelser: () i E( e1 ) = 0 ( ii) Cov( e, x *) = 0 1 1 Disse antagelser er ofte mere naturlige. Desværre giver de anledning til alvorlige problemer. KM2: F22 9

Målefejl i de forklarende variabler Egenskaber ved OLS estimatoren OLS ikke konsistent Tavlegennemgang I kapitel 15 ser vi på, hvordan man kan få konsistente estimater når der er målefejl KM2: F22 10

Data problemer Indtil videre har vi antaget, at MLR.2 altid er opfyldt Vi har antaget, at data stammer fra en tilfældig stikprøve Der er mange grunde til, at denne antagelse ikke er opfyldt i praksis: Manglende observationer: Tilfældigt eller ej? Ikke-tilfældig dataudvælgelse: Exogent eller endogent. KM2: F22 11

Manglende observationer Er manglende observationer for en eller flere variabler et problem? Manglende observationer vil reducere antallet af brugbare observationer i analysen Det afgørende for, om manglende observationer giver alvorlige problemer, er hvorfor observationerne mangler Hvis observationerne mangler tilfældigt, er det et mindre problem -> mindre præcise estimater KM2: F22 12

Ikke-tilfældig dataudvælgelse Der er forskellige måder hvorpå stikprøven kan være ikke-tilfældig (dvs. antagelse MLR.2 ikke er opfyldt): Eksogen dataudvælgelse Endogen dataudvælgelse Stratificeret dataudvælgelse Det er ikke alle typer af ikke-tilfældig dataudvælgelse, som giver anledning til skæve eller inkonsistente OLS estimater KM2: F22 13

Ikke-tilfældig dataudvælgelse Eksogen dataudvælgelse: Dataudvælgelse baseret på værdien af en af de forklarende variabler Denne type af dataudvælgelse vil (under forudsætninger af nok variation i de forklarende variabler) stadig give middelrette og konsistente OLS etimater Generelt: Dataudvælgelse baseret på variabler, som er uafhængige af fejlleddet giver stadig, at OLS estimaterne er middelrette og konsistente KM2: F22 14

Ikke-tilfældig dataudvælgelse Endogen dataudvælgelse: Dataudvælgelse baseret på den afhængige variabel (eller variabler, der er korrelerede dermed) Eksempler Formue i model for investeringsstrategier blandt aktieinvestorer (kun baseret på folk med formue under 0,5 mill. kr.) Lønrelationen (kun baseret på folk som arbejder) OLS estimator er ikke middelret og ikke konsistent KM2: F22 15

Ikke-tilfældig dataudvælgelse Stratificeret dataudvælgelse: Populationen er delt i grupper (disjunkte grupper som udgør hele populationen) Nogle grupper er udvalgt mere hyppigt end andre, sammenlignet med deres andel af populationen OLS er middelret og konsistent, hvis gruppeopdelingen er baseret på eksogene variabler KM2: F22 16

Ekstreme observationer Ekstreme observationer er observationer, som har stor betydning på værdien af OLS estimaterne En ekstrem observation kan få stor betydning på OLS estimaterne, da OLS bestemmes ved at minimere de kvadrerede residualer Hvorfor er der ekstreme observationer: Fejl i data: Kommafejl (tal i 1000 er i stedet for millioner) Enkelte enheder i populationen er meget forskellige fra resten: AP Møller Mærsk i en tilfældig stikprøve af danske virksomheder. KM2: F22 17

Ekstreme observationer Hvad gør man ved ekstreme observationer: Hvis man er sikker på, at de skyldes fejl i data: Ekstreme observationer udelades Hvis det ikke er en oplagt fejl, er der ingen nemme løsninger: Estimér modellen med og uden de ekstreme observationer og sammenlign resultaterne: Robusthedsanalyse Der findes estimatorer, som i sig selv er mere robuste overfor ekstreme observationer end OLS KM2: F22 18

NB er Målefejl i den afhængige variabel giver oftest anledning til mindre præcis estimation, men berører sædvanligvis ikke konsistensen af OLS estimation. Klassiske målefejl: Mest rimelige antagelse i mange tilfælde. Desværre giver dette tilfælde anledning til alvorlige problemer (inkonsistente OLS estimater). Dataudvælgelse der er baseret på information, der er relateret til den afhængige variabel, giver ofte anledning til bias. KM2: F22 19

Næste gang Næste forelæsning er mandag den 7. maj Nyt emne: Gentagne tværsnit og paneldata: Kapitel 13 i Wooldridge. KM2: F22 20