Økonometri 1. Inferens i den lineære regressionsmodel 25. september Økonometri 1: F6 1

Relaterede dokumenter
Kvantitative metoder 2

Kvantitative metoder 2

Økonometri 1. Inferens i den lineære regressionsmodel 25. september Oversigt: De næste forelæsninger

Note om Monte Carlo eksperimenter

Note om Monte Carlo eksperimenter

Økonometri 1. Inferens i den lineære regressionsmodel 2. oktober Økonometri 1: F8 1

Økonometri 1. Den simple regressionsmodel 11. september Økonometri 1: F2

Økonometri 1. Dagens program. Den simple regressionsmodel 15. september 2006

Kvantitative metoder 2

Økonometri 1. Dagens program. Den multiple regressionsmodel 18. september 2006

Kvantitative metoder 2

Økonometri 1. Dummyvariabler 13. oktober Økonometri 1: F10 1

Kvantitative Metoder 1 - Forår 2007

Økonometri 1. Prediktion. Dummyvariabler 9. oktober Økonometri 1: F9 1

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

! Variansen på OLS estimatoren. ! Multikollinaritet. ! Variansen i misspecificerede modeller. ! Estimat af variansen på fejlleddet

Vejledende besvarelser til opgaver i kapitel 14

Økonometri 1. FunktioneI form i den lineære regressionsmodel 19. oktober Dagens program

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Produkt og marked - matematiske og statistiske metoder

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

Økonometri 1. Oversigt. Mere om dataproblemer Gentagne tværsnit og panel data I

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Kursus Introduktion til Statistik. Forelæsning 13: Summary. Per Bruun Brockhoff

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

Økonometri 1. Inferens i den lineære regressionsmodel 29. september Økonometri 1: F7 1

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Note om Monte Carlo metoden

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

Tema. Dagens tema: Indfør centrale statistiske begreber.

Module 4: Ensidig variansanalyse

Hvad er danskernes gennemsnitshøjde? N = 10. X 1 = 169 cm. X 2 = 183 cm. X 3 = 171 cm. X 4 = 113 cm. X 5 = 174 cm

Kvantitative Metoder 1 - Efterår Dagens program

Kvantitative metoder 2

Økonometri 1. Kvalitative variabler. Kvalitative variabler. Dagens program. Kvalitative variable 8. marts 2006

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Forelæsning 11: Kapitel 11: Regressionsanalyse

Program. Konfidensinterval og hypotesetest, del 2 en enkelt normalfordelt stikprøve I SAS. Øvelse: effekt af diæter

t-fordeling Boxplot af stikprøve (n=20) fra t(2)-fordeling Program ( ): 1. repetition: fordeling af observatorer X, S 2 og t.

Referat : af Gruppearbejde Økonometri1 øvelsestime ugeseddel 7 dato 26/3 2003, Hold 4

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i.

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Anvendt Statistik Lektion 5. Sammenligning af to grupper * Sammenligning af middelværdier * Sammenligning af andele

Oversigt over emner. Punktestimatorer: Centralitet(bias) og efficiens

! Proxy variable. ! Målefejl. ! Manglende observationer. ! Dataudvælgelse. ! Ekstreme observationer. ! Eksempel: Lønrelation (på US data)

Løsning eksamen d. 15. december 2008

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Wooldridge, kapitel 19: Carrying out an Empirical Project. Information og spørgsmål vedr. eksamen. Økonometri 1: Afslutningsforelæsning 2

Praktiske ting og sager: Forelæsninger tirsdag og torsdag kl i Kirkesalen, Studiestræde 38 Øvelser

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

1 Statistisk inferens: Hypotese og test Nulhypotese - alternativ Teststatistik P-værdi Signifikansniveau...

Konfidensintervaller og Hypotesetest

Eksamen i Statistik for biokemikere. Blok

Kvantitative metoder 2

Oversigt. Kursus Introduktion til Statistik. Forelæsning 9: Inferens for andele (kapitel 10) Per Bruun Brockhoff

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

Opgaver til kapitel 3

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning

Forelæsning 9: Inferens for andele (kapitel 10)

Dagens program. Praktisk information:

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Kursus Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, ( , ) Per Bruun Brockhoff

1 Regressionsproblemet 2

Agenda Sandsynlighedsregning. Regneregler (kap. 3-4) Fordelinger og genkendelse af fordelinger (kap. 3-5) Simultane, marginale og betingede

Økonometri: Lektion 4. Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater

Mindste kvadraters tilpasning Prædiktion og residualer Estimation af betinget standardafvigelse Test for uafhængighed Konfidensinterval for hældning

Statistik vejledende læreplan og læringsmål, foråret 2015 SmartLearning

1 Hb SS Hb Sβ Hb SC = , (s = )

I dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt)

Teoretisk Statistik, 9 marts nb. Det forventes ikke, at alt materialet dækkes d. 9. marts.

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Kvantitative metoder 2

Kvantitative Metoder 1 - Forår 2007

Dagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

Økonometri: Lektion 2 Multipel Lineær Regression 1/27

Kvantitative Metoder 1 - Forår Dagens program

Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model

Estimation og usikkerhed

Kvantitative metoder 2

Økonometri: Lektion 6 Emne: Heteroskedasticitet

Logistisk Regression. Repetition Fortolkning af odds Test i logistisk regression

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab. Estimation

Normalfordelingen og Stikprøvefordelinger

Økonometri 1. Dagens program: Afslutningsforelæsning 23. maj 2007

Rettevejledning til Økonomisk Kandidateksamen 2005I, Økonometri 1

Transkript:

Økonometri 1 Inferens i den lineære regressionsmodel 25. september 2006 Økonometri 1: F6 1

Oversigt: De næste forelæsninger Statistisk inferens: hvorledes man med udgangspunkt i en statistisk model kan drage konklusioner på grundlag af data, [ ] blandt andet punktestimation og intervalestimation af parametre samt metoder til afprøvning af statistiske hypoteser. (TSØ p. 238) Simulationseksperimenter (Note på hjemmesiden) Ideen med at lave simulationseksperimenter Opbygning af en simulationsalgoritme Eksempel: Den forventede startløn for en økonom Eksempel (ugeseddel 3): Alternativ middelret estimator β Resultater om OLS med endeligt antal observationer (kap. 4): Normalitetsantagelse (MLR.6). Test af en enkelt lineær restriktion på koefficienter i lineær regressionsmodel. Asymptotiske resultater for OLS: n (kap. 5). Test af flere lineære restriktioner (kap. 4.5 og 5.2). Økonometri 1: F6 2

Hvorfor simulationseksperimenter? Simulationseksperimenter kaldes også Monte Carlo eksperimenter. De introduceres i Økonometri 1 for at illustrere vigtige statistiske begreber: Middelret estimation, varians, efficiens, Simulationseksperimenter er (stort set) ikke dækket af Wooldridge (men se Table C.1, p.771), så derfor benyttes en note (se hjemmesiden). I noten analyserer vi fordelingen af OLS estimatoren og sammenligner med fordelingen af en alternativ estimator Simulationseksperimenter vil også optræde i øvelserne (ugeseddel 4, 5, 7, 12). Kommer igen i Økonometri 2. Økonometri 1: F6 3

Monte Carlo eksperiment: Ideen Simulationer af datasæt fra en fuldt specificeret model: Datagenererende proces (DGP) Eksempel: y = μ + σε, ε iidn... (0,1) i i i Vi kender de "sande parametre" og. Genererer et sæt af fx n=100 observationer fra modellen: y, y,..., y μ 1 2 100 Glemmer at vi kender og : Anvend estimator ( regneregel ) til at skønne over μ ud fra et konkret (men kunstigt) sæt af observationer: Fx gennemsnittet: 1 n y = yi n i = 1 2 σ μ 2 σ Økonometri 1: F6 4

Monte Carlo eksperimenter: Ideen (fortsat) Kan vi på en nem måde vurdere, om y er en rimelig estimator for μ? Lav en uafhængig trækning af et nyt datasæt, der er genereret af den samme DGP. Lav mange uafhængige trækninger ( replikationer ): j = 1,2,..., M. j Beregn værdien af estimatoren for hvert datasæt: y Se på fordelingen af estimaterne over replikationerne: Beregn fx fordelingens gennemsnit og varians. Parallel til tankeeksperimentet : Vores konkrete faktiske datasæt er blot ét blandt mange potentielle udfald. Økonometri 1: F6 5

Monte Carlo eksperimenter: Ideen (fortsat) Formål med Monte Carlo eksperimenter: Efterprøve analytiske resultater: Fx at OLS er middelret under MLR.1-4. Analysere konsekvenserne, hvis antagelserne ikke holder. Sammenligne forskellige estimatorer eller test, hvor det er besværligt/umuligt analytisk. Vurdere hvor mange observationer der skal til, for at man kan bruge asymptotiske resultater i praksis (kap. 5). Økonometri 1: F6 6

Monte Carlo eksperimenter: Eksempel DJØFs hjemmeside www.djoef.dk: Vejledende startløn for en privatansat, nyuddannet økonom er kr. 29.500 om måneden (pr. februar 2005). Antag: Startlønninger er uafhængige og normalfordelte. Sand middelværdi i lønfordelingen er kr. 29.500. Sand lønfordeling har standardafvigelse på kr. 1.500. Hermed er lønfordelingen fuldt specificeret. Simulere en situation, hvor der indhentes en tilfældig stikprøve af n=100 startlønninger. Økonometri 1: F6 7

Monte Carlo eksperimenter: I praksis Trin 1: Konstruer et kunstigt datasæt: Opstil en model for den datagenererende proces: y i = μ + σεi, εi N(0,1), μ=29,5, σ = 1,5. Generer et antal, fx n = 100, observationer af ε i fra en tilfældighedsgenerator og beregn fra modellen. Proc IML; antalobs = 100; mu = j(antalobs,1,29.5); seedvct = j(antalobs,1,1) ; seedvct = 117*seedvct ; e = normal(seedvct) ; y = mu + 1.5 * e ; quit; y i Økonometri 1: F6 8

Monte Carlo eksperimenter: I praksis (fortsat) Trin 2: Ex. sammenligne to estimatorer: Beregn estimaterne: 1. Find gennemsnit af alle observationer: 1 m = 100 1 y i = 1 i 100 2. Find gennemsnit af mindste og største observation: 1 m2 = (min i= 1,...,100 y i + max i= 1,...,100 y i ) 2 m1est=sum(y)/antalobs; * estimatet m1 (gennemsnittet); m2est=1/2*(min(y)+max(y)); * estimatet m2 (gns. min og max); Økonometri 1: F6 9

Monte Carlo eksperimenter: I praksis (fortsat) Trin 3: Gentag trin 1 og 2: M=10.000 replikationer: antalrep = 10000; * antal replikationer i simulationen; m1 = j(antalrep,1,.); * vektorer til at gemme estimaterne i; m2 = j(antalrep,1,.); do j=1 to antalrep; * løkke over simulationer; * her beregnes estimater for hvert datasæt> * estimaterne gemmes for hver replikation ; m1[j,1]=m1est ; * m1 ; m2[j,1]=m2est ; * m2 ; end; Trin 4: Analysér fordelingerne af de to sæt estimater: Histogram Gennemsnit, varians, højere momenter Økonometri 1: F6 10

Monte Carlo eksperimenter: Eksempel Brug algoritmen til at analysere m1og m2 som estimatorer for middelværdien i fordelingen af startlønninger. Simulere telefoninterviews med tilfældigt udvalgte, nyuddannede økonomer, som oplyser (?) deres startløn. SAS-programmet MC.sas udfører M=10.000 replikationer. Se på n=100, n=50 og n=10. Link til SAS Hjemmeopgave : Brug SAS-programmet MC.sas til at køre et simulationseksperiment, hvor du har n=100, men sætter antallet af replikationer til M=5.000. Sammenlign og fortolk dine resultater. Økonometri 1: F6 11

Monte Carlo eksperimenter: Eksempel (fortsat) Middelværdi og varians af de to estimatorer baseret på M=10.000 simulationer har lavest varians m 1 Varians aftager med n n=100 Middelværdi Varians n=50 Middelværdi Varians n=10 Middelværdi Varians 29,499 0,0223 29,499 0,0443 29,498 0,2209 m m 1 2 29,502 0,2089 29,499 0,2445 29,489 0,4116 Økonometri 1: F6 12

Eksempel: En alternativ middelret estimator i en simpel lineær regressionsmodel Model: y = β0 + β1 x+ u, opfylder MLR.1-4 Alternativ estimator: y1 y2 β1 = x x 1 2 Gennemsnit for de observationer, der svarer til de n /2mindste og n /2 største værdier af x Ugeseddel 3: Vis at i β1 er middelret. Ugeseddel 5: Sammenlign V ( β1) med V ( ˆ β1) i et simulationseksperiment Økonometri 1: F6 13

Monte Carlo eksperimenter: Afrunding Husk: Resultater og konklusioner fra Monte Carlo eksperimenter afhænger potentielt af de valgte parametre og fordelinger. I praktiske anvendelser må man i hvert enkelt tilfælde godtgøre, at den valgte model har relevans for den problemstilling, man ønsker at belyse. Økonometri 1: F6 14

Hypotesetest i den lineære regressionsmodel: Endelige stikprøver (kap. 4) For hypotesetest behøver vi fordelingen af ˆβ. Introducere yderligere antagelse: Normalitet. MLR.6: u er uafhængig af x1, x2,..., xk og normalfordelt 2 med middelværdi nul og varians σ. MLR.1-6 definerer den klassiske lineære model (CLM). Restriktiv antagelse: Argument for: u opsamler alle de mange effekter der er udeladt af modellen: Central grænseværdisætning køres i stilling. Argumenter imod i konkrete problemstillinger: Begrænsede variabler (positive!), andre typer af fordelinger (log-normal, diskrete). Økonometri 1: F6 15

Fordeling af OLS estimatoren: Endelig stikprøve Linearitet af ˆβ i u og CLM giver følgende resultat: Theorem 4.1: Under CLM antagelserne og betinget på x1, x2,..., xk hvor Heraf følger: gælder at ˆ β N( β,var( ˆ β )) j j j Var( ˆ β ) = j 2 σ SST 2 j(1 R j) ( ˆ β β ) / standardafv.( ˆ β ) (0,1) j j j N Økonometri 1: F6 16

Fordeling af OLS estimatoren: Endelig stikprøve (fortsat) 2 Theorem 4.1 indeholder den ukendte parameter σ, derfor ikke umiddelbart operationel. 2 2 Erstattes σ af σˆ kan man vise at der gælder følgende resultat: Theorem 4.2: Under CLM antagelserne og betinget på x1, x2,..., xk gælder at ( ˆ β ˆ j β j) / standardfejl( β j) tn k 1 hvor k+1 er antal regressorer i modellen inkl. konstantled. t-fordelingen går mod N(0,1) når antallet af frihedsgrader vokser (fin approximation hvis større end 120). Økonometri 1: F6 17

Hypotesetest: Restriktion på en enkelt koefficient Betragt en nulhypotese om en regressionskoefficient: H 0 : β j = a, hvor a er en konstant. Under nulhypotesen påstår vi altså en bestemt værdi af en parameter i den sande model. Analogt til at specificere en parameter i DGP en for et Monte Carlo eksperiment. Tænk på nulhypotesen som DGP en for et tankeeksperiment: Givet denne værdi af β j kender vi fordelingen af ˆ β j. Bruge afvigelsen mellem estimatet, ˆ β j og den postulerede værdi, a, til at vurdere gyldigheden af nulhypotesen. Økonometri 1: F6 18

Hypotesetest: Restriktion på en enkelt koefficient t-testet for H : β = a er givet ved og er fordelt som under nulhypotesen. Alternativhypotesen: Ensidede alternativer: H1: β j > a eller H1: β j < Tosidet alternativ: H : β a Ex. Afkast af uddannelse: Hypotese om Nulhypotese: 0 j Relevant alternativ: ( ˆ β a) / standardfejl( ˆ β ) j β 1 = 0 tn k 1 1 j β 0? β > 0? 1 1 j β 1 a Økonometri 1: F6 19

Hypotesetest: Restriktion på en enkelt koefficient Klassisk teststrategi: Vælg signifikansniveau: Sandsynlighed for at afvise nulhypotesen, givet at den er sand. Typisk vælges 5 %. Vælg alternativhypotese: Bestemmer den kritiske region, givet signifikansniveauet. Beregn teststatistik. Afvis nulhypotesen hvis testet er i den kritiske region. Afvis ellers ikke. Alternativ: Beregn p-værdi: Marginale signifikansniveau som netop ville betyde at nulhypotesen må afvises. Økonometri 1: F6 20

Hypotesetest: Restriktion på en enkelt koefficient Typiske eksempler: a=0: Standard signifikanstest. a=1 eller a=-1: Test af homogenitet eller proportionalitet. Konfidensinterval: Givet signifikansniveau,, fx 5 %. Så er 100- α % konfidensintervallet givet ved: [ ˆ β t (1 α/ 2) istandardfejl( ˆ β ), ˆ β + t (1 α/ 2) istandardfejl( ˆ β )] j n k 1 j j n k 1 j Konstrueres intervallet således vil det i 100- % af udfaldene rumme den sande værdi. Nulhypoteser om værdier udenfor vil således blive afvist. Skitsér på tavlen. Eksempel: Lønrelationen. α α Økonometri 1: F6 21

Hypotesetest: Eksempel: Lønrelationen Afhængig variabel: log(timeløn) Regressor Model (1) Model (2) uddaar erfaring konstant Antal observationer 2 R 0,0452 (0,0035) _ 4,3500 (0,0420) 1046 0,140 0,0485 (0,0032) 0,0139 (0,0010) 4,1051 (0,0424) 1046 0,275 Kilde: Output fra SAS-programmet lon_udd2.sas Økonometri 1: F6 22

NB er fra denne forelæsning Monte Carlo eksperimenter som en måde at gøre det statistiske tankeeksperiment mere konkret. Resultater fra Monte Carlo eksperimenter afhænger potentielt af de valgte parametre for DGP en. Antal observationer i stikprøven (n) og antal replikationer (gentagelser) i eksperimentet (M). Eksplicit om ingredienser i klassisk teststrategi. Økonometri 1: F6 23

Hvad bliver det næste? Fredag: Mere om kapitel 4, starter på kapitel 5 om asymptotiske resultater. Hjemmeopgave på ugeseddel 3: Den alternative estimator Ugeseddel 4: Simulationseksperiment. Økonometri 1: F6 24