Økonometri 1. Inferens i den lineære regressionsmodel 25. september 2006. Oversigt: De næste forelæsninger



Relaterede dokumenter
Økonometri 1. Inferens i den lineære regressionsmodel 25. september Økonometri 1: F6 1

Kvantitative metoder 2

Kvantitative metoder 2

Note om Monte Carlo eksperimenter

Forelæsning 8: Inferens for varianser (kap 9)

Note om Monte Carlo eksperimenter

Konfidensinterval for µ (σ kendt)

Modul 5: Test for én stikprøve

Kursus Introduktion til Statistik. Forelæsning 7: Kapitel 7 og 8: Statistik for to gennemsnit, ( , ) Per Bruun Brockhoff

Hypotese test. Repetition fra sidst Hypoteser Test af middelværdi Test af andel Test af varians Type 1 og type 2 fejl Signifikansniveau

Økonometri 1. Inferens i den lineære regressionsmodel 2. oktober Økonometri 1: F8 1

Økonometri 1. Interne evalueringer af forelæsninger. Kvalitative variabler. Dagens program. Dummyvariabler 21. oktober 2004

Program. 1. Repetition: konfidens-intervaller. 2. Hypotese test, type I og type II fejl, signifikansniveau, styrke, en- og to-sidede test.

Økonometri 1. Hvorfor simulationseksperimenter? Monte Carlo eksperimenter: Ideen. Inferens i den lineære regressionsmodel 28.

Forelæsning 6: Kapitel 7: Hypotesetest for gennemsnit (one-sample setup)

Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model

Kvantitative metoder 2

Modul 7: Eksempler. 7.1 Beskrivende dataanalyse Diagrammer. Bent Jørgensen. Forskningsenheden for Statistik ST501: Science Statistik

Kvantitative Metoder 1 - Forår Dagens program

Module 12: Mere om variansanalyse

Økonometri 1. Den simple regressionsmodel 11. september Økonometri 1: F2

Note til styrkefunktionen

En Introduktion til SAS. Kapitel 6.

! Husk at udfylde spørgeskema 3. ! Lineær sandsynlighedsmodel. ! Eksempel. ! Mere om evaluering og selvselektion

PhD-kursus i Basal Biostatistik, efterår 2006 Dag 2, onsdag den 13. september 2006

Økonometri 1. Dagens program. Den simple regressionsmodel 15. september 2006

Anvendt Statistik Lektion 4. Hypotesetest generelt Test for middelværdi Test for andele

Kvantitative Metoder 1 - Forår 2007

Hypotesetest. Altså vores formodning eller påstand om tingens tilstand. Alternativ hypotese (hvis vores påstand er forkert) H a : 0

Økonometri 1. Dagens program. Den multiple regressionsmodel 18. september 2006

Kvantitative metoder 2

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007

Vejledende besvarelser til opgaver i kapitel 14

Kvantitative Metoder 1 - Efterår Dagens program

Statistik vejledende læreplan og læringsmål, efteråret 2013 SmartLearning

Produkt og marked - matematiske og statistiske metoder

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Konfidensintervaller og Hypotesetest

02402 Løsning til testquiz02402f (Test VI)

Dagens Temaer. Test for lineær regression. Test for lineær regression - via proc glm. k normalfordelte obs. rækker i proc glm. p. 1/??

Økonometri 1. Dummyvariabler 13. oktober Økonometri 1: F10 1

Kursusindhold: Produkt og marked - matematiske og statistiske metoder. Monte Carlo

Note om Monte Carlo metoden

Tema. Dagens tema: Indfør centrale statistiske begreber.

Kvantitative Metoder 1 - Forår 2007

Uge 48 II Teoretisk Statistik 27. november Numerisk modelkontrol af diskrete fordelinger: intro

Økonometri 1. Inferens i den lineære regressionsmodel 29. september Økonometri 1: F7 1

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Basal statistik for sundhedsvidenskabelige forskere, forår 2015 Udleveret 3. marts, afleveres senest ved øvelserne i uge 13 (

Referat : af Gruppearbejde Økonometri1 øvelsestime ugeseddel 7 dato 26/3 2003, Hold 4

Privatansatte mænd bliver desuden noget hurtigere chef end kvinderne og forholdsvis flere ender i en chefstilling.

Kapitel 3 Centraltendens og spredning

Normalfordelingen. Statistik og Sandsynlighedsregning 2

Økonometri: Lektion 4. Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Sandsynlighedsregning

Forelæsning 5: Kapitel 7: Inferens for gennemsnit (One-sample setup)

SENIORKURSUS STATA OG BIOSTATISTIK

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Statistik og Sandsynlighedsregning 2

Ensidet eller tosidet alternativ. Hypoteser. tosidet alternativ. nul hypotese testes mod en alternativ hypotese

k UAFHÆNGIGE grupper F-test Oversigt 1 Intro eksempel 2 Model og hypotese 3 Beregning - variationsopspaltning og ANOVA tabellen

Faculty of Health Sciences. Logistisk regression: Interaktion Kvantitative responsvariable

Multipel Lineær Regression. Polynomiel regression Ikke-lineære modeller og transformation Multi-kolinearitet Auto-korrelation og Durbin-Watson test

Vi kalder nu antal prøverør blandt de 20, hvor der ikke ses vækst for X.

Program. t-test Hypoteser, teststørrelser og p-værdier. Hormonkonc.: statistisk model og konfidensinterval. Hormonkoncentration: data

Appendiks Økonometrisk teori... II

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i.

Anvendt Statistik Lektion 6. Kontingenstabeller χ 2 -test [ki-i-anden-test]

Maple 11 - Chi-i-anden test

Program. Modelkontrol og prædiktion. Multiple sammenligninger. Opgave 5.2: fosforkoncentration

a) Har måleresultaterne for de 2 laboranter samme varians? b) Tyder resultaterne på, at nogen af laboranterne måler med en systematisk fejl?

Økonometri 1. FunktioneI form i den lineære regressionsmodel 19. oktober Dagens program

Program. 1. Repetition 2. Fordeling af empirisk middelværdi og varians, t-fordeling, begreber vedr. estimation. 1/18

SAS-øvelse: Vi starter ud med model et hvor x=(kvotient, eksald, halvaar, kvinde, MatB,, Gif).

Wooldridge, kapitel 19: Carrying out an Empirical Project. Information og spørgsmål vedr. eksamen. Økonometri 1: Afslutningsforelæsning 2

Program. Simpel og multipel lineær regression. I tirsdags: model og estimation. I tirsdags: Prædikterede værdier og residualer

Forelæsning 9: Inferens for andele (kapitel 10)

Hvad skal vi lave? Nulhypotese - alternativ. Teststatistik. Signifikansniveau

! Variansen på OLS estimatoren. ! Multikollinaritet. ! Variansen i misspecificerede modeller. ! Estimat af variansen på fejlleddet

Økonometri 1. Lineær sandsynlighedsmodel. Hvad nu hvis den afhængige variabel er en kvalitativ variabel (med to kategorier)?

Økonometri 1. Prediktion. Dummyvariabler 9. oktober Økonometri 1: F9 1

Kvantitative Metoder 1 - Forår 2007

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

Funktionalligninger - løsningsstrategier og opgaver

Ensidet variansanalyse

Regneregler for middelværdier M(X+Y) = M X +M Y. Spredning varians og standardafvigelse. 1 n VAR(X) Y = a + bx VAR(Y) = VAR(a+bX) = b²var(x)

Program. Ensidet variansanalyse Sammenligning af grupper. Statistisk model og hypotese. Eksempel: Aldersfordeling i hjertestudie

Program: 1. Repetition: fordeling af observatorer X, S 2 og t. 2. Konfidens-intervaller, hypotese test, type I og type II fejl, styrke.

Module 2: Beskrivende Statistik

ØVELSER Statistik, Logistikøkonom Lektion 6: Hypotesetest 1

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

I dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt)

men nu er Z N((µ 1 µ 0 ) n/σ, 1)!! Forkaster hvis X 191 eller X 209 eller

Dagens program. Praktisk information:

Kursusindhold: X i : tilfældig værdi af ite eksperiment. Antag X i kun antager værdierne 1, 2,..., M.

Statistik II 4. Lektion. Logistisk regression

Adgangsgivende eksamen (udeladt kategori: Matematisk student med matematik på niveau A)

Transkript:

Oversigt: De næste forelæsninger Økonometri Inferens i den lineære regressionsmodel 5. september 006 Statistisk inferens: hvorledes man med udgangspunkt i en statistisk model kan drage konklusioner på grundlag af data, [ ] blandt andet punktestimation og intervalestimation af parametre samt metoder til afprøvning af statistiske hypoteser. (TSØ p. 38) Simulationseksperimenter (Note på hemmesiden) Ideen med at lave simulationseksperimenter Opbygning af en simulationsalgoritme Eksempel: Den forventede startløn for en økonom Eksempel (ugeseddel 3): Alternativ middelret estimator β Resultater om OLS med endeligt antal observationer (kap. 4): Normalitetsantagelse (MLR.6). Test af en enkelt lineær restriktion på koefficienter i lineær regressionsmodel. Asymptotiske resultater for OLS: n (kap. 5). Test af flere lineære restriktioner (kap. 4.5 og 5.). Økonometri : F6 Økonometri : F6

Hvorfor simulationseksperimenter? Monte Carlo eksperiment: Ideen Simulationseksperimenter kaldes også Monte Carlo eksperimenter. De introduceres i Økonometri for at illustrere vigtige statistiske begreber: Middelret estimation, varians, efficiens, Simulationseksperimenter er (stort set) ikke dækket af Wooldridge (men se Table C., p.77), så derfor benyttes en note (se hemmesiden). I noten analyserer vi fordelingen af OLS estimatoren og sammenligner med fordelingen af en alternativ estimator Simulationseksperimenter vil også optræde i øvelserne (ugeseddel 4, 5, 7, ). Kommer igen i Økonometri. Simulationer af datasæt fra en fuldt specificeret model: Datagenererende proces (DGP) Eksempel: yi = μ + σε i, ε i iidn... (0,) Vi kender de "sande parametre" μ og σ. Genererer et sæt af fx n=00 observationer fra modellen: y, y,..., y00 Glemmer at vi kender μ og σ : Anvend estimator ( regneregel ) til at skønne over μ ud fra et konkret (men kunstigt) sæt af observationer: Fx gennemsnittet: = n y yi n i = Økonometri : F6 3 Økonometri : F6 4

Monte Carlo eksperimenter: Ideen (fortsat) Monte Carlo eksperimenter: Ideen (fortsat) Kan vi på en nem måde vurdere, om y er en rimelig estimator for μ? Lav en uafhængig trækning af et nyt datasæt, der er genereret af den samme DGP. Lav mange uafhængige trækninger ( replikationer ): =,,..., M. Beregn værdien af estimatoren for hvert datasæt: y Se på fordelingen af estimaterne over replikationerne: Beregn fx fordelingens gennemsnit og varians. Parallel til tankeeksperimentet : Vores konkrete faktiske datasæt er blot ét blandt mange potentielle udfald. Formål med Monte Carlo eksperimenter: Efterprøve analytiske resultater: Fx at OLS er middelret under MLR.-4. Analysere konsekvenserne, hvis antagelserne ikke holder. Sammenligne forskellige estimatorer eller test, hvor det er besværligt/umuligt analytisk. Vurdere hvor mange observationer der skal til, for at man kan bruge asymptotiske resultater i praksis (kap. 5). Økonometri : F6 5 Økonometri : F6 6 3

Monte Carlo eksperimenter: Eksempel DJØFs hemmeside www.doef.dk: Veledende startløn for en privatansat, nyuddannet økonom er kr. 9.500 om måneden (pr. februar 005). Antag: Startlønninger er uafhængige og normalfordelte. Sand middelværdi i lønfordelingen er kr. 9.500. Sand lønfordeling har standardafvigelse på kr..500. Hermed er lønfordelingen fuldt specificeret. Simulere en situation, hvor der indhentes en tilfældig stikprøve af n=00 startlønninger. Monte Carlo eksperimenter: I praksis Trin : Konstruer et kunstigt datasæt: Opstil en model for den datagenererende proces: y i = μ + σεi, εi N(0,), μ=9,5, σ =,5. Generer et antal, fx n = 00, observationer af ε i fra en tilfældighedsgenerator og beregn fra modellen. Proc IML; antalobs = 00; mu = (antalobs,,9.5); seedvct = (antalobs,,) ; seedvct = 7*seedvct ; e = normal(seedvct) ; y = mu +.5 * e ; quit; y i Økonometri : F6 7 Økonometri : F6 8 4

Monte Carlo eksperimenter: I praksis (fortsat) Monte Carlo eksperimenter: I praksis (fortsat) Trin : Ex. sammenligne to estimatorer: Beregn estimaterne:. Find gennemsnit af alle observationer: m = 00 y i = i 00. Find gennemsnit af mindste og største observation: m = (min i=,...,00 y i + max i=,...,00 y i ) mest=sum(y)/antalobs; * estimatet m (gennemsnittet); mest=/*(min(y)+max(y)); * estimatet m (gns. min og max); Trin 3: Gentag trin og : M=0.000 replikationer: antalrep = 0000; * antal replikationer i simulationen; m = (antalrep,,.); * vektorer til at gemme estimaterne i; m = (antalrep,,.); do = to antalrep; * løkke over simulationer; * her beregnes estimater for hvert datasæt> * estimaterne gemmes for hver replikation ; m[,]=mest ; * m ; m[,]=mest ; * m ; end; Trin 4: Analysér fordelingerne af de to sæt estimater: Histogram Gennemsnit, varians, høere momenter Økonometri : F6 9 Økonometri : F6 0 5

Monte Carlo eksperimenter: Eksempel Monte Carlo eksperimenter: Eksempel (fortsat) Brug algoritmen til at analysere m og m som estimatorer for middelværdien i fordelingen af startlønninger. Simulere telefoninterviews med tilfældigt udvalgte, nyuddannede økonomer, som oplyser (?) deres startløn. SAS-programmet MC.sas udfører M=0.000 replikationer. Se på n=00, n=50 og n=0. Link til SAS Hemmeopgave : Brug SAS-programmet MC.sas til at køre et simulationseksperiment, hvor du har n=00, men sætter antallet af replikationer til M=5.000. Sammenlign og fortolk dine resultater. Middelværdi og varians af de to estimatorer baseret på M=0.000 simulationer m har lavest varians Varians aftager med n n=00 Middelværdi Varians n=50 Middelværdi Varians n=0 Middelværdi Varians 9,499 0,03 9,499 0,0443 9,498 0,09 m m 9,50 0,089 9,499 0,445 9,489 0,46 Økonometri : F6 Økonometri : F6 6

Eksempel: En alternativ middelret estimator i en simpel lineær regressionsmodel Model: y = β0 + β x+ u, opfylder MLR.-4 Alternativ estimator: y y β = x x Gennemsnit for de observationer, der svarer til de n /mindste og n / største værdier af x Ugeseddel 3: Vis at i β er middelret. Ugeseddel 5: Sammenlign V ( β) med V ( ˆ β) i et simulationseksperiment Monte Carlo eksperimenter: Afrunding Husk: Resultater og konklusioner fra Monte Carlo eksperimenter afhænger potentielt af de valgte parametre og fordelinger. I praktiske anvendelser må man i hvert enkelt tilfælde godtgøre, at den valgte model har relevans for den problemstilling, man ønsker at belyse. Økonometri : F6 3 Økonometri : F6 4 7

Hypotesetest i den lineære regressionsmodel: Endelige stikprøver (kap. 4) For hypotesetest behøver vi fordelingen af ˆβ. Introducere yderligere antagelse: Normalitet. MLR.6: u er uafhængig af x, x,..., xk og normalfordelt med middelværdi nul og varians σ. MLR.-6 definerer den klassiske lineære model (CLM). Restriktiv antagelse: Argument for: u opsamler alle de mange effekter der er udeladt af modellen: Central grænseværdisætning køres i stilling. Argumenter imod i konkrete problemstillinger: Begrænsede variabler (positive!), andre typer af fordelinger (log-normal, diskrete). Fordeling af OLS estimatoren: Endelig stikprøve Linearitet af ˆβ i u og CLM giver følgende resultat: Theorem 4.: Under CLM antagelserne og betinget på x, x,..., xk gælder at ˆ β ˆ N( β,var( β )) hvor ˆ σ Var( β ) = SST ( R ) Heraf følger: ( ˆ β β ) / standardafv.( ˆ β ) (0,) N Økonometri : F6 5 Økonometri : F6 6 8

Fordeling af OLS estimatoren: Endelig stikprøve (fortsat) Theorem 4. indeholder den ukendte parameter σ, derfor ikke umiddelbart operationel. Erstattes σ af σˆ kan man vise at der gælder følgende resultat: Theorem 4.: Under CLM antagelserne og betinget på x, x,..., xk gælder at ( ˆ β ˆ β ) / standardfel( β ) tn k hvor k+ er antal regressorer i modellen inkl. konstantled. t-fordelingen går mod N(0,) når antallet af frihedsgrader vokser (fin approximation hvis større end 0). Hypotesetest: Restriktion på en enkelt koefficient Betragt en nulhypotese om en regressionskoefficient: H 0 : β = a, hvor a er en konstant. Under nulhypotesen påstår vi altså en bestemt værdi af en parameter i den sande model. Analogt til at specificere en parameter i DGP en for et Monte Carlo eksperiment. Tænk på nulhypotesen som DGP en for et tankeeksperiment: Givet denne værdi af β kender vi fordelingen af ˆ β. Bruge afvigelsen mellem estimatet, ˆ β og den postulerede værdi, a, til at vurdere gyldigheden af nulhypotesen. Økonometri : F6 7 Økonometri : F6 8 9

Hypotesetest: Restriktion på en enkelt koefficient Hypotesetest: Restriktion på en enkelt koefficient t-testet for H 0 : β = a er givet ved ( ˆ β a) / standardfel( ˆ β ) og er fordelt som under nulhypotesen. Alternativhypotesen: Ensidede alternativer: H: β > a eller H: β < a Tosidet alternativ: H : β a Ex. Afkast af uddannelse: Hypotese om tn k Nulhypotese: β = 0 Relevant alternativ: β 0? β > 0? β Klassisk teststrategi: Vælg signifikansniveau: Sandsynlighed for at afvise nulhypotesen, givet at den er sand. Typisk vælges 5 %. Vælg alternativhypotese: Bestemmer den kritiske region, givet signifikansniveauet. Beregn teststatistik. Afvis nulhypotesen hvis testet er i den kritiske region. Afvis ellers ikke. Alternativ: Beregn p-værdi: Marginale signifikansniveau som netop ville betyde at nulhypotesen må afvises. Økonometri : F6 9 Økonometri : F6 0 0

Hypotesetest: Restriktion på en enkelt koefficient Hypotesetest: Eksempel: Lønrelationen Typiske eksempler: a=0: Standard signifikanstest. a= eller a=-: Test af homogenitet eller proportionalitet. Konfidensinterval: Givet signifikansniveau, α, fx 5 %. Så er 00- α % konfidensintervallet givet ved: [ ˆ β ˆ ˆ ˆ tn k ( α/ ) istandardfel( β ), β + tn k ( α/ ) istandardfel( β )] Konstrueres intervallet således vil det i 00- α % af udfaldene rumme den sande værdi. Nulhypoteser om værdier udenfor vil således blive afvist. Skitsér på tavlen. Eksempel: Lønrelationen. Afhængig variabel: log(timeløn) Regressor uddaar erfaring konstant Antal observationer R Model () 0,045 (0,0035) 4,3500 (0,040) 046 0,40 Kilde: Output fra SAS-programmet lon_udd.sas _ Model () 0,0485 (0,003) 0,039 (0,000) 4,05 (0,044) 046 0,75 Økonometri : F6 Økonometri : F6

NB er fra denne forelæsning Hvad bliver det næste? Monte Carlo eksperimenter som en måde at gøre det statistiske tankeeksperiment mere konkret. Resultater fra Monte Carlo eksperimenter afhænger potentielt af de valgte parametre for DGP en. Antal observationer i stikprøven (n) og antal replikationer (gentagelser) i eksperimentet (M). Eksplicit om ingredienser i klassisk teststrategi. Fredag: Mere om kapitel 4, starter på kapitel 5 om asymptotiske resultater. Hemmeopgave på ugeseddel 3: Den alternative estimator Ugeseddel 4: Simulationseksperiment. Økonometri : F6 3 Økonometri : F6 4