Økonometri, ugeseddel 8 Hold 1 1/4-2003

Relaterede dokumenter
Økonometri 1. Dagens program. Den simple regressionsmodel 15. september 2006

Økonometri 1. Dummyvariabler 13. oktober Økonometri 1: F10 1

Kvantitative metoder 2

Økonometri 1. Inferens i den lineære regressionsmodel 2. oktober Økonometri 1: F8 1

! Proxy variable. ! Målefejl. ! Manglende observationer. ! Dataudvælgelse. ! Ekstreme observationer. ! Eksempel: Lønrelation (på US data)

Referat : af Gruppearbejde Økonometri1 øvelsestime ugeseddel 7 dato 26/3 2003, Hold 4

Kvantitative metoder 2

Økonometri 1. Oversigt. Mere om dataproblemer Gentagne tværsnit og panel data I

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Økonometri: Lektion 6 Emne: Heteroskedasticitet

Kvantitative metoder 2

Kvantitative metoder 2

Anvendt Statistik Lektion 9. Variansanalyse (ANOVA)

Appendiks Økonometrisk teori... II

! Husk at udfylde spørgeskema 3. ! Lineær sandsynlighedsmodel. ! Eksempel. ! Mere om evaluering og selvselektion

Eksamen i Statistik for biokemikere. Blok

! Variansen på OLS estimatoren. ! Multikollinaritet. ! Variansen i misspecificerede modeller. ! Estimat af variansen på fejlleddet

Rettevejledning til Økonomisk Kandidateksamen 2005I, Økonometri 1

Økonometri: Lektion 2 Multipel Lineær Regression 1/27

Ugeseddel 8. Gruppearbejde:

Institut for Matematiske Fag Matematisk Modellering 1 UGESEDDEL 6

Rettevejledning til Økonomisk Kandidateksamen 2007II. Økonometri 1

Lagrange multiplier test. Økonometri: Lektion 6 Håndtering ad heteroskedasticitet. Konsekvenser af Heteroskedasticitet

Økonometri: Lektion 6 Emne: Heteroskedasticitet

Model. (m separate analyser). I vores eksempel er m = 2, n 1 = 13 (13 journalister) og

Rettevejledning til Økonomisk Kandidateksamen 2007II. Kvantitative Metoder 2: Tag-hjem eksamen

Simpel Lineær Regression: Model

Økonometri 1 Efterår 2006 Ugeseddel 11

Uge 43 I Teoretisk Statistik, 21. oktober Forudsigelser

Økonometri 1 Forår 2006 Ugeseddel 11

Hvis α vælges meget lavt, bliver β meget stor. Typisk vælges α = 0.01 eller 0.05

Økonometri 1. Inferens i den lineære regressionsmodel 25. september Økonometri 1: F6 1

Bilag S.1: Beskrivelse af beregningen af koefficienten på indvandrerbaggrund

Økonometri: Lektion 2 Multipel Lineær Regression 1/33

Trin 1: Formuler hypotese Spørgsmål der ønskes testet vha. data H 0 : Nul hypotese Formuleres som en ligheds hændelse

Kvantitative metoder 2

MLR antagelserne. Antagelse MLR.1:(Lineære parametre) Den statistiske model for populationen kan skrives som

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

Økonometri 1. Prediktion. Dummyvariabler 9. oktober Økonometri 1: F9 1

Økonometri 1. Interne evalueringer af forelæsninger. Kvalitative variabler. Dagens program. Dummyvariabler 21. oktober 2004

Statistik Lektion 4. Variansanalyse Modelkontrol

Fokus på Forsyning. Datagrundlag og metode

Tema. Dagens tema: Indfør centrale statistiske begreber.

Dagens Emner. Likelihood teori. Lineær regression (intro) p. 1/22

Dagens Emner. Likelihood-metoden. MLE - fortsat MLE. Likelihood teori. Lineær regression (intro) Vi har, at

Appendiks E. Lag-længde samt unit-root test Test for unit-roots - 1 -

Kvantitative metoder 2

Kvantitative metoder 2

Vejledende besvarelse af eksamen i Statistik for biokemikere, blok

Eksempel Multipel regressions model Den generelle model Estimation Multipel R-i-anden F-test for effekt af prædiktorer Test for vekselvirkning

Tænk på a og b som to n 1 matricer. a 1 a 2 a n. For hvert i = 1,..., n har vi y i = x i β + u i.

1. Intoduktion. Undervisningsnoter til Øvelse i Paneldata

Simpel Lineær Regression

Anvendt Statistik Lektion 8. Multipel Lineær Regression

Oversigt. 1 Gennemgående eksempel: Højde og vægt. 2 Korrelation. 3 Regressionsanalyse (kap 11) 4 Mindste kvadraters metode

Økonometri 1. FunktioneI form i den lineære regressionsmodel 19. oktober Dagens program

1 Hb SS Hb Sβ Hb SC = , (s = )

Kvantitative Metoder 1 - Forår 2007

Tema. Model og modelkontrol ( Fx. en normalfordelt obs. række m. kendt varians) Estimation af parametre. Fordeling. Hypotese og test. Teststørrelse.

Økonometri: Lektion 4. Multipel Lineær Regression: F -test, justeret R 2 og aymptotiske resultater

Forelæsning 11: Kapitel 11: Regressionsanalyse

Appendiks A. Lag-længde samt unit-root test Test for unit-roots - 1 -

Reminder: Hypotesetest for én parameter. Økonometri: Lektion 4. F -test Justeret R 2 Aymptotiske resultater. En god model

Multipel Lineær Regression

Uge 13 referat hold 4

Økonometri Lektion 1 Simpel Lineær Regression 1/31

Løsning eksamen d. 15. december 2008

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

Dansk Erhvervs gymnasieanalyse Sådan gør vi

Rettevejledning til eksamen i Kvantitative metoder 1, 2. årsprøve 2. januar 2007

Rettevejledning til Økonomisk Kandidateksamen 2004I, Økonometri 1

Økonometri 1. Den simple regressionsmodel 11. september Økonometri 1: F2

Økonometri 1. Dagens program: Afslutningsforelæsning 23. maj 2007

Normalfordelingen. Det centrale er gentagne målinger/observationer (en stikprøve), der kan beskrives ved den normale fordeling: 1 2πσ

Velkommen til kurset. Teoretisk Statistik. Lærer: Niels-Erik Jensen

1 Multipel lineær regression

1 Multipel lineær regression

Statistik Lektion 16 Multipel Lineær Regression

Økonometri 1. Kvalitative variabler. Kvalitative variabler. Dagens program. Kvalitative variable 8. marts 2006

Stikprøver og stikprøve fordelinger. Stikprøver Estimatorer og estimater Stikprøve fordelinger Egenskaber ved estimatorer Frihedsgrader

for drikkevandsselskaberne

I dag. Statistisk analyse af en enkelt stikprøve: LR test og t-test, modelkontrol, R Sandsynlighedsregning og Statistik (SaSt)

Multipel regression. Data fra opgave 3 side 453: Multipel regressionsmodel: Y = α + β 1 x 1 + β 2 x 2 + ǫ. hvor ǫ N(0, σ 2 ).

Dansk Erhvervs gymnasieeffekt - sådan gør vi

Wooldridge, kapitel 19: Carrying out an Empirical Project. Information og spørgsmål vedr. eksamen. Økonometri 1: Afslutningsforelæsning 2

Program: 1. Repetition: p-værdi 2. Simpel lineær regression. 1/19

NATURVIDENSKABELIG KANDIDATEKSAMEN VED KØBENHAVNS UNIVERSITET.

Økonometri 1. Målsætning for Økonometri 1. Dagens program: Afslutningsforelæsning 16. December 2005

To samhørende variable

Program. 1. ensidet variansanalyse. 2. forsøgsplanlægning: blocking. 1/12

Konfidensintervaller og Hypotesetest

for drikkevandsselskaberne

β = SDD xt SSD t σ 2 s 2 02 = SSD 02 f 02 i=1

Schweynoch, Se eventuelt

I dag. Statistisk analyse af en enkelt stikprøve med kendt varians Sandsynlighedsregning og Statistik (SaSt) Eksempel: kobbertråd

Stastistik og Databehandling på en TI-83

Out-of-sample forecast samt reestimation af ADAMs lønligning

Adgangsgivende eksamen (udeladt kategori: Matematisk student med matematik på niveau A)

Matematik A. Studentereksamen. Forberedelsesmateriale til de digitale eksamensopgaver med adgang til internettet

Økonomisk Kandidateksamen 2005I Økonometri 1. Virker u-landsbistanden?

Transkript:

1 Modeller/diagrammer med dummy er Disse tre diagrammer ligger til grund for gruppearbejdet. a) Generel regressions model g = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 +..+ β n x n + u i, Hvor i =1,.n g b) Model med dummyvariabel x i g = β 0 + β 1 x 1 + β 2 x 2 + β 3 D i + u i, hvor i =1,.n β 3 indgår kun i modellen, når kriteriet får dummyen er opfyldt(dette ses i viewtable i sas ved et 1- tal). Det der sker når en dummy inkluderes er, at linjen parallelforskydes med β 3 i forhold til g den oprindelige regression(grafen), når D i =1 c) Model med dummy og interaktionsled g = β 0 + β 1 x 1 + β 2 x 2 + β 3 D i + β4(di*x i ) + u i, hvor i =1,.n Forskellen imellem denne model og den foregående er interaktionsleddet, som gør, at linjerne kan krydse hinanden. Linjerne har forskellig hældning g og forskellig skæring med g-aksen x i x i

2 Gruppearbejde Spørgsmål 1: Inkluderes der en dummyvariabel, for et geografisk område(i dette tilfælde Afrika syd for Sahara), vil det i regressionsmodellen medføre, at der kommer et ekstra led på. En dummyvariabel betyder man kategoriserer observationerne efter et bestemt kriterium. Opfyldes dette vil det ses ved et 1 tal i viewtable i sas, hvorimod hvis kriterierne ikke er opfyldt vil der stå et 0. I dette tilfælde er det lande som ligger i det geografiske område få et 1-tal og de andre lande et 0. For lande, der ligger i Afrika syd for Sahara indgår en ekstra parameter β 4, hvorimod de andre lande ikke vil få inkluderet dette led. Dette svarer altså ikke til udeladelse af observationer. Kun i tilfælde af 1 observation fra Afrika vil det medføre at landet udelades, da der mindst skal være 1 observation mere end antallet af parametre. Oprindelige model g = β 0 + β 1 lnyr 60 + β 2 s ki + β 3 s Hi + u i Ny model med dummyvariabel g = β 0 + β 1 lnyr 60 + β 2 s ki + β 3 s Hi + β 4 D i Afrika + u i Er der flere lande, der er inkluderet i dummyen vil det medføre at regressionen bliver parallelforskudt. Hvilket svarer til model b(forrige side) Spørgsmål 2 og 3: I spørgsmål 2 bliver det geografiske område udvidet til også at inkludere Latinamerika. Der laves en fælles dummy, alternativt kunne man lave 2 dummyer. Da udgangspunktet kan være forskelligt og da der også kan forekomme forskelle i hældningerne vil der også bliver inkluderet et interaktionsled(se graf c, forrige side). Model g = β 0 + β 1 lnyr 60 + β 2 s ki + β 3 s Hi + β 4 D Afrika,Latin i + β 5 xd Afrika, Latin +u i Hvis de Latinamerikanske lande og Afrikanske lande syd for Sahara har samme konvergenshastighed som de andre lande, vil dette ses i modellen ved at β 4 og β 5 helt kan udelades.

3 Bidrager disse variable derimod signifikant til modellen kan de ikke udelades, og dermed kan det ikke udelukkes, at konvergenshastigheden og konvergensniveauet afviger for disse lande. SAS-øvelser I spørgsmål a blev vi bedt om at splejse datasættene i PWT og Barrolee. De nye variable, der fremkommer i det nye datasæt er: Asia, Latinam., OECD og Safrica(alle dummier) og Revcoup. Alt i alt ser splejsningen fin ud. b) Inddragelse af Revcoup i modellen I SAS estimeres den nye model g=β 0 +β 1 logy i0 +β 2 (logs K,i -log(n i +0,075))+ β 3 (logs H,i -log(n+0,075))+ β 4 revcoup i +β 5 revcoup i (logs K,i - log(n i +0,075))+β 6 revcoup i ( logs H,i -log(n i +0,075))+u i For at teste, om politisk ustabilitet har indflydelse på forskelle i vækstraten, tester man om β 4, β 5 og β 6 kan udelades samtidig. H 0 : β 4 = β 5 = β 6 = 0 H 1 : β 4 ej 0, β 5 ej 0 eller β 6 ej 0 F = ((RSS R - RSS UR )/q)/(rss UR /n-k-1) n = 78, k=6, antal variable udover konstanten Så F testet har (3,71) frihedsgrader og værdien 0,59 med en signifikanssandsynligheden på 0,63(signifikans niveau på 5%). Hypotesen om, at politisk ustabilitet ikke har indflydelse på forskelle i vækstraten kan dermed ikke afvises. c) Der inkluderes to dummyvariable for hhv. Latinamerika og Sydafrika g=β 0 +β 1 logy i0 +β 2 (logs K,i -log(n i +0,075))+ β 3 (logs H,i -log(n+0,075))+ β 4 latinam i +β 5 safrica+u i Der opstilles et t-test for, om landegrupperne kan udelades hver for sig. H 0 : β 4 = 0 H 1 : β 4 ej 0 H 0 : β 5 = 0 H 1 : β 5 ej 0 T-værdierne for latinam og safrica er hhv.-3,24 og 2,55. Signifikanssandsynlighederne er 0,0018 og 0,0131, så hypoteserne om, at latinam og safrica kan udelades når de testes særskilt forkastes.

4 d) Hvis man skal undersøge, om latinam og safrica kan udelades samtidigt, opstiller man et F-test. H 0 : β 5 = β 6 = 0 H 1 : β 5 ej 0 eller β 6 ej 0 F-værdien er 6,17 med (2,72) frihedsgrader og signifikanssandsynligheden er 0,0034. Hypotesen om at latinam og safrica samlet set kan udelades forkastes. Vækstraterne i Latinamerikanske lande og lande syd for Sahara er forskellige i forhold til resten af verden. simulationsstudiet Det ses, at gennemsnittet af estimaterne er tæt på den sande værdi, som er 4, når a = 0. Dette betyder, at OLS-estimatoren er unbiased og konsistent, både når n er henholdsvis 100, 400 og 1600. Som det fremgår af tabellen bliver estimatet mere præcist, når n vokser. a = 0,25: Nu er β OLS ikke længere middelret, da estimationen på middelværdien bliver mindre præcis, desto større n. Der er tale om heteroskedasticitet. Regressionen er heller ikke konsistent. a = 25/n er middelret, idet gennemsnittet af estimaterne kommer tættere og tættere på den sande værdi når n stiger. Den er også konsistent. Tabel 1 gennemsnit a / n 100 400 1600 0 3,9981 3,9983 3,9995 0,25 4,2481 4,2483 4,2495 25 4,2481 4,0685 4,0152 n Variansen var(β OLS ) = middelret og konsistent. Dette skyldes at variansen ikke er påvirket af a i nogen af tilfældene

a / n 100 400 1600 5 0 0,00246 0,00062 0,00016 0,25 0,00246 0,00062 0,00016 25 0,00246 0,00062 0,00016 n Tabel 2 varians