1 Modeller/diagrammer med dummy er Disse tre diagrammer ligger til grund for gruppearbejdet. a) Generel regressions model g = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 +..+ β n x n + u i, Hvor i =1,.n g b) Model med dummyvariabel x i g = β 0 + β 1 x 1 + β 2 x 2 + β 3 D i + u i, hvor i =1,.n β 3 indgår kun i modellen, når kriteriet får dummyen er opfyldt(dette ses i viewtable i sas ved et 1- tal). Det der sker når en dummy inkluderes er, at linjen parallelforskydes med β 3 i forhold til g den oprindelige regression(grafen), når D i =1 c) Model med dummy og interaktionsled g = β 0 + β 1 x 1 + β 2 x 2 + β 3 D i + β4(di*x i ) + u i, hvor i =1,.n Forskellen imellem denne model og den foregående er interaktionsleddet, som gør, at linjerne kan krydse hinanden. Linjerne har forskellig hældning g og forskellig skæring med g-aksen x i x i
2 Gruppearbejde Spørgsmål 1: Inkluderes der en dummyvariabel, for et geografisk område(i dette tilfælde Afrika syd for Sahara), vil det i regressionsmodellen medføre, at der kommer et ekstra led på. En dummyvariabel betyder man kategoriserer observationerne efter et bestemt kriterium. Opfyldes dette vil det ses ved et 1 tal i viewtable i sas, hvorimod hvis kriterierne ikke er opfyldt vil der stå et 0. I dette tilfælde er det lande som ligger i det geografiske område få et 1-tal og de andre lande et 0. For lande, der ligger i Afrika syd for Sahara indgår en ekstra parameter β 4, hvorimod de andre lande ikke vil få inkluderet dette led. Dette svarer altså ikke til udeladelse af observationer. Kun i tilfælde af 1 observation fra Afrika vil det medføre at landet udelades, da der mindst skal være 1 observation mere end antallet af parametre. Oprindelige model g = β 0 + β 1 lnyr 60 + β 2 s ki + β 3 s Hi + u i Ny model med dummyvariabel g = β 0 + β 1 lnyr 60 + β 2 s ki + β 3 s Hi + β 4 D i Afrika + u i Er der flere lande, der er inkluderet i dummyen vil det medføre at regressionen bliver parallelforskudt. Hvilket svarer til model b(forrige side) Spørgsmål 2 og 3: I spørgsmål 2 bliver det geografiske område udvidet til også at inkludere Latinamerika. Der laves en fælles dummy, alternativt kunne man lave 2 dummyer. Da udgangspunktet kan være forskelligt og da der også kan forekomme forskelle i hældningerne vil der også bliver inkluderet et interaktionsled(se graf c, forrige side). Model g = β 0 + β 1 lnyr 60 + β 2 s ki + β 3 s Hi + β 4 D Afrika,Latin i + β 5 xd Afrika, Latin +u i Hvis de Latinamerikanske lande og Afrikanske lande syd for Sahara har samme konvergenshastighed som de andre lande, vil dette ses i modellen ved at β 4 og β 5 helt kan udelades.
3 Bidrager disse variable derimod signifikant til modellen kan de ikke udelades, og dermed kan det ikke udelukkes, at konvergenshastigheden og konvergensniveauet afviger for disse lande. SAS-øvelser I spørgsmål a blev vi bedt om at splejse datasættene i PWT og Barrolee. De nye variable, der fremkommer i det nye datasæt er: Asia, Latinam., OECD og Safrica(alle dummier) og Revcoup. Alt i alt ser splejsningen fin ud. b) Inddragelse af Revcoup i modellen I SAS estimeres den nye model g=β 0 +β 1 logy i0 +β 2 (logs K,i -log(n i +0,075))+ β 3 (logs H,i -log(n+0,075))+ β 4 revcoup i +β 5 revcoup i (logs K,i - log(n i +0,075))+β 6 revcoup i ( logs H,i -log(n i +0,075))+u i For at teste, om politisk ustabilitet har indflydelse på forskelle i vækstraten, tester man om β 4, β 5 og β 6 kan udelades samtidig. H 0 : β 4 = β 5 = β 6 = 0 H 1 : β 4 ej 0, β 5 ej 0 eller β 6 ej 0 F = ((RSS R - RSS UR )/q)/(rss UR /n-k-1) n = 78, k=6, antal variable udover konstanten Så F testet har (3,71) frihedsgrader og værdien 0,59 med en signifikanssandsynligheden på 0,63(signifikans niveau på 5%). Hypotesen om, at politisk ustabilitet ikke har indflydelse på forskelle i vækstraten kan dermed ikke afvises. c) Der inkluderes to dummyvariable for hhv. Latinamerika og Sydafrika g=β 0 +β 1 logy i0 +β 2 (logs K,i -log(n i +0,075))+ β 3 (logs H,i -log(n+0,075))+ β 4 latinam i +β 5 safrica+u i Der opstilles et t-test for, om landegrupperne kan udelades hver for sig. H 0 : β 4 = 0 H 1 : β 4 ej 0 H 0 : β 5 = 0 H 1 : β 5 ej 0 T-værdierne for latinam og safrica er hhv.-3,24 og 2,55. Signifikanssandsynlighederne er 0,0018 og 0,0131, så hypoteserne om, at latinam og safrica kan udelades når de testes særskilt forkastes.
4 d) Hvis man skal undersøge, om latinam og safrica kan udelades samtidigt, opstiller man et F-test. H 0 : β 5 = β 6 = 0 H 1 : β 5 ej 0 eller β 6 ej 0 F-værdien er 6,17 med (2,72) frihedsgrader og signifikanssandsynligheden er 0,0034. Hypotesen om at latinam og safrica samlet set kan udelades forkastes. Vækstraterne i Latinamerikanske lande og lande syd for Sahara er forskellige i forhold til resten af verden. simulationsstudiet Det ses, at gennemsnittet af estimaterne er tæt på den sande værdi, som er 4, når a = 0. Dette betyder, at OLS-estimatoren er unbiased og konsistent, både når n er henholdsvis 100, 400 og 1600. Som det fremgår af tabellen bliver estimatet mere præcist, når n vokser. a = 0,25: Nu er β OLS ikke længere middelret, da estimationen på middelværdien bliver mindre præcis, desto større n. Der er tale om heteroskedasticitet. Regressionen er heller ikke konsistent. a = 25/n er middelret, idet gennemsnittet af estimaterne kommer tættere og tættere på den sande værdi når n stiger. Den er også konsistent. Tabel 1 gennemsnit a / n 100 400 1600 0 3,9981 3,9983 3,9995 0,25 4,2481 4,2483 4,2495 25 4,2481 4,0685 4,0152 n Variansen var(β OLS ) = middelret og konsistent. Dette skyldes at variansen ikke er påvirket af a i nogen af tilfældene
a / n 100 400 1600 5 0 0,00246 0,00062 0,00016 0,25 0,00246 0,00062 0,00016 25 0,00246 0,00062 0,00016 n Tabel 2 varians