Rettevejledning til Økonomisk Kandidateksamen 2003II, Økonometri 1

Relaterede dokumenter
Økonometri 1. Definition og motivation. Definition og motivation. Dagens program. Den multiple regressionsmodel 15. februar 2006

Kvantitative metoder 2

Økonometri 1. Inferens i den lineære regressionsmodel 29. september Økonometri 1: F7 1

hvor i er observationsnummeret, som løber fra 1 til stikprøvestørrelsen n, X i

Motivation. En tegning

Test i to populationer. Hypotesetest for parrede observationer Test for ens varians Gensyn med flyskræk!

Praktisk info. Statistisk analyse af en enkelt stikprøve: kendt eller ukendt varians Sandsynlighedsregning og Statistik (SaSt) I tirsdags.

24. januar Epidemiologi og biostatistik. Forelæsning 1 Uge 1, tirsdag. Niels Trolle Andersen, Afdelingen for Biostatistik.

Generelle lineære modeller

Simpel Lineær Regression. Opsplitning af variationen Determinations koefficient Variansanalyse F-test Model-kontrol

Statistik Lektion 8. Parrede test Test for forskel i andele Test for ens varians Gensyn med flyskræk!

Vejledende besvarelser til opgaver i kapitel 15

29. januar Epidemiologi og biostatistik Forelæsning 2 Uge 1, torsdag 2. februar 2006 Michael Væth, Afdeling for Biostatistik.

9. Binomialfordelingen

Statistik Lektion 7. Hypotesetest og kritiske værdier Type I og Type II fejl Styrken af en test Sammenligning af to populationer

Mikroøkonomi, matematik og statistik Eksamenshjemmeopgave december 2007

1 Punkt- og intervalestimation Punktestimatorer: Centralitet(bias) og efficiens... 2

Definition: Normalfordelingen. siges at være normalfordelt med middelværdi µ og varians σ 2, hvor µ og σ er reelle tal og σ > 0.

Kvantitative metoder 2

vejer (med fortegn). Det vil vi illustrere visuelt og geometrisk for (2 2)-matricer og (3 3)-matricer i enote 6.

Spørgsmål 3 (5 %) Bestem sandsynligheden for at et tilfældigt valgt vindue har en fejl ved listerne, når man ved at der er fejl i glasset.

Dagens program. Estimation: Kapitel Eksempler på middelrette og/eller konsistente estimator (de sidste fra sidste forelæsning)

Løsninger til kapitel 7

antal gange krone sker i første n kast = n

13. februar Resumé: En statistisk analyse resulterer ofte i : Et estimat ˆ θ med en tilhørende se( ˆ θ )

Løsningsforslag til skriftlig eksamen i Kombinatorik, sandsynlighed og randomiserede algoritmer (DM528)

Meningsmålinger KLADDE. Thomas Heide-Jørgensen, Rosborg Gymnasium & HF, 2017

Elementær Matematik. Polynomier

Den flerdimensionale normalfordeling

Statistik 8. gang 1 KONFIDENSINTERVALLER. Konfidensintervaller: kapitel 11. Valg og test af fordelingsfunktion

Statistiske test. Efteråret 2010 Jens Friis, AAU. Hjemmeside :

Anvendt Statistik Lektion 3. Punkt- og intervalestimater Konfidensintervaller Valg af stikprøvestørrelse

Stikprøvefordelinger og konfidensintervaller

30. august Epidemiologi og biostatistik. Forelæsning 3 Uge 2, torsdag d. 8. september 2005 Michael Væth, Afdeling for Biostatistik.

Sammenligning af to grupper

Sandsynlighedsfordelinger for kontinuerte data på interval/ratioskala

Asymptotisk optimalitet af MLE

Estimation ved momentmetoden. Estimation af middelværdiparameter

Økonomisk Kandidateksamen 2003II Økonometri 1. Værdisætning af skov

Uge 40 I Teoretisk Statistik, 30. september 2003

Modul 14: Goodness-of-fit test og krydstabelanalyse

Introduktion til uligheder

Renteformlen. Erik Vestergaard

Introduktion til uligheder

Vejledende opgavebesvarelser

Uge 37 opgaver. Opgave 1. Svar : Starter med at definere sup (M) og inf (M) :

Formelskrivning i Word 2. Sådan kommer du i gang 4. Eksempel med skrivning af brøker 5. Brøker skrevet med småt 6. Hævet og sænket skrift 6

Sætning: Middelværdi og varians for linearkombinationer. Lad X 1,X 2,...,X n være stokastiske variable. Da gælder. Var ( a 0 + a 1 X a n X n

DATV: Introduktion til optimering og operationsanalyse, Bin Packing Problemet

Matematik A. Studentereksamen. Forberedelsesmateriale. Forsøg med digitale eksamensopgaver med adgang til internettet.

Statistik ved Bachelor-uddannelsen i folkesundhedsvidenskab

Kvantitative metoder 2

Undersøgelse af numeriske modeller

Lys og gitterligningen

Dagens forelæsning. Claus Munk. kap Obligationer Grundlæggende Intro. Obligationer Grundlæggende Intro. Obligationer Grundlæggende Intro

Claus Munk. kap. 1-3

STATISTIKNOTER Simple normalfordelingsmodeller

Rettevejledning til Økonomisk Kandidateksamen 2004I, Økonometri 1

Analyse 1, Prøve maj 2009

DATV: Introduktion til optimering og operationsanalyse, Følsomhed af Knapsack Problemet

Oversigt. Kursus 02402/02323 Introducerende Statistik. Forelæsning 12: Inferens for andele. Klaus K. Andersen og Per Bruun Brockhoff

Projekt 9.10 St. Petersborg paradokset

Kvantitative metoder 2

Projekt 4.8 De reelle tal og 1. hovedsætning om kontinuerte funktioner

Uddannelsesparathed. Vejledning om processerne ved vurdering af uddannelsesparathed (UPV) og ansøgning til ungdomsuddannelserne

Matematikkens mysterier - på et obligatorisk niveau. 7. Ligninger, polynomier og asymptoter

! Variansen på OLS estimatoren. ! Multikollinaritet. ! Variansen i misspecificerede modeller. ! Estimat af variansen på fejlleddet

! Proxy variable. ! Målefejl. ! Manglende observationer. ! Dataudvælgelse. ! Ekstreme observationer. ! Eksempel: Lønrelation (på US data)

Velkommen. Program. Statistik og Sandsynlighedsregning 2 Sandsynlighedstætheder og kontinuerte fordelinger på R. Praktiske ting og sager

Tankegangskompetence. Kapitel 9 Algebraiske strukturer i skolen 353

Økonometri 1. For mange variable i modellen. For få variable. Dagens program. Den multiple regressionsmodel 21. september 2004

Bekendtgørelse om takstændringer i offentlig servicetrafik i trafikselskaber og hos jernbanevirksomheder m.v. (takststigningsloftet)

Tests for forskel i central tendens for data på ordinal- og intervalskala. Typer af statistiske test:

StudyGuide til Matematik B.

Branchevejledning. ulykker indenfor. lager. området. Branchearbejdsmiljørådet for transport og engros

Kvantitative metoder 2

Konfidens intervaller

Maja Tarp AARHUS UNIVERSITET

Indholdsfortegnelse Generelt Diskrete stokastiske variable: Kontinuerte stokastiske variable: Regneregler for stokastiske variable

Teoretisk Statistik, 9. februar Beskrivende statistik

Yngre Lægers medlemsundersøgelse om det lægelige arbejdsmarked, 2016

Eksempel 10.1 En autoregressiv proces af orden 1 (ofte blot kaldet en AR(1)- proces) pårhar et opdateringsskema (10.1) med funktionen. for y R.

Matematik A. Højere handelseksamen. Tirsdag den 26. maj 2015 kl hhx151-mat/a

Branchevejledning. ulykker indenfor. godschauffør. området. Branchearbejdsmiljørådet for transport og engros

Program. Ensidet variansanalyse Normalfordelingen. Antibiotika og nedbrydning af organisk materiale. Tegninger

Rettevejledning til Økonomisk Kandidateksamen 2005I, Økonometri 1

Kvantitative metoder 2

Kapitel 10 KALIBRERING AF STRØMNINGSMODEL

Sprednings problemer. David Pisinger

Noter om kombinatorik, Kirsten Rosenkilde, februar Kombinatorik

Du skal redegøre for løsning af ligninger og herunder behandle omformningsreglerne for ligninger.

og Fermats lille sætning

Beregning af prisindeks for ejendomssalg

FUNKTIONER del 1 Funktionsbegrebet Lineære funktioner Eksponentialfunktioner Logaritmefunktioner Rentesregning Indekstal

Økonometri: Lektion 6 Emne: Heteroskedasticitet

Økonometri 1. Oversigt. Mere om dataproblemer Gentagne tværsnit og panel data I

Projekt 1.3 Brydningsloven

Økonometri 1. Dummyvariabler 13. oktober Økonometri 1: F10 1

Sandsynlighedsteori 1.2 og 2 Uge 5.

Transkript:

Rettevejledig til Økoomisk Kadidateksame 003II, Økoometri Vurderigsgrudlaget er selve opgavebesvarelse og bilaget. Programmer og data som er afleveret på diskette/cd bedømmes som såda ikke, me er avedt fx til at opklare evetuelle følgefejl og ligede i besvarelse og til at checke at opgave er besvaret idividuelt. Ved bedømmelse er der taget udgagspukt i de vægtig af opgavere, der er aført i opgavetekste. I de samlede bedømmelse idgår desude e vurderig af, om besvarelse samlet set er kosistet og idefor de agive rammer formår at belyse de overordede problemstillig, der rejses i opgave. Hvor der udføres hypotesetest forvetes der redegjort for de opstillede hypoteser, de avedte teststatistik og fordelig samt sigifikasiveauet for testet (i rettevejledige beyttes 5% sigifikasiveau hvis ikke adet er ævt). Da opgave er besvaret ud fra idividualiserede datasæt er der ikke her agivet kokrete umeriske resultater. Disse ka fås ved at køre det vedlagte SAS program FACIT.sas med det relevate eksamesummer. Vi har ku agivet retige af de mere robuste koklusioer. I opgavetekste er det aført at besvarelse højest må fylde 5 sider og derudover 0 sider bilag. Overskrides omfaget af opgavebesvarelse, skal det vægtes egativt i de samlede bedømmelse. Opgave Spørgsmål a i) De studerede skal gøre rede for, at modelle er e lieær regressiosmodel (lieær i parametree), som bruges til at modellere salgsprise på parcelhuse ud fra e række karakteristika ved husee. Der ka evt. gives kommetarer vedr. hvilke type af forklarede variable, som idgår i modelle. ii) Modelle er e log lieær model (afhægig variabel og forklarede variable (med udtagelse af dummy-variablee) er trasformeret med logaritme). $ ka derfor fortolkes som e elasticitet mht. husets samlede areal, alt adet lige. 00*$ 6 ka fortolkes som de procetuelle ædrig af salgsprise et ekstra bad giver aledig til, alt adet lige. iii) $ >0 og $ 6 >0. Svaree bør begrudes. Spørgsmål b Data beskrives ved e tabel, som agiver geemsit, varias (eller stadardafvigelse) evt. mi og max. Kommetarer vedr. tabelle bør ideholde e kort diskussio af, om der er oplagte problemer med data (det er der ikke). Spørgsmål c I dette spørgsmål skal de studerede pege på, at de to parametre, som ka bruges til værdisætig af skov, er parametree til afstade til skov og udsigte til skov med e hevisig til husprismetode beskrevet i itroduktioe og bilag A. Fortolkige af parametere $ 0 er e

priselasticitet med hesy til afstade til skov. Hvis huse, alt adet lige, koster mere, hvis de ligger i ærhede af skov, vil ma forvete at parametere $ 0 er egativ. Parametere til udsigt gaget med 00 ka fortolkes som de procetuelle ædrig i prise for et hus med udsigt. Forteget forvetes at være positivt. Ma ka dog argumetere, at skov meget tæt på giver skygge, og herved er forteget egativt. Opgave Spørgsmål a I dette spørgsmål rapporteres OLS estimatere af model (). Der må ikke rapporteres stadardfejl eller kommeteres på evt. sigifikas af estimatere, da ma edu ikke har checket for gyldighede af OLS variase. OLS estimatere er middelrette og kosistete, da MLR - MLR 4 atages at være opfyldt. Da ma edu ikke ved, om atagelse MLR 5 er opfyldt, ka ma ikke slutte, at OLS estimatere er efficiete. Spørgsmål b De grafiske aalyse laves ved at plotte OLS residualere fra model () mod et udvalg af de forklarede variable. Alterativt ka de kvadrerede residualer plottes mod et udvalg af de forklarede variable. De grafiske aalyse tyder ikke på heteroskedasticitet. White s test ka udføres ved at lave følgede hjælperegressio: uˆ = τ ˆ ˆ 0 τy τy w, hvor û er OLS residualere fra model (), og ŷ er de predikterede værdi af log husprise fra model (). Testet for homoskedasticitet udføres ved at teste følgede hypotese H0 : τ = τ = 0(homoskedasticitet). Testet ka udføres som et F-test eller et LM test. Hvis testet udføres som et LM test ka teststørrelse bestemmes som R, hvor R stammer fra hjælperegressioe, og er atal observatioer. Teststørrelse er χ -fordelt med frihedsgrader. Hypotese ka ikke afvises, og herved ka vi ikke afvise, at fejlleddee er homoskedastiske. White s test ka alterativt udføres med alle forklarede variable, deres kvadrater og alle iteraktiosled. Beyttes dee versio af testet ka hypotese om homoskedasticitet forkastes i ogle tilfælde. Breush-Paga testet for om logaritme til husets samlede areal er de variasstyrede variabel udføres ved at lave følgede hjælperegressio uˆ = τ0 τlog( sareal) w. Nul-hyotese er her H0 : τ = 0(homoskedasticitet). Dee hypotese ka testes ved et t-test. Hypotese ka ikke afvises, hvilket ige medfører, at hypotese om homoskedasticitet ikke ka afvises. De studerede bør udover at komme frem til de rigtige koklusioer vedr. heteroskedasticitet også være i stad til præcist at formulere de hypotese, de tester. Desude bør det her bemærkes, at ma, år ma har homoskedastiske fejlled, ka avede stadardfejl fra OLS regressioe og at t- og F- test er pålidelige (hvilket ikke vil være tilfælde, hvis der er heteroskedasticitet).

Spørgsmål c I dee opgave har der beklageligvis idseget sig e fejl. Husee er hadlet i periode 985-000. Hvad ete de studerede vælger at opdele periode 985-993 og 994-000 eller udelader observatioere fra år 000 og opdeler i periodere 985-993 og 994-999 skal dette give fuldt poit. Variable d94 går ige i de seere opgaver, hvor der ka være e variat hvor dummye er defieret præcist som i opgavetekste og 000-observatioere er med. De vil også blive reget som korrekt. De studerede bliver bedt om at udføre et Chow test for om husprisrelatioe er de samme i periode 985-993 og i periode 994-999. Chow test ka udføres på to måder, og begge metoder skal, såfremt de er udført korrekt, give fuldt poit. Metode : Modelle formuleres på følgede måde: log pris = β j,0 β j, log( sareal) β j, log( grud) β j,3 log( alderkob) β j,4 extoilet β j,5xxtoilet β j,6 exbad β j,7 gasbeto β j,8 tegl β j,9 fladttag β j,0 log( distkm) β j,udsigt u, hvor j= for huse hadlet i periode 985-993 og j= for huse hadlet i periode 994-999. Hypotese ka formuleres som H0 : β,0 = β,0, β, = β,, β, = β, Teststørrelse bereges ved at udføre tre regressioer og otere RSS-størrelsere (summe af de kvadrerede residualer). Teststørrelse bereges som ( RSSF ( RSS RSS))/ F = ( RSS RSS) /( *) Teststørrelse er F-fordelt F(,-4). Hypotese afvises, så der er teg på, at husprisrelatioe ædrer sig over tid. Metode : Chow testet ka også udføres ved at itroducere e dummy variabel for periode 994-999 (eller 994-000): d94. Dee variabel og alle iteraktiosled ikluderes i modelle: log pris = β0 βlog( sareal) βlog( grud) β3log( alderkob) β4extoilet β5xxtoilet β6exbad β7gasbeto β8tegl β9 fladttag β0 log( distkm) βudsigt βd94 β3(log( sareal)* d94) β4(log( grud)* d94) β5(log( alderkob)* d94) β6( extoilet * d94) β7 ( xxtoilet * d94) β8( exbad * d94) β9( gasbeto* d94) β0( tegl * d94) β( fladttag * d94) β(log( distkm)* d94) β3( udsigt * d94) u, Hypotese ka formuleres som H0 : β =... = β3 = 0. Testet ka udføres i SAS ved test-optioe TEST. Teststørrelse er F-fordelt med F(,-4). Hypotese afvises, så der er teg på, at husprisrelatioe ædrer sig over tid. Spørgsmål d Model () er e udvidelse af model (), idet ma her har tilladt, at iveauet for husprisere ka ædre sig fra periode 985-993 til periode 994-999. De studerede bør påpege, at dee model er mere restriktiv, ed e model hvor ma tillader, at alle parametree ka ædre sig mellem 3

de to perioder. Model () testes overfor de foretruke model fra spørgsmål.c, som bør være kosistet med koklusioe fra Chow testet, dvs. modelle, der er ævt uder Metode. Hypotese ka formuleres som H0 : β3 =... = β3 = 0. Teststørrelse for dee hypotese er F- fordelt F(,-4). Testsadsylighede ligger omkrig 5 procet, hvilket betyder, at ogle studerede vil afvise hypotese, mes adre ikke ka afvise hypotese. Spørgsmål e Dette spørgsmål drejer sig om at teste forskellige hypoteser om parametree i modelle. Alle test skal udføres i model (). I dee opgave bør de studerede opskrive hypotese, udføre testet samt drage de rigtige koklusioer på baggrud af testee. i) Hypotese er H0 : β4 = β5 = 0. Teststørrelse er F-fordelt med F(,-3). Hypotese afvises. ii) Hypotese er H0 : β4 = β5 (effekte af etop ét ekstra toilet = effekte af mere ed ét ekstra toilet). Testes med t- eller F-test, hhv. t(-3) og F (,-3)-fordelt. Hypotese ka ikke afvises. iii) Hypotese er H0 : β6 = 0 H: β6 > 0. Alterativhypotese skal formuleres således, at de er kosistet med opgave, spørgsmål a, iii). Teststørrelse er t-fordelt med -3 frihedsgrader. Testet skal udføres som et esidet test. Hypotese ka ikke afvises. iv) Hypotese er H0 : β = 0(ma ka her argumetere for både et dobbelt-sidet eller ekelt-sidet test). Teststørrelse er t-fordelt med -3 frihedsgrader. For ogle studerede ka hypotese afvises, mes for adre ka de ikke afvises. Spørgsmål f Hypotese H0 : δ = testes i model (3) som et dobbelt-sidet test. Teststørrelse er t-fordelt med - 0 frihedsgrader. Hypotese afvises. Hypotese agiver om elasticitete mht. til husets areal er lig, med adre ord om der er tale om e model for kvadratmeter-prise. Da dee hypotese afvises, og parameterestimatet er midre ed, betyder det, at prise per kvadratmeter falder, jo større husee er. Spørgsmål g De forvetede prisforskel på to es huse, som ligger hhv. 00 og 500 m fra skove, bereges på grudlag af model (3). For at løse dee opgave skal ma bruge følgede atagelse fra spørgsmålet, emlig at det tilsvarede hus ville koste, millio, hvis det lå 600 m fra skove. Det betyder, at E(log(. mio)) = δ δ log( sareal) δ log( grud) δ log( alderkob) δ xtoilet 0 3 4 δ gasbeto δ tegl δ fladttag δ log(0.6) δ d94 5 6 7 8 9 δ0 δlog( sareal) δlog( grud) δ3log( alderkob) δ4xtoilet δ5gasbeto δ 6 tegl δ 7 fladttag δ 9 d94 = log(. mio) δ log(0.6) 8 4

Heraf sluttes, at prise for det tilsvarede hus 500 m fra skove er E(log( pris500 )) = δ0 δ log( sareal) δ log( grud) δ3 log( alderkob) δ4xtoilet δ5gasbeto δ6tegl δ7 fladttag δ8log(0.5) δ9d94 = log(. mio) δ8log(0.6) δ8log(0.5) = log(. mio) δ (log(0.6) log(0.5) ) 8 Et estimat for prise for huset 500 m fra skove ka udreges ved at beytte e approksimatio pris ˆ 500 =. mio*exp( δ 8(log(0.6) log(0.5)). Tilsvarede ka prise for et hus 00 m fra skove udreges pris ˆ 00 =. mio*exp( δ 8(log(0.6) log(0.)). Prisforskelle er i størrelsesordee 70.000 kr. Dette tal ka sammeholdes med resultatere af e tilsvarede udersøgelse refereret i bilag A side 0. Resultatere fra Hasler mfl. (00) aslår, at prisforskelle er omkrig 60.000 kr. De skitserede løsig er approximativ, idet de bytter om på expoetialfuktio og forvetigsoperator i bestemmelse af de forvetede prisforskel og det forvetes heller ikke at besvarelse tager højde for dette. Spørgsmål h Dette spørgsmål hadler om værdisætig af Esbjerg Platage, og dette skal gøres ved at bruge husprismetode (Hedoisk værdisætig) beskrevet i bilag A, boks II.. For at kue besvare dette spørgsmål er de studerede ødt til selv at lave ogle atagelser udervejs. Derfor ka skøet godt variere e del. Det vigtige er her, at de studerede klart gør rede for deres atagelser. For at udrege de ekstra værdi husee har, er ma ødt til at kede deres præcise afstad til skove, hvilket ikke er opgjort i tabelle. Skøet ka laves ved at atage, at husee ligger i e afstad til skove svarede til midtpuktet i itervallet. Derefter udreges ekstraværdie af husee i afstad til skove på 50 m, 50 m, 50 m 350 m, 450 m og 550 m ved at beytte samme metode som i spørgsmål g. Ekstraprise for et hus i 50 m afstad til skove sammeliget med 600 m er pris50 pris ˆ 600 =. mio*exp( δ 8(log(0.6) log(0.05)).mio Dee prisforskel gages så med atallet af huse i det pågældede iterval. De samlede værdi af Esbjerg Platage skøes til ca. 30-40 mio. kr. I diskussioe af uder hvilke forudsætiger det er et rimeligt skø, ka mage forskellige forhold iddrages. Disse forhold kue være, at skøet udelukkede er baseret på husees ekstra værdi, me siger ikke oget om hvor mage der beytter skove. Værdie af skov ikluderer ikke grudværdie af skove, eller tømmerværdie af de træer der er i skove. Opgave 3 Spørgsmål a i) Modelle i ligig (4) estimeres med OLS og residualere gemmes. I de vejledede SAS besvarelse er der udersøgt for heteroskedasticitet ved grafisk aalyse. Der er også geemført et Breusch-Paga test med log til grudstørrelse som potetielt 5

variasstyrede variabel i form af et to-sidet t-test. Resultatet idikerer at ulhypotese om homoskedastiske fejlled må forkastes og at log til grudstørrelse er variasstyrede. ii) iii) Heteroskedasticitetskosistete (robuste) stadardfejl bereges, jf. forelæsigsote om robust variasestimatio. Et robuste estimat af kovariasmatrice for OLS estimatere er givet ved: ˆ Var( δ ) = ( X ' X ) S( X ' X ) S = uˆ ixixi ' i= hvor X beteger ( k ) matrice af k forklarede variabler plus kostatleddet, xi er vektore der består af de i te række af X, og uˆi er de kvadrerede residualer fra (4). De vejledede SAS besvarelse programmerer disse udtryk i IML. Ud fra de beregede stadardfejl bereges e robust t-statistik som ratioe mellem OLS estimatet ˆ δ 6 og de tilhørede robuste stadardfejl. Nulhypotese er H0 : δ 6 = 0 overfor et esidet egativt alterativ (jf. Opgave.a. iii), H : δ 6 < 0. Testet er asymptotisk stadard ormalfordelt uder ulhypotese, som forkastes. Det kokluderes, at afstade til skov har e sigifikat effekt på husprise, alt adet lige. Resultatet er robust hvad ete der korrigeres for heteroskedasticitet eller ej. Et test ude korrektio er imidlertid ikke fyldestgørede. Spørgsmål b i) Wooldridges afsit 9. er relevat her. Der skal redegøres for hvilke forudsætiger der skal være opfyldt for, at OLS avedt på (4) bliver kosistet, år de sade model er givet ved (5): a. Fejlleddet v atages at være ukorreleret med alle regressorere. Det er stadardatagelse for de lieære regressiosmodel (5). Desude atages v at være ukorreleret med de tre proxyvariabler, hvilket betyder at disse ku påvirker prise via deres rolle som kvalitetsidikatorer. b. Atag desude at der eksisterer e sammehæg mellem kvalitete og de tre proxyvariabler: q = λ0 λgasbeto λ fladttag λ3tegl w Fejlleddet w er udtryk for adre dimesioer af kvalitete ed dem, der svarer til de tre proxyvariabler, gasbeto, fladttag og tegl, og atages derfor ukorreleret med disse og med de øvrige forklarede variabler i (4). For at checke at det er tilstrækkelige betigelser idsættes udtrykket for q i (5): log pris = δ0 δlog sareal... δ6 log distkm δq ( λ0 λgasbeto λ fladttag λ3tegl w) og δal Allerod δhihillerod δes Esbjerg v ved at samle leddee: log pris = δ0 δλ q 0 δlog sareal... δ6log distkm δλ q gasbeto δλ q fladttag δλ q 3tegl fås δal Allerod δhi Hillerod δes Esbjerg δqw v (4) med yt kostatled δ 0 = δ 0 δ q λ og 0 δ = δλ 7 q, δ 8 = δλ q og δ9 = δλ q 3. OLS 6

estimerer kosistet parametree i (4) bortset fra kostatleddet, hvis det samlede fejlled u = δ w v er ukorreleret med regressorere, heruder de tre proxyvariabler, hvilket er q opfyldt uder atagelsere a. og b. ii) E diskussio af forudsætige om, at fejlleddet u og variable log distkm er asymptotisk ukorrelerede i model (4) bør ideholde følgede elemeter: a. Kvalitetsaspektet: I lyset af diskussioe uder i) betyder forudsætige, at korrektioe for bygigsmaterialer sikrer, at de tilbageværede dimesioer af uobserverbar kvalitet samt adre uobserverbare faktorer ikke er korrelerede med afstade mellem huset og skove. b. Realisme: Ka sagtes betvivles, me årsag skal explicit agives. Ma ka tæke sig e tedes til, at huse der opføres med de bedste beliggehed, bygges i de bedste kvalitet (ikl. uobserverbare kvalitetsdimesioer). Det vil betyde e egativ korrelatio mellem fejlleddet u og variable log distkm. iii) Wooldridges kapitel 5 er relevat her. Geerelt vil samtlige OLS estimatorere (heruder af koefficiete δ6 til log distkm) være ikosistete hvis forudsætige om at fejlleddet u og variable log distkm er asymptotisk korrelerede i model (4) (det følger af Theorem 5. og kommetarere omkrig MLR.3 ). Kosistete estimater vil kue opås, hvis der fides e istrumetvariabel z (evt. flere) som opfylder, at de ikke er korreleret med u (heruder de uobserverede kvalitetsdimesio), me omvedt er korreleret med log distkm. Der er ige oplagte kadidater til istrumeter i datasættet og begrudede forslag til istrumetvariabler ligger ud over, hvad der kræves for e fuldstædig besvarelse. Spørgsmål c i) Bemærk at dette er e ret mekaisk egeskab ved OLS estimatore og ikke kræver avedelse af forvetigsoperatore eller asymptotiske egeskaber. Brug defiitioe af OLS estimatore og de mekaiske egeskaber for OLS fra kapitel : ( yˆ y)( y y) ˆ γ ˆ ˆ = y = (model med kostatled) y = y y) y)( yˆ y uˆ) = y) per def. y = yˆ uˆ y) uˆ = ( yˆ y) y) uˆ = 0. Næver 0 iflg. SLR.4. = For kostatleddet følger direkte af (.7): ˆ γ0 = y ˆ γ ˆ ˆ y = 0, idet y = y og γ =. ii) E besvarelse ud fra de klassiske målefejlsmodel i afsit 9.3 eller direkte fra side 69 i Wooldridge er acceptabelt svar på dee del af opgave (om ed forudsætige om e tilfældig 7

stikprøve ku er approximativt opfyldt for û ). E mere striget udledig ka se ud som edefor. Uder alle omstædigheder skal de fuldstædige besvarelse gøre rede for, hvorledes oplysigere fra opgavetekste er avedt i løsige. ( y y )( y y) γ ˆ ˆ = y = y v = y v u ( y y ) v y v)( y y) = y = ( y v uˆ ) y v i model med kostatled = v y v) y v v)( yˆ y v v ( v v) uˆ) = Forlæge. led i tæller y v v) * *3 y v v) uˆ y v v)( v v) = y v v) y v v) * *-leddet: plim y v v) = plim y) plim ( v v) plim y)( v v) = βσ ˆ x σv plim β( x x)( v v) = βσ σ β Cov( xv, ) x v = βσ σ > 0 x v idet Cov( x, v) = 0, og adet lighedsteg bruger at p lim y) = p lim β ( x x) da y, x ligger på regressiosliie og ˆ β er kosistet. *-leddet: plim y v vu ) ˆ = plim ( v vu ) ˆ idet yu ) ˆ = 0 = plim ( v v)( y yˆ ) = plim ( v v)( β ˆ ˆ 0 β0 ( β β) x u) = plim ( ) ˆ ˆ v v u β0, β kosistete givet SLR.-4 = Covvu (, ) = 0 *3-leddet: plim y v v)( v v) = plim ( v v) Argumet som uder * = σ > 0 v 8

Samlet giver *, * og *3 idsat i udtrykket for γ : σ p lim γ = < v βσ x σv De asymptotiske bias er derfor egativ: p lim( γ) γ < 0, hvilket skulle vises. Opgave 4 Spørgsmålee i Opgave 4 har e temmelig åbe karakter og der er geerelt flere mulige metoder. Her er ævt ogle eksempler og de vejledede SAS besvarelse implemeterer ogle af disse. De elemeter, der krævet for e fuldstædig og korrekt løsig, er også agivet. Spørgsmål a Der skal tages udgagspukt i modelle i ligig (4) for alle fire områder. For at udersøge om effekte af afstad til skov er es i de fire områder skal modelle udvides med iteraktioseffekter mellem de tre områdedummier og log distkm: log pris = δ 0 δlog sareal... δ9tegl δal Allerod δhi Hillerod δes Esbjerg δ Allerod *log distkm δ Hillerod *log distkm δ Esbjerg * log distkm u Alkm Hikm Eskm Der skal udføres et samlet test af hypotese: H : 0 0 δeskm = δalkm = δhikm = overfor alterativet, at midst e af disse er forskellig fra ul. Idividuelle t-test på koefficietere er ikke tilstrækkelige, heller ikke ud fra robuste stadardfejl. Der skal tages stillig til, om regressioe lider af heteroskedasticitet og hvorda ma i givet fald tager højde for dette i udførelse af hypotesetestet. Ku hvis det ka dokumeteres at der er homoskedastiske fejlled ka et almideligt F-test bruges. Metode skal beskrives i hovedtræk. Hvis der mistækes eller kostateres heteroskedasticitet er der flere forskellige muligheder: E variabel udpeges som variasstyrede: Det kue være grudstørrelse, jf. Opgave 3.a. Der korrigeres ved hjælp af WLS og de vægtede regressio dokumeteres at være homoskedastisk: Feasible GLS: F-test på de vægtede regressio som ved WLS. Heteroskedasticitetskosistet LM test eller Wald test (fides som optio i SAS) I første og adet tilfælde skal det sikres at vægtige er es uder ul- og alterativhypotesere. Ade og tredje mulighed er geemført i de vejledede SAS besvarelse. Hypotese om es effekt af afstad til skov i de fire områder bliver geerelt afvist. Spørgsmål b i) De øskede OLS regressio, log pris = ˆ γ ˆ 0 γlog ejdvurd, giver e estimeret koefficiet til log ejdvurd som er midre ed. De geemsitlige forskel mellem log pris og log ejdvurd er ca. -0,07, dvs. ejedomsvurderige er i geemsit kap 3 % lavere ed prise. Hvis der kommeteres på sigifikas her, skal der tages stillig til gyldighede af stadardfejl. 9

Det skal diskuteres, om de oplyste ejedomsvurderig giver et realistisk billede af hadelsværdie. Besvarelse bør defiere, hvad der forstås ved et realistisk billede. E defiitio kue være, at ejedomsvurderige er e middelret prediktor af hadelsværdie af de ekelte ejedom. Evt. kue ma her kommetere, at regressioe er specificeret i logaritmer og at exp af e middelret prediktor af log til e give variabel ikke vil være middelret for dee variabel. Besvarelse bør diskutere følgede forhold: Der er to umiddelbare kilder til, at vurderige i geemsit vil være lavere ed hadelsværdie: Der rudes altid edad: Vurderigere ligger mellem 400.000 kr og 3,3 mio. kr. For ejedomme uder mio. kr. opås de største procetvise rabat på ca.,4% ved e bereget værdi på 409.999 kr. faldede til ca. % ved e bereget værdi på 999.999 kr. For ejedomme over mio. kr. opås de største procetvise rabat på ca. 4,8% ved e bereget værdi på.049.999 kr. faldede til ca.,5% ved e bereget værdi på 3.349.999 kr. E geemsitlig afrudig ka ikke bereges præcist ud fra de give oplysiger. Ejedomsvurderige er grudlag for skatteopkrævig: Husejere har derfor e iteresse i at klage over vurderige i edafgåede retig, me vil have midre icitamet til at afsløre privat iformatio om forhold der vil kue forhøje vurderige. E faktor går formetlig i modsat retig: Vurderige er pr.. jauar 000, mes husprisere er opgjort i 999-prisiveau (formetlig er der tale om et geemsit for året): I e situatio hvor husprisere stiger vil det give e positiv skævhed i sammeligige. I vurderige af oveståede regressio ka disse forhold betragtes som målefejl, me med e middelværdi forskellig fra ul. Hvorvidt de er korrelerede med log ejdvurd er ikke klart. Det vil i givet fald betyde ikosistes af parameterestimatere. Desude fremgik det af opgavetekste til Opgave 3.c, at selv i e situatio, hvor de predikterede værdi (som er e middelret prediktor uder SLR.-4) tilføjes e klassisk ukorreleret støj, vil OLS estimatet af γ alligevel være edaf skævt. Regressioe ka æppe bruges til at give et foruftigt svar på, om ejedomsvurderige giver et realistisk billede af hadelsværdie for de ekelte ejedom. På det foreliggede grudlag ka ma således ikke afvise, at mydighederes prediktio af hadelsprise (iklusive evetuelle mauelle justeriger for særlige forhold, me ude afrudig og effekte af klager) er middelret. Besvarelse skal eksplicit tage stillig til dette spørgsmål. ii) Afstad til skov er ikke aført bladt de ormale tillæg eller edslag i bilag C. Hvis vurderige skal afspejle afstade til skov må det således ske ete via stadardprise for området eller ud fra mauelle justeriger. Uaset metode skal der kokluderes, om vurderige tager højde for afstad til skov. For at udgå problemet med egativ skævhed som følge af målefejl a la Opgave 3.c ka ma fx defiere størrelse diff=log pris-log ejdvurd. Hvis ejedomsvurderige ikke i tilstrækkelig grad tager højde for værdie af afstad til skov forvetes e sigifikat effekt i følgede regressio diff = α log 0 α dist ea 0

Der medtages et kostatled for at tage højde for de uder i) omtalte a priori skævheder i vurderige og fordi geemsittet af log til afstad til skov er forskellig fra ul i datamaterialet. Et alterativ er at estimere modeller som (4) med log ejdvurd som afhægig variabel og teste sigifikas af log dist. I så fald bør der argumeteres for, at de systematiske skævheder som blev kostateret uder i) ka fages af kostatled og at målefejl i øvrigt er et midre problem, så læge de optræder på vestreside. Opgave 5 Dee del af opgave bør fremstå som e samlet koklusio på hele opgave. De studerede behøver ikke at iddrage oget yt her me blot på e overskuelig måde at sammefatte deres hovedkoklusioer fra hele opgave. Spørgsmål a I dette spørgsmål skal de studerede vise, at de har overblik over de forskellige modeller, og at de er i stad til at lave e tabel, som sammeholder de vigtigste aalyser, de har lavet i opgave -4. Desude skal de kue gøre rede for, hvorda de ekelte modeller forholder sig til hiade. De studerede skal aføre, hvilke model de foretrækker, og gere aføre hvorfor dee foretrækkes. Spørgsmål b I dette spørgsmål skal de studerede diskutere avedelighede af husprismetode. Her bør der samles op på diskussioe fra opgave og specielt med heblik på at iddrage bilag A. Desude ka iddrages følgede aspekter fra de empiriske del af opgave: Er husprisrelatioe kostat over tid og over forskellige områder? Er der problemer med edogeitet i modelle? Er det de rigtige fuktioelle form som er valgt?