Metodenotat 14. maj 2014 Datagrundlaget for Boligmarkedsstatistikken Realkreditforeningen, Realkreditrådet, Dansk Ejendomsmæglerforening og Finansrådet udgiver i fællesskab Boligmarkedsstatistikken, som bliver udarbejdet i samarbejde med e- nettet. e-nettet validerer og leverer statistikkens datagrundlag, der stammer fra Real-ViewTM databasen. Da et af statistikkens hovedformål er at afdække reelle markedspriser på ejendomme, indgår der kun frie handler i statistikken udbudt af professionelle udbydere, hvilket er defineret som handler med ejendomme, for hvilke der er kortlagt et udbudsforløb på Internettet, med en efterfølgende tilknyttet registrering i statens offentlige registre, om at ejendommen er handlet. Et af de unikke kendetegn ved statistikken er således, at man på transaktionsniveau har identificeret og fulgt ejendommene i alle salgsforløbets faser, fra ejendomsmæglerne udbyder ejendommene og indtil der er tinglyst skøde på disse. Udover at opgøre de frit realiserede handelspriser, foretager Boligmarkedsstatistikken også sammenligninger af realiserede handelspriser og udbudte priser for de solgte ejendomme, hvilket ligeledes er et af Boligmarkedsstatistikkens unikke kendetegn. Boligmarkedsstatistikken offentliggøres p.t. 4 gange om året. Offentliggørelse sker almindeligvis omkring den 20. i måneden, ca. to og en halv måned efter kvartalsskiftet. Der offentliggøres gennemsnitlig pris pr. solgte m², antal handler, salgstider for solgte ejendomme, første udbudte pris og seneste udbudte pris (nedtagningspris), når ejendommen konstateres handlet. Data offentliggøres for hele landet, 5 regioner, 11 landsdele, 98 kommuner og på postnummerniveau. Datagrundlaget består af handler, som er foretaget i det pågældende kvartal, og der offentliggøres alene tal, såfremt disse baserer sig på mindst fem underliggende transaktioner. Registreringstidspunkt Boligmarkedsstatistikken bygger på indberetninger i det digitale tinglysnings-system (etl), hvor bl.a. salgspris og handelsdato registreres. For perioden fra 2004 til 2007 indeholder de offentlige registre misvisende data om tidspunktet for informationernes statistiske tilgængelighed, da Kommunalreformen i 2007 overskrev historiske data på de ejendomme, der på daværende tidspunkt skiftede kommuneog/eller ejendomsnummer. Det er, på grundlag af handler med ejendomme der ikke blev berørt af Kommunalreformen, beregnet, at der i perioden fra 2004 til 2006 var i gennemsnit 117 dage fra omregningsdatoen, hvilket typisk er sammenfaldende med handelsdatoen, til den dato, hvor informationen blev tilgængelig i de offentlige registre. For Boligmarkedssta-
tistikkens tidsmæssige stadfæstelse af handelsinformationens tilgængelighed, er der for perioden fra 2004 til 2007 anvendt denne forskydning. Ejendomstyper i Boligmarkedsstatistikken Statistikken baseres på finanstilsynets 3 ejendomskategorier parcel- og rækkehuse, ejerlejligheder og fritidshuse. Boligmarkedsstatistikkens grunddata Boligmarkedsstatistikken anvender en række definitioner, herunder følgende: m²-pris Vægtet etageareal Handelsdato Realiseret handelspris Første udbudspris Nedtagningspris Beregnes på baggrund af Finanstilsynets definition af vægtet etageareal (se herunder). Ved vægtet etageareal (vejet areal) forstås boligareal omregnet efter realkreditbranchens omregningsnøgle, der er aftalt med Finanstilsynet (se bilag A). Dato for underskrivelse af købsaftalen. Før 8/9 2009 = Kontant købesum / kontantomregnede købesum Efter 8/9 2009 = Købesum ifølge tingbog. Observeret udbudspris første gang en ejendom er sat til salg på Internettet. Den senest observerede pris på en ejendom som er sat til salg på Internettet. Udregning af gennemsnitlige m²-priser m²-prisen beregnes først for den enkelte ejendom og dernæst for henholdsvis postnummer og kommune som helhed ved summering af de enkelte m2-priser, delt med antal handler i alt. Der offentliggøres ikke m²-priser på postnummer- og kommuneniveau, hvis der er mindre end fem handler i den omhandlede periode. 2
Løbende korrektion for de seneste 4 kvartaler Tallene i Boligmarkedsstatistikken genberegnes løbende et år tilbage i tid, hvorefter tallene i statistikken betragtes som endelige. Analyser har vist at en handel typisk tinglyses tæt på overtagelsesdatoen, og at ejendomme med en længere overtagelsestid i gennemsnit har en højere m²-pris end ejendomme med kortere overtagelsestid. Tinglysningsmønstret betyder dermed, at den gennemsnitlige m²-pris i datagrundlaget stiger over tid, fordi data i Boligmarkedsstatistikken bl.a. er baseret på data, der fødes af det elektroniske tinglysningssystem etl. I tidligere udgaver af Boligmarkedsstatistikken, blev de foreløbigt publicerede priser opgjort på grundlag af alle handler, der på beregningstidspunket var tinglyst. Eftersom de dyrere ejendomme har en gennemsnitligt længere overtagelsestid, opstod der i statistikken en systematisk undervurdering af priserne i de foreløbige tal, dvs. de første af de tal, der blev publiceret i Boligmarkeds-statistikken, der ved hver publicering genberegner data et år tilbage i tid. Den metode, der fra og med udgivelsen af tal for 1. kvartal 2014 anvendes i Boligmarkedsstatistikken (den nuværende version), kompenserer for skævheden i tinlysningsmønsteret, jf. bilag B. Det sker ved, at midlertidige m²-priser, dvs. de m²-priser der publiceres i statistikken i perioden indtil tallene efter et år er endelige, beregnes på grundlag af den forrige periode med samme forventede procentuelle andel af det endelige antal handler. De endelige tal, dvs. de tal der er beregnet efter et års genberegninger (af midlertidige tal), vil svare til de endelige tal for den hidtidige beregningsmetode, og vil dermed ikke være korrigerede. Den nye beregningsmetode har en forventelig mindre bias, hvad angår prisudviklingen for de foreløbige perioder, altså indtil tallene publiceres som endelige. Vægtning med boligbestanden m²-priserne i Boligmarkedsstatistikken tager udgangspunkt i den aktuelle boligbestand i den beregnede periode for hver ejendomskategori i den enkelte kommune. De enkelte kommuner vægter dermed med samme forhold, når der beregnes tal for henholdsvis landsdele, regioner og på landsplan. I den tidligere version af Boligmarkedsstatistikken indgik kommuner uden handler med de seneste m²-priser i den pågældende kommune. Hvis der eksempelvis ikke havde været nogle handler i en kommune i et år, ville den gennemsnitlige m²-pris, som indgik i beregningen af m²-prisen i landsdelen, være et år gammel. I denne version af Boligmarkedsstatistikken falder den pågældende kommune ud af vægtningsgrundlaget, hvis der er for få handler, og kommuner med for få handler kommer dermed ikke til at påvirke gennemsnits-beregningerne. Det betyder, at kommuner uden hand- 3
ler vil indgå i statistikken på samme måde, som hvis den pågældende kommune havde haft en prisudvikling svarende til den gennemsnitlige prisudvikling i landsdelen, hvor kommunen er beliggende. Validering af m²-priser I statistikken frasorteres ejendomme med særligt høje eller lave realiserede handelspriser, hvilket sker for at undgå, at atypiske ejendomme påvirker statistikken og for at imødegå tastefejl. I tidligere udgaver af Boligmarkedsstatistikken, blev disse valideringer gennemført med udgangspunkt i en nedre valideringsgrænse på kr. 1.000 pr. kvadratmeter, hvilken værdi var indeksfremskrevet fra 1992 og fremefter. Tilsvarende fandtes en øvre valideringsgrænse på kr. 30.000 pr. kvadratmeter i 1992-priser, der ligeledes var indeksfremskrevet, begge på baggrund af forrige års prisændringer målt på landsplan. Den nuværende version af Boligmarkedsstatistikken anvender tilsvarende filtre, der frasorterer åbenlyse fejl og afvigere, og herudover anvendes den statistiske standardafvigelse i hver gennemsnitlig beregning af m²-priser til at afgøre, hvilke observationer der skal udelades i beregningerne, hvilket sikrer, at de m²-priser der publiceres i statistikken så vidt muligt afspejler reelle markedspriser. P.t. anvendes følgende filtre til frasortering: Areal m2, nedre grænse 25 Areal m2, øvre grænse 750 Pris, nedre grænse 100.000 Pris, øvre grænse 25.000.000 m2-pris, nedre grænse 1.000 m2-pris, øvre grænse 200.000 Standardafvigelse beregnes: 4
Kun er værdier indenfor intervallet [-2:3], som indgår i beregningen af de gennemsnitlige m²-priser. Historiske data for ejendomspriser fra før og efter 2004 Et af Boligmarkedsstatistikkens unikke kendetegn er, at det er det samlede salgsforløb for de ejendomme, der indgår i statistikken, der er identificeret, herunder prisdannelsen undervejs i udbudsforløbet og frem til realiseret handel. Boligmarkedsstatistikken beskæftiger sig alene med udbudsdata fra 2004 og fremefter, hvorfor man skal skelne mellem tal, der er publiceret henholdsvis før og efter 2004. For perioden 1992 til 2003 medtages alle handler, der i de offentlige registre er registreret som frie handler udbudt af en professionel formidler, hvilket ikke må forveksles med Boligmarkedsstatistikkens definition af en fri handel, der er grundlaget fra 2004 og fremefter. M²priser for perioden før 2004 er indekseret, hvor m²-priserne for 1. kvartal 2004 er udgangspunktet for indekset, så der dermed ikke opstår nogen forskel i niveauet. Udregning af salgstid Salgstiden beregnes som den tid der medgår, fra 1. gang en ejendom sættes til salg til den dato, hvor købsaftalen er underskrevet. Ejendomme som tages af nettet, for igen at dukke op på nettet indenfor 90 dage, betragtes som værende en fortsættelse af samme salgsforløb. 5
Bilag A: Omregning af arealer i Boligmarkedsstatistikken Arealet bliver opgjort på baggrund af m²-registreringer i BBR-registret. Opgørelsen foregår jf. nedenstående vægte: Enhed Vægtning Stueetage samt øvrige fulde etager - Boligareal anvendt til boligformål 100 % Kælder - Godkendt til bolig 100 % - Ikke godkendt til boligformål 40 % Tagetage - Indrettet og godkendt til boligformål 90 % - Kun forberedt til udnyttelse 10 % Garage, carport og udhuse - Garage/udhus indbygget i husets stueplan 40 % - Garage/udhus fritliggende eller op af huset 25 % - Carport fritliggende eller indbygget i husets stueplan 10 % Udestue - Udestueareal 15 % Ejerlejlighed - Boligareal ifølge BBR-meddelelse 100 % 6
Bilag B: Beregning af korrektionsmekanismer Nedenfor er beskrevet den metode i Boligmarkedsstatistikken (BMS2012) der fra og med 1. kvartal 2014 er anvendt til korrektion af m²-priser, udbudspriser, udbudstider og antal handler. Metoden er udarbejdet med udgangspunkt i den problemstilling, som også Danmarks Statistik har adresseret i deres ejendomssalgsstatistik, og som har til formål at kompensere for det faktum, at tinglysnings-mønstret er forskelligt for ejendomme i forskellige priskategorier. Analyser, herunder hos Danmarks Statistik, har vist at en handel typisk tinglyses tæt på overtagelsesdatoen, og at dyrere ejendomme i gennemsnit har en længere overtagelsestid end mindre dyre ejendomme. Dette tinglysningsmønster betyder, at dyrere ejendomme kommer senere med i datagrundlaget end mindre dyre ejendomme, eftersom data i Boligmarkedsstatistikken bl.a. er baseret på data, der fødes af det elektroniske tinglysningssystem etl. Ved Boligmarkedsstatistikkens hidtidige metode, blev prisudviklingen opgjort på grundlag af alle handler, der på beregningstidspunket var tinglyst. Eftersom de dyrere ejendomme har en gennemsnitligt længere overtagelsestid, og følgelig tinglysningsorden, opstod der i statistikken en systematisk undervurdering af priserne i de foreløbige tal, dvs. de første af de tal, der blev publiceret i Boligmarkedsstatistikken, der ved hver publicering genberegner data et år tilbage i tid. Den nye metode, der er beskrevet i nærværende, bygger på den forudsætning, at skævheden i tinglysningsmønsteret for ejendomshandler med forskellig pris er stabilt over tid. Metoden der anvendes, korrigerer for skævheden i tinglysningsmønsteret, ved at statistikken, når der publiceres midlertidige m²-priser, dvs. i det år hvor statistikkens tal genberegnes og dermed ikke er endelige, beregner de midlertidige tal på grundlag af den forrige periode med samme forventede procentuelle andel af det endelige antal handler. De endelige tal, dvs. de tal der er beregnet efter et års genberegninger (midlertidige tal), vil svare til de endelige tal for den hidtidige beregningsmetode, og vil dermed ikke være korrigerede. Den nuværende beregningsmetode har en forventeligt en mindre usikkerhed, hvad angår prisudviklingen for de foreløbige periode, altså indtil tallene publiceres som endelige. Beregningsmetode for priser og salgstider I nærværende dokument beskrives korrektionen ud fra en fire kvartalers model. Beskrivelsen beskæftiger sig i det følgende alene med handelspriser, selvom første udbudspris, nedtagningspris og salgstider korrigeres efter eksakt samme metode. 7
I eksemplet beregnes 1. udgivelsen 2½ måned efter et afsluttet kvartal. Det vil eksempelvis sige, at 1. udgivelsen af tallene for 4. kvartal 2013 vil blive beregnet i marts 2014 se nedenstående tabel. I statistikken beregnes tallene fire gange hvert år, hvor den fjerde version af tallene er de endelige. Der laves altså 3 midlertidige beregninger og en endelig beregning, og det er tallene i de 3 midlertidige beregninger, som bliver korrigeret. Den aktuelle version af beregningerne kan beskrives som herunder. Lodret er det data perioder (dvs. objekt tid) og vandret er det observationsperiode, og hvor K1, eksempelvis, betyder den 4. og endelige version af 1.kvartalstallet: Observationsmåned Marts 2014 K4 2013 (1. udgivelse) K4 2013 (1.opsamling) Juni 2014 K1 2014 (1. udgivelse) K1 2014 (1. opsamling) September 2014 K2 2014 (1. udgivelse) K2 2014 (1. opsamling) December 2014 K3 2014 (1. udgivelse) K3 2014 (1. opsamling) K3 2013 (2. opsamling) K4 2013 (2. opsamling) K1 2014 (2. opsamling) K2 2014 (2. opsamling) K2 2013 (3. opsamling) K3 2013 (3. opsamling) K4 2013 (3. opsamling) K1 2014 (3. opsamling) Tilgængelige data K1 2013 K2 2013 K3 2013 K4 2013 K1 2013 K2 2013 K3 2013 K1 2013 K2 2013 K1 2013 Når der udsendes en statistik i juni 2014 vil salgspriserne for 1. kvartal 2014 være 1. udgivelsen, mens tallene for 4. kvartal 2013 er 2. udgivelsen og tallene for 3. kvartal 2013 vil være 3. udgivelsen. Tallene for 2. kvartal 2013 være de endelige tal. Hvis man nu eksempelvis i juni 2014 skal beregne første version af 1. kvartal 2014, da fås denne, som 2. udgivelsen af 4. kvartal 2013 opskrevet med prisudviklingen mellem 1. opsamlingen af 4.kvartal 2013 og 1. opsamlingen af 1. kvartal 2014: 8
På samme tidspunkt kan man beregne 2. udgivelsen af 4. kvartal 2013, hvor 3. udgivelsen af 3. kvartal 2013 opskrives med prisudviklingen mellem 2. beregningen af 3.kvartal 2013 og 2. beregningen af 4. kvartal 2013.: Herved kan beregningen af 1. kvartal 2014 via substitution omskrives til: Ved at bruge samme metode kan udtrykket udvides til den endelige udregning for 1. kvartal 2014: Derved bliver 1. udgivelsen for salgspriserne for 1. kvartal 2014 lig med den endelige pris for 2. kvartal 2013 opskrevet med den procentvise udvikling i hvert af de 3 efterfølgende kvartalers største sammenlignelige opsamling. Da man sammenligner ens opsamlinger vil salgsprisen være middelret, så længe der ikke sker ændringer i indberetningsmønstret. Da den endelige beregning, i eksemplet, ikke genberegnes, er denne blot den almindelige gennemsnitlige m2-pris for en given boligtype i et givent område. Hvis vi beskriver: - antallet af revisioner som R (i ovenstående eksempel 4) - perioden som t - udgivelsessnummeret som u 9
da kan den korrigerede m2-pris udtrykkes som:, for u < R Som note hertil, så offentliggøres (ved nye perioder) altid de opdaterede, bedst tilgængelige estimater for tidligere perioder, indtil den endelige forefindes, i hvilken sammenhæng resultatet fastlåses. Endelig opereres med en værdi kaldet kvalitetstallet, som er det laveste antal observerede handler brugt til produktsummen herover. Hvis denne er mindre end 5 (dvs. en eller anden periode havde under 5 (ukorrigerede) handler for dette område), da udelades alle resultater for det specifikke område. Beregningsmetode for antal handler Handelstal (antallet af handlede ejendomme) korrigeres efter en anden metode, hvor den aktuelle (ikke-endelige) værdi opskrives med en faktor, der bestemmes af indberetningsmønstret fra året før (dvs. stigningen sidste år fra den første version til den endelige version). Metoden benyttes for at sikre mod sæson i indberetningsmønstre. Opskrivningsfaktoren tvinges ind i intervallet [1:1,25], hvor begge tal er inklusive, for at forhindre at disse tal afviger for meget i antalsmæssigt tynde områder. Handelstallet undergår herudover ingen særskilt kvalitetskontrol. Hvis vi beskriver: - Antallet af revisioner R på et år (i ovenstående eksempel 4) - perioden som t - udgivelsessnummeret som u - Antal og Antal betyder henholdsvis korrigeret og ukorrigeret antal handler da kan det korrigerede antal handler udtrykkes som: 10