Estimation af ejendomsværdi for ejerboliger Søren Leth, Københavns Universitet Kaare Brandt Petersen, SAS Institute
Introduktion hvem er vi? Søren Leth Professor, cand polit, ph.d. Økonomisk Institut, Københavns Universitet Forsker i opsparingsadfærd blandt andet betydningen af boligmarkedet Medlem af Ekspertudvalget vedrørende ejendomsvurdering Kaare Brandt Petersen Konsulentdirektør, cand scient, ph.d. Education & Academic, SAS Institute Løsningsarkitekt for SAS team til Ekspertudvalget vedr ejendomsvurdering
Baggrund 26 mia. kr. indsamles i ejendomsskat fra ejerboliger i 2012 Ejendomsværdiskat: 13 mia. / grundskyld: 13 mia. kr. Til sammenligning - topskat: 15 mia. kr. Ejendomsskatter: Ejendomsværdiskat: 1%*ejendomsværdi + 2%*ejendomsværdi [værdi>3.4 mio. kr] Grundskyld: 16-34 promille af grundværdi
Baggrund Ejendomsskatter: Ejendomsværdiskat: 1%*ejendomsværdi + 2%*ejendomsværdi [værdi>3.4 mio.kr] Grundskyld: 16-34 promille af grundværdi
Baggrund Efteråret 2013: Stor uro om fastsættelse af værdien af ejendomme og grunde Rigsrevisionens rapport: Skats vurdering kun tilstrækkelig god, hvis i intervallet [-15%:0], når målt mod faktiske salgspriser. 25% af boliger solgt i 2. halvår 2011 blev vurderet korrekt. Sager med uforståelige forskelle i grundværdiskatter (Politiken-historie) Skatteminister Holger K. Nielsen nedsatte ekspertudvalget (Oktober 2013)
Kommisorium Kvaliteten i ejendomsvurderingen forbedres Implementeres og er effektivt Forudsætning at reglerne om ejendomsbeskatning fastholdes uændret Datagrundlaget forbedres Vise konsekvenser
Prioriteringer Forbedre data-grundlaget Bedre beskrivelse af lokale boligmarkeder Bedre beskrivelse af beliggenhedsvariable / herlighedsværdier Bedre udvælgelse af frie handler Statistisk model Fjerne diskrete forskelle i vurderinger for ellers identiske huse Maksimere prædiktionsraten Angive en metode til at måle træfsikkerheden
Skinnenettet den korte version Salg DQ report Model estimation Performance rapport Bygninger Ejendom Data integration Ejendomsspecifikke DQ checks Model ETL Scoring Scoring rapport Geodata Familie Skattekonsekvenser Skatte-rapport
Dannelse af Master ABT DMA (3) (Data Mart Analyse) DMS (20) Data Mart Storage DATA til Sagsbehandling Klageproces DSA (76) // DDS (107) Simpel DQ Source - Datamodtagelse Staging area Tinglysnin gen BBR SKAT/Vur Geodata Opdeling i Tidsperioder ABT estimering scoring Kortnære egenskaber til segmentering Kort Segmentering på ejdnære egenskaber Filter Est / EjEst Datapartitionering Flag-regler: Ejendomsspecifik DQ Datakvalitet Estimering af områdepris v nabosalg Anvendelse af områdepris v nabosalg Segmentering med markedsdata Model-Diagn.- rapport Estimering af EV-model Anvendelse af EV-model Tst Estimering af Præcisionsmodel på EV Anvendelse af præcisionsmodel på EV Diagnostik og indsigt på PCL Træfsikkerhed Data partitionering til GV Estimering af GV-kurve Anvendelse af GV-kurve Postjustering (EV/GV mm) Filter AUTO / MAN Scoring Anden håndtering Skatteberegninger Outputkontroller Scoring AUTO Scoringsrapport Dataflow (Obs kontrol) skattemæssige konsekvenser
Datagrundlag et svært udgangspunkt 100+ tabeller næsten uden dokumentation Økonomi ifm vedligehold og opdatering af dokumentation Hvad gør man så?
Datagrundlag Mest centrale datakilder BBR (oplysninger om bygninger) Ejendom (oplysninger grund, matrikel, etc) Geodata (afstande til x og y) etl (Tinglyste salg af fast ejendom) CPR (relationer på køber og sælger) Eksempler på data om et hus Boligareal Arealer garage, carport Arealer kælder, udhuse Grundareal Tagtype Murtype Antal etager Vandforsyning Kloakering Opvarmningstype Position Udsigt Afstand til kyst, sø, skov,
Datagrundlag datakvalitet 5 tinglyste salg med negativ salgspris 3% af tinglyste salg på 0,00 kroner Frit salg mellem fraskilte? Eller søskende? Lejlighedsareal < 10 kvm Opførelsesår < år 1400 Fritliggende carport med areal > 250 kvm En ubebygget grund med en kælder på 6000 kvm
Model hvad forudsiger prisen på et hus? Beliggenhed Boligstørrelse Stand Arkitektur Naboejendomme Indretning Grundstørrelse Carport/Garage Sælgers situation Købers situation Sælger/køber relation Møblering ved salg Trafikstøj Forurening Skoledistrikt Kommune 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015
Model historien på kortest mulige form 1 2 3 Fremskrivning af historiske salg Find sammenlignelige salg i nærområdet Korrektion for specifikke forhold ved ejendommen +218.000 +179.000-218.000 2000 2013
Model Prisudvikling er meget lokal Prisudviklingen gennemsnitlig for kommunen Prisudviklingen positivt påvirket af nybyggeri med udsigt over Øresund
Model Tilgang til lokal prisudvikling Estimeret pris i 2013 = Forhold er i princippet unik for hvert eneste hus (x,y) og år Ejendom ID 1234 Solgt i 2010 Pris: 3.1 mio DKK Områdepris 2013 Områdepris 2010 = Median kvadratmeter pris for de 50 nærmeste salg i 2010 x Pris i 2010 = 29.100 DKK/m2 25.300 DKK/m2 = Median kvadratmeter pris for de 50 nærmeste salg i 2013 x 3.1 mio DKK = 3.56 mio DKK
Model Områdeprisen Ejendom ID 9999 Med 18 nærmeste naboer og deres 2013 priser Områdepris i 2013 værdier for ejendom ID=9999 = 29.654 DKK/m2 Bemærk, at områdeprisen er unik for hvert eneste hus, men at naboer vil have ens eller sammenlignelige værdier
Model Områdeprisen på landsplan Hver prik er en ejendom med farve efter ejendommens områdepris Bemærk tydelige effekter af urbanisering og infrastruktur
Model flere modeller er prøvet af Linear additive model Linear multiplikativ model Statistiske beslutningstræer Neurale netværk Submodeller ud fra områdepris Submodeller ud fra geografi
Model forskellige performancemål pm20 Mean absolute difference Coefficient of dispersion Note: Let at forklare til folk uden matematisk baggrund Uafhængigt af ekstreme værdier Målet er relativt dvs sammenligneligt på tværs af pris niveauer Note: Målet er absolut Let at forklare Supplement til pm20 Note: Uafhængigt af ekstreme værdier Uafhængigt af moedllens evne til at ramme det overordnede niveau Tæt relateret til pm20
Bias/Noise Præcision ift salgspris Hvordan klarer modellen sig sammenlignet med realiserede handler? Realiseret handelsværdi (target variabel) OK Underestimateret Overestimateret Meget lav 5% 62% 33% Lav 8% 71% 21% Medium 10% 81% 9% Høj 21% 71% 8% Meget høj 33% 62% 5% Bemærk Standard er at sammenlignet ift predicted value siger noget om modelestimering Effekten er udtryk for højt støjniveau ikke misspecifikation
Vandkants-Danmark I særklasse grimt og misligeholdt hus
Fejlkilder
Arbejdet fortsætter Ekspertudvalgets resultater er kun begyndelsen Implementeringscenter for Ejendomsvurdering (ICE) En del af Skatteministeriet
Spørgsmål