Statistikmodul om at få mere ud af de data, som I allerede har
Motivation for projektet I LOIS databasen findes rigtig mange data, som i mange tilfælde er svære at få sat ordentlig i spil. Kun de kommuner med rutinerede GIS- og databasefolk, har viden til at kunne lave udtræk fra LOIS, som kan bruges videre i organisationen. Det er dog ofte en udfordring at få defineret de udtræk som f.eks. planfolkene i en kommune har behov for til en given analyse.
Baggrund for projektet I Fredericia kommune skal der laves en række analyser og rapporter som skal bruges i planlægningsøjemed: Boliganalyse skal danne grundlag for byfornyelsesindsatser Kommuneplan den kender vi vist alle Årsrapport en slags rigets tilstand Alle de data der skal ligge til grundlag for disse analyser, kan indkøbes hos DST men riget fattes penge og kommunen har mange af disse data i forvejen i LOIS.
Data i projektet
Befolkningsdata i årsrapporten På befolkningsdelen ønskes der fokus på følgende: Befolkningstilvækst Tilflytternes alder Fraflytningskommuner (tilflyttere til Fredericia) Nettotilflytning fordelt på bruttoindkomst De 25-64 årige tilflytteres uddannelsesniveau Tilflytternes arbejdsmarkedstilknytning sammenholdt med Fredericias borgere Data markeret med rødt kan vi ikke udlede fra LOIS-data. Det er kun DST der kan levere dem.
Udfordringer omkring data Hos kommunen er der et ønske om at kunne samkøre informationer om individet med individets bolig. Det er væsentligt at skelne mellem statistikdata på generelt niveau og analysedata på individniveau, da der er væsentlige forskelle i hvad man må. Man må ikke kunne opnå ny viden om enkeltpersoners forhold fra en statistiktabel. Diskretionering skal udføres i tilstrækkelig grad, så dette ikke er muligt.
Udfordringer omkring data Eksempel: Vi laver en aldersfordeling med angivelse af køn og civilstatus. Hvis der i en celle kun er én person (kvinde) mellem 24-45 år kan man, hvis man kender kvindens alder opnå viden om hendes civilstatus DEN GÅR IKKE Hvis der er to kvinder i samme alder og ene er gift, den anden ugift kan den ene kvinde identificere den anden, ud fra viden om sig selv. DEN GÅR HELLER IKKE Der skal således være mindst tre kvinder mellem 24-45 år i en celle for at diskretionering ikke er nødvendig.
Forskel på analyse og statistik Spørgsmål: Hvor i kommunen får vi størst værdi for vores byfornyelsesmidler Tese: Vi skal finde de utidssvarende ejendomme i områder med stor koncentration af ikke ressourcestærke personer Analyse: Geokodning og kobling af data fra BBR med data fra f.eks. KMD-Aktiv = samkøring af registre Kræver anmeldelse til Datatilsynet?? Statistik: Grid med koncentration af personer på overførselsydelse (diskretion af celler) Grid med koncentration af utidssvarende boliger Lav overlayanalyse på disse to datasæt
Løsningen
Opbygning af modulet Statistikdatasættene er tænkt leveret i pakker, som hver indeholder en række views som indeholder relevante data. Det kan være: Boligdata (OIS) Erhvervsdata (CVR) Befolkningsdata (CPR) Plandata (OIS, CPR og PlanDK) Kommunesammenligning (alle datakilder)
Eksempler Boligdata (OIS) Boligtyper Boligstørrelser Handels- / vurderingspriser Boliger med installationsmangler Erhvervsdata (CVR) Antal ansatte Virksomhedstyper Nystartede virksomheder indenfor et år
Eksempler del 2 Befolkningsdata (CPR) Aldersfordeling Borgere 60+ Tilflyttere/fraflyttere Antal forskellige statsborgerskaber Plandata (OIS, CPR og PlanDK) Ubeboede boliger Bebyggelsesgrad af lokalplanområder Forskel på ejendomskat og skatteloft Husstandstyper (enlige m/u børn osv.)
Eksempler del 3 Kommunesammenligninger (alle datakilder) Befolkningstal Udskrivningsprocent Indpendling i fht. antal arbejdsplader %-del udlejningsboliger af alle boliger Fødsler pr. 1000 indbyggere Byggesagstider Antal ansatte (CVR) / antal 25-64 årige (CPR)
Hvordan kan det så se ud
Hvordan kan det så se ud
Hvordan kan det så se ud
Historik - tidsserier Der kan laves historik på alle BBR og ESR data tilbage til 2010 Historik kan laves på årsbasis, halvårig, kvartalvis På CVR kan der laves historik fra installationsdato. På CPR/DPR undersøges det hvad der er lovligt at lave historik på evt. anonymiseret. Vi har dialog med DST.
Geografi og DST Data leveres som standard i 100 m og 1 km grid Enhver geometri kan uploades til databasen, som automatisk vil generere samme statistikberegninger på disse nye geografier Vi kan derfor f.eks. importere data fra Danmarks Statistik griddata, og genberegne nye områder uden at skulle købe en ny datalevering fra DST forudsat at DST leverer i 100m grid og den nye geometri er større. Data fra DST kan vises og kobles sammen med egne data. På den måde, kan der skabes merværdi af begge datasæt.
Videreudvikling af modulet Trække på data direkte fra andre kilder: Miljødata (GeoEnviron) Omsorgsdata (CARE) Sundhedsdata Spørgsmålet er, hvordan vi får adgang til visse af disse data