Begrebsarbejde som forudsætning for datamodellering Højnelse af datakvalitet og øget effektivitet i it-systemer Copenhagen Business School, mandag den 5. december 2016 Bodil Nistrup Madsen & Hanne Erdman Thomsen 1
Oversigt 1. Begrebsmodellering Metode Når myndigheder taler forskelligt dansk 2. Begrebsmodellering versus datamodellering Modellernes formål og indhold Det ideelle modelleringsforløb Eksempel på problemer i datamodel Konklusion 3. Behov for samarbejde 2
1. Begrebsmodellering 3
Metode 4
Eksempel fra http://sundhedsdata.iterm.dk/ 5
Udsnit af Medicineringsbegreber Associativ relation Typerelation Inddelingskriterium Delhelhedsrelation Begreb 6
Tilføjelse af træk v. bnm MÅDE: i henhold til skriftlig anvisning ADMINISTRATION: enkeltstående dosering ADMINISTRATION: gentagen dosering Karakteristisk træk: ATTRIBUT:VÆRDI INTERVAL: fastlagt INTERVAL: efter behov 7
Tidligere og nuværende version 9
Når myndigheder taler forskelligt dansk 10
Udsnit af diagrammet JM-Sag (Justitsministeriet) 11
Udsnit af diagrammet Forvaltningsbegreber (Socialstyrelsen) 12
Sammenstilling af begreber fra Justitsministeriet og Socialstyrelsen Justitsministiet Socialstyrelsen myndighedssag sag hvori der træffes en afgørelse myndighedssag sag som ligger inden for en forvaltningsenheds primære forretningsområde reguleret af særlig lovgivning 13
2. Begrebsmodellering versus datamodellering 16
Modellernes formål og indhold 17
Problemstilling Der er mange lighedspunkter mellem begrebsmodellering og datamodellering. MEN! Der er ingen en-til-en korrelation mellem begrebsmodel og datamodel, dvs. der er ikke fuldstændig overensstemmelse mellem henholdsvis begreber og karakteristiske træk i begrebsmodellen og klasser og attributter i datamodellen. 18
Illustration af modellernes indhold Terminologisk ontologi: Begreb Typerelation mellem begreber Inddelingskriterium Trækspecifikation: attribut-værdi-par Datamodel (UML): Klasse SourceReference ref: Integer pk type: String suppl: String Diskriminator Specialisering Origin WrittenSourceReference OralSourceReference Attribut ref: Integer pk fk year: String publisher: String author: String title: String ref: Integer pk fk job: String name: String 19
Modellernes formål og indhold MODELTYPE FORMÅL INDHOLD Terminologisk ontologi Datamodel At skabe begrebsafklaring og enighed om indholdet af en term og brugen af fagudtryk At fastlægge hvilke oplysninger, der skal indgå i et it-system, og hvordan de hænger sammen Oplysninger om begreber i form af karakteristiske træk (trækspecifikation) og begrebsrelationer Oplysninger om databasens klasser i form af attributter og relationer mellem klasser 20
Begrebsforvirring - Klip fra Kriminalforsorgens modelleringsvejledning Der er ikke enighed om indholdet af og betegnelserne for de forskellige datamodelleringsniveauer. En ofte anvendt betegnelse er fx informationsmodel. Denne anvendes både om konceptuel datamodel og logisk datamodel. 21
Det ideelle modelleringsforløb 22
Ideelt modelleringsforløb 1 Terminologisk begrebsmodellering Udarbejdelse af en terminologisk ontologi der indeholder oplysninger om begreber i form af karakteristiske træk og begrebsrelationer - BEGREBSAFKLARING! 2 Konceptuel datamodellering Udarbejdelse af en datamodel der afspejler typer af entiteter og deres indbyrdes relationer, og som udgør en abstrakt repræsentation af data. 3 Logisk datamodellering Udarbejdelse af en datamodel der specificerer organiseringen af data på en måde, som afspejler den logiske struktur i et it-system. 4 Fysisk datamodellering Udarbejdelse af en datamodel der afspejler den fysiske struktur i et itsystem 23
Eksempel på ideelt modelleringsforløb Udvikling af et it-system med en bagvedliggende relationel database til konferenceadministration Case fra Mathiassen et al.: Objektorienteret analyse & design 24
Beskrivelse af databasen - udsnit Konferencesystemet skal bruges til forberedelse og administration af en konference, dvs. udarbejdelse af konferenceprogram og administration af deltagere og artikler. Det skal ikke bruges i forbindelse med budgetlægning, regnskab samt hotel- og lokalereservationer. Målgruppen er programkomiteen, organisationskomiteen og det administrative personale. Personer kan overordnet opdeles i to kategorier: personer, som er tilmeldt og derfor deltager i konferencens aktiviteter, og personer som ikke er tilmeldt, men som alligevel kan optræde i forbindelse med forberedelsen af konferencen. Sidstnævnte personer er typisk reviewere, som bedømmer artikler indsendt til programkomiteen, samt forfattere, der har skrevet artiklerne. I forbindelse med artikler er det vigtigt at holde styr på, hvem der bedømmer en given artikel, hvad bedømmelsen er, om artiklen udvælges til konferencen, og hvornår artiklen skal fremlægges. 25
Eksempel på modelleringsforløb - Identifikation af relevante begreber 26
Udkast 27
Her kommer multipliictet Inddelingskriterium bliver til klasse ledsager, deltager forfatter, reviewer 28
Her kommer attributter, primærnøgle, fremmednøgle og datatyper 29
Processen fra terminologisk ontologi til logisk datamodel Kan genereres på basis af terminologisk ontologi (uden multiplicitet) Her kommer multiplicitet på 30
Den oprindelige konceptuelle datamodel fra Mathiassen et al. Svarer til typerelation i terminologisk ontologi Jf. den terminologiske ontologi Svarer til to mere specifikke roller: ROLLE IFT KONFERENCE og ROLLE IFT ARTIKEL 31
Den oprindelige konceptuelle datamodel fra Mathiassen et al. Versus den konceptuelle datamodel baseret på ontologien Bliver associativ relation til to specifikke roller Bliver til de to mere specifikke roller på grundlag af den terminologiske ontologi ledsager, deltager forfatter, reviewer 32
Eksempel på problemer i datamodel 33
Problemer i datamodel Udsnit af Fødevareministeriets begrebsmodel datamodel for Kontrol for Kontrol Linket er ikke længere aktivt FVM omtalte den som begrebsmodel http://www.fvm.dk/files/filer/ministeriet/udvalg%20og%20partnere/standarder/kontrol/begrebsmodel_kontrol.htm 34
Oprindelig (logisk) datamodel oversat til engelsk Er her gentegnet i en mere overskuelig form Er ikke typer af control type, men typer af control Se forslag til ændret konceptuel datamodel, slide 41 Begreberne sampling og analysis indgår i on site control. De er ikke typer af on site control. 35
Terminologisk ontologi for kontrol, engelsk, justeret version rekvireret kontrol regelfast kontrol Her er ikke noget begreb control type, kun control. Begrebet on site control er en type control, ikke en type control type. kontrol på stedet Begreberne sampling og analysis indgår i on site control. De er ikke typer af on site control. prøveudtagning Her er tale om to begreber: kontrolansvarlig og udførende myndighed. 37
Oprindelig konceptuel datamodel for kontrol versus ny konceptuel datamodel baseret på ontologi Fødevareministeriets model Ny konceptuel datamodel 40
Fødevareministeriets beskrivelse af administrativ kontrol Dannede udgangspunkt for karakteristisk træk i den terminologiske ontologi Description Som udgangspunkt foretages administrativ kontrol på materiale som myndigheden har til behandling. Dette indebærer kontrol af oplysninger, som kunden har afgivet til en myndighed gennem en ansøgning, indberetning af produktionsdata eller lignende. Administrativ kontrol foretages som udgangspunkt udelukkende internt hos myndigheden. Administrativ kontrol kan foretages på samtlige oplysninger i forbindelse med sagsbehandling og udbetaling eller anden aktivitet rettet mod kunde, produkt eller aktivitet. I forbindelse med sagsbehandling af støtteansøgninger foretages både en administrativ kontrol og en fysisk kontrol. Den administrative kontrol kan være en systematisk kontrol af alle oplysninger eller en stikprøveudvalgt del af oplysningerne. Den administrative kontrol kan ved behandling af eksempelvis ansøgninger opsættes som en systematisk maskinel udfør kontrol. Short description Ved administrativ kontrol forstås den kontrol, der foretages ved at sammenholde modtagne oplysninger og data vedrørende kunder, produkt eller aktivitet med gældende regler og andre relevante oplysninger. 41
DANTERMcentrets definitioner for kontrol på stedet og administrativ kontrol: BEGREB FVM DANTERM kontrol på stedet Aktiviteten kontrol på stedet udføres som en kontrol hos en kunde eller dennes leverandør/aftager. kontrol der udføres hos en kunde eller dennes leverandør eller aftager administrativ kontrol Ved administrativ kontrol forstås den kontrol, der foretages ved at sammenholde modtagne oplysninger og data vedrørende kunder, produkt eller aktivitet med gældende regler og andre relevante oplysninger. kontrol der foretages hos en kontrolmyndighed Definitionerne er ikke diskuteret med Fødevarestyrelsen. 42
Ideelt modelleringsforløb 1 Terminologisk begrebsmodellering Udarbejdelse af en terminologisk ontologi der indeholder oplysninger om begreber i form af karakteristiske træk og begrebsrelationer - BEGREBSAFKLARING! 2 Konceptuel datamodellering Udarbejdelse af en datamodel der afspejler typer af entiteter og deres indbyrdes relationer, og som udgør en abstrakt repræsentation af data. 3 Logisk datamodellering Udarbejdelse af en datamodel der specificerer organiseringen af data på en måde, som afspejler den logiske struktur i et it-system. 4 Fysisk datamodellering Udarbejdelse af en datamodel der afspejler den fysiske struktur i et itsystem 43
Konklusion For at kunne udvikle en hensigtsmæssig database må man kende begrebsmodellen for det domæne der ligger bag datamodellen (databasestrukturen). Viden om begreberne i et domæne findes i oplysninger om begrebsrelationer, karakteristiske træk og definitioner (semantisk viden terminologisk ontologi). 44
3. Behov for samarbejde 45
Topontologi - FORVIR Udarbejdet af en arbejdsgruppe under FORVIR, Forum for Videndeling i Offentligt Regi, med deltagelse af mange medlemmer Formål: fælles definition af de generelle begreber, der bruges i definitioner af mere specifikke fællesoffentlige begreber Vision: udarbejdelse af begrebsmodeller for fællesoffentlige begreber ressourcer? Work in progress 46
Forvir topontologi øverste top 47
FORVIR: Udsnit af topontologi Aktivitet http://forvir.iterm.dk/ 48
Dagens opgave 49
Referencer Madsen, Bodil Nistrup (2012): Vejledning for begrebsarbejde i Kriminalforsorgen. Kriminalforsorgen og DANTERMcentret. Hentet 22-01-2014 på http://kriminalforsorgen.iterm.dk/search/filer/h%c3%a5ndbog%20i%20begrebsarbejde %202012-09-18.pdf Madsen, Bodil Nistrup, and Hanne Erdman Thomsen (2009). Terminological Concept Modelling and Conceptual Data Modelling. International Journal of Metadata, Semantics and Ontologies (IJMSO) 4(4): pp 239-249. Madsen, Bodil Nistrup and Hanne Erdman Thomsen (2015): Concept Modeling vs. Data modeling in Practice. Handbook of Terminology. (eds.) Hendrick J. Kockaert; Frieda Steurs. Vol. 1 Amsterdam: John Benjamins Publishing Company, pp 250-275. Madsen, Bodil Nistrup og Hanne Erdman Thomsen (2015): Når danske myndigheder taler forskelligt dansk: Begrebsafklaring med terminologiske ontogier, Globe: A Journal of Language, Culture and Communication, Special Issues 1, 2246-8838, s. 7-25. https://journals.aau.dk/index.php/globe/issue/download/142/17 50
Links Sundhedsdatastyrelsen http://sundhedsdatastyrelsen.dk/da/rammer-og-retningslinjer/om-terminologi/nbs http://sundhedsdata.iterm.dk/ Kriminalforsorgen http://kriminalforsorgen.iterm.dk/search/ Socialstyrelsen: find begreb http://www.socialebegreber.dk/begrebsarbejde/begrebsdatabasen/find_begreb Forum for begrebsmodellering i offentligt regi (FORVIR) www.forvir.dk FORVIRs begrebsbase http://blog.cbs.dk/forvir/topontologien/ http://forvir.iterm.dk (Login: FORVIR/FORVIR) 51