ISSN: LYKEION 11 LYKEION

Størrelse: px
Starte visningen fra side:

Download "ISSN: 1602-9259 LYKEION 11 LYKEION"

Transkript

1 ISSN: LYKEION nyt 11 LYKEION DANTERMcentret, Bernhard Bangs Allé 17 A, DK-2000 Frederiksberg T: , Fax: Juli 2003, redaktion: Mogens Ehrich Dette nummer indeholder bl.a. materiale fra workshop d. 30. april 2003 om datamodellering OBS: Torsdag d. 18 september er der ny workshop ved Carl Chr. Lassen: Rationaliseringens sprog - ca kl. 14, præcis tid og sted meddeles Abstract: Min observation er, at vi har oplevet en masse 'tre bogstavs navne' på metoder, principper, filosofier etc. igennem de seneste 25 år, der er dukket op, prædiket om, og forsvundet i glemslen igen. Hver gang man har set det nye lys, og har kigget det i kortene, så er det 'gammel vin' på nye flasker i nye indpakninger. I grund og bund drejer det sig om at sammensætte og strukturerer de fire grundlæggende elementer på en hensigtsmæssig måde: Lav noget, Kontroller det, Flyt det og Opbevar det. (Nyd både bogstavrim og rim: Make, Test, Move, Rest). Det er branche - u - specifikt! Det er 'prædikant' - u - specifikt! INDHOLD: Lise Borup: Modellering i logistikdomænet Side 2 Bodil Nistrup Madsen, Hanne Erdman Thomsen, Carl Vikner Resumé til brug ved workshop: Datamodellering og begrebsmodellering i terminologidomænet 5 Uddrag fra bog Viden om Viden, del 2 Forskning udgivet af DANTERMcentret 2002, side : Bodil Nistrup Madsen, Hanne Erdman Thomsen, Carl Vikner Computerstøttet opbygning af begrebssystemer Datamodellering og begrebsmodellering i terminologidomænet 8

2 Frederiksberg d NOTAT OM MODELLERING I LOGISTIKDOMÆNET v/lise Borup Inspirationen til at udarbejde et notat om logistik kommer fra højst forskellige kanter. Først og fremmest fra påvirkning af de problemer der er med modellering i byggeriet og fra det nyere initiativ 'Lean Construction' om byggeriets logistik. Men også fra påvirkningen af helt aktuelle begivenheder som krigen i Irak, der nu influeres af logistiske vanskeligheder eller forsyningsvanskeligheder. Der er to forskellige ordforklaringer på logistik i Gyldendals Fremmedordbog. Den første handler om ordets filosofiske betydning, og den anden om ordets mere praktiske betydning. Notatet handler om logistik i praktisk betydning, hvor ordbogen forklarer: 'højere forsyningstjeneste; beregningskunst vedr. flytning og forsyning af tropper'. Men det anbefales i høj grad at sætte sig ind i ordets filosofiske betydning, hvor Politikens filosofileksikon gør grundigt rede for logistikbegrebet, dets rødder og historie - herunder om logos og logik. Logistik set logisk og ontologisk ifølge Aristoteles Om logistik Logistik handler - ifølge ovenstående ordforklaring nr. 2 - om aktioner med flytning af ting/forsyninger i tid og rum. Dette involverer en stor mængde forskellige begreber hvoraf nogle er overordnede, og andre er mere underordnede. Uden en fungerende referenceramme for helheden af alle disse begreber og deres logiske og ontologiske sammenhænge, kan det være svært at organisere og holde styr på alle aktiviteterne og de ting som indgår i dem. Om den formale logik Efterfølgende om logikkens udvikling er baseret på kortfattede uddrag fra Jørgen Jørgensen 'Indledning til logikken og metodelæren' fra Uddragene blev brugt første gang i 'Notat vedr. tværfagligt seminar om begrebslæren bag moderne systemanalyse og systemkonstruktion' af , som blev fremlagt på første Lykeion møde i Dansk Standard d. 27. januar Udviklingen af logikken begyndte med den formale (eller formelle) logik i form af begrebs- eller navnelogikken hos grækeren Aristoteles ( f.kr.). Aristoteles erstattede Platons metafysiske eller overnaturlige idé-realisme med en begrebs-realisme baseret på begrebets iboende natur (eller tingenes væsen). Aristoteles forklarede eller definerede begreber som substans, klasser af slægter og arter, definitioner og egenskaber i sit arbejde med at udrede tingenes væsen. Egenskaber opdelte han i 9 hovedarter, der tilsammen med substansen udgør de 10 aristoteleske 'kategorier', som på en gang er de højeste begreber og de almeneste former for 'væren' eller 'eksistens'. Aristoteles 10 kategorier omfatter således en helhed af 'det værende' - en ontologi. SUBSTANS 1) Substans (Substans; Entitet; Eksistens; Sag; Objekt; Fænomen) EGENSKABER/PRÆDIKATER 2) Kvalitet (Kvalitet - ønskelig, verificerbar, målelig; Egenskabsværdier) 3) Kvantitet (Kvantitet, Måleenhed; Tal; Sum; Mængder) 4) Relation (Relation; Forbindelse; Reference; Association; Klasse/Klassifikation; Orden/Rækkefølge/Hierarki; Model; System etc) 5) Sted (Sted; Position/Lokalisering; Rum) 6) Tid (Tid; Tidspunkt; Periode; Varighed; Alder; Ældning) 7) Tilstand (Tilstand eller Konstitution - udfra iboende egenskaber som fx Materiale; Sanselige overfladekarakteristika; Vægt; Form; Struktur; Komposition mv) 8) Haven (Haven; Ejerskab; Ejendom; Penge; Kapital; Financiering mv) 9) Handlen (Handlen; Bevægelse; Aktion; Aktivitet; Proces; Produktion - inkl. Aktør/Agent ('Agency') som driver og indvirker på aktionen/processen mv) 10) Liden (Påvirkninger fra aktionen/processen på dens omgivelser/miljø inkl. 2

3 mennesker; Følelser) Efterfølgende gør Jørgen Jørgensen rede for de næste fire trin af logikkens udviklingshistorie, hvor 5 trin - ifølge Jørgen Jørgensen - udvikledes i begyndelse af 1900tallet i form af den symbolske eller matematiske logik (den gang kaldt for logistikken). Om begreberne i logistikdomænet Begreberne i logistikdomænet handler om aktioner/processer -> 9. Handlen med ting -> 1. Substans i tid -> 6. Tid og rum -> 5. Sted. Alle naturlige og menneskeskabte processer indebærer at tingene/substanser forandrer sig. I produktionsprocesser sker i reglen store forandringer i forvandlingen fra input til output. I flytteprocesser er der ofte ingen synlige tegn på forandringer, idet 'tingen' som flyttes er den samme set som input eller output - blot er den blevet ældre målt med flytningens varighed -> 6. Tid. For fordærvelige ting kan dette selvfølgelig have alvorlige konsekvenser, så jo kortere flyttetid jo mindre forældelse. Men en flytteaktion med fx mennesker (dyr og planter) kan være ufrivillig, hvor man bliver revet op med rode og har svært ved at komme over flytningen -> 10. Liden. Flytninger kan også betyde store forandringer af de steder -> 5. Sted, der flyttes fra og af de steder der flyttes til. Modellering af begreberne i logistikdomænet Efterfølgende eksempler på begreber i logistikdomænet og på begrebernes logiske og ontologiske relationer bør ikke betragtes som fuldt dækkende, men blot eksemplificeret for at give en idé om tankegangen. Der er ikke skelnet imellem logiske og ontologiske (berøring i tid og rum) relationstyper. 1. Substans Tingene/forsyningerne kan betragtes som -> 1. Substans. Tingene består af bestemte typer/arter/slags. Typerne kan være af en speciel slags eller en gruppe/samling af forskellige slags. Tingene - som substans - forvandles som input til output i aktionen/processen -> 9. Handlen. 2. Kvalitet Alle typerne af tingene -> 1. Substans har kvaliteter eller egenskaber -> 2. Kvalitet, hvoraf nogle har kvanticiferbare egenskabsværdier -> 4. Relation til -> 3. Kvantitet. Disse kvaliteter - som omfatter iboende egenskaber -> 7. Tilstand og deraf følgende relationsegenskaber som funktions- og reaktionsegenskaber/brugsegenskaber/ydeevner/kapaciteter (adfærd/performance) - forvandles i aktionen/processen -> 9. Handlen. 3. Kvantitet Alle typerne af ting/forsyninger -> 1. Substans er i x-antal eksemplarer -> 3. Kvantitet 4. Relation Nærværende eksemplificeres relationer mellem 2. Kvalitet og 3. Kvantitet - mellem 7. Tilstand og 2. Kvalitet - mellem 8. Haven og 3. Kvantitet - og mellem 9. Handlen og 10. Liden. Der er mange flere eksempler på relationer, idet fx 1. Substans har relationer til alle 9 egenskabskategorier. 9. Handlen har relationer til både 1. Substans, 2. Kvalitet, 3. Kvantitet, 5. Sted, 6. Tid, 7. Tilstand, 8. Haven og 10. Liden osv osv. 5. Sted Flytningen 9. Handlen foregår i rum eller steder, dvs at tingene flyttes fra et sted til et andet sted -> 5. Sted. Disse rum eller steder kan også - i visse situationer - betragtes som -> 1. Substans med specifikke egenskaber mht fast monterede redskaber og faciliteter for tingenes flytning, opbevaring eller placering -> 7. Tilstand 6. Tid Flytningen foregår i tid og drejer sig om bestemte tidspunkter og tidsperioder, dvs fra x tidspunkt til y tidspunkt -> 6. Tid. Flytningens varighed handler om -> 3. Kvantitet af -> 6. Tid 7. Tilstand Alle typerne af tingene har forskellige iboende egenskaber -> 7. Tilstand som fx kompositioner af forskellige

4 materialer og med -> 4. Relation til størrelser/rumfang og vægt/vægtfylde som kvantificerede egenskabsværdier -> 2. Kvalitet 8. Haven Flytninger kan være i forbindelse med køb og salg og deraf følgende nye ejerskaber af tingene - og i så fald om hvem der skal betale for flytningen -> 8. Haven. Ineffektive eller urationelle flytninger har en negativ effekt af værdien af den gavn mennesker kan have af flytningen i form af stigende priser på de flyttede ting -> 4. Relation til kvantificerbare priser -> 3. Kvantitet 9. Handlen Flytningen kan betragtes som en aktion, proces eller begivenhed -> 9. Handlen. Denne aktion er underkastet eller inkluderet vilkår af/fra agenter/aktører mv som driver og indvirker på aktionen. Disse agenter/indvirkere kan være hvad som helst (mennesker med deres intellekt, energi, maskiner/værktøjer mv) som samlet skaber aktionens vilkår. Flytningen foregår fx ved hjælp af 'flytteværktøjer' - redskaber/maskiner og mennesker (evt. dyr) hver for sig og i kombination dvs af agents som 'flytteværktøjer' og 'flytteaktører'. Alle typerne af ting/forsyninger - både som enkelttyper og som grupper af typer - må beskyttes af en beskyttelseskappe/emballage under flytningen. Emballagen har yderligere den funktion at skulle gøre flytningen lettere mht løft og transport, dvs at der udover agents som 'flytteværktøjer' og 'flytteaktører' er en 'agent' som emballage 10. Liden Flytteaktionerne -> 9. Handlen påvirker omgivelserne -> 10. Liden, idet der kan være mange forskellige belastninger af miljøet inkl. mennesker - idet fx påvirkninger af mennesker både handler om fysisk påvirkning og følelsesmæssig påvirkning. Flytteaktionernes overordnede formål og vilkår For de fleste ting gælder, at de flyttes flere eller mange gange i deres samlede livscyklus, dvs at der optræder flere eller mange aktioner med flytninger i tid og rum. Flytteaktionerne har - som regel - som formål at flytte tingene hen, hvor de skal bruges til et eller andet. Da tingene - set med menneskets øjne (inkl. visse religioner) - er skabt for at komme mennesker til gavn, er det klart at ineffektive flytteaktioner kan have en mere eller mindre direkte negativ effekt på værdien af den gavn, mennesker kan have af flytningen - fx stiger købsprisen på tingen, hvis købsprisen skal inkludere høje flytte- eller transportudgifter. Prisen for det færdige produkt vil også stige ved ineffektiv intern transport eller flytninger i forbindelse med de ting, som skal viderebearbejdes i fremstillingsprocesser eller produktion. Begrebet 'ineffektive flytninger' kan måske også siges at omfatte flytninger med store miljøpåvirkninger eller -belastninger -> 10. Liden. Derfor er kvaliteten af flytteaktioner af ting i tid og rum et vigtigt anliggende, og der er derfor udviklet logistiske værktøjer eller metoder for at gøre det nemmere at organisere og holde styr på flytteaktionerne (som inkluderer håndtering af materialer i mere eller mindre automatiseret industriel produktion). Nogle meget kendte metoder er oprindeligt udviklet i regi af det amerikanske forsvar (CALS-Computer Assisted Logistics System) og på de japanske bilfabrikker (Toyota Production System -> USA-Lean Construction). Der er også omfattende udviklinger af automatiserede transportsystemer som baseres på styring og kontrol ved hjælp af IT. 4

5 Datamodellering og begrebsmodellering i terminologidomænet Bodil Nistrup Madsen, Hanne Erdman Thomsen, Carl Vikner Institut for Datalingvistik, Handelshøjskolen i København I vores oplæg vil vi dels præsentere projektet CAOS (Computer Aided Ontology Structuring), som sigter mod at udarbejde et interaktivt værktøj til brug i forbindelse med opbygningen af ontologier 1 (begrebssystemer), dels redegøre for sondringen mellem datamodellering og begrebsmodellering. Computerstøttet opbygning af ontologier Et værktøj som CAOS vil være et uundværligt hjælpemiddel i forbindelse med den terminologiske analyse, som anvendes ved systematisk beskrivelse af begreber. En sådan beskrivelse og den deraf følgende afklaring af begrebsapparater og mulighed for entydig fastlæggelse af begreber er ikke kun vigtig i forbindelse med klassisk oversættelsesorienteret terminologiarbejde. Den er også en uomgængelig forudsætning for at kunne konstruere velfungerende IT-systemer til udførelse af informationssøgning, informationslagring og informationsudveksling. CAOS udfører begrebsmodellering på basis af en formalisering af karakteristiske træk og begrebsrelationer, som muliggør automatisering af nedarvningen af karakteristiske træk og forskellige inferenser vedrørende disse træk. Disse inferenser bruges til at udvikle metoder, som kan anvendes til støtte for terminologer ved opbygningen af begrebssystemer. Konceptet i CAOS går ud på, at når terminologen arbejder med opbygningen af et begrebssystem på grundlag af tekster om det pågældende faglige domæne, skal det være muligt for ham/hende at indtaste oplysninger om de forskellige begreber, efterhånden som de fremgår af teksten. Oplysningerne kan vedrøre begrebsbetegnelser, karakteristiske træk, relationer til andre begreber mm. For hver ny oplysning skal CAOS forsøge at indpasse oplysningen i den del af ontologien, der allerede er udarbejdet, idet brugeren gøres opmærksom på inkonsistenser og formelle fejl. CAOS-systemet skal arbejde sammen med den eksisterende terminologiske databaseapplikation DANTERM CBS, som tidligere er udviklet ved Institut for Datalingvistik på Handelshøjskolen i København. DANTERM CBS er derfor blevet udvidet med formaliseret information om begrebsrelationer og karakteristiske træk. Dette arbejde er baseret på en integrering af principper for formelle ontologier og traditionelle begrebssystemer. I CAOS-projektet har vi således udarbejdet en detaljeret struktur for en ontologisk database, og denne er blevet implementeret i ORACLE og forsynet med eksperimentelle data. Desuden har vi udarbejdet en række algoritmer til behandling af trækstrukturer og nedarvning i en relationel database, og en del af disse faciliteter er blevet implementeret i CAOS-systemet. I forbindelse med vores oplæg vil vi demonstrere nogle af faciliteterne i systemet. 1 Domænespecifikke ontologier og begrebssystemer har meget til fælles, eftersom begge beskriver begreber og deres relationer, men de er ofte forskellige med hensyn til formaliseringsgrad.

6 Datamodellering og begrebsmodellering Et særligt problem - der ikke er specifikt for CAOS-systemet, men som dog er blevet aktualiseret under vores arbejde med projektet - er sondringen mellem datamodellering og begrebsmodellering. Datamodellering 2 kan fx udføres ved hjælp af E/R-diagrammer, begrebsmodellering er derimod etableringen af begrebssystemer (eller ontologier). I mange arbejder behandles de to aktiviteter som en og samme ting. At dette ikke er tilfældet, og at det tværtimod er vigtigt at skelne, vil vi argumentere for i vores oplæg. Det er velkendt at det er umuligt at udarbejde en hensigtsmæssig databasestruktur, hvis man ikke er fortrolig med de centrale begreber i det domæne, som databasen skal dække. Viden om begreberne i et domæne udtrykkes ved hjælp af karakteristiske træk og oplysninger om relevante begrebsrelationer, som tilsammen danner basis for udarbejdelse af definitioner. Denne form for viden kaldes også semantisk viden. Begrebsrelationer repræsentere 3 s i begrebssystemer, og et eller flere begrebssystemer inden for et givet domæne udgør en begrebsmodel for domænet. Det er imidlertid meget vigtigt at understrege, at der ikke er nogen en-til-en korrelation mellem et begrebssystem (eller en ontologi) for begreberne i et databasedomæne på den ene side og databasestrukturen på den anden side. Dette gælder for en terminologisk database, som er baseret på viden om begreberne inden for terminologidomænet, men det gælder også for databaseapplikationer i andre domæner. Begrebssystemer og datamodeller har noget til fælles, men de er også forskellige fra hinanden. Disse forskelle er meget indlysende, når man sammenligner begrebssystemer med databasestrukturer i relationelle databaser (repræsenteret ved hjælp af entitets/relationsdiagrammer). Forskellene er måske lidt mindre indlysende - men stadig reelle - når man sammenligner begrebssystemer med objektorienterede datastrukturer, som fx strukturer beskrevet ved hjælp af EER (Enhanced Entity-Relationship modelling) eller UML (Unified Modelling Language). Entitets/relations-modellering bliver sommetider omtalt som semantisk modellering. Denne omstændighed bidrager måske også til den misforståelse, at begrebsmodellering skulle være ækvivalent med datamodellering. Imidlertid indeholder entitets/relations-diagrammer ikke semantisk information, dvs. karakteristiske træk og begrebsrelationer vedrørende de begreber, der ligger til grund for databasestrukturen. Ved beskrivelsen af Enhanced Entity-Relationship modellering bruges begreber som specialisering/generalisering, nedarvning af attributter, aggregering og komposition, hvilket måske også kan minde om de tilsvarende lingvistiske begreber: under-/overordning, nedarvning af karakteristiske træk og del-helheds-relationer. De begreber, der bruges ved datamodellering, adskiller sig imidlertid fra de begreber, der bruges ved begrebsmodellering. Diskussionen i vores indlæg er også motiveret af, at nogle omtaler en databases struktur som ontologien for den pågældende database. I et begrebssystem repræsenteres et begrebs karakteristiske træk ved hjælp af trækspecifikationer i form af attribut-værdi-par, jf. eksemplet i figur 1. Disse trækspecifikationer giver information om begrebets betydningsindhold. 2 3 I databaselitteraturen findes forskellige definitioner af datamodellering, men vi vil her bruge databasestrukturering og datamodellering som synonymer. 6

7 1 pant 1.1 PLACERING 1.2 GENSTAND håndpant [PLACERING: panthaver] underpant [PLACERING: pantsætter] pant i fast ejendom [GENSTAND: jord og bygninger] pant i løsøre [GENSTAND: let transportabel] pant i rettigheder [GENSTAND: økonomiske goder] håndpant i løsøre underpant i fast ejendom Figur 1: Uddrag af begrebssystem for panteretstyper En indlysende forskel mellem datamodellering og begrebsmodellering består i, at de attributter, der er knyttet til entitetstyperne i et entitets/relations-diagram, ikke giver oplysninger om entitetstypens betydning. De specificerer kun, hvilken slags information der vil blive registreret om de entiteter, der repræsenteres af den pågældende entitetstype. Specifikationen af domænet for en attribut giver information om attributtens mulige værdier, men dette giver stadig ingen information om entitetstypens betydning; det svarer derimod til en slags ekstensional definition af attributten. Attributværdierne beskriver de enkelte entiteter, ikke det begreb, som ligger til grund for entitetstypen. En anden forskel mellem datamodeller og begrebsmodeller er, at der ikke er nogen en-til-en korrespondens mellem begreberne i en begrebsmodel for et domæne på den ene side og entitetstyperne i et entitets/relations-diagram for en database i det samme domæne på den anden side. I vores oplæg vil vi redegøre nærmere for disse forskelle og give eksempler bl.a. fra terminologidomænet.

8 Viden om viden Del 2 - Forskning Slutrapport for projektet Udvikling af metoder og værktøjer til oprettelse og drift af virksomhedsinterne terminologibaser DANTERMcentret

9 Viden om viden Del 2 - Forskning Slutrapport for projektet Udvikling af metoder og værktøjer til oprettelse og drift af virksomhedsinterne terminologibaser 2002 DANTERMcentret, København 1. udgave, 1. oplag 2002 Layout og omslag: DANTERMcentret Sat med: Bembo Tryk og indbinding: Prinfo Kolding ISBN DANTERMcentret Bernhard Bangs Allé 17A DK-2000 Frederiksberg Tlf Fax Internet Enhver gengivelse fra denne bog, på tryk eller elektronisk, må kun ske med DANTERMcentrets skriftlige tilladelse. Kopiering fra bogen må foretages i henhold til lov om ophavsret af 14. juni 1995 med senere ændringer. Citat i anmeldelser er tilladt med angivelse af kilde.

10 3 Indholdsfortegnelse Del 2 - Forskning Forord...5 Målsætning, projektplan og organisation...9 Resultater og perspektiver...25 Indlæg og rapporter Korpuslingvistik Kirchmeier-Andersen, Sabine: ParaT Parallelle Tekster. Identifikation af termkandidater i parallelle korpora...31 Weilgaard, Lotte: På datafangst hvad repræsenterer verber som kalde, karakterisere og andre?...47 Terminologi og vidensrepræsentation Madsen, Bodil Nistrup, Hanne Erdman Thomsen & Carl Vikner: Rapport over CAOS-projektet Madsen, Bodil Nistrup, Hanne Erdman Thomsen & Carl Vikner: Computerstøttet opbygning af begrebssystemer...99 Madsen, Bodil Nistrup, Hanne Erdman Thomsen & Carl Vikner: Datamodellering og begrebsmodellering i terminologidomænet Picht, Heribert: Repræsentationsformer for begreber og genstande Toft, Bertha: Kan terminologen og objekt-analytikeren bruge hinanden til noget? Teksthukommelses-systemer Christensen, Tina Paulsen: Translation Memory-systemer som værktøj til oversættelse af juridiske tekster

11 4 Andre sprogteknologiske værktøjer Feil, Ruth: Hybride systemer Nielsen, Tina: Optimizing Computer Assisted Learning Applications for Teaching Language Technology A view on the pedagogical aspect Appendikser Appendiks A: Liste over deltagere i forskningsaktiviteterne Appendiks B: Oversigt over DANTERM-seminarer og workshops Appendiks C: Oversigt over indlæg og publikationer vedrørende de enkelte forskningstemaer Appendiks D: Alfabetisk liste over forfattere og publikationer i relation til emnerne i DANTERM-centerkontrakten...243

12 99 Computerstøttet opbygning af begrebssystemer af Bodil Nistrup Madsen Hanne Erdman Thomsen Carl Vikner

13 100 COMPUTERSTØTTET OPBYGNING AF BEGREBSSYSTEMER Indholdsfortegnelse Abstract Indledning Artiklens formål Beslægtede projekter Den oprindelige terminologiske database Formalisering af terminologiske begrebssystemer Integrering af trækspecifikationer i den relationelle databaseapplikation Nedarvning Indsættelse af nye begreber Flytning af begreber Etablering af polyhierarki Inddelingskriterier Afsluttende bemærkninger Referencer

14 COMPUTERSTØTTET OPBYGNING AF BEGREBSSYSTEMER 101 Abstract Denne artikel beskriver den udvidelse af terminologidatabasen DANTERM CBS, som er lavet inden for rammerne af CAOSprojektet. Formålet med udvidelsen er at formalisere oplysningerne om begrebssystemer, således at det bliver muligt at foretage halvautomatisk opbygning af begrebssystemer, eller ontologier. Ved formaliseringen benyttes trækstrukturer, som muliggør automatisering af nedarvningen af karakteristiske træk og af forskellige inferenser vedrørende disse træk. Disse inferenser bruges til at udvikle metoder, som kan anvendes i et computersystem til støtte for terminologer ved opbygningen af begrebssystemer. 1 Indledning I terminologiarbejde er begrebssystemer et uundværligt hjælpemiddel til at bringe orden i det kaos af termer, som oversættere og andre ofte udsættes for, når de begynder at arbejde med tekster inden for et givet fagområde. Det er imidlertid et meget vanskeligt og tidrøvende arbejde at opbygge sit eget begrebssystem for et bestemt område, og der bruges utrolig megen tid på at rette i udkast, så snart et begrebssystem er blevet bare en lille smule kompliceret. Dette er baggrunden for at Institut for Datalingvistik og DANTERMcentret arbejder på et projekt, hvis formål er at udvikle et computersystem, der kan lette dette arbejde: CAOS - Computer Aided Ontology Structuring (Madsen et al., 1999). En nødvendig forudsætning for at kunne konstruere et sådant computersystem er en formalisering af selve terminologiarbejdet, som traditionelt udføres ret uformelt. I CAOSprojektet erstattes de uformelle begrebssystemer derfor med formelle ontologier.

15 102 COMPUTERSTØTTET OPBYGNING AF BEGREBSSYSTEMER 2 Artiklens formål I denne artikel vil vi vise, hvordan integrationen af formelle trækstrukturer i et eksisterende terminologisk databasesystem kan bruges til at hjælpe terminologer ved opbygningen af begrebssystemer. I det følgende omtales først nogle beslægtede projekter (afsnit 3). I afsnit 4 gives en kort præsentation af den relationelle databaseapplikation DANTERM CBS. I afsnit 5 beskrives formaliseringen af begrebssystemer ved hjælp af formelle trækstrukturer, der modellerer nedarvning af karakteristiske træk. I afsnit 6 viser vi, hvorledes denne formalisering integreres i den oprindelige databaseapplikation, og på hvilke måder brugere kan få hjælp ved indsættelsen af begreber i et begrebssystem. Til sidst beskrives i afsnit 7, hvordan inddelingskriterier fra traditionelt terminologiarbejde kan håndteres formelt i CAOS. 3 Beslægtede projekter Et andet projekt, der arbejder med anvendelsen af vidensbaserede metoder i terminologiarbejde, er COGNITERM projektet 1. I dette projekt bruges en formalisering, der er beslægtet med trækstrukturer, til at repræsentere begrebers karakteristiske træk, og de udviklede systemer har automatisk nedarvning, men de konsistenstjek, som bruges i CAOS, er mere omfattende end den simple påvisning af værdikollision, som beskrives i Meyer et al. (1997: 116). Cimino (2001) beskriver metoder til anvendelse af viden om karakteristiske træk ved automatisk eller interaktiv placering af begreber i en ontologi med polyhierarkisk nedarvning. Fremgangsmåden er baseret på viden om nedarvning af træk, og ligner således det der er planlagt i CAOS, men systemet 1

16 COMPUTERSTØTTET OPBYGNING AF BEGREBSSYSTEMER 103 (MED) er designet specielt med henblik på sundhedsområdet og opererer med en afgrænset mængde af attributter (relationer + attributter i Ciminos teminologi), hvor vi foreslår en ubegrænset mængde. Dette skyldes at vi har konstateret, at der inden for specifikke fagområder kan optræde meget specialiserede adskillende træk, således at de ikke kan udvælges og afgrænses, før terminologiarbejdet påbegyndes. 4 Den oprindelige terminologiske database I den oprindelige DANTERM CBS -database kan der lagres oplysninger af mange forskellige slags om terminologi på et ubegrænset antal sprog. Dataorganiseringen er begrebsorienteret, hvilket betyder at alle synonymer registreres som termudtryk hørende til det samme begreb, dvs med én enkelt definition, i modsætning til en ordorienteret datastrukturering, hvor ét udtryk kan være registreret med mange betydninger, og følgelig mange definitioner (se også Madsen 1998a). Figur 1: Begrebsrelaterede oplysninger i DANTERM CBS

17 104 COMPUTERSTØTTET OPBYGNING AF BEGREBSSYSTEMER Som det kan se i figur 1 vises kun termer på to sprog samtidigt for brugeren. I hovedvinduet præsenteres de vigtigste informationstyper, nemlig nogle begrebsrelaterede oplysninger som fx klassifikation (fælles for de to sprog) og definition med kildeangivelse, og nogle termrelaterede oplysninger som fx termer med tilhørende grammatiske oplysninger. For begge sprog kan der vises flere oplysninger, både begrebs- og termrelaterede. I figur 1 ses et pop-up vindue, der indeholder yderligere begrebsrelaterede oplysninger i forbindelse med det engelske begreb mortgage. De interessanteste oplysningstyper i denne forbindelse er dem, der vedrører begrebssystemet og de relaterede begreber, repræsenteret ved en term. For det første vises navnet på begrebssystemet og positionen for det aktuelle begreb i form af en numerisk notation i overensstemmelse med DIN Dernæst vises en liste med de relaterede begreber. Relationen angives ved hjælp af en notation, der ligner den, der bruges i tesaurusser til indeksering, efterfulgt af et af termudtrykkene for det relaterede begreb. 5 Formalisering af terminologiske begrebssystemer Som det fremgår af figur 1, er de oplysninger der for øjeblikket registreres i DANTERM CBS ikke formaliseret, og de udarbejdes af terminologen inden de indtastes i databasen, som regel uden brug af formelle værktøjer. Et tegn på den manglende formalisering af dataene er, at relaterede begreber repræsenteres ved et af deres termudtryk i stedet for ved en begrebsrelateret oplysning, som fx ID-nummeret. Selv om man i stedet vælger at registrere begrebets ID-nummer, kan man stadig vælge at præsentere et af termudtrykkene for brugeren.

18 COMPUTERSTØTTET OPBYGNING AF BEGREBSSYSTEMER 105 Vi har tidligere foreslået, at terminologer skulle bruge formelle trækspecifikationer 2 til at modellere begrebers karakteristiske træk (se Thomsen 1998, 1999 og Madsen 1998b). Dette ligner den fremgangsmåde, der beskrives i Meyer et al. (1997). top mortgage mortgage chattel of immovables mortgage OBJECT: immovables OBJECT: movables equitable mortgage CREATION : general words legal mortgage CREATION : legal charge Figur 2: Begrebssystem med trækspecifikationer Brugen af trækspecifikationer kan illustreres med begrebet equitable mortgage, der har det karakteristiske træk 'created by general words (herein differing from a legal mortgage)', som findes formuleret i en skriftlig kilde. Dette kan fx repræsenteres formelt ved at tildele begrebet trækspecifikationen [CREATION: general words] som vist i figur 2. Alle underbegreber til equitable mortgage har også dette karakteristiske træk. Dette afspejles i formaliseringen og i CAOS-systemet ved, at trækspecifikationen nedarves til alle begreber, der er underordnet equitable mortgage. Formaliseringen gør det muligt at udvikle computersystemer, som kan udføre konsistenstjek som beskrevet i de følgende afsnit. En anden fordel ved formaliseringen er, at dataene kan anvendes til andre formål, hvor der bruges formelle ontologier, som fx ontologibaseret informationssøgning, jf. projektet OntoQuery (se Andreasen et al. 2002a og Andreasen et al. 2002b). 2 Om formelle trækspecifikationer, se Carpenter (1992).

HÅNDBOG I BEGREBSARBEJDE DEL 1: PRINCIPPER

HÅNDBOG I BEGREBSARBEJDE DEL 1: PRINCIPPER HÅNDBOG I BEGREBSARBEJDE DEL 1: PRINCIPPER 2005 Håndbog i begrebsarbejde Principper og metoder for arbejdsgrupperne nedsat af Det Nationale Begrebsråd for Sundhedsvæsenet Del 1: Principper Bodil Nistrup

Læs mere

HVAD MED EN PERSONLIG HJEMMESIDE? KLASSISKE OG MODERNE ONTOLOGIER

HVAD MED EN PERSONLIG HJEMMESIDE? KLASSISKE OG MODERNE ONTOLOGIER ISSN: 1602-9259 LYKEION nyt 14 LYKEION DANTERMcentret, Bernhard Bangs Allé 17 A, DK-2000 Frederiksberg T: 38153371, Fax: 38153820 November 2004, redaktion: Mogens Ehrich INDHOLD: Side Arrangementer og

Læs mere

DEL 2: METODER OG ARBEJDSFORLØB HÅNDBOG I BEGREBSARBEJDE

DEL 2: METODER OG ARBEJDSFORLØB HÅNDBOG I BEGREBSARBEJDE DEL 2: METODER OG ARBEJDSFORLØB 2006 HÅNDBOG I BEGREBSARBEJDE Håndbog i begrebsarbejde Principper og metoder for arbejdsgrupperne nedsat af Det Nationale Begrebsråd for Sundhedsvæsenet Del 2: Metoder og

Læs mere

Terminologiske og leksikografiske udfordringer hos e-conomic international a/s en undersøgelse af tilgange til oprettelse af en termbase i MultiTerm

Terminologiske og leksikografiske udfordringer hos e-conomic international a/s en undersøgelse af tilgange til oprettelse af en termbase i MultiTerm Cand.ling.merc, engelsk, TT CBS December 2011 Terminologiske og leksikografiske udfordringer hos e-conomic international a/s en undersøgelse af tilgange til oprettelse af en termbase i MultiTerm Specialeskriver:

Læs mere

Mønstre en indføring i analyse-, design- og arkitekturmønstre

Mønstre en indføring i analyse-, design- og arkitekturmønstre Mønstre en indføring i analyse-, design- og arkitekturmønstre COT/4-07-V2.2 C * O T Center for Revisionshistorie: 12.01.99 v.0 Første udgave 9.02.99 v.1.0 Anden udgave 27.04.99 v.2 Endelig version 10.05.99

Læs mere

Men læs nu selv rapporten, inden du nedenfor læser formandskabets tanker derom.

Men læs nu selv rapporten, inden du nedenfor læser formandskabets tanker derom. LYKEION nyt Nr.5. - December 2000 Dette nummer af Lykeion Nyt er reserveret Mogens Ehrichs rapportering af samtalerne med alle jer, der interesserer sig for Lykeions formål. At det udsendes på mail, er

Læs mere

Daniel Mogens Ham, Jens Ehlert Lassen Roskilde Universitet, CBIT December, 2009. Data, Information og Procesforbedring i Ejendomsformidlingsbranchen

Daniel Mogens Ham, Jens Ehlert Lassen Roskilde Universitet, CBIT December, 2009. Data, Information og Procesforbedring i Ejendomsformidlingsbranchen Daniel Mogens Ham, Jens Ehlert Lassen Roskilde Universitet, CBIT December, 2009 Data, Information og Procesforbedring i Ejendomsformidlingsbranchen INDHOLDSFORTEGNELSE 1 - INDLEDNING... 4 1.1 - CASEN...

Læs mere

En undersøgelse af en syntese mellem den relationelle og den objektorienterede databasemodel

En undersøgelse af en syntese mellem den relationelle og den objektorienterede databasemodel Hovedopgave, Datanomuddannelsen ved Niels Brock - Copenhagen Business College Forårssemesteret 1998 En undersøgelse af en syntese mellem den relationelle og den objektorienterede databasemodel Illustration

Læs mere

Fjernundervisning i Prak sis

Fjernundervisning i Prak sis FKOPUB PS. 180-10 Fjernundervisning i Prak sis Fjernundervisning i Praksis Fjernundervisning i Praksis er udgivet af Forsvarsakademiet, Fakultetet for Militærpsykologi, Ledelse og Pædagogik og Center

Læs mere

Ontologier og metadata i relation til søgning i tekster

Ontologier og metadata i relation til søgning i tekster Ontologier og metadata i relation til søgning i tekster Bolette S. Pedersen, Costanza Navarretta, Dorte Haltrup Hansen VID-rapport nr. 2 Center for Sprogteknologi Oktober 2003 Center for Sprogteknologi

Læs mere

Dynamisk dokumentation - En metode til at understøtte Enterprise Architecture i en serviceorienteret verden

Dynamisk dokumentation - En metode til at understøtte Enterprise Architecture i en serviceorienteret verden Dynamisk dokumentation - En metode til at understøtte Enterprise Architecture i en serviceorienteret verden -Speciale ved Peter Gaarde Dejbjerg Jensen IT-Universitetet, juni 2006 -Vejleder: John Gøtze

Læs mere

Forord. Aalborg Universitet, d. 5. januar 2001. Nikolaj Kolbe. Mike H. Hougaard. Flemming N. Larsen

Forord. Aalborg Universitet, d. 5. januar 2001. Nikolaj Kolbe. Mike H. Hougaard. Flemming N. Larsen Forord Denne rapport er skrevet af projektgruppe N4-211 ved Aalborg Universitet, afdeling for datalogi. Rapporten er baseret på gruppens arbejde foretaget ved VR-Center Nord og med brug af dette centers

Læs mere

Internettet i eksportens tjeneste

Internettet i eksportens tjeneste Internettet i eksportens tjeneste Formålet med denne rapport er at angive nogle tendenser til en konceptuel forståelse af, hvorledes små og mellemstore virksomheder (SM-virksomheder) kan anvende Internettet

Læs mere

Christopher, Andreas og Christian VINOPERTEN. En elektronisk vinekspert. 2. semeterprojekt

Christopher, Andreas og Christian VINOPERTEN. En elektronisk vinekspert. 2. semeterprojekt VINOPERTEN En elektronisk vinekspert 2. semeterprojekt Christopher, Andreas og Christian Vinoperten Elektronisk Vinekspert Roskilde Universitet 2014 Humanistisk Teknologisk Basisstudium 2. semester Et

Læs mere

Relationel forståelse i matematisk problemløsning, hvori ligninger indgår Projekttype: Professionsprojekt - formidling

Relationel forståelse i matematisk problemløsning, hvori ligninger indgår Projekttype: Professionsprojekt - formidling Relationel forståelse i matematisk problemløsning, hvori ligninger indgår Projekttype: Professionsprojekt - formidling IMFUFA, RUC Studerende: Lotte Juul Larsen John Sorth-Olsen Censor: Bent Hirsberg Eksaminator:

Læs mere

Lean og det psykosociale arbejdsmiljø

Lean og det psykosociale arbejdsmiljø Mads W. Schøtt-Bejegaard Lean og det psykosociale arbejdsmiljø! Cand.Soc.HRM Lean og det psykosociale arbejdsmiljø - En beskrivelse af spændingsfeltet mellem Lean og det psykosociale arbejdsmiljø i Jobcenter

Læs mere

PERFEKTE PROCESSER PRAKTISK FORLAG

PERFEKTE PROCESSER PRAKTISK FORLAG PERFEKTE PROCESSER RUNE JOSEFSEN KRISTIAN STEEN HOLME JOAKIM BÆKGAARD PERFEKTE PROCESSER PRAKTISK FORLAG Perfekte processer 2014 Praktisk Forlag 1. Udgave, reviderede udgave 2014 Omslag: Marta Podolska

Læs mere

Indholdsfortegnelse. 2 af 80

Indholdsfortegnelse. 2 af 80 Forord Med denne opgave vil vi gerne rette en stor tak til HMN Naturgas. Særligt til medarbejderne i Kundeservice, for deres åbenhed, venlighed og samarbejdsvilje i forbindelse med de observationer og

Læs mere

Værdistyret informationsarkitektur til GIS

Værdistyret informationsarkitektur til GIS Værdistyret informationsarkitektur til GIS Standard for design og udvikling af Kort & Matrikelstyrelsens GIS- og kartografiydelser Kort & Matrikelstyrelsen version 1.0 19. februar 2007 2 Kort & Matrikelstyrelsen,

Læs mere

BETA-VERSION. Systime SO2. Birgitte Merci Lund Dorte Blicher Møller. stime. Du har ikke ret til at kopiere eller distribuere pdf en. Forlaget Systime.

BETA-VERSION. Systime SO2. Birgitte Merci Lund Dorte Blicher Møller. stime. Du har ikke ret til at kopiere eller distribuere pdf en. Forlaget Systime. Birgitte Merci Lund Dorte Blicher Møller SO2 stime SO2 2009 Birgitte Merci Lund, Dorte Blicher Møller og Systime A/S Kopiering og anden gengivelse af dette værk eller dele deraf er kun tilladt efter reglerne

Læs mere

Kravspecifikation for Business Intelligence System

Kravspecifikation for Business Intelligence System Kravspecifikation for Business Intelligence System Forord Denne kravspecifikation er udarbejdet af Business Intelligence-gruppen under Knowledge Lab. Kravspecifikationen er udarbejdet som led i opfyldelsen

Læs mere

Et begrebssystem for. informationssikkerhed

Et begrebssystem for. informationssikkerhed Rapport fra nbs06 Informationssikkerhed Side 1 af 150 Et begrebssystem for informationssikkerhed Rapport fra arbejdsgruppe nbs06 under Det Nationale Begrebsråd for Sundhedsvæsenet Maj 2006 Rapport fra

Læs mere

Thomas Holme Hansen Marie Lund Klujeff Henrik Kaare Nielsen VEJLEDNING I AKADEMISK OPGAVE- SKRIVNING VED INSTITUT FOR ÆSTETISKE FAG AARHUS UNIVERSITET

Thomas Holme Hansen Marie Lund Klujeff Henrik Kaare Nielsen VEJLEDNING I AKADEMISK OPGAVE- SKRIVNING VED INSTITUT FOR ÆSTETISKE FAG AARHUS UNIVERSITET Thomas Holme Hansen Marie Lund Klujeff Henrik Kaare Nielsen VEJLEDNING I AKADEMISK OPGAVE- SKRIVNING VED INSTITUT FOR ÆSTETISKE FAG AARHUS UNIVERSITET 2. udgave 2009 THOMAS HOLME HANSEN, MARIE LUND KLUJEFF,

Læs mere

OnLibri.dk. Access 2007. Torben Lage Frandsen. Download gratis bøger på ventus.dk / BookBoon.com

OnLibri.dk. Access 2007. Torben Lage Frandsen. Download gratis bøger på ventus.dk / BookBoon.com Access 2007 Torben Lage Frandsen 2008 Torben Lage Frandsen & OnLibri Alle rettigheder forbeholdes. Ingen del af denne bog må gengives, lagres i et søgesystem eller transmitteres i nogen form eller med

Læs mere

Punkt 2. "Kommunen Kommunikerer Kloak" Printversion

Punkt 2. Kommunen Kommunikerer Kloak Printversion Punkt 2. "Kommunen Kommunikerer Kloak" Printversion Punkt 2. Sådan gør du Dette er projektets værktøjskasse. Værktøjskassen kan benyttes som en trin for trin vejledning, der fortæller, hvordan en kloakforsyning

Læs mere

TAVS VIDEN Oversigtsanalyse med udgangspunkt i Michael Polanyi s The Tacit Dimension og 48 udvalgte artikler

TAVS VIDEN Oversigtsanalyse med udgangspunkt i Michael Polanyi s The Tacit Dimension og 48 udvalgte artikler KANDIDATAFHANDLING VED INSTITUT FOR ORGANISATION OG LEDELSE FORFATTER: SINE JUUL-OLSEN STUD. NR.: 25 38 19 VEJLEDER: THORKILD B. JØRGENSEN TAVS VIDEN Oversigtsanalyse med udgangspunkt i Michael Polanyi

Læs mere

Evaluering af D2i -Design to innovate

Evaluering af D2i -Design to innovate Evaluering af D2i -Design to innovate Udarbejdet af LB Analyse og SDU for for D2i - Design to innovate Februar 2015 Indhold 1 Indledning... 3 1.1 Formål og målgruppe... 3 1.2 Aktiviteter i projektet...

Læs mere

Videnregnskabers struktur og indhold?

Videnregnskabers struktur og indhold? Oktober 1999 Videnregnskabers struktur og indhold? Per Nikolaj D. Bukh, Aarhus Universitet Jan Mouritsen, Handelshøjskolen i København Heine Thorsgaard Larsen, Handelshøjskolen i København Resume Videnregnskabet

Læs mere

Matematik for lærerstuderende Omega 4.-10. klassetrin

Matematik for lærerstuderende Omega 4.-10. klassetrin Matematik for lærerstuderende Omega 4.-10. klassetrin 71190_omega_4k.indd 1 27-06-2008 10:13:42 71190_omega_4k.indd 2 27-06-2008 10:13:42 John Schou, Jeppe Skott, Kristine Jess og Hans Christian Hansen

Læs mere

Ontologibaseret teksthåndtering med sprogteknologi

Ontologibaseret teksthåndtering med sprogteknologi Ontologibaseret teksthåndtering med sprogteknologi Bolette S. Pedersen, Costanza Navarretta & Dorte Haltrup Hansen VID-rapport nr. 6 Center for Sprogteknologi Marts 2005 Center for Sprogteknologi 2003

Læs mere