Ontologier og metadata i relation til søgning i tekster

Størrelse: px
Starte visningen fra side:

Download "Ontologier og metadata i relation til søgning i tekster"

Transkript

1 Ontologier og metadata i relation til søgning i tekster Bolette S. Pedersen, Costanza Navarretta, Dorte Haltrup Hansen VID-rapport nr. 2 Center for Sprogteknologi Oktober 2003

2 Center for Sprogteknologi 2003 Rapporten kan fås ved henvendelse til CST, eller hentes fra CST s hjemmeside VID-projektet er støttet af Center for IT-forskning (nu overgået til Forskningsstyrelsen). II

3 Om VID: Viden- og Dokumenthåndtering med sprogteknologi Der er et udtalt behov hos danske virksomheder for at kunne supplere deres eksisterende sproglige kompetence og viden med sprogteknologiske IT-værktøjer og metoder som dels kan støtte medarbejderne, dels forankre viden og processer i virksomhedens ITsystemer, dels danne grundlag for den udvikling der kræves hvis virksomhederne skal overleve og vokse i den stadigt mere globaliserede økonomi. VID-projektet er et forsknings- og udviklingsprojekt der har til formål at udforske de forskellige muligheder som sprogteknologi frembyder inden for informationssøgning og dokumentproduktion, og at understøtte de deltagende virksomheder i at udvikle værktøjer til bedre udnyttelse af egen viden, samt til bedre og mere effektiv produktion af dokumentation, herunder flersproget dokumentation. Foruden CST omfatter projektet på den ene side virksomhederne Bang & Olufsen A/S, Zacco A/S og Nordea A/S, som i dette projekt udgør teknologiens brugere, på den anden Navigo Systems A/S og Ankiro, som er teknologiproducenter. Projektet omfatter følgende forskningsopgaver: analyse af de tekstuelle data virksomhederne skal kunne håndtere for at kunne fastlægge tesauruser/ontologier for de relevante semantiske domæner, undersøgelse af den bedst egnede formalisme/teknologi til at udtrykke disse; afdækning og videreudvikling af sprogteknologiske komponenter til brug for automatisk tekstklassifikation og begrebsorienteret informationssøgning, indbefattende tilpasning af sprogteknologiske 'basismoduler' til opmærkning af tekst; udforskning af flertydighed i tekstuelle data som kan vanskeliggøre informationssøgning; ligeledes den omvendte problematik: at samme indhold kan udformes forskelligt rent sprogligt og derfor kan være svær at fremfinde i store datamængder; forskning inden for kontrolleret sprog - også set i et flersproget perspektiv - til brug for dokumentproduktion; herunder analyse af den sprogstil og tone som virksomhederne ønsker at anvende, samt opstilling af modeller for dette sprog; undersøgelse af hvilke sprogteknologiske metoder der kan anvendes til denne kvalitetssikring af dokumentproduktionen i form af f.eks. termstyring og grammatikkontrol. Projektet er støttet af Center for IT-forskning og løber i perioden III

4

5 Indhold 1 Indledning Ontologi en strukturering af begreber Indledning Forskellige perspektiver på ontologier Eksempler på formelle top-ontologier Upper Cyc Ontology DOLCE (A Descriptive Ontology for Linguistic and Cognitive Engineering) KR Ontology (Sowas Knowledge Representation Ontology) SUMO (Suggested Upper Merged Ontology) Domæneontologier til informationssystemer CIDOC Conceptual Reference Model (CRM) DAML (DARPA Agent Markup Language) Eksempler på lingvistiske ontologier og leksikalske net Princeton WordNet EuroWordNet SIMPLE-ontologien MikroKosmos Konkluderende bemærkninger Metadata til beskrivelse af dokumenter Hvad er metadata Metadatasystemer Dublin Core Metadata Dublin Core element set Brug af Dublin Core Automatisk behandling af Dublin Core Repræsentation af Dublin Core Værktøjer til generering af Dublin Core Automatisk generering af danske Dublin Core metadata Konkluderende bemærkninger Formelle sprog og værktøjer Formelle sprog Traditionelle formelle sprog til videnrepræsentation Web-baserede formelle sprog til videnrepræsentation Fælles protokoller og formater til udveksling af eksisterende videnbaser Værktøjer Værktøjer til at opbygge og editere ontologier Værktøjer til at sammenflette ontologier Evalueringsværktøjer Konkluderende bemærkninger...42 Referencer...45 V

6

7 1 Indledning Med den eksplosive udbredelse af elektroniske dokumenter inden for offentlige institutioner, i private virksomheder og på internettet, er der opstået stigende behov for at kunne systematisere tekster og den viden de indeholder, således at søgning i dem kan effektiviseres. I de senere år har søgning i tekster ændret sig fra at være rent strengbaseret til at anvende mere og mere videnbaserede teknikker. Fælles for disse tilgange er at der anvendes metadata i en eller anden form, således at man ved hjælp af nogle overordnede indholdskategorier kan klassificere og referere til viden. Disse metadata kan bestå af simple, standardiserede kategorier som det ses i fx Dublin Core Metadata, hvor man bl.a. kan definere en teksts forfatter og emne i dertil indrettede felter til brug for kategorisering og efterfølgende søgning. Eller de kan være strukturerede i form af ontologier bestående af flere hundrede eller flere tusinde begreber med en rig intern struktur i form af relationer på kryds og tværs. Sådanne ontologier kan udnyttes i søgning til at repræsentere elementer af tekstindhold i et formelt sprog. Et helt simpelt eksempel på dette er problemet med forskellige udtryk i tekster der har den samme betydning. Hvis fx byrådsmedlem og medlem af byrådet refererer til samme ontologiske begreb og teksten (automatisk eller semiautomatisk) er opmærket med denne information, kan dette udnyttes til kategorisering og søgning. Hensigten med denne rapport er at undersøge state-of-the-art i relation til ontologier og andre former for metadata og at undersøge hvilke formelle sprog og værktøjer der dels er hensigtsmæssige, dels er tilgængelige på nuværende tidspunkt for et forskningsprojekt som VID (VIden og Dokumenthåndtering med sprogteknologi). Specielt interesserer vi os for ontologier, metadata og formelle sprog som har eller er ved at få status som standard inden for området. Rapporten er inddelt i 3 kapitler. Kapitel 2 beskriver forskellige traditioner inden for ontologiarbejde og vi ser på hvorledes lingvistiske ontologier adskiller sig fra andre formelle ontologier til bl.a. ekspertsystemer. I kapitel 3 ser vi nærmere på standardiserede metadata til beskrivelse af dokumenter sådan som de typisk anvendes inden for biblioteks- og museumsverdenen til kategorisering af tekst- og genstandssamlinger. I kapitel 4 ser vi på formelle sprog og værktøjer til brug for ontologier og metadata. Stort set alle nyere formelle sprog til implementering af ontologier og metadata anvender en XML-baseret teknologi. Generelt gælder det at de mest komplekse og udtryksrige sprog er opbygget som en specialisering af de mere simple, og karakteristisk er det også at sprogene i øjeblikket er i konstant og rivende udvikling. 1

8 2 Ontologi en strukturering af begreber 2.1 Indledning I dette kapitel ser vi indledningsvis på forskellige tilgange til ontologier inden for filosofi, datalogi og lingvistik (2.2). Dernæst redegør vi i 2.3 for forskellige eksempler på formelle topontologier for derefter i 2.4 at give eksempler på ontologier som er blevet udviklet til mere specifikke informationssystemer. Endelig undersøger vi i 2.5 forskellige lingvistiske ontologier og leksikalske net. 2.2 Forskellige perspektiver på ontologier Studiet af ontologier er historisk set en filosofisk disciplin stammende fra Aristoteles undersøgelser af tingenes væsen. Kort sagt har ontologi fra tidernes morgen beskæftiget sig med identifikation af centrale begreber og relationerne imellem disse. I erkendelse af at dette er en foreteelse som er vanskelig om ikke umulig - at udføre ud fra rent objektive, formålsuafhængige kriterier, definerer Sowa begrebet ontologi som a catalogue of the type of things that are assumed to exist in a domain of interest D, from the perspective of a person who uses a language L for the purpose of interest D (Sowa 2000: p492). Et sådant studie er interessant og essentielt inden for en lang række faglige discipliner spændende fra filosofi, logik og datalogi til terminologi og sprogvidenskab. Fælles for disse discipliner er at de har haft behov for at anskue begreber på en struktureret og gerne formelt baseret måde. Af samme grund er ontologier blevet opbygget og anvendt gennem de seneste tiår inden for flere forskellige faglige traditioner. Inden for datalogi og mere specifikt kunstig intelligens (AI) har man typisk beskæftiget sig med den gren af emnet der omtales formel ontologi. Formel ontologi kan defineres som en logisk specifikation af essentielle begreber inden for et domæne struktureret ud fra de relationer der kan identificeres imellem dem (Nilsson 2001:p.11). Som udgangspunkt for en klassifikation af begreber i formel ontologi anvendes som regel inklusion, også benævnt is_a-relationen, fx kan man om forholdet mellem begreberne Hund og Dyr sige at Hund er underbegreb til (is_a) Dyr. Dette betyder normalt at Hund nedarver alle de egenskaber som gælder for Dyr. Inden for formel ontologi interesserer man sig for en yderligere aksiomatisk 1 karakteristik af begreberne. Begreber som er beriget med aksiomer eller definitioner i et formelt sprog gør det muligt at foretage logisk inferens på disse og dette er naturligvis centralt inden for videnrepræsentation. Fx kan man i en given ontologi for begrebet Kæledyr tilskrive følgende aksiom der eksisterer Person x og Dyr y sådan at x har et Kæledyr y 2. Et sådant aksiom gør det i 1 Et aksiom er et logisk udsagn som hører til grundlaget i et system og som ikke kan bevises inden for dette system. 2 Taget fra SUMO-ontologien: Sevcenko 2003:p.8: x, y : instance(x, Person) instance(y, Animal) pet(x, y). 2

9 princippet muligt at inferere i form af deduktion i et univers hvori begreber som dyr, kæledyr og mennesker forekommer. Der findes en lang række formelle sprog til at udtrykke aksiomatiske egenskaber med hvoraf de fleste i en eller anden form bygger på første-ordenslogik 3. Description Logic er fx et ofte anvendt formelt sprog i forbindelse med ontologiopbygning hvori man kan udtrykke mere komplekse relationer end tilfældet er i førsteordenslogik (se afsnit 4.1. om formelle sprog). Et alternativ til ontologier med aksiomatiske beskrivelser er en formel ontologi baseret på prototyper, en såkaldt prototypebaseret ontologi. I en sådan ontologi defineres kategorier ud fra prototypiske instanser og for hver ny kategori måles den semantiske afstand til den prototypiske kategori. Der findes også hybride ontologier hvor fx metabegreberne beskrives ved hjælp af aksiomer, mens mere specifikke begreber beskrives ved hjælp af prototyper. En mere anvendelsesorienteret afart af formel ontologi ses i ontologier til informationssystemer. Ontologier til informationssystemer er typisk skræddersyet til et ganske bestemt domæne, ofte dog også med reference til mere generelle og almengyldige ontologiske begreber. Sådanne ontologier har et ganske praktisk formål; de kan have til formål at udgøre kernen i et ekspertsystem eller til et system for indholdsbaseret søgning inden for det givne domæne. I og med at disse ontologier som regel er fagspecifikke, er de ofte nært beslægtede med de såkaldte begrebssystemer inden for terminologien. Graden af aksiomatisk karakteristik i disse ontologier afhænger af formålet; således indgår deduktion ofte som en central del af ekspertsystemers inferensmaskine hvorfor aksiomer er særligt vigtige i denne applikationstype. Mange systemer til indholdsbaseret søgning udnytter derimod primært inklusionsrelationen i forbindelse med ekspansion af søgestrengen for at forbedre søgemaskinens såkaldte recall 4. Når man søger på kræftformer kan søgningen fx udvides til at omfatte begrebet leukæmi via inklusionsrelationen mellem de to begreber, og dermed fremfindes flere relevante dokumenter. Lingvistiske ontologier adskiller sig fra andre ontologier ved at være forankret i det sproglige udtryk; i de leksikalske enheder altså ordene i et givent sprog. En lingvistisk ontologi er med andre ord a system of symbols representing the concepts encoded by natural language expressions (lexical units, terms etc.), Lenci (2003:5). Lingvistiske ontologier benyttes altså først og fremmest til at repræsentere leksikalsk viden på en 3 Første-ordenslogik er en slags prædikatslogik hvor prædikaterne kun indeholder atomare elementer og hvor kvantorer kun binder atomare variable (Suber 4 Hvis en given database antages at indeholde i alt 50 dokumenter, der kan karakteriseres som værende relevante i forhold til en forespørgsel, og samme forespørgsel fremfinder alle 50 dokumenter, så har den en recall på 1. Hvis der kun fremfindes 10 af de 50 relevante dokumenter, så er recall på 10/50=0,2, hvilket omvendt betyder 0,8 (80%) af de relevante dokumenter ikke blev fundet, og derfor stadigvæk er ukendte for brugeren ( 3

10 struktureret måde og i sagens natur forholder de sig til konkrete sprog som fx dansk eller spansk. Inden for sprogvidenskaben og særligt inden for datalingvistikken anvender man som oftest principperne fra formel ontologi. Inklusion er således også en central relation i lingvistiske ontologier; blot omtales relationen typisk inden for sprogvidenskaben som en hyponymi-relation 5. Ofte vil man dog se at fokus i den lingvistiske ontologi er anderledes. Et af de problematiske aspekter når man behandler naturligt sprog (i modsætning til formelle sprog) er at det viser sig at være meget vanskeligt at lave korrekt inferens; førsteordenslogik er med andre ord ikke nuanceret nok til beskrivelse af især almensproget, bl.a. fordi almensproget ikke altid opfører sig kompositionelt. Frasers betydning kan fx i mange sammenhænge ikke udledes alene ud fra de enkelte ords betydning, men også ud fra deres sammenhæng; at vaske op betyder ikke at man vasker i retningen opad, en grøn student er ikke en student med farven grøn osv. Man vil derfor typisk se at den lingvistiske ontologi har nogle sondringer som er mere sprogligt/syntaktisk funderede end klassisk formel ontologi; en lingvistisk ontologi skal fx kunne bruges til at skelne imellem forskellige betydninger ved polyseme ord. Selv om egentlig deduktion som nævnt ofte viser sig at være problematisk inden for lingvistiske ontologier, arbejdes der med inferenslignende mekanismer fx i forbindelse med entydiggørelse. Dette ses bl.a. ved Pustejovskys generative mekanismer (Pustejovsky 1995: ), så som selektiv binding. Selektiv binding foregår fx ved flertydige adjektiver hvor man beregner hvilken dimension i substantivets kernesemantik (qualia structure) det flertydige adjektiv modificerer. Ved et eksempel som et let puslespil kunne man fx antage at der var tale om et puslespil som ikke vejer ret meget. Den mest umiddelbare fortolkning er imidlertid at der er tale om et puslespil som er at let at lægge, dvs. at let her betyder som ikke volder nogen større problemer eller anstrengelser (Nudansk Ordbog) og denne resolution kræver noget beregning. Ved at inferere ud fra puslespils kernesemantik - som bl.a. indeholder den centrale dimension formål, nemlig at samle brikker så de danner et hele - kan der foretages en korrekt entydiggørelse af let 6. Også i mange andre entydiggørelsessammenhænge er der en tendens til at formålet med kulturskabte ting spiller en meget vigtig rolle når vi fortolker de ord der omgiver substantivet, og formålet med kulturskabte entiteter må derfor tildeles en særlig vægt i de generative mekanismer 7. Lingvistiske ontologier er nært beslægtede med såkaldte leksikalske net såsom WordNet (se nedenfor) og ofte bruges benævnelserne i flæng. Leksikalske net har som regel 5 Når et begreb er hyponym til et andet begreb, betyder det at det er underbegreb. Fx er Hund hyponym til Dyr. 6 I Nudansk ordbog har let følgende betydninger: (i) som ikke vejer el. fylder ret meget (fx taske: fysisk genstand) (ii). som har en lav styrke el. grad (fx trafik: fænomen) (iii). som ikke volder nogen større problemer el. anstrengelser, el. som sker uden at man gør noget særligt (fx om tilberedning: handling) (iv) som er ubekymret el. overfladisk (fx om person). Definitionen på puslespil er i Nudansk som følger: et spil med træ- el. papbrikker i forskellige faconer som skal lægges sammen så de danner et hele. Andre dimensioner i kernesemantikken for puslespil er således at det har spil som overbegreb og består af flere pap- eller træbrikker. 7 Pustejovsky bruger selv eksemplerne a fast car og a fast typist til at illustrere selektiv binding. Fast går i begge tilfælde på den teliske rolle, altså hhv. køre og taste. 4

11 ingen aksiomatisk karakteristik, men består udelukkende af leksikalske enheder som er forbundet med hinanden ved hjælp af semantiske relationer, som fx hyponymirelationer, del-helhedsrelationer el. lign. Som regel vil man dog forudsætte at et leksikalsk net i det mindste er forbundet med en sproguafhængig topontologi 8 for at kunne gå under betegnelsen lingvistisk ontologi. I denne sammenhæng bør også nævnes tesaurusser som i den klassiske definition også er en ordsamling hvor ordene er ordnet efter betydning med angivelsen af relationerne til over- og underbegreber, samt synonymer, altså meget tæt på definitionen for leksikalske net. I praksis anvendes begrebet tesaurus nu om dage mest om oversigter over søgeord til brug for indeksering, jf. Hermes som bruges på bibliotekerne. Den leksikalske viden som er udtrykt i lingvistiske ontologier og leksikalske net er svær at komme uden om hvis man ønsker at udvikle systemer der skal kunne håndtere tekst på en nuanceret måde. Også set i et multilingvalt perspektiv er det vigtigt at have lingvistiske ontologier som refererer til specifikke sprog. På et vist specificeringsniveau har forskellige sprog forskellig ontologisk struktur; på spansk har man fx et fælles overbegreb for fingre og tæer: dedos; det har vi ikke på dansk; der taler vi om bevægelige kropsdele eller lemmer, men disse begreber er overbegreb for mere end blot fingre og tæer. I erkendelse af disse problemfelter er der stor interesse for at koble lingvistiske ontologier sammen med formelle ontologier, i det man på den måde kan kombinere den tekstlige forankring fra den lingvistiske tilgang med den større beregningskraft fra den formelle tilgang. Dette gælder bl.a. ved søgning i tekster. I de senere år har der været en særlig fokus på ontologistandarder idet det i forbindelse med især Semantic Web-initiativet 9 er blevet særligt påkrævet at nå til en konsensus om hvordan en ontologi bør opbygges, hvori de mest centrale begreber består og på hvilken måde man kan sammensætte allerede eksisterende ontologier i et netværk af flere mere eller mindre domænespecifikke ontologier der kan interagere i samme system. 2.3 Eksempler på formelle top-ontologier Se i øvrigt for en god oversigt over ontologier og ontologianvendelser Upper Cyc Ontology Upper Cyc Ontology er et ældre og meget ambitiøst ontologiprojekt der er blevet afviklet i løbet af 80 erne og 90 erne i USA. Formålet var at udvikle en almen ontologi 8 Ved en topontologi forstår man en ontologi der kun inderholder de mest generelle begreber. 9 Semantic Web betegner en ny form for web-indhold som er forståelig for maskiner og som skal gøre det muligt at søge mere indholdsorienteret på internettet, jf. Berner-Lee et al

12 til anvendelse i informationssystemer. Ontologien (eller dele af den) genanvendes i flere nyere projekter i forskellige versioner. I selve Upper Cyc Ontology er der tale om en formel top-ontologi bestående af ca såkaldte konstanter (selve Cyc-ontologien er langt større, men til gengæld ikke offentlig tilgængelig) hvoraf nogle svarer til begreber, mens andre angiver relationer eller logiske operatorer. Konstanter relateres til hinanden ved hjælp af to strukturerende relationer #$isa 10 som forbinder en instans med en klasse, samt #&genls som angiver hvad konstanten er et underbegreb til. Som det ses i figur 2.1 har hver konstant en definitionsdel i almindeligt sprog samt referencer til relaterede konstanter. Skin er altså en instans af AnimalBodyPartType og har derudover en række relaterede overbegreber så som AnimalBodyPart og SheetOfSomeStuff. #$Skin A (piece of) skin serves as outer protective and tactile sensory covering for (part of) an animal's body. This is the collection of all pieces of skin. Some examples include #$TheGoldenFleece (representing an entire skin of an animal) and (#$BodyPartFn #$YulBrynner #$Scalp) (representing a small portion of his skin). isa: #$AnimalBodyPartType genls: #$BiologicalLivingObject #$AnimalBodyPart #$SheetOfSomeStuff #$VibrationThroughAMediumSensor #$TactileSensor Figur 2.1: Konstanten skin og dens relaterede konstanter i Upper Cyc Ontology I Figur 2.2 gengives grafisk konstanten event og dets relaterede konstanter. 10 Bemærk at der altså ikke tale om den almindelige fortolkning af isa, nemlig er undertype til eller er underbegreb til, men snarere: er en instans af. 6

13 Figur 2.2: Konstanten event og dens relaterede konstanter i Upper Cyc Ontology Upper Cyc Ontology kan downloades i HTML fra hjemmesiden, men der arbejdes også på at konvertere den til RDF og Topic Maps. Endelig kan den downloades i ACCESSdatabaseformat (se Der arbejdes også videre med at offentliggøre en større del af Cyc-ontologien (6000 begreber) inden for det projekt der hedder OpenCyc ( DOLCE (A Descriptive Ontology for Linguistic and Cognitive Engineering) Denne ontologi er udviklet ved Laboratory for Applied Ontology, Italien, primært af Guarino og Welty. Der er tale om en formel ontologi bestående af omkring 200 metabegreber med en rig aksiomatisk karakteristik. Der er taget grundigt stilling til de teoretiske aspekter omkring hvilke ontologiske begreber der er centrale og hvilke der ikke er. Ifølge Masolo et al. (2003:8) er der tale om en kognitivt funderet ontologi som baserer sig på hvorledes vi opfatter ting og ikke nødvendigvis på tings metafysiske eller biologiske egenskaber. Endvidere beskrives og defineres begreberne ud fra forskellige metaegenskaber hvoraf rigiditet (rigid properties) regnes for en særlig vigtig egenskab for ontologiens kernebegreber. Hvis et begreb besidder rigide egenskaber betyder det bl.a. at det bibeholder disse over tid; begrebet Person besidder fx rigide egenskaber i modsætning til begrebet Student. Den såkaldte OntoClean Methodology udviklet af Guarino & Welty (2002) er anvendt på DOLCE og skulle netop hjælpe brugeren med at træffe valg omkring begrebers status i ontologien. 7

14 Der skelnes på øverste niveau i ontologien mellem Endurant og Perdurant. Også for disse to begrebskategorier er deres tidsmæssige karakteristik central. Endurants er i tid, (fx Person), mens Perdurants foregår i tid (fx State). Basiskategorierne i DOLCE kan ses i figur 2.3. Til begreberne i DOLCE-ontologien hører i øvrigt en rig aksiomatisk karakteristik udtrykt i førsteordenslogik. ALL Entity ED Endurant PD Perdurant/ Occurence Q Quality AB Abstract PED Physical Endurant NPED Non-physical Endurant AS Arbitrary Sum EV Event STV Stative TQ Temporal Quality PQ Physical Quality AQ Abstract Quality Fact Set R Region M Amount of Matter APO Agentive Physical Object F Feature POB Physical Object NAPO Non-agentive Physical Object NPOB Non-physical Object MOB Mental Object ASO Agentive Social Object ACH ACC Achievement Accomplishment SOB Social Object NASO Non-agentive Social Object ST State PRO Process TL SL Temporal Spatial Location Location TR Temporal Region PR Physical Region AR Abstract Region T S Time Interval Space Region SAG Social Agent SC Society Figur 2.3: Basiskategorier i DOLCE (Masolo et al. 2003:9) Der arbejdes i øjeblikket på at indarbejde WordNet i DOLCE-ontologien. DOLCE kan downloades i formaterne DAML+OIL-format, RDF, XML og OWL. Ifølge hjemmesiden er ontologien under anvendelse i flere praktiske sammenhænge, bl.a. i sammenhænge hvori den er integreret med domænespecifikke ontologier KR Ontology (Sowas Knowledge Representation Ontology) Denne ontologi er en udløber af John F. Sowas bog Knowledge Representation (Sowa 2000). Ontologiens kategorier er baseret på traditioner fra logik, lingvistik, filosofi og kunstig intelligens. Relationerne i Sowas ontologi beskrives ved hjælp af såkaldte konceptuelle grafer som bl.a. udtrykkes i en gitterstruktur og altså ikke i rene taksonomiske strukturer som man ser i mange andre ontologier. Gitterstrukturen i figur 2.4 illustrerer ontologiens topkategorier. 8

15 Figur 2.4: Basiskategorier i KR-Ontologien Ontologien er dynamisk sådan at forstå at der ikke er tale om et endeligt sæt af kategorier, men om et sæt af distinktive træk fra hvilket gitteret dynamisk kan genereres. Som ved DOLCE-ontologien fremstår de teoretiske aspekter omkring opbygningen af ontologien som særligt væsentlige og velbeskrevne, og flere af de angivne distinktioner ligner de distinktioner der findes i DOLCE-ontologien, fx skellet mellem continuant og occurrent som er mere eller mindre parallelle til hhv. Endurant og Perdurants i DOLCE. KR-ontologiens dynamiske egenskaber er muligvis årsagen til at det ikke fremgår hvor omfattende ontologien er og i hvilken grad den kan downloades til brug i praktiske anvendelser. Til repræsentation af ontologien anvendes det såkaldte Knowledge Interchange Format (KIF) (se afsnit 4.1.3) SUMO (Suggested Upper Merged Ontology) 9

16 SUMO er en nyligt udviklet ontologi udarbejdet under IEEE 11 Standard Upper Ontology Working Group. Målet for denne arbejdsgruppe er at udvikle en standardontologi som kan understøtte udveksling af data, informationssøgning, automatisk inferens samt natursprogsbehandling. SUMO udgør en top-ontologi bestående af 1000 metabegreber suppleret med et antal aksiomer. Aksiomerne er udtrykt i førsteordenslogik. Begreberne spænder fra generelle begreber som fx Quantity til relativt specifikke som fx Bird. Begreberne er sammensat i et en-dimensionelt hierarki med top-knuden Entity, som repræsenterer det mest generelle begreb og som derfra deler sig i de klassiske grupperinger i form af Abstract og Physical som det ses i figur 2.5. Entity Abstract Physical Quantity Attribute Object Process SetofClass Proposition Relation Figur 2.5 Basiskategorier i SUMO (Sevcenko 2000:2) For at knytte an til den sproglige dimension er SUMO integreret med WordNet (se afsnit 2.5.2). Denne integration realiseres ved at der for hver synonymimængde (synset) i WordNet tilskrives et SUMO-overbegreb. For synset {animal, beast, fauna} tilskrives fx SUMO-begrebet Animal. SUMO-ontologien kan downloades i følgende formater/værktøjer: DAML, LOOM, XML, og Protege (pprj, pont, pins filer) (se kapitel 4). 11 IEEE står for of Electrical and Electronics Engineers, Inc og er en ikke-kommerciel forening for omkring medlemmer i 150 lande. 10

17 2.4 Domæneontologier til informationssystemer Domæneontologier udvikles ofte som komponenter til konkrete projekter og er i mange tilfælde ikke offentligt tilgængelige. Nedenfor gives dog et eksempel på en offentlig tilgængelig museumsontologi samt link til et websted hvorfra man kan finde eksempler på andre domæneontologier som kan downloades CIDOC Conceptual Reference Model (CRM) samt Crofts et al Ontologien der er ganske omfattende, er udviklet over en årrække af CIDOC Documentation Standards Working Group og er beregnet til beskrivelse af museumsdokumentation og dækker således et bredt område inden for kulturarv. Det er en ontologi der er udviklet ud fra praktiske behov for strukturering af begreber inden for museumsverdenen og der er tale om en formelt baseret ontologi der dels anvender en top-ontologi, dels indeholder definitioner i et formelt sprog. Der arbejdes videre med ontologien i et forsøg på at få gjort den til en ISO-standard DAML (DARPA Agent Markup Language) samt Formålet med det amerikanske initiativ DAML (DARPA Agent Markup Language) er at udvikle et sprog og nogle værktøjer som kan fungere som standard inden for Semantic Web-teknologien (se Afsnit om formelle sprog). En anden vigtig pointe ved DAML-initiativet er i ontologisammenhæng at det udgør et samlingssted med links til domænespecifikke ontologier til informationssystemer, alle udtrykt i DAML. Man kan fx downloade et rejseontologi, en vejrontologi eller en organisationsontologi. Alt efter formål kan man så yderligere specificere en sådan ontologi så den passer til de teksttyper man ønsker at behandle. Se i øvrigt også (SHOE for Simple HTML Ontology Extensions) hvorfra flere ontologier kan downloades i det såkaldte SHOEformat, som er et udvidet HTML-format hvor forfatteren kan annottere sine websider. 2.5 Eksempler på lingvistiske ontologier og leksikalske net Princeton WordNet og Fellbaum WordNet er en elektronisk leksikalsk database bestående af engelske begreber struktureret efter psykolingvistiske principper i såkaldte synonymimængder (synsets), hvori indgår ord som er synonymer eller delvise synonymer til hinanden. Den leksikalske database omtales ofte som et leksikalsk net eller en lingvistisk ontologi idet begreberne er forbundet med hinanden ved hjælp af semantiske relationer. Der er tale om et meget finmasket net hvor hver leksikalsk indgang beskrives med dets (ofte mange) underbetydninger. I figur 2.6 ses en af de seks betydninger som dog har i 11

- Hvad er det, og hvilke fordele kan opnås ved fælles løsninger?

- Hvad er det, og hvilke fordele kan opnås ved fælles løsninger? Semantik, ontologi, tesaurus mv. - Hvad er det, og hvilke fordele kan opnås ved fælles løsninger? Seniorforsker, Center for Sprogteknologi, Københavns Universitet Indhold Hvorfor er semantik relevant for

Læs mere

ABM standard arbejdsgruppen nedsat af Statens Arkiver, Styrelsen for Bibliotek og Medier og Kulturarvsstyrelsen

ABM standard arbejdsgruppen nedsat af Statens Arkiver, Styrelsen for Bibliotek og Medier og Kulturarvsstyrelsen nedsat af Statens Arkiver, Styrelsen for Bibliotek og Medier og Kulturarvsstyrelsen Titel : Profil for udveksling af ABM-data Dato : 2009-08-28 Status : Gældende ABM-specifikation Sekretariat: Publicering:

Læs mere

ABM standard arbejdsgruppen nedsat af Statens Arkiver, Biblioteksstyrelsen og Kulturarvsstyrelsen

ABM standard arbejdsgruppen nedsat af Statens Arkiver, Biblioteksstyrelsen og Kulturarvsstyrelsen nedsat af Statens Arkiver, Biblioteksstyrelsen og Kulturarvsstyrelsen Titel : Fælles ABM indholds- og transportformat Dato : 2009-08-28 Status : Gældende ABM-specifikation Sekretariat: Publicering: Kulturarvsstyrelsen

Læs mere

Automatisk identifikation af virksomhedens termer og nøgleord

Automatisk identifikation af virksomhedens termer og nøgleord Udkommer i Informationsspecialisten, november 2004 Viden- og dokumenthåndtering med sprogteknologi Bolette Sandford Pedersen, Costanza Navarretta, Dorte Haltrup, Bart Jongejan Center for Sprogteknologi,

Læs mere

VID. VID-projektets mission. at foretage en række sprogteknologiske eksperimenter i et dynamisk trekantsmiljø: forskningsinstitution

VID. VID-projektets mission. at foretage en række sprogteknologiske eksperimenter i et dynamisk trekantsmiljø: forskningsinstitution Sprogteknologiske komponenter i ontologi og søgning Bolette Sandford Pedersen, Costanza Navarretta, Dorte Haltrup Hansen, Bart Jongejan Center for Sprogteknologi, KU VID-projektets mission at foretage

Læs mere

Konverteringsbeskrivelse for Dublin Core til danmarc2 J.nr marts 2004

Konverteringsbeskrivelse for Dublin Core til danmarc2 J.nr marts 2004 Forord Efter en drøftelse i Katalogdataudvalget blev nedsat en arbejdsgruppe med henblik på at udarbejde en konverteringsbeskrivelse Dublin Core til. Arbejdsgruppens sammensætning har været Susanne Thorborg

Læs mere

Vidensmedier på nettet

Vidensmedier på nettet Vidensmedier på nettet En sociokulturel forståelse af læring kan bringe os til at se bibliotekernes samlinger som læringsressourcer og til at rette blikket mod anvendelsespotentialerne. fra Aarhus Universitet

Læs mere

Sprogteknologi og formel semantik

Sprogteknologi og formel semantik Oversigt Sprogteknologi og formel semantik Bolette Sandford Pedersen Center for Sprogteknologi Københavns Universitet bolette@cst.dk Det formelle paradigme Vigtige forskningsspørgsmål inden for sprogteknologi

Læs mere

På vej mod internationalt orienterede datastandarder

På vej mod internationalt orienterede datastandarder FDA2018 På vej mod internationalt orienterede datastandarder Dan Bjørneboe, KL Peter Bruhn Andersen, Digitaliseringsstyrelsen 1 OPDATERING OIO OIO-OPDATERING FDA 23. april 2018 DAGSORDEN/EMNER OIO OPDATERING

Læs mere

1 Klassifikation-version2.0

1 Klassifikation-version2.0 1 Klassifikation-version2.0 Formål med Klassifikationsmodellen Her specificeres Klassifikationsmodellen, som en informationsmodel for Klassifikationer. Klassifikationer (eller klassifikationssystemer)

Læs mere

CCS Formål Produktblad December 2015

CCS Formål Produktblad December 2015 CCS Formål Produktblad December 2015 Kolofon 2015-12-14

Læs mere

Artikler. Aktivitet er defineret med inspiration fra begrebet 'perdurant' i DOLCE (A Descriptive Ontology for Linguistic and Cognitive Engineering).

Artikler. Aktivitet er defineret med inspiration fra begrebet 'perdurant' i DOLCE (A Descriptive Ontology for Linguistic and Cognitive Engineering). 1 af 6 15-01-2015 12:49 Artikler 35 artikler. entitet Generel definition: hvad der kan erkendelses Entiteter kan være: - eksisterende (fx en reol, rengøring), tidligere eksisterende (fx en dinosaur, et

Læs mere

Digitale Videnssystemer: Notater

Digitale Videnssystemer: Notater Digitale Videnssystemer: Notater Sigfred Hyveled Nielsen IVA / Københavns Universitet 3. Semester Denne tekst er skrevet af Sigfred Nielsen, og stillet til rådighed under Creative Commons Navngivelse-IkkeKommerciel-DelPåSammeVilkår

Læs mere

DK CLARIN: METADATA FOR WP4 RESSOURCER

DK CLARIN: METADATA FOR WP4 RESSOURCER DK CLARIN: METADATA FOR WP4 RESSOURCER DK CLARIN WP 4 Version 2011 02 01 Bolette S. Pedersen, KU, bspedersen@hum.ku.dk Lene Offersgaard, KU, leneo@hum.ku.dk Nicolai H. Sørensen, DSL, nhs@dsl.dk Viggo Sørensen,

Læs mere

Notat om cuneco-projekter og sammenhæng til buildingsmart-standarder og -værktøjer 2014-04-24

Notat om cuneco-projekter og sammenhæng til buildingsmart-standarder og -værktøjer 2014-04-24 Notat om cuneco-projekter og sammenhæng til buildingsmart-standarder og -værktøjer 2014-04-24 cuneco buildingsmart Formidling og indarbejdning af cuneco-resultater i buildingsmart International CCS-klassifikation

Læs mere

CCS klassifikation og identifikation

CCS klassifikation og identifikation UDVEKSLINGSSPECIFIKATION klassifikation og identifikation Udgivet 01.09.2017 Revision 0 Molio 2017 s 1 af 19 Forord Denne udvekslingsspecifikation beskriver, hvilke egenskaber for klassifikation og identifikation,

Læs mere

Interlinkage - et netværk af sociale medier

Interlinkage - et netværk af sociale medier Interlinkage - et netværk af sociale medier Introduktion Dette paper præsenterer en kort gennemgang af et analytisk framework baseret på interlinkage ; den måde, sociale netværk er internt forbundne via

Læs mere

adfgvrga Open Access Hvor og Hvordan Steen Ammentorp

adfgvrga Open Access Hvor og Hvordan Steen Ammentorp EU adfgvrga Open Access Hvor og Hvordan Steen Ammentorp Agenda Videnskabelige OA ressourcer Digitale biblioteker Arkiver Historiske aviser CORE (COnnecting REpositories) Startede 2011 Knowledge Media Institute,

Læs mere

ABM standard arbejdsgruppen nedsat af Statens Arkiver, Styrelsen for Bibliotek og Medier og Kulturarvsstyrelsen

ABM standard arbejdsgruppen nedsat af Statens Arkiver, Styrelsen for Bibliotek og Medier og Kulturarvsstyrelsen nedsat af Statens Arkiver, Styrelsen for Bibliotek og Medier og Kulturarvsstyrelsen Titel : Mapning danmarc2 til DKABM Dato : 2009-08-25 Status : Gældende ABM-specifikation Sekretariat: Publicering: Kulturarvsstyrelsen

Læs mere

Den sproglige vending i filosofien

Den sproglige vending i filosofien ge til forståelsen af de begreber, med hvilke man udtrykte og talte om denne viden. Det blev kimen til en afgørende ændring af forståelsen af forholdet mellem empirisk videnskab og filosofisk refleksion,

Læs mere

a. Find ud af mere om sprogteknologi på internettet. Hvad er nogle typiske anvendelser? Hvor mange af dem bruger du i din hverdag?

a. Find ud af mere om sprogteknologi på internettet. Hvad er nogle typiske anvendelser? Hvor mange af dem bruger du i din hverdag? En computer forstår umiddelbart ikke de sprog vi mennesker taler og skriver. Inden for sprogteknologien (på engelsk: Natural Language Processing eller NLP), der er en gren af kunstig intelligens, beskæftiger

Læs mere

Program for møde fredag d. 22/2-2002

Program for møde fredag d. 22/2-2002 Program for møde fredag d. 22/2-2002 Disposition for den indledende præsentation af problemstillinger Kort beskrivelse af projektets struktur, hvilket leder frem til hovedtemaet for den efterfølgende diskussion

Læs mere

Artikler

Artikler 1 af 6 09/06/2017 13.00 Artikler 35 artikler. borger Generel definition: person, der har pligter og rettigheder i forhold til en kommunalforvaltning, regionsforvaltning eller centraladministration viden

Læs mere

Formålet med undervisning fra mediateket er at styrke elevernes informationskompetence, således de bliver i stand til:

Formålet med undervisning fra mediateket er at styrke elevernes informationskompetence, således de bliver i stand til: Informationssøgning Mediateket ved Herningsholm Erhvervsskole er et fagbibliotek for skolens elever og undervisere. Her fungerer mediateket ikke blot som bogdepot, men er et levende sted, som er med til

Læs mere

DDElibra H Å N D B O G

DDElibra H Å N D B O G H Å N D B O G Axiell Danmark A/S 2016-10-12 Version 9.11.60 GUI Copyright 2016 2 1 Indholdsfortegnelse 1 Indholdsfortegnelse... 2 2 Introduktion... 3 3 Søgning i dokumentationen... 3 4 Åbning af ""...

Læs mere

Studenterportalen. Registrering og upload af bacheloropgaver og andre afgangsprojekter. Professionshøjskolen Metropol, marts 2011

Studenterportalen. Registrering og upload af bacheloropgaver og andre afgangsprojekter. Professionshøjskolen Metropol, marts 2011 Studenterportalen Registrering og upload af bacheloropgaver og andre afgangsprojekter Professionshøjskolen Metropol, marts 2011 Forord Dette materiale har til formål at beskrive hvordan du registrerer

Læs mere

Matematik, maskiner og metadata

Matematik, maskiner og metadata MATEMATIK, MASKINER OG METADATA VEJE TIL VIDEN Matematik, maskiner og metadata af CHRISTIAN BOESGAARD DATALOG IT Development / DBC 1 Konkrete projekter med machine learning, hvor computersystemer lærer

Læs mere

arkiver, biblioteker og museer på internettet

arkiver, biblioteker og museer på internettet ABM standard arbejdsgruppen nedsat af Statens Arkiver, Styrelsen for Bibliotek og Medier og Kulturarvsstyrelsen Titel : Specifikationer for fælles præsentation af data fra arkiver, biblioteker og museer

Læs mere

Find det relevante dokument på rekordtid med A104 Dokumenthåndtering Gunnar Friborg, bips

Find det relevante dokument på rekordtid med A104 Dokumenthåndtering Gunnar Friborg, bips Find det relevante dokument på rekordtid med A104 Dokumenthåndtering Gunnar Friborg, bips Dokumenthåndtering er nøglen Nøglen til dokumenterne Nøglen til informationerne Nøglen til data Preben Mejer, Innovation

Læs mere

Bringe taksonomier i spil

Bringe taksonomier i spil Bringe taksonomier i spil Frans la Cour Hvem er jeg? Frans la Cour 3 år hos ensight a/s Systemdesign Projektledelse og implementering Undervisning Med udgangspunkt i Veritys værktøjer Vise nogle af de

Læs mere

Kommentar fra KMS til Specifikation af Serviceinterface for Person

Kommentar fra KMS til Specifikation af Serviceinterface for Person Kommentar fra KMS til Specifikation af Serviceinterface for Person Organisation Side Kapitel Afsnit/figur/tabel /note Type af kommentar (generel (G), redaktionel (R), teknisk (T)) Kommentar KMS-1 G Godt

Læs mere

Metadata i danske netpublikationer. Brugervejledning. Udarbejdet af Biblioteksstyrelsen

Metadata i danske netpublikationer. Brugervejledning. Udarbejdet af Biblioteksstyrelsen 1 Metadata i danske netpublikationer Brugervejledning Udarbejdet af Biblioteksstyrelsen København 1999 2 Metadata i danske netpublikationer Brugervejledning Vejledninger fra Biblioteksstyrelsen 3 Udarbejdet

Læs mere

DANNET ET LEKSIKALSK-SEMANTISK WORDNET FOR DANSK

DANNET ET LEKSIKALSK-SEMANTISK WORDNET FOR DANSK Peter Widell og Ulf Dalvad Berthelsen (udg.): 11. Møde om Udforskningen af Dansk Sprog Århus 2006 DANNET ET LEKSIKALSK-SEMANTISK WORDNET FOR DANSK Af Sanni Nimb (Center for Sprogteknologi, Københavns Universitet)

Læs mere

Web services til med udgangspunkt i katalogen. Adam Dickmeiss Index Data

Web services til med udgangspunkt i katalogen. Adam Dickmeiss Index Data Web services til med udgangspunkt i katalogen Adam Dickmeiss Index Data Overblik Typer af services Informationssøgning generelt Kort om A9 OpenSearh Gennemgang af SRW/U. Servicetyper Informationssøgning

Læs mere

Hans-Peder Kromann. Base b11: FAGSPROGSBIBLIOGRAFIEN. Sprogbiblioteket, HERMES on-line katalog, Handelshøjskolen

Hans-Peder Kromann. Base b11: FAGSPROGSBIBLIOGRAFIEN. Sprogbiblioteket, HERMES on-line katalog, Handelshøjskolen Hans-Peder Kromann 103 Base b11: FAGSPROGSBIBLIOGRAFIEN Sprogbiblioteket, HERMES on-line katalog, Handelshøjskolen i København En fyldig bibliografi er et nyttigt redskab også for fagsprogsforskere, som

Læs mere

Forskning med brug af tekster og tekstværktøjer

Forskning med brug af tekster og tekstværktøjer Forskning med brug af tekster og tekstværktøjer Lene Offersgaard, Center for Sprogteknologi, NFI, KU leneo@hum.ku.dk KU, 20. april 2015 DIGHUMLAB har tre søjler: Language-based materials and tools Research

Læs mere

Semantic Web teknologier. RDF Resource Description Framework. Henrik Hvid Jensen

Semantic Web teknologier. RDF Resource Description Framework. Henrik Hvid Jensen Semantic Web teknologier RDF Resource Description Framework Whitepaper af Henrik Hvid Jensen Vidensleverandør og forfatter SOA Network Henrikhvid@soanetwork.dk November 2004 URI giver mulighed for at vi

Læs mere

Konvertering af STO-SIMPLE til LMF med udgangspunkt i filen: nysimpletotal.sgml

Konvertering af STO-SIMPLE til LMF med udgangspunkt i filen: nysimpletotal.sgml Konvertering af STO-SIMPLE til LMF med udgangspunkt i filen: nysimpletotal.sgml Denne README-fil, filen STO-SIMPLE-LMF-dokumentation.xsl samt SIMPLE-documentation-danishfinalny.pdf udgør dokumentation

Læs mere

Afsnittet er temmelig teoretisk. Er du mere til det praktiske, går du blot til det næste afsnit.

Afsnittet er temmelig teoretisk. Er du mere til det praktiske, går du blot til det næste afsnit. Afsnittet er temmelig teoretisk. Er du mere til det praktiske, går du blot til det næste afsnit. XML (eng. extensible Markup Language) XML er en måde at strukturere data på i tekstform. På samme måde som

Læs mere

Semantiske relationer og begrebssystemer

Semantiske relationer og begrebssystemer Semantiske relationer og begrebssystemer I denne opgave vil jeg beskæftige mig med semantiske relationer og begrebssystemer med udgangspunkt i en oplysende tekst fra Politikens Vinbog (se bilag). Jeg vil

Læs mere

Fremstillingsformer i historie

Fremstillingsformer i historie Fremstillingsformer i historie DET BESKRIVENDE NIVEAU Et referat er en kortfattet, neutral og loyal gengivelse af tekstens væsentligste indhold. Du skal vise, at du kan skelne væsentligt fra uvæsentligt

Læs mere

24-03-2009. Problemstilling ved DBK integration i BIM Software Hvad skal der til. Nicolai Karved, Betech Data A/S

24-03-2009. Problemstilling ved DBK integration i BIM Software Hvad skal der til. Nicolai Karved, Betech Data A/S 24-03-2009 Problemstilling ved DBK integration i BIM Software Hvad skal der til. Nicolai Karved, Betech Data A/S Problemstilling ved DBK integration i BIM Software Domæner og aspekter Det domæne, der primært

Læs mere

ICD-11 på 10 minutter. Kort introduktion til den nye version af ICD

ICD-11 på 10 minutter. Kort introduktion til den nye version af ICD ICD-11 på 10 minutter Kort introduktion til den nye version af ICD Hvorfor en ny version af ICD? ICD-10 er ved at være udfaset, og i WHO har man i 10 år arbejdet på en ny version af sygdomsklassifikationen.

Læs mere

Sammenligning af metoder

Sammenligning af metoder Sammenligning af metoder Hvorfor sammenligne? Den ideelle metode Generelle frameworks (NIMSAD/Andersen) Wood-Harper framework til sammenligning Problemer med sammenligning af metoder Hvorfor sammenligne?

Læs mere

ST Sortiment Informationsmodel

ST Sortiment Informationsmodel .5.27 ST Sortiment Informationsmodel .5.27. Delsortiment Delsortimentet er en obligatorisk opdeling af sortimentet i værdilister, samlinger af mulige registreringsværdier, hvor hver samling, delsortimentet,

Læs mere

Tietgenskolen - Nørrehus. Data warehouse. Database for udviklere. Thor Harloff Lynggaard DM08125

Tietgenskolen - Nørrehus. Data warehouse. Database for udviklere. Thor Harloff Lynggaard DM08125 Tietgenskolen - Nørrehus Data warehouse Database for udviklere Thor Harloff Lynggaard DM08125 Juni 2010 Indhold Beskrivelse... 3 Data warehouse... 3 Generelt... 3 Sammenligning... 3 Gode sider ved DW...

Læs mere

Databasesystemer. Databaser, efterår Troels Andreasen. Efterår 2002

Databasesystemer. Databaser, efterår Troels Andreasen. Efterår 2002 Databaser, efterår 2002 Databasesystemer Troels Andreasen Datalogiafdelingen, hus 42.1 Roskilde Universitetscenter Universitetsvej 1 Postboks 260 4000 Roskilde Telefon: 4674 2000 Fax: 4674 3072 www.dat.ruc.dk

Læs mere

0.9 19-09-2012 DAVAR Omdøbt til SagDokumentFormat. Attention er skilt ud i et selvstændigt format, AttentionFormat.

0.9 19-09-2012 DAVAR Omdøbt til SagDokumentFormat. Attention er skilt ud i et selvstændigt format, AttentionFormat. Specifikation 19. september 2012 DAVAR J.nr. 2012-6211-281 Sagdokumentformat Versionshistorik Version Dato Initialer Noter 0.7 15-06-2012 DAVAR Høringsversion. Indsat MeddelelseAttention. 0.9 19-09-2012

Læs mere

NBS Organisatoriske begreber

NBS Organisatoriske begreber NBS Organisatoriske begreber Rapport vedrørende udarbejdelse af begrebssystem og definitioner Version 1.0/18. december 2012 Kolofon: Titel NBS - Rapport vedrørende udarbejdelse af begrebssystem og definitioner

Læs mere

PsycINFO (Ebsco) VIA manual

PsycINFO (Ebsco) VIA manual PsycINFO (Ebsco) VIA manual Udgiver American Psychological Association (APA). For nærmere beskrivelse af basen, se APA Databases Psycinfo: http://www.apa.org/psycinfo. Indhold Basen dækker alle discipliner

Læs mere

01017 Diskret Matematik E12 Alle bokse fra logikdelens slides

01017 Diskret Matematik E12 Alle bokse fra logikdelens slides 01017 Diskret Matematik E12 Alle bokse fra logikdelens slides Thomas Bolander 1 Udsagnslogik 1.1 Formler og sandhedstildelinger symbol står for ikke eller og ( A And) hvis... så... hvis og kun hvis...

Læs mere

Vejledning til anvendelse af MeMo og SMTP. Næste generation Digital Post Maj 2018, version 0.9

Vejledning til anvendelse af MeMo og SMTP. Næste generation Digital Post Maj 2018, version 0.9 Vejledning til anvendelse af MeMo og SMTP Næste generation Digital Post Maj 2018, version 0.9 Indhold Indhold 2 1 Introduktion 3 1.1 Præciseringer 3 1.2 Terminologi 3 2 Anvendelse af SMTP-felter 5 3 Anvendelse

Læs mere

Bilag 1: Ordliste. Bilag 1: Ordliste 141

Bilag 1: Ordliste. Bilag 1: Ordliste 141 Bilag 1: Ordliste 141 Bilag 1: Ordliste Da det behandlede område indeholder mange nye termer, som ikke nødvendigvis alle kender, og da disse termer opfattes forskelligt, har vi udarbejdet denne ordliste,

Læs mere

Trekanter. Frank Villa. 8. november 2012

Trekanter. Frank Villa. 8. november 2012 Trekanter Frank Villa 8. november 2012 Dette dokument er en del af MatBog.dk 2008-2012. IT Teaching Tools. ISBN-13: 978-87-92775-00-9. Se yderligere betingelser for brug her. Indhold 1 Introduktion 1 1.1

Læs mere

1 KlassifikationStruktur

1 KlassifikationStruktur ..27 KlassifikationStruktur. KlassifikationStruktur Klassifikation er det abstrakte objekt som samler et klassifikationssystem. Klassifikation holder klassifikationssystemets metadata. Klassifikationssystemet

Læs mere

Namespaces. Vi kan kvalificere elementer på denne måde: <?xml version="1.0" encoding="iso-8859-1"?>

Namespaces. Vi kan kvalificere elementer på denne måde: <?xml version=1.0 encoding=iso-8859-1?> Namespaces...1 Default namespace:...6 Præfiks:...7 To slags navne i XML:...11 Standard namespaces:...14 RDF Resource Description Framework:...18 Attributter:...19 DTD skemaer og namespaces:...21 Namespaces.

Læs mere

Det Rene Videnregnskab

Det Rene Videnregnskab Det Rene Videnregnskab Visualize your knowledge Det rene videnregnskab er et værktøj der gør det muligt at redegøre for virksomheders viden. Modellen gør det muligt at illustrere hvordan viden bliver skabt,

Læs mere

Som bruger af Mendeley kan man komme ud for, at de poster man downloader skal rettes en smule til.

Som bruger af Mendeley kan man komme ud for, at de poster man downloader skal rettes en smule til. Indhold: Indledning Oprette en post fra bunden af Rette en webside henvisning til Lav en kapitelhenvisning til en bog Danske forkortelser i stedet for engelske Oprette grupper Indsætte emneord i posterne

Læs mere

PHP Quick Teknisk Ordbog

PHP Quick Teknisk Ordbog PHP Quick Teknisk Ordbog Af Daniel Pedersen PHP Quick Teknisk Ordbog 1 Indhold De mest brugte tekniske udtryk benyttet inden for web udvikling. Du vil kunne slå de enkelte ord op og læse om hvad de betyder,

Læs mere

Funktionsterminologi

Funktionsterminologi Funktionsterminologi Frank Nasser 12. april 2011 c 2008-2011. Dette dokument må kun anvendes til undervisning i klasser som abonnerer på MatBog.dk. Se yderligere betingelser for brug her. Bemærk: Dette

Læs mere

Fremtidens metadata. Oplæg på DDELibra brugergruppemøde 19. november 2015. Susanne Thorborg, DBC. Vejle

Fremtidens metadata. Oplæg på DDELibra brugergruppemøde 19. november 2015. Susanne Thorborg, DBC. Vejle Fremtidens metadata Vejle Oplæg på DDELibra brugergruppemøde 19. november 2015 Susanne Thorborg, DBC Agenda Nogle trends om bibliotekets brugere Hvordan påvirker det metadata og metadatastandarder? Bibliografisk

Læs mere

TeamShare 2.1 Versionsnoter Oktober 2009

TeamShare 2.1 Versionsnoter Oktober 2009 TeamShare 2.1 Versionsnoter Oktober 2009 TeamShare version 2.1.292 Denne version af TeamShare har fået mange nye funktioner, samt forbedringer på eksisterende. Hver ny feature er gennemgået i hvert sit

Læs mere

Manuskriptvejledning De Studerendes Pris

Manuskriptvejledning De Studerendes Pris Fremsendelse af artikel Artikler skrevet på baggrund af bachelorprojekter, der er afleveret og bestået i det annoncerede tidsrum, kan deltage i konkurrencen om De Studerendes Pris. Det er kun muligt at

Læs mere

Redigering af Nyheder

Redigering af Nyheder Redigering af Nyheder Her er først klikket på Liste i venstre kolonne, derefter på Nyheder i næste kolonne: (Husk at man klikker på ordet og ikke på ikonet!) For at tilføje, redigere og slette nyheder

Læs mere

Sproglige problemstillinger ved informationssøgning

Sproglige problemstillinger ved informationssøgning Sproglige problemstillinger ved informationssøgning Patrizia Paggio Center for Sprogteknologi Københavns Universitet patrizia@cst.dk Disposition Søgemaskiner i dag: nogle problemer Nogle krav til fremtidig

Læs mere

Retningsliner for etwinning værktøjer

Retningsliner for etwinning værktøjer Retningsliner for etwinning værktøjer Registrer til etwinning Trin 1: Deltagerens data Trin 2: Twinning præferencer Trin 3: Skole data Trin 4: Skole profil TwinFinder Automatisk søgning Gem søgning Avanceret

Læs mere

BIM Shark brugervejledning v1 Februar 2016

BIM Shark brugervejledning v1 Februar 2016 Indholdsfortegnelse 1 BIM Shark's mission... 2 2 Kom godt i gang... 2 2.1 Oprettelse af bruger... 2 2.2 Oprettelse af virksomhed... 3 2.3 Inviter medlemmer/accepter invitation/sende invitationer... 3 2.3.1

Læs mere

BILAG 1 GENERELLE BETINGELSER INTERN (VERSION 1.0 AF 31. MAJ 2005) (I DET FØLGENDE KALDET GENERELLE BETINGELSER) OIO STANDARDAFTALE FOR WEB SERVICES

BILAG 1 GENERELLE BETINGELSER INTERN (VERSION 1.0 AF 31. MAJ 2005) (I DET FØLGENDE KALDET GENERELLE BETINGELSER) OIO STANDARDAFTALE FOR WEB SERVICES BILAG 1 GENERELLE BETINGELSER INTERN (VERSION 1.0 AF 31. MAJ 2005) (I DET FØLGENDE KALDET GENERELLE BETINGELSER) OIO STANDARDAFTALE FOR WEB SERVICES INDHOLDSFORTEGNELSE 1. Anvendelsesområde... 3 2. Definitioner...

Læs mere

Vejledning for metadatabasen

Vejledning for metadatabasen Vejledning for metadatabasen Version 1.0, d. 20. juni 2011 Indholdsfortegnelse INDLEDNING... 3 LOG IND... 4 ABONNERE PÅ RETTELSER OG ÆNDRINGER I DATASÆT VIA GEORSS... 4 SØGNING EFTER METADATA I METADATABASEN...

Læs mere

Notat om underleverandører af software til medicinsk udstyr Specielt med fokus på fortolkere, hvor nyt udstyr let kan genereres

Notat om underleverandører af software til medicinsk udstyr Specielt med fokus på fortolkere, hvor nyt udstyr let kan genereres December 2018 Notat om underleverandører af software til medicinsk udstyr Specielt med fokus på fortolkere, hvor nyt udstyr let kan genereres Af Carsten Jørgensen FORCE Technology Venlighedsvej 4 2970

Læs mere

Manual til administration af online booking

Manual til administration af online booking 2016 Manual til administration af online booking ShopBook Online Med forklaring og eksempler på hvordan man konfigurerer og overvåger online booking. www.obels.dk 1 Introduktion... 4 1.1 Formål... 4 1.2

Læs mere

Dansk overgang til nye, internationale katalogiseringsregler, RDA

Dansk overgang til nye, internationale katalogiseringsregler, RDA NOTAT H.C. Andersens Boulevard 2 1553 København V Telefon +45 3373 3373 Telefax +45 3391 7741 post@kulturstyrelsen.dk www.kulturstyrelsen.dk EAN 5798000793132 CVR 2648986 4. marts 2016 Dansk overgang til

Læs mere

Web of Science Core Collection

Web of Science Core Collection Dato: 29. juni 2016 Ref.: Randi Juul Nørskov Web of Science Core Collection Udgiver: Thomson Reuters Type: Bibliografisk database / henvisning til artikler Indhold og omfang Tværvidenskabelig database

Læs mere

Opgaver hørende til undervisningsmateriale om Herons formel

Opgaver hørende til undervisningsmateriale om Herons formel Opgaver hørende til undervisningsmateriale om Herons formel 20. juni 2016 I Herons formel (Danielsen og Sørensen, 2016) er stillet en række opgaver, som her gengives. Referencer Danielsen, Kristian og

Læs mere

Generelt Internationalisering

Generelt Internationalisering Bekendtgørelse om krav til anvendelse af Informations- og Side 1 af 7 Generelt Digital Konvergens samarbejdet, har i sit hidtidige arbejde fokuseret på at implementere vindende, digitale standarder, der

Læs mere

Anklagemyndighedens Vidensbase

Anklagemyndighedens Vidensbase Anklagemyndighedens Vidensbase Indhold 1 OM DENNE VEJLEDNING... 2 2 LOGIN... 3 3 SØGNINGER... 4 3.1 SØG EFTER DOKUMENTER... 4 3.2 NAVIGÉR DIG FREM... 5 3.3 KOMBINÉR SØGNING OG NAVIGATION... 6 3.4 VISNING

Læs mere

Krav i Leverancekontrakt Bilag 2 krav lyder (jf. ændringsforslag 18) således:

Krav i Leverancekontrakt Bilag 2 krav lyder (jf. ændringsforslag 18) således: Indholdsfortegnelse Bevis for krav 19.12...1 Indledning...1 Metode...1 Resultater...2 Søgning på fanebladet Bygning og boliger...2 Skærmbilledet Grund...3 Skærmbilledet Bygningsamurai...4 Søgning på fanebladet

Læs mere

Sortimentet angiver de mulige klasser, som er tilladte at benytte i en registrering, med andre ord en værdiliste over tilladte koder.

Sortimentet angiver de mulige klasser, som er tilladte at benytte i en registrering, med andre ord en værdiliste over tilladte koder. 22.3.27 SortimentStruktur. DataStructure: SortimentStruktur Et sortiment er en samling af klasser, som er udvalgt fra en eller flere klassifikationer, med et specifikt formål om at afgrænse registreringspraksis

Læs mere

Notat om metadata om grunddata

Notat om metadata om grunddata Bilag 16 - Fælles arkitekturramme for GD1-GD2-GD7 Notat om metadata om grunddata 6. december 2013 SAR & PLACE Indledning Metadata data om data betegner ikke en entydig klasse af data. Anvendelsen af betegnelsen

Læs mere

Starthjælp. til e-bogs- og bogprojekter via mybod

Starthjælp. til e-bogs- og bogprojekter via mybod Starthjælp til e-bogs- og bogprojekter via mybod mybod starthjælp Velkommen til mybod! Med din registrering har du fået adgang til alle vigtige funktioner og værktøjer, som du skal bruge for selv at udgive

Læs mere

Brugervejledning til databrowseren

Brugervejledning til databrowseren Brugervejledning til databrowseren Indholdsfortegnelse Indledning...2 Hvordan tilgås browseren og api et...2 Databrowseren...2 Søgning...2 Visning...4 Features i listevisningen...4 Detaljeret visning...5

Læs mere

Politik vedrørende cookies og andre lignende teknologier. 1. Hvad dækker denne politik?

Politik vedrørende cookies og andre lignende teknologier. 1. Hvad dækker denne politik? Politik vedrørende cookies og andre lignende teknologier 1. Hvad dækker denne politik? Denne politik dækker dine handlinger relateret til Tikkurilas digitale serviceydelser. Denne politik dækker ikke,

Læs mere

FKG datamodellen Version 2.3.1 ArcGIS integration Sidste revisionsdato: 23. maj 2014

FKG datamodellen Version 2.3.1 ArcGIS integration Sidste revisionsdato: 23. maj 2014 FKG datamodellen Version 2.3.1 ArcGIS integration #1 FKG Fælleskommunale Geodatasamarbejde FKG datamodellen Version 2.3.1 ArcGIS integration Sidste revisionsdato: 23. maj 2014 1 FKG datamodellen Version

Læs mere

A 18 Validering af dataleverancer ifm. Ældredokumentationsprojektet

A 18 Validering af dataleverancer ifm. Ældredokumentationsprojektet Danmarks Statistik, IT-Center 27. mar. 2009 Jbb/Flj A 18 Validering af dataleverancer ifm. Ældredokumentationsprojektet Indhold: 1. Indledning...2 2. Validering med XML-skemaer i udviklingsfasen...3 3.

Læs mere

Intro til design og brug af korpora

Intro til design og brug af korpora Intro til design og brug af korpora Jørg Asmussen ja@dsl.dk Det Danske Sprog- og Litteraturselskab www.dsl.dk Intro til design og brug korpuslingvistik af korpora Jørg Asmussen ja@dsl.dk Det Danske Sprog-

Læs mere

Vejledning til redigering via iserasuaat.gl/typo3 - både frontend og backend

Vejledning til redigering via iserasuaat.gl/typo3 - både frontend og backend Iserasuaat.gl Vejledning til redigering via iserasuaat.gl/typo3 - både frontend og backend Indhold Om kategorier en central del af Iserasuaat... 2 Frontend redigering... 3 Fanen Generelt... 4 Linke til

Læs mere

Sprogteknologi skal gøre fremtidens søgemaskiner intelligente

Sprogteknologi skal gøre fremtidens søgemaskiner intelligente Sprogteknologi skal gøre fremtidens søgemaskiner intelligente Hvad hjælper det, at den nødvendige viden er tilgængelig på internettet, hvis vi ikke kan trække den ned på vores pc-skærme, når vi har brug

Læs mere

Brugervejledning til Højkvalitetsdokumentationen og Dialogforummet på Danmarks Statistiks hjemmeside

Brugervejledning til Højkvalitetsdokumentationen og Dialogforummet på Danmarks Statistiks hjemmeside Brugervejledning til Højkvalitetsdokumentationen og Dialogforummet på Danmarks Statistiks hjemmeside Forord Denne vejledning beskriver baggrunden for begreber og sammenhænge i Danmarks Statistiks dokumentationssystem

Læs mere

Juridisk anvendelse af (Q)SAR'er i henhold til REACH

Juridisk anvendelse af (Q)SAR'er i henhold til REACH Juridisk anvendelse af (Q)SAR'er i henhold til REACH Webinar om informationskrav Den 10. december 2009 http://echa.europa.eu 1 Anvendelse af (Q)SARmodeller Anvendelse i henhold til REACH til opfyldelse

Læs mere

RESUME TRANSLATION MEMORY-SYSTEMER SOM VÆRKTØJ TIL JURIDISK OVERSÆTTELSE. KRITISK VURDERING AF ANVENDELIGHEDEN AF TRANSLATION MEMORY-SYSTEMER TIL

RESUME TRANSLATION MEMORY-SYSTEMER SOM VÆRKTØJ TIL JURIDISK OVERSÆTTELSE. KRITISK VURDERING AF ANVENDELIGHEDEN AF TRANSLATION MEMORY-SYSTEMER TIL RESUME TRANSLATION MEMORY-SYSTEMER SOM VÆRKTØJ TIL JURIDISK OVERSÆTTELSE. KRITISK VURDERING AF ANVENDELIGHEDEN AF TRANSLATION MEMORY-SYSTEMER TIL OVERSÆTTELSE AF SELSKABSRETLIG DOKUMENTATION. I den foreliggende

Læs mere

Elementær Matematik. Mængder og udsagn

Elementær Matematik. Mængder og udsagn Elementær Matematik Mængder og udsagn Ole Witt-Hansen 2011 Indhold 1. Mængder...1 1.1 Intervaller...4 2. Matematisk Logik. Udsagnslogik...5 3. Åbne udsagn...9 Mængder og Udsagn 1 1. Mængder En mængde er

Læs mere

Alle børn har ret til en skole med en kultur for kvalitetsudvikling, der er baseret på synergi mellem interne og eksterne evalueringsprocesser.

Alle børn har ret til en skole med en kultur for kvalitetsudvikling, der er baseret på synergi mellem interne og eksterne evalueringsprocesser. Alle børn har ret til en skole med en kultur for kvalitetsudvikling, der er baseret på synergi mellem interne og eksterne evalueringsprocesser. Denne deklaration følger den europæiske vision om, at alle

Læs mere

1 ST Klassifikation Informationsmodel

1 ST Klassifikation Informationsmodel ..27 ST Klassifikation Informationsmodel. Facet En facet angiver en bestemt synsvinkel på klassificering af de objekter, som klassifikationssystemet udgør taxonomien for. Facetten grupper klasser i klassifikationssystemet.

Læs mere

Maj 2012. Forleasebyowner.com Case Studie. Hvordan E-Intelligence Forbedrede Side trafik, Rankering og Kundeemner For Forleasebyowner.

Maj 2012. Forleasebyowner.com Case Studie. Hvordan E-Intelligence Forbedrede Side trafik, Rankering og Kundeemner For Forleasebyowner. Hvordan E-Intelligence Forbedrede Side trafik, Rankering og Kundeemner For Forleasebyowner.com Maj 2012 Forleasebyowner.com Case Studie Ophavsret eintelligenceweb.com 2013 Kontakt os: eintelligenceweb.com

Læs mere

Hvad er formel logik?

Hvad er formel logik? Kapitel 1 Hvad er formel logik? Hvad er logik? I daglig tale betyder logisk tænkning den rationelt overbevisende tænkning. Og logik kan tilsvarende defineres som den rationelle tænknings videnskab. Betragt

Læs mere

DE BEAR TECHNOLOGY. o Processer, metoder & værktøjer. e-mail: info@dbtechnology.dk WWW.DBTECHNOLOGY.DK

DE BEAR TECHNOLOGY. o Processer, metoder & værktøjer. e-mail: info@dbtechnology.dk WWW.DBTECHNOLOGY.DK Mission Critical o Projekt Information management o Processer, metoder & værktøjer. Side 1 of 11 Projekt information Projekt information management inkluderer alle de processer, som er nødvendige for at

Læs mere

Effektiv søgning på web-steder

Effektiv søgning på web-steder Effektiv søgning på web-steder 7. maj 1998 Udarbejdet af DialogDesign ved Rolf Molich, Skovkrogen 3, 3660 Stenløse Indhold 1. Indledning 3 1.1. Model for søgning 3 2. Forskellige former for søgning 4 2.1.

Læs mere

Om at konvertere PDF - den gode, den dårlige og den forfærdelige metode

Om at konvertere PDF - den gode, den dårlige og den forfærdelige metode Dokumentation Om at konvertere PDF - den gode, den dårlige og den forfærdelige metode Forfatter Leonard Rosenthal PDF Standards Architect, Adobe Inc. Oversættelse Søren Frederiksen / Søren Winsløw DDPFF

Læs mere

Database for udviklere. Jan Lund Madsen PBS10107

Database for udviklere. Jan Lund Madsen PBS10107 Database for udviklere Jan Lund Madsen PBS10107 Indhold LINQ... 3 LINQ to SQL og Arkitektur... 3 O/R designere... 5 LINQ Den store introduktion med.net 3.5 er uden tvivl LINQ(udtales link): Language-INtegrated

Læs mere

IDAP manual Emission

IDAP manual Emission IDAP manual Emission Dato: 08-06-2005 16:32:35 Indhold INDHOLD... 1 1 EMISSION... 2 1.1 KURVER... 2 1.2 RAPPORTER... 5 1.3 DATA REDIGERING... 6 1.3.1 Masse redigering... 7 1.3.2 Enkelt redigering... 10

Læs mere