- Hvad er det, og hvilke fordele kan opnås ved fælles løsninger?

Størrelse: px
Starte visningen fra side:

Download "- Hvad er det, og hvilke fordele kan opnås ved fælles løsninger?"

Transkript

1 Semantik, ontologi, tesaurus mv. - Hvad er det, og hvilke fordele kan opnås ved fælles løsninger? Seniorforsker, Center for Sprogteknologi, Københavns Universitet

2 Indhold Hvorfor er semantik relevant for informationssøgning? Begrebsafklaring: semantik, ordnet, tesaurus, ontologi Hvordan opbygges sådanne videnbaser? Genbrug af eksisterende data, samt manuelle vs. halvautomatiske metoder To eksperimentelle projekter med ontologi og opmærkning med metadata 2

3 1. Hvorfor er semantik relevant? Vi får for mange informationer hvoraf meget af det er irrelevant Vi får for få informationer i forhold til hvad der rent faktisk er tilgængeligt fordi vi ikke har ramt den rigtige formulering i forespørgslen Fremtidsvisionen: Vi vil gerne kunne spørge og få et svar - ikke bare i form af tekster

4 Hvorfor er semantik relevant? For mange informationer fordi: ord kan betyde flere ting; de er flertydige Ca. 25 % af alle ord der søges på er flertydige; ca. 10 % af alle navne der søges på er flertydige homonymi: pande - hoveddel, køkkenredskab polysemi: mus - dyr, styreredskab til computer proprier: Java: ø, programmeringssprog Entydiggørelse vha af sprogteknologiske metoder: - domæneafgrænsning - sprogteknologisk beregning på kontekst 4

5 Hvorfor er semantik relevant? For få informationer fordi samme indhold kan have forskellig forklædning: ordformen genkendes ikke af systemet: trøffel - trøfler synonymer og synonyme udtryk: børnepasningsorlov - forældreorlov byrådsmedlem - medlem af byrådet Europæisk Union - EU vi kan tale om ting på forskellige specificeringsniveauer: mangelsygdom - beriberi 5

6 Hvorfor er semantik relevant? Samme udtryk i forskellig forklædning: - lemmatisering på basis af dansk sprogteknologi (stemming dur ikke for dansk) - videnmodel der kortlægger domænets udtryksvariationer og begrebsmæssige struktur således at der kan foretages beregning på semantik 'nærhed' 6

7 2. Begrebsafklaring: semantik Semantik: studiet af ords og sætningers betydning (Nudansk Ordbog) Ordsemantik hvad betyder ordene? Sætningssemantik hvad betyder sætningen? Tekstsemantik hvad er indholdet i teksterne? 7

8 Ordsemantik Uformel tilgang: i almindelig ordbøger eller tesaurusser vha definition og brugseksempler definition på kop: lille skåleformet el. cylindrisk beholder til at drikke af, typisk med hank og brugt sammen med en dertil hørende underkop til varme drikke (Den Danske Ordbog) brugseksempler: kopper og tallerkner, kvinden stiller to kopper på bordet forsvinder ind i stuens mørke og kommer tilbage med kaffe 8

9 Ordsemantik (light) Formel tilgang: delmængde af de samme oplysningstyper som i en almindelig ordbog, blot formaliseret ud fra en sprogteknologisk anskuelsesvinkel, fx i et ordnet vha. etablerede relationer: is_a, part_of, used_for, contains indeholde beholder drikke af kop drikkevare hank tekop te 9

10 Ordsemantik Formel tilgang kan indeholde langt mere formaliseret viden om betydning, fx aksiomatisk beskrivelse: kæledyr: 'der eksisterer en Person x og Dyr y sådan at x har Kæledyr y' :? x, y : instance(x, Person)? instance(y, Animal)? pet(x, y) 10

11 tekstsemantik (ekstra light) Uformel tilgang: Resumé, genfortælling Formel tilgang: Nøgleord brugt som indeksord Opmærkning med metadata fx i form af ontologiske kategorier og relationer således at de faktuelle informationer registreres i et formelt sprog Tekstsemantik er naturligvis meget mere end dette! 11

12 Ordnet Et ordnet er en database der som grundlæggende enheder indeholder betydningsdefinitioner, hvortil der knyttes de ord og vendinger som kan udtrykke pågældende betydning, såkaldte synsets Synsets forbindes med hinanden vha. semantiske relationer, fx modsætninger; sort - hvid, over- og underbegreber; møbel - stol, del-helhed; finger - hånd 12

13 Leksikalske net En tesaurus er en specialordbog eller ordsamling, der angiver konceptuel, semantisk information om begreber og termer i form af definitioner, relationer (fx over- og underbegreber), samt synonymer. Termen anvendes især inden for specifikke fagdomæner I søgesammenhæng anvendes begrebet tesaurus ofte om oversigter over søgeord til brug for indeksering 13

14 Leksikalske net En tesaurus er en specialordbog eller ordsamling, der angiver konceptuel, semantisk information om begreber og termer i form af definitioner, relationer (fx over- og underbegreber), samt synonymer. Termen anvendes især inden for specifikke fagdomæner I søgesammenhæng anvendes begrebet tesaurus ofte om oversigter over søgeord til brug for indeksering 14

15 Tesaurus En tesaurus er en specialordbog eller ordsamling, der angiver konceptuel, semantisk information om termer i form af definitioner, relationer, synonymer samt evt. anden inf. Termen anvendes især inden for specifikke fagdomæner I søgesammenhæng anvendes begrebet ofte om oversigter over søgeord til brug for indeksering 15

16 Tesaurus En tesaurus er en specialordbog eller ordsamling, der angiver konceptuel, semantisk information om begreber og termer i form af definitioner, relationer (fx over- og underbegreber), samt synonymer. Termen anvendes især inden for fagdomæner I søgesammenhæng anvendes begrebet tesaurus ofte om oversigter over søgeord til brug for indeksering 16

17 Sprogteknologi ind på flere planer 17 en ordbog el. ordsamling hvor ordene er ordnet efter betydning med angivelse af relationer til overbegreb, underbegreber og synonymer I VID-projektets delprojekt om 'ontologi og søgning med sprogteknologi' har vi foretaget følgende fem eksperimenter: 1) Identifikation af termer fra brugervirksomhedernes tekster 2) Opstilling af fagontologi 3) Identifikation af nøgleord 4) Søgning med lingvistisk viden, ontologi og Dublin

18 Ontologi Aristoteles' undersøgelse af 'tingenes væsen': identifikation af centrale begreber og relationerne i mellem dem mange forskellige faglige traditioner: filosofisk logisk datalogisk lingvistisk.. 18

19 Ontologi Karakteristika som adskiller ontologi fra de andre tilgange: I ontologi taler man om begreber eller klasser; dvs. man abstraherer over ordniveau En ontologi har ofte en aksiomatisk karakteristik af begreberne som muliggør inferens i informationssystemer? x, y : instance(x, Person)? instance(y, Animal)? pet(x, y) En ontologi kan antage mange forskellige former (inklusionshierarki, gitterstruktur, graf, topic map) 19

20 DOLCE Ontology 20

21 Sowas KR-ontology 21

22 Upper Cyc Ontology 22

23 Topic map 23

24 3. Opbygning af videnbaser Opbygning af videnmodel kræver overblik over domænets terminologi Kilder: Eksisterende ressourcer: egne ordlister, definitioner, tesaurusser mv. Uddragede termer fra tekster inden for domænet Termeksperternes viden, associationsmetoder 24

25 Termidentifikation ud fra tekster Semiautomatisk termidentifikation, mulig metode: Ordene identificeres og ordklasseopmærkes Ordene neutraliseres til grundform Navneord, tillægsord og udsagnsord udvælges Ordlisten sammenholdes med evt. eksisterende termlister inden for domænet (+liste) Ordlisten sammenholdes med en almen ordbog (- liste) Finpudsning (flerordstermer, sammensatte ord mv.) 25

26 Resultater for termudtræk Verifikation hos termeksperter: Er de fundne termkandidater rent faktisk termer? (precision) Hvor mange af termerne er fundet med den automatiske metode? (recall) Afhængig af teksttype og af hvor stort et forarbejde man har gjort med at 'rense' teksterne for støj, bør man få precision og recall på over 80 %. 26

27 Fra termer til ontologi Tre-lags model: Nederste lag: kan bygges semiautomatisk ud fra termlisten (især sammensatte ord), clustering-metoder mellemlag: kræver ekstralingvistisk viden om domænet; termeksperternes velvilje central, formålet skal stå klart Øverste lag: anvend i så høj grad som muligt ontologi- og metadatastandarder Formelle sprog og værktøjer: vi har eksperimenteret med Ontology Web Language (OWL), RDFS, Topic Maps, værktøj: Protégé 27

28 Statistiske tilgange til ontologi Semantisk clustering: ord som semantisk ligner hinanden mest, indsættes i samme gruppe (cluster), mens ord der er forskellige indsættes i separate grupper Semantisk lighed defineres som graden hvorpå ord kan erstatte hinanden i samme kontekst 28

29 Statistiske metoder Hierarkisk clustering Ikke hierarkisk clustering 29

30 Vores erfaringer med clustering Vi har eksperimenteret med CMU-statistikpakken og Lnknet-systemet udviklet af MIT Lincoln Laboratory Giver de bedste resultater på store mængder data (fx ignoreres lavfrekvente ord) Hjælper ontologidesigneren til at foretage de første grupperinger af data Understøtter ikke kodning af relationer mellem ord i de forskellige grupper og mellem grupperne 30

31 4. To eksperimenter med ontologi og metadata VID: VIden og Dokumenthåndtering med sprogteknologi CST + 5 danske/nordiske virksomheder (Ankiro, Navigo, Nordea, B&O, Zacco) formål: at udforske de forskellige muligheder som sprogteknologi frembyder inden for informationssøgning og dokumentproduktion Moses: MOdular and Scalable Environment for the Semantic web: Europæiske forskningsinstitutioner og virksomheder. Danske partnere: CST og det Humanistiske Fakultet formål: det semantiske web - også flersprogligt 31

32 VID: søgning og vedligeholdelse af standarddokumenter, IPR-domænet search engine text chunk database Domain-specific ontology Question q1 q2 q3 query expansion returned text chunks <Text chunk>:id:009 lexical database <keywords>keyword1,keyword2</keywor ds> <description>description_text </description> text, text.. 32

33 IPR (OWL plugins i Protégé) 33

34 34

35 Mål i Moses At udvikle metoder til: Opbygning og vedligeholdelse af hjemmesiders indhold via semiautomatisk opmærkning Tværsproglig søgning i opmærkede ressourcer via brugerforespørgsler i naturligt sprog Prototype: søgning i universiteters web-sites (KU, Roma III). 35

36 MOSES-ontologier Udgangspunkt: DAML+OIL universitetsontologi En italiensk og en dansk version defineret i Topic Maps - formalisme Dansk ontologi: 200 begreber, 50 relationer Ontologien bruges til strukturering/opmærkning af data og til sproglig analyse. 36

37

38 Forespørgslerne Hvilke ph.d.-studerende er der på det humanistiske fakultet på KU? På hvilke universiteter kan man læse tysk filologi? Applikationsdomæner: Ansatte/Kurser/Forskning 38

39 Afslutning Samlede løsninger, harmonisering og brug af fælles standarder er absolut efterstræbelsesværdigt Men: vigtigt at genbruge eksisterende klassifikationer fra de enkelte delområder; større chance for gennemslagskraft; Sprogpolitisk mission: Vælg sprogteknologiske løsninger som er udviklet for dansk! FOVITS-kurser: Forskningsbaseret Videreuddannelse i IT og Sprog (KU, HHK, AAU)

VID. VID-projektets mission. at foretage en række sprogteknologiske eksperimenter i et dynamisk trekantsmiljø: forskningsinstitution

VID. VID-projektets mission. at foretage en række sprogteknologiske eksperimenter i et dynamisk trekantsmiljø: forskningsinstitution Sprogteknologiske komponenter i ontologi og søgning Bolette Sandford Pedersen, Costanza Navarretta, Dorte Haltrup Hansen, Bart Jongejan Center for Sprogteknologi, KU VID-projektets mission at foretage

Læs mere

Ontologier og metadata i relation til søgning i tekster

Ontologier og metadata i relation til søgning i tekster Ontologier og metadata i relation til søgning i tekster Bolette S. Pedersen, Costanza Navarretta, Dorte Haltrup Hansen VID-rapport nr. 2 Center for Sprogteknologi Oktober 2003 Center for Sprogteknologi

Læs mere

Ontologibaseret teksthåndtering med sprogteknologi

Ontologibaseret teksthåndtering med sprogteknologi Ontologibaseret teksthåndtering med sprogteknologi Bolette S. Pedersen, Costanza Navarretta & Dorte Haltrup Hansen VID-rapport nr. 6 Center for Sprogteknologi Marts 2005 Center for Sprogteknologi 2003

Læs mere

Undertitel Anvendelse af ontologier og metadata til klassificering af information anvendt i byggeprojekter.

Undertitel Anvendelse af ontologier og metadata til klassificering af information anvendt i byggeprojekter. Aalborg Universitet Instituttet for Bygningsteknik Sohngaardsholmsvej 57 9000 Aalborg Tlf. 9635 8080 Direkte: 9635 8576 mc@bt.aau.dk Ref.: Tage Dræbye, Jesper Kirkeskov, Mads Carlsen Dato: 04.01.2005 Projektbeskrivelse,

Læs mere

Kontrolleret sprog. Indledende analyse af virksomhedernes regelsæt og sammenligning med eksisterende regelsæt

Kontrolleret sprog. Indledende analyse af virksomhedernes regelsæt og sammenligning med eksisterende regelsæt Kontrolleret sprog Indledende analyse af virksomhedernes regelsæt og sammenligning med eksisterende regelsæt Lina Henriksen, Bart Jongejan, Bente Maegaard VID-rapport nr. 1 Center for Sprogteknologi September

Læs mere

Begrebsarbejde i Kriminalforsorgen 1 Begrebsarbejde i Kriminalfor-

Begrebsarbejde i Kriminalforsorgen 1 Begrebsarbejde i Kriminalfor- Vejledning for Begrebsarbejde i Kriminalforsorgen 1 Begrebsarbejde i Kriminalfor- Del 1: Forretningsmæssig begrebsafklaring Del 2: Arbejdsproces Del 3: Fra begrebsmodel til konceptuel datamodel Bodil Nistrup

Læs mere

Semantic Web teknologier. RDF Resource Description Framework. Henrik Hvid Jensen

Semantic Web teknologier. RDF Resource Description Framework. Henrik Hvid Jensen Semantic Web teknologier RDF Resource Description Framework Whitepaper af Henrik Hvid Jensen Vidensleverandør og forfatter SOA Network Henrikhvid@soanetwork.dk November 2004 URI giver mulighed for at vi

Læs mere

Modul 2 projekt Marie Højlt & Anne Rosenstand Hansen D.19.12.06

Modul 2 projekt Marie Højlt & Anne Rosenstand Hansen D.19.12.06 Indholdsfortegnelse 1 Indledning og problemfelt... 4 1.1 Problemfelt... 4 1.1.1 Problemformulering... 7 2 Metode... 8 2.1 Motivation... 8 2.2 Begrebsafklaring... 8 2.3 Valg af teori...10 2.4 Empiri...11

Læs mere

SØGEORDSANALYSE EBOGEN. Søgeordsanalyse ebogen Nikolaj Mogensen

SØGEORDSANALYSE EBOGEN. Søgeordsanalyse ebogen Nikolaj Mogensen SØGEORDSANALYSE EBOGEN Side 1 af 43 EBOGEN OM SØGEORDSANALYSE Det er efterhånden mange år siden, at jeg første gang hørte om begrebet søgeordsanalyse. Disciplinen søgeordsanalyse hænger tæt sammen med

Læs mere

IMM-B.Eng-2010-36 NYHEDSSØGEMASKINE. Hasim Coskun. Eksamensprojekt, Diplom IT. Danmarks Tekniske Universitet. Vejleder.

IMM-B.Eng-2010-36 NYHEDSSØGEMASKINE. Hasim Coskun. Eksamensprojekt, Diplom IT. Danmarks Tekniske Universitet. Vejleder. IMM-B.Eng-2010-36 NYHEDSSØGEMASKINE Hasim Coskun Eksamensprojekt, Diplom IT Danmarks Tekniske Universitet 2010 Vejleder Finn Gustafsson Abstrakt Implementerer en parser prototype i PHP til en nyhedssøgemaskine.

Læs mere

ISSN: 1602-9259 LYKEION 11 LYKEION

ISSN: 1602-9259 LYKEION 11 LYKEION ISSN: 1602-9259 LYKEION nyt 11 LYKEION DANTERMcentret, Bernhard Bangs Allé 17 A, DK-2000 Frederiksberg T: 38153371, Fax: 38153820 Juli 2003, redaktion: Mogens Ehrich Dette nummer indeholder bl.a. materiale

Læs mere

Query expansion med sociale tags til forbedret ranking af søgeresultater

Query expansion med sociale tags til forbedret ranking af søgeresultater Query expansion med sociale tags til forbedret ranking af søgeresultater Kandidatspeciale af Jens Peter Andersen Mikkel Just Tronhus 23. maj 2008, 31.212 ord Frederik Bajers Vej 7K 9220 Aalborg Ø Query

Læs mere

E-business. Børsen Forum A/S, 2004. Børsen Ledelseshåndbøger. er Danmarks største og. stærkeste videns- og udviklingsklub.

E-business. Børsen Forum A/S, 2004. Børsen Ledelseshåndbøger. er Danmarks største og. stærkeste videns- og udviklingsklub. Børsen Ledelseshåndbøger er Danmarks største og stærkeste videns- og udviklingsklub. Uanset hvilket område eller emne du beskæftiger dig med, får du her et komplet opslagsværk på print, cd-rom og Artikel

Læs mere

HÅNDBOG I BEGREBSARBEJDE DEL 1: PRINCIPPER

HÅNDBOG I BEGREBSARBEJDE DEL 1: PRINCIPPER HÅNDBOG I BEGREBSARBEJDE DEL 1: PRINCIPPER 2005 Håndbog i begrebsarbejde Principper og metoder for arbejdsgrupperne nedsat af Det Nationale Begrebsråd for Sundhedsvæsenet Del 1: Principper Bodil Nistrup

Læs mere

DEL 2: METODER OG ARBEJDSFORLØB HÅNDBOG I BEGREBSARBEJDE

DEL 2: METODER OG ARBEJDSFORLØB HÅNDBOG I BEGREBSARBEJDE DEL 2: METODER OG ARBEJDSFORLØB 2006 HÅNDBOG I BEGREBSARBEJDE Håndbog i begrebsarbejde Principper og metoder for arbejdsgrupperne nedsat af Det Nationale Begrebsråd for Sundhedsvæsenet Del 2: Metoder og

Læs mere

Find vej. Skrevet af: Gruppe D109A Aalborg Universitet 2004

Find vej. Skrevet af: Gruppe D109A Aalborg Universitet 2004 Find vej Skrevet af: Gruppe D109A Aalborg Universitet 2004 TITEL Find vej PROJEKTPERIODE Dat1 2. September - 21. December 2004 PROJEKTGRUPPE D109A GRUPPEMEDLEMMER Morten Dahl Uffe Sørensen Martin Clemmensen

Læs mere

Speciale CLM spansk. Forfatter: May-Britt Hestehauge Studienummer: 243541. Vejleder: Lektor Sven Tarp Fakultet for sprog og erhvervskommunikation

Speciale CLM spansk. Forfatter: May-Britt Hestehauge Studienummer: 243541. Vejleder: Lektor Sven Tarp Fakultet for sprog og erhvervskommunikation Speciale CLM spansk Forfatter: May-Britt Hestehauge Studienummer: 243541 Vejleder: Lektor Sven Tarp Fakultet for sprog og erhvervskommunikation En eksemplarisk metode for, hvordan man kan anvende internettet

Læs mere

Forside til hjemmeopgave / synopsis

Forside til hjemmeopgave / synopsis Forside til hjemmeopgave / synopsis til opgaver ved Det Humanistiske Fakultet Personlige data Navn KU-mail (fx abc123@alumni.ku.dk) Telefonnummer Institut ENGEROM IKK INSS IVA MEF SAXO ToRS Studieoplysninger

Læs mere

At måle og veje korpusser et aspekt af arbejdet bag de store almensproglige korpusser for dansk

At måle og veje korpusser et aspekt af arbejdet bag de store almensproglige korpusser for dansk At måle og veje korpusser et aspekt af arbejdet bag de store almensproglige korpusser for dansk Jørg Asmussen Det Danske Sprog- og Litteraturselskab www.dsl.dk Bidrag til Bente Maegaard-festskrift KLADDE-VERSION

Læs mere

Når hurraråbene har lagt sig

Når hurraråbene har lagt sig Sabine Kirchmeier-Andersen Når hurraråbene har lagt sig Hvordan understøtter man klarsprogsarbejdet i hverdagen? Hvordan undgår man at sproglige retningslinjer bliver andet end blot nogle fine principper

Læs mere

Vejledning KPK Online Prøverum

Vejledning KPK Online Prøverum Vejledning KPK Online Prøverum INDHOLD Introduktion side 2 Funktionsliste side 2 Få adgang til systemet side 3 Opload dine billeder side 4 Sådan bruges systemet side 5 Gem dine eksempler side 7 Side 1/7

Læs mere

Søgemaskineoptimering af din egen hjemmeside 2007

Søgemaskineoptimering af din egen hjemmeside 2007 Søgemaskineoptimering af din egen hjemmeside 2007 En gør-det-selv e-bog fra DocTech DETTE ER ET UDDRAG AF BOGEN angiver områder der er taget ud Tak fordi du har investeret i denne e-bog. Den er blevet

Læs mere

Inspirationsforløb i faget matematik i 4. - 6. klasse. Sammenligning af data et inspirationsforløb om statistik og sandsynlighed i 6.

Inspirationsforløb i faget matematik i 4. - 6. klasse. Sammenligning af data et inspirationsforløb om statistik og sandsynlighed i 6. Inspirationsforløb i faget matematik i 4. - 6. klasse Sammenligning af data et inspirationsforløb om statistik og sandsynlighed i 6. klasse Indhold Indledning 3 Undervisningsforløbet 4 Mål for forløbet

Læs mere

Meeting Room Manager App

Meeting Room Manager App Meeting Room Manager App Multimediedesigneruddannelsen 4. sem, Eksamensprojekt april - maj 2009 Erhvervsakademiet København Nord Jeffrey Lai 28. Maj 2010 Introduktion 1 1.0 Introduktion 1.1 Indledning

Læs mere

DEF ÅBEN HYPERMEDIE-PROJEKT DELIVERABLE 1.1 ANALYSEDOKUMENT

DEF ÅBEN HYPERMEDIE-PROJEKT DELIVERABLE 1.1 ANALYSEDOKUMENT DEF ÅBEN HYPERMEDIE-PROJEKT DELIVERABLE 1.1 ANALYSEDOKUMENT Dok-ID: DEF-HM-00-01 Version: 1.0 Dato: 14/04-2000 Status: Endelig Ansvarlige: Mikkel Verner Nielsen, Christian Yndigegn, Kaj Grønbæk Tilgængelighed:

Læs mere

Hjemmesidehåndbog. for Norddjurs Kommune

Hjemmesidehåndbog. for Norddjurs Kommune Hjemmesidehåndbog for Norddjurs Kommune I denne vejledning kan du læse om, hvordan du skriver til nettet. Det er en vejledning i at lægge indhold på Norddjurs Kommunes hjemmesider, så brugerne kan læse

Læs mere

Specifikation af serviceinterface for organisation. Dette udkast til standard er i offentlig høring i perioden 12. oktober til 13.

Specifikation af serviceinterface for organisation. Dette udkast til standard er i offentlig høring i perioden 12. oktober til 13. Specifikation af serviceinterface for organisation Dette udkast til standard er i offentlig høring i perioden 12. oktober til 13. november 2009 Specifikation af forretningsservice for Organisation Denne

Læs mere

Et begrebssystem for. informationssikkerhed

Et begrebssystem for. informationssikkerhed Rapport fra nbs06 Informationssikkerhed Side 1 af 150 Et begrebssystem for informationssikkerhed Rapport fra arbejdsgruppe nbs06 under Det Nationale Begrebsråd for Sundhedsvæsenet Maj 2006 Rapport fra

Læs mere

2 Typologisering af internetressourcer

2 Typologisering af internetressourcer 2 Typologisering af internetressourcer I dette kapitel vil jeg præsentere de forskellige typer af internetdokumenter, som er relevante for fagområdet "informationsteknologi". Først vil jeg se nærmere på

Læs mere

Lingvistiske specifikationer for DanNet Version 2

Lingvistiske specifikationer for DanNet Version 2 DanNet 1. juli 2011 Lingvistiske specifikationer for DanNet Version 2 Bolette S. Pedersen & Anna Braasch, Center for Sprogteknologi, Københavns Universitet, Sanni Nimb, Jørg Asmussen, Nicolai Sørensen,

Læs mere