Sprogteknologiske resourcer for islandsk leksikografi

Størrelse: px
Starte visningen fra side:

Download "Sprogteknologiske resourcer for islandsk leksikografi"

Transkript

1 Eiríkur Rögnvaldsson Sprogteknologiske resourcer for islandsk leksikografi Seminar om leksikografi og sprogteknologi Schæffergården 31. januar 2010

2 Foredragets emne Islandsk sprogteknologi omkring århundredskiftet Sprogteknologiske resurser for islandsk Morfologisk database Balanceret tagget corpus Sprogteknologiske værktøjer Open source policy Nye og kommende projekter

3 Islandsk sprogteknologi for ti år siden Islandsk sprogteknologi eksisterede ikke år 2000 Vi havde Et godt stavekontrolsystem En primitiv talesyntese Vi havde ikke Universitetsprogrammer eller kurser i sprogteknologi Akademisk forskning i islandsk sprogteknologi Software firmaer som arbejdede med sprogteknologi

4 Sprogteknologiudvalget Et specielt sprogteknologiudvalg Oprettet i 1998 af ministeren for undervisning og forskning Opgaver: At undersøge situationen i islandsk sprogteknologi At komme med forslag for at styrke sprogteknologien i Island

5 Foreslåede aktiviteter Sproglige resurser skulle udvikles og opbygges til andvendelse for fimaer som ville udvikle sprogteknologiske værktøjer og andre produkter Praktisk forskning indenfor sprogteknologi skulle støttes Firmaer skulle støttes til at udvikle sprogteknologiske produkter Universitetsprogrammer og kurser i sprogteknologi skulle oprettes

6 Sprogteknologiprogrammets produkter En morfologisk database med ord Et balanceret tagget korpus med 25 million ord En statistisk PoS tagger Islandsk talesyntese Islandsk talgenkender Et forbedret stavekontrolsystem

7 Islandsk frekvensordbog 100 forskellige tekster fra 5 genrer Islandske romaner Romaner i oversættelse Historie og biografier Børnelitteratur Faglitteratur ord lemmaer

8 Fra Islandsk frekvensordbog

9 Fra basen til Islandsk frekvensordbog f p k e n hann han s f g 3 e þ átti ejede n h e o afmæli fødselsdag a o í i n k e o dag dag c og og n k e n g hvolpurinn hvalpen n k e n - m Vaskur Vask s f g 3 e þ var var n v e n afmælisgjöf fødselsdagsgave

10 Morfologisk database Morfologisk database for islandsk sprog Beygingarlýsing íslensks nútímamáls, BÍN Et projekt der blev påbegyndt i 2002 ved Leksikografisk Institut finanisieret af sprogteknologiprojektet projektleder Kristín Bjarnadóttir Indeholder nu paradigmer for ord flere end 5,6 millioner ordformer

11 Hensigten med databasen Til hvilken brug blev databasen oprettet? For brug indenfor sprogteknologi For opslag på instituttets webside Har hidtil været brugt i søgemaskiner (embla på mbl.is) i telefonbogen i læremateriale (Icelandic Online) som hjælp ved tagging og lemmatisering

12 Hvad indeholder databasen? Ordklasse Lemmaer Ordformer Klasser Substantiver Verber Adjektiver Adverbier Talord Pronomener Artikel 1 24

13 Paradigmer i BÍN-databasen Paradigmer for nogle ord hestur subst.mask. hest hvítur adj. hvid bera vb. bære inni adv. inde þessi pron. denne einn num. én

14 Omstrukturering af databasen Databasen er nylig blevet omstruktureret filene lagt ind i en MySQL database Målet med omstruktureringen er at gøre det nemmere at vedligeholde databasen og at gøre søgning i den hurtigere Et excerperingsprogram er blevet lavet i forbindelse med omstruktureringen

15 Balanceret korpus Balanceret tagget korpus Projektleder Sigrún Helgadóttir 25 million ord Mange forskellige teksttyper PoS-tagget Samme tagsæt som i Islandsk frekvensordbog XML-markup TEI-kompatibel format

16 Vigtigste teksttyper Avistekst Trykte bøger (romaner o.fl.) Blog Forskellige tidsskrifter Tekst fra Videnskabswebben Webtekster fra institutter, firmaer, etc. Love og andre tekster fra Altinget Talesprog

17

18 Ordliste med lydskrift Liste med frekvente ordformer Oprindelig lavet for Hjal-projektet To typer af lydskrift IPA og SAMPA Er allerede blevet brugt til talgenkendelse talesyntese

19 Fra den fonetiske ordliste

20 Liste over verber med argumentstruktur

21 PoS taggere

22 IceParser

23 Lemmatisere

24 IceNLP IceTagger IceParser Lemmald Online værktøjer værktøjerne kan bruges ét ad gangen eller alle samtidig

25 Open source Sprogteknologiprojektets produkter skulle være tilgængelige for alle til en rimelig pris men det har vist sig at selv en lav pris fører til at produkterne ikke bliver brugt Det er vigtigt at alle sprogteknologiske resurser for islandsk bliver open source IceNLP er blevet open source licenceret under GNU LGPL

26 Et nyt projekt Vi har nu startet et nyt treårigt projekt for at opbygge resurser for islandsk sprogteknologi Viable Language Technology beyond English Icelandic as a test case Tre delprojekter En database af semantiske relationer Shallow transfer maskinoversættelse En træbank (syntaktisk analyseret korpus)

27 Konklusion Vi har fået en del sprogteknologiske resurser for islandsk i det sidste årti Nogen af dem vil også være vigtige for leksikografisk arbejde Vi mangler endnu en sprogteknologisk orddatabase med morfologi, syntax og semantik Men vi har mange slags materiale som kunne kobles sammen til en sådan orddatabase

28

Automatiske metoder til excerpering af nye ord

Automatiske metoder til excerpering af nye ord Automatiske metoder til excerpering af nye ord Kristín Bjarnadóttir og Eiríkur Rögnvaldsson Seminar om sprogrøgt og sprogteknologi København 29. oktober 2007 Foredragets emne Prototype af et værktøj for

Læs mere

Det islandske ordklasseopmærkede korpus MÍM Sigrún Helgadóttir

Det islandske ordklasseopmærkede korpus MÍM Sigrún Helgadóttir Det islandske ordklasseopmærkede korpus MÍM Sigrún Helgadóttir Det islandske ordklasseopmærkede korpus Oversigt over foredraget: Hvor stammer projektet fra? Hvad er et ordklasseopmærket korpus? Hvordan

Læs mere

LexicoNordica. særtryk. leksikografi og språkteknologi i norden. nordisk forening for leksikografi

LexicoNordica. særtryk. leksikografi og språkteknologi i norden. nordisk forening for leksikografi LexicoNordica 17 2010 leksikografi og språkteknologi i norden særtryk nordisk forening for leksikografi lexiconordica 2010 LexicoNordica 17 2010 Leksikografi og språkteknologi i Norden Hovedredaktører

Læs mere

Spørgsmål om ophavsret den islandske erfaring

Spørgsmål om ophavsret den islandske erfaring Spørgsmål om ophavsret den islandske erfaring Sigrún Helgadóttir Árni Magnússon instituttet for islandske studier Leksikografisk afdeling Spåkteknologisk infrastruktur Nordiskt seminarium vid Wallenberg

Læs mere

Sprogteknologi I Undervisningsplan Forårssemester 2008

Sprogteknologi I Undervisningsplan Forårssemester 2008 Sprogteknologi I Undervisningsplan Forårssemester 2008 Patrizia Paggio 27/9/2007 1 Introduktion til sprogteknologi Hvad er sprogteknologi Hvorfor er det svært at processere sprog Eksempler på applikationer

Læs mere

Sprogteknologi I Undervisningsplan Forårssemester 2009

Sprogteknologi I Undervisningsplan Forårssemester 2009 Sprogteknologi I Undervisningsplan Forårssemester 2009 Version 1 Patrizia Paggio 25/1/2009 6.feb: Lektion 1. Introduktion til sprogteknologi Hvad er sprogteknologi Hvorfor er det svært at processere sprog

Læs mere

Intro til design og brug af korpora

Intro til design og brug af korpora Intro til design og brug af korpora Jørg Asmussen ja@dsl.dk Det Danske Sprog- og Litteraturselskab www.dsl.dk Intro til design og brug korpuslingvistik af korpora Jørg Asmussen ja@dsl.dk Det Danske Sprog-

Læs mere

ISLEX. Islandsk-skandinavisk webordbog. Stofnun Árna Magnússonar í íslenskum fræðum Árni Magnússon-instituttet for islandske studier. 1.

ISLEX. Islandsk-skandinavisk webordbog. Stofnun Árna Magnússonar í íslenskum fræðum Árni Magnússon-instituttet for islandske studier. 1. MÁLFRÍÐUR 11 ISLEX Islandsk-skandinavisk webordbog Stofnun Árna Magnússonar í íslenskum fræðum Árni Magnússon-instituttet for islandske studier Projektet er for det meste finansieret af de fire landes

Læs mere

It-støttet excerpering og registrering af nye ord og ordforbindelser

It-støttet excerpering og registrering af nye ord og ordforbindelser It-støttet excerpering og registrering af nye ord og ordforbindelser Møde i Selskab for Nordisk Filologi 30. oktober 2008 Jakob Halskov Projektforsker, ph.d. Dansk Sprognævn jhalskov@dsn.dk Disposition

Læs mere

NORDISKE STUDIER I LEKSIKOGRAFI

NORDISKE STUDIER I LEKSIKOGRAFI NORDISKE STUDIER I LEKSIKOGRAFI Titel: Forfatter: Ordbogen og den daglige tale - Om den islandske talesprogsbank (ISTAL) og dens betydning i ordbogsredaktion Ásta Svavarsdóttir Kilde: Nordiske Studier

Læs mere

ISLEX - Islandsk-skandinavisk webordbog

ISLEX - Islandsk-skandinavisk webordbog Sammenfatning ISLEX er et elektronisk ordbogsværk hvor kildesproget er islandsk og målsprogene er dansk, svensk og norsk (både nynorsk og bokmål). Ordbogen genspejler islandsk sprogbrug i samtiden og den

Læs mere

sproget.dk en internetportal for det danske sprog

sproget.dk en internetportal for det danske sprog sproget.dk en internetportal for det danske sprog Ida Elisabeth Mørch, Dansk Sprognævn Lars Trap-Jensen, Det Danske Sprog- og Litteratuselskab 1 Baggrunden 2003 Sprog på spil 2005 Ekstrabevilling 2006

Læs mere

Nordiska studier i lexikografi

Nordiska studier i lexikografi Särtryck ur Nordiska studier i lexikografi 11 Rapport från Konferensen om lexikografi i Norden Lund 24 27 maj 2011 ISLEX en flersproget nordisk ordbog Halldóra Jónsdóttir & Þórdís Úlfarsdóttir Skrifter

Læs mere

NyS. NyS og artiklens forfatter

NyS. NyS og artiklens forfatter NyS Titel: Forfatter: Kilde: Udgivet af: URL: Danske resurser til automatisk opmærkning Dorte Haltrup NyS Nydanske Sprogstudier 30. Korpuslingvistik, 2002, s. 59-67 Akademisk Forlag A/S www.nys.dk NyS

Læs mere

Aalborg Katedralskole Masterplan for grundforløb i almen sprogforståelse

Aalborg Katedralskole Masterplan for grundforløb i almen sprogforståelse Aalborg Katedralskole Masterplan for grundforløb i almen sprogforståelse Overordnede faglige mål med AP-forløbet Det primære formål med AP er at give eleverne en nødvendig basisforståelse for morfologi,

Læs mere

Han overfører altså dele fra en brugt ytring, og bruger dem i sine egne sætningskonstruktioner dog ikke grammatisk korrekt.

Han overfører altså dele fra en brugt ytring, og bruger dem i sine egne sætningskonstruktioner dog ikke grammatisk korrekt. Børns morfologi En optælling af Peters ordforråd viser, at han den ordklasse han bruger mest, er substantiver. Det hænger hovedsageligt sammen med, at det er nemmere at forene en fysisk genstand med en

Læs mere

LEKSIKOGRAFISK TRADITION OG FORNYELSE: Digital revolution eller organisk reformisme? Lars Trap-Jensen NFL, Oslo 2013

LEKSIKOGRAFISK TRADITION OG FORNYELSE: Digital revolution eller organisk reformisme? Lars Trap-Jensen NFL, Oslo 2013 LEKSIKOGRAFISK TRADITION OG FORNYELSE: Digital revolution eller organisk reformisme? Lars Trap-Jensen NFL, Oslo 2013 1900 LEKSIKOGRAFISK REVOLUTION? 2000 2 AKADEMIPRINCIPPET: Normerende, opdragende Alle

Læs mere

Rettelserne er markeret med understregning. 13. Socialisations- og institutionsforståelser (Culturalization and Institutional Analysis)

Rettelserne er markeret med understregning. 13. Socialisations- og institutionsforståelser (Culturalization and Institutional Analysis) Rettelsesblad til studieordning for bacheloruddannelsen i interkulturel pædagogik og arabisk 2011 samt bacheloruddannelsen i interkulturel pædagogik og dansk som andetsprog 2011 Gælder for studerende indskrevet

Læs mere

VID. VID-projektets mission. at foretage en række sprogteknologiske eksperimenter i et dynamisk trekantsmiljø: forskningsinstitution

VID. VID-projektets mission. at foretage en række sprogteknologiske eksperimenter i et dynamisk trekantsmiljø: forskningsinstitution Sprogteknologiske komponenter i ontologi og søgning Bolette Sandford Pedersen, Costanza Navarretta, Dorte Haltrup Hansen, Bart Jongejan Center for Sprogteknologi, KU VID-projektets mission at foretage

Læs mere

Studieordning for tilvalget på bachelorniveau i. It og sprog, 2013-ordningen

Studieordning for tilvalget på bachelorniveau i. It og sprog, 2013-ordningen Studieordning for tilvalget på bachelorniveau i It og sprog, 2013-ordningen Institut for Nordiske Studier og Sprogvidenskab Det Humanistiske Fakultet Københavns Universitet Indhold Kapitel 1. Hjemmel,

Læs mere

Aalborg Katedralskole Masterplan for grundforløb i almen sprogforståelse

Aalborg Katedralskole Masterplan for grundforløb i almen sprogforståelse Aalborg Katedralskole Masterplan for grundforløb i almen sprogforståelse Overordnede faglige mål med AP-forløbet Det primære formål med AP er at give eleverne en nødvendig basisforståelse for morfologi,

Læs mere

PHP Quick Teknisk Ordbog

PHP Quick Teknisk Ordbog PHP Quick Teknisk Ordbog Af Daniel Pedersen PHP Quick Teknisk Ordbog 1 Indhold De mest brugte tekniske udtryk benyttet inden for web udvikling. Du vil kunne slå de enkelte ord op og læse om hvad de betyder,

Læs mere

Sprogteknologi og formel semantik

Sprogteknologi og formel semantik Oversigt Sprogteknologi og formel semantik Bolette Sandford Pedersen Center for Sprogteknologi Københavns Universitet bolette@cst.dk Det formelle paradigme Vigtige forskningsspørgsmål inden for sprogteknologi

Læs mere

2nd N o rdic Conference o f Computational Linguistics N O D A L ID A 1979

2nd N o rdic Conference o f Computational Linguistics N O D A L ID A 1979 H anne Ruus 139 In stitu t for nordisk filo lo g i Københavns Universitet Njalsgade 80 DK 2300 København S. SEMANTIK I AUTOMATISK LEMMATISERING. De fleste, der beskæftiger sig med lemmatisering, har som

Læs mere

Danske adverbier mellem leksikon og syntaks Ph.d.-afhandling Sanni Nimb

Danske adverbier mellem leksikon og syntaks Ph.d.-afhandling Sanni Nimb Danske adverbier mellem leksikon og syntaks Ph.d.-afhandling Sanni Nimb Institut for Nordiske Studier og Sprogvidenskab samt Center for Sprogteknologi Københavns Universitet, september 2004 Forord Denne

Læs mere

Aalborg Katedralskole Masterplan for grundforløb i almen sprogforståelse

Aalborg Katedralskole Masterplan for grundforløb i almen sprogforståelse Aalborg Katedralskole Masterplan for grundforløb i almen sprogforståelse Overordnede faglige mål med AP-forløbet Det primære formål med AP er at give eleverne en nødvendig basisforståelse for morfologi,

Læs mere

Brug af CLARIN s værktøjer til at skabe AcaDan, et korpus for dansk akademisk sprog

Brug af CLARIN s værktøjer til at skabe AcaDan, et korpus for dansk akademisk sprog Brug af CLARIN s værktøjer til at skabe AcaDan, et korpus for dansk akademisk sprog Anne Sofie Jakobsen, ph.d.-stipendiat Institut for Engelsk, Germansk og Romansk Dias 1 LUNAS nordisk netværk 2013-2016

Læs mere

MULINCO - Korpusplatform til sprog- og oversættelsesstudier

MULINCO - Korpusplatform til sprog- og oversættelsesstudier MULINCO - Korpusplatform til sprog- og oversættelsesstudier Bente Maegaard Direktør Center for Sprogteknologi Københavns Universitet bente@cst.dk www.cst.dk/bente/index.html Lene Offersgaard Seniorudviklingsingeniør

Læs mere

Aalborg Katedralskole Masterplan for grundforløb i almen sprogforståelse

Aalborg Katedralskole Masterplan for grundforløb i almen sprogforståelse Aalborg Katedralskole Masterplan for grundforløb i almen sprogforståelse Overordnede faglige mål med AP-forløbet Det primære formål med AP er at give eleverne en nødvendig basisforståelse for morfologi,

Læs mere

En rundvisning i ordnet.dk

En rundvisning i ordnet.dk Tur En rundvisning i ordnet.dk Guide Jørg Asmussen Det Danske Sprog- og Litteraturselskab Tid & Sted Fredag, 9. november 2012 Universität Flensburg Mere Denne præsentation findes under http://korpus.dsl.dk/staff/ja/pres/uniflens2012.pdf

Læs mere

Lingvistiske faktorers betydning for interskandinavisk sprogforståelse. Charlotte Gooskens

Lingvistiske faktorers betydning for interskandinavisk sprogforståelse. Charlotte Gooskens Lingvistiske faktorers betydning for interskandinavisk sprogforståelse Charlotte Gooskens 1 Oversigt 1. baggrund 2. projekter 3. måling af sprogforståelse 4. lingvistiske afstande - fonetiske afstande

Læs mere

DK CLARIN: METADATA FOR WP4 RESSOURCER

DK CLARIN: METADATA FOR WP4 RESSOURCER DK CLARIN: METADATA FOR WP4 RESSOURCER DK CLARIN WP 4 Version 2011 02 01 Bolette S. Pedersen, KU, bspedersen@hum.ku.dk Lene Offersgaard, KU, leneo@hum.ku.dk Nicolai H. Sørensen, DSL, nhs@dsl.dk Viggo Sørensen,

Læs mere

GUIDE. for børn og deres voksne

GUIDE. for børn og deres voksne åh velkommen mens kultur føle halvtreds os øv tale menneske vi wow kær en selvfølgelig fordi land fjorten og fjerde den mærke hos du kærlighed hvem hviske tvivl snart stor da fascinerende forunderlig af

Læs mere

Center for Internationalisering og Parallelsproglighed (CIP)

Center for Internationalisering og Parallelsproglighed (CIP) Center for Internationalisering og Parallelsproglighed (CIP) Akademiske ordlister fra et sprogpolitisk perspektiv? Birgit Henriksen, Centerleder i CIP Og Anne Sofie Jakobsen, forskningsassistent i CIP

Læs mere

Islandsk i officiel teori og individuel praksis

Islandsk i officiel teori og individuel praksis 1 Islandsk i officiel teori og individuel praksis Guðrún Kvaran & Hanna Óladóttir Reykjavík Det er her meningen at tale lidt om nydannelse af ord i islandsk. Hvilken status den har i islandsk sprogpolitik,

Læs mere

I denne e-bog får du en introduktion til følgende:

I denne e-bog får du en introduktion til følgende: Inbound Marketing I denne e-bog får du en introduktion til følgende: Inbound marketing metoden Hvad der adskiller inbound marketing fra de mere traditionelle markedsføringsmetoder Hvordan du tiltrækker

Læs mere

OLAM et semiautomatisk morfologisk og lydstrukturelt kodningssystem for dansk

OLAM et semiautomatisk morfologisk og lydstrukturelt kodningssystem for dansk OLAM et semiautomatisk morfologisk og lydstrukturelt kodningssystem for dansk Thomas O. Madsen, Hans Basbøll og Claus Lambertsen 1 Syddansk Universitet, Institut for sprog og kommunikation Campusvej 55,

Læs mere

Sprogzonen. Sprogfaglig Dag. // CFU Sjælland + Hovedstaden. Arbeitsgeschäft. Roskilde //

Sprogzonen. Sprogfaglig Dag. // CFU Sjælland + Hovedstaden. Arbeitsgeschäft. Roskilde // Arbeitsgeschäft I brug Betydning Grammatik Lyde Fonetik og fonologi Fokus på svære lyde Øvelse Hvilke ord er svære for jeres elever? Streichholzschächtelchen? Ich!? Stein? Øvelse 1. Skriv (mindst) 10 svære

Læs mere

Fag. Navne. Undervisere. Antal anslag. IT og Informationssøgning de bagvedliggende datalogiske og sprogteknologiske principper

Fag. Navne. Undervisere. Antal anslag. IT og Informationssøgning de bagvedliggende datalogiske og sprogteknologiske principper Fag IT og Informationssøgning de bagvedliggende datalogiske og sprogteknologiske principper Navne Andreas Søeborg Kirkedal Lars Kolind Jonas Andersen Undervisere Bolette Pedersen, Costanza Navarretta,

Læs mere

SPØRGSMÅL OG SVAR TIL UDBUDDET [D ]

SPØRGSMÅL OG SVAR TIL UDBUDDET [D ] SPØRGSMÅL OG SVAR TIL UDBUDDET [D. 29.06.17] 1. Engelsk udgave af udbudsmaterialet [Tender material in English] Findes udbudsmaterialet i en engelsk udgave? [Is the tender material available in English?]

Læs mere

ordbøgerne og internettet

ordbøgerne og internettet IV ordbøgerne og internettet betragtninger over ordnet.dk a f c a n d. m a g., m p h i l l a r s t r a p - j e n s e n l e d e n d e r e d a k t ø r, d e t d a n s k e s p r o g - o g l i t t e r a t u

Læs mere

Integration af flere forskellige værktøjer i oversættelsesprocessen. Nancy L. Underwood Center for Sprogteknologi

Integration af flere forskellige værktøjer i oversættelsesprocessen. Nancy L. Underwood Center for Sprogteknologi Integration af flere forskellige værktøjer i oversættelsesprocessen Nancy L. Underwood Center for Sprogteknologi Integration af forskellige værktøjer i oversættelsesprocessen Hvorfor? Oversigt Hvordan?

Læs mere

ordnet.dk ordbøger og korpus på internettet

ordnet.dk ordbøger og korpus på internettet ordnet.dk ordbøger og korpus på internettet Af Henrik Lorentzen og Lars Trap-Jensen, Det Danske Sprog- og Litteraturselskab Ordnet.dk er et websted der giver samtidig adgang til to ordbøger og et tekstkorpus.

Læs mere

Hvad ved vi nu. om danske talesprog? Redigeret af Frans Gregersen og Tore Kristiansen SPROGFORANDRINGSCENTRET

Hvad ved vi nu. om danske talesprog? Redigeret af Frans Gregersen og Tore Kristiansen SPROGFORANDRINGSCENTRET Hvad ved vi nu om danske talesprog? Redigeret af Frans Gregersen og Tore Kristiansen SPROGFORANDRINGSCENTRET Denne artikel er kapitel 10 i bogen Hvad ved vi nu om danske talesprog? (red. F. Gregersen og

Læs mere

Årsplan for 4. klasse (dansk)

Årsplan for 4. klasse (dansk) Årsplan for 4. klasse (dansk) Periode Emne/ fokuspunkt Mål Handleplan Evaluering Aug okt. Helt ærligt Reklamer: trykte og digitale At give et indblik i og overblik over, hvad grundbogen vil byde på i løbet

Læs mere

gelig tendens til, at fagordbøger bliver skæmmet ved en sjusket leksikografisk udførelse, der medfører, at det faglige og sproglige indhold ikke

gelig tendens til, at fagordbøger bliver skæmmet ved en sjusket leksikografisk udførelse, der medfører, at det faglige og sproglige indhold ikke Alice Lykke Holste, Tinna Nielsen, Marina Orlova-Jermark og Viktor Smith: Russisk rets- og politisprog. Grundlæggende begreber og principper. Russisk-dansk juridisk ordbog. København: Handelshøjskolens

Læs mere

CENTER FOR SPROGTEKNOLOGI. Center for Sprogteknologi. Årsrapport

CENTER FOR SPROGTEKNOLOGI. Center for Sprogteknologi. Årsrapport CENTER FOR SPROGTEKNOLOGI Center for Sprogteknologi Årsrapport 2002 Årsrapport 2002 København, April 2003 Center for Sprogteknologi Njalsgade 80 2300 København S Tlf: +45 35 32 90 90 Fax: +45 35 32 90

Læs mere

Årsplan for 4. klasse (dansk)

Årsplan for 4. klasse (dansk) Årsplan for 4. klasse (dansk) Periode Emne/ fokuspunkt Mål Handleplan Evaluering Aug okt. Vi tager på lejrskole d. 28.-30. August. Helt ærligt H.C.A. forløb At give et indblik i og overblik over, hvad

Læs mere

Sprogteknologiske ressourcer til informationssøgning

Sprogteknologiske ressourcer til informationssøgning Sprogteknologiske ressourcer til informationssøgning Af Bolette Sandford Pedersen, Patrizia Paggio og Costanza Navarretta Abstract Formålet med denne artikel er at præsentere et antal sprogteknologiske

Læs mere

Virtuelle perspektiver for ordbogsredigering: muligheder, strategier og virkelighedens begrænsning

Virtuelle perspektiver for ordbogsredigering: muligheder, strategier og virkelighedens begrænsning Lars Trap-Jensen * 1 Virtuelle perspektiver for ordbogsredigering: muligheder, strategier og virkelighedens begrænsning The electronic medium offers improved search facilities and allows much more information

Læs mere

BILAG 3_Tabel Komparativ Analyse 4 Maritime Kilder omsat i Tabelform Præsentation6 Inspiration Komparativ Analyse 4 Maritime Kilder

BILAG 3_Tabel Komparativ Analyse 4 Maritime Kilder omsat i Tabelform Præsentation6 Inspiration Komparativ Analyse 4 Maritime Kilder BILAG 3_Tabel Komparativ Analyse 4 Maritime Kilder omsat i Tabelform Præsentation6 Inspiration Komparativ Analyse 4 Maritime Kilder CMA: California Maritime Academy Library KMRC: MERIKOTA/Kotka Maritime

Læs mere

Bioinformatik Open Source Software i biologiens tjeneste

Bioinformatik Open Source Software i biologiens tjeneste Bioinformatik Open Source Software i biologiens tjeneste Kenneth Geisshirt kneth@silex.dk Silex Science ApS Bioinformatik p.1/19 Om Silex Science ApS Grundlagt maj 2002 Ejeren er Cortex Holding Fokusområderne

Læs mere

Bilag 1. Der er en rar og hyggelig atmosfære. interesseret i Frekvens Antal 85 102 147 43 Procent 54,5 % 65,4 % 94,2 % 27,6 %

Bilag 1. Der er en rar og hyggelig atmosfære. interesseret i Frekvens Antal 85 102 147 43 Procent 54,5 % 65,4 % 94,2 % 27,6 % Bilag 1 Datasæt for Bjæverskov: Frekvenstabeller Tabel B.1 Bjæverskov Bibliotek Grunden til benyttelse af netop dette bibliotek Frekvenstabel Hvorfor benytter du netop dette bibliotek? Der er en rar og

Læs mere

SPØRGSMÅL OG SVAR TIL UDBUDDET [D ]

SPØRGSMÅL OG SVAR TIL UDBUDDET [D ] SPØRGSMÅL OG SVAR TIL UDBUDDET [D. 04.07.17] 1. Engelsk udgave af udbudsmaterialet [Tender material in English] Findes udbudsmaterialet i en engelsk udgave? [Is the tender material available in English?]

Læs mere

PHP kode til hjemmeside menu.

PHP kode til hjemmeside menu. PHP kode til hjemmeside menu. Home Hovedmenu 1 Hovedmenu 2 Hovedmenu 3 Hovedmenu 4 Undermenu 1 Breadcrumb Her vises indholdet af den valgte side Undermenu 2 Undermenu 3 Undermenu 4 Evt. en mulighed for

Læs mere

CURRICULUM VITAE. Hoda Al-Amood, 2014

CURRICULUM VITAE. Hoda Al-Amood, 2014 CURRICULUM VITAE Hoda Al-Amood, 2014 Kontakt info: Navn: Hoda Al-Amood Født: oktober-1974 Civil stand: Samlevende Adresse: Mellemengen 3, 1TV 2980 Kokkedal Telefon: 31 25 04 34 E-mail: hodaal@gmail.com

Læs mere

Sproglige problemstillinger ved informationssøgning

Sproglige problemstillinger ved informationssøgning Sproglige problemstillinger ved informationssøgning Patrizia Paggio Center for Sprogteknologi Københavns Universitet patrizia@cst.dk Disposition Søgemaskiner i dag: nogle problemer Nogle krav til fremtidig

Læs mere

NORDISKE STUDIER I LEKSIKOGRAFI

NORDISKE STUDIER I LEKSIKOGRAFI NORDISKE STUDIER I LEKSIKOGRAFI Titel: Forfatter: Hybris - nemesis - balance. Problemer med genbrug af ordbogsdata set fra Den Danske Ordbog Ebba Hjorth Kilde: Nordiska Studier i Lexikografi 4, 1997, s.

Læs mere

Informationssøgning metoder og scenarier

Informationssøgning metoder og scenarier Informationssøgning metoder og scenarier Patrizia Paggio Center for Sprogteknologi Københavns Universitet patrizia@cst.dk Disposition Forskellige systemer IR, IE og QA Information Retrieval (IR) Boolean

Læs mere

Semantikopgave Ved Tobias Scavenius

Semantikopgave Ved Tobias Scavenius Semantikopgave Ved Tobias Scavenius Opgaveformulering Undersøg hvordan verbet bære er beskrevet semantisk i DDO, sammenhold beskrivelsen med Ruus beskrivelse i Kognitiv semantik på dansk. Undersøg hvordan

Læs mere

Læringsmål: Årsplan 2015-2016. Dansk. 2.klasse. Mål

Læringsmål: Årsplan 2015-2016. Dansk. 2.klasse. Mål Årsplan 2015-2016 Dansk 2.klasse Mål Formålet med undervisningen i dansk er, at fremme elevernes oplevelse og forståelse af sprog, litteratur og andre udtryksformer som kilder til udvikling af personlig

Læs mere

KORTLÆGNING AF DIGITIALISERINGS- BEHOV I DANMARK HUMANOMICS RESEARCH CENTER

KORTLÆGNING AF DIGITIALISERINGS- BEHOV I DANMARK HUMANOMICS RESEARCH CENTER ANALYSERAPPORT KORTLÆGNING AF DIGITIALISERINGS- BEHOV I DANMARK HUMANOMICS RESEARCH CENTER Denne rapport samt bilag indeholder den endelige database af spørgeskemaet Anvendelsen af digitale ressourcer

Læs mere

Databasesøgning. 1. års

Databasesøgning. 1. års Databasesøgning 1. års Gymnasiets Biblioteksbase Gymnasiets Biblioteksbase: Indeholder materialer, der fysisk befinder sig på Vordingborg Gymnasium & HFs bibliotek www.vgbib.dk Vordingborg Bibliotekerne

Læs mere

Fællesmål for faget dansk som fremmedsprog på Prins Henriks Skole Formål, slutmål, delmål og undervisningsplaner

Fællesmål for faget dansk som fremmedsprog på Prins Henriks Skole Formål, slutmål, delmål og undervisningsplaner Fællesmål for faget dansk som fremmedsprog på Prins Henriks Skole Formål, slutmål, delmål og undervisningsplaner INDHOLDSFORTEGNELSE INDLEDNING. Side 2 FORMÅL. Side 2 SLUTMÅL. Side 3 DELMÅL.. Side 4 TRINMÅL

Læs mere

Ordklasser. Hele feltet

Ordklasser. Hele feltet Ordklasser Hele feltet Ordklasser - hele feltet Der findes 10 ordklasser, én til hver finger. Ikke mere, ikke mindre. Det er meget nærliggende at kalde ordklasser for ordkasser, for det er det det drejer

Læs mere

Manuskriptvejledning De Studerendes Pris

Manuskriptvejledning De Studerendes Pris Fremsendelse af artikel Artikler skrevet på baggrund af bachelorprojekter, der er afleveret og bestået i det annoncerede tidsrum, kan deltage i konkurrencen om De Studerendes Pris. Det er kun muligt at

Læs mere

brug nettet / lær at søge effektivt

brug nettet / lær at søge effektivt brug nettet / lær at søge effektivt Med netmedierne kan du gratis og lovligt: Downlåne materiale direkte til din egen pc Undgå ventetid Få adgang til et utal af fuldtekst artikler fra diverse tidsskrifter

Læs mere

Bilag 1 (2.del) Der er en rar og hyggelig atmosfære. jeg er interesseret i Frekvens Antal 77 85 119 44 Procent 57% 63% 88,1% 32,6%

Bilag 1 (2.del) Der er en rar og hyggelig atmosfære. jeg er interesseret i Frekvens Antal 77 85 119 44 Procent 57% 63% 88,1% 32,6% Datasæt for Ejby: Bilag 1 (2.del) Frekvenstabeller Tabel E1 Ejby bibliotek Grunden til benyttelse af netop dette bibliotek Frekvenstabel Hvorfor benytter du netop dette bibliotek? Der er en rar og hyggelig

Læs mere

Uge Indhold Aktivitet Færdigheder/mål. Skriveøvelser

Uge Indhold Aktivitet Færdigheder/mål. Skriveøvelser Dansk 35-38 Kalligrafikursus Mediekundskab 40-41 Mediekundskab Grammatik, herunder ordklasser, formlære og syntax. Tegnsætning. 43-44 Mediekundskab Kommatering 46-51 Kursus i læsetræning Biografier 2-4

Læs mere

Indhold. Indhold... 2

Indhold. Indhold... 2 Efterårskurser 2017 ... 2 Se kursusoversigt og læs om tilmelding her: (Klik på punkterne nedenfor - du kan bladre med piletaster ) Skema - dansk... 3 Skema - engelsk... 4 Velkommen til Hovedstadens Ordblindeskole...

Læs mere

Open access. Open Access på Aarhus Universitet. Gør dine publikationer mere synlige og tilgængelige på nettet

Open access. Open Access på Aarhus Universitet. Gør dine publikationer mere synlige og tilgængelige på nettet Open access Gør dine publikationer mere synlige og tilgængelige på nettet 2 (OA) spiller en vigtig rolle, hvis du ønsker at gøre dine videnskabelige publikationer mere synlige og tilgængelige online handler

Læs mere

gyldendal tysk grammatik

gyldendal tysk grammatik agnete bruun hansen elva stenestad i samarbejde med carl collin eriksen gyldendal tysk grammatik agnete bruun hansen elva stenestad i samarbejde med carl collin eriksen gyldendal tysk grammatik gyldendal

Læs mere

Generelle synspunkter i forhold til skolens formål og værdigrundlag.

Generelle synspunkter i forhold til skolens formål og værdigrundlag. TYSK Generelle synspunkter i forhold til skolens formål og værdigrundlag. Formål: Det er formålet med undervisning i tysk, at eleverne tilegner sig færdigheder og kundskaber, der gør det muligt for dem

Læs mere

Fri software for Microsoft Windows. Velkommen! V/ Carsten Agger, agger@c.dk

Fri software for Microsoft Windows. Velkommen! V/ Carsten Agger, agger@c.dk Fri software for Microsoft Windows Velkommen! V/ Carsten Agger, agger@c.dk Fri software for Microsoft Windows Hvorfor bruge fri software? Hvad er fri software? Hvad kan man med fri software? Hvad kan man

Læs mere

- de primære funktioner

- de primære funktioner - de primære funktioner Aarhus Universitet, Business and Social Sciences ASB Bibliotek 2011 INDHOLD INTRODUKTION 2 LOGIN 3 MANUEL INDDATERING AF REFERENCER 4 EKSPORT AF REFERENCER FRA DIVERSE DATABASER

Læs mere

Fransk-dansk ordbogsprojekt inden for varemærker og varemærkeret i Frankrig og Danmark

Fransk-dansk ordbogsprojekt inden for varemærker og varemærkeret i Frankrig og Danmark Fransk Institut Forfatter: Speciale Signe Rousing Østergaard Cand.ling.merc. Eksamensnummer: 243550 Specialevejleder: Kirsten Wølch Rasmussen Fransk-dansk ordbogsprojekt inden for varemærker og varemærkeret

Læs mere

- Hvad er det, og hvilke fordele kan opnås ved fælles løsninger?

- Hvad er det, og hvilke fordele kan opnås ved fælles løsninger? Semantik, ontologi, tesaurus mv. - Hvad er det, og hvilke fordele kan opnås ved fælles løsninger? Seniorforsker, Center for Sprogteknologi, Københavns Universitet Indhold Hvorfor er semantik relevant for

Læs mere

Automatisk identifikation af virksomhedens termer og nøgleord

Automatisk identifikation af virksomhedens termer og nøgleord Udkommer i Informationsspecialisten, november 2004 Viden- og dokumenthåndtering med sprogteknologi Bolette Sandford Pedersen, Costanza Navarretta, Dorte Haltrup, Bart Jongejan Center for Sprogteknologi,

Læs mere

Vejledning til det danske morfosyntaktisk taggede PAROLE-korpus

Vejledning til det danske morfosyntaktisk taggede PAROLE-korpus Vejledning til det danske morfosyntaktisk taggede PAROLE-korpus af Britt Keson Det Danske Sprog- og Litteraturselskab (DSL) 1. INDLEDNING 4 2. MORFOSYNTAKTISK KORPUSTAGGING 5 2.1 Korpustaggingens forløb

Læs mere

Udkast til fagbeskrivelse for engelsk

Udkast til fagbeskrivelse for engelsk Udkast til fagbeskrivelse for engelsk fag Engelsk modul 1. fagets formål Formålet med undervisningen i engelsk er at kvalificere unge og voksne til at forbedre deres almene kundskaber og personlige kompetencer,

Læs mere

Case: Findvej.dk. Ved Peter Brodersen, Korruption. FDIH seminar, 16. april 2008

Case: Findvej.dk. Ved Peter Brodersen, Korruption. FDIH seminar, 16. april 2008 Case: Findvej.dk Ved Peter Brodersen, Korruption FDIH seminar, 16. april 2008 30 minutters gennemgang Min baggrund Findvej.dk Korttyper Google Maps Case: mitkbh.dk Formidling Case: bibliotek.dk Forretning

Læs mere

Center for Sprogteknologi 25 år

Center for Sprogteknologi 25 år Center for Sprogteknologi 25 år 1991-2016 Bente Maegaard Center for Sprogteknologi, NFI bmaegaard@hum.ku.dk Dias 1 Forhistorien op til skabelsen af CST i 1991 EU (dengang EF) igangsatte et maskinoversættelsesprojekt

Læs mere

Bogklubben: Junior Pc-kørekort og Faget, fællesmål, IT-integration

Bogklubben: Junior Pc-kørekort og Faget, fællesmål, IT-integration Bogklubben. Projektet henvender sig til dansk i 6. klasse. Målet er at eleverne: Arbejder med procesorienteret skrivning i et skolesamarbejde Arbejder med i fællesskab at udvikle en spændende fortælling

Læs mere

Eckhard Bick Institut for Sprog og Kommunikation, SDU Odense Universitet lineb@hum.au.dk, http://visl.hum.sdu.dk

Eckhard Bick Institut for Sprog og Kommunikation, SDU Odense Universitet lineb@hum.au.dk, http://visl.hum.sdu.dk EN CONSTRAINT GRAMMAR PARSER FOR DANSK Eckhard Bick Institut for Sprog og Kommunikation, SDU Odense Universitet lineb@hum.au.dk, http://visl.hum.sdu.dk 1. Projektet Det moderne samfunds udstrakte brug

Læs mere

Skabelon for. Faculty of Humanities Curriculum for the Elective Studies in IT and Language The 2007 Curriculum. Justeret 2010

Skabelon for. Faculty of Humanities Curriculum for the Elective Studies in IT and Language The 2007 Curriculum. Justeret 2010 Skabelon for Det Humanistiske Fakultets Uddannelser Studieordning for tilvalgsstudiet på BA-niveau i It og Sprog 2007-ordningen Under Uddannelsesbekendtgørelsen af 2004 Faculty of Humanities Curriculum

Læs mere

Henning Bergenholtz; Ilse Cantell; Ruth Vatvedt Fjeld; Dag Gun- dersen; Jón Hilmar Jónsson; Bo Svensén: Nordisk leksikografisk ordbok

Henning Bergenholtz; Ilse Cantell; Ruth Vatvedt Fjeld; Dag Gun- dersen; Jón Hilmar Jónsson; Bo Svensén: Nordisk leksikografisk ordbok Henning Bergenholtz; Ilse Cantell; Ruth Vatvedt Fjeld; Dag Gundersen; Jón Hilmar Jónsson; Bo Svensén: Nordisk leksikografisk ordbok. Oslo: Universitetsforlaget, 1997 Da Nordisk forening for leksikografi

Læs mere

Surf på nettet med din stemme!

Surf på nettet med din stemme! Surf på nettet med din stemme! Indtal.dk er en begrænset dansk talegenkender, der sætter bevægelseshæmmede i stand til at navigere på nettet. Med talegenkenderen er det fx muligt at udfylde selvangivelsen

Læs mere

Rektor Ralf Hemmingsen, Dekan Kjelgaard-Petersen, Ambassadør Sturla Sigurjónsson. Ærede gæster,

Rektor Ralf Hemmingsen, Dekan Kjelgaard-Petersen, Ambassadør Sturla Sigurjónsson. Ærede gæster, Islands-Dansk akademisk tradition. Köbenhavns Universitets Seminar i anledning af Islands Universitets 100 års jubileum. Københavns Universitet, 22. september 2011. Rektor Ralf Hemmingsen, Dekan Kjelgaard-Petersen,

Læs mere

Undervisningen i AP har 42 timer til rådighed (= 26½ moduler), som i moduler fordeler sig således:

Undervisningen i AP har 42 timer til rådighed (= 26½ moduler), som i moduler fordeler sig således: Til undervisere i AP: Undervisningen i AP har 42 timer til rådighed (= 26½ moduler), som i moduler fordeler sig således: Screeningstest (½ modul), midtvejstest (½ modul) + afslutningstest (1 modul) Ordklasser:

Læs mere

Introduktion til Datalogi

Introduktion til Datalogi Introduktion til Datalogi DM534/DM558 Rolf Fagerberg Mål og midler Mål og midler Mål for kurset: 1. Hurtig indsigt i mange dele af datalogi. Dette giver perspektiv på faget og studiet og dermed øget motivation.

Læs mere

STUDIEORDNING FOR TYSK Studieordning sept., 2015

STUDIEORDNING FOR TYSK Studieordning sept., 2015 Vejledende gennemgang af STUDIEORDNING FOR TYSK Studieordning sept., 2015 BA-sidefag og Kandidatsidefag STUDERENDE MED CENTRALFAG INDEN FOR HUMANIORA Indledning Denne folder er en vejledende gennemgang

Læs mere

Kort rapport om året 2011 på Oqaaserpassualeriffik

Kort rapport om året 2011 på Oqaaserpassualeriffik Kort rapport om året 2011 på Oqaaserpassualeriffik 1. Arbejdet kører planmæssigt 2. Vi har forberedt 3 større gennembrud i 2012 3. Andre forhold 4. Problemerne 1. Arbejdet kører planmæssigt Den mest tidskrævende

Læs mere

Automatisk analyse af Zaccos og Ankiros tekstmateriale

Automatisk analyse af Zaccos og Ankiros tekstmateriale Automatisk analyse af Zaccos og Ankiros tekstmateriale Bart Jongejan, Bolette S. Pedersen, Costanza Navarretta VID-rapport nr. 3 Center for Sprogteknologi 2004 Center for Sprogteknologi 2003 Rapporten

Læs mere

Aarhus Kommunes Biblioteker Mindspot. brug nettet. / lær at søge effektivt

Aarhus Kommunes Biblioteker Mindspot. brug nettet. / lær at søge effektivt Aarhus Kommunes Biblioteker Mindspot brug nettet / lær at søge effektivt 2 3 brug nettet / lær at søge effektivt 4 Biblioteksbasen 6 FaktaLink 8 Infomedia 0 Student Resources In Context 2 Literature Resource

Læs mere

ISLANDSK DATATERMINOLOGI FRA 1968 TIL 1998. Sigrún Helgadóttir Hagstofa Íslands

ISLANDSK DATATERMINOLOGI FRA 1968 TIL 1998. Sigrún Helgadóttir Hagstofa Íslands 185 ISLANDSK DATATERMINOLOGI FRA 1968 TIL 1998 Sigrún Helgadóttir Hagstofa Íslands Abstract In this article, the history of the Terminological Committee of the Icelandic Society for Information Processing

Læs mere

CorpusEye - Et brugervenligt web-interface for grammatisk opmærkede korpora

CorpusEye - Et brugervenligt web-interface for grammatisk opmærkede korpora Peter Widell og Mette Kunøe (udg.): 10. Møde om Udforskningen af Dansk Sprog Århus 2004 CorpusEye - Et brugervenligt web-interface for grammatisk opmærkede korpora Af Eckhard Bick (Syddansk Universitet)

Læs mere

Bilag 2. Formidling i 2002

Bilag 2. Formidling i 2002 Bilag 2 Formidling i 2002 Publikationsliste 2002 Andreasen, T., P. A. Jensen, J. F. Nilsson, P. Paggio, B. S. Pedersen, H. E. Thomsen: OntoQuery: Ontology-based Querying of Texts, in J. Karlgren (ed.),

Læs mere

Er du interesseret i at tage et tilvalg med IT, der er rettet mod erhvervslivet? Hvis ja, så har du følgende muligheder:

Er du interesseret i at tage et tilvalg med IT, der er rettet mod erhvervslivet? Hvis ja, så har du følgende muligheder: Er du interesseret i at tage et tilvalg med IT, der er rettet mod erhvervslivet? Hvis ja, så har du følgende muligheder: Informationsvidenskab i Kolding Informationsvidenskab i Odense Kommunikation og

Læs mere

MT Summit VIII - generelle tendenser. Bente Maegaard. Seminar om de væsentligste nyheder fra MT Summit 15. november 2001

MT Summit VIII - generelle tendenser. Bente Maegaard. Seminar om de væsentligste nyheder fra MT Summit 15. november 2001 MT Summit VIII - generelle tendenser Bente Maegaard Seminar om de væsentligste nyheder fra MT Summit 15. november 2001 MT Summit VIII Hvor: Santiago de Compostela, Galicia, 18-22 sep. 2001 MT Summit deltagere

Læs mere

New ventures based on open innovation - an empirical analysis of start-up firms in embedded Linux

New ventures based on open innovation - an empirical analysis of start-up firms in embedded Linux New ventures based on open innovation - an empirical analysis of start-up firms in embedded Linux Marc Gruber Joachim Henkel Entrepreneurship 12. september 2010 Fokus Der undersøges hvordan typiske udfordringer

Læs mere