I midten af det tyvende århundrede havde et ordbogsarbejde typisk følgende fasert. 1. Opstilling af retningslinjer for udvælgelse af materiale.

Relaterede dokumenter
Spørgsmål om ophavsret den islandske erfaring

Lingvistik Analyse M etode data Baser Datamater Applikation

HVOR AUTOMATISERET ER DEN DANSKE FREMSTILLINGSINDUSTRI?

Alle de studerende jeg har vejledt, har været under ordningen. D.v.s. først fire års studier efterfulgt af et fire-årigt ph.d. studium.

HVOR AUTOMATISERET ER DEN DANSKE FREMSTILLINGSINDUSTRI?

Hans-Peder Kromann. Base b11: FAGSPROGSBIBLIOGRAFIEN. Sprogbiblioteket, HERMES on-line katalog, Handelshøjskolen

DATA PROTECTION SERVICE. Arbejd bedre og mere sikkert med følsomme data

Ordbogssamarbejde i Norden

Forord. Henning Bergenholtz & Sven-Göran Malmgren

DANTERMcentret Webbaserede termbaser og e-ordbøger

att. Carsten Melchiors Brøndby, den 8. marts 2011 Projekt Svejserobot til skibsbygning - afsluttende rapport

Danske tegnsprogsordbøger En oversigt over eksisterende ordbøger over dansk tegnsprog, sammenholdt med projektet Ordbog over Dansk Tegnsprog.

Det erhvervsrelaterede projekt 7. semester. Projekt plan

Sådan bruger du Den Engelske Regnskabsordbog

MT Summit VIII - generelle tendenser. Bente Maegaard. Seminar om de væsentligste nyheder fra MT Summit 15. november 2001

2 Foreningens formål er å arbeide for å utvikle praktisk og vitenskapelig ordboksarbeid i Norden, og å fremme nordisk samarbeid om leksikografi.

OR sektionens publikationsliste En lille brugervejledning

RÅDGIVNING VEDRØRENDE EKSPERIMENTEL BEHANDLING FOR MENNESKER MED LIVSTRUENDE SYGDOMME

Søgeeksempel i PubMed:

Bevarings- og kassationsbestemmelser for Dansk Data Arkivs papirarkiv

Henning Bergenholtz; Ilse Cantell; Ruth Vatvedt Fjeld; Dag Gun- dersen; Jón Hilmar Jónsson; Bo Svensén: Nordisk leksikografisk ordbok

Publikationer. Født Uddannelse: 2009 Cand. med. Syddansk Universitet

Politik for adgang til de digitale samlinger


Søgning i EBSCO. Ebsco baserne omfatter: CINAHL * PsycInfo * AMED. Business Source Premier * e-book Community College

NB: Tilmeldingen til valgfaget gælder for 5. og 6. semester

Søgeeksempel i CINAHL:

Cochrane Library. o Other Reviews (DARE) (Databasen over resuméer af systematiske oversigtsartikler)

Implementering og effekt af kliniske retningslinjer

file:///c:/users/antonia/desktop/thesis/surveycontentbuilder.aspx.htm

STUDIER I DANSK POLITIK LARS BILLE BLÅ ELLER RØD ELLER...? DANSK PARTIPOLITIK I PERSPEKTIV JURIST- OG ØKONOMFORBUNDETS FORLAG

Kønsproportion og familiemønstre.

ISLEX. Islandsk-skandinavisk webordbog. Stofnun Árna Magnússonar í íslenskum fræðum Árni Magnússon-instituttet for islandske studier. 1.

Sådan bruger du Den Engelsk-Danske Regnskabsordbog

Det digitale skolebibliotek

Statistisk Måler Kontrol

Antallet og arten af moderne importord i Nye ord i dansk 1955 til i dag

Retningslinjer for manuskripter til Dansk Tidsskrift for Teologi og Kirke

Rapport. Koncept til systematisk dokumentation af dyrevelfærd på slagtedagen. Margit D. Aaslyng og Pia Brandt

1. Baggrund og problemstilling

Identificerede problemer Lægernes og sygeplejerskernes medicineringsarbejdsgange er blevet observeret og analyseret hver for sig.

East Export Network Øst Magasinet

IT-CENTRET. Stedet, hvor du kan lære IT i dit eget tempo AMU

Søgning i EBSCO. Ebsco baserne omfatter: CINAHL * PsycInfo * Medline * Greenfile. Business Source Premier * ebook Academic Collection

Sport som middel til at komme videre for unge uden uddannelse eller arbejde

Gert Engel og Bertha Toft

Kopi fra DBC Webarkiv

Dårlige tolke truer behandlingen i sundhedsvæsenet

Perspektiver og ønsker for de private firmaers anvendelse af datasamlingen. v/jakob Bjerg Larsen, chefkonsulent, Lif LVS årsmøde 23.

BESTEMMELSE FOR FAK FORSKNINGSPUBLIKATION. Revideret maj 2016.

LexicoNordica. Nyt fra bestyrelsen for Nordisk Forening for Leksikografi. Kilde: LexicoNordica 21, 2014, s

Open Access med Pure

DEFU STEPP DEn FUldautomatiske STErilcentral og Procedure Pakning 11:00 11:30 d.7 februar 2013

Curriculum. Publications

Søgeeksempel i CINAHL:

BILAG 3_Tabel Komparativ Analyse 4 Maritime Kilder omsat i Tabelform Præsentation6 Inspiration Komparativ Analyse 4 Maritime Kilder

13 års forskel i Ålborg

Orddeling. Automatisk orddeling. Manuel orddeling. Word thoremil.dk. Vælg fanebladet [Sidelayout] Vælg [Orddeling] Markér Automatisk orddeling

Bedre cykelstatistik. Afrapportering af analyse finansieret af Cykelpuljen

Mistanke om seksuelle overgreb mod børn i daginstitutioner

Kom godt i gang med PubMed

ISLEX - Islandsk-skandinavisk webordbog

Inspiration til arbejdet med børnefaglige undersøgelser og handleplaner INSPIRATIONSKATALOG

politica Tidsskriftfor politisk videnskab

Ledelsessystemer for fødevaresikkerhed Vejledning i anvendelsen af ISO 22000:2005

CV FORM MÅLGRUPPE KOMMENTARER

Automatisk samkøring og kvalitetssikring af data i en term- og vidensbank

Aalborg Universitet, Institut for Architektur&Design Gammel Torv Aalborg. 9. semester, Videnskabsteori. Jeppe Schmücker Skovmose

KA-TILVALG I DANSK SPROG

Skriftlig Eksamen Algoritmer og Datastrukturer (DM507)

Bilag 1: Begrundelse for ansøgning samt beløb

1. Publikationstyper S&L s vejledning til PURE (Udarbejdet af HNR og KRR, )

Find det relevante dokument på rekordtid med A104 Dokumenthåndtering Gunnar Friborg, bips

ordbøgerne og internettet

Terminologiske oplysninger som del af det almensproglige: webportalen málið.is

1. Ledelsesresumé. Den 2. juli Jnr Ø90 Sagsid Ref NSS Dir /

TEKNOLOGISKE HJÆLPEMIDLER FREMTIDENS DOKUMENTATION?

Case Story. Qubiqa leverer avanceret plukkelager til norsk kontorforsyning, 2012

Manuskriptvejledning De Studerendes Pris

Videncenter for diakoni og pædagogikp. Diakonhøjskolen i Århus, Lyseng Alle 15, DK-8270 Højbjerg

BerryMeat. Statusmøde for Organic RDD og CORE Organic II. Rie Sørensen Centerchef. Onsdag den 16. november

Søgeeksempel i PubMed:

Velkommen til KOBRA. Kompetencebaseret Regional Analyse. Region Midtjylland v/bente Børre Petersen

Metoder og produktion af data

Uddannelses- og Forskningsudvalget UFU Alm.del Bilag 77 Offentligt

Produktbeskrivelse for

DGMF Kursus i Digitalcentralen. Rev. 19 / Poul Erik Christiansen. DiMAX 1200Z Digitalcentral

Undervisningsbeskrivelse

Konkret var målet med projektet at udvikle et udstyr, der automatisk. Nedenfor beskrives kort aktiviteter og de opnåede resultater.

IT-støtte til tosprogede elever i social- og sundhedsuddannelserne. Test, ordbog og IT til tosprogede elever Marianne A. Udsen

Produktion i Danmark. Robotter i global kamp

Sådan bruger du Den Danske Regnskabsordbog

Temadag for undervisere i FVU for tosprogede med fokus på ordforråd. Workshop Gråzonesprog

Fejlagtige oplysninger om P1 Dokumentar på dmu.dk

Concito. December Antal besvarelser: 176

Rapport om ophold på Det Danske Institut i Athen, Februar 2012

Nyheder - idékatalog. Samarbejde med Ramasjang: En landsdækkende kampagne for Danmarks børn I er alle vores reportere :

Sådan bruger du Den Dansk-Engelske Regnskabsordbog

Sprogteknologi på Færøerne

Transkript:

149 Haime Ruus Institut for nordisk filologi Københavns Universitet ORDBØGER FOR FREMTIDEN I midten af det tyvende århundrede havde et ordbogsarbejde typisk følgende fasert 1. Opstilling af retningslinjer for udvælgelse af materiale. 2. Indsamling af materiale. 3. Fastlæggelse af redaktionsprincipper. Udarbejdelse af redaktionsregler. k. Redaktion af ordbogsartiklerne. 3. Trykning og distribution af ordbogen. Alle dele af processen blev udført manuelt. En stor del af fase 2, h og 5 bestod af af eller renskrivningsarbejde og korrekturlæsning. 1 begyndelsen af det enogtyvende århimdrede vil automatiseringen have ført til, at et ordbogsarbejde typisk har følgende fasen l. DetalJspeclflkation af ordbogens Indhold og opstilling. 2. Materiale til ordbogen fremtages automatisk fra andre masklnlæsbare ordbøger og fra ordog tekstbanker. 3. (Seml )automatisk redaktion af ordbogsartikler. k. Trykning eller distribution ad andre databæ rende medier som informationsnetværker og teletekst. 1 deime version af arbejdsgangen vil fastlæggelse af redaktionsprincipper og redaktionsregler indgå i arbejdet med detaljspeclfikatlonen af ordbogen. Fase 2, fremskaffelse af materiale, vil kunne foregå automatisk, idet udvælgelseskriterierne vil fremgå af detaljspeclfikationen. Ordbøger for fremtiden Hanne Ruus, pages 149-153

150 Fase 3 vil 1 det Ideelle tilfælde bestå i en kontrollerende gennemlæsning af ordbogsartikleme, som er fremstillet automatisk ved hjælp af generelle programmer, hvis specielle anvendelse er udledt af detaljspeciflkatlonen. Fase U foregår helt automatisk. Af trykningsmetoder kan man teenke på laserprintning, mlkroflche eller fotosætning. Ved distribution ad andre databærende medier vil det primært være et spørgsmål om at vejlede ordbogsbrugerne 1, hvilke ordrer de skal skrive for at finde de nye oplysninger 1 eksisterende databaser. Sådanne vejledninger vil også kunne fremstilles automatisk og lægges ind som en del af systemerne. Her 1 firserne er vi nået at godt stykke vej mod automatiseret fremstilling af ordbøgen Maskinellet til dateunatiseret ordbogsarbejde findes stort set 1 dag. Lagring af store datamængder er f.eks. ikke længere noget problem. Det mindst menneskevenlige på masklnelslden er inddateringsmedierne, hvor f.eks. diakritiske tegn som oftest kræver specialbehandling. På programmelsiden bør det ikke vare længe, før man kan købe en generel progreunpakke, der er egnet til udarbejdelse af ordbøger. Ingredienserne til en sådan pakke findes allerede i tekstbehandlingssystemer, 1 dokumentations og informationssystemer og 1 forskelligt databaseprogrammel. Man kan pege på flere andre faktorer, der befordrer automatiseringen af den almensproglige leksikografii 1«Automatiseringen af ti-ykkeprocessen. Så godt som alle bøger sættes 1 dag automatisk og deres tekst gøres derfor maskinlæsbar 1 fremstillingsprocessen. Denne tryktekniske udvikling kan man få gavn af også 1 næsten afsluttet ordbogsarbejde f.eks, ved at få gjort teksten maskinlæsbar, når kladden til det endelige manuskript foreligger, som det sker ved Nye Ord i Dansk ( Riber Petersen 1981). 2. Opbygningen af større samlinger af masklnlæsbare teks^er^ 1 Skandinavien kan man pege på Logoteket ved Språkdata 1 Gøteborg, Norsk Tekstarkiv, DANwOHDs samling af tekstprøver 1 København. Sådanne tekstsamlinger kan danne basis for ordbogsprojekter, som det f. eks. er planlagt 1 Gøteborg med projektet Lekslkallsk databas (Allån, Gavare, Ralph 1981). 3. Masklnlæsbare ordbøger. Alle ordbøger, der udgives nu, eksisterer i maskinlæsbar form Jf.l. Hvis man kan komme til rette med eventuelle copyrightproblemer, er der her et rigt materiale for andre ordbøger. Desuden findes der ordbøger, der er født masklnlæsbare. Det gælder alle ordbøger, der anvendes inden for projekter om auto tomatisk analyse af naturlige sprog f.eks. kunstig 150

151 Intelligens og masklnoversættelse. Sådanne ordbøger kan Indeholde anselige datamængder f.eks. Indeholder den tyske analyseordbog til SUSY ved SFB 100 1 SaarbrQcken omkring 300 000 leksikalske Indgange (Maas 1 9 8 0 ). I den almensprogllge leksikografi er frekvensordbøgeme nær^ mest automatiseringen. I udarbejdelsen af Nusvensk Frekvensordbok er der anvendt edb 1 alle faser af arbejdet, 1 DANw ORDsproJektet er tekstprøveindsamling og Indkodning manuel, mens fremstilling af frekvenslister foregår automatisk. Nærmest den fuldstændig automatiserede ordbogafremstilling er man for tiden 1 fagsprogsleksikograflen, hvor f.eks. TFAM, Siemens* fagsproglige database, kun behøver seks uger til at fremstille en ordbog. Til en flersproget ordbog over edb termer brugte de således fem timers maskintid til at udtage materiale, en halv times maskintid til at redigere det og halvanden times maskintid til at fotosætte ordbogen (Sager and McNaught 1 9 8 0 ). Automatiseringen af ordbogsfremstllllngen vil ændre det leksikografiske arbejde. F.eks. vil effektiv søgning kræve, at man begrænser antallet af synonyme betegnelser og at forskellige typer af oplysninger holdes klart adskilt. Den mest Indgribende ændring i ordbogsarbejdet vil nok være, at den detaljerede planlægning flyttes til den Indledende fase. Denne planlægning kan blive meget omfattende. Især når det drejer sig om leksikalske data, som tænkes lagret maskinelt til direkte benyttelse for oversættere, terminologer og imdervlsere. Det ser man af forarbejderne til DANTERM (Frandsen og Nlstrup Madsen 1980, Nlstrup Madsen I9 8 I) og til British Linguistic Data Bank (McNaught 1 9 8 I). Hvis man ændrer sine planlægningsvaner og datamatiserer sit ordbogsarbejde, får man til gengæld en række muligheder, som savnes ved manuel ordbogsfremstilling Jf. en række bidrag 1 denne publikation. Datamater er uovertrufne til at sortere, søge og ændre - hundrede procent konsekvent. Man har altså mulighed for at undersøge klassificeringer og typer af oplysningers distribution 1 ordbogen på alle tænkelige måder med deraf følgende gevinst 1 form af konsekvens 1 behandlingen af samme type ord forskellige steder 1 alfabetet. Hvis man har planlagt sin ord bogsartikel passende struktureret, giver ændringsfaciliteter ne mulighed for at ændre samtlige forekomster af en bestemt værdi på en bestemt plads 1 artiklerne lige til dagen før, man sender ordbogen til trykning. Der bliver også mulighed for at foretage eksperimenter, som på længere sigt vil kunne ændre alle forestillinger om, hvordan ordbøger er Indrettet og ser ud. 151

152 Man kan afprøve ordning af ordene efter deres betydnlngsmæs sige sajnmenhnng f.eks. 1 et flerdimensionalt netværk som nævnt af Ralph (1979)«Behov for forskning 1 denne retning kan udledes af Sager and McNaught (1 9 8 0 ). Deres forespørgsler til potentielle brugere af en Brltlsh Llngulstlc Data Bank viser, at oversættere gerne vil have overbegreb, synonymer og antonymer på kildesproget foruden målsprogsækvlva lenten, når de slår et ord op. I ordbøger, der som de fagsproglige databaser er tilgængelige via elektroniske medier, kan mem anvende den ordning af ordene, der er mest meningsfuld for brugerne f.eks. en sammenkædning efter betydningsfællesskab. Idet det overlades til programmerne at finde rundt 1 datamængden efter de kriterier, som kan udledes af brugerens spørgsmål. Hvis telåtekst ad åre bliver lige så udbredt, som telefonen er det 1 dag, er det nærliggende at gøre også almensprogllge ordbøger tilgængelige via elektroniske medier. I så fald kan man også 1 disse ordbøger udnytte mulighederne for at koble ordene sammen efter betydningsfællesskaber 1 ordstoffet frem for efter formelle egenskaber som samme begyndelsesbogstav. Her vil man få hårdt brug for resultater af forsøg med at kæde almensprogéts ord sammen 1 thesaurusllgnende strukturer. Henvlsnlnge r, Allån, Sture I Nusvensk Frekvensordbok, baserad på tldnlngstekst, 1-it, 1 9 7 0-1 9 8 0. Allån, Sture, Gavare, Rolf and Ralph Bo I9 8 I 1 Språkdata Research Report 1 9 8 0. Compiling nr. 10, feb. 1981. Frandsen, Lene and Nlstrup Madsen, Bodil 1980: The Setting up and Operation Of a Danish Terminological Data Bank (The DANTERM Project), 1 Human Translation - Machine Translation ed. by Suzanne Hanon and Viggo Hjømager Pedersen = NOK 39, Romansk Institut, Odense Universitet, s.121-131. Maas, Heinz Dieter 1980: Zur Entwlcklung des Ubersetzungssystems SUSY und seiner elnzelnen Komponenten, 1 Maschlnelle Ubersetzung, Lexlkographle und Analyse, Akten des 2. Internationalen Kolloqulums SaarbrQc ken. November 1979, herausgegeben von Hans Eggers = Llngulstlsche Arbelten, Neue Folge, Heft 3,1 UniversitSt des Saarlandes, Sonderforschungsbereich 100, s.7-1 6. Maegaard, Bente og Ruus, Hanne 1978: DANwORD, Hyppighedsundersøgelser i moderne dansk: Baggrund og materiale, 1 Danske Studier 1978, s,42 70, Maegaard, Bente og Ruus, Hanne: Hyppige Ord i Danske Børnebøger, Gyldendal, nov. 1981 Maegaard, Bente og Ruus, Hanne: Hyppige Ord 1 DEUiske Romeuier, Gyldendal, nov. 1981. 152

153 McNaught, John 1981: Terminological Data Banks: a model for a British Linguistic Data Bank (LDB), 1 Asllb Proceedings 33 (7/8), July/August, s.297-308. Nlstrup Madsen, Bodil 1961 a Nye veje inden for fagsproglig leksikografi, 1 SPRINT 2, Sproginstltuttemes tidsskrift Handelshøjskolen 1 København, s.18-23. Ralph, Bo 1979: Leksikologi som datalingvistik, i Nordiske Datalingvistikdage 1 København 9.-lo. oktober 1979, Foredrag udgivet af Bente Maegaard, S. I6 1 - I7 O. Riber Petersen, Pia I 9 8 I : Ordbøger og edb, 1 SAML 8, Udgivet af Københavns Universitets Institut for anvendt og matematisk lingvistik, s.l7 9 ~ 1 9 1. Sager, J.C. and McNaught, J. 1980: Feasibility Study of the Establishment of a Terminological Databank in the U.K., British Library R. & D. Report Nr. 56^2. Selective Survey of Terminological Databanks in Western Ehirope, British Library R. A D. Report Nr. 56i*3. Model Specification of a Linguistic Databank for the U.K., British Library R. & D. Report Nr. 5 6 ^^. 153