Ordbøger i Danmark: datamatstøttet leksikografi i praksis



Relaterede dokumenter
Bodil Nistrup Madsen In stitu t for Datalingvistik

`Sf[a`S^ efdsfwy[ f[^ TW] _bw^ew SX ha^v [ ` dw dw^sf[a`wd

Når faglige mål bliver til synlige mål

Patientkontorets årsberetning 2009

Afsnittet er temmelig teoretisk. Er du mere til det praktiske, går du blot til det næste afsnit.

KOLOFON. Yderligere eksemplarer: Søren Holm, Århus Kommunes Biblioteker, Møllegade 1, 8000 Århus C. Tlf

Samskabt Politik i 3b

Vis, at fjernvarmen gør en forskel

Formuepleje Safe A/S udvider aktiekapitalen

NORDISKE STUDIER I LEKSIKOGRAFI

DANTERMcentret Webbaserede termbaser og e-ordbøger

Formuepleje Optimum A/S. Børsprospekt maj 2006

I midten af det tyvende århundrede havde et ordbogsarbejde typisk følgende fasert. 1. Opstilling af retningslinjer for udvælgelse af materiale.

Formuepleje Epikur A/S udvider aktiekapitalen

Kørelys på Cykel - En effektundersøgelse

Introduktion til Grafteori

Det tidligere Projektrådgivningen

En kortfattet beskrivelse... 3 Baggrund for lokalplanen... 3 Lokalplanens indhold... 4 Forhold til anden planlægning... 5 Miljøvurdering...

Encoding:...1 Et tegn sæt (character set):...1 UTF-8 og UTF-16 (Unicode):...2

Søgeeksempel i CINAHL:

Område ved Frederikshavnsvej til erhvervsformål og pladskrævende varegrupper

Opgaver til modul 1. Grundlæggende informationsteknologi

Frontpanel... 5 Oversigt over stiktilslutninger på bagpanel 5

Søgeeksempel i CINAHL:

Formuepleje Penta A/S. Børsprospekt juni 2007

Med lov. en der er ingen grund til at gøre det farligere end nødvendigt. skal land bygges

NYT. Få en ny Formular i PakIT Helt gratis

Ordbogssamarbejde i Norden

Processoren: Fler-cyklus implementation

NORDISKE STUDIER I LEKSIKOGRAFI

Dansk CMS sendt op i skyen med Windows Azure på kun en uge Vidste ikke om C1 ville virke på Azure

Fælles Mål Edb. Faghæfte 26

ODDER KULTURFORENING. Odder Kulturforening. Vi kan hver især gøre en forskel. Sammen kan vi skabe forandring...!

Allan Røder: Danske talemåder, 616 sider. Gads Forlag, Køben-

Terminsprøver 10. klasse Marts 2017

ERHVERVSSTRATEGI

ectrl vejledning ectrl Autorapporter

Kom godt i gang med Cinahl

Kun til lærerbrug. Dansktræning 3. Kopiering er u-økonomisk og forbudt til erhvervsformål. Kun salg ved direkte kontakt mellem skole og forlag.

Regnskab for boligorganisation 1. april 2013 til 31. marts Boligorganisation Administrator Tilsynsførende kommune

Information om avu eksamen maj/juni 2015

Problemstilling ved DBK integration i BIM Software Hvad skal der til. Nicolai Karved, Betech Data A/S

Funktionærernes Boligselskab i Lyngby-Taarbæk Kommune

G-MAIL (GOOGLE)

NORDISKE STUDIER I LEKSIKOGRAFI

sproget.dk en internetportal for det danske sprog

Italien spørgeskema til seminarielærere / sprog - dataanalyse

(EØS-relevant tekst) Artikel 1. Genstand

Hans-Peder Kromann. Base b11: FAGSPROGSBIBLIOGRAFIEN. Sprogbiblioteket, HERMES on-line katalog, Handelshøjskolen

Dansk sproghistorie 12

Hastighedsprofiler og forskydningsspænding

Korpusbaseret lemmaselektion og opdatering

Sådan bruger du Den Dansk-Engelske Regnskabsordbog

Punktskrift eller Tale Via

Søgeeksempel i PubMed:

Information om avu eksamen maj/juni 2016

FAG. og SPOKEn O. RYGSæK. DEn UNDERVISNINGSMATERIALE Dansk DEN KULTURELLE RYGSÆK FAABORG-MIDTFYNS KULTURELLE RYGSÆK PERIODE

Vejledning På bordene ligger omslag til din besvarelse, med dit navn på. Sæt dig ved bordet med dit omslag.

Navision i undervisningen

Det nye Markedskort - gamle data på nye måder

MES Industriel IT SCADA Automation. AnaMo. Fremtidens ledelsesværktøj. (+45)

Søgeeksempel i PubMed:

Langtved Data A/S Nyhedsbrev

Vejledning til udfyldelse. af den digitale version af den nationale brugerundersøgelse. Vejledning til udfyldelse TNS

Søgning i EBSCO. Ebsco baserne omfatter: CINAHL * PsycInfo * AMED. Business Source Premier * e-book Community College

Netbaseret spørgeskemaundersøgelse

Kulturministeriets it-arkitekturpolitik

Sådan laver du nemme grafiker til din webshop. Erik Holflod Jeppesen

Skabelonfilen er udarbejdet i Word til Windows (Office 2010) og er også afprøvet i Word til Mac.

Brugervejledning for TrivselsRADAR Version 1.5 revideret 30. november 2012

Sygefravær en fælles udfordring

Hvad er personoplysninger?

Blended Learning ADJUNKT HANNE-LENE HVID DREESEN

RESUME TRANSLATION MEMORY-SYSTEMER SOM VÆRKTØJ TIL JURIDISK OVERSÆTTELSE. KRITISK VURDERING AF ANVENDELIGHEDEN AF TRANSLATION MEMORY-SYSTEMER TIL

NORDISKE STUDIER I LEKSIKOGRAFI

Sygefravær en fælles udfordring

En 100% bærbar løsning! altid i front!

Ole Lauridsen* Handelsordbøger

Installation og Drift. Aplanner for Windows Systemer Version 8.15

Indholdsplan for Engelsk FS10+

KultuNaut. - Synliggørelse af arrangementer gratis! Indtastede events er udover på Kultunaut.dk synlige på mange forskellige platforme. Bl.

Kommunikation omkring det grønne arbejde til de decentrale indkøbere erfaringer og udfordringer. Udbudschef Cecilie Schwartz Førby Odense Kommune

Windows Vista 1. Side 1 af 10

Socialfag Intern fagprøve Opg. 3. Intern fagprøve. Socialfag Maj opgave 3. Voksne med nedsat funktionsevnes livskvalitet.

Information om avu eksamen maj/juni 2018

Installation og Drift. Aplanner for Windows Systemer Version

Stk. 3. Undervisningen skal give eleverne adgang til de skandinaviske sprog og det nordiske kulturfællesskab.

STYR TIDSRØVERNE. 1 Styr tidsrøverne

Hvordan man kan arbejde med CD-ord og Adobe Reader. Konference

Space Challenge og Undervisningsminsteriets Fælles Mål for folkeskolen

Margit Gade. Dansk med it. Vis mig hvordan! TRIN

Dansk Atletik Forbunds Talentudviklingsprojekt TUD

Grundlæggende køretidsanalyse af algoritmer

WINDOWS LIVE MAIL

Opgaveteknisk vejledning Word 2016 til Mac. Tornbjerg Gymnasium 10. december 2015

GeoGIS2020. Installation. Udkast. Revision: 1 Udarbejdet af: BrS Dato: Kontrolleret af: Status: Løbende Reference: Godkendt af:

INVACARE EL-KØRESTOLE

Computerspil rapport. Kommunikation og IT. HTX Roskilde klasse 1.4. Casper, Mathias Nakayama, Anders, Lasse og Mads BC. Lærer - Karl Bjarnason

Eksamensreglement for HG

Transkript:

- 259 - Ordbøger i Danmark: datamatstøttet leksikografi i praksis Hanne Rs & Dorthe Dncker Københavns Universitet Institt for Nordisk Filologi Njalsgade 8 DK-23 København S I et lille sprogområde som det danske brges der forholdsvis mange kræfter på leksikografisk arbejde. Den danske sprogbrger har behov for og krav på en rimeligt dækkende leksikografisk beskrivelse af sit modersmål, både af den ngældende rigssprogsnorm med dens regionale og sociale varianter og af tidligere sprogtilstande. Endvidere har den danske sprogbrger berettiget forventning om t o s p r o g s ordbøger både m e llem dansk og nordiske og eropæiske n a b o sprog, mellem dansk og de store internationalt anvendte sprog og mellem dansk og de sprog, som tales af de for s k e l lige indvandrergrpper, der er kommet til landet i de s e n e re å r. Man kan øge effekten af den leksikografiske arbejdsindsats ved koordinering og samarbejde. En fordsætning for s a m a r bejde er lettilgængelige og ajorførte oplysninger i det leksikografiske miljø om, hvilke forskningsprojekter der er i gang, og om, hvem der arbejder med hvilke ordbogsprojekter. Det leksikografiske miljø i Danmark blev kortlagt ret grndigt som led i det arbejde, der dførtes af et dvalg nedsat af Ministeriet for kltrelle anliggender i 977, Dette arbejdes resltater, der bygger på data Indsamlet i 978 og 979, sppleret i 98, er fremlagt i betænkningen Vilkår for ordbogsarbejde i D a nmark. 982 - i det følgende kaldet Ordbogsbetænkningen. I Ordbogsbetænkningen sammenfattes oplysninger om mål, tidsplaner og økonomi for større ordbogsprojekter, der var i gang i 98. Virkningerne af Ordbogsbetænkningens an b e f a linger blev i høj grad præget af, at dvalgsmedlemmerne havde meget forskellige meninger om et eventelt k o o r d i n e

- 26 - rende organ, et ordbogsråd, som da heller ikke er blevet oprettet. De koordinerende bestræbelser blev flgt op af Statens Hmanistiske F o r skningsråd m e d særligt henblik på anvendelse af edb-teknologi i et initiativområde: Edb for Tekst, Tale og Ordbøger (E T T O > 982-85. Med støtte herfra arbejdede DANLE-grppen med beskrivelse af danske ordbogsdata til lagring i elektroniske systemer. Resltaterne fra dette arbejde er pbliceret i bogen Descriptive Tools for Electronic Processing of Dictionary Data 987. DANLEgrppen består af: Gert Engel, Handelshøjskole Syd; Ebba Hjorth, Gammeldansk Ordbog; Jane Rosenkilde Jacobsen, Københavns Universitet; Bodil Nistrp Madsen, Handelshøjskolen i København; Ole Norling-Christensen, Gyldendal og Hanne Rs, Københavns Universitet. I 986 tog Statens Hmanistiske Forskningsråd initiativ til et dredningsarbejde over området "Almindelig leksikografi" både vedrørende de teoretiske fordsætninger og de konkrete ordbogsprojekter. Målet for dredningen var en koo r d i n e r i n g af aktiviteterne, både inden for forskningen og, hvor det er mligt og ønskeligt, mellem de igangværende og planlagte ordbogsprojekter. Udredningsarbejdet blev dført af DANLEgrppen i tidsrmmet janar til september 987. En oversigt over arbejdet findes i Rs 987. Siden sltningen af 97erne er den væsentligste ændring i vilkårene for leksikografisk arbejde fremkomsten og dbredelsen af informationsteknologiske hjælpemidler til ordbogsarbejde. De elektroniske hjælpemidler letter og smidiggør ordbogsarbejdet og minimerer det trivielle kontrolleringsarbejde, men de kræver også ofte ret omfattende og detaljeret teknisk viden hos brgeren, hvis denne skal opnå de nævnte fordele. En af konsekvenserne af en dbredt anvendelse af informationsteknologi inden for et forsknings- og praksisområde som A l m indelig leksikografi er, at en hensigtsmæssig dnyttelse af de tekniske faciliteter kræver en præcis og s t r k treret beskrivelse af de data, de behandler. Med sådanne præcise databeskrivelser bliver det betydelig enklere for to eller flere projekter at finde berøringsflader og samar-

- 26 - b e jdsmligheder. Den elektroniske lagring gør det endvidere overkommeligt at dtage veldefinerede delmængder fra store datasamlinger. Der er således teknisk mlighed for at d veksle og dele data som aldrig før. En anden basal fordsætning for samarbejde og koordination er en dbredt viden om igangværende og netop afslttede projekter inden for området. På denne baggrnd valgte DANLEgrppen at koncentrere d redningsarbejdet om * indsamling af oplysninger om netop afslttede og igangværende projekter inden for området Almindelig leksikografi, oplysninger om nværende og ønsket teknologianvendelse, oplysninger om brg af andre datasamlinger og allerede etableret samarbejde, * bearbejdning af de indsamlede oplysninger dels i s e m i narform dels i rapportform, * formidling af oplysninger om ndersøgelsens resltater. Resltaterne af det dførte indsamlings- og bearbejdningsarbejde er fremlagt i rapporten Ordbøger i D a n m a r k, 987. Her skal vi sammenfatte og kommentere de resltater fra dredningsarbejdet, der giver et billede af datamatstøttet leksikografi i praksis i Danmark anno 987. Spørqeskemandersøgelsen Med skyldigt hensyn til de i Ordbogsbetænkningen anvendte spørgeskemaer blev der darbejdet to spørgeskemaer, et for forskningsprojekter inden for området Almindelig leksikografi og et for ordbogsprojekter. Ordbogsskemaerne, indeholder spørgsmål om det enkelte ordbogsprojekts leksikografiske type. De øvrige spørgsmål er koncentreret om ordbøgernes kilder - hernder om disse er maskinlæsbare, om anvendelsen af apparatr, om ønsket adgang til apparatr, om eksisterende og ønsket samarbejde med andre projekter. Spørgeskemaerne blev sendt til alle højere læreanstalters sproginstittter og til forlag, instittioner og p e r soner, som arbejder med leksikografi og ordbøger. Med h e n blik på indsamling af viden om og brg af tekniske h j æ l p e

- 262 - midler blev ordbogsspørgeskemaet sendt til alle grppen bekendte ordbogsprojekter, også fagsprogsordboger og s p e c i a l ordboger. Kn meget elementære ordboger til skolebrg er ikke taget i betragtning. Bortset fra enkelte kommercielle ordbogsprodcenter har så godt som alle skemamodtagere, der arbejder med praktisk ordbogsarbejde, dfyldt disse. Sammenfatningerne af oplysningerne fra ordbogsskemaerne (s. 54-82 i Ordboqer i D a n m a r k ) må derfor siges at give et ret dækkende billede af igangværende ordbogsprojekter, for så vidt angår deres art, deres anvendelse af apparatr og deres beroringsflader me d andre ordbogsprojekter og datasamlinger. Ordboqsprofiler For at skabe overblik over, hvilke typer ordboger der er i arbejde, blev der i sporgeskemaet stillet spørgsmål om en række leksikografiske karakteristika. Disse karakteristika er opstillet d fra den taksonomi for leksikografiske oplysninger, der beskrives i Descriptive Tools 987 s. 29-5. Fra de v æ r k s p e c i f i k k e oplysningstyper er specificeret folgende: * om antallet af sprog: etsprogs-, tosprogs- eller flersprogsordbog * om arten af sprog: nationalsprog, sociolekt, dialekt * om synsvinkel: almensproglig eller fagsproglig og inden for det fagsproglige: enkelt- eller flerfaglig Fra de generelle oplysningstyper er specificeret: * etymologi (dvs. historiske oplysninger) * fonetik (dvs. dtaleoplysninger) * grammatik * betydningsbeskrivelse * citater (dvs. citater eller teksteksempler) I skemaerne kan man således kende modersmålsordbøgerne på krydset i etsprogs-kolonnen og oversættelsesordbøgerne på krydset i tosprogs-kolonnen. I markeringen af de generelle

- 263 - oplysningstyper kan man finde mlige samarbeidspartnere om de enkelte oplysningstyper: her kan man se^ hvor man kan henvende sig om f.eks, dtaleoplysninger eller eksempler på ords anvendelse. Sprog ~] Oplysn. ] I typer Gyldendals Røde Ordbøger eng. - da., da. - fr., d a. - t y., d a. - sp.j Ix Dansk Etymologisk Ordbog, Gyldendal Gyldendals Fremmedordbog I -) Ix -4- I I I Dansk-Engelsk. dg.. Gyldendal Engelsk-Dansk, B. Kjærllf Nielsen Italiensk-Dansk, Gyldendal Ix I I I \- I I I I -4------U - I Dansk-Persisk Ordbog Dansk-Krdlsk/Krdlsk-Dansk Minlordbog Dansk-Tamllsk/Tamllsk-Dansk Ordbog xl -I I- I I I I!! I ^,, \ f ^ _ 4 ------ I I I I I Ordbog over den danske Dialekt Angel Dlctlonnalre toareg-franpals DEMEP Diet. of Early Mod. Engl. Pron. Udtaleordbog over dansk rigsmål Nylatinsk Ordliste Perslsk-Dansk Ordbog Dansk Radlsrordbog Dansk-Finsk Ordbog Dansk- Tysk Teknisk Ordbog Dansk- Engelsk Teknisk Ordbog Semantisk Rigssprogsordbog Fra A til Z, Da. vendinger med eng., ty. og fr. ækvivalenter Tjekklsk-Dansk Grndordbog I -txl i >! I I I 4 U -4 4- xi I I I I I I! i -4-4- I -tixix I I I!! ^! I I I I I I I - 4 f - I I f I! - I x xl.4----------. 4- x I I I I -4-!! I M!! i

- 264 - Sprog O p l y s n. typer ) tn H OJ > H Dansk-Engelsk Ordbog, Vinterberg og Bodelsen Da.-Fr. & Fr.-Da., Blinkenberg-Høybye Dansk-Hebræisk & Hebræisk-Dansk Ordbog w aco w aw E - tn atn t rh Ci atn ftj C 4J nj z 4J t»h CO ) rh fts H Q atn c ) E ih < rh a tn Cl, fh ro»h <H t c rh < (U (H Cl. rh E> Cl] (U C Cl. H ro ro th O U V) Q) tn c H C > 4J Q) CQ t tn ) J \ ) J ro J Dansk-Rssisk Ordbog Dansk-Tysk Ordbog Dansk-Tysk Handelsordbog DANTERM, terminologisk database DANwORD, ordhyppigheder i moderne dansk Dansk Udtaleordbog Gammeldansk Ordbog Spplement til Ordbog over det Danske Sprog Holbergordbogen Eftermid. personnavneordbog Erotra-DK Fr.-Da. Ordbog o. samf.faglige termer JURTERM, Jridisk Ordbog: civilproces Jysk Ordbog Nye Ord i Dansk 976-86 Ordbog over det norrøne prosasprog Serbokroatisk-Dansk Ordbog Polsk-Dansk Ordbog D a n sk-fransk Teknisk Ordbog Ømålsordbogen Gads Stribede Ordbøger da. - eng., da. - fr., da. - ty. x i. J x l _ J. j x JL... J JL -.. j x x jx i ' L J Ix Ix ^! i ^ Ix!. - i i^r i i i " L f ) i t I x x xlxl - I i -,. i l. i x. J f» L_. _ t I i' I.. i L x l j j x j x l

- 265 - Teknologianvendelse Viden om de forskellige projekters anvendelse af edb-teknologi er en vigtig fordsætning for vrdering af samarbejdsmlighederne. I spørgeskemaet blev der stillet spørgsmål om ordbøgernes anvendelse af apparatr, redigeringssystemer og om kildemateriale i maskinlæsbar form. Det fremgik af ndersøgelsens resltater, at næsten tre fjerdedele af de projekter, som deltog, er indstillet på at inddrage t e k n o logiske hjælpemidler i det leksikografiske arbejde. 7% af deltagerne anvender allerede edb, mens 22% har et ønske om at gøre det, men har endn ikke fået stillet apparatr til rådighed eller har anskaffet det. Den konfigration, de fleste projekter arbejder med, b e står af en P C er og en matrix-printer samt forskelligt r e digeringsprogrammel. Enkelte har større maskiner (større kapacitet), kommnikationsdstyr (modem) og laserprinter. Af den grppe, som allerede anvender edb, arbejder n æ sten alle (87%) med redigeringsprogrammel. De anvendte s y stemer fordeler sig på fire typer: dedikerede systemer, d a tabasesystemer, andre systemer og tekstbehandlingssystemer. Godt en fjerdedel (28%) af ordbøgerne inden for grppen anvender det dedikerede system COMPULEIS. COMPULEIS er et færdigt redigeringssystem, som kan anvendes af brgere den indgående edb-kendskab (kap. 6 i Descriptive Tools og Svensén 987). Systemet er nder stadig dvikling i takt med k n d e r nes ønsker og konfigreres til det enkelte projekt, så behovet for oplysningstyper (felter) og alfabeter dækkes. I øvrigt kan alle specialtegn anvendes. De vises korrekt på både skærm og print - den koder. I praksis viser det sig dog, at der ikke altid er fld overensstemmelse mellem t e g n ene på skærm og/eller print og/eller sats. Ud fra erfaringerne med COMPULEIS i ndersøgelsen fremgår det, at systemets styrke - d over dets avancerede t e k s t behandlingsfaciliteter - blandt andet er, at det giver m l i g hed for strktreret redigering/indtastning, atomatisk typografering, at både strktreret og typografisk version kan vises på såvel skærm som på print, at man kan søge på felttyper og -indhold, at der atomatisk holdes kontrol med felters rækkefølge og indhold, at hele redaktionsprocessen

- 266 - frem til færdig fotosats nderst<sttes, og at der er vidtgående sikkerhedsforanstaltninger mod odelæggelse/tab af data (f.eks, ved strøm- eller maskinsvigt). Brgerne peger dog også på en række mangler. Særlig s ø gemlighederne virker tilfredsstillende. Hrtig søgning kan kn foretages på opslagsord. Alle andre søgninger kan kn dføres som tidskrævende batch-kørsler, og desden kan resltatet af søgning kn dskrives på printede lister - ikke på skærm, og resltaterne kan heller ikke gemmes til senere brg i systemet. Systemet opleves som langsomt blandt andet af denne grnd, men også på grnd af den høje datasikkerhed (i hvert fald hvis man brger disketter). En anden svaghed ved systemet er, at s t rktrering i flere hie r a r kiske niveaer kn i ringe gra d nderstøttes, hvorfor reglerne for atomatisk typografering kan blive så komplicerede, at de vanskeligt kan formleres af brgerne. Desden er skift mellem strktreret og typografisk version langsom (D e s c riptive Tools s. 76ff). For brgerne af COMPULEIS gælder det, at de gerne vil beholde systemet, men ønsker dvidelser og mlighed for d a tabaselagring. En fjerdedel af projekterne i ndersøgelsen har da netop også valgt et databasesystem som redigeringssystem. Der er tale om fire forskellige systemer: DANSTATUS, KnowledgeMan, Informix og MASTERFILE. DANSTATUS er den danske version af det engelske informat i o n s s ø g n i n g s s y s t e m STATUS II. D A NSTATUS brges til t e k s t korps og terminologi- og ordbogsdatabase på Hand e l s h ø j s k o len i København (Descriptive Tools s. 46ff, Nistrp Madsen 987). DANSTATUS dmærker sig ved at være brgervenlig, g i ve mlighed for dynamisk dvidelse af tegnsæt, ved ikke at have væsentlige datamængde- og datalængdebegrænsninger, ved ikke at have tomme felter og nogen fast feltlængdedefinition og ved at give m l ighed for at ændre feltrækkefølge i de e n kelte poster. Me d hensyn til søgemlighederne kan man i D A N STATUS foretage fritekstsøgning, samtidig søgning i hele ordbasen, selektive søgninger og dskrifter (ordbogsartikler og dele af ordbogsartikler, nøgleordslister, frekvenslister og konkordans), og man kan brge direkte kommandosprog ved søgning. Desden er der mlighed for at danne mensystem og

- 257 - særlige søgeprofiler, for at søge videre i en svarliste med poster fndet ved søgning og for at dskrive svarlister med nyt format den at foretage ny søgning. Der er endvidere mlighed for at læse- og skrivebeskytte på alle niveaer og for at få oplysning om antallet af fndne svar, før man får svarene præsenteret. Svaghederne ved DANSTATUS er, at der mangler validitetsog sekvenskontrol, at der ingen mlighed er for atomatisk betydningsnmmerering, og at der ingen m l i g h e d er for s a m tidig søgning og repræsentation af data fra tekstkorps og ordbase. På grnd af sine begrænsede niveaopdelingsmligheder og dermed manglende mlighed for afspejling af r e l a tioner mellem data kan DANSTATUS ikke betegnes som det o p timale system. Det er endvidere ikke mligt at søge på feltnavne, og sorteringsfaciliteterne er meget begrænsede. Det er heller ikke mligt at tilføje nye feltnavne, den at hele databasen må nloades og oprettes igen med ny databasedefinition. En lempe ved arbejdet med DANSTATUS er desden de begrænsede tekstbehandlingsfaciliteter. KnowledgeMan er valgt efter dårlige erfaringer med DBASE- III (Jacobsen 987). Brgen af DBASE-III viste, at systemet ikke knne opfylde brgernes behov. Det var ikke stort nok, det havde ingen mlighed for alternativ alfabetisering, og det gav besvær med at arbejde med flere filer samtidig. Med KnowledgeMan er det derimod mligt at arbejde interaktivt med flere filer på en gang, det kan lade sig gøre at dføre fri alfabetisering, og systemet ledsages af et rimeligt stærkt og forståeligt programmeringssprog (a la COMAL). Den nyeste version har indbyggede mener, der gør systemet let at gå til. Der er dog også lemper forbndet med KnowledgeMan. Systemet er meget langsomt, fordi det er fortolkende, og det kræver indgående edb-kndskab af sine brgere, hvis man vil dnytte de faciliteter, der ligger i programmeringssproget - samtidig med at dette ikke er stærkt nok for den, som kan programmere. Det tredje af de anvendte databasesystemer, Informix, er et relationelt databasesystem. Omfanget af en database i Informix begrænses principielt kn af det til rådighed stående hardware. Informix er et fleksibelt applikationssystem, som er forholdsvis nemt at anvende. Det indeholder en version af

- 268 - det standardiserede søgesprog SQL (Strctred Qery Langage). Desden kan systemet dbygges med de afhængige programmeringssprog C og Cobol. Informix kan håndtere en del af de (»nsker og behov, som fremkom nder ndersøgelsen (Widell 987). Der kan dog ikke repræsenteres og arbeides på flere poster ad gangen i editeringsfasen. Det kan kn ske via rapportgenerering. Det fjerde databasesystem, MASTERFILE, giver gode søgemligheder og kan arbejde sammen med et tekstbehandlingssystem (TASWORD). Til gengæld er begrænsningerne med hensyn til omfanget af databasen meget generende (kn 64Kb). Systemet er heller ikke kompatibelt me d meget andet. En fjerdedel af projekterne som brger r e d i g eringssystemer, brger "andre systemer. Det drejer sig dels om typografiske systemer, dels om særlige løsninger darbejdet d i rekte med henblik på det enkelte projekt. Den sidste løsning lader til at være den mest hensigtsmæssige set d fra et brgersynspnkt. Brgerne af disse systemer har me d en e n kelt ndtagelse ingen dårlige erfaringer og ingen ønsker om forbedringer. I det eneste tilfælde, hvor løsningen ikke fngerer tilfredsstillende, er programmellet fremstillet i samarbejde med et edb-firma og ikke af projektdeltagerne s e l v. At denne type løsning overhovedet forekommer, må nok ses som et resltat af de gældende markedsforhold med hensyn til (manglende) dbd af leksikografisk anvendeligt software. Løsningen giver friere hænder til det enkelte projekt nder arbejdet end f.eks, et system som COMPULEIS gør. I forhold til COMPULEIS vrderes et system som Informix som et mere forskningsfleksibelt edb-redskab med en relativ høj fortrydelsesret indbygget. Den totale frihed får man dog først med egen programmering. Dette realiseres af i det mindste ét projekt med direkte specifik programmering til løsning af eventelle problemer, så man ikke låses fast i arbejdet ved på forhånd at have defineret alle mlige opstående behov - hvorefter der opstår et man ikke havde fordset. Den sidste fjerdedel af projekterne har valgt et tekstb e h a n d l i n g s s y s t e m s om redigeringssystem. Et enkelt projekt

- 269 - brger ikke engang tekstbehandling, men blot editoren til et programmeringssprog (PolyPascal). Denne editor har dog tekstbehandlingslignende faciliteter. Erfaringerne med den er imidlertid vanskeligt sammenlignelige med de anvendte tekstbehandlingssystemer, da ingen af disse er nævnt ved navn i ndersøgelsen. Det brgerne af tekstbehandling p r i mært savner, er repræsentation af specialtegn på såvel skærm som printer. To af projekterne anvender editeringsprogrammet SCRIPTOR dviklet på Hmanistisk edb-center, Københavns Universitet. Programmet kan håndtere en række fremmede alfabeter og disse kan repræsenteres både på skærm og printer. B r gerne d t r y k ker dog ønske om mlighed for strktreret inddatering a la COMPULEIS. Samarbejdsmlighederne Generelt er der stor spredning inden for de anvendte s y s t e mer. Dette rejser en meget central problemstilling: k o m p a tibiliteten. Hvis der for alvor skal være basis i fremtiden for et dstrakt samarbejde, må der ske en standardisering på både hardware- og softwarefronten. Denne problematik vedrører også dveksling af maskinlæsbart kildemateriale, som i nogen grad foreligger (Hjorth 987). Materialet sklle også gerne være maskinlæsbart for dem man dveksler med (Norling- Christensen 988). Kompatibilitetsproblemet vedrører både programmel og apparatr og forekommer både i forbindelse med forskellige fabrikater og fabrikater af samme type. Man kan komme d for, at et system kn fngerer på sin egen maskine, da ikke alle fabrikater er % kompatible endog med sig selv! Desden kører f.eks. COMPULEIS på enkeltstående maskiner den fælles adgang til hverken data eller printer. Systemet kan endvidere kn (for tiden) køre på Apricot og Siris/ Victor maskiner som ikke er særligt dbredte. Det giver p r o blemer med hensyn til service og med at brge maskinen til andet end lige netop COMPULEIS. Det er imidlertid planlagt, at COMPULEIS skal blive tilgængeligt på IBM PC og k o m p a t i ble maskiner. Det meget varierede dsnit af systemer i brg er p r o b l e m a

- 27 - tisk i forbindelse med dveksling af data mellem projekter med forskellige systemer. Brgere af DANSTATUS kan den videre dveksle data indbyrdes. Sådan' brde det i princippet også være for det store antal brgere af COMPULEIS, men på grnd af individelt darbejdede formater repræsenteres data forskelligt i systemer med forskellige formater. Hvis to eller flere projekter derimod arbejder med det samme format, sklle det være mligt for dem at dveksle data med hinanden. Udveksling af data mellem COMPULEIS og DANSTATUS har været genstand for en ndersøgelse (Vestergaard 987) om overførsel af data fra COMPULEIS til DANSTATUS. Det lod sig kn gøre, fordi COMPU LEIS indvilligede i at lade disketterne konvertere til magnetbånd (7-bit ASCII). Dette magnetbånd dannede i ndersøgelsen dgangspnkt for forsøg med to databasesystemer: DANSTATUS og DataFlex. Det lykkedes kn at nå gennem hele procedren for DANSTATUS vedkommende. Med hensyn til m lighederne for dveksling af data mellem de øvrige anvendte systemer er sitationen bedst for tekstbehandlingssystemerne. De fleste tekstbehandlingssystemer har en facilitet til lagring af dokmenter i ASCII-filer. En sådan fil kan siden anvendes i et andet tekstbehandlingssystem. Ulempen ved denne type overførsel er, at alle specialkoder går tabt (nderstregning, fed skrift osv.). Der findes hjælpeprogrammer som kan oversætte direkte mellem forskellige tekstbehandlingssystemer så alle oplysninger bevares, men da de anvendte systemers identitet ikke fremgår af ndersøgelsen er det vanskeligt at anbefale et bestemt oversættelsesprogram. Undersøgelsen giver ikke noget entydigt billede af det o ptimale system. B rgerne af henholdsvis COM P U L E I S og D A N STATUS ønsker dvidelser med det andet systems styrkesider. Således ønsker COMPULEIS-brgerne mlighed for databaselagring, mens DANSTATUS-brgerne ønsker øgede tekstbehandlingsfaciliteter. Denne tendens afspejles ikke blandt ønskerne fra brgerne af egentlige tekstbehandlingssystemer og de ø v rige databasesystemer. Således giver kn enkelte tekstb e h a n d lingsbrgere dtryk for et ønske om at knne lagre i da t a b a se, ligesom databasebrgerne ikke formlerer ønsker om adgang til tekstbehandling. Udveksling af data mellem forskellige

- 27 - databasesystemer kan vise sig at være mere eller mindre p r o blematisk alt efter, hvilket format systemernes datastrktr kan normaliseres til. Generelt for alle de anvendte systemer gælder det, at det ville hjælpe, hvis man får dviklet noget programmel, som kan oversætte alle typer data til ét fælles format. Her vil et SGML-format (Standard Generalized Markp L a n g a g e ) nok være det bedste at dveksle data i (Descriptive Tools s. 39-44, Smith 987, Norling-Christensen 988). Referencer Descriptive Tools for Electronic Processing of Dictionary D a t a, Stdies in Comptational Lexicography; The DANLE-grop: Ebba Hjorth, Bodil Nistrp Madsen, Ole Norling-Christensen, Jane Rosenkilde Jacobsen, Hanne R s ; Lexicographica, Series Maior, Band 2, Max Niemeyer Verlag, Tbingen 987. Hjorth, Ebba: Materialesamlinger, i Ordbøger i D a n m a r k; s. 98-2, Jacobsen, Bent C h r.: Den Arnamagnæanske Kommissions Ordbog, i Ordbøger i D anmark; s. 5-52. Nistrp Madsen, Bodil: Dansk-fransk Ordbogsbase, i Ordbøger i Danmark; s. 24-3. Norling-Christensen, Ole: Læsning af maskinlæsbare tekster, i LAMBDA No. 7. København 988. Ordbøger i Danmark, En oversigt, DANLEgrppen, København 987. Rs, Hanne: Det dførte arbejde, i Ordbøger i D a n m a r k; s. 2-6. Smith, Joan M.: The Standard Generalized Markp Langage (SGML) for Hmanities Pblishing, i Literary and Lingistic Compting, Vol. 2, No. 3, Oxford 987; s. 7-75.

- 272 - Svensén, Bo: Handbok i lexikografi, Esselte Stdim TNC, 987; s. 26-64. Vestergaard, Bodil: Undersøgelse af d a t a b a s e s y s temer til o r d bøger, LAMBDA No. 2, Institt for Datalingvistik, Handelshøjskolen i København, København 987. Vilkår for ordbogsarbejde i Danmark, Betænkning afgivet af det af Ministeriet for kltrelle anliggender nedsatte ordbogsdvalg, Betænkning nr. 967, København 982. Widell, Peter: Databasesystemer i ordbogsarbejde - eksemplificeret ved det relationelle databasesystem Informix, i O r d bøger i D anmark; s. 32-49.