> hvidbog. Lingvister og maskiner arbejder sammen i harmoni

Relaterede dokumenter
Vurdering af Speak and Translate Elektronisk Tolk

SPØGELSET I MASKINEN - OM ALGORITMER PÅ DE SOCIALE MEDIER. Indledning. Hvad er temaet i denne artikel? Hvad er en algoritme?

Eksempler på alternative leveregler

Den næste times tid. Disposition: Baggrund Kommunikation Relationer Familiemedlemmer

SUPPLERENDE SPØRGESKEMA B

Individer er ikke selv ansvarlige for deres livsstilssygdomme

Artikler

Hvordan gør de professionelle?

ÅDAN SKABER DU FORANDRING FOR DIT BARN

Fleksibilitet og Sikkerhed

Hjælp til opfindere. 01 Beskyttelse af dine idéer 02 Patenthistorie 03 Før du søger et patent 04 Har det opfindelseshøjde? 05 At få et patent

Spørgsmål i DI s ledelsesscoreboard

Hvordan man omhyggeligt plejer

Rollespil Brochuren Instruktioner til mødeleder

PERSONLIG SALGSTRÆNING En anderledes uddannelse til ledige, der tager udgangspunkt i den enkelte. Dag 5 af 6; 08:30 15:30

De spanske medier og arbejdsløsheden. - Hvordan dækker de en af landets største kriser?

Rollespil Projektsamarbejde Instruktioner til mødeleder

Kom ud over rampen med budskabet

Mellem Linjerne Udskrift af videosamtalerne

Velkommen! Bogen her vil snakke om, hvad der er galt. Altså, hvis voksne har det meget skidt, uden man kan forstå hvorfor.

appendix Hvad er der i kassen?

10 Vigtigste SEO Ranking Faktorer

At vurdere websteder. UNI C 2008 Pædagogisk IT-kørekort. af Eva Jonsby og Lena Müller oversat til dansk af Kirsten Ehrhorn

Kommunikation og adfærd

Prædiken 4. søndag efter Hellig Tre Konger 2014, 2. Tekstrække, Matth 14,22-

Hvilke ord 'trigger' dine kunder?

Sorg er ikke hvad sorg har været

Workshop. Ledelse på afstand. Landsforeningens årsmøde 2014

Bilag 2: Interviewguide

a. Find ud af mere om sprogteknologi på internettet. Hvad er nogle typiske anvendelser? Hvor mange af dem bruger du i din hverdag?

Det er ikke altid chefens skyld

Lærervejledning til teacher-content.com senest rettet Efter beskrivelsen kan du få svar på nogle af de oftest stillede spørgsmål.

TALENT BESKRIVELSER SÆT DIT TALENT I SPIL V. IRIS ENGELUND SÆT DIT TALENT I SPIL SÅ FALDER BRIKKERNE NEMMERE PÅ PLADS IRIS ENGELUND

Selvværd og selvtillid - hvordan styrker vi vores eget og vore børns selvværd?

Analysen er din, og skal kun bruges til, at du kan tænke over, hvordan du oplever dig selv som leder.

Hvad fortæller du egentlig dig selv? - og andre?

Den moderne CFO er både sparringspartner og vagthund

Sektion H/i. Version B

Beskyttelse af personlige oplysninger og dig

Nyhedsbreve, der sælger

Kort sagt: succes med netdating.

Prædiken til 3. søndag efter påske, Joh 16, tekstrække

Forældrefiduser Ny survey fra 2014

Sådan kan du bruge mindre tid på at få posten ud af døren

HR/ Personalerekruttering

DET GODE LIV INDHOLD. Dette materiale er ophavsretsligt beskyttet og må ikke videregives

Bedre Balance testen:

Tolkningens kunst - når tolkningen fungerer

Rikkemaiah - LIV TIL ORD skrivtil@rikkemaiah.dk rikkemaiah.dk

Personaleledelse. Skab det bedste hold. Husk ros og skulderklap

Bønnens grundvold JESUS ACADEMY TEMA: BØN ER FÆLLESSKAB MED GUD

7. Håndtering af flerkulturelle besætninger

Her vil jeg gerne være Det er sådan dine kunder skal tænke

Medfølende brevskrivning Noter til terapeuten

Vildledning er mere end bare er løgn

Demenssygeplejerske, Tinna Klingberg.

Prædiken til Påskedag kl i Engesvang 1 dåb

Borgerens opfattelse af alliancen med rådgiver eller fagpersonen er et væsentligt grundlag for fremskridt.

Indvendinger. Psykologisk glidning

Prædikenens uforudsigelighed eller om hvordan en tale virker. Om Marianne Gaarden, Prædikenen som det tredje rum (Anis 2015), 161 sider

Om denne. nemlig i serviceerhvervene. Rapporten giver også nogle fingerpeg om, hvad der kan gøres for at indfri potentialet.

Lindvig Osmundsen Side Prædiken til 5.s.e. påske Prædiken til 5. søndag efter påske Tekst: Johs. 17,1-11.

At leve med ædruelighed - en ny begyndelse. Pris: kr. 35,00. Vare nr. 22. Produktkode: P-49. Alkoholisme en karrusel ved navn.

Guide til lektielæsning

Når mor eller far har piskesmæld. når mor eller far har piskesmæld

Sandhed - del 2 To typer af sandhed

BORGER VS FORVALTNING

Charlotte Plenge. Kom/IT Projekt HTX Roskilde. Joachim K. Bodholdt

Rygestop muligheder - og alt det der holder os tilbage

Hvad skal jeg skrive?

Tag ledelse af teamkulturen spar ressourcer og skab nytænkning. Fagkongres 2015 Elisabeth Plum culture.dk

Nina Ekman og Stine Reintoft. Mindfulness. for dig som mor med det lille barn

SPØGELSET I MASKINEN - OM ALGORITMER PÅ DE SOCIALE MEDIER. Indledning. Hvad er temaet i denne artikel? Hvad er en algoritme?

Hattersly s hjælp til billedkritik

SUPPLERENDE SPØRGESKEMA A

På en og samme tid drømmer man, og frygter, at man ikke kan indfri den andens drømme, eller for den sags skyld sine egne.

Vækst og Forretningsudvikling

Application Management Service

AFSLØRING AF URENT TRAV I UNDERSØGELSE AF LÆGESKØN - om Randers Kommunes undersøgelse af lægeskøn fra Lægeservice og Vibeke Manniche

Tre er et umage par. Disposition: Om undersøgelsen Kommunikation Relationer Familiemedlemmer Fremtidsperspektiver

Side 1. Værd at vide om...

INDIREKTE GENTESTS PÅ FOSTRE MEDFØRER ETISKE PROBLEMER - BØR MAN KENDE SANDHEDEN?

Sorg er ikke hvad sorg har været

Sådan skabes resultater gennem engagement

Opgaver. til. Forelsket

Forberedelse. Forberedelse. Forberedelse

Giv mig 5 minutter til at forklare...

Databeskyttelsespolitik

Sunde relationer online

280412_Brochure 23/01/08 16:41 Side 1. Feedback DANMARK. Kursusafdelingen

HR/ Personalerekruttering

Tjener eller tjenester. Hvor er vores fokus?

Clarified Communications

Hvad er fremtiden for internettet?

HVAD DEFINERER MIG? En stærk bog om Tro og Selvbillede. Benedicte Frölich

Analyse Sommerskrald

2. Kommunikation og information

En spekulativ teori om hvad det vil sige at være en normal person

Transkript:

> hvidbog Lingvister og maskiner arbejder sammen i harmoni

INDLEDNING INDLEDNING Sprogspecialister og maskiner arbejder sammen i harmoni Sådan lærer teknologien at skelne mellem det, der giver mening, og det, der ikke giver mening, mellem lykke og vrede og mellem EU-direktiver og redaktionelt stof i de nationale medier. Kenny Sendel Chief Technical Officer Forestillingen om, at en maskine kan oversætte flydende fra et hvilket som helst sprog til ethvert andet sprog, er i samme kategori som det papirløse kontor og den selvkørende bil. Alle tror, det bør være muligt. Alle tror, at det engang vil ske. Men når vi befinder os i en flyvemaskine, ligger på operationsbordet eller trykker på bremserne i vores bil, vil vi helst ikke tro, at instruktionerne er oversat af en maskine. Vi føler os trygge ved, at et menneske, der har forstand på det, har haft en finger med i spillet. Men ikke hele livet handler om potentielt livstruende situationer. Hvis teksten er stavet forkert, så er det måske ikke nogen katastrofe, og der kan være tilfælde, hvor der kun er behov for at forstå en e-mail fra en leverandør i store træk. Et juridisk dokument fra den tyske afdeling behandles nok anderledes end et notat om deres årlige ferie, men hvordan ved vi, hvad der er hvad? Denne hvidbog forklarer, hvordan vi alle står på randen af en revolution, der vil komme til at betyde hurtigere, mere præcise og mere omkostningsbesparende oversættelser: Den rigtige oversættelse til den rigtige situation udført på den rigtige måde - fordi maskiner og mennesker med tiden vil lære, hvordan de bedst kan arbejde sammen. Alle kommer til at tale samme sprog Blandt alle de andre myter er der forestillingen om, at alle med tiden vil tale samme sprog - et globalt sprog. Engelsk fremsættes ofte som kandidaten til dette, hvilket forståeligt nok irriterer mange andre nationaliteter. Den gode nyhed for dem, der gør indsigelser, er, at der er meget få tegn på, at dette vil ske. Det mest velkendte forsøg på at udvikle et globalt sprog var i 1887, da esperanto blev lanceret, og selv om der i mellemtiden er gået næsten 130 år, vurderes der stadig at være under en million, der taler esperanto, og intet land har indført det officielt. Til gengæld er der næsten 7.000 sprog i verden, og interessen i at fastholde gamle sprog i modsætning til at lade dem uddø, er faktisk voksende. De er dog ikke alle i almindelig brug, og en moderne sprogløsningsvirksomhed oversætter typisk til og fra ca. 400 sprog dagligt. 2 3

OVERSÆTTELSENS STARTPUNKT TITEL FORSTÅELSE AF OVERSÆTTELSESPRÆCISION Startpunktet for oversættelse Oversættelse starter ikke med en oversætter eller en computer eller en fransk/dansk ordbog. Det starter med et kildedokument på et sprog, som du enten forstår eller ikke forstår, med et ønske om som resultat at have det samme dokument på et sprog, som du enten forstår eller ikke forstår. Her er paradokset ved oversættelse. Der er altid én del af processen, som køberen ikke forstår fuldt ud. I den henseende er det meget anderledes end næsten alt andet. I de fleste forretningsprocesser er indkøb en klar proces med forståelse af et start- og et slutpunkt og en klar forståelse af, hvordan de begge skal måles. Oversættelse er ikke helt så ligetil. Hvor starter komplikationerne med oversættelse? Endnu engang ved kilden... 84 ord fra The Huffington Post: Jeg kan være temmelig kynisk, når det handler om markedsføringsbudskaber, men det føles som et lykkeligt øjeblik lige nu. Vi ved, at teknisk set kan penge ikke købe lykke, men måske er vi faktisk begyndt at tro på det. Vi ser billeder af de unge, smukke og rige, som solbader på deres lystbåde, vi gætter på, hvor meget erhvervsledere får i løn, og det virker bare ikke så tiltrækkende, som det plejede. Som en del af Huffington Posts Third Metric-bevægelse hører vi historier fra den anden side af... 84 ord fra et direktiv fra Europa- Kommissionen: Det faktum, at kun ordene "Forordning 44" (og ikke "Forordning 44/03") nu vil blive angivet i det ændrede direktiv, var en kilde til bekymring for NL-delegationen, da der var gennemført en betydelig forbedring fra serie 02 til serie 03 af tilføjelserne til R44 (i løbet af 1990 erne) i udviklingen af R44, hvilket var så vigtigt, at Direktiv 2003/20/ EF (ændring af direktiv 91/671/EØF) faktisk var blevet forældet (og ikke længere måtte bruges), men var CRS-godkendt til standarderne i forordning 44/00, /01 eller /02. De to eksempler her er begge på dansk. De har samme længde, men formuleringen er vidt forskellig. De lange sætninger, sætningernes kompleksitet, ordvalget, de mange kommaer, brug af latinske ord og uforklarede akronymer gør det nederste eksempel stort set uforståeligt, når der sammenlignes med den måde, det andet eksempel er skrevet på. Det ses tydeligt, så længe begge tekststykker er på dansk. Det ene stykke kan være meget sværere at forstå, men det er nemt at vurdere, hvad der er hvad og - i vid udstrækning - hvad de hver for sig handler om. Når der lægges et andet sprog oveni, øges vurderingsproblemerne eksponentielt. Forestil dig at blive præsenteret for disse eksempler på et sprog, du ikke kan læse? Hvordan skulle du vide, hvilket der var det mest komplicerede? Hvilket af de to er et EUdirektiv, og hvilket omhandler emnet lykke? "Det er dette vurderingsniveau, der er så vigtigt for at opnå den mest præcise, hurtige og omkostningseffektive oversættelse." Forståelse af oversættelsespræcision "Der er tre drivkræfter for alle, der køber oversættelsesservices: omkostning, tid og præcision. Disse er indbyrdes uforenelige; at prøve at udføre en oversættelse billigere eller hurtigere vil påvirke præcisionen. At maksimere præcisionen vil tage længere tid." Hvis en virksomhed har brug for at få et dokument oversat, lad os sige fra et kildedokument på spansk til et måldokument på fransk, hvad er så det vigtigste krav: Anvendt tid Oversættelsens præcision Omkostningerne Der er faktisk ikke et svar på dette, og faktisk er det sådan, at ændring af en eller flere af disse prioriteringer har en indvirkning på de andre. Det vigtigste krav for resultatet af enhver oversættelse vil sandsynligvis ændre sig fra dokument til dokument. For en virksomhed, der bestiller oversættelse af en manual i betjening af en flyvemaskine, har præcision topprioritet, med tid og omkostninger som en meget lavere prioritet. En virksomhed, der opdaterer oplysninger på hjemmesiden på timebasis, vil betragte tiden som den styrende drivkraft, og et "hurtigt sælgende" katalog ville måske prioritere omkostningerne. 4 5

HVAD ER 'PERFEKTION'? SUBJEKTIVITET Hvad er 'perfektion'? Hvis oversættelsens præcision ofres til fordel for tids- og omkostningsbegrænsninger, hvor upræcise er vi så indstillet på at være? På en skala, hvor 1 er kildesproget, og 10 er den perfekte oversættelse til målsproget, hvor ligger præcisionen så, og hvor målbar er den? Fabrikations- og ingeniørvirksomheder er eksempelvis ekstremt gode til at vurdere kvalitet, men deres fremgangsmåde, som ser på specifik måling og ofte fokuserer på fravær af defekter, lader sig ikke nødvendigvis overføre til sprog. Sprog kan være faktuelt korrekt, men alligevel lyde forkert, fordi udtryksform, fornemmelse for sproget, dagligdags talemåde og gængs brug er faktorer, som vi ubevidst bemærker, når vi læser eller hører vores eget sprog.* "En mand, der nu lever af at være tolk, og som er ekspert i geografisk definition af sproget hos enhver person i Europa ved at lytte til deres tale, taler med Eliza Doolittle. Han bedømmer, at hendes engelsk er for perfekt til, at hun kan være en engelsk kvinde, og meddeler, at Eliza må være en udenlandsk prinsesse." Synopse fra Pygmalion (My Fair Lady): George Bernard Shaw På nuværende tidspunkt står alle leverandører af sprogservice over for en forhindring. De ved, at nogle dokumenter kan oversættes tilstrækkeligt af en maskine. Andre har brug for menneskelig oversættelse med brug af en oversættelseshukommelse. Andre igen er så vigtige, at de kun må oversættes af et menneske og skal gennemgås og vurderes af en eller flere andre menneskelige oversættere. Beslutningen om, hvilket dokument der kan følge hvilken vej er et spørgsmål om vurdering. Konsekvenserne af at tage den forkerte beslutning kan være alvorlig, og derfor bruger sprogserviceleverandører forskellige metoder til at vurdere kildedokumentationen. Nogle bruger projektledere, mens andre sender prøvedokumenter direkte til oversætterne til vurdering, eller de bruger en kombination af de to muligheder. Uanset hvilken mulighed der vælges, er det en tidskrævende proces lige fra starten af oversættelsesprocessen. Ofte kan det ikke forudsiges forud for vurderingsfasen, om man vil være i stand til at tage en beslutning om den bedste fremgangsmåde for oversættelsen, hvor det tages med i betragtning, hvor lang tid der kræves til at levere et passende præcisionsniveau til en acceptabel pris. Dette gør det til en udfordring for sprogserviceleverandører at give et tilbud på projekter og ligeledes præcist at planlægge leveringstiden; dette er forståeligt nok lige så frustrerende for sprogserviceleverandøren som for kunden. Subjektivitet Menneskelig vurdering af kildedokumentation er også en yderst subjektiv proces. En projektleder eller oversætter vil måske kontrollere nogle sætninger og finde dem forholdsvist ukomplicerede og bruge disse som grundlag for vurdering af en større mængde tekst. Ved andre lejligheder kan teksten se ud til at være enkel og klar, men den henviser faktisk til en række billeder (fx på et websted), som ikke er leveret med; dette giver anledning til misforståelser længere nede i processen. Mangel på sammenhæng i kildedokumentet kan føre til en lang række forespørgsler senere, for eksempel ved oversættelse til et sprog, der bruger hankøn og hunkøn. Emnet er også problematisk. De fleste oversættere har specialiseret sig i konkrete emneområder, fx jura, bilindustrien eller marketing. Ideelt vil de kun blive bedt om at oversætte dokumenter inden for disse områder, men i virkelighedens verden modtager oversættere ofte dokumenter, som ligger uden for deres speciale. Dette skyldes til dels, at projektlederne bliver vant til at modtage konkrete arbejdstyper fra konkrete kunder, såsom juridiske dokumenter fra advokatvirksomheder. Pludselig kommer der så en marketingtekst ind på (fx) tysk, og de lægger ikke mærke til, at den er anderledes. "Vurderingsfejl, der giver anledning til flere forespørgsler og ukorrekt fremsendelse af dokumenter, fører til en øget risiko for upræcise oversættelser" Begge disse problemstillinger - flere forespørgsler og ukorrekt fremsendelse af dokumenter - skyldes reelt set vurderingsfejl, der fører til øget risiko for oversættelse af dårlig kvalitet. I oversættelsesbranchen øges risikoen på grund af to nøglefaktorer: 1. Branchens omfattende brug af freelance arbejdskraft og 2. Branchens kunders manglende evne til at vurdere produktet effektivt. Stort set alle sprogserviceleverandører i verden bruger den samme stab af oversættere og sprogspecialister, hvoraf de fleste er freelance leverandører. Som sådan er oversætterne og sprogspecialisterne i virkeligheden akkordarbejdere, der betales pr. oversat ord. Alt hvad der kræver, at de stiller spørgsmål ved eller afviser arbejde, der ligger uden for deres speciale, koster dem penge. Dette åbner op for en klar konflikt mellem en oversætters professionelle integritet og vedkommendes behov for at tjene penge. Dette ville være et mindre problem, hvis kunden var i stand til i tilstrækkelig grad at gennemse og vurdere resultatet. Men inden for oversættelse er dette sjældent muligt. Kunden har betalt for oversættelse, simpelthen fordi de ikke selv kan gøre det. Der er altid en del af ydelsen, kildedokumentet eller måldokumentet, som de ikke helt forstår. De har tillid til oversætteren og sprogserviceleverandøren. Denne tillid belønnes af den sprogserviceleverandør, der er i stand til at etablere en omkostningsbesparende og objektiv automatiseret vurderingsproces - og dette vil være datalingvistik. Allerede nu sætter datalingvistikken sit præg i den litterære verden. Patrick Juola er en datalingvist fra USA med speciale inden for retsmedicin, som blev kendt for at smide J.K. Rowling ud som forfatter af "Gøgens kalden", en bog, som hun skrev under et andet navn. Hans software kører flere tusinde mikroanalyser af bittesmå, underbevidste datapunkter, som individuelt ser ud til at være intetsigende: som for eksempel hvor ofte en forfatter bruger ordet "også", eller om han eller hun henviser til et bestemt møbel som et "sofabord" eller et "kaffebord". Men når disse mikromønstre samles, danner de et detaljeret kort over en enkeltpersons sproglige mønstre. Inden for kriminalitet arbejder lingvister fra Essex Universitetet i Colchester, UK, og Center for Mind/Brain Sciences i Trento, Italien, sammen om at udvikle et system til at afsløre løgn. Dette system søger efter overdreven brug af sproglige afskærmninger som "efter min bedste overbevisning" eller alt for ivrige udtryk som "Jeg sværger ved Gud". Forskerne hævder, at systemet allerede med næsten 75 % præcision kan angive, om sagsøgte eller et vidne ikke taler sandt. 6 7

SPROGSERVICELEVERANDØREN OG KUNDEN FREMTIDSUDSIGTER Sprogserviceleverandøren og kunden Selv om det ser ud til at ligge fjernt fra falsk forklaring for retten og prisvindende forfattere, er de problemstillinger, der påvirker oversættelse i forretningsverdenen, ikke ret meget anderledes. Tid, præcision og omkostninger kan udgøre hele forskellen mellem succes og fiasko, og når virksomheder klager over sprogserviceleverandører, falder deres kritik næsten altid inden for en af disse tre kategorier. På området informationsteknologi har der længe været en forståelse af forestillingen om 'garbage in-garbage out', dvs. er udgangspunktet dårligt, bliver resultatet også dårligt, og oversættelse er ikke anderledes. Kvaliteten af en færdig oversættelse afhænger i høj grad af kvaliteten af kildematerialet, den udformning, det præsenteres i, og det medfølgende referencemateriale, der gør det muligt for en sprogspecialist at placere det i en sammenhæng. "Det er meget sjældent, at jeg ser en kildetekst og tænker 'Dette er virkelig godt skrevet'" Professionel sprogspecialist Sprogspecialister har en klar overbevisning om og er stort set enige om de problemer, der giver de største udfordringer i oversættelsen. Disse falder i store træk inden for tre kategorier: upræcis (forkert indhold fra starten), teknisk (forkert formatering/filpræsentation eller konvertering) og misvisende (uventet indhold, f.eks. marketingstekst, hvor juridisk var forventet). Der er også antagelser fra ikke-sprogspecialister om, hvordan sprogspecialister arbejder. For eksempel er det ofte langt sværere at oversætte nogle få ord end et langt tekststykke, fordi det er svært at anbringe ordene i den rigtige sammenhæng. Særlige problemer kan opstå i forbindelse med en liste som fx maskindele. Disse skal oversættes til forskelligt køn på nogle sprog, og med en tilfældig eller ustruktureret liste er dette nærmest umuligt. Kildedokumentationen leveres ofte på engelsk, skrevet af en person, der faktisk ikke har engelsk som modersmål. Det understøttende referencemateriale er også af afgørende betydning. Meget af det, der skal oversættes i dag, er visuelt; det henviser til markedsføringslitteratur, til websider, til billeder. Og det henvender sig altid til bestemte målgrupper. Jo flere oplysninger en oversætter har om formålet med teksten, jo bedre kan han eller hun udføre opgaven. Til sidst er akronymer, intern jargon eller brancheforkortelser noget, som alle oversættere frygter, og som kan ende med at forsinke en vigtig oversættelse i flere timer eller måske endda flere dage. Efterhånden som den første vurdering bliver bedre, vil samarbejdet mellem sprogspecialisten og kunden stile mod at tage hånd om alle de problemstillinger, der påvirker de tre områder, som typisk giver anledning til fejl i oversættelsesprocessen. Fremtiden - forudsigelser & Angry Tweets I fremtiden vil alle dokumenter måske, måske ikke, blive oversat af maskiner, men i virkeligheden vil det sandsynligvis blive endnu mere spændende, da vi bruger maskinerne til at filtrere det meningsløse væk, fortælle os, når mennesker er vrede på os, og til at sætte os i stand til at fokusere på, hvad vi bør læse. I sprogservicebranchen vil fremtiden handle om mennesker og maskiner, der arbejder sammen på en måde, som de aldrig har gjort det før. Efterhånden som professionelle sprogspecialister arbejder sig igennem dokumenter, vil maskinoversættere lære af dem på en dynamisk måde og derefter bruge algoritmerne til at forudsige hyppigheden af det næste ord, hvilket kan spare dem for flere tusind tastetryk. Oversættelseshukommelser vil bruge statistik til at forudsige og autofuldføre lange smører af tekst. Forskningen er også meget langt fremme med 'følelsesanalyse'. Dette vil gøre det muligt for en maskine at inddele følelser ved for eksempel at læse en million tweets og ved at bruge nøgleord og sætningskonstruktioner til at identificere, hvilke af dem der er vrede tweets. Dette bruger en kombination af maskinoversættelse og en naiv Bayes-klassifikator som en form for kunstig intelligens. Når en korrekturlæser gennemgår en tekst i fremtiden, er det sandsynligt, at en maskine også gennemgår den og træner sig i at vide, hvilke sætninger korrekturlæseren sandsynligvis vil redigere. På denne måde lærer den korrekturlæserens sandsynlige adfærd, som kan meldes tilbage til den menneskelige oversætter. Dette fører til spørgsmålet, om korrekturlæseren vil ændre noget, der så igen fører til forudsigende analyse og en risikovægtet beslutning, om der skal bruges maskinoversættelse til en bestemt sætning. En fremtid, hvor alle taler samme sprog, er ikke kun højst usandsynlig, men på en måde også uønsket. Sprog er uløseligt forbundet med kultur, tradition, historie, geografi og nære menneskelige forbindelser, og sprog er noget, der skal værnes om. Et sprogs kompleksitet er dets styrke og grunden til, at det har taget helt op til nutiden at skabe den nødvendige computerkraft, som nu begynder at få en virkning 8 9

få mere at vide om datalingvister ved at kontakte os på: t: +44 (0)870 488 000 e: info@thebigword.com w: www.thebigword.com