Abstract This thesis has attempted to examine the quality of online translation services on texts translated from Danish into English.

Relaterede dokumenter
The X Factor. Målgruppe. Læringsmål. Introduktion til læreren klasse & ungdomsuddannelser Engelskundervisningen

Efter-redigering af maskinoversatte tekster

Barnets navn: Børnehave: Kommune: Barnets modersmål (kan være mere end et)

Italien spørgeskema til seminarielærere / sprog - dataanalyse

Hvor er mine runde hjørner?

DK - Quick Text Translation. HEYYER Net Promoter System Magento extension

Rettevejledning til skriveøvelser

Project Step 7. Behavioral modeling of a dual ported register set. 1/8/ L11 Project Step 5 Copyright Joanne DeGroat, ECE, OSU 1

Når vi forbereder et nyt emne eller område vælger vi de metoder, materialer og evalueringsformer, der egner sig bedst til forløbet.

Delma l for Danish. Det talte sprog. Måltaksonomi: Beginners Middlegroup Advanced Efter Y4 Forstå enkle ord og vendinger knyttet til dagligdagen

Fremstillingsformer i historie

Tema: Pets Fag: Engelsk Målgruppe: 4. klasse Titel: Me and my pet Vejledning Lærer

Notat om underleverandører af software til medicinsk udstyr Specielt med fokus på fortolkere, hvor nyt udstyr let kan genereres

Bedømmelsesvejledning til prøven i skriftlig fremstilling G, december Dansk som andetsprog

Bilag. Resume. Side 1 af 12

Dansk som andetsprog - Supplerende undervisning

Vores mange brugere på musskema.dk er rigtig gode til at komme med kvalificerede ønsker og behov.

Dansk/historie-opgaven

Vina Nguyen HSSP July 13, 2008

IBM Network Station Manager. esuite 1.5 / NSM Integration. IBM Network Computer Division. tdc - 02/08/99 lotusnsm.prz Page 1

Dansk som andetsprog - Supplerende undervisning

Senest opdateret: 21. november 2016 SPØRGSMÅL OG SVAR. Vedr. offentligt udbud af rammeaftale

To the reader: Information regarding this document

Engelsk. Niveau D. De Merkantile Erhvervsuddannelser September Casebaseret eksamen. og

Basic statistics for experimental medical researchers

Skriftlig genre i dansk: Kronikken

PDFmaps på smartphones

PDFmaps på smartphones

Medfødt grammatik. Chomskys teori om sprogtilegnelse efterlader to store stridspunkter i forståelsen af børnesprog:

Dato: 24. oktober 2013 Side 1 af 7. Teknologisk singularitet. 24. oktober 2013

Observation Processes:

At arbejde som translatør

IT opgave. Informationsteknologi B. Vejleder: Karl. Navn: Devran Kücükyildiz. Klasse: 2,4

Nanna Flindt Kreiner lektor i retorik og engelsk Rysensteen Gymnasium. Indsigt i egen læring og formativ feedback

Vejledning til Projektopgave. Akademiuddannelsen i projektstyring

how to save excel as pdf

Maskinoversættelse i et dansk perspektiv

Guide til god netkommunikation Introduktion og vejledning til at producere til intranettet

Titel: Barry s Bespoke Bakery

Dansk som andetsprog (supplerende) Fælles Mål

Kunstig intelligens. Thomas Bolander, Lektor, DTU Compute. Siri-kommissionen, 17. august Thomas Bolander, Siri-kommissionen, 17/8-16 p.

DIO. Faglige mål for Studieområdet DIO (Det internationale område)

Guide til lektielæsning

1.0 FORMELLE KRAV HVORDAN OPGAVENS OPBYGNING... 2

Revision af oversatte tekster. en empirisk undersøgelse af oversættelsesrevision

Titel: Hungry - Fedtbjerget

Rasmus Rønlev, ph.d.-stipendiat og cand.mag. i retorik Institut for Medier, Erkendelse og Formidling

Forberedelse. Forberedelse. Forberedelse

PARALLELIZATION OF ATTILA SIMULATOR WITH OPENMP MIGUEL ÁNGEL MARTÍNEZ DEL AMOR MINIPROJECT OF TDT24 NTNU

Stk. 3. Undervisningen skal give eleverne adgang til de skandinaviske sprog og det nordiske kulturfællesskab.

Meget formel, modtager har en meget speciel titel som skal bruges i stedet for deres navne

Årsplan 9. Klasse Engelsk Skoleåret 2015/16

Meget formel, modtager har en meget speciel titel som skal bruges i stedet for deres navne

Engelsk. Niveau C. De Merkantile Erhvervsuddannelser September Casebaseret eksamen. og

Bedømmelsesvejledning til prøven i skriftlig fremstilling D, december Dansk som andetsprog

RESUME TRANSLATION MEMORY-SYSTEMER SOM VÆRKTØJ TIL JURIDISK OVERSÆTTELSE. KRITISK VURDERING AF ANVENDELIGHEDEN AF TRANSLATION MEMORY-SYSTEMER TIL

Poster design. Meningen med en poster

Forslag til opgavestruktur, typografi og layout

LESSON NOTES Extensive Reading in Danish for Intermediate Learners #8 How to Interview

Årsplan for 4.klasse i dansk

Store IT-Innovationer TØ5

Avancerede bjælkeelementer med tværsnitsdeformation

Indledning. Problemformulering:

Visioner, missioner og værdigrundlag i de 50 største virksomheder i Danmark

Deep Learning. Muligheder og faldgruber. Glenn Gunner Brink Nielsen, Teknologisk Institut

Engelsk, basis. a) forstå hovedindhold og specifik information af talt engelsk om centrale emner fra dagligdagen

Analyse af PISA data fra 2006.

Hvad bør du vide om layout og typografi

Terese B. Thomsen 1.semester Formidling, projektarbejde og webdesign ITU DMD d. 02/

Evalueringsresultatet af danskfaget på Ahi Internationale Skole. ( ) Det talte sprog.

Lynkursus i problemformulering

Større skriftlige opgaver i Microsoft Word 2007 Indhold

The River Underground, Additional Work

Analyse af værket What We Will

Bedømmelseskriterier for engelsk niveau D

Bedømmelseskriterier for engelsk niveau C

Fagplan for tysk. Delmål 1 efter 6. klassetrin

Vildledning er mere end bare er løgn

Eksempelvis: Fra matematik delen:

Intro to: Symposium on Syntactic Islands in Scandinavian and English

Lita Lundquist: Oversættelse. Problemer og strategier, set i tekstlingvistisk og pragmatisk perspektiv. Gylling: Samfundslitteratur, 1997 (2. udg.

Aktivering af Survey funktionalitet

a. forstå varierede former for autentisk engelsk både skriftligt og mundtligt,

Censorvejledning for censorer i skriftlig fransk begyndersprog og fortsættersprog A, hhx. Analog prøve

Senest opdateret: 30. november 2016 SPØRGSMÅL OG SVAR. Vedr. offentligt udbud af rammeaftale

Fordeling af karakterer

De skriftlige eksamensgenrer i engelsk

Videnskabsteori - Videnskabelig argumentation og videnskabeligt sprog. Mette Dencker

BONUSINFORMATIONER i forbindelse med emnet Billeder og grafik

Side 1 af 9. SEPA Direct Debit Betalingsaftaler Vejledning

Begynderens Guide Til Chatbots

Når vi forbereder et nyt emne eller område vælger vi de metoder, materialer og evalueringsformer, der egner sig bedst til forløbet.

Hjerner i et kar - Hilary Putnam. noter af Mogens Lilleør, 1996

Hvorfor skal vi bruge objekt orienteret databaser?

Special VFR. - ved flyvning til mindre flyveplads uden tårnkontrol som ligger indenfor en kontrolzone

Artikler. Aktivitet er defineret med inspiration fra begrebet 'perdurant' i DOLCE (A Descriptive Ontology for Linguistic and Cognitive Engineering).

Freefly B-Række Regler

Transkript:

Camilla Antonsen Cand.ling.merc. engelsk Side 1 af 62 Abstract This thesis has attempted to examine the quality of online translation services on texts translated from Danish into English. I have chosen to base this thesis on the three following online translation tools: Google Translate (https://translate.google.com) SDL FreeTranslation.com (http://www.freetranslation.com) Bing Translator (http://www.bing.com/translator/) These have been chosen because they are all free, anyone with an Internet access would be able to reach them and in addition they offer all translation from Danish and English. Since they are all freely available, I think it's would be interesting to take a critical look at them, so it can be determined, how the quality of them is and which can be recommended to use. One of the things that these online translation services are used for is to get an overview of a text that the reader does not immediately understand. So the expectation for an online machine translation will probably be that the reader will achieve an overall understanding of a text. Therefore, I think it would be interesting to compare machine translation, as translated from Danish into English in their raw machine translation output. The empirical data in this specialty is the film reviews "Creepy performance in 'Foxcatcher'" and "theory of everything". So with that in mind, my thesis try to answer the following questions: Is there a difference in quality between the above three free online translation tools? To answer this question, the following questions have also be taken into consideration: What translation service is best to reproduce the basic message? What types of errors occur? First, it established what it's like with the basic message. To that end, I gave a skopos of machine translations. The purpose is that the reader understands the message, but it is not necessarily a perfect translation. During the analysis of machine translation from the selected translation services, it appeared that both Google Translate and Bing Translator was the best to reproduce the basic message, while SDL FreeTranslation.com left several items untranslated. But it is only small differences; none of them are superior to others. In relation to the types of errors that occurred during machine translation, there were some common traits which recurred in all three translation tools. These include context mistranslations, locations of adverbs and verb translation and direct translation, which gave unusual synthetic constructions. Translation quality was studied by means of setting up an analysis model which was inspired by editing theory: Group 1 - Transfer of message Accuracy

Camilla Antonsen Cand.ling.merc. engelsk Side 2 af 62 Deletions and additions Group 2 - Linguistic reproduction of content Understanding Mistraslations Group 3 - Genre Specific elements Imagery and idioms Names If I have to conclude on whether there is a difference in the quality of the three selected translation services. It world be concluded that there are some differences in the quality of machine translations, but it is more subtle differences. There is not one of the services that are superior to the others. In relation to the criteria, they are all three very equal, except for omissions and additions, where SDL Freetranslation.com performed significantly worse than the other two. The criterion names were the second aspect, where SDL FreeTranslation.com once again stands out negatively. This means it can be concluded that there are differences in the quality of the translation services, but they are not essential. If I were to to recommend an online translation service to use for my machine translation needs, then I would choose Google Translate, but it is only marginally. And then I'd probably avoid SDL FreeTranslation.Com.

Camilla Antonsen Cand.ling.merc. engelsk Side 3 af 62 Indholdsfortegnelse Abstract... 1 1. Introduktion... 5 1.1 Problemformulering... 5 1.2 Empiri... 6 1.3 Afgrænsning... 6 1.4 Termer... 6 1.5 Metode og specialets opbygning... 6 2. Online oversættelsesværktøjer... 8 2.1 Hvad er oversættelse?... 8 2.2 Hvad er maskinoversættelse?... 9 2.3 Hvordan fungerer maskinoversættelse?... 10 2.4 Udvalgte værktøjer til empiri... 11 2.4.1 Google Oversæt... 11 2.4.2 Bing Translator... 12 2.4.3 SDL FreeTranslation.com... 12 3. Teori... 13 3.1 Skopos... 13 3.2 Efterredigeringsteorier... 14 3.2.1 Mossop The Revision Parameters... 14 3.2.2 O brien... 17 3.2.3 TAUS... 18 3.3 Sproglige aspekter... 19 3.3.1 Retstavning... 19 3.3.2 Syntaks og idiom... 19 3.3.3 Tegnsætning... 20 3.3.4 Sprogbrug... 20 4. Analysemodel... 21 4.1 Skopos... 21 4.2 Genre og maskinoversættelse... 21 4.3 Analysemodel til brug i speciale... 22 5. Beskrivelse af empiri... 24 6. Analyse... 24 6.1 Foxcatcher... 24 6.1.1 Google Oversæt... 24 6.1.2 Bing Translator... 29 6.1.3 SDL Free Translation... 34 Opsamling... 40 6.2 Teorien om alting... 40 6.2.1 Google Oversæt... 40 6.2.2 Bing Translator... 45 6.2.3 SDL Free Translation... 49 Opsamling... 55 7. Resultat og diskussion... 55 7.1 Dominerende fejl... 57 8. Konklusion... 58

Camilla Antonsen Cand.ling.merc. engelsk Side 4 af 62 Litteraturliste... 60 Bilag... 62

Camilla Antonsen Cand.ling.merc. engelsk Side 5 af 62 1. Introduktion I takt med at verden er blevet mere globaliseret, er behovet for oversættelser også steget. Jeg har personligt altid fundet disciplinen oversættelse interessant og det er derfor jeg har valgt at studere det. Det er en disciplin, som handler om mere end bare at oversætte fra ord- til- ord. Disciplinen indebærer sproglig og grammatisk viden, men også viden om kulturelle aspekter og viden om specifikke emner. Gennem mit studie har jeg selv prøvet at oversætte forskellige genrer, både indenfor almen og fagsproglig kommunikation. Hidtil har jeg mest beskæftiget mig med oversættelse uden den store hjælp fra maskinoversættelse. Men jeg har altid fundet mødet med maskinoversættelse vedkommende og et brugbart hjælpemiddel, som jeg gerne vil tage et nærmere kig på. Derudover er der spændende muligheder i, hvordan forskellige maskinoversættelsesværktøjer kan bruges indenfor oversættelsesdisciplinen i fremtiden. Ønsket om automatisk oversættelse er langt fra en ny ide, men i takt med den teknologiske udvikling, er det blevet muligt, at opfinde adskillelige automatiske oversættelsesværktøjer. Der findes mange forskellige gratis oversættelsesværktøjer på nettet. Det er min opfattelse, at de bliver brugt hyppigt. Så derfor synes jeg, at det er interessant at tage et kritisk blik på dem, så det kan fastslås bl.a. hvordan kvaliteten af dem er og hvilken der kan anbefales at bruge. Det skal dog nævnes, at der stadig ikke findes én, der kan oversætte en tekst perfekt, men det er heller ikke formålet med de gratis online oversættelsestjenester der findes. En af de ting som fx Google Oversæt og andre lignende tjenester bliver brugt til er at få et overblik over en hvilken som helst tekst, som brugeren ikke umiddelbart forstår. Så forventningen til en online maskinoversættelse vil formentlig være, at brugeren opnår en overordnet forståelse, men han/hun vil ikke opleve et fuldstændigt korrekt sprog. Derfor synes jeg, at det kunne være interessant, at sammenligne maskinoversatte tekster, som er oversat fra dansk til engelsk i deres rene maskinoversættelse. Det vil sige, at formålet med dette speciale er, at se på teksterne, som de er direkte fra de udvalgte oversættelsestjenester, med andre ord vil der ikke blive set på, hvad der kan gøres for at forbedre de maskinoversatte tekster, men at undersøge hvordan kvaliteten af de maskinoversatte tekster er, i forhold til at gengive det grundlæggende budskab. Jeg har valgt at basere dette speciale på følgende tre online oversættelsesværktøjer: 1. Google Oversæt (https://translate.google.com) 2. SDL FreeTranslation.com (http://www.freetranslation.com) 3. Bing Translator (http://www.bing.com/translator/) Disse er blevet valgt, fordi de alle er 100% gratis, enhver med internetadgang ville kunne tilgå dem og derudover tilbyder de alle oversættelse både til og fra dansk og engelsk. Disse online tjenester er i konstant udvikling, så resultatet af min undersøgelse vil kun give et øjebliksbillede af de tre oversættelsestjenester foråret 2015. 1.1 Problemformulering Så med ovenstående in mente, vil mit speciale fokusere på følgende spørgsmål: Er der forskel i kvaliteten mellem de tre ovennævnte gratis online oversættelsesværktøjer?

Camilla Antonsen Cand.ling.merc. engelsk Side 6 af 62 For at kunne besvare dette spørgsmål vil følgende underspørgsmål også blive taget i betragtning: Hvilken oversættelsestjeneste er bedst til at gengive det grundlæggende budskab? Hvilke fejltyper opstår? 1.2 Empiri Som nævnt i problemformuleringen, er formålet med dette speciale at undersøge maskinoversættelsen af udvalgte danske artikler. Jeg har udvalgt to aktuelle filmanmeldelser. Filmene er udvalgt tilfældigt. Disse filmanmeldelser indeholder et alment og varieret sprog, hvor den gode oversættelse i høj grad afhænger af konteksten. I modsætning til eksempelvis et teknisk eller medicinsk sprog, som er baseret på specifik fagterminologi, hvor der er en fast opfattelse af hvad der er en korrekt oversættelse. Derfor mener jeg, at det er mere interessant at kigge på førstnævnte, fordi det giver generelt billede af hvordan den grundlæggende kvalitet af de udvalgte online oversættelsesværktøjer er. Så maskinoversættelse af fagsproglig kommunikation vil ikke blive taget i betragtning i dette speciale. Specialets spørgsmål vil blive forsøgt opklaret ved hjælp af at angive et skopos for oversættelsen. Derudover vil jeg opstille en analysemodel af kvalitetskriterier, som vil blive baseret på efter- redigeringsteori af bl.a. Brian Mossop (2014). Denne analysemodel vil bruges til sammenligningen af de udvalgte maskinoversatte filmanmeldelser. Derudover vil diverse teorier blive anvendt, til at belyse de sproglige aspekter i forbindelse med analysen af hvilke typer af oversættelsesfejl der fremkommer. 1.3 Afgrænsning Dette speciale vil kun beskæftige sig med maskinoversættelse fra dansk til engelsk, og ikke til og fra begge sprog. Derudover vil det kun være kvaliteten af den maskinoversatte tekst, som vurderes, selvom specialets teoretiske grundlag vil basere sig på efterredigeringsteori, så vil det ikke handle om hvordan maskinoversættelser kan forbedres. 1.4 Termer I dette speciale er der flere termer som går igen. Her vil blive beskrevet hvad disse henviser til til. I dette speciale vil læser henvise til alle former for modtagere. Forfatter henviser til enhver person som har skrevet en tekst. Når der henvises til billedsprog og idiomer, som er det de udtryk der kan slås op i Den Danske ordbog 1. 1.5 Metode og specialets opbygning For at kunne besvare spørgsmålene i min problemformulering er det nødvendigt at have en basisviden om maskinoversættelse og mere specifikt om de tre udvalgte oversættelses tjenester: Google Oversæt, Bing Translator og SDL Freetranslation.com. Derfor vil jeg i kapitel 2 beskrive disse, samt forklare hvad både oversættelse og maskinoversættelse vil sige, hvordan et statistisk baseret maskinoversættelsessystem fungerer, dog uden at gå i dybden 1 http://ordnet.dk/ddo 2 SDL Trados Studio er et professionelt maskinoversættelseværktøj.

Camilla Antonsen Cand.ling.merc. engelsk Side 7 af 62 med de tekniske detaljer. Udover at besidde en viden om det system, som udfører maskinoversættelsen, er det også nødvendigt at vide hvordan udfordringerne i forbindelse med maskinoversættelse kan identificeres. Derfor vil jeg i kapitel 3 beskrive og kommentere på den teori, som jeg har valgt at basere min analysemodel på. Dette indebærer bl.a. Brian Mossops teori og metode fra Revising and editing for translators fra 2014, samt TAUS retningslinjer. Derudover vil de teoretiske grundlag for skoposteorien også blive præsenteret. Mossop er det teoretiske grundlag for dette speciale, mens TAUS er udarbejdet af professionelle oversættere, der arbejder med efter- redigering, og som derved giver et indblik i, hvordan det foregår i den virkelige verden. Jeg har valgt Mossop (2014) som mit teoretiske grundlag, fordi teorien indeholder relevante aspekter i forhold til at kvalitetsvurdere en rå maskinoversættelse. I kapitel 4 vil jeg gennemgå min analysemodel, samt skoposset for de maskinoversatte filmanmeldelser. For at kunne vurdere kvaliteten af de maskinoversatte tekster, vil jeg i kapitel 6 analysere de udvalgte maskinoversatte artikler med udgangspunkt i min model. I kapitel 7 vil gennemgå resultatet af analysen og diskutere resultatet. I kapitel 8 kommer min konklusion, hvor jeg vil konkludere på spørgsmålene fra problemformuleringen.

Camilla Antonsen Cand.ling.merc. engelsk Side 8 af 62 2. Online oversættelsesværktøjer 2.1 Hvad er oversættelse? Før den specifikke oversættelsesdisciplin maskinoversættelse tages i betragtning, så er det relevant at definere, hvad der forstås ved oversættelse. Oversættelse er ikke blot en transformation fra ord til ord. I ganske simple termer kan oversættelse defineres som en substitution af en tekst fra et sprog til en ækvivalent tekst på et andet sprog. Men der er mange flere aspeker i disciplinen oversættelse end bare ækvivalens. Hvis man ser på oversættelse ud fra det synpunkt, at måltekstens funktion i målsprogskulturen er mere interessant end den direkte relation til kildeteksten, det vil sige at en oversættelse ses som en selvstændig tekst. Et andet synspunkt kunne være, at enhver tekst, som har en relation til en anden tekst ses som en oversættelse. Det vil sige at i forbindelse med oversættelse, så er ækvivalens ikke den eneste måde at definere oversættelse på. Her kommer betydning ind i billedet, da det traditionelt set er at en oversættelse har samme betydning som kildeteksten. (Malmkjær 2011:109) Betydning er derfor vigtig for oversættelse, men det er særdeles svært at definere, fordi en kildetekst har en kildesprogsbetydning og en målsprogstekst har en målsprogsbetydning. (Malmkjær 2011:110) Derudover er der flere facetter af oversættelse. Det kan foregå indenfor det samme sprog, kaldet intralingual translation og fra et sprog til et andet, kaldet interlingual translation. (Schjoldager 2008:18-19) I forbindelse med dette speciale er det sidstnævnte der vil blive behandlet. Definitionen for oversættelse i dette speciale vil være: A translation is a text that expresses what another text has expressed in another language (Schjoldager 2008:19) Det er en ret bred definition, at en oversættelse er en tekst, der udtrykker, hvad en anden tekst har udtrykt på et andet sprog, men den er dækkende til brug i dette speciale. I forbindelse med den klassisk oversættelsestradition så skal en oversætter besidde lingvistisk, kulturel, tekstlig og emnespecifik viden, ligeså er research og korrekt gengivelse særdeles essentielle. (Schjoldager 2008:20) Disse aspekter er ikke direkte anvendelige, når der refereres til en automatiseret oversættelse, dvs. en hvilken som helst maskinoversættelse. Da en maskinoversættelse tænker en oversættelse anderledes en person ville, men dette vil blive uddybet i kapitel 2.2. Sidste betragtning før der gås videre til de funktionelle aspekter i maskinoversættelse, handler om formålet med oversættelsen, dvs. oversættelsens skopos. I maskinoversættelse ses der på forskellen mellem assimilation og dissemination (Fersøe 2006:287) Assimilation dækker over at få et overblik over hvad en tekst handler om, i modsætning til slet ikke at kunne få den oversat. Dissemination dækker over maskinoversættelsessystemer, hvor kvaliteten af den maskinoversatte tekst skulle kunne publiceres. Dette er de to behov der findes i forhold til maskinoversættelse og det er det første som vil blive taget i betragtning i

Camilla Antonsen Cand.ling.merc. engelsk Side 9 af 62 dette speciale. Dette henfører til skoposteorien og dens teoretiske anskuelser, og disse vil blive beskrevet i større omfang i kapitel 3. 2.2 Hvad er maskinoversættelse? Behovet for oversættelse er langt fra et nyt fænomen. Derfor er det en naturlig konsekvens, at mennesket har villet inddrage teknologien for at gøre disciplinen lettere. Det følgende er en kort gennemgang af maskinoversættelsens historie. Ideen om maskinoversættelse går langt tilbage i tiden, men de første skridt blev taget i 1933, da der blev udstedt to patenter på tidlige versioner af mekaniske oversættelsesmaskiner og ordbøger. (Hitchens 2007:1) Men det var først i slutningen af 40erne, at der for alvor kom gang i udviklingen, da man for første gang fandt på at bruge de nyligt opfundne computere til oversættelse. Herfra og op gennem 50erne var der en massiv udvikling, ikke blot teknologisk, men også i forhold til at identificere de sproglige udfordringer, som ligger i maskinoversættelse. (Hitchens 2007:2) Den første overordnede metode, som tog sit udspring i 50erne/60erne kaldes den direkte metode. (Fersøe 2006:290) Den bygger på anvendelsen af tosprogede ordbøger, samt enkle grammatiske regler. Gennem tiden blev denne metode naturligvis udviklet og forbedret ved brug af mere grammatik. I 80erne begyndte den indirekte metode at vinde indpas. (Fersøe 2006:292) Den går ud på at der er flere trin i oversættelsesprocessen og bl.a. en langt større grammatisk viden og en vis form for analyse, bl.a. typiske sætningskonstruktioner. Disse to metoder kaldes samlet for de regelbaserede metoder, fordi de bygger på et sprogs regler, såsom ordbøger og grammatik og derudover regler for oversættelse mellem to udvalgte sprog. Fra 90erne og frem vinder de statistiske baserede metoder frem, hvor det ikke er lingvistiske regler i form af ordbøger og grammatik maskinoversættelsen baseres på, men viden ud fra statiske regler (Fersøe 2006:289). De statiske metoder kaldes også korpusbaserede metoder. 90erne betød også en stor opblomstring af maskinoversættelse på internettet. Og internettet har haft stor betydning for udviklingen og udbredelsen af maskinoversættelse. I starten tilbød udviklerne kun oversættelse mellem de globalt anerkendte sprog, såsom engelsk, fransk og spansk. Men nu er en lang række er verdens sprog tilgængelige, der er endda nogle oversættelsestjenester der tilbyder at oversætte fiktive sprog som klingon. Det forventes, at ikke- oversatte tekster som regel er skrevet på ét sprog, fx, dansk eller engelsk, at de giver mening og at de er sprogligt korrekte, i det mindste at det giver mening rent sprogligt. Derfor må man have den samme forventning til en oversat tekst. En hvilken som helst oversættelsesproces kunne se ud som følgende: En kildetekst en oversættelsesproces en oversættelse Som udgangspunkt er en maskinoversættelse ikke anderledes. Det er velkendt, at systemer og maskiner ikke kan noget af sig selv, de har brug for en form for tillæring eller en kommando. Men det må derfor også antages, at systemer og maskiner ikke har en nødvendig og generel

Camilla Antonsen Cand.ling.merc. engelsk Side 10 af 62 tekstlig og kulturel forståelse eller grundlæggende viden om de to sprog, der skal oversættes imellem. Det er disse aspekter, der er behov for i forbindelse med en oversættelse, så disse skal så akkumuleres af systemet eller maskinen. Derfor hvis man skulle definere maskinoversættelse helt simpelt, så ville det være, at maskinoversættelse er en automatiseret oversættelse. Det er den proces, hvormed computersoftware anvendes til at oversætte en tekst fra et naturligt sprog til et andet. Mens det på overfladen muligvis synes meget ligetil, så er det en langt mere kompleks proces. 2.3 Hvordan fungerer maskinoversættelse? Så hvordan fungerer maskinoversættelse egentlig? Der findes to typer af maskinoversættelse. De er som tidligere nævnt den regelbaserede maskinoversættelse og den statistiske maskinoversættelse. Men da de udvalgte online oversættelsestjenester, som jeg vil bruge i dette speciale, bygger på den statistiske maskinoversættelse, så er det den type, der vil være fokus på. Så her følger en gennemgang af hvordan den statistiske maskinoversættelse fungerer. Fersøe (2006:294) siger at den statiske maskinoversættelse bygger på at en maskine lærer hvad den statisk set mest sandsynlige oversættelse af en given sekvens er, baseret på analyse af store mængder oversat materiale og, i princippet, uden anvendelse af lingvistiske regler overhovedet. Statistisk maskinoversættelse foregår gennem et system, som overvejer de statistiske oversættelsesmuligheder i specifikke sprogpar, det vil sige mellem det to sprog som der oversættes mellem. Disse oversættelsesmuligheder opsættes i en oversættelsesmodel, en sprogmodel og en afkodningsalgoritme. (Fersøe 2006:295) Oversættelsesmodellen bruges til at modsvare kildesprogsinputtet og målsprogsoutputtet. Modellen bruger dette til at lære hvilke ordkombinationer på kildesproget, der hyppigst giver hvilke kombinationer på målsproget. (Fersøe 2006:295) Så afkodningsalgoritmen baseres på ordkombinationer eller enkelte ord, hvilket betyder at oversættelsesmodellen ikke vælger en oversættelse, men hvad der er mulige oversættelser ud fra det givne materiale systemet har til rådighed. Dette gøres, da en statistisk maskinoversættelse hverken har en tekstuel eller kulturel forståelse, men er baseret på korpuset, som er alt den data som er indført og maskinoversættelsen har lært fra. Så for at kunne vælge den mest sandsynlige oversættelse er der behov for en sprogmodel, der indeholder sandsynligheder for korrekte udsagn på målsproget. Afkodningsalgoritmen er kernen i den statistiske maskinoversættelse, idet den bruger oversættelsesmodellen og sprogmodellen på kildesprogsteksten og kreerer selve oversættelsen og dermed målsprogsteksten. Den ideelle tekst (Fersøe 2006:295) til en maskinoversættelse er en som er renset for styretegn til layout og typografi, den skal være opdelt i tokens (ord, tal), og gerne være i segmenter (dokumenter, overskrifter, afsnit, sætninger) og den skal være aligneret. Dette betyder, at der er en forbindelse mellem en udvalgt sætning på kildesproget og en konkret oversættelsen på målsproget. Dette kan være på overordnet dokumentniveau, men jo detajeret maskinoversættelsen alignerer, jo bedre bliver resultatet i sidste ende.

Camilla Antonsen Cand.ling.merc. engelsk Side 11 af 62 To af de største udfordringer i forbindelse med maskinoversættelse er mindre ændringer i billedsprog og idiomer og mangelen på data i oversættelsesværktøjet. De udvalgte online oversættelsestjenester, er de såkaldte statistiskbaserede oversættelsessystemer. Det vil sige, at systemerne ser på store mængder tekst og leder efter et system, hvormed oversættelsen skal være og kommer med et kvalificeret bud på en oversættelse. Systemet ser på hvilken der er mest sandsynlig, men der er ikke en form for analyse og hverken syntaks eller semantik kommer i betragtning. Hvis man tager billedsprog og idiomer i betragtning først, så vil oversættelsessystemet givetvis kunne genkende den korrekte gengivelse i mange tilfælde. Da mange af den er ens og har en ækvivalent på målsproget. Men hvis der byttes lidt om på ordene eller der indsættes et ekstra ord, dvs. at de faste billeder bliver brudt op, så opstår problemet for maskinoversættelsesværktøjet, for så kan systemet ikke genkende ordstillingen også er det de mere specielle oversættelser opstår. Der arbejdes dog på at finde en løsning på dette problem. Her er oversættelsessystemet Phrasal (Thorsen 2010:2), som inkorporeres i allerede eksisterende oversættelsesværktøjer, et rigtig godt bud, da det er udviklet med henblik på at løse netop dette specifikke problem. Men der er stadig et andet stort problem, som ikke lige er til at løse, fordi det er ét forskerne på området mener, at man altid vil have. Ifølge forskeren Anders Søgaard (2010) (Thorsen 2010:3) vil man altid opleve fejl i maskinoversættelse, fordi systemerne ikke har nok data til at fremstille anvendelige oversættelser. Et eksempel kunne være at et oversættelsesværktøj ikke på nogen måde kan oversætte et ord, som ikke findes i maskinoversættelsens korpus. Et sidste aspekt som vil blive taget i betragtning er, forskellen mellem maskinoversættelse og menneskelig oversættelse. Oversættelsen betragtes forskelligt alt efter om det er en person eller en maskine, der laver den. En maskinoversættelse oplever en tekst som en der skal afkodes, dvs., at det er noget der kan sættes i formler og modeller, hvorimod en person vil forsøge at finde meningen og budskabet i sætningen og ud fra den givne mening, gengive det på et andet sprog. 2.4 Udvalgte værktøjer til empiri De udvalgte oversættelsesværktøjer minder om hinanden, men det er relevant at se på hvad der karakteriserer hver enkelt. Så de tre oversættelsesværktøjer vil bliver præsenteret hver for sig i det følgende. 2.4.1 Google Oversæt Google Oversæt kan findes på: https://translate.google.com. Googles oversættelsestjeneste er en af de mest velkendte og mest brugte online oversættelsestjeneste. Den kan bruges til at oversætte enkelte ord, sætninger, dokumenter og websider. Teknologien bag tjenesten er den statistiske maskinoversættelse. Der er mulighed for at oversætte mellem over 90 sprog. I modsætning til andre tjenester, så har brugeren med Google Oversæt mulighed for at forslå en anden oversættelse end den som værktøjet producerer. Brugeren har også muligheden for at

Camilla Antonsen Cand.ling.merc. engelsk Side 12 af 62 få læst den oversatte tekst op. Det er også muligt at indtale det man ønsker oversat. Derudover har man muligheden for at gemme oversættelser i en såkaldt phrasebook, som er en feature i ens Google konto, så man skal have oprettet en bruger, hvis man vil kunne bruge den funktion. Google Oversæt findes også som en gratis applikation til smartphones, så der er også mulighed for at bruge tjenesten, hvis man ikke har adgang til en computer. 2.4.2 Bing Translator Bing Translator findes på: http://www.bing.com/translator/. Denne oversættelsestjeneste er skabt af Microsoft. Oversættelsestjenesten gengiver ikke hvilken typen oversættelsesteknologi den benytter, bare at det er en automatiseret oversættelse. Men det må formodes at den som de andre to maskinoversættelsestjenester tjenester bygger på den statistiske model. Dette formodes da, den bygger på indlæringsmaskiner og sproglige modeller Tjenesten kan oversætte websider og anden tekst. Det er en fuld automatisk maskinoversættelse, som oversætter imellem 47 sprog. I modsætning til de andre to findes denne tjeneste ikke som en gratis applikation til smartphones. 2.4.3 SDL FreeTranslation.com SDL FreeTranslation.com kan findes på http://www.freetranslation.com. SDLs oversættelsestjeneste kan også oversætte dokumenter, websider og andre typer tekster til mange forskellige behov. På hjemmesiden har man muligheden for gratis maskinoversættelse, som er tilgængelig for alle som vil have oversat en tekst. Man har også muligheden for at få en professionel oversættelse, dette kræver at man opretter en konto på siden og derefter kan man få et tilbud på den oversættelsesopgave man ønsker udført. Ifølge SDL så har hjemmesiden omkring 3 millioner besøgende om måneden. Bag oversættelsesværktøjet står SDL, som er en af de førende firmaer indenfor maskinoversættelse, da de både tilbyder værktøjer som ovenstående og det professionelle værktøj SDL Trados Studio 2 og andre værktøjer til brug indenfor maskinoversættelse. Tjenesten tilbyder maskinoversættelse indenfor minimum 26 sprog og SDL anvender den statistiske maskinoversættelsestilgang til automatiseret oversættelsesteknologi. Oversættelsestjenesten findes også som en gratis applikation til smartphones, ligesom Google Oversæt. 2 SDL Trados Studio er et professionelt maskinoversættelseværktøj.

Camilla Antonsen Cand.ling.merc. engelsk Side 13 af 62 3. Teori 3.1 Skopos I dette speciale vil skoposteorien blive brugt til, at henlede opmærksomheden på at det ikke handler om at maskinoversættelse producerer perfekte tekster. Det handler mere om hvad læseren af en maskinoversættelse skal bruge oversættelsen til. Det formodes, at en læser har et formål med at læse en maskinoveroversat tekst, og det vil givetvis være for at kunne forstå den tekst, som læseren ikke tidligere forstod. Det betyder, at der er en forventning til hvor meget en læser i givet fald vil forstå af en maskinoversættelse. I det følgende en beskrivelse af skoposteorien. Skoposteorien er skabt af Hans J. Vermeer i 70 erne i Tyskland og den bliver set som et analytisk redskab i forbindelse med oversættelsesvidenskaben. Det overordnede princip i skoposteorien er at bestemme hvilket formål en oversættelse har. (Nord 1997:27). Der kan altid findes en begrundelse for en oversættelseshandling i forhold til slutresultatet. Teorien skal hjælpe med at udvide og forbedre en oversætters praktiske færdigheder. Skoposteorien har fokus på funktionalitet og viser at der er andre metoder til oversættelse end kildesprogsorienteret oversættelse. Vermeer var selv fortaler for den målsprogsorienterede oversættelse, men det er ikke ideen med skoposteorien. Ideen er derimod at pointere at en tekst kan oversættes på flere forskellige måder og at det er skoposet, som angiver på hvilken måde en tekst skal oversættes. De overordnede pointer af skoposteorien er (Schjoldager 2008:153): At skoposteorien angiver specifikt hvad en oversætter ved intuitivt. Det indebærer at læsers oversættelsesbehov bliver dækket. At skoposteorien tvinger oversættere til at se på oversættelse ud fra et bredere, mindre sprogorienteret perspektiv og giver oversætterne flere muligheder. Dette indebærer et større fokus på overførsel af budskab og mindre fokus på direkte oversættelse. At skoposteorien understreger at professionel oversættelse bør fortages af ansvarlige eksperter, fremfor en person som kan to sprog. Dette højner professionalismen indenfor oversættelsesdisciplinen. Selve ordet skopos er af græsk oprindelse og betyder formål, hensigt, målsætning eller funktion. (Schjoldager 2008:154) Vermeer bruger skopos til at henvise til formålet med målteksten. Men han bruger yderligere termerne målsætning, formål, intention og funktion som en del af dette. (Nord 1997:28) Målsætning referer til hvad en læser opnår. Formålet ses som trinet før målsætning, det vil sige at formålet et en del af at opnå en målsætning. Funktion henviser til brugen af en tekst fra læserens synspunkt, om en given tekst så giver mening og bliver forstået den. Forståelse afhænger af flere aspekter, bl.a. læserens forventninger, behov, eksisterende viden og situationen. Intention henviser til den måde som en oversættelseshandling udføres på, og det er fra forfatterens synspunkt så en tekst videregiver det budskab som var intenderet. (Nord 1997:28) En tekst er produceret til et givent formål og skal søge at opnå dette formål. Så ifølge skopos, så skal der oversættes på en sådan måde, som gør at funktionen af en oversættelse passer til en given situation og til læseren, så oversættelsen kan bruges til præcist det der er formålet. (Nord 1997:29) Det vil sige at skopos kan bruges i forskellige meninger, fx til at beskrive formålene med både kilde- og målteksten,

Camilla Antonsen Cand.ling.merc. engelsk Side 14 af 62 formålet med oversættelsesprocessen eller formålet med målteksten. Og det er den sidste betydning som vil blive brugt i dette speciale. For at illustrere at skopos er et vigtigt element i oversættelsesprocessen, er der et vist hierarki i den måde som oversættere går til en oversættelse på. Dette hierarki af regler indeholder tre trin 3 : 1. Skoposreglen, 2. Reglen om kohærens 3. Nøjagtighedsreglen (Schjoldager 2008:154). 1. Skoposreglen: Dette er hjørnestenen indenfor skoposteorien. Skoposteorien siger at en oversætter skal forsøge at skabe en måltekst som tjener et givent formål i en hvilken som helst kommunikationssituation. Det er værd at nævne at en given oversættelse kan have mere end et skopos. 2. Reglen om kohærens: Dette element kommer efter skoposreglen. Det siger at en oversætter skal forsøge at skabe en oversættelse som er tilstrækkelig kohærent, med andre ord forståelig, for at den giver mening i den givne kommunikationssituation. 3. Nøjagtighedsreglen: Dette aspekt kommer efter både skoposreglen og reglen om kohærens. Den siger at en oversætter skal forsøge at skabe en måltekst som har en acceptabel lighed med kildeteksten, men som ikke specificer hvilken type relation. Hvad der ses som et acceptabelt kildetekst/måltekst forhold bestemmes af skoposet. 3.2 Efterredigeringsteorier Dette speciale arbejder som tidligere nævnt ikke med efterredigering. Formålet med dette speciale er, at se på kvaliteten af en maskinoversættelse. Efterredigeringsteorierne er dog relevante at undersøge, da de er oplagte at basere min egen analysemodel på. Min analyse model vil blive præsenteret i kapitel 4. Efterredigeringsteorierne kigger på hvilke elementer, som har brug for at blive rettet, for at en tekst kan ses som korrekt. Så i forbindelse med at vurdere kvalitet, så kunne en lignende opstilling med udvalgte kriterier være brugbar for mig. De følgende teorier der vil blive gennemgået er Mossops efterredigeringsparametre (Mossop 2014:134) Analytisk fejlkategorisering, som er en fremgangsmåde fra O brien (2014) og til sidst TAUS som er direkte opstillet til brug i maskinoversættelse. 3.2.1 Mossop The Revision Parameters Efterredigeringsparametre 4 (Mossop 2014:134): Gruppe A - Problemer med overførsel af mening (Overførsel) 1. Gengiver oversættelsen kildetekstens budskab? (Nøjagtighed) 2. Er der elementer af budskabet der er udeladt? (Fuldstændighed) 1. Nøjagtighed (Mossop 2014:135-137) er en af de mest vigtige faktorer indenfor oversættelse. Det kan siges, at den første opgave for en oversætter er, at sikre, at en oversættelse overordnet gengiver kildetekstens budskab. Dette kan bl.a. sikres ved at der ikke er fejloversættelser, som kan føre til misforståelser. Nøjagtighed er ikke begrænset til ord, fraser eller sætninger, men derimod henviser nøjagtighed specifikt til gengivelsen af den overordnede struktur af budskabet, dvs. at målteksten gengiver kildetekstens argumenter i 3 Min oversættelse. 4 Min oversættelse af termer som er angivet i modellen.

Camilla Antonsen Cand.ling.merc. engelsk Side 15 af 62 den rette rækkefølge. Det handler ikke i så høj grad om ordvalg eller sætningsstrukturer, som minder om kildetekstens, men mere om overførselen af tekstens budskab. Så intentionen for nøjagtighed er ikke en så nøjagtig oversættelse som muligt, men mere en så nøjagtig oversættelse som nødvendigt. Og dette afhænger af genre og tekstens formål. 2. Oversættere forventes at gengive buskabet og kun budskabet af en kildetekst. En læser kan vælge at ignorere en svær passage i en tekst, men det kan en oversætter ikke. De må forsøge at komme op med en fortolkning af ethvert udtryk. Dette er hvad fuldstændighed (Mossop 2014:137-140) indebærer. En af de mest almindelige fejl indenfor fuldstændighed er utilsigtede udeladelser, men tilføjelser er også et aspekt som skal tages i betragtning her. Enkelte mindre udeladelser eller tilføjelser kan ikke undgås, bl.a. pga. kulturelle eller tekniske elementer, som evt. behøver en forklaring. Det skal også bemærkes at fuldstændighed handler om overførslen af kildetekstens budskab og mindre om den specifikke ordlyd af oversættelsen. Gruppe B Problemer med indhold (Indhold) 3. Giver sekvensen mening? Findes der nonsens eller modsigelser? (Logik) 4. Findes der faktuelle, begrebsmæssige eller matematiske fejl? (Fakta) 3. Da en oversættelse fremkommer måske med ideer, som oversætteren finder fjollet eller ligegyldig, så skal en oversættelse ikke indeholde sludder, modsigelser sætninger imellem eller logiske fejl. Logik (Mossop 2014:140-141) er delt op i to kategorier: Den første omhandler at kildeteksten ikke er logisk og oversætter gør ikke noget ved det. Den anden er at kildeteksten giver mening, men oversætteren har introduceret nonsens eller modsigelser. Det må formodes at det er en forfatters intention at skrive en tekst der giver mening. Men hvis kildeteksten ikke er logisk, kan oversætteren vælge ikke at gøre noget ved det. I nogle tilfælde kan konteksten evt. vise den intenderede mening ellers er det op til læseren at dømme hvad meningen er. I det tilfælde at kildeteksten giver mening, men oversætteren har introduceret nonsens eller modsigelser, er ofte en konsekvens af at oversætteren ikke har haft tilstrækkelig viden om kildesproget. 4. Fakta (Mossop 2014:141-142) omhandler den information en oversættelse indeholder, fx faktuelle, konceptuelle, begrebsmæssige eller matematiske aspekter, og disse skal selvfølgelige være korrekte. Disse informationer bærer en kommunikativ vigtighed og hvis de ikke er korrekte vil de blive set med det samme af læseren. Gruppe C Problemer med sprog og stil (Sprog) 5. Giver teksten mening? Er der forbindelsen mellem sætningerne tydelig? Er forholdet mellem sætningsdelene klar? Findes der nogle akavede eller ulæselige sætninger? (Klarhed) 6. Er sproget tilpasset målgruppen af oversættelsen og det målgruppen skal bruge oversættelsen til? (Tilpassethed) 7. Er stilen tilpasset genren? Er der brugt korrekt terminologi? Passer ordvalget til den brugt i kildetekster af samme emne? (Specialiseret sprog) 8. Er ordkombinationerne idiomatiske? Overholder oversættelsen målsprogets retoriske præferencer? (Formsprog) 9.Er reglerne for grammatik, retstavning, tegnsætning, præsentation og korrekt brug overholdt? (Sprog)

Camilla Antonsen Cand.ling.merc. engelsk Side 16 af 62 5. Klarhed (Mossop 2014:142-143) falder under kategorien stil og er medvirkende til hvor let en tekst er at læse. Forståelsen af en tekst skulle gerne opnås ved første gennemlæsning. Hvis den ikke gør det, så er der ofte problemer med sætningsstrukturer eller sammenhængen mellem sætningerne. Eksempler på dette kan være en for direkte oversættelse, som imiterer kildetekstens sætningsstrukturer, forkert brug af forbindelsesord eller for direkte overførte kildesprogsudtryk. 6. En oversættelse er nødt til at være tilpasset til dem der skal læse den og til det læseren skal bruge oversættelsen til. Tilpassethed (Mossop 2014:143-144) indebærer derfor at en oversættelse har det rigtige sprogniveau, dvs. den rette formalitet, den rette teknikalitet og den rette tone. Sproget skal også være tilpasset til målgruppen af oversættelsen, her skal læserens viden om det givne emne tages i betragtning. 7. Enhver genre og fagsprog trækker på forskellige leksikalske, syntaktiske og retoriske strukturer alt efter sprog. Specialiseret sprog (Mossop 2014:144-145) indebærer derfor at sørge for at fagspecifik terminologi er korrekt. Derudover indebærer det også at sørge for at autentiske formuleringer, hvis det er nødvendig for oversættelsen. 8. Ethvert sprog indeholder et fast sæt grammatiske regler for hvordan et sprog fremstår. Der findes grammatiske muligheder for hvordan ord kan kombineres. Hvis der opstår uidiomatiske ordkombinationer vil det irritere en læser som læser en tekst på sit modersmål. Det er hvad punktet formsprog (Mossop 2014:145-147) omhandler. Dette er især relevant i forbindelse med oversættelse, fordi en oversætter vil være inspireret af kildeteksten og dermed er faren at opfinde ordkombinationer og fraser som ikke findes, men som forstås og kan give mening. Og her er udfordringen for oversætteren at vide hvilke kombinationer der findes og ikke findes 9. Sprog (Mossop 2014:147-148) indebærer udover at sørge for at undgå fejl i grammatikken, retstavningen og tegnsætningen, så gælder det også om at efterligne den præsentation som kildeteksten har. Præsentationen kan være ganske specifikt angivet. Gruppe D Problemer relateret til det visuelle (Præsentation) 10. Er der problemer med måden hvorpå teksten fremstår på en side: mellemrum, indrykning, margen, etc.? (Layout) 11.Er der problemer relateret til fed skrift, understregning, skrifttype, skriftstørrelse, etc.? (Typografi) 12. Er der problemer med måden hvorpå hele dokumentet er organiseret: sidetal, overskrifter, indholdsfortegnelse, etc.? (Organisation) 10. Layout (Mossop 2014:148) indebærer at sørge for at oversættelsen fremstår letlæselig og at layoutet er konsekvent hele vejen igennem. Dette er vigtigt hvis både kildeteksten og oversættelsen er tilgængelig for læseren, så skal de to tekster helst ligne hinanden så meget som muligt. Ellers kunne læseren tro der mangler noget, hvis den en er synligt kortere end den anden.

Camilla Antonsen Cand.ling.merc. engelsk Side 17 af 62 11. Typografi (Mossop 2014:148) indebærer at sørge for der er konsekvens og at der ikke er brugt for mange typografiske indstillinger. Det indebærer også at sørge for at de specifikke typografiske indstillinger der er brugt i kildeteksten også er brugt i målteksten, fx understregninger eller at alle overskrifter er ens. 12. Organisationen (Mossop 2014:149) af en tekst er med til at gøre det lettere for læseren at navigere rundt i en længere tekst. Dette kan bl.a. være at sidetallene passer med indholdsfortegnelsen og at alle referencer passer. Det skal bemærkes at Mossops liste er til inspiration og dermed hverken er fuldstændig eller en der skal følges til punkt og prikke når der efterredigeres. Til mit formål er gruppe A og B mest brugbare i forhold til at vurdere kvaliteten af maskinoversættelse. Selv om der ikke gåes efter perfektion så er aspekter som fuldstændighed og nøjagtighed relevante. Hvorimod gruppe C kunne være interessant i forbindelse med vurderingen af hvilke fejltyper der opstår i maskinoversættelse. 3.2.2 O brien Når det skal vurderes hvad der skal efterredigeres, så indeholder sammenhængen mellem oversættelseskvalitet og strukturelle oversættelsesspecifikationer. Oversættelseskvalitet bygger på nøjagtighed og elegant udtryksevne. Disse er elementer, som er nødvendig for læseren, formål osv.. Hvad der tæller når man vurderer oversættelseskvalitet er om tekstens formål kan udføres, fx ved maskinoversættelse af en teknisk reparationsmanual, så skulle læseren kunne reparer maskinen med udgangspunkt i teksten, selv om der er grammatiske fejl eller problemer men retstavningen. Dette betyder at kan være brugbar selvom den ikke er pæn sprogligt set. Dette kan beskrives som en specifikation omhandlende funktionalitet. En anden specifikation går på pænhed, det vil sige at der er tekster, hvor selv mindre grammatiske fejl vil skæmme en tekst, selvom læseren ville kunne forstå teksten, fx en virksomheds årsrapport. I forbindelse med kvalitet af en oversættelse handler det derfor om at imødekomme de specifikationer som teksten byder, i stedet for at opnå hvad der kaldes en idel oversættelse, som er et abstrakt fænomen. Så hvordan man vurderer oversættelseskvalitet afhænger af aspekter som modtager, teksttype osv.. Analytisk fejlkategoriseringsfremgangsmåde 5 : 5 Min oversættelse Nøjagtighed Terminologi Fejloversættelser Udeladelser Tilføjelser Ikke oversatte elementer Elegant udtryksevne (Indhold) Register Stil Uoverensstemmelse (Sprog)

Camilla Antonsen Cand.ling.merc. engelsk Side 18 af 62 Principper Retstavning Typografi Grammatik Lokale overtrædelser Ulæselighed Fuldstændighed Lovkrav Lokal anvendelighed (O brien 2014:288-289) Ovenstående er en metode som fokuser på oversættelsesproduktet, det vil sige målteksten og bygger på de allerede nævnte specifikationer for oversættelseskvalitet. (O brian 2014:288) Det er mest naturligt at en oversætter vælger hvilke issues som anses for at være kerneværdierne for en oversættelse. Det er ikke alle der vil blive taget i brug ved en vurdering af en oversættelse, men i stedet foretager en vurdering af hvilker der er relevante for det givne formål af oversættelsen. (O brian 2014:289) Fx hvis man skal vurdere en oversættelse som skal gengive de overordnede budskab, så er det måske kun fejloversættelser, ikke- oversatte elementer og ulæselighed som tages i betragtning. I forhold til min analysemodel, så er det jeg kan tage med herfra at specialisere min analysemodel. Det vil sige at jeg kun medtager de kategorier som er relevante for mit formål. 3.2.3 TAUS Taus er en tænketank og et ressourcecenter for international oversættelsesteknologi. De har opsat en række retningslinjer for efterredigering 6. Målet med disse retningslinjer er at skabe en grundlæggende forudsætning for efterredigering af maskinoversættelse, dvs. at de ikke er fuldstændige, men der kan bygges på alt efter behov. De er opsat med tanke på efterredigering af oversættelse mellem to sprog. De har delt retningslinjerne op i to kategorier: Retningslinjer for at opnå en "god nok" kvalitet og retningslinjer for opnåelse af en kvalitet der ligner eller er lig med menneskelig oversættelse. Disse vil blive beskrevet i de nedenstående. Retningslinjer for at opnå en "god nok" kvalitet: "Godt nok" kan defineres som forståeligt (dvs. at hovedindholdet af meddelelsen forstås), nøjagtig (dvs. den gengiver betydningen af kildeteksten), men ikke med den samme stilistiske overbevisning. Teksten kan virke som var den genereret af en computer, syntaksen kan være en anelse usædvanlig, grammatik er ikke perfekt, men budskabet er korrekt. Målet er en semantisk korrekt oversættelse. Sørge for, at ingen oplysninger er blevet tilføjet eller udeladt. Rediger anstødeligt, upassende eller kulturelt uacceptabelt indhold. Brug så meget af den rå maskinoversættelse som muligt. Almindelige regler for retstavning gælder. Ingen grund to udføre korrektioner, som kun er af en stilistisk natur. Ingen grund to på omstrukturere sætninger for at forbedre tekstens naturlige forløb. 6 https://www.taus.net/think- tank/best- practices/postedit- best- practices/machine- translation- post- editing- guidelines

Camilla Antonsen Cand.ling.merc. engelsk Side 19 af 62 Retningslinjer for opnåelse af en kvalitet der ligner eller er lig med menneskelig oversættelse: Dette niveau af kvalitet er generelt defineret som værende forståeligt (dvs. en slutbruger perfekt forstår indholdet af meddelelsen), nøjagtig (dvs. kommunikerer den samme betydning som kildeteksten), stilistisk fint, selvom stilen er måske ikke så god som der opnås ved en indfødt menneskelig oversætter. Syntaks er normal, grammatik og tegnsætning er korrekte. Målet er en grammatisk, syntaktisk og semantisk korrekt oversættelse. Sørg for, at centrale terminologi er oversat korrekt. Sørg for, at ingen oplysninger er blevet tilføjet eller udeladt. Rediger anstødeligt, upassende eller kulturelt uacceptabelt indhold. Brug så meget af den rå maskinoversættelse som muligt. Grundlæggende regler for stavning, tegnsætning og orddeling anvendes. Sørg for, at formateringen er korrekt. I forhold til mit brug så kunne disse retningslinjer være inspiration til at identificere hvilke typer af fejl en maskinoversættelse laver. I den forbindelse er retningslinjerne for god nok kvalitet mest interessant. 3.3 Sproglige aspekter Når der kigges på en tekst med udgangspunkt i et vurderingssynspunkt er der flere aspekter der er relevante. (Mossop 2014:42) Når en tekst gennemgås er der regler som skal følges for at en tekst ses som korrekt, fx de grammatiske regler et sprog er underlagt. Dette betyder at der skal lægges vægt på detaljen, det vil sige, at det er skal gennemgås sætning for sætning. Ved gennemgangen af en tekst kan det også i nogle tilfælde være relevant at se på de typografiske elementer og layoutet. Der kan være et opsat instruktion (fra den der har bestilt oversættelsen) for hvordan visse elementer skal udføres. Følgende kategorier vil blive taget i betragtning: retstavning og typografiske fejl, syntaks og idiom, tegnsætning og sprogbrug. 3.3.1 Retstavning Hvorfor er det, at korrekt retstavning er vigtig? (Mossop 2014:44-45) Det er en lære, som er med os fra vi lærer at læse og skrive og det er måske et aspekt som ikke har givet grund til at tænke nærmere over. Men det er vigtigt, fordi stavefejl påvirker læserens indtryk af teksten og det er gerne i en negativ retning. I værste fald kan det betyde at læseren ikke tror på hvad der står. Stavefejl er derudover også distraherende og gør en tekst sværere at læse. Ydermere så kan slåfejl betyde noget for meningen, så læseren misforstår teksten. Nu om dage er vi hjulpet af diverse muligheder for stavekontrol, men man skal også selv være på vagt især når det kommer til fx navne, regionale forskelle i stavning eller kontekst. 3.3.2 Syntaks og idiom Hvis en tekst er skrevet af en indfødt sprogbruger og ikke er en oversættelse, så er chancen, at teksten er forholdsvis idiomatisk og syntaktisk korrekt. (Mossop 2014:45-49) Der kan være nogle undtagelser, såsom at forfatteren skriver om et emne, som vedkomne ikke ved så meget om. En anden undtagelse er, at der er elementer som bliver overset, fx et manglende eller tilføjet ord, cut- and- paste har gjort at dele af en sætning er blevet flyttet eller der er flere verballed, (fx at forfatteren har glemt at slette et eller ændret mening undervejes om hvordan sætningen skal konstrueres). Et aspekt der også skal tages i betragtning her er kongruens,

Camilla Antonsen Cand.ling.merc. engelsk Side 20 af 62 fordi det kan give forvirring, men det er ikke altid direkte meningsforvirrende. Endelig så er der en tendens indenfor oversættelse, hvor det er muligt at komme til at konstruere ugrammatiske og uidiomatiske sætninger, fordi man lader sig inspirere lidt for meget af kildeteksten. Syntaks og idiom er noget der er i evig forandring, så hvad tidligere er blevet set som en fejl, muligvis ikke antages som en fejl længere. Syntaks og idiom kan også varierer fra person til person, hvad der føles naturligt for en person, gør det måske ikke for en anden person, men det gør det ikke nødvendigvis forkert. Hvad der er acceptabelt kan også variere alt efter genre. 3.3.3 Tegnsætning På den ene side så indebærer tegnsætning de genkendelige markører, som komma, punktum, spørgsmålstegn osv. Men på den anden side indebærer tegnsætning også flere andre markører som er med til at guide læseren. (Mossop 2014:49-52) Det være sig stort begyndelsesbogstav i begyndelsen af en sætning, ligneafstand og mellemrum mellem afsnit. En af udfordringerne med hensyn til tegnsætning er, at der ikke findes nogle ligeså fastsatte regler for hvordan det er, i forhold til fx retstavning. Det handler om hvilke man personligt fortrækker, fx Oxford komma. Der er dog visse ufravigelige regler, såsom stort begyndelsesbogstav efter punktum og så videre. Især når det kommer til kommaet, er der mange variationer. Nogle bruger mange kommaer, andre bruger kun få. Andre bruger komma til at indikere talefunktioner, såsom pauser og betoning eller markering af visse syntaktiske strukturer. 3.3.4 Sprogbrug Ved vurderingen af en tekst er det tit ubestemmelige elementer som korrekt grammatik og korrekt sprogbrug som er i spil. Disse elementer kan ikke uden videre klassificeres og opstilles i et regelsæt. Disse elementer er i modsætning til fx syntaks og idiom, hvor det handler om, at teksten er i overensstemmelse med de principper et sprog foreskriver. Dette er også elementer, hvor en fejl umiddelbart kan genkendes. Der er ikke nogen tvivl om dem, men det kan der derimod være i forbindelse med sprogbrug. Hvad der ses som en fejl, er det muligvis ikke. Sagt på en anden måde, så der er forskellige personlige meninger om hvad der er korrekt. Et eksempel kunne være distinktionen mellem om det er korrekt at sige: it s me eller it s I Her er der også geografiske forskelle, fx i udtale eller en generationsforskel, hvor et ords betydning ændres i større eller mindre grad over tid. Dette er en del af en proces, hvor visse elementer accepteres og andre afvises. I en skrevne sprog er der brug for en høj grad af standardisering, så en tekst kan læses og forstås. Om buskabet er blevet succesfuldt kommunikeret er hvad det handler om i sidste ende, det vil sige, at en tekst kan læses og forstås og der er ikke noget som kan misforstås. Der kan også være et for stramt syn på hvad der ses som korrekt og at der derfor ændres for meget. (Mossop 2014:55). Dette skaber ikke kun fejl, men kan også hindre effektiv kommunikation, fx ved at reducere en forfatters semantiske muligheder. Selv små rettelser kan ændre hvad forfatteren forsøgte at kommunikere. Så det gælder om at udvide sin horisont og at forsøge ikke at følge de fastlagte rigide regler blindt, fordi det siger de grammatiske regler. Det er måske mere givtigt at se nærmere på hvad det passer på den kommunikative situation. Der er flere og flere forfattere, som skriver på engelsk og som ikke har det som deres modersmål. Dette betyder at disse forfattere ikke har en fastgroet mening i debatten om hvad der er korrekt sprogbrug, de er derimod mere fokuserede på hvad der er mest effektivt i