La anotación del gerundio en treebanks



Relaterede dokumenter
RESUME TRANSLATION MEMORY-SYSTEMER SOM VÆRKTØJ TIL JURIDISK OVERSÆTTELSE. KRITISK VURDERING AF ANVENDELIGHEDEN AF TRANSLATION MEMORY-SYSTEMER TIL

Opdateringer til førsteudgaven for Claus Drengsted-Nielsen: Grammatik på dansk

DE FARLIGE STOFFER FINDES OVERALT

Formålet med undervisning fra mediateket er at styrke elevernes informationskompetence, således de bliver i stand til:

Tips og vejledning vedrørende den tredelte prøve i AT, Nakskov Gymnasium og HF

Modalverbernes infinitiv

ICI3140 Métodos Numéricos. Profesor : Dr. Héctor Allende-Cid

JO HERMANN. Latinsk grammatik. på dansk. Akademisk Forlag

Aalborg Katedralskole Masterplan for grundforløb i almen sprogforståelse

NB: Tilmeldingen til valgfaget gælder for 5. og 6. semester

Fremstillingsformer i historie

Lynkursus i analyse. Vejledning - vi tilbyder individuel vejledning i skriftlig akademisk fremstilling.

Om grammatikken. 1. Grammatikkens opbygning

Vidensbegreber vidensproduktion dokumentation, der er målrettet mod at frembringer viden

Kapitel 18 Verbets modus

Spansk A. Studentereksamen. Onsdag den 25. maj 2016 kl

ALMEN GRAMMATIK 1. INDLEDNING. At terpe eller at forstå?

Bente Skov. Castellano. Spansk grammatik. Haase & Søns Forlag

Studieretningsprojektet i 3.g 2007

AT og Synopsisprøve Nørre Gymnasium

Kompetenceområdet fremstilling. Mandag den 3. august 2015

Lita Lundquist: Oversættelse. Problemer og strategier, set i tekstlingvistisk og pragmatisk perspektiv. Gylling: Samfundslitteratur, 1997 (2. udg.

Faglig læsning i matematik

Det Rene Videnregnskab

Gruppeopgave kvalitative metoder

Eksamenskatalog - Prøveformer og bedømmelsesgrundlag

AT UNDERVISE I MATEMATIK PÅ ET FREMMESPROG 1

Danske tegnsprogsordbøger En oversigt over eksisterende ordbøger over dansk tegnsprog, sammenholdt med projektet Ordbog over Dansk Tegnsprog.

Han overfører altså dele fra en brugt ytring, og bruger dem i sine egne sætningskonstruktioner dog ikke grammatisk korrekt.

Indholdsfortegnelse. Hvad er tekstlingvistik og funktionel grammatik? 2. De fire tekstkriterier 3. Strukturen i kapitlerne 4. Sproglig vejledning 6

Elevmanual til SRP. Elevmanual til studieretningsprojektet

Evaluering af skriftlig eksamen i latin maj/juni 2013

Det centrale emne er mennesket og dets frembringelse Humaniora:

Dansk-historieopgaven (DHO) skrivevejledning

Spansk 2 Begyndere/let øvet

Auto Illustrator Digital æstetik: Analyse Skriveøvelse 1

Undervisningsbeskrivelse for: 915e Sp 1308

Forslag til opgavestruktur, typografi og layout

Et oplæg til dokumentation og evaluering

LÆSNING OG SKRIVNING I MATEMATIK

Almen sprogforståelse

FRI s høringskommentarer til Udbudsopmålingsregler

Semantikopgave Ved Tobias Scavenius

Hvad sker der med sin i moderne dansk og hvorfor sker det? Af Torben Juel Jensen

Forsøgslæreplan for græsk A - stx, marts 2014

Basale hjælpemidler til løsning af skriftlige afleveringer/ årsprøve/ terminsprøve og eksamen:

Teksten i grammatikken

literære værker på engelsk. At dømme på disse literære værker beherskede Joseph Conrad engelsk morfosyntaks og leksikon på et niveau der er

Mål med faget: At gøre jer klar til eksamen, der er en mundtlig prøve på baggrund af et langt projekt

bab.la Fraser: Personlig hilsen Spansk-Dansk

Forudsætninger for at lære sprog

Visioner, missioner og værdigrundlag i de 50 største virksomheder i Danmark

Christianshavns Gymnasium Studieretningsopgaven i 2.g (SRO) januar- marts 2014 VEJLEDNING

Et sprogtypologisk blik på alverdens sprog

Niels Egelund (red.) Skolestart

Bilag 7. avu-bekendtgørelsen, august Dansk, niveau D. 1. Identitet og formål

1. Arbejd to og to og spørge hinanden som i eksemplet. 2. Ordne billederne og fortæl historien:

Indledende bemærkninger

1 Indledning Lingvistisk baggrund Lingvistikkens grundtanke Sprogets udvikling... 11

Patientperspektivet på læge-patientrelationen i almen praksis. med særligt fokus på interpersonel kontinuitet

Sammenligning af fagsproglige tekstsortkonventioner - et ph.d.- arbejde

Guldbog Kemi C Copyright 2016 af Mira Backes og Christian Bøgelund.

Projektskrivning - tips og tricks til projektskrivning

LEKTION 2 HILSEN OG PRÆSENTATION. Øv dig på disse ord og vendinger og lyt til cd en og gentag! Hej... Hola

Opgaver hørende til undervisningsmateriale om Herons formel

Synlig Læring i Gentofte Kommune

1) Til en praktik prøve. 2) Aflevere Synopsis Som er starten på dit afsluttende eksamensprojekt.

AT MED INNOVATION ELEVMANUAL

Retningslinjer for manuskripter til Dansk Tidsskrift for Teologi og Kirke

OPGAVE 1 Læs om talord i Gramática de uso básica Svar på følgende spørgsmål:

Kursistmanual til Større skriftlig opgave. 2 Hf,

Aalborg Katedralskole Masterplan for grundforløb i almen sprogforståelse

Kort gennemgang af Samfundsfaglig-, Naturvidenskabeligog

Bilag til AT-håndbog 2010/2011

En dialogisk undervisningsmodel

Indholdsfortegnelse. DUEK vejledning og vejleder Vejledning af unge på efterskole

Bilag til den indsigelse, som sommerhusgrundejerforeningerne på Samsø har fremsendt til Skov- og Naturstyrelsen den 27. april 2012.

FIP spansk marts 2018

Rapport vedrørende. etniske minoriteter i Vestre Fængsel. Januar 2007

Overordnet set kan man inddele matematikholdige tekster i to kategorier tekster i matematiksammenhænge og tekster i andre sammenhænge.

Mater Thesis Preparation (TI-MTP) Den gode opgave kap

Nye tiltag i grammatikundervisningen

M-government i Silkeborg Kommune

Dansk-historie-opgave 1.g

Opdateringer til førsteudgaven for Claus Drengsted-Nielsen: Grammatik på dansk

Faglig læsning i skolens humanistiske fag. Indhold. Den humanistiske fagrække i grundskolen. Temadag om faglig læsning, Aalborg 2012

SRP Retningslinjer for studieretningsprojekter ved Holstebro Tekniske Gymnasium

Hjælp til jobsøgningen

1) Status på din kompetenceudvikling i forhold til uddannelsens krav, forventninger, muligheder, rammer m.m.

Fra skoleåret 2016/17 indføres en praktisk-mundtlig fælles prøve i fysik/kemi, biologi og geografi.

Islandsk i officiel teori og individuel praksis

Kapitel FORMÅL Kapitel Kapitel INDHOLD Kapitel UNDERVISNINGSFORMER Kapitel EKSAMEN...

Vejledning til tysk skriftlig fremstilling med adgang til internettet Styrelsen for Undervisning og Kvalitet November 2015

Prosodi i ledsætninger

Ordliste over anvendt fagterminologi

Forberedelsesskema til SUS, 9. semester samt konklusionspunkt (se nederst i skemaet)

REGELMÆSSIGE VERBER: AR VERBER. 1. Glosestorm. Skriv 3 gloser til hvert verbum. Lær dem udenad!

NOTAT: LEDIGHEDSBEGREBET VED DIMENSIONERINGEN AF ANTROPOLOGI ANALYSE OG TAL

Evalueringsresultatet af danskfaget på Ahi Internationale Skole. ( ) Det talte sprog.

Silvia Becerra Bascuñán Sigrid Østergaard Julie Højgaard

Transkript:

Annotation af gerundium i træbanker La anotación del gerundio en treebanks Kandidatafhandling, cand.ling.merc.: spansk Udfærdiget af: Søren Mejer Jensen og Jonas Deleurang Mortensen Vejleder: Henrik Høeg Müller Copenhagen Business School Maj 2009

Resumen La anotación del gerundio en treebanks Esta tesina trata de la anotación del gerundio en treebanks. Durante el trabajo hemos elaborado una forma de ver las distintas funciones del gerundio en un texto para su anotación. Los ejemplos etiquetados en el estudio son efectuados a base de 475 ejemplos de frases que contienen el gerundio y han sido encontrados tanto en todo tipo de literatura como en páginas Web de periódicos, organizaciones y empresas. Nuestra tesina tiene su punto de partida en nuestro trabajo como asistentes de investigación en Copenhagen Dependency Treebank Project. Hemos asistido a unos profesores en su trabajo para una anotación de textos españoles. Sin embargo, la norma para la anotación carece de categorías para algunas funciones del gerundio. El trabajo con la anotación de textos españoles ha llevado consigo una necesidad de saber cómo tratar la anotación del gerundio y un deseo de buscar categorías adecuadas para este, especialmente en cuanto a los sintagmas adverbiales con una función pragmática. En la tesina presentamos la siguiente pregunta principal: Cómo podemos anotar el gerundio en los sintagmas pragmáticos? Las preguntas secundarias son las siguientes: Qué es lo que distingue el sintagma de gerundio con una función pragmática de los otros? Cómo garantizamos la mejor base teórica para una categoría de dependencia? El objetivo es averiguar, cómo tratar el gerundio con respecto a una anotación sintáctica, semántica y pragmática. Para poder responder a las preguntas presentadas, nuestro estudio se basa en la teoría de Halliday sobre las tres relaciones: la elaboración, la extensión y la expansión y en sus ideas de que en cada texto hay tres funciones del lenguaje: la ideativa, la interpersonal y la textual. Tomando sus teorías como punto de partida, podemos distinguir entre los sintagmas de función semántica y los de función pragmática. A lo largo de la tesina vamos analizando la función del gerundio desde un punto de vista gramatical, clasificando después esta forma verbal con la relación de dependencia que tiene con el núcleo de la oración. Entre las funciones sintácticas del gerundio ponemos el

Resumen enfoque en la función adverbial. El gerundio lo dividimos en dos grupos según su función adverbial: la función semántica y la función pragmática. En esta tesina presentamos por lo tanto un análisis de las funciones del gerundio, tanto su función en la oración como su función en un sintagma nominal. Aparte de la clasificación del gerundio dentro de un sintagma nominal, clasificamos las relaciones de dependencias para el gerundio a nivel oracional en las siguientes funciones: Función como núcleo de la oración Construcción de perífrasis verbal Predicado al objeto directo Función adverbial, tanto semántica como pragmática Con la utilización de nuestro material como base teórica para el estudio, hemos podido distinguir entre la función semántica y pragmática del sintagma adverbial. La distinción tiene que ver con la cohesión entre el sintagma y el núcleo de la oración, lo que nos facilita clasificar y anotar el gerundio. La conclusión del estudio es una clasificación del gerundio en seis diferentes funciones y un total de 18 categorías para su anotación en treebanks. Teniendo en cuenta las posibilidades de elaborar nuevas categorías dentro del ámbito de la anotación, nuestras ideas podrán servir para futuras investigaciones sobre la anotación de textos españoles en treebanks. Estamos convencidos de que nuestro método también es aplicable en una elaboración de normas para una anotación de las otras formas verbales infinitas en español.

1 Indledning...3 1.1 Generelle problemstillinger for Copenhagen Dependency Treebank... 4 1.2 Dependensannotation... 5 1.3 G i et dependensanalytisk perspektiv... 7 1.4 Problemformulering... 8 1.5 Afgrænsning... 10 1.6 Afhandlingens mål... 11 2 Definitioner på pragmatiske adverbialer...12 2.1 Louise Denver (1987)... 12 2.2 Per Anker Jensen (1985)... 12 2.3 Michael Halliday (1994)... 13 2.4 Gramática Descriptiva (1999)... 14 3 Teoretisk grundlag...15 3.1Terminologi... 16 4 Empiri...22 5 Metode...23 5.1 Begrebsforklaring... 24 5.2 Metodisk gennemgang af analysens kapitler... 26 5.2.1 G er kerneled... 26 5.2.2 G i verbalperifraser... 26 5.2.3 G s funktion som objektsprædikativ... 27 5.2.4 G s funktion i syntagmer... 27 5.2.5 Adverbielle G-syntagmer... 27 5.2.5.1 Semantiske G-syntagmer... 30 5.2.5.2 Pragmatiske G-syntagmer... 31 5.3 Visuel oversigt over valgt metode... 31 6 Analyse...34 6.1 G som kerneled... 34 6.2 Verbalperifraser... 37 6.2.1 Undtagelse af den generelle regel... 41 6.2.2 Konstruktioner med samme struktur... 42 6.3 G som objektsprædikativ... 45 6.4 G på syntagmeniveau... 48 6.4.1 Prædikativ funktion... 50 6.4.2 Adverbiel funktion... 51 6.4.3 Adjektivisk funktion... 52 6. 5 G som sætningsadverbial... 55 6.5.1 Semantiske G-syntagmer... 62 6.5.1.1 Måde... 65 6.5.1.2 Instrument... 67 6.5.1.3 Betingelse/årsag/tid... 68 6.5.1.3.1 Betingelse... 69 6.5.1.3.2 Årsag... 71 6.5.1.3.3 Tid... 72 6.5.1.4 Indrømmelse... 74 1

6.5.1.5 Ledsagende omstændighed i tid... 76 6.5.1.5.1 Samme struktur med anden betydning... 79 6.5.2 Pragmatiske G-syntagmer... 83 6.5.2.1 G-syntagmer med pragmatisk kohæsion til sætningskernen... 88 6.5.2.2 G-syntagmer med pragmatisk og leksikalsk kohæsion til sætningskernen88 6.5.2.3 Karakteristik af det pragmatiske G-syntagme set ud fra et metafunktionelt perspektiv... 90 6.5.2.4 Annotation af de pragmatiske G-syntagmer... 92 7 Konklusion...97 7.1 Perspektivering... 98 8 Litteraturliste...101 8.1 Litteratur benyttet til korpusindsamling... 104 2

1 Indledning Formålet med denne kandidatafhandling er på baggrund af forskellige grammatikker og videnskabelige udlægninger at klassificere verbalformen gerundium i spansk på en sådan måde, at den kommer til at indgå i en enhedsteori om annotation af tekster i træbanker. Enhedsteorien er udviklet i forskningsprojektet Copenhagen Dependency Treebank Project på Handelshøjskolen i København, hvor vi har været ansatte som studentermedhjælpere. Baggrunden for Copenhagen Dependency Treebank Project (CDT) er, at udviklingen i træbanker (se afsnit 3.1 Terminologi) i dag er nået til et punkt, hvor der fokuseres på den underlæggende annotation i træbankerne i stedet for, som tidligere, en optimering af statistiske systemer eller mængden af tekstdata (Buch-Kromann, 2006). Formålet med CDT er, at det med udgangspunkt i ensartede grammatiske retningslinjer skal udvikle en bedre og mere fyldestgørende annotation af træbanker. CDT s mål er at udvikle og forbedre parallelle træbanker på dansk, engelsk, italiensk, spansk og tysk. Det er derfor vigtigt, at så mange sproglige fænomener som muligt samles i én samlet enhedsteori, der skal kunne bruges til annotation af tekstkorpora på de nævnte sprog. Projektet tager udgangspunkt i følgende: Et dansk annoteret korpus, Danish Dependency Treebank (DDT) En annotationsteori fremlagt i Discontinous Grammar (DG) og som er udviklet specielt til formålet af Buch-Kromann (Buch-Kromann, 2006). En annotationsguide, der opstiller retningslinjer og kriterier for dependensannotation af det danske sprog. Copenhagen Dependency Treebank Project er grundlæggende delt op i 3 delprojekter: 1. Første delprojekt fokuserer på udviklingen af en ensartet teori til annotation af tekster i forbindelse med konstruktionen af træbanker på engelsk, italiensk, spansk og tysk. Denne teori bygges på et kriterium om, at man ud fra de 3

annoterede tekster, via systemværktøjer og på hurtigst mulig vis, kan søge på specifikke sproglige fænomener. Enhedsteorien skal være et redskab til omfattende og detaljeret annotation af tekstkorpora, der inkorporerer så mange sproglige fænomener som muligt såsom syntaks, morfologi, semantik og pragmatik. CDT s enhedsteori skal gøre træbanken til en fyldestgørende ressource til datalingvistiske undersøgelser, og den skal være med til at udvikle bedre paralleltræbanker. 2. Ved hjælp af enhedsteorien i delprojekt 1, skal oversatte tekstkorpora på de ovennævnte sprog dependensannoteres og alligneres (se afsnit 3.1 Terminologi) med den danske kildetekst. Dette vil danne grundlag for konstruktionen af paralleltræbanker mellem dansk og det pågældende fremmedsprog. 3. Delprojekt 3 omhandler en udvikling af systemværktøjer, der skal forenkle annotationsarbejdet. Gennem statistiske parallelparsere er målet at kunne automatisere dette arbejde (Trautner Kromann, 2003). 1.1 Generelle problemstillinger for Copenhagen Dependency Treebank En af de problemstillinger CDT står over for, er udviklingen af paralleltræbanker, som skal omfatte dansk, engelsk, italiensk, spansk og tysk. På grund af de sprogtypologiske forskellige, der kan være mellem dansk og de ovennævnte sprog, er det uundgåeligt, at der i visse tilfælde bør laves nogle retningslinjer for annotation af elementer i fremmedsproget, som ikke eksisterer på dansk samt eventuelle kategorier, der ikke bruges i den danske træbank. I forbindelse med CDT-projektet har vi været ansatte som studentermedhjælpere, hvor vores arbejde i delprojekt 2 har været dependensannotation og alignering af de oversatte tekster. Som spanskstuderende har vores arbejdsområde været delt i to: En dependensannotation af det spanske korpus via annotationsprogrammet DTAG (se afsnit 3.1 Terminologi). 4

Alignering af den oversatte tekst med den danske udgangstekst (se afsnit 3.1 Terminologi) De tekster, der er blevet brugt til dependensannotationen, er spanske oversættelser af en del af den danske træbank, Danish Dependency Treebank (DDT) (se afsnit 3.1 Terminologi) Selve oversættelsesarbejdet fra spansk til dansk er på forhånd blevet udført af professionelle oversættere. De oversatte tekster udgør minikorpora på de pågældende sprog, som vi som studentermedhjælpere skal dependensannotere og allignere med den danske tekst. 1.2 Dependensannotation Som nævnt, er formålet med denne afhandling at klassificere det spanske gerundium, så det indgår i en enhedsteori om dependensannotation af tekster i træbanker. Dependensannotation betyder, at hvert enkelt ords relation til et andet i en tekst markeres, og det bygger på dependensgrammatikkens teorier om, at et ord i en sætning/sætningsemne selekterer tilstedeværelsen af et andet (Buch-Kromann, 2006 s.53). Ordene kan inddeles i to kategorier: Regent: det styrende ord Dependent: det styrede ord Regenten i sætningen vil vi også kalde for sætningens kerneled (se afsnit 5.1 Begrebsforklaring). I en finit sætning er det sætningens verbal, som er kerneled. Da et verbal kan bestå af verbalkæder med finitte og infinitter verber, kan vi præcisere yderligere og sige, at det er det finitte verbum i verbalet, der er sætningens egentlige kerneled. Det er med andre ord det finitte verbum, der selekterer tilstedeværelsen af resten af sætningens ord. Det vil sige at det finitte verbum i verbalet kun har funktion som regent, hvilket gør det til kerneleddet. Sætningens øvrige ord er enten dependenter og regenter eller udelukkende dependenter. 5

Denne dependent-regent-forbindelse bliver markeret i annotationsprogrammet DTAG, og det er denne markering, der kaldes for annotation. Annotationen af de to ords relation til hinanden markeres i DTAG med buede pile som går fra regenten til dependenten. Dette er illustreret i nedenstående danske eksempel: Som det fremgår af ovenstående eksempel er regenten det eneste ord i teksten, som ikke tilskrives nogen kategori. Dependenten tilskrives en dependenskategori afhængig af dens relation til kerneleddet. Hvis den er et valensled tilskrives den en syntaktisk relation. For eksempel får sætningens subjekt kategorien subj, direkte objekt dobj og præpositionsobjekt pobj. Nedenfor er vist et eksempel på en længere sætning der er blevet dependensannoteret i DTAG. Som det fremgår af ovenstående eksempel, så bliver sætningens adverbial ikke annoteret i henhold til dets syntaktiske relation til sætningskernen, men derimod til den semantiske. Adverbialet i går forankrer sætningskernen i tid og får derfor dependenskategorien time. Et adverbial kan for eksempel også modificere sætningskernen, hvortil den kan få kategorien cause, hvis det er en årsag, eller for eksempel cond, hvis det er en betingelse. Det er altså de engelske betegnelser, der ligger til grund for kategoriernes titler. Der vil yderligere blive redegjort for kategorierne i afhandlingens afsnit 3.1 Terminologi. De semantiske kategorier til adverbialerne er en videre udvikling af annotationsguiden, som 6

til at starte med udelukkende arbejdede med de syntaktiske relationer. De semantiske kategorier er blevet udviklet af CDT-projektets deltagere og er blevet brugt som et tillæg til annotationsguiden. Tillægget til annotationsguiden hedder Annotation af adverbialer (Buch-Kromann et al, 2008a), og vi kommer løbende til at referere til denne i afhandlingen. 1.3 G i et dependensanalytisk perspektiv Gerundium er en infinit verbalform, som ikke eksisterer på dansk. Selve formen er kendetegnet ved, at det er kernen i verbet med suffikset endo, iendo eller ando. Gerundium er i sig selv hypotaktisk. Det vil sige, at den underordner sætninger. Den benævnes også som verbaladverbial, da dens primære funktion er adverbiel. Derudover kan gerundium fungere som sætningsafløser, fordi den bl.a. som adverbial kan parafraseres til en ledsætning, hvor den optræder som finit verbum: - Puede localizar su Centro Hilti más cercano pulsando sobre el siguiente enlace: (Hilti.es, 10.10.08 1 ) - Puede localizar su Centro Hilti más cercano si pulsa sobre el siguiente enlace: - Siendo este un terrorismo internacional, la concienciación debe tener también un ámbito internacional [ ] (11M.es, 10.10.08 2 ) - Ya que/dado a que este es un terrorismo internacional, la concienciación debe tener también un ámbito internacional [ ] G kan altså i kraft af sin adverbielle betydning tildeles en semantisk kategori. Derudover har G et logisk subjekt som i de fleste tilfælde er identisk med sætningens syntaktiske subjekt. I visse tilfælde kan G s logiske subjekt være identisk med sætningens direkte objekt (se afsnit 6.3). G s logiske subjekt får tildelt dependenskategorien [subj]. Vi har i forbindelse med afhandlingens formål indsamlet en række teksteksempler med G, som vi har samlet i et eksempelkorpus. Disse er blevet benyttet til at undersøge G s 1 http://www.hilti.es/holes/modules/editorial/edit_singlepage.jsp?contentoid=130797 2 http://www.asociacion11m.org/ver_programa.php?id=5 7

funktioner i sætningen. Da der endnu ikke er lavet specifikke retningslinjer eller teorier for annotation af det spanske sprog, er vi som studentermedhjælpere stødt på en række problemer i forbindelse med annotation af spanske tekster. Vores arbejde i delprojekt 2 har dermed gjort, at vi er stødt på problemer, hvis løsning findes via nærmere studier af de enkelte sproglige fænomener. Dermed ligger denne afhandlings fokusområde i virkeligheden inden for delprojekt 1. 1.4 Problemformulering Det adverbielle G-syntagme kan, som nævnt, have en række semantiske relationer til sætningskernen og bliver annoteret i henhold til denne. Der opstår imidlertid en vis usikkerhed i bestemmelsen af den semantiske relation i forbindelse med de pragmatiske G-syntagmer. Vi er i forbindelse med oprettelsen af vores eksempelkorpus (K2) stødt på G-syntagmer som vi har haft problemer med at klassificere ud fra Annotation af adverbialer (Buch-Kromann et al, 2008a). Nedenfor har vi samlet et uddrag af sætningseksempler fra K2 med pragmatiske G-syntagmer: (1) Teniendo en cuenta los problemas del equipo en los últimos años, mucho del éxito de New York dependerá del rendimiento de Reyna. (ESPN deportes, 10.04.07 3 ) (2) Hablando de otros partidos, deportistas y actores deben apoyar públicamente a partidos políticos? (La Razón, 12.01.09 4 ) (3) Pero, volviendo a la cuestión terrenal, muchas veces se olvidan los parámetros básicos de la competencia en un sistema de mercado. (Cinco Días, 19.11.08 5 ) (4) Diciéndolo en términos sencillos, los elementos visuales situados en áreas de tensión tienen más peso. (Imageandart.com, 19.01.09 6 ) 3 http://espndeportes.espn.go.com/news/story?id=545988&s=mls&type=story 4 http://www.larazon.es/noticia/a-veces-como-es-tan-barbaro-sigo-el-boxeo 5 http://blogs.cincodias.com/lealtad/2008/11/sin-transparenc.html 6 http://www.imageandart.com/tutoriales/morfologia/alfabetividad_visual/6ta_parte/index.html 8

(5) Excluyendo estos dos últimos territorios, que gozan de autonomía administrativa, Dinamarca es el país escandinavo de menor extensión y [ ] (Ministerio del Interior, 01.09.08 7 ) (6) El juicio tenía que durar hasta el próximo jueves, aunque ahora es probable que no se celebre hasta enero, suponiendo que para entonces hayan capturado a Robert Antonio. (El Mundo, 02.12.08 8 ) (7) Concretamente hablando, el 70% del mundo actual que conoce el sagrado libro, sabe que dice [ ] (Los Cuentos.net, 21.01.09 9 ) De ovennævnte G-syntagmer kan i princippet parafraseres til en betingelsesledsætning, der er indledt med konjunktionen si og dermed fungerer som betingelse for sætningskernen. Dette illustreres i nedenstående eksempel: (1 ) Si tenemos en cuenta los problemas del equipo en los últimos años, mucho del éxito de New York dependerá del rendimiento de Reyna [ ]. På trods af dette, er det imidlertid vores opfattelse, at G-syntagmet i de ovenstående eksempler i mindre grad udtrykker for eksempel en betingelse. Sammenligner vi ovenstående eksempel med eksempel (8) nedenfor så kan man se at (8) i højere grad har en betingelsesrelation til sætningskernen: (8) Accediendo a Bolsa, la empresa potencia su imagen al hacerse más transparente frente al mercado en general y a sus accionistas en particular. (Bolsa de Valencia, 10.10.08 10 ) I eksempel (8) er sætningskernens realisering betinget af G-syntagmet. Firmaet forstærker ikke sin profil, hvis det ikke går på børsen. I eksempel (1 ) har betingelsesledsætningen i virkeligheden ikke nogen betingelsesrelation til sætningskernen. New Yorks succes 7 http://www.icex.es/staticfiles/guia%20pais%20dk%202003_2330 2339_.pdf 8 http://193.110.128.199/papel/2008/12/02/madrid/2554086_impresora.html 9 http://www4.loscuentos.net/cuentos/link/192/192939/ 10 http://www.bolsavalencia.es/empresasenbolsa/ 9

afhænger af Reynas effektivitet, uanset om vi tænker på de problemer, som holdet har haft i løbet af de sidste år eller ej. Vi kan nu spørge os selv, hvad ledsætningens/g-syntagmets relation til sætningskernen i (1 ) egentlig er. Relationen er pragmatisk. Det er en brug af G, som svarer til Louise Denvers udlægning af G som pragmatisk adverbial (Denver, 1987 s.111 ff) samt Per Anker Jensens udlægning af den pragmatiske brug af en ledsætning (Jensen, 1985 s. 82). G-syntagmet har en brug i konteksten, der gør, at den semantiske relation bliver mindre væsentlig i det pågældende eksempel. I Annotation af adverbialer er der givet dependenskategorien prg (pragmatic) til det der beskrives som sætningsadverbialer i form af afsendermarkeringer af typen: desværre, heldigvis, måske. Ser vi på vores indsamlede eksempler af pragmatiske G-syntagmer så er de ikke udelukkende afsendermarkeringer. De skaber ofte andre relationer til sætningskernen, end det at være afsendermarkeringer. Disse andre relationer som det pragmatiske G-syntagme kan have, bør kunne annoteres i en dependenskategori. Vi mener, at prg-kategorien bør redefineres på baggrund af de yderligere relationer, som det pragmatiske G-syntagme har til sætningskernen. Vi vil derfor i løbet af denne afhandling svare på følgende spørgsmål: 1. Hvordan skal de pragmatiske G-syntagmer annoteres 2. Hvad er det, der adskiller det pragmatiske G-syntagme fra de øvrige 3. Hvordan sikres det bedste teoretiske grundlag for en dependenskategori Med udgangspunkt i ovenstående spørgsmål, vil vi i denne afhandling med hjælp fra udvalgt teori og udlægninger inden for emnet, først og fremmest redegøre og foreslå en ny generel indgangsvinkel til adverbialer. 1.5 Afgrænsning G-formen er en verbalform som har mange forskellige funktioner og betydninger. Grundet afhandlingens omfang har vi set os nødsaget til bevidst at fravælge nogle betydninger og funktioner. Det drejer sig specielt om tilfælde, hvor et G yderligere kan inddeles i for eksempel G-syntagmet behandlet i analysens afsnit 6.5.1.5. Årsagen er 10

udover overskuelighed også begrundet med, at det ikke er alle grammatikker og udlægninger, som behandler G så detaljeret, at vi har fundet det forsvarligt at kategorisere G ud fra. I forbindelse med dependensrelationer og kategorier er vi opmærksomme på, at der i princippet findes relationer på tværs af sætningerne i en tekst, men da vores mål er at redegøre for G-syntagmets relation til sætningskernen, vil vi udelukkende beskæftige os med dependensrelationer inden for selve sætningen. 1.6 Afhandlingens mål Som nævnt i indledningen, er afhandlingens formål at klassificere G på baggrund af en undersøgelse af G s dependensrelationer til sætningskernen. Resultatet af vores undersøgelse og klassificering af G skulle gerne resultere i, at vi kan kortlægge G s annotationsmuligheder. Vores kortlægning af G s annotationsmuligheder skal indgå i CDT s samlede enhedsteori om annotation af tekster til træbanker og vil kunne bruges i fremtidige annotationer af G eller andre infinitte verbalformer i spanske tekster. I DTAG (se afsnit 3.1 Terminologi) har vi mulighed for at ændre eller tilføje nye dependenskategorier og denne mulighed har samtidig gjort, at vi kan oprette nye dependenskategorier de steder, hvor vi har fundet det nødvendigt. Vi stiler mod, at afhandlingens produkt kan blive en del af den ensartede teori omkring annotation af tekster til brug i træbanker, hvilket CDT s delprojekt 1 arbejder på. Vi håber, at vores forslag til et teoretisk udgangspunkt for annotation af adverbialled kan bruges som inspiration til videre studier af annotation på baggrund af semantiske og pragmatiske relationer mellem sætningens enheder. Den benyttede teori i dette speciale kan desuden benyttes som udgangspunkt for annotation af relationer mellem hele sætninger og dermed åbne op for videre studier af f.eks. diskursanalyser. 11

2 Definitioner på pragmatiske adverbialer I dette kapitel vil vi redegøre for de tidligere behandlinger der har været i forbindelse med pragmatiske adverbialer og som vi har benyttet os af i denne afhandling. 2.1 Louise Denver (1987) Denver kommer i sin behandling af G-syntagmer ind på nogle af de samme type G- syntagmer, der blev opstillet i problemformuleringen. Disse G-syntagmer kalder Denver for pragmatiske adverbialer (Denver, 1987 s.111). Det er karakteristisk for G i 4.1 [pragmatiske adverbialer], at den nonspecifikke agent kan udtrykkes ved brug af 1. person pluralis i ledsætningsparafrasen, da agenten indirekte referer til den talende i visse tilfælde og i andre til både taleren og tilhøreren. (Denver, 1987, s. 111) Denver inddeler de pragmatiske G-syntagmer i fem grupper: (Denver, 1987 s. 120): Teniendo en cuenta synonyme og antonyme udtryk Hablando de / volviendo a Temaregulerende gerundio-syntagmer Contando synonyme og antonyme udtryk Suponiendo que Adverbium på mente + hablando Vi vil gennem hele afhandlingen holde fast i Denvers udlægning om, at det adverbielle G-syntagmet i visse tilfælde har pragmatisk funktion. 2.2 Per Anker Jensen (1985) Til en yderligere uddybning af, hvad et pragmatisk adverbial er, har vi benyttet Per Anker Jensens udlægning af pragmatiske adverbialer (Jensen, 1985, s. 82). Ifølge Jensen kan en dansk betingelsesbisætning undertiden have en anden funktion end betingelse: 12

Betegnelsen, pragmatisk, bruges om udtryk, hvis anvendelse ikke så meget er bestemt af, hvad de præcis betyder, eller hvad de refererer til (deres semantik), som af hensynet til den konkrete situation, hvori de bruges eller denne situations forudsætninger. (Jensen, 1985, s. 82). Jensen skriver yderligere, at en betingelsesledsætning undertiden kan have den funktion, at den sætter en situation og dermed fungerer pragmatisk, mere end at den fungerer som betingelse for hovedsætningen (Jensen, 1985, s. 82). Dette kan illustreres ved Jensens eget eksempel: Hvis man ser på Rømø-dæmningen, så slår den et knæk Afsenderen sætter via ovenstående ledsætning en situation, hvorunder sætningskernen skal forstås. Der er altså ikke tale om nogen betingelse, selvom ledsætningen indledes af konjunktionen hvis. Jensen kommer ikke yderligere ind på, hvilken relation ledsætningen har til sætningskernen, men skriver Den har den funktion at sætte en situation (Jensen, 1985, s. 82). Jensen inddeler de pragmatiske adverbialer i to: Modale adverbialer af typen desværre, heldigvis, mærkværdigvis Konnektive adverbialer af typen imidlertid, derimod, derfor Han kommer dog ikke yderligere ind på de situationssættende ledsætninger. Disse er imidlertid interessante for vores afhandling da de etablerer nogle andre relationer til sætningskernen end udelukkende at være pragmatiske. 2.3 Michael Halliday (1994) Halliday nævner to former for adverbialer, der svarer til Jensens pragmatiske adverbialer nemlig Conjunctive adjuncts 13

Modal adjuncts (Halliday, 1994 s.49). De såkaldte Conjunctive adjuncts er dem, der relaterer en sætning til den foregående sætning. Eksempler på disse adverbialer er blandt andre følgende: - In other words - To be precise - Leaving that aside - To sum up - With this in mind - Under the circumstances Halliday betegner de såkaldte Modal adjuncts for adverbialer, der angiver afsenderens egen vurdering af udsagnet. Blandt disse kan nævnes følgende: - Probably - Honestly - Broadly speaking - Strictly speaking 2.4 Gramática Descriptiva (1999) Lagunilla tager i Gramática Descriptiva udgangspunkt i sproghandlingsteorien og kalder den type G-syntagmer der blev opstillet i problemformuleringen for gerundios ilocutivos (Lagunilla, 1999, s. 3482f). Den illokutionære sproghandling betegner intentionen med det, der bliver sagt og er en markør for afsenderen af teksten. Lagunilla har lagt vægt på afsenderens intention, hvilket yderligere uddybes med, at G har et subjekt som ikke kan være eksplicit i teksten, men som er afsenderen af teksten (Lagunilla, 1999, s. 3482). 14

3 Teoretisk grundlag For at få et generelt overblik over G, har vi benyttet Gramática Descriptiva. Dette skyldes, at denne grammatik er en af de mest udtømmende grammatikker over det spanske sprog. Kapitlerne i grammatikken er skrevet af højt respekterede videnskabsfolk og specialister inden for emnerne, Lagunilla og Yllera. Derfor vurderer vi, at det er en af de mest uddybende gennemgange af G s syntaktiske og semantiske funktioner. Dette værk er relevant at inddrage i vores afhandling, fordi vi til afhandlingens formål skal have et grundlag at basere vores kategorier på. Med henblik på at få et så nuanceret billede af G s semantiske og funktion, har vi valgt at supplere Gramática Descriptiva med Denvers videnskabelig udlægning. Vi har benyttet både Denvers udlægning om G-syntagmer i Gerundio-syntagmer med en non-specifik agent som logisk subjekt samt Lagunillas udlægning i Gramática Descriptivas til at blive inspireret og få et overblik over mulige inddelinger af pragmatiske G-syntagmer. Denvers udlægning er væsentlig at inkludere i forbindelse med G som adverbial, da hun oplister en række G med forskellige semantiske betydninger og pragmatiske fortolkninger. Hallidays An introduction to functional grammar er vores egentlige analyseværktøj. Halliday er blevet brugt til denne afhandling, da han beskriver sproget ud fra, hvordan det bruges. Med ham kan vi forklare sætningens ydre omstændigheder samt relationerne mellem adverbielle G-syntagmer og sætningskernen. Ud fra et dependensanalytisk perspektiv og med G-syntagmet for øje, har hans teorier vist sig at være de mest udtømmende. På baggrund af Hallidays grammatik har vi kunnet inddele de adverbielle G-syntagmer i to generelle hovedgrupper, de semantiske og pragmatiske, hvilket er baseret på sætningens tekstuelle og interpersonelle komponent. Til denne afhandling har det været muligt at inddrage anden teori og udlægninger af gerundiums funktion og betydning i en tekst. Selvom andre også er lige så vigtige, har vi dog valgt at begrænse vores teoretiske grundlag til at omhandle få, men uddybende 15

behandlinger. Dette skyldes dels, at der i de fleste tilfælde er sammenfald i grammatikkernes fremlæggelser i forbindelse med funktionen af G i en tekst og dels, at mange grammatikere refererer til netop Gramática Descriptiva. 3.1Terminologi Her vil vi redegøre for de begreber og termer, der er frekvente i afhandlingen. Vi vurderer, at det er nødvendigt for læserens forståelse for emnet, da vores beslutninger og valg i løbet af afhandlingen tager udgangspunkt i disse begreber. Træbank En træbank er et annoteret tekstkorpus og et datalingvistisk redskab til søgning på sproglige forekomster og fænomener. En træbank bruges til computerbaserede statistiske systemer, det vil sige computerprogrammer, som kan måle frekvensen af sproglige fænomener i et tekstkorpus og på baggrund af disse udregne for eksempel algoritmer for konstruktionen af automatiske annotationsprogrammer, maskingrammatikker og oversættelsesværktøjer (Wikipedia, 2008 11 ). Med udgangspunkt i ovenstående er det omfanget af tekst, systemværktøjer og annotationen af teksterne, der afgør, hvor godt et værktøj træbanken er. Der findes ingen retningslinjer for omfanget af tekster og ord, der skal være, før man kan tale om en træbank. Træbanker kan være opbygget forskelligt med hensyn til både grammatiske teorier og annotationsomfanget, og selve annotationen kan være meget forskellig. Nogle træbanker er kun ordannoteret, andre kan være diskursannoteret, mens en hel tredje kan være ord- og diskursannoteret. Opbygningen og udformningen af træbanken afhænger af dens formål. Den optimale træbank vil derfor indeholde alle former for tekster og være annoteret i henhold til alle sproglige fænomener sådan, at de datalingvistiske systemværktøjer kan søge på så mange kriterier som muligt. Det er denne indgangsvinkel Copenhagen Dependency Treebank Project har haft til annotation af dets korpora. 11 http://en.wikipedia.org/wiki/treebank 16

Paralleltræbank En paralleltræbank er et dependensannoteret korpus på et kildesprog, som er blevet aligneret med det annoterede oversatte korpus. Det oversatte korpus er blevet annoteret ud fra de samme præmisser og efter ens retningslinjer som det dependensannoterede korpus på kildesproget. Paralleltræbanken er derfor et resultat af en alignering af to forskelligsprogede annoterede tekstkorpora. Danish Dependency Treebank Danish Dependency Treebank (DDT) er et allerede annoteret korpus på 536 danske tekster, bestående af 5540 sætninger på i alt 100.200 tegn (Trautner, 2003). DDT er en dependenstræbank og er blevet annoteret i DTAG. Denne annotation tager udgangspunkt i doktorafhandlingen Discontinuos Grammars teori (se nedenfor). Discontinuous Grammar Discontinuous Grammar (DG) er en grammatisk teori, der er udviklet specielt til annotation af tekster til brug i træbanker. Denne grammatiske teori tager udgangspunkt i dependensgrammatikken og er inspireret af Hudsons Word Grammar (Hudson, 1984). DG er udviklet med henblik på en bedre maskinindlæring af annoteret tekst (Buch- Kromann, 2006). DTAG DTAG er et computerprogram, der er udviklet af Matthias Buch-Kromann. Programmet benyttes til at annotere de forskellige kategorier samt ordalignere tekster til brug i træbanker. Kategorierne i forbindelse med dependensannotationen er en forkortelse af den engelske betegnelse for funktionen af ordet. 17

I nedenstående tabel vises de meste frekvente syntaktiske dependenskategorier som ses i forbindelse med de annoterede eksempler i afhandlingen: Vobj subj / [subj] nobj dobj iobj pobj TABEL I: SYNTAKTISKE KATEGORIER For bedst at illustrere, hvordan kategorierne ser ud rent visuelt, kan vi opstille følgende eksempel: vobj: Kategorien vobj gives til verbalobjekter, blandt andet infinitte verbalformer som participier i perfektum-former som i givet i eksemplet ovenfor. nobj: nobj-kategorien tildeles nominalobjekter. Et nominalobjekt er hovedsagelig et substantiv i et syntagme, hvilket i eksemplet Han har givet pigen en bog, hvor bog er blevet tildelt kategorien nobj. pobj: Dependenskategorien pobj er ikke til stede i ovenstående eksempel, men benyttes til at annotere præpositionsobjekter. Pobj-kategorien benyttes derudover også som del af dependenskategorier i forbindelse med komposita, der er dannet ved hjælp af en præposition, som i la producción de azúcar 12. subj/[subj]: Sætningens syntaktiske subjekt tildeles dependenskategorien subj. [subj]- relationen er sekundær. [subj]-kategorien gives til sætningens sekundære subjektsrelation. Det vil sige hvis sætningens subjekt er subjekt til verbalets 12 Denne kategori modificeres ved annotation af komposita, hvor en præposition skaber relation mellem N 1 og N 2. Modificeringen ses ved annoterede eksempler senere i afhandlingen, men henvise til Principper for dependensanalyse (Buch-Kromann et al, 2008b). 18

infinitte verber som f.eks. givet i det ovenstående eksempel. Eller hvis et verbum har et subjekt som ikke er sætningens subjekt som f.eks. ham i nednstående eksempel: iobj: dobj: Den sekundære kategori adskiller sig fra de andre ved at være rammet ind i firkantet parentes [ ] samt at dependenspilen går under sætningen. Det indirekte objekt i sætningen annoteres med kategorien iobj. Sætningens syntaktiske direkte objekt tildeles dependenskategorien dobj. I løbet af afhandlingen illustrerer vi ved annoterede eksempler de kategorier vi tildeler G. Ved de kategorier der endnu ikke er oprettet i DTAG, vil pilen være under linjen og selve dependenskategorien vil være markeret med rød. Udover de ovennævnte syntaktiske kategorier er der en række semantiske kategorier, der beskriver adverbialleddets semantiske relation til sætningskernen (Buch-Kromann et al, 2008a): 1. Mål, hensigt: goal 2. Tid: time 3. Årsag: cause 4. Betingelse: condition: cond 5. Indrømmelse: concession: conc 6. Følge: consequence: cons 7. Stedsadverbier fordeles på: 8. Instrument: inst 9. Måde: manner: man 10. Benefaktiv: beneficiary: ben 11. Negation: neg 12. Reference/kilde: source 19

13. Tekststrukturerende: struct 14. Baggrund: background: bg 15. Kontrast: contr 16. Sammenligning: comp 17. Omfang: extent: ext 18. For eksempel: ex, underordnet det led der tilføjes til en liste 19. Grad: degree: degr 20. Nærmere beskrivelse: elaboration: elab 21. Fokalisatorer: focal 22. Ledsagende handling/omstændighed: concom 23. Andet: other 24. Interrogativer: følger i sagens natur den semantiske inddeling af adverbialer, jf. hvor=sted, hvordan=måde, hvorfor=årsag, hvornår=tid, etc. Ordalignering Ordalignering er den proces, hvor en kildeteksts betydningsenheder sættes i forbindelse med oversættelsens med andre ord aligneres kildetekstens betydningselementer. Udover aligneringen af ord, foretages også en aligering af tegnsætning. Ordaligneringen indgår sammen med dependensannotationen som de to delelementer i konstruktionen af en paralleltræbank. Nedenstående figur 2 er et eksempel på en dansk tekst, der aligneres med en spansk oversættelse: Jeg købte bogen i går S Ayer compré el libro FIGUR I: ALIGNERET EKSEMPEL I figur 1 er ses det, at jeg købte aligneres med compré, adverbialet i går med ayer og det direkte objekt bogen med både el og libro. S et på stregen midt i figuren markerer ifølge 20

Buch-Kromann et al., 2008c, at der er tale om en syntaktisk forbindelse mellem det danske ord bogen og det tilsvarende spansk el libro. (Buch-Kromann, et al., 2008c), Da afhandlingens hovedfokus ligger inden for dependensannotation af G, vil vi ikke yderligere komme ind på behandlingen af denne verbalform hvad angår alignering, men blot illustrere, den anden del af Copenhagen Dependency Treebank Project går ud på 13. 13 For yderligere information omkring alignering se Aligment Forslag til koder http://www.treebank.dk/alignment.pdf 21

4 Empiri Da formålet med denne opgave er at redegøre for G s mange funktioner og dermed for de dependenskategorier, som G har mulighed for at blive annoteret med, er det nødvendigt, at et eksempelkorpus indeholder så mange forskellige typer af G som muligt. I vores annotationsarbejde har vi arbejdet med et korpus af oversatte tekster fra dansk til spansk (K1). K1 består af en samling tilfældigt oversatte tekster fra Danish Dependency Treebank og vi har i forbindelse med vores annotationsarbejde kunnet konstatere, at korpusset har et meget begrænset antal og meget få typer G-konstruktioner. På denne baggrund har vi været overbevidste om, at K1 ikke viser et korrekt billede af G s syntaktiske, semantiske og pragmatiske funktioner. Dette har medført, at vi har valgt at se bort fra K1 og derimod indsamlet eksempler til et nyt eksempelkorpus (K2), som vil indgå i denne afhandling som erstatning for K1. K2 består af 475 eksempler med G. For at finde så mange forskellige brug af G som muligt, består K2 af eksempler fra aviser, skøn- og faglitteratur samt juridiske og økonomiske tekster indsamlet fra internettet og bøger. At vi har indhentet teksteksempler så mange forskellige steder fra, skyldes også, at vi ikke har en normativ, men derimod en deskriptiv tilgang til emnet. Samtidig forsøger vi ikke at favorisere én genre frem for en anden. Vi er af den overbevisning, at en behandling af G inden for én bestemt genre ikke ville give et retvisende billede af de forskellige typer G, som findes i det spanske sprog. K2 vil derfor være vores primære empiri i opgaven og vil være vores værktøj til redegørelse af G s betydningsfacetter i spanskproducerede tekster. 22

5 Metode Vi har i denne afhandling udtaget og fokuseret på ét bestemt annotationsmæssigt problem, nemlig den infinitte verbalform gerundium (G). Dette skyldes, at G, afhængig af konteksten det indgår i, kan have en højere grad af syntaktisk, semantisk eller pragmatisk relation til sætningskernen. Disse forskellige relationer mellem G og sætningskernen er der endnu ikke er blevet lavet en systematisk redegørelse for i forbindelse med dependensannotation. Til at inddele G i henhold til dets dependensmuligheder har vi brugt forskelligt grammatisk og teoretisk materiale. Vi vil her præsentere det materiale, der er blevet brugt til at inddele K2 i dependenskategorier. Derudover vil vi forklare, hvordan vi via det teoretiske grundlag kan inddele de adverbielle G-syntagmer på en ny måde. Til denne afhandling har den primære hensigt været at klassificere G i dependenskategorier, som er teoretisk begrundede. Derfor har vi som nævnt i det foregående kapitel indsamlet en række teksteksempler, som udgør vores nye korpus, K2. Eksemplerne er først blevet inddelt efter deres syntaktiske relation til kerneleddet. Dernæst har vi benyttet det teoretiske grundlag til, inden for hver af disse syntaktiske relationer, at give en uddybende forklaring af G s relation til kerneleddet og på denne baggrund redegøre for en dependenskategori. Efter gennemgangen af en given syntaktisk funktion, illustrerer vi med et annoteret eksempel, hvilken dependenskategori G tildeles. Er eksemplet langt, har vi markeret G med en rød ring. Til den syntaktiske inddeling af G-syntagmerne har vi taget udgangspunkt i Gramática Descriptiva. Vores strategi for en inddeling først og fremmest været at analysere G- syntagmerne i henhold til, hvor tæt tilknytning de har til kerneleddet i sætningen. På denne baggrund har vi kunnet inddele G efter hvorvidt den har funktion inden eller uden for sætningskernen (se afsnit 5.1 Begrebsafklaring). 23

5.1 Begrebsforklaring I de følgende afsnit vil vi forklare, hvordan vi definerer forskellige begreber, som i løbet af afhandlingen kan have indflydelse på forståelsen af vores arbejde. Tekst: I forbindelse med denne afhandling og med hensyn til dependensannotation generelt, betegner vi en tekst på samme måde som Lundquist (Lundquist i Herslund et al, s. 228): En tekst er afsluttet kommunikativ enhed mellem hvis dele der er sammenhæng. I forbindelse med dependensannotation består en tekst således af et antal sætninger imellem hvilke, der er tekstsammenhæng. Sætning: En sætning består af et finit verbum, der sammen med valensledene og adverbialerne danner en sætning, hvis afgrænsning er fastsat af et punktum. Sætningskerne: Ved sætningskerne skal forstås den del af sætningen, der kun omfatter verbalet og dets valensled. Alt, hvad der ligger uden for sætningskernen, vil blive betragtet som et adverbial. Således kan vi inddele det følgende eksempel i sætningskerne+adverbial: Han gav en pige bogen i går Sætningskerne: Adverbial: Han gav en pige bogen I går Termen sætningskerne vil i afhandlingen ofte blive brugt i forbindelse med de adverbielle G s relation til sætningskernen. 24

Sætningsemne: Sproglige enheder uden et finit verbum kaldes normalt for sætningsemner (Herslund et al, 2003 s. 185) som f.eks. i Rygning forbudt. 14 Vi kan i forbindelse med dependensrelationer behandle sætningsemner så længe, disse består af mindst to ord. Kerneled: Kerneleddet er det ord i sætningen eller i sætningsemnet der er det styrende (regenten) og til hvilket samtlige af sætningens andre ord har en direkte eller indirekte dependensrelation. Det er således gav, der er sætningens kerneled i han gav en pige bogen i går. Relationer: Relationer mellem sætningens enheder skal forstås som den forbindelse der eksisterer mellem to sproglige enheder i en sætning. I den nuværende annotation arbejder vi med to former for relationer: den syntaktiske og den semantiske. Den syntaktiske relation gives til kerneleddets valensled, mens den semantiske relation gives til adverbialerne: Nedenstående vises et annoteret eksempel med de syntaktiske relationer: Annoteret eksempel med den semantiske relation: 14 Der eksisterer på nuværende tidspunkt ingen udarbejdelse af retningslinjer for, hvordan man generelt bestemmer sætningsemnets kerneled, og vi vil heller ikke behandle denne problemstilling, men som vi vil komme ind på senere i opgaven, så kan G som infinit verbalform have funktion som kerneled. 25

5.2 Metodisk gennemgang af analysens kapitler 5.2.1 G er kerneled Den første gruppe af G, vi behandler, er, når det fungerer som selve kerneleddet i et sætningsemne. Ifølge Lagunilla ses denne type G typisk ved tekster til billeder eller i korte tekster (Lagunilla, 1999, s. 3495ss). Et G, der fungerer som kerneled i en sætning, er væsentlig i annotationsøjemed, og vi vil i analysens afsnit 6.1 komme ind på de indvirkninger et G af denne type har for annotation af tekster. Til analysen af G med denne funktion vil vi benytte Gramática Descriptiva, samt retningslinjerne for annotation beskrevet i Principper for dependensanalyse (Buch-Kromann, 2008b). 5.2.2 G i verbalperifraser I denne afhandling vil vi udelukkende beskæftige os med de verbalperifraser, hvori G indgår. Verbalperifraser består af et finit verbum (V 1 ) også kaldet værtsprædikat samt en infinit verbalform (V 2 ) kaldet co-prædikat. Dette komplekse verbum eksisterer ikke på dansk, hvilket betyder, at der derfor ikke er lavet nogen dependenskategori. Til redegørelsen for det perifrastiske G benytter vi Yllera (Yllera, 1999, s. 3391ff). Yllera oplister i Gramática Descriptiva en række verber, der kan fungere som værtsprædikat. Det er dette verbum, der afgør, om der er tale om en verbalperifrase. For at kunne annotere G i verbalperifraser er det nødvendigt at få kortlagt de verber, der kan fungere som V 1. Det, der lægges til grund for grammatikkernes udvælgelse af verber, der indgår som V 1 i verbalperifrasen, er, ud fra graden af den grammatikalisering verbet har gennemgået. Det betyder, at vi i annotation af G, der indgår i verbalperifraser, vil kigge på det verbum, der fungerer som værtsprædikat. Med henblik på at få så bredt et grundlag at vurdere ud fra som muligt, har vi ud over Gramática Descriptiva, kort inddraget to andre udlægninger, nemlig García Diccionario de Perífrasis Verbales (García, 2006) samt Fernández udlægning i Las perífrasis verbales en el español actual (Fernández, 1999). 26

5.2.3 G s funktion som objektsprædikativ Når G har funktion på sætningsniveau kan det også fungere som prædikativ til sætningens objekt. Annotationsguiden har allerede en dependenskategori for objektsprædikativer, og vi vil derfor redegøre for, hvornår G kan have funktion som objektsprædikativ. Til definition af G i denne funktion tager vi udgangspunkt i Gramática Descriptiva, der opstiller en række verber, der skal være kerneled i sætningen, før G kan have denne funktion som objektsprædikativ. På baggrund af Gramática Descriptivas udlægning kan vi klassificere G som objektsprædikativ alt efter, om sætingens kerneled tilhører en af de typer verber. 5.2.4 G s funktion i syntagmer G kan have funktion på syntagmeniveau. Her kan G have en række af de samme syntaktiske og semantiske relationer, som det har på sætningsniveau. For at få systematiseret G i denne brug og for at kunne bestemme annotation af G i komplekse nominalsyntagmer har vi benyttet Spanske substantivers interne struktur set i et valensteoretisk perspektiv (Müller, 1997) og artiklen The Spanish Gerund Revisited i Grammatica Et Festschrift in honour of Michael Herslund (Denver, 2006, s. 51-68). 5.2.5 Adverbielle G-syntagmer Som det blev nævnt tidligere vil afhandlingens analyse være fokuseret på de adverbielle G-syntagmer. Til denne analyse har Hallidays An Introduction to Functional Grammar været vores primære teori. Med udgangspunkt i Hallidays udlægning om sætningens metafunktioner (Halliday, 1994 s. 36) har vi kunnet lave en systematisk tvedeling af de adverbielle G-syntagmer. De to hovedgrupper er herefter blevet analyseret hver for sig på baggrund af Hallidays udlægning om sætningskernens udvidelse med andre sætninger samt de relationer der eksisterer mellem disse (Halliday, 1994 s. 225). I de separate analyser har vi berørt andre grammatikker og udlægninger til at bidrage til 27

klassificeringen af en given type G. Det drejer sig blandt andet om Herslund (Herslund et al, 2003), Jensen (Jensen, 1985), Martínez (Martínez, 1963 [1953]), Moliner (Moliner, 1998). I tillægget til annotationsguiden har Buch-Kromann som tidligere nævnt oplistet forskellige dependenskategorier til adverbialer (Buch-Kromann et al, 2008a). Vi har vurderet, at det er nødvendigt at skelne mellem de forskellige adverbialer, da vi mener, at den nuværende inddeling i virkeligheden blander to niveauer sammen, og fordi den er ikke særlig systematisk i sin tilgang til sætningsadverbialer. Det betyder, at vi på baggrund af Hallidays funktionelle analyse af sætningen og på baggrund af G som adverbial vil foreslå en ny generel inddeling af adverbialer, som kan bruges til annotation, og som skal indgå i Annotation af adverbialer. Nedenstående figur viser den nuværende inddeling af adverbialer: Adverbialer man prg cause bg cond FIGUR II. NUVÆRENDE INDDELING AF ADVERBIALER G -syntagmets tekstuelle og interpersonelle relation til sætningskernen Den nye inddeling vil tage udgangspunkt i en analyse af de pragmatiske G-syntagmer. Til at analysere disse har vi benyttet Hallidays teorier om sprogets tre metafunktioner (Halliday, 1994, s. 37 ff). På denne baggrund har vi kunnet dele de adverbielle G- syntagmer i to hovedgrupper i henhold til, hvor fremtræden den interpersonelle komponent er. Hermed har vi to grupper adverbielle G-syntagmer, som efterfølgende er 28

blevet analyseret hver for sig i forbindelse med formålet at finde en passende dependenskategori. Adverbialer Semantisk funktion Pragmatisk funktion FIGUR III: FORSLAG TIL NY INDDELING AF ADVERBIALER Denne analyse er sket med hjælp fra Gramática Descriptiva, Denver og Hallidays udlægninger inden for emnet. Analyserne har ført til et antal dependenskategorier til de adverbielle G-syntagmer, som hver især har overkategorien pragmatisk eller semantisk adverbial. G s udvidelse af sætningskernen For yderligere at kunne redegøre for G-syntagmets relation til sætningskernen, har vi analyseret de to hovedgrupper i henhold til den måde, hvorpå G-syntagmet udvider sætningskernen. Til dette har vi brugt Hallidays udlægning om sætningen udvidelse, Elaborating, extending, enhancing: three kinds of expansion (Halliday, 1994 s. 225) Med denne metode har vi kunnet redegøre for relationen mellem G-syntagmet og sætningskernen. G-syntagmerne kan udvide kernen på tre måder: - Elaborerende G-syntagmer af typen Diciéndolo en términos sencillos, los elementos visuales situados en áreas de tensión tienen más peso. (Imageandart.com, 19.01.09) - Informationsudvidende G-syntagmer af typen Andaba asolado sin zalemas y sin alegría, resenciaolo con su sola resencia. (Sender, 2004 s.24) 29

- Betydningsudvidende G-syntagmer af typen Eligiendo este destino, además de mejorar el inglés, podrás disfrutar de la playa [ ] (Mastermas, 18.11.08) Således har vi i henholdsvis de pragmatiske og semantiske G-syntagmer set på den måde de hver især udvider sætningskernen. G-syntagmers udvidelse af sætningskernen Elaborating Extending Enhancing FIGUR IV: UDVIDELSE AF SÆTNINGSKERNEN 5.2.5.1 Semantiske G-syntagmer Som nævnt i afsnit 3.1 Terminologi er der udarbejdet en række dependenskategorier til adverbialer. Dette betyder, at vi som udgangspunkt vil kigge på, om et G med adverbiel funktion kan tildeles en af disse kategorier. Til at forklare, hvad det er, der rent generelt kendetegner et G med semantisk relation, benytter vi Hallidays tilgang. Tilgangen går som nævnt i foregående kapitel ud på, at sætningskernen kan udvides, hvortil der dannes relationer. Vi vil i analysen søge at inddele og klassificere G i så mange betydningsnuancer som muligt, men dertil kræves en decideret gennemgang af G s semantiske betydninger, som Halliday ikke behandler. Derfor tager vi dette udgangspunkt i Denvers inddeling af G. Det skyldes, at Denver inddeler G i kategorier og opstiller en række semantiske betydninger, som G kan have, når det fungerer adverbielt (Denver, 1987, s. 79ff). For at understøtte Denvers inddeling af semantiske kategorier, inddrager vi også Lagunillas inddeling i Gramática Descriptiva, for at få så bredt et grundlag at klassificere vores G ud fra (Lagunilla, 1999, s. 3444ff). 30