Danske adverbier mellem leksikon og syntaks Ph.d.-afhandling Sanni Nimb

Størrelse: px
Starte visningen fra side:

Download "Danske adverbier mellem leksikon og syntaks Ph.d.-afhandling Sanni Nimb"

Transkript

1 Danske adverbier mellem leksikon og syntaks Ph.d.-afhandling Sanni Nimb Institut for Nordiske Studier og Sprogvidenskab samt Center for Sprogteknologi Københavns Universitet, september 2004

2

3 Forord Denne afhandling er skrevet i en tre-års arbejdsperiode som kandidatstipendiat på Center for Sprogteknologi, finansieret af Nordisk Sprogteknologisk Forskningsprogram (NorFA). I foråret 2003 var jeg desuden tilknyttet Språkdata, Institutionen för svenska språket, på Gøteborgs Universitet i nogle måneder. Jeg vil gerne takke mine to vejledere, professor Hanne Ruus, Institut for Nordiske Studier og Sprogvidenskab på Københavns Universitet samt seniorforsker Bolette S. Pedersen, Center for Sprogteknologi, for deres faglige kritik og moralske opbakning undervejs. Derudover vil jeg takke medarbejderne på Språkdata for samarbejdet, særligt Maria Toporowska Gronostaj og Elisabet Engdahl, som altid viste stor interesse for mit projekt og gav gode råd og mange gode litteratur-henvisninger. Sidst, men ikke mindst, vil jeg takke Center for Sprogteknologi for at støtte mig i at søge midler til et ph.d.-projekt, samt for hjælpen med at forfatte afhandlingen det være sig alt fra teknisk assistance til diskussion af lingvistiske teorier og analyser. Særligt medarbejderne i STO-projektet måtte tit tage stilling til underlige spørgsmål og mærkelige sætninger, og har desuden gennemgået og kommenteret den model til kodning af adverbier i STO, som jeg fremlægger i afhandlingen: Nicolai H. Sørensen, Costanza Navarretta, Claus Povlsen, Sussi Olsen, Anna Braasch, min ene vejleder Bolette S. Pedersen og Dorte Haltrup Hansen. Nicolai har afprøvet min kodningsvejledning på ca. 50 adverbier, og resultatet af dette kodningsarbejde indgår i det leksikon, som præsenteres i afhandlingen.

4

5 Dansk Resumé Adverbiers syntaks er svær at håndtere i automatisk analyse af sprog som dansk, fordi de kan modificere mange forskellige slags syntagmer og optræde i mange forskellige positioner. Denne afhandling angriber problemet fra en leksikografisk synsvinkel. Dens primære mål er at finde frem til hvilke syntaktiske egenskaber, der er leksikalsk betinget for adverbier, dvs. særegne for det enkelte adverbium, og som derfor skal beskrives i leksikon-komponenten i en sprogteknologisk applikation og ikke i grammatikreglerne. Kernen i afhandlingen er en detaljeret korpusundersøgelse af 49 danske adverbier, der repræsenterer alle betydningsområder (kapitel 6). Ca. 100 konkordanslinjer for hvert adverbium er i undersøgelsen blevet opmærket mht. syntaktisk opførsel. Derudover gennemgås i afhandlingen adverbiers roller, som de opfattes i formelle lingvistiske teorier samt adverbiers syntaktiske og til dels semantiske karakteristika, som de er beskrevet i fire skandinaviske grammatikker (kapitel 4 og 5). Resultatet af undersøgelserne munder ud i opstillingen af en model til en korpusbaseret kodning af adverbiers syntaktiske egenskaber i det danske sprogteknologiske leksikon STO (kapitel 7). Endelig kodes et udvalg på 217 lemmaer (alle med kun én betydning i den elektroniske ordbog Politikens Nudansk med etymologi) i henhold til de opstillede regler, hvilket resulterer i i alt 417 leksikalske indgange (kapitel 8 samt bilag). Det normalt vanskelige skel mellem adverbier, der knytter sig til det leksikalske verbum, adverbier der knytter sig til hele verbalet, og adverbier der knytter sig til hele sætningen, baseres i leksikonnet udelukkende på syntaktiske kriterier. Adverbier, der knytter sig til selve verbet, skal således kunne stå enten på mådesadverbialpladsen eller udgøre et bundet adverbial (af enhver slags). Adverbier, der knytter sig til verbalet, er de adverbier, der ikke opfylder nogen af disse kriterier, men som stadig kan stå i en infinitivsætning. Endelig er de adverbier, der knytter sig til hele sætningen, kendetegnet ved ikke at kunne stå i en infinitivsætning. Ligeledes skelnes der i leksikonnet skarpt mellem adverbier, der kan modificere et leksikalsk adjektiv og adverbier, der kan modificere en adjektivfrase inklusive eventuelle adled. Når de 417 leksikalske indgange sorteres i grupper ud fra deres syntaktiske formåen, viser det sig, at der i mange af grupperne er semantiske ligheder mellem adverbierne (kapitel 8). Særligt en gruppering ud fra, om adverbiet kan knytte sig til kun én, præcis to eller flere end to typer af syntagmer, er interessant. Næsten halvdelen af adverbierne kan kun knytte sig til én syntagmetype, ca. 1/3 kun til to, og resten ca.1/5 - til tre eller flere. Semantisk set viser den sidste gruppe sig at bestå af næsten udelukkende såkaldte fokusadverbier. Gruppen af adverbier, der kan knytte sig til to typer syntagmer, har også mange semantiske ligheder, vel at mærke når de knytter sig til de samme to typer. Inden for datamatisk lingvistik er viden om, at næsten halvdelen af adverbierne kun knytter sig til én syntagmetype og faktisk kun 20 % til mere end to særligt brugbar den indikerer nemlig, at man kan reducere antallet af analysemuligheder for sætninger, der indeholder adverbier, betragteligt, forudsat at man i leksikonnet har angivet, hvilket syntagme ordet kan knytte sig til. Det skal dog understreges, at der også er mange adverbier, der falder uden for grupperingerne og opfører sig helt specielt ved fx at kunne stå på særligt mange eller særligt få pladser i sætningen derfor er et leksikon for adverbier med detaljerede oplysninger om deres individuelle egenskaber absolut nødvendigt i sprog-teknologiske applikationer, der skal kunne håndtere danske sætninger med adverbier. Afhandlingen fremlægger også en nærmere undersøgelse af 31 polyseme adverbier (kapitel 8). Formålet med denne er at se, i hvor høj grad en syntaktisk analyse alene kan bruges til at skelne mellem betydningerne af adverbiet. Undersøgelsen viser, at for mere end halvdelen af adverbiernes vedkommende opfører de to betydninger sig syntaktisk vidt forskelligt.

6 Til sidst i afhandlingen fremlægges et forslag til, hvordan de leksikalske indgange kan anvendes i en formel grammatik både mht. opbygning af syntagmer og med hensyn til en hierarkisk indplacering af adverbier i sætningsstrukturen (kapitel 8).

7 "Jeg burde simpelthen undgå adverbier. Så vidt muligt. Men adverbier er ret egenrådige. Og temmelig påtrængende. De finder altid et smuthul. Som nu tilsyneladende. Det skulle absolut stille sig op foran adjektivet uendelig. Ærgerligt, når det uden større skade kunne have stillet sig foran så mange andre adjektiver. Tilsyneladende ensomme. Tilsyneladende hjælpeløse, tilsyneladende ubevægeligt. Men ret skal nu være ret. Det virker som om pladsen foran uendelig for det meste står gabende tom og der er ikke særlig mange adverbier, der har lyst til at stille sig på netop den plads." Fra essayet "Silken, rummet, sproget, hjertet" Inger Christensen: Hemmelighedstilstanden. Essays. Gyldendal 2000.

8

9 Danske Adverbier mellem leksikon og syntaks 1: Indledning Baggrund Afhandlingens mål Disposition for afhandlingen : STO-leksikonnet Indledning Syntaktiske oplysninger Adjektivers syntaks i STO Forkortelser for adjektivernes syntaktiske beskrivelser Konklusion. 16 3: Adverbier i eksisterende sprogteknologiske leksika Leksika for adverbier udarbejdet i EU-projektet PAROLE Det italienske PAROLE-leksikon Det spanske PAROLE-leksikon Det svenske, det hollandske og det danske PAROLE-leksikon Konklusion mht. PAROLE-leksikaene for adverbier Andre sprogteknologiske leksika for adverbier: to amerikanske Leksikonnet COMLEX Chicago-leksikonnet Samlet konklusion. 26 4: Adverbiers syntaktiske roller i formelle lingvistiske teorier Indledning Adverbier i formel lingvistik Obligatoriske og fakultative sætningselementer Adverbiers syntaktiske roller: adjunkt, specifier og komplement Adverbiers placering i forhold til det led som modificeres Forskellen på komplementer og adjunkter mht. placeringsmuligheder Konklusion Behandlingen af adverbier inden for de forskellige formelle teorier Fire forskellige formelle analyser af adverbier G. Cinques analyse: Adverbs and Functional Heads W. Freys analyse: Syntactic conditions on adjunct classes T.Ernsts analyse: Semantic features and the distribution of adverbs Anne Abeillé og Danièle Godards analyse: The syntax of French adverbs without functional Projections Konklusion.. 51

10 5: Adverbier i nye grammatikker for dansk, norsk og svensk Indledning Forskelle på grammatikkernes inddelinger og opfattelser af adverbier Sætningsskemaer og adverbiers placeringsmuligheder Ole Togeby: Fungerer denne sætning? Funktionel Dansk Sproglære Inddeling af adverbier i undertyper Adverbiers placeringsmuligheder i sætningen Særlige karakteristika ved de forskellige adverbier Adverbiers indbyrdes relation De indbyrdes adled-kerne relationer Den indbyrdes rækkefølge af sætningsadverbier Adverbiernes hierarkiske indplacering i sætningen Konklusion Erik Hansen og Lars Heltoft: Grammatik over det Danske Sprog Underinddeling af adverbier i grupper og de forskellige gruppers karakteristika Ledstillingsmønstre og adverbiers positionsmuligheder i sætningen Udfyldningsmuligheder på de enkelte pladser Konklusion Svenska Akademiens Grammatik Definition på ordklassen adverbier Adverbiers syntaktiske muligheder betragtet ud fra deres semantiske typer Adverbiernes funktion som forskellige typer adverbial Adverbium som partikeladverbial Adverbium som bundet og frit adverbial Adverbium som sætningsadverbial Den indbyrdes rækkefølge af sætningsadverbier i svensk og sammenligninger til dansk Konklusion Norsk Referanse-grammatikk Afgrænsning af ordklassen adverbier Sætningsstruktur og adverbiers rolle som adled Adverbiers rolle som adverbial på sætningsniveau Bundet adverbial Frit adverbial Sætningsadverbial Adverbialtyperne indplaceret i sætningshierarkiet Konklusion Ledstilling Topologi Fokuserende adverbier. 97

11 Adverbier i sætningskløvninger Konklusion Oversigt over de fire grammatikkers hovedsynspunkter, generelt og mht. adverbier Samlet oversigt over de syntaktiske egenskaber, som man kan udlede til at være leksikalsk betinget ifølge de fire grammatikker Konklusion : Korpusundersøgelse af danske adverbiers syntaktiske opførsel Syntaktisk undersøgelse af adverbier repræsenterende alle semantiske typer Forudsætninger og afgrænsninger for undersøgelsen Undersøgelsesmetoden Adverbiets opførsel i tekster Den syntaktiske opmærkning Adverbiets kerne Adverbiets position i forhold til kernen Adled til adverbiet Tilknyttede led til adverbiet Særlige konstruktioner Registrering af resultater Test af adverbierne i forskellige syntaktiske omgivelser Tests Resultater af undersøgelsen af adverbier repræsenterende alle semantiske typer Opmærkninger Tests af adverbierne i bestemte syntaktiske omgivelser Skema Konklusion 151 7: Model til kodning af danske adverbiers syntaktiske egenskaber i STO Opsummering af resultater: eksisterende leksika, litteratur og korpusundersøgelser STO-leksikonnets udvidelse med syntaktiske oplysninger for ordklassen adverbier Lemmaselektion Syntakskodning Adverbiernes konstruktionspotentiale Egenskaber ved selve adverbiet ( self -delen af det syntaktiske mønster) Positionsmuligheder Skema over positionsmuligheder Øvrige syntaktiske oplysninger vedrørende ordet selv Samlet oversigt over mulige syntaktiske oplysninger og deres betegnelser : Selve leksikonnet og sammenligninger af leksikalske indgange De leksikalske indgange opstillet ud fra hvilket type led adverbiet lægger sig til Adverbier, der modificerer adjektiv

12 Adverbier, der knytter sig til adjektivfraser Adverbier, der modificerer adverbier Adverbier, der modificerer hoved- el. bisætning Adverbier, der optræder i kløvning Adverbier, der modificerer NP Adverbier, der modificerer PP Adverbier, der modificerer negationen ikke Adverbier, der knytter sig til VP Adverbier, der knytter sig til selve V Adverbier, der modificerer hele sætningen Adverbier, der knytter et ekstra led til sig Konklusion Adverbierne inddelt efter hvor mange syntaktiske tilknytningsmuligheder de har Adverbier, der kun har én syntaktisk tilknytningsmulighed Adverbier, der har to syntaktiske tilknytningsmuligheder Adverbier, der har tre syntaktiske tilknytningsmuligheder og derover Konklusion Polyseme adverbier Undersøgelsen af polyseme adverbier Konklusion Forslag til brug af de leksikalske indgange i en formel grammatik Adverbiernes placering i de forskellige syntagmer Adverbiers hierarkiske indplacering i sætningsstrukturen 256 9: Konklusion 257 Litteraturliste 261 English summary. 267 Bilag: leksikonnet i alfabetisk orden (side a-p)

13 Kapitel 1 Indledning 1.1. Baggrund Ideen til emnet for denne afhandling opstod under arbejdet med at færdiggøre det danske SIMPLE-leksikon 1 og i opstartsfasen af STO-projektet, hvor et stort sprogteknologisk leksikon for dansk skulle udvikles. STO skulle indeholde morfologiske, syntaktiske og til dels semantiske oplysninger for ca frekvente, danske ord fra samtlige ordklasser. I SIMPLE-leksikonnet var adverbier slet ikke medtaget i den fælles leksikon-model for EUsprogene, og i det leksikon, som var udgangspunktet for STO-leksikonnet PAROLEleksikonnet 2 var adverbiers syntaks ikke beskrevet for dansk og faktisk kun i større detaljeringsgrad for spansk og italiensk. Begge de danske leksikon-projekter havde altså et hul, hvad angik adverbier, og derudover eksisterede det teoretiske grundlag, der var nødvendigt for at kunne beskrive dem leksikalsk, i øvrigt heller ikke i litteratur om dansk sprog. Det gik endvidere op for mig, at adverbierne i det hele taget inden for datamatisk leksikografi faktisk var en forsømt ordklasse ikke kun for dansk, men i høj grad også i leksikografiske projekter for andre sprog. Den udvikling, der er foregået inden for formel lingvistik fra at regne leksikonnet for en mindre betydelig del i sprogbeskrivelsen til at flytte mere og mere syntaktisk information fra grammatikkomponenten over i leksikondelen, kan faktisk siges at være gået uden om adverbierne. Adverbiernes syntaks er uhyre varieret og på mange måder uigennemskuelig, og ordklassen er i øvrigt væsentlig mindre end de andre tre store ordklasser. Derfor har de ofte været lavest prioriteret af de leksikografer, der udarbejdede de syntaktiske formelle leksika. Og hvad angår den semantiske leksikalske beskrivelse, lider de under det faktum, at de alle udpeger ikke-konkrete forhold, som er nærmest umulige at opløse i semantiske komponenter som fx overbegreber og meronymi-relationer (Ruus, 1995) - den fremgangsmåde man anvender, når det gælder beskrivelsen af fx konkrete substantivers og verbers betydning. Der er dog flere danske lingvister, der har interesseret sig for en gruppe af danske adverbier, nemlig sætningsadverbier, og er fremkommet med spændende resultater om samspillet mellem semantik og ordstilling, men igen har kun et forholdsvis lille antal adverbier indgået i analyserne (Skafte Jensen, 2000), (Andersen, 1982). Alt i alt kan man sige, at adverbier traditionelt ikke har fået særlig meget opmærksomhed fra leksikograferne, men snarere fra grammatikkerne de skaber nemlig store problemer i de formelle grammatikbeskrivelser, når de skal indplaceres korrekt i syntakstræet, og de er årsag til et meget stort antal syntaktisk analyseresultater, fordi der er så mange måder at tolke deres placering på. Men arbejdet med at komme disse problemer til livs har været fokuseret på små 1 SIMPLE (Pedersen & Paggio (2004) samt er et sprogteknologisk leksikon, der fra blev udarbejdet for 12 EU-sprog med semantiske informationer - i alt ca semantiske indgange for substantiver, verbet og adjektiver 2 PAROLE (Braasch (1998) samt var forløberen for SIMPLE. I dette EU-projekt blev der fra udarbejdet leksika for 12 EU-sprog - ca lemmata for hvert sprog blev beskrevet, hvad angår morfologi og syntaks.

14 grupper af prototypiske adverbier inden for samme betydningsfelt, og analyserne er foregået top-down ud fra den samlede sætnings struktur og adverbiets betydning og ikke bottomup med udgangspunkt i det enkelte ord, som kendetegner en leksikografisk arbejdsmetode. Mit arbejde med adverbier i denne afhandling bygger på en idé om, at sandheden om adverbierne skal findes ved at undersøge dem ord for ord nedefra, samt at det er en god ide at undersøge deres syntaktiske potentiale som udgangspunkt, før man undersøger semantikken, fordi deres betydninger er så abstrakte, hvorimod syntaktiske forhold er mere håndgribelige. Man vil da opdage at de gemmer på lige så mange eller måske endda i hvert fald hvad angår deres syntaktiske potentiale endnu flere sjove hemmeligheder end ord fra andre ordklasser. Og man vil måske ved at gå syntaksvejen opnå større indsigt i deres semantik, idet der sandsynligvis, som ved andre ordklasser, er en vis forbundethed imellem, hvordan adverbier opfører sig syntaktisk set og deres betydning min hypotese er dog umiddelbart, at den er mindre klar end for de øvrige ordklasser. Det er et af målene for afhandlingen at opnå større viden om dette. Derudover mener jeg, at leksiksalsk syntaktisk viden om det enkelte adverbium vil være den rette måde inden for automatisk sprogbehandling til at opnå en begrænsning af det ofte meget store antal analysefortolkninger af sætninger, der indeholder adverbier. De syntaktiske kodninger fra leksikonnet vil simpelthen komme til at fungere som en frasorteringsmekanisme, der kasserer nogle i første omgang korrekte syntaktiske analyser, hvori et bestemt adverbium indgår, i det øjeblik oplysninger i leksikonnet siger, at det pågældende adverbium ikke er i stand til at optræde i netop denne syntaktiske konstruktionstype eller på netop denne plads i sætningen. Det største problem ved at undersøge ordklassen adverbier er, at de selvfølgelig i kraft af deres mangfoldige syntaks og meget lidt konkrete semantik - er langt sværere at fastholde, når man undersøger dem, end andre ord er. Med introspektion når man fx ikke langt, når man skal afgrænse, hvor de kan stå i sætningen, da det er min erfaring, at alle placeringsmuligheder pludselig synes mulige ikke kun hos mig selv, men også hos informanter. Endnu værre er det, som allerede nævnt, når man forsøger at kigge ind i adverbiet i et forsøg på at opløse ordet i mindre enheder. Adverbier er således også tit svære at definere i traditionelt ordbogsarbejde, og man finder da også tit meget upræcise beskrivelser af deres betydning og syntaktiske forhold, som det fx ses i følgende eksempler fra Nudansk Ordbog med Etymologi Altid: Betydning 3. udtryk for at man må være tilfreds med noget det er dog altid noget, selvom det ikke er nok det er altid bedre end ingenting Lige (som adverbium) udtryk for at noget befinder sig nær ved el. sker samtidig med el. kort tid før el. efter noget andet jeg bor lige ved stationen de bor i huset lige overfor forretningen ligger lige om hjørnet træet står lige op af gavlen det skete lige for øjnene af mig vi sidder lige og spiser jeg har lige set ham vi skal lige til at spise vi spiste lige efter han var kommet jeg har lige gjort det Nok: Betydning 3. udtryk for en bestemt følelse el. antagelse af sandsynligheden af noget = SANDSYNLIGVIS jeg tror nok han kommer han er nok i London {sjovt/..} nok udtryk for undrende eftertanke m.m.; nok står efter visse adverbier og gør at de kan stå andre steder i sætningen end ellers underligt nok har jeg ikke hørt fra ham siden jeg har sjovt nok også haft sådan en de var mærkeligt nok kommet hjem sært nok heldigt nok dårligt nok Derfor er korpusundersøgelser helt afgørende for at få reel indsigt i adverbiers opførsel. 2

15 1.2. Afhandlingens mål Afhandlingens mål er at undersøge danske adverbiers syntaks med henblik på at definere hvilke syntaktiske fænomener, der varierer fra adverbium til adverbium og derfor må regnes som værende leksikalsk betinget. Desuden skal der i afhandlingen udvikles et beskrivelsesapparat og den mængde af træk, der er nødvendige for at kunne udtrykke de leksikalske egenskaber i et (allerede eksisterende) sprogteknologisk leksikon. Undersøgelsen vil dels bestå i korpusundersøgelser og i læsning af litteratur om adverbiers syntaks. Litteratur om adverbiers semantik vil selvfølgelig blive inddraget undervejs, hvor det er relevant. En overordnet og meget vigtig del af undersøgelsen vedrørende danske adverbiers syntaktiske potentiale er at forsøge at afgrænse præcis hvilke egenskaber, der reelt er leksikalsk betinget i forhold til, hvad der generelt gælder for ordklassen adverbier, og som derfor bør beskrives af de overordnede grammatik-regler i en sprogteknologisk applikation og ikke i leksikonnet. Fx gælder det for alle danske adverbier, at hvis de kan stå til sidst i en almindelig deklarativ hovedsætning, så kan de også stå til sidst i en bisætning eller i et spørgsmål: Han køber avisen nu Han siger, at han køber avisen nu Køber han avisen nu? Det gælder derimod fx ikke for alle danske adverbier, at hvis de kan stå på adverbialpladsen mellem hjælpeverbet og hovedverbet, så kan de også stå mellem hjælpeverbet og hovedverbet i et spørgsmål: Han har heldigvis købt avisen i dag Har han * heldigvis købt avisen i dag? Det gælder fx heller ikke for danske adverbier, at de altid kan stå forrest i sætningen i det såkaldte fundamentfelt. Nogle kan, men andre kan ikke: Han vil måske komme senere Måske vil han komme senere. Han vil sikkert komme senere * Sikkert vil han komme senere Ligeledes kan mange danske adverbier, som kan stå i neksusfeltet, samtidig stå foran en adjektivfrase inde i en substantivfrase: Vælgerne er tilsyneladende ikke nær så optaget af det rekordhøje skattetryk i Danmark som politikerne -> Med anholdelsen er den tilsyneladende uendelige skikrig i de franske alper atter brudt ud Men igen er der undtagelser, og disse kan kun beskrives i et leksikon. Fx kan nemt og simpelthen ikke stå foran adjektivfraser i NP er (= præpositionssyntagmer/nomanalfraser), selvom de godt kan stå i neksusfeltet: Vi har nemt 200 sager om året nu *De nemt 200 årlige sager Medarbejderne har simpelthen haft for meget overarbejde *Det simpelthen omsiggribende overarbejde er et stort problem 3

16 Der er altså en særlig leksikalsk egenskab ved heldigvis, der udelukker ordet fra at optræde i spørgsmål og også en særlig, leksikalsk egenskab ved sikkert der udelukker ordet fra at stå i fundamentfeltet. Ligeledes er det leksikalske egenskaber, der gør, at nemt og simpelthen ikke kan stå i adjektivfraser. Denne form for information skal i en sprogteknologisk applikation nødvendigvis hentes fra leksikon-komponenten. Informationen skal sikre at adverbierne er korrekt placeret ved produktion af danske sætninger fx i maskinoversættelses-systemer. Fx kan nogle adverbier på engelsk stå sidst i sætningen, hvorimod de umuligt kan det i en dansk oversættelse. Et eksempel er adverbiet willingly, der på dansk oversættes til gerne: Mark rode a bicycle on the day of the transit strike willingly (Lit. * Mark cyklede på dagen for transportstrejken gerne) Mark ville gerne cykle den dag der var transportstrejke Informationen om, at gerne ikke kan stå sidst i sætningen, må nødvendigvis komme fra den danske leksikonkomponent i oversættelsesmodulet. Også i analyse af danske sætninger er leksikalsk viden om adverbierne vigtig, for den er en forudsætning for, at adverbiet ikke bliver knyttet til forkerte konstituenter i syntaksanalysen. Fx kan kun leksikalsk viden om adverbiet herefter nemlig at ordet dels kan udgøre et valensled til et verbum som anafor for et præpositionsobjekt, og at det dels kan være tilknyttet et verbal, men da kun stå i neksusfeltet og fundamentfeltet og ikke i slutfeltet - sikre, at man i den syntaktiske analyse af sætningen Man fastsatte værdien herefter får knyttet herefter til selve verbet fastsætte, og ikke analyserer det som værende frit adverbial. Når adverbiet er polysemt, peger en af afhandlingens undersøgelser på, at det er særligt afgørende, at syntaksanalysen er så korrekt som overhovedet muligt en korrekt syntaktisk analyse ser nemlig i mange tilfælde ud til at være den afgørende faktor ved entydiggørelse mellem de to eller flere betydninger af polyseme adverbier Disposition for afhandlingen Kernen i afhandlingen er deltaljerede korpusundersøgelser af, hvorledes et bredt udvalg af danske adverbier rent faktisk opfører sig syntaktisk i skreven tekst. Med de mange muligheder, der de senere år er opstået inden for datamatisk leksikografi med adgangen til store tekst-korpora for dansk, er korpusundersøgelser i dag en helt nødvendig og naturlig del af leksikografisk forskningsarbejde. Og med adverbier er det om muligt endnu mere en nødvendighed end for andre ordklasser, da det som nævnt er min erfaring at introspektion generelt kommer til kort med hensyn til, hvad der er syntaktisk muligt for denne ordklasse. I kapitel 6 gennemgås derfor i detaljer en korpusundersøgelse af 49 danske adverbier. Udover disse korpusundersøgelser vil følgende områder blive undersøgt i afhandlingen: I kapitel 2 gennemgås modellen for STO-leksikonnet i detaljer. Da afhandlingen i høj grad har et anvendelsesorienteret formål, nemlig at udvide STO med syntaktiske oplysninger for adverbier, et det naturligvis nødvendigt at tage udgangspunkt i, hvordan dette leksikon er opbygget, og hvordan de øvrige ordklasser er beskrevet. 4

17 Dernæst er det vigtigt at kortlægge, hvorledes adverbiers syntaks er beskrevet i andre eksisterende sprogteknologiske leksika. Kapitel 3 i afhandlingen omhandler dette emne. Det er ligeledes vigtigt at få overblik over, hvordan adverbiers roller opfattes i de formelle lingvistiske teorier, som de grammatikker, der anvendes i sprogteknologiske systemer, bygger på. Det er jo disse grammatikker, der skal kunne udnytte de leksikalske data for adverbierne fra STO-leksikonnet. Kapitel 4 i afhandlingen giver derfor et indblik i, hvordan adverbiers roller opfattes i formelle lingvistiske teorier. Sidst men ikke mindst er det vigtigt at få indsamlet den grammatiske viden, der allerede findes om danske adverbier. Og man vil med stor fordel også kunne inddrage viden om adverbier i de to grammatisk set meget velbeskrevne sprog norsk og svensk, som er tæt beslægtet med dansk. Kapitel 5 i afhandlingen giver derfor en grundig beskrivelse og sammenligning af to nye danske, en ny svensk og en ny norsk grammatiks syn på adverbier De konkrete resultater, som afhandlingen sigter på at komme frem til på baggrund af den læste litteratur og korpusundersøgelserne er for det første en beskrivelsesmodel for adverbiers kodning i STO-leksikonnet. Denne model beskrives i kapitel 7. I kapitel 8 fremlægges derpå ca. 400 leksikalske indgange, der er lavet på baggrund af beskrivelsesmodellen. Der opstilles ud fra leksikonnet bl.a. syntaktiske klasser af adverbier, og der fremlægges en videregående undersøgelse af polyseme adverbier. Endelig gives der et bud på, hvordan adverbiumsindgangene kan anvendes i formelle grammatikregler. 5

18 6

19 Kapitel 2 STO-leksikonnet 2.1. Indledning De leksikalske data om adverbier, der er resultatet af denne afhandling, skal indgå i et allerede eksisterende leksikon, nemlig STO-leksikonnet. STO er en stor dansk sprogteknologisk ordbase, der blev færdig 1. marts En ordbase er en samling ordbogsdata lagret i en database og beregnet til maskinel anvendelse i sprogteknologiske værktøjer. Det blev i sin tid besluttet at igangsætte STO-projektet, fordi informationsteknologi i dag bruges i stadig større udstrækning, og fordi man til at udvikle velfungerende danske værktøjer altid vil have brug for et stort datamatisk leksikon, der beskriver de danske ords opførsel. Sådanne værktøjer kan fx være systemer til on-line informationssøgning, hjælpeværktøjer til at oversætte tekster, systemer til talegenkendelse og -syntese, sproglige hjælpemidler for handicappede og undervisningsprogrammer. STO-leksikonnet er finansieret af statslige midler af Ministeriet for Videnskab, Teknologi og Udvikling med henblik på, at grammatik-udviklerne bag sådanne danske værktøjer kan benytte leksikonnet som den leksikalske komponent i applikationen og dermed slippe for det store arbejde, det i sig selv er at producere en sådan komponent. Ordbasen blev produceret i et samarbejde mellem Institutter på Københavns Universitet (CST og Sprogvidenskab) Handelshøjskolen i København (Institut for Datalingvistik) samt Syddansk Universitet (Institut for Erhvervsinformatik, Kolding) STO s ordforråd dækker de store ordklasser godt som det ses i tabel (1) Leksikalsk kategori Antal lemma Kun morfologiske oplysninger Både morfologiske og syntaktiske oplysninger Både morfologiske, syntaktiske og semantiske oplysninger Substantiv % 41 % 12 % Adjektiv % 55 % 13 % Verbum % 81 % 17 % Tabel (1). Lemmata i STO. Omregnet til tal er der angivet syntaktiske oplysninger i leksikonnet for substantiver, 6596 adjektiver og 5659 verber. For de øvrige ordklasser derimod adverbier, interjektioner, præpositioner, konjunktioner og pronomener har STO-projektet overtaget de morfologiske beskrivelser fra PAROLEleksikonnet, som både hvad angår leksikonmodel og leksikalske data dannede udgangspunkt for STO-projektet. PAROLE-leksikonnet blev udviklet for dansk og 11 andre EU-sprog og indeholder lemmaer for hvert sprog. Det danske PAROLE-leksikon indeholder morfologiske oplysninger for alle ordklasser, men altså kun syntaktiske oplysninger for substantiver, verber og adjektiver og dermed ikke for adverbier overhovedet. Man stod derfor faktisk på bar bund, da man i STO-leksikonnet ønskede at beskrive de danske adverbiers leksikalsk betingede syntaktiske egenskaber. Denne afhandling har derfor som et af sine 7

20 mål at opnå den viden om danske adverbier, der er påkrævet, for at man kan beskrive dem leksikalsk i STO-leksikonnet. Derudover er det også et mål, at det inventar af syntaktiske mønstre, der er nødvendige for at kunne kode adverbierne, bliver opstillet i overensstemmelse med STO-leksikon-modellen. De verber, substantiver og adjektiver, der er medtaget i STO, er udvalgt på baggrund af ordforekomster i forskellige korporaer og stammer primært fra almensprog 3. I alt er der kodet mere end opslagsord med morfologiske oplysninger, herunder ordklasse, bøjning, eventuelle stavevarianter samt for substantivers vedkommende også oplysninger vedrørende sammensætning. Af dette ordforråd er ca (jf. tabel 2.1 ovenfor) også forsynet med syntaktisk beskrivelse. En delmængde af ordforrådet er også forsynet med semantisk beskrivelse med varierende detaljeringsgrad 4. Til den semantiske beskrivelse er benyttet en betydningsinddeling svarende til den, der anvendes i en mellemstor monolingval ordbog (Nudansk Ordbog med Etymologi). De leksikografiske data i STO er opdelt i mange forskellige oplysningstyper, der er relateret på mange forskellige måder til hinanden i en relationel databasestruktur. På den måde kan en delmængde af oplysningerne udtrækkes på en fleksibel måde ud fra forskellige behov. Helt overordnet er de leksikalske data struktureret i enheder på tre adskilte beskrivelsesniveauer svarende til ords morfologiske, syntaktiske og semantiske egenskaber. Enhederne kan kædes sammen på forskellig vis, så man kan producere en samlet leksikografisk-lingvistisk beskrivelse af de enkelte opslagsord, en 'ordbogsartikel'. Hvis man fx ser på NuDansk Ordbogs indgang for ordet skade, er der to lemmaer et substantiv og et verbum - og i alt 4 hovedbetydninger: tre for substantivet og en for verbet: skade 1 subst. -n, -r, -rne 1. = ØDELÆGGELSE stormen anrettede store skader skadeserstatning skadesløs 2. en sort-hvid el. brunlig kragefugl, husskaden og skovskaden 3. en mørk rokkefisk med torne på siden af halen; latinsk navn Raja batis skade 2 verb. -r, -de, -t 1. skade ng(t) tilføje nogen el. noget en skade = BESKADIGE Disse oplysninger bliver i STO-leksikonnet beskrevet på følgende måde, idet det er afgørende for datastrukturen for det første, at der er tale om et substantiv og et verbum, for det andet at den ene af substantivets betydninger danner komposita på en anden måde end de to andre betydninger gør (skadeserstatning over for fx skaderede og skadegæller) - se figur (2): 3 Ca ord tilhører dog fagsprog og stammer fra seks udvalgte emneområder, nemlig edb, miljø, sundhed/helse, finans, forvaltning samt handel & erhverv. 4 Ca almensproglige opslagsord er beskrevet med ontologisk type, semantisk relation, argumentstruktur, selektionsrestriktioner, qualia-struktur mm. i henhold til SIMPLE-modellen (Pedersen & Paggio, 2004). Ca fagsproglige ord fra emneområdet sundhed/helse er beskrevet med ontologisk type, argumentstruktur og selektionsrestriktioner. Desuden er alle fagord forsynet med emneområdeangivelse. 8

21 Morfologi Syntaks Semantik Figur (2). beskrivelsen af ordet skade i STO-leksikonnet. Grundprincippet i den tredelte struktur er, at der skal splittes op i flere enheder så sent som muligt i databasen. Hvis ikke der således havde været to måder for substantivet skade at danne komposita på, ville alle tre betydninger af substantivet have været fælles om både den morfologiske og den syntaktiske indgang (da syntaksen er helt ens for alle tre). Fuges-forskellen forårsager med andre ord en opsplitning i to selvstændige enheder allerede på morfologi-niveauet, men som det ses i figuren kan fugle- og fiske-betydningerne fortsat deles om syntaksindgangen, og opsplitningen for disse to betydninger sker først på semantikniveauet. Denne måde at opdele data på er særdeles hensigtsmæssig set ud fra et datamatisk synspunkt, idet man derved kan formindske de overgenereringsproblemer, der skyldes flertydigheder på de enkelte niveauer. Det er vigtigt at bemærke, at det faktisk er semantikniveauet, der afgør hvilke syntaktiske og morfologiske indgange, der skal oprettes der skal splittes op i syntaksen og morfologien, hvis de forskellige betydninger opfører sig forskelligt syntaktisk og/eller morfologisk som i eksemplet ovenfor med skade Syntaktiske oplysninger STO-projektets opgave var, som nævnt i indledningen, at udvikle et leksikon med bl.a lemmaer forsynet med syntaktiske oplysninger. De lemmaer blev udvalgt ud fra den lemmakandidatliste, der også blev benyttet ved arbejdet med Den Danske Ordbog (Hjort & Kristensen, ). Hvert lemma på denne liste er bl.a. forsynet med oplysninger om, hvor frekvent lemmaet er i Den Danske ordbogs korpus på 40 mil. løbende ord (nærmere oplysninger om korpus: Hjort & Kristensen, , bind 1, s. 54). Ved at sætte mindstekravet for den frekvens, som et givet lemma skulle opfylde for at 9

22 blive kodet med syntaktiske oplysninger i STO, til 20, opnåede man netop et udvalg på lemmaer. De syntaktiske oplysninger i STO angives i syntaktiske enheder (kaldet SynU er (Syntactic Unit)) og bygger på principperne for PAROLE-modellen (Braasch, 1998). En syntaktisk enhed indeholder oplysninger om opslagsordets konstruktionspotentiale (funktionel og kategoriel valens mm.), syntaktiske funktion i konstruktioner og brug af hjælpeverbum osv. Oplysningerne udtrykkes i attribut/værdi-par, der er formaliseret i koder. Hver unik kombination af et sæt sammenhørende koder udgør et mønster. Fx står mønstret Dn0 for Description for noun med 0 argumenter, og mønstret Dv2N står for Description for verb med 2 argumenter, hvor 2. argument er et substantivsyntagme (N). I princippet består hver syntaktisk enhed af én syntaktisk Description. Denne er opdelt i to typer oplysninger (dvs. at oplysningerne står i hver sin tabel i databasen): for det første oplysninger, der angår ordet selv, og for det andet oplysninger om, i hvilken struktur ordet indgår, dvs.valensoplysninger. Ved avalente ord udelades valensfeltet. Strukturen for en syntaktisk enhed kan illustreres som nedenfor i figur (3): Figur (3) Strukturen for en syntaktisk enhed i STO Oplysninger om ordet selv indbefatter den information om ordet, som ikke beskrives via ordets konstruktionspotentiale, fx angives her, om et verbum har passiv form med aktiv betydning (fx trives), om det bøjes med have eller være, og om verbet er refleksivt eller er et partikelverbum. For substantiver vil der typisk være oplysning om, hvorvidt der er tale om et proprium eller et appellativ. Hovedparten af de informationer, der er relevante at give for ordklassen adverbier, er af denne interne type, og det er slet ikke så typisk i beskrivelsen af adverbierne at skulle gøre brug af valens-delen, som det er for de øvrige ordklasser, som vi senere skal se. Men jeg vil dog lige overordnet gennemgå valensbeskrivelsen i STO for verber, substantiver og adjektiver, da dele af det skal anvendes for adverbier også. Ved et ords valensmønster forstås både dets aritet (dvs. hvor mange led det knytter til sig), leddenes syntaktiske funktion (subjekt eller objekt fx) samt dets konstruktionspotentiale, fx om et tilknyttet led er en nominalsyntagme, et præpositionssyntagme eller en sætning. Endvidere specificeres det, hvilken præposition, der indleder præpositionssyntagmet, hvilket materiale styrelsen består af (fx et NP, en infinitivsætning etc.), konstruktionspotentialet for selve styrelsen, hvilken form for kontrol der er tale om i tilfælde af valensbundne infinitivsætninger, hvilken partikel der evt. er tilknyttet samt en lang række andre detaljer. Endelig hører det med til et valensmønster at angive, hvorvidt et led er obligatorisk eller optionelt. For verber, substantiver og adjektiver i STO benytter man et forholdsvis løst valensbegreb, idet man udover at beskrive led, som man sædvanligvis i lingvistikken er enige om, er klart 10

23 valensbundne (de obligatoriske og de optionelle komplementer som fx direkte objekt (han spiser (kage)) og komplementer tilknyttet med fast præposition uden semantisk indhold ( jeg tænker på ham)), også beskriver de såkaldte middles (Braasch et al., under udgivelse), (Somers, 1987)). Som vi senere skal se, er det denne type led som adverbier kan knytte til sig. Middles er led der befinder sig i en gråzone mellem valensbundne og ikke-valensbundne elementer. Semantisk set er de bestemt af det valensbærende led - oftest et verbum - men deres funktion og konstruktionspotentiale kan variere. De kan også være enten obligatoriske eller optionelle. Som eksempler kan gives stedsangivelser ved lokativiske verber: han bor i Spanien, han sidder på bænken, retningsangivelser ved bevægelsesverber han gik (ned/op/hen/ud/.. til gården). Fælles for disse to grupper er, at konstruktionspotentialet er temmelig frit, hvorimod det semantiske indhold i præpositionssyntagmet (sted eller retning) er fast. Endelig omfatter gruppen materiale- og instrumentaliselementer samt frie dativer. Hvad angår denne mellemgruppe, trækkes grænsen individuelt inden for hhv. verber, substantiver og adjektiver. For verberne er der defineret en række kriterier: leddet kodes, hvis det er mere eller mindre obligatorisk (som i han bor i Spanien/på Solkysten, han sidder på bænken/under bordet), hvis det er en retningsangivelse ved bevægelsesverber (han gik (ned/op/hen/ud/.. til gården)), eller hvis leddet i øvrigt anses for meget centralt for verbets kernebetydning og derfor er markant i korpus (fx jeg bød ham 1000 kroner for jobbet ). Leddet kodes derimod ikke, hvis der er tale om materiale- og instrumentalisled eller om frie dativer. For substantiverne og adjektivernes vedkommende har man ikke så præcise kriterier, men koder gråzone-leddene, såfremt de er meget signifikante i de benyttede korporaer. Generelt er korpusundersøgelser et meget vigtigt udgangspunkt for ordbeskrivelsen i STO, så vel som den er det for ordudvælgelsen, og altså hvad valensled angår især også er det for adjektiver og substantiver. Hvis et element er meget signifikant i korpus som fx ved substantivet afbræk, hvor præpositionen i forekommer i langt de fleste eksempler (et mindre afbræk i produktionen), anses det således for en del af afbræks kernebetydning og kodes som valensbundet led. Ligeledes for en markedsandel på 20 % hvor størrelsesangivelsen er så signifikant i korpus, at det må opfattes som en del af markedsandels kernebetydning. For at give en mere detaljeret beskrivelse af kodningerne i STO har jeg udvalgt den ordklasse, der umiddelbart forekommer at måtte ligge tættest på adverbierne, nemlig adjektiverne. Udover at tjene som eksempel, er det også vigtigt at få trukket præcise grænser mellem de to ordklasser adjektiver og adverbier i STO Adjektivers syntaks i STO Specifikationerne for adjektivernes syntaks er hovedsagelig udarbejdet af Costanza Navarretta (se (Braasch et al., under udgivelse)). Almindelige adjektiver defineres i specifikationerne til at være hovedkomponenter i adjektivsyntagmer (i STO-ordbasen AP, dvs. adjectival phrases), og de syntaktiske beskrivelser for denne ordklasse er opmærket med et Da (Description adjective) i ordbasen. Angivelsen af aritet (dvs. hvor mange led adjektivet knytter til sig) for den aktuelle valensramme gives som tal lige efter denne opmærkning. Da 1 - Huset er gult aritet 11

24 De resterende oplysningstyper er opdelt i to dele: 1. oplysninger om selve adjektivet og 2. oplysninger om dets konstruktionspotentiale. Den eneste oplysningstype, der hører under type 1 for adjektiver, er oplysningen om, hvorvidt det bruges attributivt eller prædikativt i en given konstruktion. Dette kodes i tabellen Self i form af to træk: ATTRIBUTIVE og PREDICATIVE. Adjektiver, som både bruges attributivt og prædikativt, får tilknyttet to Self og, som en konsekvens af dette, to forskellige syntaktiske beskrivelser. Beskrivelser, som er bundet til et attributivt Self, er opmærket med et a efter angivelsen af ariteten. Konstruktioner, der ikke har et a efter aritetsangivelse, er prædikative. Da 1 a - De borgelige partier går frem attributiv Da 1 - Berlingske Tidende gjorde Erik den Røde borgelig prædikativ Da2P-til - De er tilbøjelige til at tro på historien prædikativ Adjektivernes indbyrdes rækkefølge i attributive konstruktioner kodes ikke på syntaksniveauet, da denne oplysning er stærkt forbundet med adjektivernes betydning og anses for at tilhøre semantikniveauet. Adverbiernes indbyrdes rækkefølge på fx adverbialpladsen i neksusfeltet regnes ligeledes for at tilhøre semantikniveauet og er altså heller ikke behandlet på syntaksniveauet i STO. I attributive konstruktioner udgør substantivet pr. default den syntaktiske kerne for adjektiver, og konstruktionspotentialet beskrives derfor ikke nærmere. Det substantiv, som adjektivet modificerer, antages at svare til adjektivets eksterne argument på det semantiske niveau. Dette argument tælles som valensled, og adjektivet regnes som monovalent (ariteten er derfor 1 jf. ovenfor). Ligeledes kaldes det nominalsyntagme, som adjektivet beskriver i prædikative konstruktioner, for adjektivets eksterne argument (betegnelsen blev anvendt i EU-projektet EUROTRA, se (Braasch et al., under udgivelse). Det eksterne argument angives ikke eksplicit i beskrivelsesnavnet, men anses for default, da det eksterne argument som nævnt altid er et nominalsyntagme. en ny bil eksternt argument bilen eksternt argument er ny Da 1 a - en ny bil aritet attributivt 1.valensled (bil) underforstået til at være NP Da 1 _ - bilen er ny aritet prædikativt 1.valensled (bilen) underforstået til at være NP Adjektivernes komplementer er, som tidligere beskrevet, valensled og kaldes også interne argumenter (igen i henhold til EUROTRA-traditionen). Interne argumenter beskrives vha. en forkortelse, som står for deres syntaktiske type. I Peter er glad for sin nye bil er Peter det 12

25 eksterne argument for adjektivet glad, mens for sin nye bil er adjektivets interne argument (andet valensled). Valensrammen er derfor divalent. Det andet valensled er et præpositionssyntagme indledt af præpositionen for. Da 2 P0y -for aritet 2. valensled præposition optionelt præpositionssyntagme med nominalstyrelse I det næste eksempel beskrives en trivalent valensramme, hvor andet og tredje valensled er præpositionssyntagmer som i Peter var enig (med sin søn) (i [kritikken af skolen/at læreren havde taget fejl/hvornår de skulle rejse/at bringe sagen op for inspektøren]. Da 3 P0 P0yntqis -med -i aritet 2.valensled 3.valensled 1. præpos. 2.præpos. optionelt optionelt præpositions- præpositionssyntagme syntagme med forskellige typer styrelse En speciel gruppe prædikative konstruktioner er konstruktioner, hvor adjektivet ikke beskriver et nominalsyntagme, men en sætning, som derfor er den prædikative base. At ryge er farligt De kan også forekomme i ekstraponeret form, dvs. subjektet i kopulakonstruktionen er et formelt subjekt (ekspletivt det), mens selve sætningen, som er den prædikative base, følger adjektivet. Det er farligt at ryge Disse konstruktioner er særligt interessante i forhold til adverbierne, for deres funktion er magen til en af de funktioner, som adverbier normalt har, nemlig den at modificere en hel sætning. I (Togeby, 2003, s. 269) beskrives sådanne adjektiver således som værende adverbier med eksemplet Det er heldigt at han gik hjem. I kapitel 5 vil jeg komme nærmere ind på dette, men her vil jeg blot fastslå, at disse konstruktionstyper altså i STO-leksikonnet regnes for adjektiviske, og at det afgørende kriterium er, at de kan være prædikative det kan adverbier i ekstraponeret form ikke: det er derfor han kommer for sent - *at han kommer for sent er derfor. Der er dog adverbier, der kan optræde i prædikative konstruktioner (han er hjemme; hun er udenfor), men som alligevel ikke traditionelt inden for leksikografien regnes for adjektiver, derfor er denne test ikke helt holdbar. De sætninger, der indgår i disse typer konstruktioner, kaldes for adjektivernes interne argumenter og altså ikke for det eksterne argument, som når adverbiet modificerer et substantiv. Dette er igen i henhold til EUROTRA-traditionen. I de ekstraponerede konstruktioner svarer det formelle subjekt det ikke til noget semantisk argument semantisk og tæller derfor ikke som valensled. Eksempler på de to typer konstruktioner er følgende: 13

26 Da 1 t - At han ikke kom til et møde var usædvanligt Aritet finit bisætning Da 1 ex t - Det var usædvanligt, at han ikke kom til et møde aritet det finit bisætning (ekspletive) Det er kun nogle adjektiver, der kan indgå i konstruktioner, hvor adjektivet beskriver en sætning, og forskellige adjektiver tager forskellige typer sætninger som valensled. Fx er følgende eksempler ukorrekte *at rejse er glad, *om han kommer er glad, *om han kommer er umuligt. Derfor opmærkes typen af sætning i navnene for de relevante syntaktiske beskrivelser. Da1 - Peter er umulig. Da1i - At rejse er umuligt. Da1- Kvaliteten er tvivlsom. Da1q - Om han kommer er tvivlsomt. Der skelnes altså mellem adjektiver med et eksternt argument dette skal være et substantivsyntagme - og adjektiver, hvor argumentet er en sætningen dette er i stedet et internt argument. Hvis dette princip skal overføres til adverbierne, bør det element, som adverbiet modificerer, kaldes et internt argument. Den type led, der er komplementer til adjektiver, er ofte optionelle 5. De optionelle led til adjektiverne mærkes i navnet på den relevante konstruktion med et 0 (ud fra et princip om at følge notationen, der blev anvendt for verber i STO, hvor optionalitet også blev markeret med et 0, og hvor obligatoriskhed var default). Dette simplificeres med følgende eksempler: afhængig: syntaktisk enhed: Da2P0-af forskellig: 1. syntaktisk enhed: Da2P0-fra 2. syntaktisk enhed: Da3P0P-fra-i Jeg vil i øvrigt ikke komme nærmere end på beskrivelsen af adjektivers komplementer og valensrammer, da dette er væsentligt mere kompliceret end for adverbier. For adverbierne er det, lidt modsat af hvad der gælder for adjektiver, ordets egne egenskaber, der er relevante at beskrive syntaktisk og ikke så meget deres evne til at tage valensled. Dette er der ikke noget usædvanligt i, fx er tabellerne for verbernes egne egenskaber i STO også langt mere komplicerede end adjektivernes, som det ses i tabel (4): 5 men ikke altid, fx ikke ved adjektivet ked der tager obligatorisk PP indledt af af ked af det) 14

27 self F X P Aux M V Ægte refleksivt verbum Partikelverbum Den foreliggende description angiver en passiv konstruktion. Hjælpeverbum Modalverbum bøjes med være (have er default) Tabel (4). Typer af oplysninger i STO om verbet selv (dvs. ikke oplysninger om konstruktionspotentiale/valens) Forkortelser for adjektivernes syntaktiske beskrivelser I den følgende tabel gives en liste over de fleste af de forkortelsessammensætninger, som anvendes i navngivningen af de syntaktiske beskrivelser for adjektiver. De nævnes her, fordi nogle af dem eventuelt direkte vil kunne benyttes til adverbiernes syntaktiske beskrivelser: Forkortelse Forklaring Da syntaktisk beskrivelse (Description) for et adjektiv 1,2,3 aritet: mono-, di- og trivalent a attributiv (hvis der ikke er et a, antages at konstruktionen er prædikativ) P valensbundet præpositionssyntagme, hvor det præpositionelle komplement er et NP (default) -med -over -af valensbundet præposition 0 det valensled, der kommer umiddelbart før dette tegn, er optionelt; hvis 0 ikke angives, er leddet obligatorisk N NP n substantivsyntagme (NP) er præpositionelt komplement i et PP (et præpositionssyntagme), hvor det præpositionelle komplement også kan være en sætning t finit bisætning (at-sætning) - inkluderer alle finitte bisætninger bortset fra de interrogative q interrogativ bisætning indledt af konjunktionen om eller interrogativ hv-ord i infinitivsætning is infinitiv med subjektskontrol io infinitiv med præpositionelt objektskontrol ex formelt subjekt det (ekspletivt) C Angiver, at de efterfølgende bisætningskoder er selvstændige, adjektiviske komplementer og ikke præpositionelle komplementer som N unique som efterfulgt af NP som i Er kvinder anvendelige som embedsmænd? Tabel (5). Forkortelser for de syntaktiske beskrivelser af adjektiver i STO 15

Speciale CLM spansk. Forfatter: May-Britt Hestehauge Studienummer: 243541. Vejleder: Lektor Sven Tarp Fakultet for sprog og erhvervskommunikation

Speciale CLM spansk. Forfatter: May-Britt Hestehauge Studienummer: 243541. Vejleder: Lektor Sven Tarp Fakultet for sprog og erhvervskommunikation Speciale CLM spansk Forfatter: May-Britt Hestehauge Studienummer: 243541 Vejleder: Lektor Sven Tarp Fakultet for sprog og erhvervskommunikation En eksemplarisk metode for, hvordan man kan anvende internettet

Læs mere

Kontrolleret sprog. Indledende analyse af virksomhedernes regelsæt og sammenligning med eksisterende regelsæt

Kontrolleret sprog. Indledende analyse af virksomhedernes regelsæt og sammenligning med eksisterende regelsæt Kontrolleret sprog Indledende analyse af virksomhedernes regelsæt og sammenligning med eksisterende regelsæt Lina Henriksen, Bart Jongejan, Bente Maegaard VID-rapport nr. 1 Center for Sprogteknologi September

Læs mere

En præpositionskontekstundersøgelse

En præpositionskontekstundersøgelse KANDIDATSPECIALE Institut for kultur og identitet Roskilde Universitet ES 2015 PÅ En præpositionskontekstundersøgelse på pås præmis Camilla Hviid Ahrensbøll Studienummer: 40018 Dansk sprog som videregående

Læs mere

Dannelse og anvendelse af passiv i dansk, norsk og svensk

Dannelse og anvendelse af passiv i dansk, norsk og svensk Tartu Universitet Germansk-romansk filologi Dannelse og anvendelse af passiv i dansk, norsk og svensk Magisterafhandling af Anu Laanemets Vejledere: prof. Stig Örjan Ohlsson Skandinavistika Tartu Universitet

Læs mere

Udarbejdelse af it-ordbog Dansk-spansk Spansk-dansk

Udarbejdelse af it-ordbog Dansk-spansk Spansk-dansk SPECIALE CLM-SPANSK Opgaveskriver: Kathrine Holm Nilsson Studienr. 240762 Vejleder: Sven Tarp Spansk Institut Handelshøjskolen i Århus Udarbejdelse af it-ordbog Dansk-spansk Spansk-dansk Handelshøjskolen

Læs mere

Foreninger og lokalsamfund To casestudier af lokalsamfund på Mors

Foreninger og lokalsamfund To casestudier af lokalsamfund på Mors Foreninger og lokalsamfund To casestudier af lokalsamfund på Mors Af Ole Zielke og Jon Urskov Pedersen Indholdsfortegnelse Indholdsfortegnelse...2 1. Forord...3 2. Problemformulering...4 2.1. Indledning...4

Læs mere

- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -

- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Emneopgave Januar 2006 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Sproglig kodning af bevægelse i dansk som andetsprog En typologisk undersøgelse af andetsprogstilegnelse -

Læs mere

Anvendeligheden af lange nominalkomposita, oversat fra engelsk til dansk, i medicinsk fagsprog.

Anvendeligheden af lange nominalkomposita, oversat fra engelsk til dansk, i medicinsk fagsprog. Anvendeligheden af lange nominalkomposita, oversat fra engelsk til dansk, i medicinsk fagsprog. Udarbejdet af Kristin Andreassen Vejleder: Arnt Lykke Jakobsen, Institut for Internationale Sprogstudier

Læs mere

Begrebsarbejde i Kriminalforsorgen 1 Begrebsarbejde i Kriminalfor-

Begrebsarbejde i Kriminalforsorgen 1 Begrebsarbejde i Kriminalfor- Vejledning for Begrebsarbejde i Kriminalforsorgen 1 Begrebsarbejde i Kriminalfor- Del 1: Forretningsmæssig begrebsafklaring Del 2: Arbejdsproces Del 3: Fra begrebsmodel til konceptuel datamodel Bodil Nistrup

Læs mere

Brugen af kollokationer med præposition i juridiske fagordbøger

Brugen af kollokationer med præposition i juridiske fagordbøger Brugen af kollokationer med præposition i juridiske fagordbøger En undersøgelse af hvordan juridiske fagordbøger behandler kollokationer med præposition og et forslag til hvordan emnet kan behandles Tascha

Læs mere

Ontologibaseret teksthåndtering med sprogteknologi

Ontologibaseret teksthåndtering med sprogteknologi Ontologibaseret teksthåndtering med sprogteknologi Bolette S. Pedersen, Costanza Navarretta & Dorte Haltrup Hansen VID-rapport nr. 6 Center for Sprogteknologi Marts 2005 Center for Sprogteknologi 2003

Læs mere

Terminologiske og leksikografiske udfordringer hos e-conomic international a/s en undersøgelse af tilgange til oprettelse af en termbase i MultiTerm

Terminologiske og leksikografiske udfordringer hos e-conomic international a/s en undersøgelse af tilgange til oprettelse af en termbase i MultiTerm Cand.ling.merc, engelsk, TT CBS December 2011 Terminologiske og leksikografiske udfordringer hos e-conomic international a/s en undersøgelse af tilgange til oprettelse af en termbase i MultiTerm Specialeskriver:

Læs mere

Om mennesket. 1. udgave, 1. oplag. Copyright ved Ole Andersen. Forfatteren kan kontaktes på oa@oafi.dk

Om mennesket. 1. udgave, 1. oplag. Copyright ved Ole Andersen. Forfatteren kan kontaktes på oa@oafi.dk Om mennesket 1. udgave, 1. oplag Copyright ved Ole Andersen Forfatteren kan kontaktes på oa@oafi.dk Yderligere materiale vedrørende bogen findes på http://www.oafi.dk Århus 1999 93 typisk bølgefænomen,

Læs mere

Automatisk analyse af Zaccos og Ankiros tekstmateriale

Automatisk analyse af Zaccos og Ankiros tekstmateriale Automatisk analyse af Zaccos og Ankiros tekstmateriale Bart Jongejan, Bolette S. Pedersen, Costanza Navarretta VID-rapport nr. 3 Center for Sprogteknologi 2004 Center for Sprogteknologi 2003 Rapporten

Læs mere

LEDA-Nyt nr. 45 Marts 2008 ISSN 1603-7006 Redigeret af Inger Schoonderbeek Hansen, Henrik Lorentzen og Liisa Theilgaard

LEDA-Nyt nr. 45 Marts 2008 ISSN 1603-7006 Redigeret af Inger Schoonderbeek Hansen, Henrik Lorentzen og Liisa Theilgaard LEDA-Nyt nr. 45 Marts 2008 ISSN 1603-7006 Redigeret af Inger Schoonderbeek Hansen, Henrik Lorentzen og Liisa Theilgaard Indhold L E DA L E K S I K O G R A F E R I D A N M A R K Meddelelser fra bestyrelsen

Læs mere

Nyt fra Sprognævnet. Indhold. I anledning af.. 2001/3 september. Artikler. Bøger. Af Vibeke Sandersen. I anledning af at Erik Hansen fylder 70 år

Nyt fra Sprognævnet. Indhold. I anledning af.. 2001/3 september. Artikler. Bøger. Af Vibeke Sandersen. I anledning af at Erik Hansen fylder 70 år Nyt fra Sprognævnet 2001/3 september Indhold Artikler Bøger I anledning af at Erik Hansen fylder 70 år Hvad er apposition? Imponerende 10,3 sekunder Eksemplarisk Var det hundene han gik i? En grammatisk

Læs mere

Borgeres holdning til dyrekloning

Borgeres holdning til dyrekloning Borgeres holdning til dyrekloning Af Rikke Pedersen Ulla Vincentsen Ida-Elisabeth Andersen Teknologirådet for BioTIK-sekretariatet København 2004 1 Indholdsfortegnelse Forord... 4 Indledning... 5 Baggrund

Læs mere

- en it-baseret stavekontrol

- en it-baseret stavekontrol Rapport om projekt - en it-baseret stavekontrol Udviklet af Mikro Værkstedet A/S GrammarSoft Aps Dansk Videnscenter for Ordblindhed 1 Rapport om OrdRet - en it-baseret stavekontrol Konsortiet OrdRet, 2005

Læs mere

Velkommen til DANVA s kommunikationsguide

Velkommen til DANVA s kommunikationsguide Velkommen til DANVA s kommunikationsguide "Kommunen Kommunikerer Kloak" Printversion Indholdsfortegnelse Punkt 1. Hvorfor dette projekt introduktion og baggrund... 3 [A] Hvorfor kommunikere kloak?... 3

Læs mere

Maja Pernille Jensen Bacheloropgave dansk www.sdu.dk Foråret 2014

Maja Pernille Jensen Bacheloropgave dansk www.sdu.dk Foråret 2014 www.sdu.dk Maja Pernille Jensen Bacheloropgave dansk Foråret 2014 Indholdsfortegnelse Indledning... 3 Problemformulering... 4 Afgrænsning... 4 Fremgangsmåde... 4 Opgavens empiri... 6 Den kvalitative metode...

Læs mere

Crash test. Engelsk i dansk og risikoen for domænetab. med fokus på det teknisk-naturvidenskabelige domæne

Crash test. Engelsk i dansk og risikoen for domænetab. med fokus på det teknisk-naturvidenskabelige domæne Engelsk i dansk og risikoen for domænetab med fokus på det teknisk-naturvidenskabelige domæne Crash test Kandidatspeciale af Christina Svane februar 2010 Cand.ling.merc (engelsk translatør & tolk) Vejleder:

Læs mere

AmeriDansk? Helene Hye Christensen: En analyse af amerikansk-engelsk påvirkning af dansk i perioden 1945-1975

AmeriDansk? Helene Hye Christensen: En analyse af amerikansk-engelsk påvirkning af dansk i perioden 1945-1975 Amerikansk på Dansk Arbejdspapir nr. 6 Sommer 2011 Helene Hye Christensen: AmeriDansk? En analyse af amerikansk-engelsk påvirkning af dansk i perioden 1945-1975 1 AmeriDansk? 1. Indledning... 3 1.1. Forskningsstand...

Læs mere

EVALUERING AF SOCIAL COACHING STØTTE TIL FORANDRING

EVALUERING AF SOCIAL COACHING STØTTE TIL FORANDRING EVALUERING AF SOCIAL COACHING STØTTE TIL FORANDRING Af Ivan Christensen, Anne Sørensen & Christoffer Zeuthen Socialt Udviklingscenter SUS 1 INDHOLD 1. INDLEDNING... 3 KORT OM SOCIAL COACHING, FUNDAMENTET

Læs mere

Errboe, van Mulligen & Frederiksen: Strategier i andetsprogstilegnelse

Errboe, van Mulligen & Frederiksen: Strategier i andetsprogstilegnelse 1 af 62 Indholdsfortegnelse Forord...2 1. Indledning og problemformulering...3 2. Historisk udvikling for strategier...5 3. Definitionen på strategier...7 4. Sammenligning og analyser af taksonomier...9

Læs mere

Punkt 2. "Kommunen Kommunikerer Kloak" Printversion

Punkt 2. Kommunen Kommunikerer Kloak Printversion Punkt 2. "Kommunen Kommunikerer Kloak" Printversion Punkt 2. Sådan gør du Dette er projektets værktøjskasse. Værktøjskassen kan benyttes som en trin for trin vejledning, der fortæller, hvordan en kloakforsyning

Læs mere

Indledning og problemformulering

Indledning og problemformulering Indledning og problemformulering Jeg har fået nyt job i IT- og Telestyrelsen. Stillingen er knyttet til kontaktcenteret for www.borger.dk. Opgaverne er, sammen med 7 kolleger, at besvare spørgsmål fra

Læs mere

Indholdsfortegnelse. Problemfelt... 3. Problemformulering... 7. Arbejdsspørgsmål... 7. Kvalitativ og kvantitativ metode... 9

Indholdsfortegnelse. Problemfelt... 3. Problemformulering... 7. Arbejdsspørgsmål... 7. Kvalitativ og kvantitativ metode... 9 Indholdsfortegnelse - 3F s nye tillidsrepræsentantuddannelse 4. semester 2012 Indholdsfortegnelse Indledning... 3 Problemfelt... 3 Problemformulering... 7 Uddybning... 7 Arbejdsspørgsmål... 7 Metode...

Læs mere

Køge Kommunes Biblioteker. Biblioteksbrugerne i Ejby og Bjæverskov undersøgelse af brugerne og deres benyttelse af Ejby og Bjæverskovs biblioteker

Køge Kommunes Biblioteker. Biblioteksbrugerne i Ejby og Bjæverskov undersøgelse af brugerne og deres benyttelse af Ejby og Bjæverskovs biblioteker Køge Kommunes Biblioteker Biblioteksbrugerne i Ejby og Bjæverskov undersøgelse af brugerne og deres benyttelse af Ejby og Bjæverskovs biblioteker Rapport 3. december 2009 Udarbejdet af Anne Sophie Olsen

Læs mere

Domænetab: engelske låneord i Würth Danmark A/S produktbog. Hvad betyder de egentligt?

Domænetab: engelske låneord i Würth Danmark A/S produktbog. Hvad betyder de egentligt? Domænetab: engelske låneord i Würth Danmark A/S produktbog. Hvad betyder de egentligt? Speciale, cand.ling.merc. engelsk Handelshøjskolen i Århus Iben Lehmann Rasmussen, juni 2008 Vejleder: Birthe Mousten

Læs mere

1. Indledning Fraseografi kalder man i den internationale forskning den gren af sprogleksikografien, der udarbejder fraseologiske opslagsværker.

1. Indledning Fraseografi kalder man i den internationale forskning den gren af sprogleksikografien, der udarbejder fraseologiske opslagsværker. 201 Ken Farø* Idiomer på nettet: Den danske idiomordbog og fraseografien (http://www. idiomordbogen.dk) Center for Leksikografi, Aarhus Handelshøjskole 2003. Hovedredaktør: Vibeke Vrang. Medredaktører:

Læs mere