DEPENDENSSTRUKTURER I CONSTRAINT GRAMMAR SYNTAKS FOR PORTUGISISK. Eckhard Bick. Abstract

Størrelse: px
Starte visningen fra side:

Download "DEPENDENSSTRUKTURER I CONSTRAINT GRAMMAR SYNTAKS FOR PORTUGISISK. Eckhard Bick. Abstract"

Transkript

1 DEPENDENSSTRUKTURER I CONSTRAINT GRAMMAR SYNTAKS FOR PORTUGISISK Eckhard Bick Institut for Lingvistik, Århus Universitet, Nordre Ringgade, DK Århus C tel: , fax: , e- mail: lineb@hu m. aa u. dk Abstract The paper prese n t s some syntactic aspects of an auto m a tic gram m a r - and lexicon - based parser for unres tricte d Portug ue s e text, ultima tely inten de d for applicatio n s like corpora tagging, gram m a r teaching and machine tran sla tio n. Gram m a tical rules are formulated in the Constraint Grammar formalism (CG) and focus on disambiguation and robu s t n e s s. In spite of using a highly differen tia t e d tag set, the parse r yields correct ne s s rates - for unrest ricte d and unknown text - of over 99% for morp hology/pos and 97-98% for syntax (where work is still in progres s), even when geared to full disam big u a tio n. Among other things, argu me n t struct u r e, depen d e n cy relations and subclau se function are treate d in an innovative way, and the autho r argues that the struct u r al infor m a tio n conten t of a "flat" CG- based syntactical descrip tio n can be augme n t e d in such a way that auto m a tic tran sfo r m a t io n into traditional tree struc t ur e s (like in DCG and PSG) is made possible. The parser uses valency and sema n tical class infor ma tio n from the lexicon, but disa m bigu a tio n on these levels is still experi me n t al. The syste m runs at about 100 words / s e c on a 100 MHz Pentiu m based Linux syste m, when using all levels. Morphological and POS disam bigu a tio n alone approac h 1000 words / sec.

2 1. Oversigt I denn e artikel præse n te r e s en morfologisk- syntak tisk parser for fri portugisisk tekst, hvor der anvende s Constr aint Gram m a r til disa mbiguering af ikke kun ordklas se r og morfologiske tags, men også depen de n s - og valensfor h ol d, samt ledsæt ni nger s funktion. Parsere n er udviklet som led i min Ph.D.- forskning om autom a tis k analyse af portugisisk. Projektet har en leksikografisk baggrun d (beskrevet i mit cand.mag.- speciale) og et maskin over s æ t t els es - persp ek tiv, men i det følgende vil det være det syntak tis ke niveau, der står i forgru n d e n. Især vil jeg diskute re de særlige egenskaber ved en funktionelt udrettet, "flad" dependensgram m a tik, og vurdere mulighede r n e for en auto m a tis k transfor m a tio n til egentlige træs tr u k t u r e r. Selv om arbejdet med parsere n ikke er afsluttet endn u, vil jeg forsøge en evaluering af nogle foreløbige kvantitative resultate r. Endeligt skal en række eksem pels æ t ni nge r og omfatte n d e taglister gøre det muligt for læseren selv at vurdere parsere n s notationelle koncept i forhold til andre systemer. 2. Baggrund De fleste ord i natursprogstekster er - isoleret set - flertydige med hensyn til ordklass e, bøjning, syntaktis k rolle, seman tisk indhold m.m. Det er sætningskonteksten (foruden den indholdsmæssige samenhæng og læserens "viden om verden"), der afgør hvorda n ordet skal forstås. Constraint Gra m m a r (CG), som den er udviklet af Helsinki- skolen (fx. Karlsson et.al., 1995) er en gram m a tis k metode der søger at genne mf ør e en såda n éntydiggørelse (disambiguering) ved at opstille regler for hvilken af et ords mulige læsninger der skal vælges og hvilke læsninger der skal forkaste s i en given sætningsko n t e k s t. I selve parsere n bliver reglerne kompileret til et comp u t e r p r og r a m, der som input tager tekst hvor hvert ord har fået tilføjet tags for alle dets mulige morfologiske og ordklas se - læsninger af en leksiko n - baseret tagger. Som outp u t leveres for hver ordfor m kun én taglinie, med den korrekte grundfor m, ordklas se m.m. (1) "<nu nca >" "nunca" ADV "<como >" "como" <rel > ADV "como" <inter r > ADV "como" KS "como" <vt> V PR 1S VFIN "<peixe >" "peixe" N M S "<$. >" [ADV=adverbiu m, KS=subor dineren de konjunktion, V=verbu m, N=subs t a ntiv, PR=præ se n s, S=singularis, M=mask ulin u m, 1=1. pers o n, VFIN=finit verbu m, <rel > = r elativu m, <interr > = interrogativum, <vt> = m o notransitiv] De fire læsninger af ordfor m e r n 'como' kaldes i CG- terminologien en kohorte. En typisk CG- regel til disam biguering af denn flertydighe d er fx. følgende: 2

3 =! (VFIN) (NOT *- 1 VFIN) (NOT *1 VFIN) [vælg (=!) for enhver ordform (@w) læsningen VFIN (finit verbum) hvis der ikke (NOT) - hverken til venstre (*- 1) eller til højre (*1) - findes et andet ord der kan være VFIN.] 1 Ved først at tilføje ("mappe") alle 2 mulige syntaktiske funktioner til ordfor m e n udfra dens ordklas se, bøjning m.m., og herefter at disam biguer e den ne syntaktiske flertydighe d, kan Constr ain t Gram m a r også bruges til syntak tis k parsing, som det fx. er sket i Bank- of- English- projektet (200 millioner ord, Järvinen, 1994). (3) "<nu nca >" "nunca" "<como >" "como" <vt> V PR 1S "<peixe >" "peixe" N @SC=subjekt pr æ di pr æ dikativ] Tilføjelsen af de mulige syntaktis ke tags (@) har i eksem plet resulteret i firedob belt syntak tis k ambiguitet for peixe. Læsningen som direkte objekt (@ACC) kan udvælges positivt med en =! - regel der udnytter verbets transitivitet, men den kan lige så godt fremstå indirekte 3, - ved at være den sidste overlevende læsning, efter at CG- regler har forkastet de andre: =0 (@SUBJ) (0 N) (NOT *- 1 V3) (NOT *1 V3) [forkast (=0) subjektlæ s ni ngen hvis ordet (0) er et substa ntiv (N) og der ikke findes et verbum i 3. =0 (@SC) (NOT *- 1 <vk>) (NOT *1 <vk>) [forkast subjektpr æ dikativlæs ningen (@SC) hvis der ikke findes et kopulaverbu m (<vk>) i =0 (@OC) (NOT *- (NOT [forkast objekt pr æ dikativlæ sningen (@OC) hvis der ikke findes et direkte objekt (@ACC) i sætningen] 4 1 Reglen er forenklet, idet den foruds æ t t er at enhver periode indeholder minds t ét finit verbum, hvad der ikke altid er tilfældet i overskrifter, udråb o.l. Reglen kan gøres mere sikker ved at kræve et punkt u m (*1 PUNKTUM) eller udnytte den mulige valensrelation mellem det transitive comer og den 'sikre' NP peixe (0 <vt >) (1C NP). 2 Også i mapping - fasen anvendes constraint- regler, og listen over mulige syntaktiske funktioner for et bestem t ord kan således gøres kontekst- afhæ ngig (og dermed kortere). 3 Det er denne indirekte disam biguering, der er mest karakteristisk for Constraint Grammar, og her ligger en vigtig årsag til metodens robust he d: selv sjældne eller ufuldst æ n dige konstruktioner vil få minds t én analyse - nemlig den der overlever flest forbud s regler. Parseren foretrække således som regel en struktur, der er "næsten rigtig" frem for en, der er "temmelig forkert". 4 Alle anførte regler gør brug af "ubundne" kontekstbetingelser: *- 1 = kontekstbetingelsen søges opfyldt fra og med det 1. ord til venstre (et eller andet sted til venstre) *1 = kontekst beti ngelsen søges opfyldt fra og med 1. ord til højre (et eller andet sted til højre) Man kan også bruge "bundne" kontekstbetingelser, fx - 2 = andet ord til venstre, 3 = tredje ord til højre. De "bundne" kontekstbeti ngelser kan i princippet gengives som n- gram- regler (som brugt i mange probabilistiske parsere), mens de "ubund ne" (*- kontekst er) er mere CG- 3

4 CG- gram m a tikker er først og frem me s t blevet beskrevet for engelsk (fx. Karlsso n et.al., 1991), men der findes - i hvert fald på det morfologiske niveau - projekter for flere andre sprog fra såvel den germa n s k e, roma ns ke og finno- ugriske sprogfa milie (svensk, tysk, frans k, finsk m.m.). En moden CG- gram m a tik for det morfologiske niveau (ordklass e - disambigue ringe n m.m.) består typisk af regler. For engelsk opgives fejlprocente r på under 0.3% ved en disam bigueringsgra d på 94-97% (Voutilainen, 1992). 3. "Flade" træstrukturer i CG- syntak s 3.1 Syntaktisk form og syntaktisk funktion I min parser, som i andre Constr aint Gram m a r - syste me r, benytter jeg mig af en "flad" repr æ s e n t a tio n af syntaktis k strukt u r. Beskrivelsen indeholder infor m a tio n om både syntaktisk funktion (fx argume n t e og konstit ue n t s t r u k t u r (syntaktisk form ). Den sidste bliver markeret ved hjælp af dependens markører (<, >) som er rettet mod det pågældende syntag m e s hoved og samler konstit u e n te n til en kohær e n t helhed med implicitte syntagm egr æ n s e r. Hvor hovedet ikke er hovedverbe t, bliver det anført ved pilespidsen (fx N for nominal- hoved, A for adjekt - hoved 5 ). Dependensmarkører bliver enten hæftet til de funktionelle @N<PRED), eller står, ved visse beste m m e r led, alene for [bestemmer - ] prænominal). Idet hvert ord således kun behøver at "huske" sin umiddelba r e depen d e n s r ela tio n (dvs. hvad det selv er depen d e n t til), kan hele den syntak tis ke stru k t u r beskrives lokalt (som ordrelateret tag), - som i en uro, hvor den enkelte tråd kun "kender" nøjagtig 2 af uroens mange faste dele: i den ene ende den stang den selv hænger i (hovedet, som dependens markøren peger på) og i den anden ende det objekt (eller den stang) der hænger i tråden (dependenten, som dependens markøren peger væk fra). Hvis bare man skriver ned for hver del i uroen hvilken anden del den skal hænge i, kan man faktisk godt skære den i stykker og gemme den i en skotøjsæske - den strukturelle information bevares 6. Jeg vil her skelne mellem 3 hovedtyper af konstituentstrukturer, som efterfølgen de eksem plificeres: specifikke. 5 Ved et adjekt hoved forstår jeg kernen i et adjektiv- eller adverbialsyntag me. Også attributivt brugte participier tilhører adjektkategorien. 6 At den strukt urelle information både markeres og processeres lokalt (på ordplan) er faktisk kongstanken i CG's syntaktiske filosofi, og jeg vil i afsnit 3 diskutere fordelene (og ulemperne) ved en sådan "flad" beskrivelse, og vise hvordan selv mere komplekse depende nt er (ledsætninger m.m.) kan håndteres på denne måde. 7 Reglen udsiger, at der i et syntagme ikke kan være to argumen ter med samme syntaktiske funktion, med mindre der er tale om koordination. Fx kan hovedverbet i et sætnings syntag m e 4

5 a) argumenter b) frie adjunkter c) bestem m er - adjunkter valens valensbunden ikke valensbunden ikke valensbunden blokeringsregel 7 fokuserbarhe d a) Argumentstr uktur: gyldig (dog ikke ved koordin atio n) kan fokuseres /isoleres ved kløvning ikke gyldig kan fokuseres /isoleres ved kløvning ikke gyldig kan ikke isoleres ved kløvning Argume n t Hoved Argume n t João come V VFIN <vt carne João spiser kød. quer V VFIN <x jogar V AUX< [Han/hun] vil spille rico ADJ <+em em ouro rig på guld Dependensforholdet er for argumenternes vedkommende også markeret i tråden s øvre ende: hovedet bærer en valens m a r k ø r: en tag som <vt > ('monot r a n si tivt verbu m'), for eksem pel, "forventer" et direkte objekt (@ACC) et eller andet sted i sætningen 8. Rico em ouro er et eksempel på hvordan beskrivelsen håndter e r flere hierarkiske niveauer: præpo sitione n em er hovedet for et præpositionssyntagme (dette markeres på dependenten ouro men samtidigt selv argume n t for adjektivsyntag m e t s hoved rico (markere t I mods æ t ni ng til engelsk og dans k kan et prono mi n alt subjekt på portugisisk inkorpor e r e s i det finitte verbu m (fx. quer jogar ), og skal derfor beskrives ikke som sætnings ko n s tit ue n t, men som (fakultativ og valens styret) konstitue n t i verbalsyntag m et. b) Struktur med frie adjunkter: Adjunkt Hoved Adjunkt Ontem ele veio V VFIN muito tarde I går han kom meget sent. Zanga d a saíu V sozinh a Sur gik [hun] (ud) alene. således kun styre ét akkusativ- objekt. Reglen gælder netop kun for argumenter og ikke for andre - frie - konstituenter (her kaldet for adjunkter). 8 I en rent syntaktisk samme n h æ n g anses valens m arkører dog for sekund æ re i forhold til de primære tags (@- tagsene), og et ord kan have en lang række af (potentielle) valens m arkører, og stadigvæk være syntaktisk éntydigt beskrevet igennem tag. Kun de (syntaktisk) primære tags skal disam bigueres på det syntaktiske niveau. Valensm arkør disa m biguering kan dog være et nyttig redskab på et højere analyseplan, hvor der tilsigtes polysemi differentiering (jf. afsnit 4). 5

6 Frie adjunkter er ikke valensstyret og dependensen markeres derfor kun ved dependenten: adjunkt - adverbialer (@ADVL 9 ) peger på hovedverbet, og frie (adjunk t - ) prædika tiver peger på en nominalgr u p p e (ofte subjektet, der igen kan være inkor po r e r et i det finitte verbu m). c) Struktur med bestemmer - adjunkter: Præno min al Hoved Postno min al O DET <art poeta N M S flumine nse grande Den store digter fra Rio. caro ADJ M S demais dyr for [dyr] mais ADV <qua n t interessado PCP M S mere interesseret Bestemmere er de dependenter, der er tættest bundet til syntagmehovedet, og man kan argume n t e r e, at en beste m m e r s syntaktiske funktion netop kun er 'bestem m e r', og at en yderligere præcisering af dens funktionelle rolle (attribu t, kvantifikato r m.m.) allerede fremgår af dens ordklas se - tag og de leksem s p ecifikke sema n tis ke træk. Jeg nøjes derfor med en ren dependens markering (dvs. uden funktionel tag på pilens "åbne" side). 3.2 Syntaktisk information sind hold og ækvivalente træstrukturer Spørgsm ålet er nu, om det på den ene eller ande n måde er muligt, at omdanne den beskrevne flade struktur til en træstruktur, som man kender den fra mere "traditionelle" beskrivelser (DCG 10, PSG 11 m.m.). Og, vil der i så fald være tale om infor ma tion s t a b, eller, modsa t, øget ambiguitet? Begge dele, foreko m m e r det mig. På den ene side ville det koste informationsindhold, at erstatte funktionelle og dependens - tags med en ren konstituentstr uktur ("bracketing") 12, især for verbalkomplementeringen og på leds æt nings niveau, hvor mit syste m er mest differentieret (funktion og depen d e n s markere s), og i noget mindre grad ved ad- N- og ad- A- konstruktionerne (kun dependens markeres, og argument - /adjunkt - skellet ekspliciteres nor malt kun igenne m syntagm e h ove de t s valenstags, og ikke igennem et funktionelt tag for det dependente led, jf. 3.1 c). På den anden side vil nogle tilfælde af under s pe cifikation af depen d e n s f o r h ol d blive synliggjort, når der opbygges en eksplicit træstruktur, som fx: efter postno mi n al der selv indeholde r et nominalt hoved:... o gigante Venceslau comedor de gente famoso... 9 valensbun d n e circum s ta n tielle adverbialer tagges (adverbialobjekt), og præpo sitions synt ag m e r, der ikke kan erstattes med rene adverbier, tagges (præpositionalobjekt). 10 Definite Clause Gramm ar 11 Phrase Structure Gram m ar 12 Selvfølgelig kan man så vælge - når der skal transfor m eres fra "flad" til træ- beskrivelse - at "berige" den klassiske phrase - structure - notation ved at bevare de funktionelle og depende n s - markører fra CG- notationen. 6

7 @N< I denne sætning kan famoso syntaktis k relateres til: - gente (forbydes dog af genus - kongruenskrav) - comedor (den rigtige løsning udfra princippet om syntagmekohæsion eller "close attachment") - Venceslau (usand s y nligt hoved for et adjektiv- post no mi n al, fordi der er tale om et egennavn) - gigante (kernen i den hierarkisk øverste NP- parente s i udtrykket) ii) koordinationsproblemer, fx enkelt- vs. dobbelt- tilhæftning af (postnominal):... cinco homens e quatro mulheres do (prædika tiv) efter mellems t å e n d e nominale gruppe r (som viu o amigo, exausto... - não viu nenhu m a @<PRED Her er den første sætning flertydig ved han- køns - subjekt, hvor præ dika tivet kunne pege på både subjektet eller objektet; den ande n sætning er ligeledes syntaktis k flertydig (denne gang ved hun- køns - subjekt), men ville kunne udrede s sema n tis k (løsninger kan ikke være udmattede). Som det fremgår, ville mulige løsningss tr a tegier involvere fx. kongr ue n s [i (i), i det minds te for portugisisk], minimal attach m e n t [eller minimal coordination], og semantisk kongruens mellem hoved og bestemmer [i (iii)]. Samtidigt er det dog vanskeligt at se hvorda n nogen som helst primæ r t syntak tis k beskrivelse skulle kun n e hån d ter e denn e type ambiguitet, - hvorfor den "flade" beskrivelses "elegante under s p ecifikation" måske end d a burde betragte s som den bedste eller i hvert fald mest pragma tiske løsning. 3.3 Automatisk transformation Følgende skridt kan udgøre skelettet af en algorit me til opbygning af konstituenttr æer udfra en "flad" dependensbeskrivelse som den er foreslået i min parser: 1. Alle adno mi n aler og adverbielle adjekter hæftes til deres hoveder, defineret som det første ord af egnet ordklass e, der mødes i den af dependens markørerne (>, <) angivne retning. De i skridt (1) etablerede syntagm e r vil herefter flyttes og koordiner es som helhed er [skridt (4) og (2)]. 2. Koordinator e r betragtes som intra - syntagm a tisk, hvor et skridt - 1- elemen t skal krydse dem for at finde et hoved af egnet ordklass e. Ellers koordineres funktionsækvivalente ord/synagmer på det højest mulige niveau der ikke bryder unique ne s s princippet. 7

8 3. Ledsætningsgrænser introduceres, hvor 2 ukoordinerede argumenter kommer i konflikt pga. blokeringsreglen, og mellem dependensmarkører (af sam me niveau) der peger i mods at t e retninger. 4. Argu me n t e r og adju n k te r på (led)sæt ning s niveau (hvad enten de er ord, syntag me r eller hierarkisk lavereståe n d e ledsæt ni n ger) hæftes til (hovedverbum) i den udpegede retning, medmindre der er en mellemstående ledsætningsgrænse - i dette tilfælde vælges det førstkom efter den anden (komplementære) ledsætningsgrænse, osv. Den gradvise introd u k tio n af hierarkiske parentes e r (eller træforgre nings se k tio ne r) kunne tænkes at foregå som i følgende eksem pel: a) rå "flad" notation: O pai de o menino que venceu comprou dez cervejas. <rel> b) tilhæfting af prænominaler: (O pai ) de ( o menino) que venceu comprou (dez cervejas). <rel> c) tilhæftning af postno minal relativ og etablering af PP: (O pai ) ( de (( o menino) que venceu )) comprou (dez cervejas). <rel> d) afsluttet dependen sbeskrivelse af sætningens førest NP: ((O pai ) ( de (( o menino) que venceu ))) comprou (dez cervejas). <rel> e) (led)sætningsgr æ nse r (markeret ved - ) introduceres pga. sammen stø d af ukoordineret og (uniquene ss princip), samt subjekt / o bjekt - tilhæftning: (((O pai ) ( de (( o menino) - (que venceu)- ))) comprou (dez cervejas)). <rel> Jeg har skrevet et Perl 13 - program, der realiserer nogle af disse principper 14 og transformerer den flade ordbaserede syntaktiske struktur til en mere traditionel træstruktur, hvor konstituenthierarkiet og syntagmegrænserne synliggøres, og hvor de kompleks e konstitue n t e r med deres form og funktio n indføjes som selvstæ n dige størrelser imellem orden e. Nedenstående en analyseret sætning før og efter transformationen: (5) anlyseret tekst, i "flad", ordba se r e t CG- notation: 13 Et progra m m e rings s p rog, der er særligt velegnet til strengma nip ulation og sproglige opgaver. 14 Program m e t er eksperimentelt, og opbygger - hvor CG- beskrivelsen unders pecificerer - kun én ud af flere mulige træstrukturer. 8

9 ordfor m grundfor valens & ordklasse & syntaks m semantik bøjning *a [a] <art > DET F crise [crise] <sit > N F apura [apurar] <vt > <sn > V PR 3S VFIN o [o] <art > DET M paladar [paladar] <ano s t > <fh > N M de [de] <sa m - > o [o] <- sam> <art > DET M consumid [consu mir <DERS - or> N M or ] e [e] valoriza [valorizar] <vt > <sn > V PR 3S VFIN o [o] <art > DET M dono [dono] <H > N M de [de] restaurant [restauran <inst > N M e te] que [que] <rel > SPEC N< pilota [pilotar] <vt > <vh > V PR 3S VFIN a [a] <art > DET F própria [próprio] <jn > ADJ F cozin h a [cozin ha] <ejo > N F [ordklasser: DET=deter miner, N=noun, V=verb, PRP=pre position, KC=coordinating conjunction, SPEC=specifier- pronoun, ADJ=adjektiv; bøjning: S=singular, P=plurar, M=male, F=female, PR=present, 3S=third person singular; derivation: <DERS - or> = s u ffiksderivation på '- or'; no main o nt of N< =finite subclause functioning as postnominal; valens: <art > = a rticle, <rel> =relative, <vt> = m o n o transitive verb; semantik: <H> =h u m a n, <sit> = situation, <ejo> =functional place, <inst > =institution, <anost > = a n atomical bone structure; selektionsregler: <fh> = h u m a n feature, <sn> = h as non- human subject, <vh > = h a s always human subject, <jn > has non- huma n head; ortografi: <sa m - >&<sam > = fi rst and second part of fused expression] 9

10 (6) samme tekst, efter transformation til træstruktur, med indføjede syntagm e - tags og hierarkis k F S *a [a] <art > F S crise [crise] PR 3S IND VFIN apura [apurar] <vt > <sn M S o [o] <art > M S paladar [paladar] <anost > <fh> de [de] <sam - > M S o [o] < - sam> <art > M S consumid [consumir] <DERS - or> e PR 3S IND VFIN valoriza [valorizar] <vt > <sn M S o [o] <art > M S dono [dono] <H> de [de] M S restaurant [restaurante] <inst > e M/F S/P que [que] <rel > PR 3S IND pilota [pilotar] <vt > <vh > VFIN F S a [a] <art > F S própria [próprio] <jn > F S cozinha [cozinha] <ejo > [@H=head, np= n ou n phrase, pp= p r e po sitional phrase, fcl=finite clause, ':'=sepa rator for function and form] 4. Hvilken slags Constraint Grammar I princip p et er CG en robu s t disa mbigue ring sfilosofi, der ikke på én gang genererer en hel analyse med en beste m t "lovlig" sætnings s t r u k t u r, men acceptere r ethvert input og mejsler bort hvad der ikke kan være del af nogen (tilladt) strukt u r. Her er hverken mejsletek nikke n (regelsætte t) eller mejsleredskaberne (regel- compilerne) bestemt af CG- idéen som sådan. Hver billedhugger bestemmer selv hvordan han vil forme sit værk. Og dog... Historisk set uds pringe r CG fra morfologisk analyse, de fleste syste me r benytter sig af en morfologisk toniveau - analyse (TWOL, jf. Koskennie mi, 10

11 1983) som præp r oce s s o r, og fokusere r på morfologiske træk og ordklass er. Den gram m a tis ke beskrivelse er derfor i høj grad ordbase r e t og impleme n te r e s ved at hæfte tags til ordfor m e r. "Flad" syntaks er en naturlig konsekven s af dette. Men uden specielle depen de n s f or bin d els er kan en såda n flad beskrivelse kun fungere tilfreds s tillende, hvor et enkelt ord bærer hele vægten af et syntagm e s funktion. Der vil uvægerligt være proble mer med depen de n s f o r h ol d der involverer flere forskellige syntaktiske niveauer. Således løber en CG- beskrivelse uden (funktionelle) ledsæt ni ngst ags ind i vanskelighede r som følgende:? (Led)sætningsgr æ n s e r, selv hvor de synliggøres, er ikke udlagt hierarkisk, hvorfor der kan være proble mer med uklare sætnings tilhør sfor h ol d (fx efter indsku d t e relativsæt ni nger).? Visse valenst r æ k "udfyldes" ikke altid, som fx. i tilfælde af "manglende" subjek t på engelsk ('Visiting the Louvre was not his only reason for coming to Paris'), eller manglen de akkusa tiv- objekter ( that/ q u e / a t - sætninger efter "kognitive" verber).? "Overskyden d e" argume n t e r pga. uklare tilhørsfor h old mht. sætnings hie r a r ki, som i O perigo de os inimigos atacare m à noite era imanente., hvor både perigo og inimigos er subjekter, noget der er imod blokerings regel, og kun kan løses ved at løfte det andet subjekts hovedverb u m (atacare m) ud af matrixsæ t ni nge n og beskrive det som (ledsætnings - )argument til den forudgående præposition 'de'.? Nedsat informationsindhold i sammenligning med en træstruktur (jf. ovenfor). Jeg mener at det ved at skelne mellem CG som disam bigue ringste k nik på den ene side, og den udmejslede gram m a tiske beskrivelse på den anden side, er muligt at skabe en form for flad repr æs e n t a tio n der er funktionelt ækvivalent til træstrukturer og som kan håndtere argument - og valensstrukturer på en hierarkisk måde. Min metode har været (a) at forsyne alle de syntaktiske tags med "retted e" depen d e n s m a r k ø r e r (jf. ovenfor), og (b) at hæfte 2 tags til de centrale forbinderord ("complementizer" som: subordinerende konju n k tio n e r, relativer og interrogativer) i finitte og absolut te ledsæt nin ge r, samt til infinitiver, gerundier og participier i infinitte ledsætninger 15. Disse ord vil så bære både en "indadven d t" tag (@...) der beskriver deres funktion i ledsæt ni ng e n, og en "udadven d t" tag (@#...) der beskriver ledsæt ninge n s egen ledfunktion i sætningens dependens hierarki. Teknisk set tags tags som to adskilte lister, således at "indadven d t e" og "udadven d t e" tags kan disam bigue re s uafhæ ngig af hinan de n, af distinkte regelmod ule r. (7) Sabe [saber] <vq> V PR 3S que [que] os [o] <art > DET M proble ma s [proble ma] N M 15 En anden metode til funktionel tagging af ledsæ tninger beskrives af Voutilainen (1994). Her er det hovedverbet, der bærer ledsæ tni ngens tag (...@), mens dependen s f or h olde ne gøres mere eksplicitte ved at indsæt te markører for ledsæt ni ngsgræ n s er, og ved at skelne mellem argument er af henhol dsvis finitte og infinitte verbaler. 11

12 são [ser] <vk> V PR 3P graves [grave] ADJ M/F $. [@FMV = finite main <ACC = finite subclause, functioning as direct (accusative) object attached to a main verb to the = subor = prenominal = subject for a main verb to the = subject complement for a (copula) verb to the left, V = verb, KS = subordi nating conjunction, DET = determiner, N = noun, ADJ = adjective, PR = present tense, IND = indicative, 3S = third person singular, 3P = third person plural, M = male, F = female, S = singular, P = plural, <art > = article, <vq > = cognitive verb, <vk> = copula verb] 5. Et teleologisk bedømmelsesperspektiv Når man sam m e nligner forskellige syntaktiske beskrivelser, udgør informationsindhold og konstituentstruktur kun to af de mulige bedømmelsesperspektiver, og begge må ses i lyset af et bestemt teoretisk baglan d, som fx funktionel (FG) eller generativ gram m a tik. Det kan imidlertid være interess a n t at se på hvilke praktis ke anvendelser en beste m t beskrivelses m o d el retter sig imod. Her er mit eget pers pektiv maskinover s æ t t else (MT), og aspekter som de følgende vil derfor få tillagt særlig vægt:? Detaljerede ordfølgeuaf h æ n gige funktionelle tags gør det nem me r e at transformere kildesprogsstruktur (SL) til målsprogsstruktur (TL), uden at skulle introd uc er e for mange indviklede transfor m a tio n s r egler. Således kan den danske hoveds æ t ni ngs - ordfølge SVO med subjekt i forfeltet etableres direkte på trods af den mere frie portugisiske ordstilling: (8a) O mais (8b) o mais (8c) - > mere Det er af stor betydning for polyse midifferen tieringe n at vide, hvilket af et ords potentielle valens m ø n s t r e der er blevet realiseret i en given (led) sætnings ko n t e k s t, og hvilken sema n tis k klasse udfylder en given valens pla d s (slot). I denne forbindelse får valenstags (og selektions r e s t riktione r) betydning ikke kun som sekund æ r e tags (som udelukkende bruges til at disambiguere morfologiske/syntaktiske tags), men også som selvstæ n dige prim æ re tags, der kan og skal disam biguer e s: (9aa) rever <vt > 'gense' realiseret valens: transitiv <vt > (9ab) rever <vi > 'sive igenne m' realiseret valens: intran sitiv <vi > (9ba) revista < + n > < r r > 'avis' realiseret valens: titel <+n >, semantisk klasse: læsestof <rr > (9bb) revista <CP> 'inspektion' realiseret seman tisk klasse: + CONTROL, + PERFEKTIV 12

13 ? De ovenfor omtalte proble mer med under s p ecifikation af postno mi n aler, koordination og frie nominaladjunkter bliver til et gode, når man betragter dem udfra et MT- perspe ktiv: - for det første er mange af disse tilfælde ekse m pler på "ægte flertydighe d", der kun kan tydes af den fuldt kontek st u alisere d e - men n es k elige - lytter/ l æ s e r (og under alle omst æ n dighe d e r er der tale om ægte syntaktisk flertydighed). - Og for det andet er en række af disse struk t u r elle ambiguitete r (især koordin a tio n (11a) og "kort" (10b) vs. "lang" (10a) tilhæft ning af postno mi n ale præpositionssyntagmer) forholdsvis universelle, dvs. sproguafhængig, således at de kan bevares i oversæ ttelse n, der baseres direkte på den "flade" beskrivelse (10c). (10a) Han hentede ((mande ). (10b) Han hente de (mande )). (10c) Foi buscar o home a a At gøre en såda n flertydighed eksplicit (for et sprogpa r der ellers håndterer den éns) ville kun belaste oversættelsesmodulet med irrelevant ballast. Adjektiviske beste m m e r e, enten postno mi n al eller som frie adju n k te r, er derimo d mere problem a tisk e, idet der kan være kongruensrelationer (11b) mellem hoved og bestemmer: (11a) mæn (11b) home n casad 6. Statistisk evaluering For at kunne afprøve nye og kontrollere gamle regler i min parser har jeg udarb ej d e t et "bench mark"- corp u s (i alt ca ord), hvor der for hver flertydige kohor te markere s med en <Correct!> - tag hvilken læsning der er korrekt. Pga. de mange gentest ni nger har reglerne efterhå n d e n kunnet opnå fuld disambigue ring og fejlproce nte r på under 0.1% for disse arbejds te k s te r. For ukendt tekst er tallene selvfølgelig lavere; alligevel er resultatet ikke irrelevant. Det viser nemligt, at CG- metode n ikke lider under systemim ma nente interference - problemer i samme grad som fx. en probabilistisk tagger baseret på en ren trigram - HMM 16, hvor der (så vidt jeg ved) selv ved gentr æ ni ng og - måling på sam m e corpus sjældent opnås fejlprocenter på under 3%, end ikke for ordklasse - tags Hidden Markov Model, hvor de mulige sætningsa nalyser udtrykkes som (oftest ordklasse - ) tagsekvenser og siden vurderes for deres respektive sandsynlighed: at en ordform skulle bære en given tag beregnes som produktet af a) den leksikale sandsynlighed (ord/ o r d klas se) og b) n- gram- sandsynligheden (for bigrammer fx. ordklasse n/ordklasse n- 1), og hele sekvensen sandsynlighed igen er produkt et af de "individuelle" sandsynligheder for de i sekvensen realiserede tags. 17 I en probabilistisk tagger vil "manuelle" indgreb (håndlavede regler, bias eller priming), designet til at håndtere uregelmæ s sighe der eller sjældne strukturer, ofte resultere i skadelige interferencer, fordi de probabilistiske regler er "majoritet s drevne", og en lille "gevinst" for minoritets tilfældene vil tit føre til tilsvarende større "tab" mht. majoritets tilfæl dene, idet 13

14 For at opnå maksi m al præcision, har jeg også arbejdet med et større utagget tekstmateriale ( ord fra Borba- Ramsey- corpuset 18 ), både på det morfologiske og det syntaktis ke niveau. Dette var muligt, fordi precision (defineret som overlevende korrekte læsninger : overlevende læsninger i alt) kan appro k si m e r e s ved at nedb ringe ambiguiteten, i hvert fald så længe lejlighed svise bench mark- kørsler sikrer at nye regler kun forkas ter få korrek te tags, og så længe ambiguitete n stadigt er høj. Ambiguitete n kan så måles nemt med auto m a tis ke midler (fx. progra m m e t grep) på en hvilken som helst tekst. Derimod kan recall (defineret som overlevende korrekte læsninger : alle korrekte læsninger ) kun kvantificeres ved optælling i mindre testtek s te r (der findes mig beken d t ikke noget stort analyseret portugisisk corpu s til sam m e n ligning). Indstiller man parsere n til fuld disa mbigue ring (hvor der med undtagelse af de få tilfælde af ægte ambiguitet kun er én overleven d e læsning per ordfor m), kan man her betragte recall tallene som et direkte mål for parsere n s præst a tion, og jeg vil i det følgende bruge det mere generelle udtryk correctness i betydninge n af recall ved 100% disa mbig uerin g. En optælling af fejltyper ne under test- kørslen af en mindre ("ukendt") pros a- tekst på ca ord ("O tesour o" af Eça de Queiroz) gav følgende resultat: fejl i: antal fejl: ordklas se r 16 grundformer 1 Alle morfologis ke 17 (99.3 % correctnes s) verbalfunktion 3 verbers argume n te r 25 præpositioners argumenter 2 Argument struktur 30 bestemmere 13 Bestem m ere 13 adjunkter 11 Adjunkter 11 finitte ledsæt ni nger 6 infinitte ledsæt ni nger 3 absolutte ledsæt ninger 1 Ledsætninger 10 Alle syntaktiske 64 (97.4 % correctnes s) "lokale" syntaktiske fejl pga. morfologiske /ordklasse - fejl - 27 Rent syntaktiske 37 (98.5% correctnes s) opprioriteringen af undt agelserne går ud over de "normale" statistiske regler (jf. Chanod & Tapanainen, 1994). 18 Corpuset indeholder mest brasiliansk materiale, og er i alt på 5 millioner ord. Over ord er offentliggjort på CD som led i ECI- projektet (European Corpus Initiative). 14

15 Man kunne formo de at fejlene var fordelt jævnt over hele tekste n, hvad der - ved en genne m s ni tlig sætningslæ ng de på 15 ord - ville svare til en "fejltæt h e d" af ca. 1 morfologisk fejl i hver tiende sætning, og en syntak tisk i hver tredje. Dette er imidlertid ikke tilfældet. Fejlene optr æ d e r ofte i grup p e r: indlysen d e nok, vil de fleste ord med ordklas sefejl også kun ne findes på listen over syntaktis ke fejl, og mange syntaktis ke fejl vekselvirker med læsninger i naboor de n e, pga. regler der involverer sætningsgr æ n s e - ord, uniquen e s s - princip p e t osv. Således kan en N- V- ordklas sefejl afføde 2 eller 3 syntak tisk e fejl omkring sig. Denne "ophob ning ste n d e n s" for syntak tis ke fejl har en gavnlig sideeffekt på parsere n s robus t h e d (mange sætninger er således helt fejlfrie), og letter desuden grammatikerens arbejde: en korrektur ét sted kan "helbrede" en hel kæde af sekun d æ r e interferen s - fejl. Fejlinterfere nce n betyder også at den syntaktiske parser alene, dvs. når den forsynes med morfologisk fejlfri tekst som input, kan opnå endn u bedre resultater (forskellen er typisk på procentpoint). For at under søge, om fejlprocente r n e varierer i afhæ ngighe d af teksttypen, har jeg også testet parseren på aktuelle avistekster 19 (VEJAmagasinet). Der er igen tale om (for parseren) ukend t, løbende tekst. Artiklerne repræsenterer henholdsvis underholdnings - og kunst - genrerne. Tekst: "VEJA" (videogam e s) 2412 ord Fejltyper: antal fejl % korrekt "VEJA" (kunst) 1837 ord antal fejl % korrekt ialt 4249 ord antal fejl % korrek t Morfologi (alle) % % % ukendte engelske ord i oversk rifter Morfologi (ren) % % % Syntaks (alle) % % % syntaks pga morfologi Syntaks (ren) % % % En nær m e r e genne mga ng af fejltyper ne viser, at de valgte avisteks ter n e adskiller sig fra fiktions p r o s a både leksikalsk og syntaktisk. For det første møder man en stor andel af komplekse egennavne (fx. 'Massach u s e t s Institu te of Technology'), forkor telser ('MIT') og engelske modeo r d (således er det ét enkelt ord, console, der - brugt som ukendt engelsk subs ta n tiv ['spillekon s ol'], og ikke som portugisisk verbu m ['trøste r'] - tegner sig for en tredje del (!) af fejlene i tekste n om video- spil). For det andet er tekster ne - på det syntaktis ke plan - meget rige på frie prædikativer (typisk oplysninger 19 Tal for yderligere 2 avistekster fra VEJA (genrem æ s sigt placeret indenfor politik og sundhe d), viser nogenlun de de sam me fejlprocenter (jf. Bick, 1996). 15

16 om perso n er, institu tio ne r eller forkor telser, som alder, sted, definition m.m.) og indskudte "overflødige" finitte verber i form af citationsram mer. Fejlproce nter n e skal desude n ses i lyset af det meget differen tiere d e tag- set (jf. 7.1). Således kan parsere n s detaljere d e dependens - og funktionsoplysninger for præpositional- syntagmerne (som fx. post- adverbielt adverbielt @ADVL, præp o sition subjekts p r æ d i k a frit argume n t for forbinde rle give anledning til en lang række potentielle "indbyrde s" fejl, der ville være "usynlige" i en beskrivelse, der smelter disse tags sam me n til en simpel "syntagm a tis k" tag 'PP' (præposition s sy n t ag m e), eller et rudime n t æ r t "funktionelt" 'ADVL' (adverbial). Indbyrde s "forvekslinger" inden for PP- gruppe n står således for 15 tilfælde, eller hele 22%, af de 68 rent syntaktiske fejl i VEJA- teksterne. 7. Parseren 7.1 Tag- sættet Parsere n s tag- sæt indeholder 13 ordklas se - kategorier, der kombine re s med 24 tags for bøjningsfor m e r, ialt flere hund r e de distinkte komplekse tags. I tag- linien 'V PR 3S IND VFIN', for eksem p el, altern er er ordklas se n 'V' således med 12 andre ordklass er, og indenfor V- klassen alterner er 'PR' (præse n s) med 5 andre tider, der hver igen findes i 6 forskellige person - nume r u s forme r for både 'IND' (indikativ) og 'SUBJ' (konjunk tiv). På denne måde beskrives 6x6x2 = 7 2 finitte verbalfor m e r ved hjælp af kun = 1 4 deltags. Denne analytiske karakter af tag- strenge ne gør dem mere "genne m s k u elige", og letter desu de n arbejdet for disam bigu erings - reglerne. I mods æ t n i n g til andre systeme r (jf., for eksem p el, CLAWS- syste me t, som beskrevet i Leech, Garside, Bryant, 1994), skelnes der i tag- strengen skarp t mellem grundfor m e r ("ord"), ordklas se r og bøjnings kategorier. Desude n etableres ordklass e r n e næsten udelukke n d e på morfologisk vis, og holdes der me d adskilt fra de syntaktis ke kategorier. Således defineres et substa n tiv (N) paradigm a tis k som den ordklass e der udviser genus som (invariant) leksemkategori og numerus som (variabel) ordformkategori. Det modsatte gælder for nume r alia (NUM), mens både genus og nume r u s er leksemk a t ego rier for prop ria (PROP), og ordfor m k a t ego rier for adjektiver (ADJ) Pronominer kan opdeles efter sam me skema, i en deter miner - klasse (DET) med de sam me (variable) kategorier som adjektiver, og en "specifier"- klasse (SPEC) af "substantiviske" prono mi ner der udviser de sam me (invariante) kategorier som propria - klassen. Personlige prono mi ner (PERS), som tredje klasse, har 4 ordfor m kategorier: numerus, genus, casus og person. Alle 3 prono minalklasser adskiller sig fra de "rigtige" nominalklasser ved at de ikke tillader derivation. Pronominer som 'o' og 'este', der både kan forekom m e "adjektivisk" og "substantivisk", er efter dette system entydige medlem m er af DET- klassen. Artikel- klassen får heller ikke særst atu s: 'o' er altid DET, uanset om det bruges som "artikel", "adjektivisk demons t rativ" eller "substantivisk demons t r ativ". Tagsene <art > og <de m > optages på taglisten, men de er ikke ordklasse - kategorier, og disam bigueres først på et senere tidspu nkt (valens- niveauet), til brug ved MT. Participiet (V PCP), ordklass ser ne s enfant terrible, er morfologisk markeret som ('- id/ - ad'); men udenfor verbalkæde n overtager det adjektivets ordform ka t egorier, og parseren vælger i dette tilfælde at "fusionere" PCP/ADJ- ambiguiteten: <ADJ> V PCP. 16

17 Det syntaktiske tag- sæt råder over 40 tags for ord/syntagme - funktion og ca. 30 tags for sætningsf u n k tio n (der dækker over tre slags ledsæt ninger: finitte, infinitte og absolutte [=verballøse]). Også her er det virkelige antal af distink te tag- strenge meget højere, fordi det ord der bærer ledsæt nin ge n s tag, jo også skal marke res for dets ledsæt nings - interne funktion. Systeme r n e for valens og sema ntik er under udvikling, og det er derfor vanskeligt at angive nøjagtige tal for tag- sætte ne s størrelse. Omtrentlige tal er ca. 100 for valensklas se r (især for verber), og ca. 200 for sema n tis ke klasser (især for substa n tiver). De sema n tis ke klasser er baseret på 16 "atomar e" træk (som, fx., ±HUM). 7.2 Parserens tekniske data Den portugisiske parser består af en række progra m m o d u le r, der - bortset fra lingsofts sproguaf h æ n gige compiler for CG- regler - er skrevet af mig selv i programmeringssprogene C og Perl. Parseren omfatter følgende moduler på det morfologisk- syntaktiske niveau 21 : 1. et morfologisk analyse - program (beskrevet i Bick, 1995), som beha n d le r orth og rafisk præp r oce s s e ri ng, ordklass e, bøjning, derivation, faste udtryk (polyleksikalier) og inkor po r e r e n d e verber. Analyse- modulet støtter sig til et håndbygget leksikon med enheder, der dækker over ca lekseme r og udgør en tilpasset elektronisk version af ordbogs m a t e riale fra forfatte re n s cand.mag.- speciale om leksikografi (Bick, 1993) 2. en morfologisk disambiguator med 1700 Constr aint Gram m a r regler 3. en syntaktisk "mapper" med 400 konteks t b a se r e d e regler der "mapper" (alle mulige) syntaktiske funktione r udfra en ordfor m s morfologiske/ordklasse - tags 4. en syntaktisk disambiguator med 1500 Constraint Gram m a r regler 5. en disambiguator for valens og semantiske klasser (med 2200 Constraint Grammer regler, eksperimentel) En fuldst æ n dig gram m a tis k analyse på alle niveauer håndte r e r ca. 100 ord/ s e c på en 100 MHz Pentiu m - baseret Linux- maskine. Den morfologiske/ordklasse - disambiguering alene opnår hastigheder i nærheden af 1000 ord/sec. Systemet kan afprøves igenne m en interaktiv brugerflade på følgende web- adresse: /ling.hu m.aau.dk / ~ eck hard /Linguistics.html. Større prøvetek s te r til auto m a tisk analyse (i ISO Latin- 1 format) kan også sende s via e- mail til eckhard@ling.hu m.a a u.dk under emnet portpars (tekste n skal begynde med ordet parsmail på første og afsenderens returadresse på anden linie, og afslutte s med ordet parsslut på en linie for sig). 8. Perspekti v 21 Hertil kommer eksperimentelle moduler for portugisisk - dansk MT: polysemidisa m biguering, oversæt telse af disam biguerede grundfor m er, portugisisk- dansk syntaktisk transfor m a tion og en generat or for dansk morfologi. 17

18 Parseren kan sammenfattende beskrives som et leksikon- og gram m a tik b a se r e t syste m, der beskriver ord og sætninger med hensy n til både form og funktion, hvor dens notationelle særpr æ g ligger i dens ordbas er e d e "flade" gengivelse af syntaktisk stru k t u r. Den bagvedliggen d e formalis m e, Constraint Gram m a r, har vist sig også for Portugisisk at muliggøre lave fejlproce nter, en høj hastighe d samt en meget robust hån d tering af fri tekst. Selve metod e n synes i øvrigt til en vis grad at være "niveau ne u t r al", idet jeg med success har kun net anven de den på stadigt "højere" analyse- niveauer: ledsætningsfunktion, valens- og semantisk disam biguering (samt herigenne m polyse mire solu tion). Systemet s formelle og indholds m æ s s ige egenska be r må formode s at have stor betydning for mulige anvendelses o m r å d e r, og jeg vil afslutte n d e disku te r e systemet udfra den ne synsvinkel. Nedens t åe n d e tabel viser hvilke af parsere n s egensk ab er jeg tillægger betyd ning ved anvend else n indenfo r beste m te opgaveom r å d e r (af hvilke nogle for øvrigt kan afprøves på ovennævnte web- site). EGENSKABER corpus - arbejde grammatis k stavek ontr ol grammatik - formidling maskinovers ættels e indholdsmæs sige: 1. leksikon- baseret beskriver form og dependens 3. beskriver funktio n 4. flad syntaks formelle / m etodis ke: 5. lav fejlprocent høj hastighed robust metodemæssigt niveauneutral 9. ordbaseret notation REALISERING alle CGsystem er engelsk VISL 22 (portugisis k) portugisisk - dansk informations - ekstraktion? Mens både stavekontrol, maskinoversættelse og informationsekstraktion profiterer af detaljere de leksikalske oplysninger (1), har kun de sidste to applikatio n er brug for en meto de der tillader også en vis sema n tisk analyse 22 VISL står for 'visual interactive syntax learning' og er et CTU- støttet projekt på Odense Universitet (Institut for Sprog og Kommunikation). Projekts prog er engelsk, tysk og fransk, med portugisisk som foreløbig "modelspr og" i opstart - fasen. 18

19 (8). Gram m a tikfor mi dlinge n udskiller sig fra de andre felter ved at lægge mere vægt på parsere n s indholds m æ s s ige (2, 3) end dens formelle egenska b er, og især tidsfak to re n (6) og robus t h e d e n (7) spiller en mind r e rolle, idet der typisk vil arbejdes med korte fejlfrie tekster (enkelte sætninger). Den flade ordbas e r e de notation (4, 9) har den pædagogiske fordel, at kategorier, funktion m.m. kan markere s direkte i den løbende tekst, fx. igennem farvenotation, understregning, sub- /superscript - indices, eller i form af en slags "meta- tekst" 23 - linie. Ved det lingvistiske corpus - arbejde værds æ t t e s ligeledes den flade notation, omen d på en anden baggru n d: strengs øg ning so p e r a tio n e r lettes betydeligt og gøres mere fleksible. Blandt de formelle egenskabe r er corpus - arbejdet og informationsekstraktion de områder der har størst gavn af parserens høje hastighed (6), mens fejlprocenten (5) er vigtigst for de tekstproducerende - og dermed læserkontrollerede - systemer (stavekontrol og maskinoversættelse). 23 En horisont al metateks t not a tion kunne fx se ud som i følgende sætning: Having read the letter from Italy she called her Swedish friend immediately. x:a> v:x< d:>n s:<o prp:n< n:p< pe:s> v:v d:>n adj: >N s:<o adv: <A [hvor notationen er ordklasse:funktion, og x=hjæl peverbu m, v=verbu m, d=deter miner, s=substantiv, prp=præposition, n=proprium, pe=personligt pronomen, adj=adjektiv, adv=adverbium, A>/A< = a dverbial, X<=ikke - første led i verbalkæde, >N=præn o minal, <O=direkte objekt, N<=postnominal, P<=styrrelse af præposition, S>=subjekt, V=finit hovedverbu m] 19

20 Appendiks I: Sætningseksempler E. Bick, Dependensstrukturer i CG- Syntaks for Portugisisk a) halvgrafisk træ- notation med eksplicit syntagm e - *depois [depois] <+de > de [de] F S uma [um] <card > F S década [década] em =vigor [em =vigor] <a dj > M S o [o] <art > M S estilo [estilo] <ak > M S gastronô mic o [gastrô n o m o] <DERS - ico > <jn> M/F S/P que [que] <rel > IMPF 1/3S IND VFIN supervaloriz [supervaloriza r] <vt > <vh > ava M S o [o] <art > M S requinte [requinte] <a m > de [de] <sam - > F S a [a] <- sam> <art > F S decoração [decoração] <CP > <ac > - $\, sob [sob] M S o [o] <art > M S comando [comando] <s > <CI> de [de] <+hum > VFIN M P profissionai s [profissional] <pr of > M/F S/P que [que] <rel > <que - hum > não [não] <dei > <seto p > IMPF 3P IND eram [ser] <vk> <sh > de [de] <sam - > < +top > M S o [o] < - sam> <art > M S ramo [ramo] <anbo > <stok > <fag> - $\, 20

21 @FMV:V PR 3S IND VFIN vive [viver] <vt > <va +STED> F S a [a] <art > F S hora [hora] <dur > <temp > de [de] <sam - > F S a [a] <- sam> <art > F S verdade [verdade] <feat > <ss > <a m > <sh > $. 21

22 b) "flad notation" uden eksplicit syntagm e - markering (For overskuelighede n s skyld er grundfor m e r n e og de fleste seku n d æ r e tags fjernet i eksem pler n e; desu d e n er der foretaget hierarkis k indryk ning ved de syntak tis ke tags for at vise depen d e n s - markø re r n e s funktion.) Não existe V PR 3S IND em PRP <sam - a DET F S <art > <- história N F de PRP <sam - o DET <art > <- mundo N M ocidental ADJ M/F nada SPEC M comparáv el ADJ M/F S <+a a PRP <sam - o DET M S <+rel > sam> que SPEC M/F S/P N< os DET M P <art brasileiro N M s realizara V PS/MQP 3P IND m em PRP <sam - esse DET M S <- ano N M $. O DET M S <art cientista N M/F político ADJ M diz V PR 1S IND <+interr por que SPEC M/F S/P <inter r os DET M P <art brasileiro N M s devem V PR 3P se PERS M/F 3S/P ACC <refl orgulhar V INF 0/1 <de^vrp > de $1992 NUM M/F P <card e 22

DEPENDENSSTRUKTURER I CONSTRAINT GRAMMAR SYNTAKS FOR PORTUGISISK. Eckhard Bick

DEPENDENSSTRUKTURER I CONSTRAINT GRAMMAR SYNTAKS FOR PORTUGISISK. Eckhard Bick DEPENDENSSTRUKTURER I CONSTRAINT GRAMMAR SYNTAKS FOR PORTUGISISK Eckhard Bick Institut for Lingvistik, Århus Universitet, Nordre Ringgade, DK-8000 Århus C tel: +45-89 422170, fax: +45-86 281397, e-mail:

Læs mere

AUTOMATISK ANALYSE AF PORTUGISISK SKRIFTSPROG. Eckhard Bick

AUTOMATISK ANALYSE AF PORTUGISISK SKRIFTSPROG. Eckhard Bick AUTOMATISK ANALYSE AF PORTUGISISK SKRIFTSPROG Eckhard Bick Institut for Lingvistik, Århus Universitet, Nordre Ringgade, DK-8000 Århus C tel: +45-89 422152, fax: +45-86 281397, e-mail: lineb@hum.aau.dk

Læs mere

AUTOMATISK ANALYSE AF PORTUGISISK SKRIFTSPROG. Eckhard Bick

AUTOMATISK ANALYSE AF PORTUGISISK SKRIFTSPROG. Eckhard Bick AUTOMATISK ANALYSE AF PORTUGISISK SKRIFTSPROG Eckhard Bick Institut for Lingvistik, Århus Universitet, Nordre Ringgade, DK-8000 Århus C tel: +45-89 422152, fax: +45-86 281397, e-mail: lineb@hum.aau.dk

Læs mere

Eckhard Bick Institut for Sprog og Kommunikation, SDU Odense Universitet lineb@hum.au.dk, http://visl.hum.sdu.dk

Eckhard Bick Institut for Sprog og Kommunikation, SDU Odense Universitet lineb@hum.au.dk, http://visl.hum.sdu.dk EN CONSTRAINT GRAMMAR PARSER FOR DANSK Eckhard Bick Institut for Sprog og Kommunikation, SDU Odense Universitet lineb@hum.au.dk, http://visl.hum.sdu.dk 1. Projektet Det moderne samfunds udstrakte brug

Læs mere

Parsing-systemet Palavras

Parsing-systemet Palavras Eckhard Bick Parsing-systemet Palavras Automatisk Grammatisk Analyse af Portugisisk i et Constraint Grammar-Miljø Institut for Lingvistik, Aarhus Universitet e-mail: lineb@hum.au.dk, web: http://visl.hum.sdu.dk

Læs mere

Opdateringer til førsteudgaven for Claus Drengsted-Nielsen: Grammatik på dansk

Opdateringer til førsteudgaven for Claus Drengsted-Nielsen: Grammatik på dansk Opdateringer til førsteudgaven for Claus Drengsted-Nielsen: Grammatik på dansk Grammatik på dansk er nu på Facebook: facebook.com/grammatikpd Her kan du følge med i sproglige spørgsmål og selv spørge.

Læs mere

Opdateringer til førsteudgaven for Claus Drengsted-Nielsen: Grammatik på dansk

Opdateringer til førsteudgaven for Claus Drengsted-Nielsen: Grammatik på dansk Opdateringer til førsteudgaven for Claus Drengsted-Nielsen: Grammatik på dansk Grammatik på dansk er nu på Facebook: facebook.com/grammatikpd Her kan du følge med i sproglige spørgsmål og selv spørge.

Læs mere

MORFOSYNTAKTISK OPMÆRKEDE KORPORA FOR DANSK: KORPUS90/2000 OG ARBORETUM Af Eckhard Bick (Institut for Sprog og Kommunikation, Syddansk Universitet)

MORFOSYNTAKTISK OPMÆRKEDE KORPORA FOR DANSK: KORPUS90/2000 OG ARBORETUM Af Eckhard Bick (Institut for Sprog og Kommunikation, Syddansk Universitet) MORFOSYNTAKTISK OPMÆRKEDE KORPORA FOR DANSK: KORPUS90/2000 OG ARBORETUM Af Eckhard Bick (Institut for Sprog og Kommunikation, Syddansk Universitet) 1. Introduktion En lang række lingvistiske applikationsområder,

Læs mere

Basale hjælpemidler til løsning af skriftlige afleveringer/ årsprøve/ terminsprøve og eksamen:

Basale hjælpemidler til løsning af skriftlige afleveringer/ årsprøve/ terminsprøve og eksamen: Græsk De skriftlige afleveringer i græsk og latin minder om hinanden i opbygning; i begge prøves i en sproglig og en indholdsmæssig del. I græsk er der også spørgsmål i morfologi (orddannelse), oversættelsesvurdering

Læs mere

R e g e l f o r m a l i s m e r til b r u g v e d datamatisk lingvistik.

R e g e l f o r m a l i s m e r til b r u g v e d datamatisk lingvistik. Bente Maegaard, Københavns Universitet, Institut for anvendt og m a t e m a t i s k lingvxstik, Njalsgade 96 2300 K ø b e n h a v n S R e g e l f o r m a l i s m e r til b r u g v e d datamatisk lingvistik.

Læs mere

Salme. œ œ. œ œ. œ œœ œ. œ œ œ œ. œ œ. œ œ. œ œ. œ œ. œ œ. œ œ. œ œ. œ œ. œ œ œ œ. œ œ. œ œ œ œ. œ œ. œ œ b œ œ. œ œ. œ œ. œ œ. œ œ. b œ œ œ œ.

Salme. œ œ. œ œ. œ œœ œ. œ œ œ œ. œ œ. œ œ. œ œ. œ œ. œ œ. œ œ. œ œ. œ œ. œ œ œ œ. œ œ. œ œ œ œ. œ œ. œ œ b œ œ. œ œ. œ œ. œ œ. œ œ. b œ œ œ œ. Digt af Otto Gelsted Salme Musik: ens Berg S A C T B C end fra din sæls e - len - de mod da - gens lys dit blik Du var din e - gen 6 b b b b fen - de, du selv var or - mens stik Hvor sært: mens du i mør

Læs mere

No. 5 I'm An Ordinary Man

No. 5 I'm An Ordinary Man Voice Keyoard MD Bass Clarinet in B 0 & & solo No 5 I'm An Ordinary Man Moderato q = 108 "jeg' en ganske enkel mand clarinet Moderato jeg or - lan - ger kun så lidt mit krav er li - ge- til at kun - ne

Læs mere

Latin 10 gode råd: ikke Afleveringer Syntaktisk analyse

Latin 10 gode råd: ikke Afleveringer Syntaktisk analyse Latin Det overordnet formål med skriftlig latin i gymnasieksolen er at vise, at man har forstået sproget både gennem syntaktisk analyse / oversættelse og analyse af indholdet. Lige meget hvilken type opgave,

Læs mere

Ordliste over anvendt fagterminologi

Ordliste over anvendt fagterminologi Ordliste over anvendt fagterminologi Adjektiv / tillægsord Adverbial / biled Adverbium / biord Akkusativ m. infinitiv Ord, der beskriver eksempelvis en person eller en genstand, f.eks. er stor, god og

Læs mere

Part 5 Leisure Time and Transport

Part 5 Leisure Time and Transport Part 5 Leisure Time and Transport Lesson 3 Situation and Listen & Practice Situation Line and Louise are colleagues. They meet at a café before work. Line is late because h bike had a puncture on the way.

Læs mere

Sprogteknologiske resourcer for islandsk leksikografi

Sprogteknologiske resourcer for islandsk leksikografi Eiríkur Rögnvaldsson Sprogteknologiske resourcer for islandsk leksikografi Seminar om leksikografi og sprogteknologi Schæffergården 31. januar 2010 Foredragets emne Islandsk sprogteknologi omkring århundredskiftet

Læs mere

gyldendal tysk grammatik

gyldendal tysk grammatik agnete bruun hansen elva stenestad i samarbejde med carl collin eriksen gyldendal tysk grammatik agnete bruun hansen elva stenestad i samarbejde med carl collin eriksen gyldendal tysk grammatik gyldendal

Læs mere

På med subjektet! Kampen om overtrækstrøjerne. Idé

På med subjektet! Kampen om overtrækstrøjerne. Idé Workshop på AP- konference på Nyborg Gymnasium 28.8.2013 Tia Bjørnholt Christiansen og Annette Bau På med subjektet! Kampen om overtrækstrøjerne Idé Et adverbial kan ofte placeres flere steder Eleverne

Læs mere

Du har n u en genvej på dit skrivebord hen til de n m a p pe hvor dine filer me d bladene ko m mer til at ligge, de n virkelige sti = c: \Blade.

Du har n u en genvej på dit skrivebord hen til de n m a p pe hvor dine filer me d bladene ko m mer til at ligge, de n virkelige sti = c: \Blade. Download af blade i MP3 format Side 1 af 6 Forudsætninger for at kunne ben ytte denne mulighed er: En co m p uter m e d rimelig diskplads (hvert blad fylder 45 MB). En god Internetforbindelse, for ikke

Læs mere

Aalborg Katedralskole Masterplan for grundforløb i almen sprogforståelse

Aalborg Katedralskole Masterplan for grundforløb i almen sprogforståelse Aalborg Katedralskole Masterplan for grundforløb i almen sprogforståelse Overordnede faglige mål med AP-forløbet Det primære formål med AP er at give eleverne en nødvendig basisforståelse for morfologi,

Læs mere

Aalborg Katedralskole Masterplan for grundforløb i almen sprogforståelse

Aalborg Katedralskole Masterplan for grundforløb i almen sprogforståelse Aalborg Katedralskole Masterplan for grundforløb i almen sprogforståelse Overordnede faglige mål med AP-forløbet Det primære formål med AP er at give eleverne en nødvendig basisforståelse for morfologi,

Læs mere

JO HERMANN. Latinsk grammatik. på dansk. Akademisk Forlag

JO HERMANN. Latinsk grammatik. på dansk. Akademisk Forlag JO HERMANN Latinsk grammatik på dansk Akademisk Forlag Latinsk grammatik på dansk 2. udgave, 2. 4. oplag, 2. 2011 Jo Hermann og Akademisk Forlag, et forlag under Lindhardt og Ringhof Forlag A/S, et selskab

Læs mere

Teoretisk og Anvendt Sprogvidenskab I Logopædi & (Pædagogisk) Audiologi Efterår 2016 Skriftlig aflevering med peer-feedback Syntaks

Teoretisk og Anvendt Sprogvidenskab I Logopædi & (Pædagogisk) Audiologi Efterår 2016 Skriftlig aflevering med peer-feedback Syntaks Opgave 1: Vigtige begreber 1. Syntagmerne, som udgør sætningens byggesten, er helheder bygget op af ét hovedord, der kan knytte foranstillede og efterstillede bestemmelser til sig. 2. Det rekursive princip,

Læs mere

FOR BETTER UNDERSTANDING. WordFinder. Professional 10. Kvikguide

FOR BETTER UNDERSTANDING. WordFinder. Professional 10. Kvikguide FOR BETTER UNDERSTANDING WordFinder Professional 10 Kvikguide Installationsvejledning 1 Indsæt program-dvd en i computeren. Installationsprogrammet starter nu automatisk. 2 Kontroller, at det nummer, som

Læs mere

Gram Skole 2018 (Haderslev)

Gram Skole 2018 (Haderslev) GRAM SKOLE 2018 (HADERSLEV) / 10. DECEMBER 2018 Gram Skole 2018 (Haderslev) Gram Skole har udviklet Gramblomsten, der g ennem samarbejde og struktur har formået at skabe en alsidig og succesfuld holddeling,

Læs mere

GRAMMATIK OVER DET DANSKE SPROG

GRAMMATIK OVER DET DANSKE SPROG ERIK HANSEN OG LARS HELTOFT GRAMMATIK OVER DET DANSKE SPROG Indledning og oversigt BIND I UNIVERSITÅTSBIBLIOTHEK KIEL - ZENTRALBIBLIOTHEK - D S L Det Danske Sprog- og Litteraturselskab Syddansk Universitetsforlag

Læs mere

Lav din egen forside i webtrees

Lav din egen forside i webtrees Lav din egen forside i webtrees Du behøver ikke at kunne kode eller gøre noget advanceret for at designe din helt egen forside i webtrees. Alt du skal gøre er bare at gøre brug af den indbygget editor.

Læs mere

Teoretisk og Anvendt Sprogvidenskab I Logopædi & (Pædagogisk) Audiologi Efterår 2016 Skriftlig aflevering med peer-feedback Syntaks

Teoretisk og Anvendt Sprogvidenskab I Logopædi & (Pædagogisk) Audiologi Efterår 2016 Skriftlig aflevering med peer-feedback Syntaks Opgave 1: Vigtige begreber 1. Syntagmerne, som udgør sætningens byggesten, er helheder bygget op af ét hovedord, der kan knytte foranstillede og efterstillede bestemmelser til sig. 2. Det rekursive princip,

Læs mere

Sproget Six. Til brug i rapportopgaven på kurset Oversættere. Vinter 2006. Abstract

Sproget Six. Til brug i rapportopgaven på kurset Oversættere. Vinter 2006. Abstract Sproget Six Til brug i rapportopgaven på kurset Oversættere Vinter 2006 Abstract Six er baseret på det sprog, der vises i figur 6.2 og 6.4 i Basics of Compiler Design. Den herværende tekst beskriver basissproget

Læs mere

Skæring Skole 2018 (Aarhus)

Skæring Skole 2018 (Aarhus) SKÆRING SKOLE 2018 (AARHUS) / 10. DECEMBER 2018 Skæring Skole 2018 (Aarhus) ForældreForum er en ny praksis, der åbner mulig hed for at alle kan bidrag e til udvikling en på Skæring Skole. Skolens personale

Læs mere

Gerhard Boysen: Fransk grammatik. København: Munksgaard, 1992.

Gerhard Boysen: Fransk grammatik. København: Munksgaard, 1992. Merete Birkelund 133 Gerhard Boysen: Fransk grammatik. København: Munksgaard, 1992. Forlaget Munksgaard har med Gerhard Boysens Fransk Grammatik, 1992, indledt en grammatikserie i romanske sprog, der senere

Læs mere

DET SOM FORMELT SUBJEKT, OBJEKT OG PRÆDIKATIV I DANSK

DET SOM FORMELT SUBJEKT, OBJEKT OG PRÆDIKATIV I DANSK FOLIA SCANDINAVICA VOL. 10 POZNAŃ 2009 DET SOM FORMELT SUBJEKT, OBJEKT OG PRÆDIKATIV I DANSK ANDRZEJ SZUBERT Adam Mickiewicz University, Poznań ABSTRACT. The aim of the article is to present and analyse

Læs mere

Vejledning for censorer i skriftlig fransk begyndersprog A, hhx. Gl-Fransk digital

Vejledning for censorer i skriftlig fransk begyndersprog A, hhx. Gl-Fransk digital Maj 2019 Vejledning for censorer i skriftlig fransk begyndersprog A, hhx Gl-Fransk digital Den digitale prøve i fransk begyndersprog A består af to delprøver. Bedømmelsen er en samlet helhedsvurdering

Læs mere

Prosodi i ledsætninger

Prosodi i ledsætninger Eksamensopgave 2 Dansk talesprog: Prosodi og syntaks Prosodi i ledsætninger Ruben Schachtenhaufen Indledning I denne opgave vil jeg undersøge nogle forhold vedrørende prosodi og syntaks i ledsætninger

Læs mere

Vejledning for censorer i skriftlig spansk begyndersprog A, stx. Gl-Spansk digital

Vejledning for censorer i skriftlig spansk begyndersprog A, stx. Gl-Spansk digital Maj 2019 Vejledning for censorer i skriftlig spansk begyndersprog A, stx Gl-Spansk digital Den digitale prøve i spansk begyndersprog A består af to delprøver. Bedømmelsen er en samlet helhedsvurdering

Læs mere

GRAMMATIK OVER DET DANSKE SPROG

GRAMMATIK OVER DET DANSKE SPROG ERIK HANSEN OG LARS HELTOFT GRAMMATIK OVER DET DANSKE SPROG Sætningen og dens konstruktion BIND III UIMIVET.S!TÅTS3iCL!CTHI,v k!... j -ZENTHALBiBUOTHEK- D S L Det Danske Sprog- og Litteraturselskab Syddansk

Læs mere

Baggrunden for Skole og Forældres politikpapir om forældreansvar er den seneste ændring i Folkeskoleloven, hvor begrebet forældreansvar blev indføjet

Baggrunden for Skole og Forældres politikpapir om forældreansvar er den seneste ændring i Folkeskoleloven, hvor begrebet forældreansvar blev indføjet P o l it ik f o r f o r æ l d r e a n s v a r Baggrunden for Skole og Forældres politikpapir om forældreansvar er den seneste ændring i Folkeskoleloven, hvor begrebet forældreansvar blev indføjet i lovteksten,

Læs mere

Ny Forskning i Grammatik

Ny Forskning i Grammatik Ny Forskning i Grammatik Titel: Forfatter: Kilde: URL: Sætningsled Argumenter vs modifikatorer Finn Sørensen P. Durst-Andersen og J. Nørgård-Sørensen (red.). Ny Forskning i Grammatik 2, 1995, s. 41-47

Læs mere

Analyse af værket What We Will

Analyse af værket What We Will 1 Analyse af værket What We Will af John Cayley Digital Æstetisk - Analyse What We Will af John Cayley Analyse af værket What We Will 17. MARTS 2011 PERNILLE GRAND ÅRSKORTNUMMER 20105480 ANTAL ANSLAG 9.131

Læs mere

Luft for sva rets læ rings kul tur...15 Et his to risk grunn lag for Luft for sva rets læ rings kul tur...15 Ny tid med nye ut ford rin ger...

Luft for sva rets læ rings kul tur...15 Et his to risk grunn lag for Luft for sva rets læ rings kul tur...15 Ny tid med nye ut ford rin ger... Innhold Ka pit tel 1 Pro log Læ ring og vekst i ope ra ti ve or ga ni sa sjo ner...11 Bak grunn for en bok om læ ring i ope ra ti ve or ga ni sa sjo ner...11 Fra virk nings full læ rings pro sess til bok...12

Læs mere

Eckhard Bick Institut for Sprog og Kommunikation, Syddansk Universitet

Eckhard Bick Institut for Sprog og Kommunikation, Syddansk Universitet MORFOSYNTAKTISK OPMÆRKEDE KORPORA FOR DANSK: KORPUS90/2000 OG ARBORETUM Eckhard Bick Institut for Sprog og Kommunikation, Syddansk Universitet lineb@hum.au.dk, http://visl.hum.sdu.dk 1. Introduktion En

Læs mere

Fagplan. Fransk B Niveau. Biology B

Fagplan. Fransk B Niveau. Biology B Fagplan Fransk B Niveau Biology B Fransk B Niveau Video Oversigt Grammatik...4 Udtale...9 Eksamen...10 18 videoer i Fransk B Niveau Sidst opdateret d. 28-07-2019 2/10 Videoplayerinstructions for the teacher

Læs mere

REDIGERING AF REGNEARK

REDIGERING AF REGNEARK REDIGERING AF REGNEARK De to første artikler af dette lille "grundkursus" i Excel, nemlig "How to do it" 8 og 9 har været forholdsvis versionsuafhængige, idet de har handlet om ting, som er helt ens i

Læs mere

Evaluering af skriftlig eksamen i spansk A (hhx) maj/juni 2017

Evaluering af skriftlig eksamen i spansk A (hhx) maj/juni 2017 Evaluering af skriftlig eksamen i spansk A (hhx) maj/juni 2017 Oktober 2017 1. Evaluering af skriftlig eksamen i spansk A (hhx) 2017 Sommer 2017 var der to opgavesæt til den skriftlige prøve i spansk A,

Læs mere

sproget.dk en internetportal for det danske sprog

sproget.dk en internetportal for det danske sprog sproget.dk en internetportal for det danske sprog Ida Elisabeth Mørch, Dansk Sprognævn Lars Trap-Jensen, Det Danske Sprog- og Litteratuselskab 1 Baggrunden 2003 Sprog på spil 2005 Ekstrabevilling 2006

Læs mere

Aalborg Katedralskole Masterplan for grundforløb i almen sprogforståelse

Aalborg Katedralskole Masterplan for grundforløb i almen sprogforståelse Aalborg Katedralskole Masterplan for grundforløb i almen sprogforståelse Overordnede faglige mål med AP-forløbet Det primære formål med AP er at give eleverne en nødvendig basisforståelse for morfologi,

Læs mere

Gruppe 1, Audiologi René Gyldenlund Pedersen, Ivan Hemmingsen, Louise Thygesen Smidt og Mette Toft Hansen Skriftlig gruppeaflevering Morfologi

Gruppe 1, Audiologi René Gyldenlund Pedersen, Ivan Hemmingsen, Louise Thygesen Smidt og Mette Toft Hansen Skriftlig gruppeaflevering Morfologi Skriftlig gruppeaflevering Morfologi 1. Løs nedenstående opgaver sammen med jeres studiegruppe 2. Aflever ét eksemplar samlet for hele studiegruppen a. a. Notér på opgaven: i. Uddannelse (Logopædi, Pædagogisk

Læs mere

Grun de jer foren in gen STORHØJ og STORHØJ Be boer foren ing. Generalforsamling

Grun de jer foren in gen STORHØJ og STORHØJ Be boer foren ing. Generalforsamling .2 N yt fra Storhøj Odder Grun de jer foren in gen STORHØJ og STORHØJ Be boer foren ing 25 Fe bru ar 1998 Storhøj Grundejerforening indkalder til ordinær Gen er al for sam ling og ori en te ring om klo

Læs mere

SEPA Direct Debit. Mandat Vejledning 2013.03.15. Nets Lautrupbjerg 10 DK-2750 Ballerup

SEPA Direct Debit. Mandat Vejledning 2013.03.15. Nets Lautrupbjerg 10 DK-2750 Ballerup SEPA Direct Debit Mandat Vejledning 2013.03.15 Nets Lautrupbjerg 10 DK-2750 Ballerup Indholdsfortegnelse 1. Indledning... 3 1.1 Tilknyttet dokumentation... 3 1.2 Kontakt til Nets... 3 2. Krav til SEPA

Læs mere

Aalborg Katedralskole Masterplan for grundforløb i almen sprogforståelse

Aalborg Katedralskole Masterplan for grundforløb i almen sprogforståelse Aalborg Katedralskole Masterplan for grundforløb i almen sprogforståelse Overordnede faglige mål med AP-forløbet Det primære formål med AP er at give eleverne en nødvendig basisforståelse for morfologi,

Læs mere

Samvær med psy ko pa tisk for æl der er pro ble ma tisk

Samvær med psy ko pa tisk for æl der er pro ble ma tisk Din kommentar er blevet udgivet. Samvær med psy ko pa tisk for æl der er pro ble ma tisk GRET HE EL HOLM OG KIR STEN KUL L BERG 12. sep tem ber 2011 01:00 2 kom men ta rer De fle ste samvær s sa ger kan

Læs mere

Det hellige rum Om sjælesorg på danske hospitaler. Møde med Oslo Universitets Sykehuspræster på Sociologisk Institut, Københavns Universitet

Det hellige rum Om sjælesorg på danske hospitaler. Møde med Oslo Universitets Sykehuspræster på Sociologisk Institut, Københavns Universitet Det hellige rum Om sjælesorg på danske hospitaler Møde med Oslo Universitets Sykehuspræster på Sociologisk Institut, Københavns Universitet Program Baggrund for studiet Studiedesign og informanter Sjælesorgens

Læs mere

Niveau Gennemsnit (ikke beståede i %) Begyndersprog A 3,5 (26,0) Begyndersprog A med netadgang 5,26 (3,5) Fortsættersprog A 4,3 (5,3)

Niveau Gennemsnit (ikke beståede i %) Begyndersprog A 3,5 (26,0) Begyndersprog A med netadgang 5,26 (3,5) Fortsættersprog A 4,3 (5,3) Uddannelsesaftaler Evaluering af skriftlig eksamen i fransk A (hhx) maj/juni 2017 Oktober 2017 1. Evaluering af skriftlig eksamen i fransk A (hhx) 2017 Sommer 2017 var der tre opgavesæt til den skriftlige

Læs mere

Seminaropgave: Præsentation af idé

Seminaropgave: Præsentation af idé Seminaropgave: Præsentation af idé Erik Gahner Larsen Kausalanalyse i offentlig politik Dagsorden Opsamling på kausalmodeller Seminaropgaven: Praktisk info Præsentation Seminaropgaven: Ideer og råd Kausalmodeller

Læs mere

1. Tekst: Frank Jæger Musik: Morten Nyord

1. Tekst: Frank Jæger Musik: Morten Nyord KORTENRØG Leggiero = 60 1. Tekst: Frank Jæger Musik: Morten Nyord yn - de - lig A yn - de - lig yn - de - lig dri - ver min T yn - de - lig dri - ver min yn - de - lig yn - de - lig dri - ver min - skor

Læs mere

3 Sange med tekst af H. C. Andersen

3 Sange med tekst af H. C. Andersen Bendt Astrup 3 Sange med tekst af H. C. Andersen For lige stemmer 2004 3 sange med tekst af H. C. Andersen Bendt Astrup Trykt i Exprestrykkeriet Printed in Denmark 2004 Poesien H. C. Andersen Soprano Alto

Læs mere

Christian Becker-Christensen. dansk syntaks. Indføring i dansk sætningsgrammatik og sætningsanalyse

Christian Becker-Christensen. dansk syntaks. Indføring i dansk sætningsgrammatik og sætningsanalyse Christian Becker-Christensen dansk syntaks Indføring i dansk sætningsgrammatik og sætningsanalyse DANSK SYNTAKS Indføring i dansk sætningsgrammatik og sætningsanalyse CHRISTIAN BECKER-CHRISTENSEN Christian

Læs mere

Skabelonfilen er udarbejdet i Word til Windows (Office 2010) og er også afprøvet i Word til Mac.

Skabelonfilen er udarbejdet i Word til Windows (Office 2010) og er også afprøvet i Word til Mac. Nordiske Studier i Leksikografi 13 (København 2015) Brug af stilark Vi vil gerne have at alle forfattere benytter den Word-fil som redaktionen har udarbejdet og sendt ud, både forfattere og redaktører

Læs mere

Sprogteknologi I Undervisningsplan Forårssemester 2008

Sprogteknologi I Undervisningsplan Forårssemester 2008 Sprogteknologi I Undervisningsplan Forårssemester 2008 Patrizia Paggio 27/9/2007 1 Introduktion til sprogteknologi Hvad er sprogteknologi Hvorfor er det svært at processere sprog Eksempler på applikationer

Læs mere

Danskhjælpen er en lille opslagsgrammatik. Her kan du læse om de grammatiske emner, før eller imens du arbejder med dine Grammar-opgaver.

Danskhjælpen er en lille opslagsgrammatik. Her kan du læse om de grammatiske emner, før eller imens du arbejder med dine Grammar-opgaver. Danskhjælpen Danskhjælpen er en lille opslagsgrammatik. Her kan du læse om de grammatiske emner, før eller imens du arbejder med dine Grammar-opgaver. Adjektiver (At Risk) 2 Present Continuous (What s

Læs mere

- b r u g e r v e j l e d n i n g

- b r u g e r v e j l e d n i n g Active - b r u g e r v e j l e d n i n g! O B S! V I G T I G T L æ s d e n n e b r u g e v e j l e d n i n g f ø r A c t i v e t a g e s i b r u g. D a t o : 2 0 0 7-0 2-2 3 V e r s i o n 3 P r o ducent

Læs mere

Arduino Programmering

Arduino Programmering Microcontroller, Arduino I teknologi skal vi lære at lave programmer til uc for at have muligheden til eksamen at kunne lave intelligente el-produkter. I hvert fald skal vi have set mulighederne, og forstået

Læs mere

Vina Nguyen HSSP July 13, 2008

Vina Nguyen HSSP July 13, 2008 Vina Nguyen HSSP July 13, 2008 1 What does it mean if sets A, B, C are a partition of set D? 2 How do you calculate P(A B) using the formula for conditional probability? 3 What is the difference between

Læs mere

Medfødt grammatik. Chomskys teori om sprogtilegnelse efterlader to store stridspunkter i forståelsen af børnesprog:

Medfødt grammatik. Chomskys teori om sprogtilegnelse efterlader to store stridspunkter i forståelsen af børnesprog: Medfødt grammatik I slutningen af 1950 erne argumenterede lingvisten Noam Chomsky for, at sprogets generativitet måtte indeholde nogle komplekse strukturer. Chomskys argumentation bestod primært af spørgsmålet

Læs mere

Sprogteknologi I Undervisningsplan Forårssemester 2009

Sprogteknologi I Undervisningsplan Forårssemester 2009 Sprogteknologi I Undervisningsplan Forårssemester 2009 Version 1 Patrizia Paggio 25/1/2009 6.feb: Lektion 1. Introduktion til sprogteknologi Hvad er sprogteknologi Hvorfor er det svært at processere sprog

Læs mere

LOGIK ANVENDT TIL OVERSÆTTELSE AF JAPANSK.

LOGIK ANVENDT TIL OVERSÆTTELSE AF JAPANSK. Arendse Bernth Datalogisk Inst. Københavns Univ. Sigurdsgade 41, DK-2200 København N LOGIK ANVENDT TIL OVERSÆTTELSE AF JAPANSK. På Datalogisk Institut ved Københavns Universitet eksperimenteres for tiden

Læs mere

Opgave: Digitalisering af et dokument

Opgave: Digitalisering af et dokument Denne opgave omhandler digitaliseringen af et Veje i Frederikssund Kommune. I opgaven gennemgås følgende: Oprettelse af mapper og sider på hjemmesiden Indsættelse af tekst, billeder, links til PDF og hjemmesider

Læs mere

FIP-kursus i tysk WORKSHOP MED FOKUS PÅ DEN NYE SKRIFTLIGE PRØVE

FIP-kursus i tysk WORKSHOP MED FOKUS PÅ DEN NYE SKRIFTLIGE PRØVE FIP-kursus i tysk WORKSHOP MED FOKUS PÅ DEN NYE SKRIFTLIGE PRØVE Program Præsentation af den nye skriftlige prøves opbygning og opgavetyper Bedømmelseskriterier Opgavetyper Eksempler på træningsopgaver

Læs mere

Studiepartitur - A Tempo

Studiepartitur - A Tempo Himle ortæller om Guds herlighed ørge Grave Nielse 99 Sl 9 v - v -0 q = ca 9 ( gag) (ved DC) hæ - ders værk; c c c c S S A A ( gag) (ved DC) cresc (ved DC) Him - le or-tæl-ler om Guds Ó Kao: cresc (ved

Læs mere

Matricer og lineære ligningssystemer

Matricer og lineære ligningssystemer Matricer og lineære ligningssystemer Grete Ridder Ebbesen Virum Gymnasium Indhold 1 Matricer 11 Grundlæggende begreber 1 Regning med matricer 3 13 Kvadratiske matricer og determinant 9 14 Invers matrix

Læs mere

22 Hobe. Noter. PS1 -- Hobe. Binære hobe. Minimum-hob og maximum-hob. Den abstrakte datatype minimum-hob. Opbygning af hobe. Operationen siv-ned.

22 Hobe. Noter. PS1 -- Hobe. Binære hobe. Minimum-hob og maximum-hob. Den abstrakte datatype minimum-hob. Opbygning af hobe. Operationen siv-ned. 22 Hobe. Binære hobe. Minimum-hob og maximum-hob. Den abstrakte datatype minimum-hob. Opbygning af hobe. Operationen siv-ned. Indsættelse i hobe. Sletning af minimalt element i hobe. Repræsentation. 327

Læs mere

Bedømmelsesvejledning til prøven i skriftlig fremstilling G, december Dansk som andetsprog

Bedømmelsesvejledning til prøven i skriftlig fremstilling G, december Dansk som andetsprog Bedømmelsesvejledning til prøven i skriftlig fremstilling G, december 2016 Dansk som andetsprog Information om prøven i skriftlig fremstilling G Prøven i skriftlig fremstilling G består af et teksthæfte,

Læs mere

How to do in rows and columns 8

How to do in rows and columns 8 INTRODUKTION TIL REGNEARK Denne artikel handler generelt om, hvad regneark egentlig er, og hvordan det bruges på et principielt plan. Indholdet bør derfor kunne anvendes uden hensyn til, hvilken version

Læs mere

Sådan bruger du Den Engelske Regnskabsordbog

Sådan bruger du Den Engelske Regnskabsordbog Sådan bruger du Den Engelske Regnskabsordbog Visning Når du får et søgeresultat, kan du gøre skriften større eller mindre ved at klikke på knapperne yderst til højre på skærmen: større, mindre, nulstil.

Læs mere

1 JENS PORSBORG Jela HENRIK DAHL

1 JENS PORSBORG Jela HENRIK DAHL 1 JENS PORSBORG Jela HENRIK DAHL Kære elev! Vi lærer at læse ved at læse. Og for at blive en god og sikker læser, skal vi læse meget rigtig meget. Når du skal læse ord, skal du bruge bogstavernes lyde

Læs mere

SPROGNOTER for mindrebemidlede

SPROGNOTER for mindrebemidlede AALBORG UNIVERSITET CENTER FOR LINGVISTIK HANS GÖTZSCHE SPROGNOTER for mindrebemidlede Emne: SPROG og TEKSTLIG FREMSTILLING version opd/prt 2011-09-07 Teori og eksempler: ORD OG SÆTNING BLIVER TIL TEKST

Læs mere

ÅTOFTENS GRUNDEJERFORENING 20. se p t e mb e r 2006 I h e n h o l d t i l v e d t æ g t e rn e s 4 i n d k al d e s h e rme d t i l ORDINÆ R GENERA L FORSA M L ING t o rsd ag d e n 5. o k t o b e r 2006

Læs mere

Mediesyntaks. Om sætningskompleksitet og talesprog på DR og TV 2. Ph.d. afhandling Institut for Sprog og Kommunikation Center for Journalistik

Mediesyntaks. Om sætningskompleksitet og talesprog på DR og TV 2. Ph.d. afhandling Institut for Sprog og Kommunikation Center for Journalistik Mediesyntaks Om sætningskompleksitet og talesprog på DR og TV 2 Ph.d. afhandling Institut for Sprog og Kommunikation Center for Journalistik Vejleder: Peder Skyum Nielsen Jonas Nygaard Blom Institut for

Læs mere

Dedikeret til Gentofte og Jægersborg Kirkers Børne- og Pigekor. Phillip Faber. Halfdan-suite. For børnekor (2 lige stemmer) med klaverakkompagnement

Dedikeret til Gentofte og Jægersborg Kirkers Børne- og Pigekor. Phillip Faber. Halfdan-suite. For børnekor (2 lige stemmer) med klaverakkompagnement edikeret til entofte Jægersborg Kirkers Børne Pigekor Philli aber Halfdansuite or børnekor (2 lige stemmer) med klaverakkoagnement til tekster af Halfdan Rasmussen Teksten er benyttet med tilladelse af

Læs mere

ENGELSK GRAMMATIK. Videooversigt. De skriftlige opgaver... 2 Eksamen... 2 Grammatik... 3 Shakespeare... 4 Up your game!... 5.

ENGELSK GRAMMATIK. Videooversigt. De skriftlige opgaver... 2 Eksamen... 2 Grammatik... 3 Shakespeare... 4 Up your game!... 5. ENGELSK GRAMMATIK Videooversigt De skriftlige opgaver... 2 Eksamen... 2 Grammatik... 3 Shakespeare... 4 Up your game!... 5 36 Videoer 1 De skriftlige opgaver Eksamen Den skønlitterære stil 1. Hvordan starter

Læs mere

Dansk. 1. Er sproget Dansk i Open Office og er der dansk stavekontrol?

Dansk. 1. Er sproget Dansk i Open Office og er der dansk stavekontrol? NEED TO KNOW Nedenstående er et bud på nogle af de funktioner man kan have glæde af i Open Office når man skriver opgaver til skolen. - Nedenstående er alene en anvisning på nogle af de punkter der står

Læs mere

Brugervejledning. ClaroRead fra Dictus -PC

Brugervejledning. ClaroRead fra Dictus -PC Brugervejledning ClaroRead fra Dictus -PC 1 Indholdsfortegnelse HVAD ER CLAROREAD?... 3 INSTALLATION... 3 CLAROREAD-VÆRKTØJSLINJE... 3 AFSPIL... 4 STOP... 4 GEM TEKST SOM LYDFIL... 4 INDSTILLINGER... 5

Læs mere

Encoding:...1 Et tegn sæt (character set):...1 UTF-8 og UTF-16 (Unicode):...2

Encoding:...1 Et tegn sæt (character set):...1 UTF-8 og UTF-16 (Unicode):...2 Encoding:...1 Et tegn sæt (character set):...1 UTF-8 og UTF-16 (Unicode):...2 Encoding: Vi har tidligere set på spørgsmålet om et XML dokuments encoding. Det er generelt altid en god ide at gemme et dokument

Læs mere

Lineære differentialligningers karakter og lineære 1. ordens differentialligninger

Lineære differentialligningers karakter og lineære 1. ordens differentialligninger enote 11 1 enote 11 Lineære differentialligningers karakter og lineære 1. ordens differentialligninger I denne note introduceres lineære differentialligninger, som er en speciel (og bekvem) form for differentialligninger.

Læs mere

LOT TE RI E NEC KER, PE TER STRAY JØR GEN SEN, MOR TEN GAN DIL. Skriv en ar ti kel. om vi den ska be li ge, fag li ge og for mid len de ar tik ler

LOT TE RI E NEC KER, PE TER STRAY JØR GEN SEN, MOR TEN GAN DIL. Skriv en ar ti kel. om vi den ska be li ge, fag li ge og for mid len de ar tik ler LOT TE RI E NEC KER, PE TER STRAY JØR GEN SEN, MOR TEN GAN DIL Skriv en ar ti kel om vi den ska be li ge, fag li ge og for mid len de ar tik ler For la get Sam funds lit tera tur Lot te Ri e nec ker, Pe

Læs mere

Hvor er mine runde hjørner?

Hvor er mine runde hjørner? Hvor er mine runde hjørner? Ofte møder vi fortvivlelse blandt kunder, når de ser deres nye flotte site i deres browser og indser, at det ser anderledes ud, i forhold til det design, de godkendte i starten

Læs mere

ADMINISTRATIONS MANUAL

ADMINISTRATIONS MANUAL ADMINISTRATIONS MANUAL onmap.dk Administrations Manual Dansk Version 0.1 Side 1 Denne manual beskrive hvordan en race administrator kan opsætte og bruge onmap.dk race protalen til at lave en specialiseret

Læs mere

GUIDE TIL BREVSKRIVNING

GUIDE TIL BREVSKRIVNING GUIDE TIL BREVSKRIVNING APPELBREVE Formålet med at skrive et appelbrev er at få modtageren til at overholde menneskerettighederne. Det er en god idé at lægge vægt på modtagerens forpligtelser over for

Læs mere

Barnets navn: Børnehave: Kommune: Barnets modersmål (kan være mere end et)

Barnets navn: Børnehave: Kommune: Barnets modersmål (kan være mere end et) Forældreskema Barnets navn: Børnehave: Kommune: Barnets modersmål (kan være mere end et) Barnets alder: år og måneder Barnet begyndte at lære dansk da det var år Søg at besvare disse spørgsmål så godt

Læs mere

Hvad er Objekter - Programmering

Hvad er Objekter - Programmering Denne guide er oprindeligt udgivet på Eksperten.dk Hvad er Objekter - Programmering En rigtig god gennemgang af hvad objekter er! Hvordan de oprettes og anvendes! Det er helt klart til nybegyndere, som

Læs mere

Maple. Skærmbilledet. Vi starter med at se lidt nærmere på opstartsbilledet i Maple. Værktøjslinje til indtastningsområdet. Menulinje.

Maple. Skærmbilledet. Vi starter med at se lidt nærmere på opstartsbilledet i Maple. Værktøjslinje til indtastningsområdet. Menulinje. Maple Dette kapitel giver en kort introduktion til hvordan Maple 12 kan benyttes til at løse mange af de opgaver, som man bliver mødt med i matematiktimerne på HHX. Skærmbilledet Vi starter med at se lidt

Læs mere

PaNoLa: The Danish Connection. Eckhard Bick Institut for Sprog og Kommunikation, Syddansk Universitet lineb@hum.au.dk, http://visl.hum.sdu.

PaNoLa: The Danish Connection. Eckhard Bick Institut for Sprog og Kommunikation, Syddansk Universitet lineb@hum.au.dk, http://visl.hum.sdu. PaNoLa: The Danish Connection Eckhard Bick Institut for Sprog og Kommunikation, Syddansk Universitet lineb@hum.au.dk, http://visl.hum.sdu.dk 1. The project PaNoLa (Parsing Nordic Languages) is a two-year

Læs mere

Holdelementnavn XPRS fagbetegnelse (kort) Norm. elevtid (skoleår) Lektioner (antal) 1g ap Almen sprogfors 0 28 totalt 3g as Astronomi 44 1g bk

Holdelementnavn XPRS fagbetegnelse (kort) Norm. elevtid (skoleår) Lektioner (antal) 1g ap Almen sprogfors 0 28 totalt 3g as Astronomi 44 1g bk Holdelementnavn XPRS fagbetegnelse (kort) Norm. elevtid (skoleår) Lektioner (antal) 1g ap Almen sprogfors 0 28 totalt 3g as Astronomi 44 1g bk Billedkunst 47 1g bi Biologi 10 41 2a BI Biologi 45 95 2c

Læs mere

Løsningsforslag til opgaver i Claus Drengsted-Nielsen: Grammatik på dansk

Løsningsforslag til opgaver i Claus Drengsted-Nielsen: Grammatik på dansk Løsningsforslag til opgaver i Claus Drengsted-Nielsen: Grammatik på dansk Grammatik på dansk er nu på Facebook: facebook.com/grammatikpd Her kan du følge med i sproglige spørgsmål og selv spørge. Der er

Læs mere

Grammatisk mini-encyklopædi Ved Sten Stenbæk Fjerritslev Gymnasium

Grammatisk mini-encyklopædi Ved Sten Stenbæk Fjerritslev Gymnasium Grammatisk mini-encyklopædi Ved Sten Stenbæk Fjerritslev Gymnasium Mini-encyklopædien er bygget alfabetisk op. Der er 3 måder at orientere sig: 1. Du kan bruge alfabet-bjælken herover 2. Du kan også trykke

Læs mere

Minigrammatik. Oversigter fra tysk.gyldendal.dk

Minigrammatik. Oversigter fra tysk.gyldendal.dk Minigrammatik Oversigter fra Artikler (kendeord) 1 Artikler danner bestemte eller ubestemte former af substantiver (navneord). De viser også, hvilket køn et substantiv har, om det er ental eller flertal,

Læs mere

Temadrøftelse Integration, dagtilbud 2018

Temadrøftelse Integration, dagtilbud 2018 Temadrøftelse Integration, dagtilbud 18 Dagtilbud Burma Rumænien Dagtilbud Bosnien Ukraine Litauen Libanon Familiens oprindelsesland for børn i børnehaver Holland Congo Letland Eritrea Tyrkiet Polen/Danmark

Læs mere

Lagervisning. Dina Friis, og Niels Boldt,

Lagervisning. Dina Friis, og Niels Boldt, Lagervisning Dina Friis, dina@diku.dk og Niels Boldt, boldt@diku.dk 6. april 2001 Kapitel 1 Sammenfatning Dette dokument er et eksempel på en delvis besvarelse af G-opgaven stillet på Datalogi 0 2000-2001.

Læs mere

Italien spørgeskema til seminarielærere / sprog - dataanalyse

Italien spørgeskema til seminarielærere / sprog - dataanalyse Italien spørgeskema til seminarielærere / sprog - dataanalyse Om dig 1. 7 seminarielærere, der under viser i sprog, har besvaret spørgeskemaet 2. 6 undervisere taler engelsk, 6 fransk, 3 spansk, 2 tysk

Læs mere

Test din viden om Konjunktioner

Test din viden om Konjunktioner Ann Kledal og Barbara Fischer-Hansen Test din viden om Konjunktioner 10 testopgaver til arbejdshæftet PARAT START 3 knyttet til grundbogen BASISGRAMMATIKKEN Special-pædagogisk forlag Xxxxxxxxx 1 Test din

Læs mere