Skabelon for Det Humanistiske Fakultets Uddannelser Studieordning for tilvalgsstudiet på BA-niveau i It og Sprog 2007-ordningen Under Uddannelsesbekendtgørelsen af 2004 Faculty of Humanities Curriculum for the Elective Studies in IT and Language The 2007 Curriculum Justeret 2010 Studienævnet for Nordiske Studier og Sprogvidenskab Det Humanistiske Fakultet Københavns Universitet The Study Committee for Scandinavian Languages and Linguistics Faculty of Humanities University of Copenhagen
Kapitel 1. Indledning 1.1 Uddannelsesdel, fag og år Tilvalgsstudiet på BA-niveau i It og Sprog, 2007-ordningen. 1.2 Tilhørsforhold Denne studieordning gælder for tilvalgsstudiet i It og Sprog under Studienævnet for Nordiske Studier og Sprogvidenskab. Studiet er udbudt i samarbejde med Datalogisk Studienævn, Center for Sprogteknologi og Institut for Engelsk, Germansk og Romansk ved Det Humanistiske Fakultet, Københavns Universitet. 1.3 Ikrafttræden og hjemmel Studieordningen træder i kraft d. 1. september 2007 i henhold til "Bekendtgørelse om bachelor- og kandidatuddannelser ved universiteterne" (nr. 338 af 6. maj 2004). Studerende der indskrives på et tilvalg i It og Sprog pr. 1. september 2007 eller senere, skal studere efter denne ordning. 1.4 Varighed og struktur Tilvalgsstudiet i It og Sprog er normeret til 45 ECTS-point. Dele af tilvalgsstudiet i It og Sprog kan dog også bruges som enkeltstående tilvalg. 60 ECTS-point svarer til et års fuldtidsstudium. Tilvalgsstudiet er en del af en samlet 3-årig bacheloruddannelse der er normeret til 180 ECTS-point, hvoraf 135 ECTS-point er grundfag. Minimum 30 ECTS-point af tilvalget skal være uden for den studerendes eget grundfag. 1.5 Indskrivning En studerendes indskrivning på en uddannelse bevirker at vedkommende er omfattet af de rettigheder og pligter der gælder på den pågældende uddannelse. Det er den studerendes indskrivning der giver ret til at gå til eksamen på uddannelsen. Den studerende er selv ansvarlig for at være indskrevet korrekt. Indskrivning til tilvalg følger Fakultetets retningslinjer. 2
Det Humanistiske Fakultets bacheloruddannelser er tilrettelagt således at den studerende har bestået 120 ECTS-point af bachelorgrundfaget samt eventuel propædeutik førend BA-tilvalget påbegyndes. Det er en forudsætning at den studerende har bestået førsteårsprøven inden tilvalget påbegyndes. 1.6 Faglig profil 1.6.1 Formål og kompetenceprofil Tilvalgsstudiet i It og Sprog fungerer som et vigtigt teknologisk supplement til et humanistisk grundstudium, idet studiet giver kompetence til at kunne håndtere komplekse sproglige problemstillinger ved hjælp af informationsteknologi. De tre moduler som tilvalgsstudiet består af, giver til sammen en indføring i en række sproglige, sprogteknologiske og datalogiske fagområder og sætter dermed de studerende i stand til at løse konkrete sproglige og datalogiske opgaver med en tværfaglig tilgang. De konkrete områder som de studerende opbygger kompetence inden for, er fleksibel informationshåndtering på nettet, avanceret automatisk sproganalyse på store tekstmængder, samt maskinoversættelse. Endvidere får man i studiet en introduktion til programmering i et moderne programmeringssprog der kan bruges i forbindelse med flere af de omtalte anvendelser, som for eksempel informationssøgning og tekstanalyse. Tilvalgsstudiet er relevant for humanistiske studerende som gerne vil søge optagelse på kandidatuddannelsen i It og Kognition.. 1.6.2 Kompetencemål Tilvalgsstudiet i IT og sprog giver i sin helhed de studerende flg. specifikke kompetencer: - viden om datalogiske grundbegreber og kendskab til et programmeringssprog, - erfaring med at anvende programmering på håndtering af sprogligt materiale med specielt henblik på informationssøgning på nettet, - træning i at organisere viden i formelle systemer, fx ordnet og ontologier, og i at benytte standarder til kodning af information på nettet, - erfaring med at bruge videnssystemer til informationssøgning, - viden om korpusmetoder og erfaring i at anvende dem til sproglige og litterære analyser, - kendskab til teorier og metoder inden for korpuslingvistik, - kendskab til forsknings- og udviklingsresultater inden for maskinoversættelse, - erfaring med udvikling af et mindre maskinoversættelsessystem. 1.7 Læsning af tekster på fremmedsprog Den studerende skal være indstillet på at læse akademiske tekster på engelsk. 1.8 Normalsidebegrebet En normalside i forbindelse med tekstopgivelser (af moderne, vestlige tekststykker) og aflevering af hjemmeopgaver svarer til 2400 typeenheder inkl. mellemrum. Ved beregning af omfang af hjemmeopgaver indgår noter, men ikke forside, litteraturliste og bilag. 3
For tekniske tekster, fx programmeringstekster, består en normalside af 1550 typeenheder. 1.9 Stave- og formuleringsevne Ved bedømmelsen af skriftlige hjemmeopgaver skrevet såvel på dansk som på et fremmedsprog skal den studerendes stave- og formuleringsevne (som dokumenteret i den forelagte præstation) indgå i helhedsbedømmelsen af den pågældende præstation, idet det faglige indhold dog skal vægtes tungest. 1.10 Dispensation fra studieordningen Studienævnet kan dispensere fra bestemmelser i studieordningen der alene er fastsat af studienævnet hvis der foreligger usædvanlige forhold. 1.11 Prøver Der afholdes syge- og omprøve i overensstemmelse med eksamensbekendtgørelsens regler. Studienævnet fastsætter nærmere regler for syge- og omprøver og kan beslutte at syge- eller omprøven afholdes som en anden prøveform end den ordinære prøve. 1.12 Øvrige bemærkninger Studerende der frit sammensætter deres tilvalg, skal selv drage omsorg for at deres BA-uddannelse lever op til eksamensbekendtgørelsens krav om at højst 1/3 af uddannelsen (15 ECTS-point af tilvalget) må være bedømt med bestået/ikke-bestået, og at mindst 1/3 (15 ECTS-point af tilvalget) skal være bedømt med ekstern censur. 1.13 Overgangsregler Efter den 31. august 2010 kan der ikke længere aflægges eksaminer på bacheloruddannelser under 1995-bekendtgørelsen, herunder tilvalg. 4
Kapitel 2. Oversigt over og beskrivelse af uddannelsens fagelementer 2.1 Oversigt over uddannelsens fagelementer Tilvalgsstudiet i It og Sprog består af følgende fagelementer: Modul I: Informationssøgning de bagvedliggende datalogiske og sprogteknologiske principper (fagelementkode 47651041) Information searching underlying methods from computer science and language technology Antal ECTS-point: 15. Prøveform: Bunden skriftlig hjemmeopgave med efterfølgende mundtlig sagsfremstilling, under forudsætning af aktiv undervisningsdeltagelse Censurform: Intern censur. Bedømmelsesform: Prøven bedømmes efter 7-trins-skalaen. Gruppeprøvebestemmelser: Prøven kan aflægges som gruppeprøve. Modul II: IT i sproglige og litterære studier (fagelementkode 47651042) IT in linguistic and literary studies Antal ECTS-point: 15. Prøveform: Fri skriftlig hjemmeopgave. Censurform: Intern censur. Bedømmelsesform: Prøven bedømmes efter 7-trins-skalaen. Gruppeprøvebestemmelser: Prøven kan aflægges som gruppeprøve. Modul III: Formel grammatik og maskinoversættelse (fagelementkode 47651043) Formal grammar and machine translation Antal ECTS-point: 15. Prøveform: Bunden skriftlig prøve på universitet under tilsyn. Censurform: Ekstern censur. Bedømmelsesform: Prøven bedømmes efter 7-trins-skalaen. Gruppeprøvebestemmelser: Prøven kan kun aflægges som individuel prøve. 2.2 Rækkefølge for afvikling af fagelementer Der er ikke nogen særlig binding imellem modulerne under tilvalgsstudiet It og Sprog, og kurserne kan også tages som enkeltmoduler. 2.3 Indhold og uddybende karakteristik af uddannelsens fagelementer Modul I: (15 ECTS-point) Informationssøgning de bagvedliggende datalogiske og sprogteknologiske principper (fagelementkode 47651041) (15 ECTS-point) 5
Information searching underlying methods from computer science and language technology Kompetencemål: Efter bestået eksamen har den studerende kendskab til grundlæggende datalogiske begreber og erfaring med at bruge et moderne programmeringssprog til at løse sproglige opgaver, med særlig henblik på informationssøgning på nettet. Dette inkluderer også viden om hvordan sprogteknologiske værktøjer såsom taggere og lemmatisere kan inddrages. Den studerende har desuden kendskab til teoretiske problemstillinger inden for informationssøgning, samt til hvordan man kan systematisere viden i semantiske strukturer som fx ordnet og ontologier til brug for søgning. Den studerende har også viden om standarder til kodning af information, fx XML og RDF, samt praktisk erfaring med at bruge dem til opbygning af mindre semantiske modeller. Undervisnings- og arbejdsformer: Undervisnings- og arbejdsformen vil være holdundervisning med aktiv inddragelse af de studerende. Dette vil bl.a. ske via obligatoriske ugeøvelser som de studerende vil løse med vejledning fra underviseren, eller ved oplæg fra de studerende. En stor del af undervisningen vil foregå i edb-lokaler. Faglige mål: Eksaminanden skal i den skriftlig opgave kunne analysere sproglige problemstillinger der er relevante for informationssøgning på internettet; kunne løse disse (sproglige) problemstillinger datalogisk og programmere løsningen i det valgte programmeringssprog; kunne evaluere løsningsforslaget både med hensyn til den sproglige dækningsgrad og den datalogiske fremgangsmåde. Eksaminanden skal til den mundtlige prøve kunne redegøre for arbejdet i hjemmeopgaven; beherske de teorier og metoder der er blevet gennemgået under kurset. Pensum: Til eksamen opgiver eksaminanden 600 normalsider litteratur udvalgt blandt det materiale som er blevet gennemgået ved kurset. Af disse skal 300 normalsider referere til sproglige aspekter og 300 til datalogiske aspekter. De datalogiske tekster gælder som tekniske tektser hvad angår normalsideberegningen. Disse tekstopgivelser skal godkendes af to vejledere, som henholdsvis er ansvarlige for de sproglige og de datalogiske aspekter. Prøveform: Eksamen består af aktiv deltagelse, dvs. aflevering og godkendelse af mindst 6 af de obligatoriske ugeøvelser, og af en bunden skriftlig hjemmeopgave med tidsfrist efterfulgt af mundtlig prøve (sagsfremstilling med efterfølgende diskussion). Censur: Prøven er med intern censur, og den skal bedømmes af to eksaminatorer, som henholdsvis er ansvarlige for de sproglige og de datalogiske aspekter. Bedømmelsesform: Prøven bedømmes efter 7-trins-skalaen, og der gives en samlet karakter, som både tager højde for de sproglige og de datalogiske aspekter, der vægtes lige højt. Omfang: Prøven består i en besvarelse af en af eksaminatorerne skriftligt formuleret opgave, der udleveres til eksaminanden 3 uger i forvejen. Besvarelsen består af en rapport på 15-20 normalsider og en cd-rom med relevant programmel. Programdokumentationen skal vedlægges som bilag. I den mundtlige prøve indleder eksaminanden med en præsentation hvor han/hun redegør for sin hjemmeopgave. Den studerende vil under prøven have adgang til en pc, hvor han/hun kan vælge at vise sit program. Denne præsentation efterfølges af en diskussion mellem eksaminatorerne og 6
eksaminanden som kan handle dels om en yderligere præcisering af problemstillinger vedrørende hjemmeopgaven, dels om andre emner inden for det opgivne pensum. Hvis opgaven er udarbejdet af en gruppe på 2 personer, skal den udgøre 25-30 normalsider. Hvis den er udarbejdet af 3 personer, skal den udgøre 35-40 normalsider. Ved gruppeprøver skal hver enkelt deltagers bidrag være en afrundet helhed, der kan bedømmes for sig selv. Deltagernes fælles bidrag må ikke overstige 50 %. Den mundtlige prøve varer 45 min. inkl. votering. Den studerendes præsentation varer ca. 5-10 minutter, og resten af tiden fordeles mellem sproglige og datalogiske diskussionsemner. Prøven er altid individuel. Hjælpemidler: Ved udarbejdelse af den skriftlige hjemmeopgave er alle hjælpemidler tilladt. Til den mundtlige prøve må eksaminanden medbringe noter og/eller en elektronisk præsentation til den mundlige prøve. Andre hjælpemidler er ikke tilladt til den mundtlige prøve. Gruppeprøvebestemmelse: Prøven kan aflægges som gruppeprøve med individuel bedømmelse. En gruppe må bestå af 2-3 personer. Den efterfølgende mundtlige prøve aflægges individuelt på baggrund af individuelle spørgsmål som tager udgangspunkt i gruppeopgaven. Modul II: (15 ECTS-point) It i sproglige og litterære studier (fagelementkode 47651042) (15 ECTS-point) IT in linguistic and literary studies Kompetencemål: 1) at gøre de studerende i stand til at anvende korpusmetoder (metoder til håndtering af store tekstmængder) til at analysere sproglige og litterære, herunder kontrastive og oversættelsesrelaterede, problemstillinger, samt 2) at give de studerende kendskab til grundlæggende teorier og metoder i korpuslingvistik. Efter kurset vil de studerende selv kunne foretage korpusanalyser og vil have kendskab til en række basale metoder og værktøjer som kan anvendes når man arbejder med store tekstmængder, både studie- og erhvervsmæssigt. Indholdsbeskrivelse: Kurset indledes med en gennemgang af de empiriske metoder som korpuslingvistikken tilbyder, både til sproglige og litterære studier. Endvidere gennemgås grundlæggende principper for opbygning af korpora, samt principperne bag de forskellige metoder til opmærkning af korpora. Man kan opmærke manuelt, men der findes også automatiske metoder som man lærer at bruge. Til de praktiske øvelser anvendes et korpusplatform som indeholder originaltekster og oversatte tekster på flere sprog. I undervisningen vil der også blive inddraget andre tekstsamlinger og korpusplatforme. De studerende vil endvidere blive indført i forskellige programmer som er relevante i forbindelse med korpusarbejde, bl.a. programmer til ordklasse-tagging og lemmatisering, og de vil lære at foretage søgninger i et eller flere sprog med et søgeværktøj som fx IMS-CQP. Korpusanalyser giver mulighed for at arbejde med problemstillinger som fx hvordan en bestemt konstruktion på ét sprog typisk oversættes til et andet en forfatters brug af bestemte ord, grammatiske konstruktioner eller semantiske felter. I den sidste del af kurset perspektiveres brugen af automatiske metoder ved at se på andre anvendelser. På basis af kurset udarbejder de studerende en opgave hvor der gennemføres en korpusbaseret analyse af et specifikt sprogligt eller litterært fænomen (monolingvalt eller kontrastivt), som undersøges ved hjælp af de gennemgåede metoder og værktøjer. 7
Undervisnings- og arbejdsformer: Undervisnings- og arbejdsformen vil veksle mellem forelæsninger og holdundervisning med aktiv inddragelse af de studerende. Dette vil ske via studenteroplæg, gruppearbejde m.m. Der forventes en stor grad af selvstændigt arbejde med korpusværktøjer og -data. Faglige mål: Eksaminanden skal beherske en række basale metoder og værktøjer inden for korpuslingvistik; kunne foretage korpusanalyser af sproglig eller litterær art ved hjælp af nævnte metoder og værktøjer. Pensum: Eksaminanden opgiver et pensum på 500 normalsider. Det samlede pensum skal godkendes af vejleder. Prøveform: Fri skriftlig hjemmeopgave. Den skriftlige opgave skal ligge inden for rammer som defineres af underviseren og skal eksemplificeres med cases. Omfang: Opgaven skal udgøre 15-20 normalsider. Hvis opgaven er udarbejdet af en gruppe på 2 personer, skal den udgøre 25-30 normalsider. Ved gruppeprøver skal hver enkelt deltagers bidrag være en afrundet helhed, der kan bedømmes for sig selv. Deltagernes fælles bidrag må ikke overstige 50 %. Censur: Prøven er med intern censur. Bedømmelsesform: Prøven bedømmes efter 7-trins-skalaen. Hjælpemidler: Alle hjælpemidler er tilladt. Gruppeprøvebestemmelse: Prøven kan aflægges som gruppeprøve med individuel bedømmelse. Ved en gruppeprøve kan der højst deltage 2 eksaminander. Modul III: (15 ECTS-point) Formel grammatik og maskinoversættelse (fagelementkode 47651043) (15 ECTS-point) Formal grammar and machine translation Kompetencemål: At give den studerende grundlæggende kendskab til formalismer og teorier i sproglig analyse og maskinoversættelse, der gør den studerende i stand til at modellere sproglig forståelse og produktion samt oversættelse på et formelt grundlag. Indholdsbeskrivelse: På kurset gennemgås forsknings- og udviklingsresultater inden for området maskinoversættelse; dvs. computerbaseret oversættelse fra et sprog til et andet. Vi tager udgangspunkt i analysen af forskellige oversættelsesproblemer med henblik på den sproglige og tværsproglige viden der er påkrævet for at automatisere oversættelsesprocessen. I den forbindelse gennemgår vi de forskellige komponenter der indgår i maskinoversættelsessystemer, både de sprogbeskrivende, som fx grammatikker for kilde- og målsprog samt oversættelsesregler, og de datamatiske, som processerer kildesætninger og genererer oversættelsesækvivalenter i overensstemmelse med grammatikken og oversættelsesreglerne. Parallelt udvikles de sprogbeskrivende komponenter for et mindre oversættelsessystem for engelsk-dansk, dvs. 8
grammatikker for engelsk og dansk, samt oversættelsesreglerne imellem de to sprog. Disse udvikles i en veletableret grammatikformalisme, fx LFG, og afprøves på et grammatikudviklingssystem, fx. "Xerox Linguistic Environment" (XLE). Undervisnings- og arbejdsformer: Forelæsninger og praktiske øvelser. Faglige mål: Eksaminanden skal beherske de teorier og metoder der er blevet gennemgået under kurset; kunne analysere oversættelsesproblemer; kunne formalisere/implementere og evaluere løsninger ved hjælp af nævnte metoder. Litteratur: Litteratur meddeles på kurset. Faglige forudsætninger: Kurset forudsætter kendskab til grammatik og oversættelse, men der forudsættes ingen speciel datalingvistisk eller datalogisk baggrund. Pensum: Eksaminanden opgiver et pensum på 500 normalsider normalt udvalgt fra, men ikke begrænset til, den meddelte litteratur.det samlede pensum skal godkendes af vejleder. Prøveform: Bunden skriftlig prøve på universitetet under tilsyn. Prøven består af en række spørgsmål om det angivne pensum. Eksaminanden har 5 timer til sin rådighed. Censurform: Ekstern censur. Bedømmelsesform: Prøven bedømmes efter 7-trins-skalaen Hjælpemidler: Ubegrænset brug af hjælpemidler. Gruppeprøvebestemmelse: Prøven kan kun aflægges som individuel prøve. 9
Godkendelse Godkendt af Studienævnet for Nordiske Studier og Sprogvidenskab d. 30. maj 2007 Godkendt af dekanen ved Det Humanistiske Fakultet d. 28. august 2007 Justeret og godkendt af Studienævet for Nordiske Studier og Sprogvidenskab, København den 23. april 2008. Justeret og godkendt af dekanen ved Det Humanistiske Fakultet den 27. maj 2008. Justeret og godkendt af Studienævet for Nordiske Studier og Sprogvidenskab den 5. maj 2010. Justeret og godkendt af dekanen ved Det Humanistiske Fakultet den 17. august 2010. Kirsten Refsing Dekan /Annette Moe Studiechef 10