Resumé. Cand.ling.merc.-speciale Tysk (profil: translatør/tolk) Lisbet Pors ( )

Størrelse: px
Starte visningen fra side:

Download "Resumé. Cand.ling.merc.-speciale Tysk (profil: translatør/tolk) Lisbet Pors ( )"

Transkript

1 Resumé Fachsprachliche Korpora und Fachlexikographie - Errichtung eines deutschen patent- und gebrauchsmusterrechtlichen Korpus bei der Anwendung von Selektion der Fachtermini für Juridisk ordbog tysk-dansk Diese Diplomarbeit behandelt die Anwendung von fachsprachlichen Korpora für die Selektion von Fachtermini für Fachwörterbücher. Dieses Thema wird beleuchtet durch eine Diskussion über die Errichtung eines deutschen patent- und gebrauchsmusterrechtlichen Korpus für die Selektion von patent- und gebrauchsmusterlichen Fachtermini für das deutsch-dänische juristische Fachwörterbuch Juridisk ordbog tysk-dansk. Damit ist der Zweck dieser Arbeit herauszufinden, wie man konkret eine solche Korpuserrichtung vornimmt, und welcher Überlegungen die Herstellung einer Terminusliste zu Grunde liegen. Als Basis für die Errichtung des Korpus werden die objektiven empirischen Theorien verwendet, die Douglas Biber für die Errichtung von repräsentativen allgemeinsprachlichen Korpora entwickelt hat. Diese Theorien sind hier an die Errichtung von repräsentativen, fachsprachlichen Korpora angepasst. Die Diplomarbeit ist in drei Kapiteln eingeteilt: Ein erstes Kapitel über den Inhalt und die Grenzen der Arbeit, ein zweites Kapitel über eine Diskussion der angewandten Theorie und ein letztes Kapitel über die praktische Errichtung des Korpus, sowie eine Wertung der gefundenen Einwortbenennungen. Die Untersuchungen zeigen, dass Korpora ein sehr anwendbares Werkzeug für die Selektion von Fachtermini für Fachwörterbücher sind - im Gegensatz zu einem objektiven, introspektiven Zugang zu der Arbeit mit Wörterbüchern. Jedoch gibt es immer noch Möglichkeiten für eine Verbesserung von solchen elektronischen Hilfsmitteln, die die praktische Arbeit mit Korpora und die Bewertung von Korpora sehr erleichtern könnten. Auch eine Anpassung von Bibers Theorien an die Errichtung von Fachsprachlichen Korpora wäre ein willkommenes Unternehmen. Cand.ling.merc.-speciale Tysk (profil: translatør/tolk) Lisbet Pors ( ) Vejleder: Jan Engberg Fagruppe tysk Handelshøjskolen i Århus Fuglsangs Allé Århus V. 2

2 Indholdsfortegnelse Problemformulering Præsentation af undersøgelsesområdet Formål og afgrænsninger Korpus og tekstkorpus Afgrænsning af undersøgelsesområdet Litteraturvalg Behovet for en revision af Wilhelm Gubbas Juridisk ordbog tysk-dansk Problemtypologi Fastlæggelse af målgruppe og funktion Hvad er fagsprog? Hvad er en fagterm? Hvorfor anvende tekstkorpora i (fag)leksikografiske studier Hvad siger fagleksikograferne Introspektion vs. empiri Valg af metode Begrænsninger i anvendelsen af Douglas Bibers tilgang Korpussammenstilling Repræsentativitet Repræsentativitet i korpuslingvistisk sammenhæng Korpusstørrelse Sammenstilling af pilotkorpus praktiske valg Nødvendigheden af pragmatiske løsninger Tematisk inddeling af undersøgelsesområdet Repræsentation af hoved- og subtemaer Valg af teksttyper Udvælgelse af tekster Tekstlængde og tekststed Den tekstmæssige tidsramme Antal tekster Standardafvigelsen på gennemsnittet - målestok for den endelige korpusstørrelse Praktisk oprettelse af pilotkorpus Valg af tekstformat Tagging/annotering

3 2.4.3 Bibliografiske informationer om pilotkorpus Det endelige korpus det sidste stykke vej Problemer under sammenstillingen af pilotkorpus Optisk tegngenkendelse Afsnit, Grafer, figurer og fodnoter Gammel og ny retstavning Fremmedsprog Tematisk klassificering af tekster Valg af konkordansprogram Sammenstilling af pilotkorpus Symmetrisk fordeling af antal fagtermer pr. tekst? Standardafvigelsen på gennemsnittet i pilotkorpus Den endelige korpusstørrelse Termudvælgelse og vurdering af resultat Praktiske valg i forbindelse med udvælgelsen af fagtermer fra korpus Vurdering af termliste Styrker og svagheder ved fagsproglige korpora i arbejdet med lemmaselektion Fremtidens lemmaselektion Konklusion Litteratur Bøger Artikler Internetsider Andet Bilag

4 Problemformulering Stadig større krav til mennesker, der beskæftiger sig med fagsprog på modersmålet eller modersmålet i kombination med et eller flere fremmedsprog, og forventningen om en høj grad af såvel sproglige som faglige kompetencer har været og er stadig skyld i en kraftig stigning i behovet for vidensbanker i alle afskygninger. Et faktum, som langt de fleste fagsprogslingvister, fagsprogsstuderende, fagsprogsoversættere og alle de der benytter sig af kombinationen fag/sprog er klar over. I kølvandet på dette behov er efterspørgslen efter fagordbøger af høj kvalitet inden for ethvert tænkeligt emne ligeledes steget. For at dække behovet for terminologisk information benytter fagsprogsoversætterne sig af hjælpemidler som World Wide Web (www) og de mere avancerede translation memory - systemer. Disse hjælpemidler er en næsten uendelig informationskilde, og der hersker vist ikke tvivl om, at de er kommet for at blive og vil være til stadig større hjælp for dem der forstår at bruge dem. Det betyder ikke, at den traditionelle ordbog er afskrevet, om end vi i fremtiden nok snarere vil se disse i elektronisk form frem for i papirform. Der kommer da også stadig flere hjælpemidler af denne type på markedet med en lang række forskellige features. De fleste fagsprogsoversættere kan nok også hurtigt kunne tilslutte sig den holdning, at en kombination af flere forskellige typer af hjælpemidler i arbejdet med fagsprogsoversættelse som oftest er den metode, der bør anvendes, når oversætteren ønsker hjælp til at finde frem til den korrekte oversættelse. Dette betyder, at det ikke er formålsløst at lave nye eller forbedre gamle traditionelle fagordbøger (mono- såvel som polylingvale), selvom fagordbogens anvendelighed til dels også er tidsbestemt af det fag, den falder inden for. Inden for fagområder som IKT (informationsog kommunikationsteknologi) eller elektronik må sproget siges at være meget dynamisk, hvorimod eksempelvis faget jura benytter sig af et mere statisk sprog (Bergenholtz/Tarp 1994:23). Anvendeligheden af en juridisk ordbog vil derfor nødvendigvis være længerevarende end anvendeligheden af en IKT-ordbog. Derfor er det meningsfyldt at der for tiden bruges resurser på en grundig redigering af Wilhelm Gubbas juridisk ordbog - tysk-dansk fra 1995 forestået af Doris Hansen, lektor ved Handelshøjskolen i København og Jan Engberg, lektor ved Handelshøjskolen i Århus. Formålet med denne opgave er at undersøge, om og hvordan maskinlæsbare tekstkorpora kan anvendes i udvælgelsen af fagtermer til brug i fagleksikografiske 5

5 værker eksemplificeret ved konstruktionen af et tekstkorpus til udvælgelse af tyske fagtermer inden for temaet tysk og europæisk patent og brugsmønsterret til anvendelse i Juridisk ordbog tysk-dansk med forventet publikation i Opgaven vil falde i tre kapitler. Et indledende kapitel (kap. 1) som beskriver formålet med og afgrænsningerne af opgaven og vurderer, hvordan og hvorfor man generelt kan/bør bruge korpora til fagleksikografiske studier og specifikt anvende disse med henblik på udvælgelse af termer til fagordbøger (kap. 1). I kapitel 2 behandles spørgsmålet om, hvilke faktorer man bør tage i betragtning ved sammenstillingen af et sådant korpus, og hvordan man rent praktisk opretter korpus. Denne del vil altså gennemgå de teoretiske overvejelser, der ligger til grund for den praktiske sammenstilling af et endeligt korpus. Den sidste del (kap. 3) vil indeholde en gennemgang af, hvordan den praktiske vej hen imod et endeligt korpus er forløbet. Her er altså tale om en beskrivelse af, hvilke træk jeg rent praktisk har foretaget, samt en vurdering af disse træk i forhold til de teoretiske overvejelser i kapitel 2. Derudover vil jeg beskrive de problemer, som er opstået i forbindelse med den praktiske oprettelse af dette fagsproglige korpus. Dernæst vil der være en beskrivelse af den konkrete termudvælgelse samt en vurdering af de fremkomne termer. Slutteligt vil jeg kort vurdere styrkerne og svaghederne ved anvendelsen af maskinlæsbare korpora til udvælgelse af fagtermer til fagordbøger samt give et bud på fremtidens hjælpemidler ved udvælgelse af termer til forbedring af fagordbøger. 6

6 1 Præsentation af undersøgelsesområdet I dette kapitel vil jeg først og fremmest definere opgavens formål og beskrive de afgrænsninger, jeg har set mig nødsaget til at foretage. Derefter følger en diskussion af, hvorfor det er relevant at revidere Wilhelm Gubbas Juridisk ordbog tysk-dansk i terminologisk henseende, og hvorfor korpora er et velegnet grundlag for arbejdet med fagordbøger. Slutteligt beskrives valget af metode. 1.1 Formål og afgrænsninger Dette speciale har to hovedformål: Først og fremmest er målet at nå frem til en termudvælgelse inden for emnet tysk patent- og brugsmønsterret på baggrund af et tekstkorpus sammenstillet efter de statistiske principper for at opnå repræsentativitet, som Douglas Biber beskriver i sin artikel Representativeness in Corpus Design fra Det andet formål er at fremstille en termliste, som senere i ordbogsarbejdet kan anvendes til udvælgelse af lemmata til Wilhelm Gubbas Juridisk ordbog tysk-dansk. Her er altså tale om sammenstillingen af et monofunktionelt korpus, hvilket betyder, at der ikke tages stilling til, hvilke faktorer der er af betydning for konverteringen af korpus til brug i andre typer undersøgelser i det sammenstillede korpus. Det er bestemt heller ikke utænkeligt, at korpus vil kunne anvendes i den efterfølgende udarbejdelse af selve ordbogsartiklerne, da der for eksempel uden tvivl vil fremkomme et utal af nyttige eksempler på termer i fornuftige kontekster (Teubert 1999:297). Andre former for undersøgelser kunne eksempelvis være interessante for cand.ling.merc.-studerende (CLM-studerende), som arbejder med temaet tysk og europæisk patent- og brugsmønsterret i forbindelse med oversættelse af konkrete tekster. I og med at udarbejdelsen af ordbogsartikler ville være en alt for omfattende opgave til at kunne behandles her, er stregen i sandet trukket ved den rene termliste samt udvælgelsen af termer fra denne liste til brug i Wilhelm Gubbas Juridisk ordbog tysk-dansk. Efterfølgende vil jeg vurdere, om en sådan fremgangsmåde resulterer i en i kvalitativ henseende tilfredsstillende termliste, som kan benyttes i det videre arbejde med ordbogen. Det andet hovedformål med opgaven er at give CLM-studerende indblik i, hvordan man rent praktisk kan sammenstille fagsproglige tekstkorpora til eksempelvis terminologiske undersøgelser, og hvorfor disse tekstkorpora er et nyttigt redskab i lingvistiske undersøgelser. 7

7 1.1.1 Korpus og tekstkorpus Allerede nu er termerne korpus og tekstkorpus blevet anvendt adskillige gange, og det må være på sin plads her at få slået fast, hvad jeg mener, når jeg bruger dem. Dyrberg et al. definerer korpora som en mængde af tekster, der som data udgør empirisk grundlag for en metodisk bearbejdning af specifikke egenskaber ved disse data (Dyrberg et al. 1988:209). Denne definition er valgt ud fra det faktum, at den ikke sætter begrænsninger i forhold til, om det drejer sig om almen- eller fagsproglige korpora og derfor ikke er til hinder for oprettelsen af et fagsprogligt korpus efter opskriften på oprettelsen af et almensprogligt korpus (se afsnit 1.4). Jeg vil dog gå et skridt videre, hvilket her betyder, at termerne tekstkorpus og korpus begge anvendes i betydningen maskinlæsbart tekstkorpus i og med at det oprettede korpus vil være elektronisk Afgrænsning af undersøgelsesområdet Der er flere årsager til, at valget er faldet på det område, som korpus skal sammenstilles inden for, nemlig den tyske og europæiske og patent- und brugsmønsterret (Patent- und Gebrauchsmusterrecht). Som en del af temaet Gewerblicher Rechtsschutz kunne man spørge, hvorfor kun denne lille del af dette overordnede tema søges behandlet. Det skyldes hovedsageligt, at en behandling af det overordnede temaet Gewerblicher Rechtsschutz ville være meget omfangsrig set i forhold til de resurser, jeg har til rådighed. Det ville kræve et enormt tekstkorpus og en omfattende inddeling af emnet i subtemaer, som vel næppe ville kunne laves inden for en rimelig tidshorisont med de menneskelige og økonomiske resurser, jeg har til rådighed. Der er her nemlig kun tale om et pilotprojekt. Af ovennævnte grund har jeg også valgt at indskrænke mig til den tyske og europæiske side af patent- og brugsmønsterretten og har altså udeladt den internationale ret inden for området. Grunden til at både den tyske og den europæiske patent- og brugsmønsterret inddrages i korpus er den tætte sammenhæng, der er mellem de to områder i form af Tysklands medlemskab af EU, som resulterer i, at europæisk lov på området også er gældende i Tyskland. Man kan derfor levende forestille sig, at der i tyske tekster vedr. patent- og brugsmønsterret forekommer termer fra såvel den tyske som den europæiske ret, hvorfor det er relevant, at begge områder behandles i Juridisk ordbog tysk-dansk (se termliste på vedlagte CD-rom). 8

8 Derimod udelades Østrigsk og Schweizisk patent- og brugsmønsterret fra korpus. En inddragelse af disse i korpus ville resultere i en betydelig forøgelse af arbejdsbyrden, da jeg derved ville være nødsaget til at opstille yderligere 2 fagsystematikker for, hvordan retten i de 2 lande skal inddeles. Derudover kunne jeg i forbindelse med analysen af og termudvælgelsen fra korpus eksempelvis løbe ind i det problem, at forskellige termer beskriver samme begreb på tværs af landegrænserne. Efter min opfattelse ville det være et studium i sig selv at fastlægge forskelle og ligheder mellem de forskellige tysktalende landes patent- og brugsmønsterret. Dertil kommer det faktum, at Schweiz ikke er medlem af EU, hvilket kunne tænkes at besværliggøre en fagsystematisk inddeling yderligere. Både patent- og brugsmønsterretten inddrages i korpus, selvom man kunne forestille sig, at patentretten alene ville være tilstrækkeligt. Årsagen skal findes i, at brugsmønsterretten i lighed med patentretten forudsætter en opfindelse og derfor også kaldes det lille patent i folkemunde (Hubmann/Götting 2002:114). Lighederne mellem de to er så mange, at de som regel behandles under ét, hvorfor det også forekommer mig naturligt at inddrage brugsmønsterretten Litteraturvalg Som det også fremgår af dette speciales litteraturliste, er korpuslingvistikken hovedsageligt et produkt af engelske og amerikanske lingvisters arbejde, hvilket også i høj grad afspejler sig i mængden af engelsksproget litteratur på området. Især den almensproglige korpuslingvistik, som udgør langt den største del af forskningen på området, er stærkt repræsenteret i anglistikken, hvilket for dette speciales vedkommende har resulteret i, at langt størstedelen af den benyttede litteratur om almensproglige korpora består af engelsksprogede værker. Korpuslingvistikken er hovedsageligt et skandinavisk og, om end i ringere grad, et tysk forskningsområde. Valget af litteratur fra dette forskningsområde er derfor for den største dels vedkommende faldet på skandinaviske og tyske forskeres arbejder. Dette litteraturvalg synes også naturligt for specialets metode, som netop er koblingen mellem almensproglige korpuslingvistiske teorier og fagsproglig korpuslingvistisk praksis. 1.2 Behovet for en revision af Wilhelm Gubbas Juridisk ordbog tysk-dansk Tager man udgangspunkt i Ingrid Simonæs anmeldelse af seneste udgave af Gubbas Juridisk ordbog tysk-dansk fra 1995, er der indvendinger mod ordbogen, som bl.a. specifikt er møntet 9

9 på fagsproglige og terminologiske aspekter. Nærmere bestemt problemerne i ordbogen med at udskille bl.a. almensproget og andre fagsprog. Simonæs påpeger for det første den tilfældige skelnen mellem almensprog og fagsprog, som har resulteret i medtagelsen af en del opslagsord, som hører bedre hjemme i en almensproglig ordbog. I anmeldelsen gives talrige eksempler på dette problem; her skal blot nævnet et par enkelte: abbrechen, Bau, dafür og regelmäßig (Simonæs 1996: ). Dette problem kan afhjælpes ved en mere præcis definition af begreberne fagsprog og terminologi (se afsnit og 1.2.4) med efterfølgende udvælgelse af termer fra det fagsprog, som ønskes repræsenteret i ordbogen. På samme måde som almensproget har fundet vej ind i ordbogen, kritiserer Simonæs også Wilhelm Gubba for at have inddraget fagord som tilhører helt andre fagsprog end det juridiske. Eksempelvis er lemmata som Abstellungsversicherung og Abhebungsformular taget fra andre fagområder, nemlig rejser hhv. bankverdenen (Simonæs 1996: ). Altså er man også nødt til at afgrænse det juridiske fagsprog, og i dette tilfælde det anvendte sprog inden for patent- og brugsmønsterretten, fra andre fagområder (se afsnit 1.2.3). Det næste kritikpunkt, Simonæs fremsætter, er ikke enestående for Juridisk ordbog tyskdansk, men må siges at gælde for stort set alle ordbøger, som er produceret til dato, og stort set alle dem der vil blive produceret i fremtiden. Det, der menes, er problemerne med repræsentativitet. Det drejer sig her om manglende opslagsord, altså opslagsord, som burde være medtaget i ordbogen, fordi de er af stor relevans for hovedtemaet eller allerede repræsenterede subtemaer (Simonæs 1996:313). Dette er naturligvis et problem, som på ingen måde vil kunne løses fuldstændigt for ordbøger, som skal repræsentere et område, der ikke lader sig fuldstændigt definere, hvad enten det er af almen eller faglig karakter. Man kan derfor kun tale om 100% repræsentative ordbøger, hvis de er begrænset til et meget lille delområde som eksempelvis den fiktive Ordbog over sproget på produktemballagen til danske Kellog s Cornflakes-pakker i Man har dog en større chance for at opnå en tilfredsstillende udvælgelse af termer, når man benytter den empiriske tilgang til udvælgelsen af terminologi, end når man anvender den introspektive tilgang. Denne empiriske tilgang ses ved velsammenstillede tekstkorpora, der udelukkende består af autentisk materiale (se afsnit 2.1) Problemtypologi Relevansen af en forbedring af Wilhelm Gubbas Juridisk ordbog tysk-dansk tager her først og fremmest udgangspunkt i to brugerundersøgelser, som begge, om end de er i en noget forskellig målestok, påpeger problemer ved nuværende fagordbøger. 10

10 Den første brugerundersøgelse, som jeg vil inddrage, er et produkt af projektet Oversættelse af fagsproglige tekster (OFT-projektet), som løb fra I tilknytning til dette projekt fremkom adskillige forskningsbidrag, som bl.a. påpegede de problemer, oversættere løber ind i ved oversættelsen af fagsproglige tekster. I den forbindelse lavede en række forskere brugerundersøgelser, som skulle kortlægge de konkrete oversættelsesproblemer. En af disse brugerundersøgelser blev foretaget af Lisbet Maidahl, som ud fra 101 informanters protokolførelse under oversættelsen af faglige tekster af forskellig art skulle kortlægge, hvilke typer problemer informanterne løb ind i ved oversættelse med hjælp fra fagordbøger, samt hvor ofte forskellige typer af problemer forekom (Maidahl 1992: ). Konklusionen på Lisbet Maidahls brugerundersøgelse er todelt, idet undersøgelsen både viste, at der er stor mangel på leksikalske og grammatiske oplysninger i de eksisterende fagordbøger, men også at der er brug for flere fagordbøger. En vinkel, som Lisbet Maidahl ikke havde med i vurderingen af protokollerne, var, præcist hvor hyppigt informanterne ikke kunne finde løsninger på de problemer, de søgte løst vha. det enkelte hjælpemiddel. Derfor har jeg på baggrund af en analyse af en del af protokollerne forsøgt at kortlægge, hvor stort problemet i grunden er med at finde det man søger efter i relevante ordbøger. Analysen af 18 protokoller udfyldt af tyskstuderende ved Handelshøjskolen i Århus, som blev bedt om at oversætte en lille del af et regnskab fra Bang & Olufsen fra dansk til tysk, viste, at hele 17,8% af opslagene i fagordbøger var forgæves. Informanterne kunne altså ikke slå den term op, de ledte efter. Nok er der her tale om oversættelse af en økonomisk tekst og en oversættelse til fremmedsproget, men jeg er overbevist om, at resultatet rent objektivt havde været det samme, havde der været tale om en juridisk tekst, som skulle oversættes fra tysk til dansk. I tabel 1 angives den nøjagtige optælling i de 18 protokoller (Maidahl 1991). Om end dette problem ikke behandles i Maidahl (1992), forekommer det mig dog yderst relevant at tage problemet op til diskussion. Resultatet af undersøgelsen af informanternes protokoller viser nemlig tydeligt at 17,8% af informanternes opslag er spild af tid, som kunne være anvendt bedre i forsøget på at løse de konkrete problemer. I denne forbindelse skal det også kort nævnes, at det samlede antal opslag de enkelte informanter noterede i deres 11

11 protokoller, varierede fra 9 til 104, og at 4 informanter blot havde noteret 1-2 forgæves opslag, hvorfor man med stor sandsynlighed kan konkludere, at enkelte informanter ikke noterede samtlige opslag men blot dem der hjalp dem videre i deres søgen efter eksempelvis den korrekte term. Det betyder, at procentantallet af forgæves opslag i princippet kunne ligge langt højere end de 17,8%. Men selvom det nøjagtige procentantal skulle ligge på de 17,8%, forekommer det mig stadig, at forgæves opslag i ordbøger udgør et væsentligt problem. I forsøget på at komme nærmere en fastlæggelse af, hvor ofte brugere af Wilhelm Gubbas Juridisk ordbog tysk-dansk foretager forgæves opslag gennemførte jeg i marts 2003 en lille brugerundersøgelse ved Handelshøjskolen i Århus med 5 cand.ling.merc.-studerende (tysk) med profilen Translatør/Tolk. Denne anden og noget mere beskedne brugerundersøgelse skulle kortlægge konkret, hvor ofte de 5 informanter fandt den term, de ledte efter i Juridisk ordbog tysk-dansk. I modsætning til Lisbet Maidahls brugerundersøgelse, hvor anvendeligheden af en række ordbøger undersøges, var det her kun anvendeligheden af Juridisk ordbog tysk-dansk i udgaven fra 1995, som søgtes kortlagt. Undersøgelsen gik altså ud på at konstatere, hvor anvendelig ordbogen var under arbejdet med oversættelsen af en juridisk tekst, en oversættelsesopgave stillet i faget Juridisk fagsprog i foråret Informanterne blev bedt om under oversættelsesarbejdet at notere, hvor ofte de slog op i ordbogen, og hvor ofte de ledte forgæves efter opslagsordet (se tabel 2). Spørgsmålet om hvorvidt de fandt opslagsordet, men havde problemer med at finde en ækvivalent, blev altså udeladt i og med, at den opgave ligger uden for rammerne for dette speciale. Som det fremgår, havde de 5 informanter tydelige problemer med at finde de opslagsord, de ledte efter i Wilhelm Gubbas Juridisk ordbog Tysk-dansk. Og selvom man som kritik af undersøgelsen kan sige, at antallet af informanter er meget lavt, og at der ikke forefindes oplysninger om, hvilke ord informanterne har slået op (har de eksempelvis slået almensproglige ord op?) mener jeg stadig, at den utroligt høje procentdel af opslagene, som var forgæves, giver et praj om manglerne i antallet af fagtermer i ordbogen. De to undersøgelser må siges at stemme meget godt overens med påstanden om, at man foretager forgæves opslag i ordbogen på grund af, at de enkelte delområder inden for juraen 12

12 ikke er repræsenteret tilstrækkeligt, hvilket Ingrid Simonæs også påpeger i sin anmeldelse af seneste udgave af Gubbas Juridisk ordbog tysk-dansk fra 1995 som et af de væsentlige problemer ved ordbogen (Simonæs 1996:313). Dette skyldes velsagtens den fremgangsmåde, som Wilhelm Gubba anvendte i sit arbejde med ordbogen. Man kan fristes til at kritisere Gubba for, at ordbogen bærer præg af at være udarbejdet ud fra en stor samling termer (en termbank), som han løbende noterede gennem sit arbejde med oversættelsen af juridiske tekster en arbejdsprocess som netop vil resultere i en mere eller mindre ustruktureret tilgang til udvælgelsen af lemmata, hvor de respektive emneområder inden for hovedemnet juridisk sprog ikke er afdækket grundigt nok, for blot at nævne den efter min mening væsentligste problemtype i forbindelse anvendelsen af netop denne ordbog. Gubba har benyttet den subjektive introspektive tilgang til ordbogsarbejdet i stedet for den objektive empiriske. Derfor er der vist ingen grund til en yderligere retfærdiggørelse af, hvorfor det er vigtigt at stratificere temaerne i den kommende udgave af Juridisk Ordbog tysk-dansk, og det er en nødvendighed, hvis problemerne nævnt ovenfor i højere grad skal kunne undgås i fremtiden. Og selvom det kun er et område, patent- og brugsmønsterretten, som søges afdækket i de efterfølgende kapitler, er det dog en god begyndelse på vejen mod en ordbog, som dækker emnet jura på en fornuftig, velstruktureret og repræsentativ måde Fastlæggelse af målgruppe og funktion Et af de første skridt i udarbejdelsen af ordbøger af enhver art er at gøre sig klart, hvilken brugergruppe ordbogen skal henvende sig til. En fastlæggelse af målgruppen for ordbogen er ikke blot af stor relevans for selve det leksikografiske arbejde, men også for det materiale, der ligger til grund for arbejdet - her korpus. En klassificering af formålet med ordbogen samt dens brugere har stor indflydelse på, hvilke autentiske tekster korpus skal bestå af. Den følgende beskrivelse af målgruppen for Juridiske ordbog tysk-dansk er baseret på samtaler med en af ordbogens forfattere, lektor ved Handelshøjskolen i Århus Jan Engberg, samt på den terminologi, som anvendes i Manual i fagleksikografi (Bergenholtz/Tarp 1994:16-25). Ud fra informationerne fra ovenstående kilder står det klart, at ordbogen hovedsageligt henvender sig til brugere med dansk som modersmål med høj modersmålskompetence inden for fagsproget samt stor fremmedsproglig indsigt. Eksempler på sådanne brugere kunne være jurister, professionelle oversættere samt studerende ved de erhvervssproglige studier på 13

13 handelshøjskolerne i Danmark. Ordbogens funktion er produktion og reception af fagtekster på fremmedsproget samt oversættelse af fagtekster fra fremmedsproget til modersmålet. Her er altså tale om brugere, som forventer en ordbog med en høj faglighedsgrad, hvilket forudsætter et korpus, der som korpusgrundlag består af tekster, der kan opfylde disse forventninger Hvad er fagsprog? For at finde frem til faglighedsgraden af korpus må man først gå et skridt tilbage og definere begrebet fagsprog. Inden for fagsprogsforskningen hersker der den generelle holdning, at almensprog (nationalsprog) og fagsprog adskiller sig fra hinanden. Enigheden hører dog op ved beskrivelsen af, hvordan de to typer sprog forholder sig til hinanden. Bergenholtz og Tarp beskriver følgende fire opfattelser af forholdet mellem almensprog og fagsprog (Bergenholtz/Tarp 1004:12-16): Fagsprog kan ses som en integreret del af almensproget, altså som et sprog, der benytter sig af det almensproglige system (se fig. 1). Almensprog er en integreret del af fagsprog i og med, at alle almensproglige udtryk også findes i fagsproget (se fig. 2). Almensprog og fagsprog er sidestillede sprog, da eksempelvis fagsprog bruges i bestemte situationer og af bestemte personer (se fig. 3). Der er forskellige grader af faglighed i forskellige kommunikationssituationer. Alt afhængig af kommunikationssituationen vil der være inddraget en større eller mindre del af almensproget i den fagsproglige kommunikation. Almensproget og fagsproget lapper ind over hinanden og danner en fællesmængde fællessproget (se fig. 4). I denne opgave vil jeg benytte mig af den tese, at almensprog og fagsprog er overlappende mængder, da det synes at have været tilfældet i andet leksikografisk (korpus)arbejde, hvor 14

14 der jo arbejdes med autentisk empirisk materiale. Ved udvælgelsen af fagterminologi må man netop løse den opgave at udskille almensproget/fællessproget fra fagsproget. Sagt på en anden måde er opgaven i den konkrete termudvælgelse fra korpus at kortlægge kommunikationen inden for det diskursfællesskab, som beskæftiger sig professionelt med tysk patent- og brugsmønsterret. Formålet med figur 4 er at beskrive, hvordan et diskursfællesskab benytter såvel fagsprog som almensprog i sin kommunikation, men selvom figuren giver et godt indtryk af, at der nødvendigvis vil opstå problemer i forbindelse med udskillelsen af fagsproget fra almensproget tager den ikke højde for, at man let kunne havne i en situation, hvor man også må udskille andre fagsprog fra fællesmængden. Jeg antager nemlig, at virkeligheden er noget mere kompleks end figur 4 viser, og at det i virkelighedens verden også er en opgave i såvel korpussammenhæng som fagleksikografisk sammenhæng at afgrænse forskellige fagsprog fra hinanden. Det er dog ikke en ny tanke, at forskellige fagsprog lapper ind over hinanden. I sin artikel om jagtsprog fra 1971 forsøger David Dalby grafisk at illustrere, hvordan forskellige andre fagsprog som eksempelvis juridisk sprog, medicinsk sprog og teknisk sprog lapper ind over jagtsproget (se fig. 5). En sammenkobling af de illustrerede problemstillinger i figur 4 og 5, som er fremkommet ud fra behovet for at illustrere afgrænsningen af fagsprog fra almensproget og fagsprog fra fagsprog, kunne se ud som illustreret i figur 6. Figur 6 går nemlig et skridt videre og antager, Fig. 5 (Dalby 1971:42) at det reelt kunne være muligt, at 2 fagområder (FS 1 og FS 2) lapper ind over hinanden, så de både har fællessproget med almensproget og fællessproget med andre fagsprog tilfælles (det lysegrå område). Et eksempel på denne sidste infiltration kunne være anvendelsen af såvel (patentretligt) juridisk 15

15 sprog som anvendelsen af diverse tekniske sprog inden for teksttypen patenter (se afsnit 3.1.5). Resultatet er, at det er en mindst lige så kompliceret opgave at afgrænse de enkelte fagsprog i forhold til hinanden, som det er at afgrænse et fagsprog i forhold til almensproget, og det er netop et af de væsentligste kritikpunkter i Ingrid Simonæs anmeldelse af seneste udgave af Wilhelm Gubbas Juridisk Ordbog tysk-dansk (se afsnit 1.2). Afgrænsningen mellem almensprog og fagsprog såvel som afgrænsningen mellem forskellige fagsprog har ikke været grundig nok i ordbogen Hvad er en fagterm? Efter at have slået fast, hvilken definition af fagsprog jeg vil tage udgangspunkt i for det videre arbejde, er det næste skridt at fastlægge, hvilke kendetegn i fagsproget i forhold til almensproget der skal ligge til grund for udvælgelsen af lemmata fra korpus til en fagordbog som Juridiske ordbog tysk-dansk. For at kunne bevæge sig frem imod den opgave, det er at udvælge de lemmata, der skal inddrages i ordbogen, er det en nødvendighed at fastlægge, hvordan begrebet fagterm anvendes i den resterende del af dette speciale. Udgangspunktet for definitionen af, hvad jeg opfatter som en fagterm, er taget i to betragtninger, som Ditlevsen et al. har gjort om, hvad der karakteriserer en fagterm (Ditlevsen et al. 2002:77). Ifølge Ditlevsen et al. er disse karakteristika for det første at Termen skabes på et bestemt tidspunkt i historien, når der opstår et kommunikativt behov for den. (Ditlevsen et al. 2002:77) og for det andet at Termen skabes for at effektivisere kommunikationen inden for faglige diskursfællesskaber. (Ditlevsen et al. 2002:78) 16

16 Der er tale om en indholdsdefinition og en funktionsdefinition, hvilken efter min mening er definitioner, som er noget lettere at forholde sig til og anvende i praksis end den noget hyppigere bestandsdefinition, hvor en term beskrives som bestående af definiendum/begreb (indholdsside) og definiens/benævnelse (udtryksside). Denne definition gør det svært at skelne mellem termer og almensproglige ord (tegn), da tegn ifølge den franske filosof Saussure ligeledes består af en indholdsside og en udtryksside, også kaldet signifié og signifiant (Ditlevsen et al. 2002:10). Arbejder man derfor ud fra bestandsdefinitionerne for term og tegn, er man i og for sig lige vidt i fastlæggelsen af, om der er tale om fag- eller almensprog. I de følgende kapitler vil det derfor være ovennævnte indholds- og funktionsdefinition, som ligger til grund for anvendelsen af begrebet term. 1.3 Hvorfor anvende tekstkorpora i (fag)leksikografiske studier Diskussionen af, hvorfor korpora er yderst anvendelige i arbejdet med den almene leksikografi og, som de senere års forskning har vist, også for fagleksikografiske studier, kunne tage udgangspunkt i de første diskussioner af brugen af korpora i lingvistikken generelt. Jeg anser det dog ikke for relevant at opsummere denne debat, men vil blot påpege, at langt de fleste lingvister i dag anser korpora for at være et nyttigt og pålideligt forskningsredskab (McEnery/Wilson 2001:2-25). Dette er et faktum som understreges i den stadigt hyppigere oprettelse af korpora med mono- eller polyfunktionale formål. Et af de bedste argumenter for at have en empirisk og dermed objektiv tilgang arbejdet og dermed anvende tekstkorpora i fagleksikografiske studier er at forbedre den fremgangsmåde, som i mange år har været den gængse i arbejdet med udarbejdelsen af ordbøger. Hidtil har det nemlig været kutyme i højere grad at anvende den mere subjektive introspektive tilgang og skele til udformningen af andre ordbøger og supplere med introspektion samt belæg af meget forskellig karakter (Jacobsen 1996:57). Den empiriske metode udvides ved brugen af korpora i ordbogsarbejdet. Det er dog under forudsætning af, at det/de anvendte korpus/korpora er sammenstillet på fornuftig vis, hvilket sikrer en ensartet og målrettet tilgang til ordbogsarbejdet, med udgangspunkt i, hvordan det sprogområde, som ønskes bearbejdet, reelt ser ud. Den holdning støttes af andre forskere, som ligeledes mener, at korpora som oftest vil adskille sig positivt fra andre fremgangsmåder i ordbogsarbejder ved at sikre en kontrollerbar udvælgelse af lemmata og belæg frem for tilfældig udvælgelse og hvor ikke to excerptorer ville nå frem til samme resultat (Bergenholtz 1996:6-7). 17

17 1.3.1 Hvad siger fagleksikograferne Mon ikke den egentlige baggrund for valget af enten den introspektive tilgang eller den empiriske tilgang til fagleksikografi bør findes i, hvad fagleksikografer har de bedste erfaringer med. Bergenholtz/Tarp opstiller systematisk de fire tilgange, som fagleksikograferne ifølge den amerikanske forsker Ronald Mackin kan anvende til lemmaselektion i fagordbøger. Selvom såvel punkterne som den kritik, Bergenholtz/Tarp fremfører, er udarbejdet for at give et billede af, hvordan man bør udvælge kollokationer til ordbøger, er jeg af den opfattelse, at diskussionen udmærket kan bruges til at illustrere de forskellige veje, fagleksikografer kan gå mht., hvilken metode de skal anvende til lemmaselektion generelt. De 4 punkter er: 1. other dictionaries 2. his [leksikografens] own competence 3. occurrences met with in course of recording and listing 4. tests (Bergenholtz/Tarp 1994:412) Punkt 1 kritiseres for at kunne resultere i overtagelsen af irrelevante eller direkte forkerte lemmata, mens punkt 3, som tydeligvis er den tilgang, Wilhelm Gubba anvendte under udarbejdelsen af Juridisk ordbog tysk-dansk, kritiseres stærkt for, at det er tilfældigheder, der ligger til grund for en lemmaselektion. Kritikken af punkt 2 og 4 bunder i, at fagleksikografen som oftest har for lille viden inden for det fagområde, som ordbogen skal dække, til at kunne benytte sig af disse metoder (Bergenholtz/Tarp 1994: ). Da det som begrundet ovenfor ikke forekommer synderligt pålideligt at anvende nogen af de ovennævnte metoder, er alternativet at basere sin lemmaselektion på et repræsentativt udvalg af autentisk tekster. Herved opnås en selektion som i langt højere grad afspejler virkeligheden Introspektion vs. empiri Gennem tiderne har der været megen diskussion om, hvorvidt korpuslingvistikken er en pålidelig videnskab, og om korpora giver et sandt billede af de sproglige strukturer, de bliver brugt til at undersøge. I den forbindelse finder jeg det meget relevant at se på nogle forskellige opfattelser af korpuslingvistikkens status. Grundlæggende er der to måder, hvorpå man kan betragte korpuslingvistikken, hvor den mest udbredte hidtil har været, at den udgør et selvstændigt forskningsområde. Kritikken af denne opfattelse har tidligere ikke været synderligt konstruktiv, idet der over en lang periode ikke fremkom alternative synsvinkler, som det bl.a. ses hos Bergenholtz/Pedersen. Her kritiserer 18

18 man opfattelsen af korpuslingvistikken som et selvstændigt forskningsområde, men afstår fra at involvere sig yderligere i debatten om, hvordan man i stedet kunne klassificere korpuslingvistikken (Bergenholtz/Pedersen 1994:162). Inden for de seneste par år er der dog fremkommet en glimrende teori om, at korpuslingvistikken ikke i sig selv udgør et forskningsområde, men derimod er et redskab eller en metode for de allerede eksisterende grene af lingvistikken (McEnery/Wilson 2001:2). Den definition må siges at være meget passende i den aktuelle korpussituation i dette speciale i og med, at det jo her netop handler om at gå korpusvejen mod målet, nemlig termudvælgelsen. Blander man den introspektive tilgang i form af sund fornuft med en korpustilgang funderet i statistiske analyser, opnår man en optimal udnyttelse af det bedste fra begge tilgangsvinkler (se afsnit 2.3). 1.4 Valg af metode Som det tydeligt fremgår af det foregående hovedafsnit, hersker der ingen tvivl om, at tekstkorpora er til stor hjælp i fagleksikografisk arbejde. Spørgsmålet er nu kun, hvordan man kobler den teoretiske korpuslingvistik med praksis. Om end litteraturen på området praktisk korpuslingvistik er noget begrænset, er der dog nogle få bud på forskellige tilgange til oprettelsen af korpora til lingvistiske studier af enhver art. En samling af sådanne tilgange gives Oakes (1998), men eftersom værket i højere grad giver et utal af statistiske beregningsmuligheder end en egentlig opskrift, forekommer det uoverskueligt at skulle vælge til eller fra i arbejdet med den praktiske korpusoprettelse. Derfor er valget af metode faldet på Douglas Bibers arbejde med den statistiske korpustilgang, som ligger til grund for sammenstillingen af mange almensproglige tekstkorpora inden for de seneste 10 år. I sin artikel Representativeness in Corpus Design fra 1993 forklarer Biber, hvordan man med udgangspunkt i statistiske beregninger opnår størst mulig repræsentativitet i et givent korpus og derigennem når frem til den optimale korpusstørrelse. Fordelen ved artiklen er, at den giver en systematisk gennemgang af de arbejdsprocesser, som man nødvendigvis må igennem for at oprette et repræsentativt korpus, og netop af den grund har jeg valgt at følge Bibers tilgang. Han giver som den eneste korpuslingvist indtil nu en konkret opskrift på, hvordan man opretter korpora Begrænsninger i anvendelsen af Douglas Bibers tilgang Selvom Biber (1993) beskriver hele forløbet i korpusoprettelsesfasen, er det dog i forbindelse med denne proces vigtigt at have for øje, at Bibers opskrift er møntet på oprettelsen af 19

19 almensproglige tekstkorpora. Det betyder, at jeg på enkelte steder har været nødt til at afvige fra Bibers fremgangsmåde og i stedet har været nødsaget til anvende til løsninger, som i højere grad afspejler de behov, som måtte opstå i forbindelse med oprettelsen af et fagsprogligt korpus. Her kan det være nødvendigt at anvende løsninger, som andre er kommet frem til under arbejdet med sammenstillingen af fagsproglige korpora som eksempelvis de aftaleretlige korpora fra 1989 (Dyrberg et al. 1991) (se afsnit 2.3.1). 20

20 2 Korpussammenstilling Formålet med dette kapitel er at beskrive, hvordan jeg ud fra Douglas Bibers teori om kvantitativ sammenstilling af tekstkorpora har sammenstillet et tysk patentretligt korpus. Kapitlet giver først en diskussion af repræsentativitetsproblematikken efterfulgt af en teoretisk gennemgang og en vurdering af Bibers tilgang til udarbejdelsen af korpora. Dernæst gives en beskrivelse af og begrundelse for de faktiske valg truffet i forbindelse med forarbejdet til den praktiske korpussammenstilling. En af de konstruktive korpuskritikere, Martin Gellerstram, påpeger 2 dominerende faktorer, som kan indvirke negativt på brugen af korpora til udarbejdelsen af ordbøger. Disse to faktorer er relevante for såvel sammenstillingen af korpus som udvælgelsen af terminologi, og selvom Gellerstrams kritik går på udarbejdelsen af almensproglige ordbøger, er problemstillingen den samme i udarbejdelsen af fagsprogsordbøger, da fagsprog og almensprog lapper ind over hinanden (se afsnit 1.2.3). For det første, og vel nok underordnet, er der de tilfældige sammensætninger af ord som f.eks årig og tysk-dansk, som ifølge Gellerstram ikke bør medtages i en korpusbaseret ordbog (Gellerstram 1996:40). Sammensætninger bør først medtages, når de understøttes af mindst 2 belæg, der naturligvis skal være fra forskellige kilder (Gellerstram 1996:45). For det andet er det ikke sikkert, at korpus er tilstrækkeligt repræsentativt for den helmængde, det skal repræsentere, hvilket kan give store huller i eksempelvis ordforrådet (Gellerstram 1996:40) eller for fagsproglige korporas vedkommende terminologien. Gellerstram hævder, at dette problem først og fremmest kan undgås ved at oprette et tilstrækkeligt stort korpus; først i anden række nævner han stratificering, dvs. en tematisk inddeling af hovedtemaet, og valg af teksttyper til korpus. Selvom stratificeringen af korpus, så det bliver repræsentativt, er det største problem i udarbejdelsen af korpora i forbindelse med lingvistisk forskning, synes Gellerstram at nedtone repræsentativitetsproblemet. Han mener i modsætning til Douglas Biber ikke, at dette problem udgør selve kernen i problematikken om anvendelsen af korpora i den lingvistiske forskning (Gellerstram 1996:35-37). Den klart overvejende del af korpuslingvisterne har dog indset, at repræsentativitet med udgangspunkt i kvantitative teorier og metoder er en grundlæggende nødvendighed for et fornuftigt sammenstillet korpus, ligesom en løsning på de problemer, der opstår i forbindelse 21

21 med koblingen af kvantitative og kvalitative mål, er det (Holmboe 1996:53-54). I det efterfølgende afsnit vil jeg se nærmere på repræsentativitetsproblematikken samt forklare, hvilke konkrete valg jeg har truffet for at opnå størst mulig repræsentativitet. 2.1 Repræsentativitet Udgangspunktet i den efterfølgende diskussion af de repræsentativitetsspørgsmål, som har været centrale i arbejdet med oprettelsen af det patentretlige fagsproglige korpus, er taget i artiklen "Representativeness in Corpus Design" (Biber 1993). Baggrunden for dette skal findes i Douglas Bibers kvantitative tilgang til korpuslingvistikken. I modsætning til den tidligere tilgang til brugen af korpora, hvor udgangspunktet var introspektion med efterfølgende dokumentation fundet i korpora, er Biber af den opfattelse, at korpora bør sammenstilles først. Derefter skal de undersøges med et statistisk udgangspunkt, hvorefter man på baggrund af de statistiske undersøgelser kan drage konklusioner om, hvorvidt korpus er repræsentativt eller ej Repræsentativitet i korpuslingvistisk sammenhæng Mht. til sammenstillingen af mit korpus er det vigtigt for det videre arbejde at få fastlagt, om det er relevant at tale om et repræsentativt tekstkorpus i og med, at et korpus taget fra en ikke 100% definerbar grundmængde eller population, som er den statistiske term, ikke med 100% sikkerhed kan siges at være repræsentativ. Ifølge Gyldendals Dansk Fremmedordbog fra 2002 er substantivet repræsentativitet udtryk for en værdi, evne som typisk repræsentant (udtryk) for ngt.. Ifølge den statistiske definition på begrebet repræsentativitet, er repræsentativitet the extent to which a study s results can be generalized to other situations or settings (Vogt 1999:246). I mine øjne er der her tale om to definitioner, som indholdsmæssigt er identiske, hvorfor jeg ikke ser nogen grund til ikke at anvende begrebet i dette speciale i modsætning til Bergenholtz/Tarps (1994:167) opfattelse. Dertil kommer, at jeg også er overbevist om, at man inden for statistikken heller ikke altid arbejder med 100% definerbare populationer. Enkelte forskere har valgt at forkaste den statistiske term repræsentativ og erstatte den med eksemplarisk (Bergenholtz/Pedersen 1994:167), hvilket dog i mine øjne ikke er andet end en strid om ord, der vil fortsætte i det uendelige, med mindre der udvikles en statistisk model til beregning af 100% repræsentativitet for sproglige korpora såvel som for en række andre 22

22 områder. En opgave der med stor sandsynlighed aldrig vil blive løst, eftersom der altid vil være spørgsmål, som kun har kvalitative svar. Det vel nok bedste eksempel på dette i korpussammenhæng er de valg, som træffes i forbindelse med stratificeringen af korpus (tematisk inddeling af hovedtemaet, hvilke teksttyper skal inddrages osv.). Med en statistisk tilgang til korpuslingvistikken tilstræbes jo netop repræsentativitet, hvorfor jeg mener, at man ved at følge Douglas Bibers statistiske tilgang til sammenstillingen af korpus roligt kan tale om repræsentativitet i løbet af sammenstillingsprocessen og ved bearbejdelsen af det endelige korpusresultatet. Jeg mener også at det er tilladeligt at tale om repræsentativitet uanset om korpus har 100% eller ringere grad af repræsentativitet. Udtrykket går jo netop på Bibers metode ved sammenstillingen af korpora. Biber beskriver i ovennævnte artikel de faktorer, der er nødvendige at tage i betragtning for at opnå størst mulig repræsentativitet i et givent korpus. Lingvisten Noam Chomsky var af den opfattelse, at jo større et korpus var, desto større var sandsynligheden for, at det var repræsentativt for den helmængde, det skulle repræsentere. Det skal her kort tilføjes, at Chomsky fremkom med sin holdning i 50 erne, hvor de tekniske muligheder for korpusarbejde var begrænsede, og at der derfor blev arbejdet med forholdsvis små korpora. Dette har naturligvis betydet, at Chomsky til dels havde ret i sine betragtninger (McEnery/Wilson 2001:77-79). Douglas Biber er derimod af den opfattelse, at en grundig analyse og definition af de faktorer, der skal repræsenteres, i langt højere grad vil resultere i et repræsentativt korpus. Eksempler på sådanne faktorer er teksttemaer, teksttyper, antal tekster og tekstlængde. I det følgende tages stilling til de faktorer, som er fundet relevante i forhold til sammenstillingen af det patentretlige korpus. 2.2 Korpusstørrelse Den endelige størrelse, som skal findes, er korpusstørrelsen en opgave, der ved første øjekast kan virke uoverkommelig. Men tager man de faktorer i betragtning, som er relevante for netop det korpus, man ønsker at sammenstille, og bevæger sig bort fra den ide, at der eksisterer en universel korpusstørrelse, er man godt på vej til at opnå en korpusstørrelse, som er ideel i forhold til den opgave, som korpus skal bruges til at løse (de Haan 1992:3). Det første skridt på vejen til at fastlægge korpusstørrelsen er fastlæggelsen af den helmængde, som ønskes repræsenteret. Det er nødvendigt at fastlægge helmængden for at have tilstrækkeligt grundlag for at vurdere, hvad der kræves, for at det aktuelle korpus er tilstrækkeligt repræsentativt for helmængden. Som udgangspunkt er det umuligt at undersøge 23

23 en given helmængde til bunds, da helmængden inden for langt de fleste fagområder består af et enormt antal tekster, der dagligt forøges. Et tekstkorpus kan derfor aldrig blive 100% repræsentativt, med mindre hele delmængden undersøges (Lauridsen/Andersen 1993:8). Det betyder dog ikke at man på forhånd bør stille sig opgivende over for opgaven. Man bør snarere forsøge at definere det fagområde (den population), som skal repræsenteres i korpus (se afsnit 1.1.2), og herefter yderligere inddele fagområdet i de subtemaer, som er typiske for fagområdet (se afsnit 2.3.2). Herefter kan en stratificeret sammenstilling af et eller flere pilotkorpora (stikprøver) finde sted. En stratificeret tilgang til sammenstillingen af stikprøver vil altid resultere i en mindst lige så repræsentativ stikprøve som den, der fremkommer ved tilfældig stikprøvesammenstilling (Biber 1993:244). Også Ole Norling-Christensen støtter den teori, at en stratificeret korpussammenstilling i modsætning til en simpel tilfældig sammenstilling er at foretrække, i og med at en stratificeret sammenstilling af korpus giver langt større sandsynlighed for, at korpus afspejler de faktorer som ønskes repræsenteret. En simpel tilfældig udvælgelse af tekster derimod giver enhver tekst inden for det tema, som ønskes repræsenteret, lige stor sandsynlighed for at blive udvalgt. Herved risikerer man, at små subtemaer overrepræsenteres i forhold til deres reelle repræsentation i populationen (Norling-Christensen 1996:126). Det er dog ikke kun et spørgsmål om, i hvor høj grad hoved- eller subtemaerne er repræsenteret. Et andet aspekt af denne stratificering er nemlig en undersøgelse af, hvilke teksttyper der bør indgå i korpus og dermed repræsentere temaerne (se afsnit 2.3.4). Det næste skridt i fastlæggelsen af korpusstørrelsen er at definere den eller de parametre, som skal ligge til grund for undersøgelserne af eksempelvis hvilke typer tekster, som inddrages og hvor lange teksterne i korpus bør være for at opnå en ensartethed i teksterne. Den parameter, som jeg i det følgende vil arbejde med, er antallet af fagtermer pr. pilottekst. Grunden til dette skift fra en kvalitativ størrelse, nemlig vurderingen af, hvad en fagterm er (se afsnit 1.2.4), til en kvantitativ størrelse, nemlig antallet af fagtermer pr. tekst skyldes, at det er nødvendigt at forsøge at omsætte det sprog, som skal undersøges, til tal for overhovedet at kunne anvende Douglas Bibers korpusteori. I sin artikel nævner Biber, at det er relevant at beregne korpusstørrelsen ud fra forekomsten af 10 forskellige lingvistiske træk: antallet af substantiver, præpositioner, passiver o.s.v. (Biber 1993:249). Disse lingvistiske træk er efter min mening fastlagt ud fra, at formålet med korpora er at undersøge lingvistiske strukturer i almensproget. Hvis formålet med det korpus, som ønskes sammenstillet her, var at undersøge lingvistiske træk i patent- og brugsmønsterretten, er det ikke utænkeligt, at beregningen af antallet af forekomster af disse træk ville være relevant. Eftersom det dog ikke er tilfældet, 24

24 men korpus derimod skal anvendes til lemmaselektion til en fagordbog, er det langt mere relevant, at det netop er antallet af fagtermer, som undersøges. Det er naturligvis ikke utænkeligt, at en lang række andre parametre eksempelvis komposita ville kunne erstatte Douglas Bibers 10 lingvistiske træk og stadig have den funktion at sikre en tilstrækkelig høj grad af faglighed. Nogle af de lingvistiske træk, som Biber nævner, kan dog også bibeholdes, da de også er typiske for fagsproget. Eksempler på dette kunne være passiver. Det ville dog være et enormt arbejde for en enkelt person at undersøge 10 mere eller mindre komplekse lingvistiske træk i et temmelig stort pilotkorpus, hvorfor jeg har begrænset mig til én parameter. Derudover har det i denne sammenhæng været nødvendigt i forhold til de resurser, der har været til rådighed, ikke at betragte kollokationer og flerordstermer som fagtermer, der skal undersøges i pilotkorpus. Det er kun antallet af enkeltordstermer, der undersøges, i og med at det er den af de tre parametre (enkeltordstermer, kollokationer og flerordstermer), som er lettest at genkende uden tidskrævende konkordansundersøgelser. Efter min mening er det tilstrækkeligt blot at undersøge antallet af enkeltordstermer. Baggrunden for, at jeg mener, det fint lader sig gøre i den konkrete korpussammenstilling, er, at antallet af fagtermer i forhold til tekstlængde er en af de tekstinterne indikatorer, som siger noget om, hvor høj fagsprogligheden er i en given tekst (Ditlevsen et al. 2002:29-30). Det er nemlig mht. det konkrete korpus tilstræbt, at fagsprogligheden er høj ud fra denne parameter for netop at kunne sikre en høj repræsentation af fagtermer til den senere termudvælgelse, såvel som for at sikre, at teksterne med stor sandsynlighed er forfattet af fagfolk og til fagfolk. I det følgende vil de foregående overvejelser blive omsat til praktiske valg. 2.3 Sammenstilling af pilotkorpus praktiske valg I forbindelse med sammenstillingen af et tekstkorpus er det vigtigt at tage udgangspunkt i et pilotkorpus. Oprettelsen og analysen af et pilotkorpus giver ikke blot en fornemmelse af, hvordan det færdige korpus kommer til at se ud, men kan også løbende give et praj om, hvordan de valg, man træffer, vil have indvirkning på det endelige korpus. Ved løbende at evaluere sit pilotkorpus og, hvis det er nødvendigt, ligeledes løbende at foretage en revision af allerede trufne valg, sparer man sig selv for en del overflødigt arbejde, i og med at det unægtelig er noget nemmere at ændre i et pilotkorpus på eksempelvis 50 tekster end et korpus på 500 tekster. Her er altså tale om en fremgangsmåde som beror på en løbende 25

25 vekslen mellem teori og praksis og om nødvendigt med løbende revision af de valg, man tidligere har truffet (Biber 1993:243). I samarbejde med statistiker Anders Frederiksen 1, er jeg kommet frem til at det vil være mest hensigtsmæssigt at oprette et pilotkorpus hvis størrelse udgør ca. 30% af tidligere oprettede korpora med lignende funktion eller sammenstilling som ønsket i det endelige korpus. Det skyldes at man ved oprettelsen af tidligere korpora nødvendigvis må have gjort nogle erfaringer omkring korpusstørrelse, som kan bruges som udgangspunkt for det pilotkorpus, som skal sammenstilles her. Derfor vil der i det følgende blive arbejdet med et pilotkorpus, der som udgangspunkt har en størrelse som udgør ca. 30% af de aftaleretlige korpora fra 1989 (Dyrberg et al. 1991). Det vil sige, at pilotkorpus vil være på ca. 30% af de 1 mio. ord i løbende tekst, som ses i de aftaleretlige korpora, nemlig ca ord. Undervejs tilpasses den endelige korpusstørrelse ud fra den fremgangsmåde, Douglas Biber opstiller i sin artikel. Ifølge Anders Frederiksen ville det være en fordel forud for fremstillingen af pilotkorpus at undersøge et andet korpus, som lignede det tilsigtede endelige korpus mest muligt. Jeg har lokaliseret et sådant korpus, som om end det er noget mere generelt, dog stadig har ligheder med det, som ønskes oprettet her. Som navnet på dette korpus antyder, Fachkorpus Jura ( er det et tysk juridisk korpus. Det er internatbaseret og indeholder 5,2 mio. ord i løbende tekst. Efter at have været i -kontakt med korpussammenstillerne viste det sig dog umuligt at få udleveret hele korpus i elektronisk form. Eftersom jeg ikke kunne få adgang til korpusteksterne online, men kun til dele af teksterne (gns. 2-3 sætninger sammenhængende tekst), var det ikke muligt at foretage de ønskede undersøgelser i dette korpus, hvorfor idéen desværre måtte opgives igen. I de følgende afsnit behandles de faktorer, som skal fastlægges for at kunne beregne standardafvigelsen på gennemsnittet, som er den endelige målestok for beregningen af såvel størrelsen på pilotkorpus som selve korpus. Standardafvigelsen på gennemsnittet er et udtryk for, i hvor høj grad teksterne i korpus afspejler teksterne i helmængden Nødvendigheden af pragmatiske løsninger Efter at have fastlagt de ydre rammer for korpus, med hvilke jeg her mener en overordnet definition af den helmængde, som skal repræsenteres, bør man ifølge Biber som næste skridt 1 Anders Frederiksen Steen Billes Gade 10, 1. tv 8200 Århus N 26

26 fastlægge de subtemaer og teksttyper, som er repræsenteret i helmængden. I den forbindelse skal det nævnes, at Biber finder en tematisk inddeling langt vigtigere end en fastlæggelse af de teksttyper, som optræder i helmængden, idet temaerne som regel er afhængige af teksteksterne faktorer, hvorimod teksttyperne er afhængige af tekstinterne faktorer (Biber 1993:245). Dvs. at temaerne i vid udstrækning vil afspejle teksttyperne. Det betyder dog ikke, at man blot kan afskrive teksttyperne som undersøgelsesværdig parameter. Generelt må det siges, at Bibers teori er en anelse vag mht. fastlæggelsen af teksttemaer og teksttyper. Her er meget få konkrete løsninger at hente, og en stor del af løsningerne må derfor nødvendigvis bero på de pragmatiske løsninger, korpussammenstilleren/- sammenstillerne vælger. Det er dog ikke kun Biber, som på dette område er vag rent teoretisk. Under udarbejdelsen af de aftaleretlige korpora er det også netop her, gruppen bag sammenstillingen af de tre korpora er stødt på problemer, som har resulteret i pragmatiske løsninger(dyrberg m.fl 1988). Eksempler på disse pragmatiske løsninger er, at det var en komplet umulighed at etablere en emnedækkende bibliografi over kontrakter (Dyrberg m.fl 1988:224), da langt de fleste kontrakter er private, hvorfor man besluttede fortrinsvist at benytte sig af fortrykte standardkontrakter og publicerede formularsamlinger. Dette kritiseres stærkt af Kirsten Wølch Rasmussen, som på baggrund af von Eybens konklusioner i Juridisk Grundbog (1989) fastslår, at de udvalgte standardkontrakter og formularsamlinger i alt for ringe grad afspejler den anvendte sprogbrug i kontrakter generelt (Rasmussen 1990:134). Efter min mening har Kirsten Wølch Rasmussen ret i de kritikpunkter, hun fremsætter i artiklen De aftaleretlige tekstkorpora principper, pragmatiske løsninger og praksis, men det betyder dog ikke, at pragmatiske løsninger er forbudte i sammenstillingen af tekstkorpora. Man bør blot nøje overveje årsagerne til og konsekvenserne af de pragmatiske løsninger, før man vælger dem. Det er her også væsentligt at nævne, at fastlæggelsen af fagsystematikken er den faktor i sammenstillingen af mit korpus, der har størst relevans i forbindelse med en fremtidig sammenstilling af et parallelt dansk patentretligt korpus. Da jeg ikke har sammenstillingen af et parallelt dansk korpus for øje, har jeg valgt ikke at undersøge, hvordan den tyske temainddeling passer sammen med en eventuel fremtidig dansk temainddeling. Indirekte vil der dog være nogen hjælp at hente i min temainddeling for en eventuel sammenstiller af et tilsvarende dansk korpus, i og med at den europæiske patentret, som gælder i såvel Danmark som Tyskland, er inddraget i korpus. Her er det altså muligt at drage paralleller mellem de to sprog. Selve udarbejdelsen af en dansk fagsystematik vil jeg således lægge i hænderne på andre. 27

27 2.3.2 Tematisk inddeling af undersøgelsesområdet Under arbejdet med fastlæggelsen af de teksttemaer, som skal repræsenteres i det endelige korpus, bør man inddrage fagfolk fra det relevante fagområde. Dette er eksempelvis set gjort i praksis under udarbejdelsen af såvel det genteknologiske korpus (Lauridsen/Andersen 1993:5) som under udarbejdelsen af de aftaleretlige korpora (Dyrberg m.fl. 1991:9). Schaeder/Bergenholtz kritiserer stærkt denne fremgangsmåde for at være lidet overbevisende, i og med at fagfolk umuligt kan fastslå, hvilke dele den helmængde, der skal repræsenteres, består af og tilmed sætte nøjagtige procenter på, hvor udbredt de respektive temaer er (Schaeder/Bergenholtz 1994:167). Der gives dog intetsteds bedre bud på, hvordan denne opgave kan løses. Bergenholtz er dog alligevel af den opfattelse, at man bør inddrage fageksperter i korpusarbejdet (Bergenholtz/Engberg 1995:185), og jeg ser intet andet sted i korpusarbejdet, hvor fageksperters råd og vejledning kan være til større hjælp end i fastlæggelsen af den tematiske inddeling. Ganske vist foreslår Biber, at man benytter sig af bibliotekernes klassifikationssystemer (Biber 1993:247), men her må man tage i betragtning, at Biber tager udgangspunkt i oprettelsen af almensproglige tekstkorpora, hvorimod Schaeder/Bergenholtz har oprettelsen af fagsproglige tekstkorpora for øje og med rette fastslår, at bibliotekernes klassifikationssystemer ikke er nær detaljerede nok til at kunne anvendes i opdelingen af helmængden i temaer (Schaeder/Bergenholtz 1994:170). Ved sammenstillingen af de aftaleretlige korpora løser Dyrberg m.fl. temaproblematikken ved først at opstille en tematisk inddeling på baggrund af den universelle decimalklassifikation (UDK), inddelingen i lærebøger samt Jens Søndergaards inddeling i sin Dansk Juridisk Bibliografi (Dyrberg m.fl. 1988:218). I arbejdet med den fagsystematiske inddeling af den tyske patentret har jeg først studeret den universelle decimalklassifikation, men om end den giver et praj om hovedtemaerne, er der her ikke information nok at hente om, hvordan hovedtemaerne inddeles, idet inddelingen forekommer uoverskuelige, mangelfuld og ustruktureret (DIN 1978). Det forekommer også vanskeligt at tage udgangspunkt i de love, som er knyttet til området. Det skyldes, at det mht. lovene er svært at vurdere, hvilke temaer der er over- og underordnede. Dertil kommer, at man skal have en grundigt kendskab til lovsproget for at kunne få det fulde udbytte af teksterne noget som ikke er lægfolk beskåret og det ville være et stort arbejde for eventuelle adspurgte jurister at løse en sådan opgave. Helt anderledes forholder det sig med lærebøger, som giver et fint overblik over den aktuelle helmængde og tilmed er et glimrende værktøj til at inddele hovedtemaerne i subtemaer. Som lægmand inden for området patentret er jeg dog ikke i stand til at vurdere, om lærebøgernes fagsystematik er dækkende, hvorfor jeg kun har været i stand til at fremstille en omtrentlig 28

28 fagsystematik. I den tematiske inddelingen har det været af stor vigtighed hverken at gøre inddelingen for bred eller for snæver. En for bred inddeling med sin manglende nuancering vil resultere i et mindre repræsentativt korpus, og en for snæver inddeling vil kræve et større korpus for i rimelig grad at få repræsenteret alle subtemaerr. Det drejer sig altså om at få sammenstillet en sådan tematisk inddeling, at korpus er repræsentativt, uden at arbejdsbyrden bliver uoverskueligt stor. 13 tyske jurister med speciale i patentret (se bilag 2) blev efterfølgende bedt om at kommentere. Efter at have rådført mig med 13 tyske jurister med speciale i patentret er jeg kommet frem til en tematiske inddeling af hovedtemaet Patent- und Gebrauchsmusterrecht og Das Europäische Patentübereinkommen. Juristerne blev først i første omgang bedt om at kommentere den tematiske inddeling hovedsageligt udviklet på baggrund af lærebogsinddelinger (Hubmann/Götting 2002; Chrocziel 2002). Efter at have taget fagfolkenes kommentarer i betragtning blev den tematiske inddeling i let bearbejdet form atter sendt til fagfolkene, som nu tilsluttede sig, at fagsystematikken var dækkende for hovedtemaet (se Bilag 1) Repræsentation af hoved- og subtemaer Nu blev eksperterne ud fra et spørgeskema bedt om at vurdere, hvor meget der er skrevet på tysk om den tyske og den europæiske patentret i forhold til hinanden på fagmand fagmandniveau. Ser man hovedtemaet Patent- und Gebrauchsmusterrecht og Das Europäische Patentübereinkommen som grundmængden (100%), står det efter en statistisk beregning af gennemsnittet klart, at fordelingen er som følger: Mængden af skriftligt materiale fordeler sig med henholdsvis 59,2 % om Patent- und Gebrauchsmusterrecht og 40.8% om Das Europäische Patentübereinkommen. Disse tal er fremkommet ved en simpel beregning af gennemsnittet for alle 13 advokates (respondenters) svar og kan opstilles i denne formel: x i = n Formlen udtrykker, at summen af respondenternes angivelse af størrelsen på hovedtemaerne henholdsvis Patent- und Gebrauchsmusterrecht og Das Europäische Patentübereinkommen x 29

29 ( x i ) divideret med antallet af stikprøver ( n ) er lig den gennemsnitlige størrelse på hovedtemaerne. For nemheds skyld vil jeg dog runde resultatet op/ned til nærmeste hele tal og foretage de efterfølgende beregninger ud fra, at Patent- und Gebrauchsmusterrecht udgør 59% af hovedtemaet, og at Das Europäische Patentübereinkommen udgør 41% af hovedtemaet. I bilag 3 ses de enkelte respondenters svar og gennemsnittet for alle respondenter. Man kunne her argumentere for, at man ved beregningerne på basis af respondenternes svar burde tage standardafvigelsen på gennemsnittet i betragtning på samme måde, som jeg inddrager denne faktor i udregningen af korpusstørrelsen (se afsnit 2.3.9). Det vil muligvis i højere grad sikre, at den enkelte respondents besvarelse ikke adskiller sig væsentligt fra den gennemsnitlige respondents Imod inddragelsen af beregningen af standardafvigelsen på gennemsnittet taler dog, at her kun er tale om 13 respondenter. Hvis man skulle foretage denne beregning og efterfølgende skille sig af med de mest yderligliggende besvarelser, ville man ende med et meget lille antal respondenter. Det er efter min mening vigtigere at få så mange respondenter som muligt inddraget, samtidig med at det ville være noget omstændeligt at foretage denne beregning, når man alligevel ud fra bilag 3 med det blotte øje kan se, at respondenternes besvarelser ikke adskiller sig dramatisk fra hinanden. Næste skridt er at beregne, i hvor høj grad subtemaerne er repræsenteret sammenholdt med repræsentationen af de to hovedtemaer. Betragter man hovedtemaet Patent- und Gebrauchsmusterrecht og Das Europäische Patentübereinkommen som to separate temaer, der hver især udgør 100% blev fagfolkene bedt om at vurdere i hvor høj grad de enkelte delemner (punkterne 1-8 og punkterne 9-12 i emneinddelingen i bilag 1), var repræsenteret i forhold til hinanden. Den yderligere fininddeling af subtemaerne (punkterne a, b, c osv. i bilag 1) skulle ikke procentangives. Det ville som tidligere nævnt resultere i en langt mere stratificeret sammenstilling af såvel pilotkorpus som korpus, men det ville ikke være hensigtsmæssigt at skulle repræsentere mange små subtemaer, som hver især udgør ex. 0,5%. Samme valg er truffet under udarbejdelsen af de aftaleretlige korpora (Dyrberg et al. 1988: ) og af selv samme årsag. Selve beregningen af subtemaernes størrelse er fremkommet ved at se på, hvordan den enkelte respondent mener, det enkelte tema bør repræsenteres, og efterfølgende sætte disse procentangivelser i relation til procentfordelingen 59%/41% over skrevet materiale om de to hovedtemaer. I bilag 4 ses den endelige procentuelle repræsentation af de forskellige subtemaer. Gennemsnittet for alle respondenter yderst i højre spalte er fremkommet ved først at beregne, 30

30 i hvor høj grad den enkelte respondent syntes subtemaerne burde være repræsenteret i korpus, og derefter beregne et gennemsnit for samtlige respondenter. Følgende eksempel illustrerer beregningsmetoden: Respondent 1, Cremer & Cremer, mener at det første subtematema, nemlig 1. Schutzgegenstand und Schutzvoraussetzungen udgør 20% af hoverdtemaet Patent und Gebrauchsmusterrecht som igen udgør 50% af det overordnede tema Patent- und Gebrauchsmusterrecht og Das Europäische Patentübereinkommen. Det vil sige, at dette første subtema efter respondent 1 s mening udgør i alt 10% af det overordnede tema da 20% af 50% er lig 10%. Udregnes samtlige 13 respondenters besvarelser i procentuelle tal i forhold til det overordnede tema, fremkommer de tal, som ses i bilag 4. Her ses som nævnt også gennemsnittet af de 13 respondenters besvarelser udregnet på samme måde som i bilag 3. Det skal her kort nævnes, at der for nemheds skyld er regnet uden decimaler i denne sidste udregning af den endelige temafordeling. Resultatet af beregningen ses i figur 7, som viser i hvor høj grad det enkelte subtema er repræsenteret i hovedtemaet. 31

31 2.3.4 Valg af teksttyper Som tidligere nævnt henvender Gubbas Juridisk ordbog tysk-dansk sig hovedsageligt til fagfolk og semi-fagfolk inden for faget jura (se afsnit 1.2.3). Af den grund er det yderst vigtigt, at de tekster, som inddrages i korpus, kun repræsenterer de tekster, som har fagfolk som såvel afsendere som modtagere. Dette er væsentligt af den ene grund, at man som udgangspunkt må skønne, at fagfolk som gruppe, også selvom det er ubevidst, har den største fornemmelse for, hvilke eksisterende genrekonventioner der bør opfyldes i patentretlige tekster rettet mod andre fagfolk. Trekantsmodellen i figur 8 illustrerer, hvilket sprogligt/visuelt middel der sætter afsenderen i stand til at opnå det ønskede formål i en given situationel ramme, hvilket jo netop er den kvalitet, som man må antage, at folk, der er velbevandrede inden for hovedtemaet, besidder. Det understreger endnu engang vigtigheden af at involvere fagfolk i korpusarbejdet, hvad enten det er direkte eller indirekte. Mht. den direkte involvering hentydes til den tematiske inddeling af hovedtemaet, og mht. den indirekte involvering menes tekster forfattet af fagfolk. Ved valget af teksttyper har det været essentielt, at afsenderen har været klar over, hvilke typikalitetsrelationer, der gør sig gældende, når der kommunikeres skriftligt inden for 32

32 patentretten. Her kan man tale om, at min tilgang afviger fra Bibers, i og med at jeg på samme måde, som Ditlevsen et al. gør det, opfatter teksttyperne som et teksteksternt parameter (Ditlevsen et al. 2002:57-59). Douglas Biber derimod opfatter teksttyper som værende afhængige af tekstinterne parametre (Biber 1993:245), men jeg mener godt, at den synsvinkel jeg har valgt at tage, kan passes ind i Bibers teori. I denne situation efterstræber jeg jo et pilotkorpus med en høj grad af faglighed, hvorfor det har været vigtigt, at den enkelte tekst har fagfolk/semi-fagfolk som modtagere og fagfolk som afsendere. Det er unægtelig noget lettere og mindre tidskrævende at fastslå ud fra teksteksterne faktorer end tekstinterne faktorer. For at starte et sted har jeg skelet til valget af teksttyper i udarbejdelsen af de aftaleretlige korpora (Dyrberg et al. 1988: ). Efterfølgende har jeg tilpasset teksttyperne, så de typer, som er karakteristiske for aftaleretten, er blevet erstattet og suppleret med patentretlige teksttyper. Det er blevet til i alt 5 grundlæggende kategorier af teksttyper, nemlig: Love og andre regler (Gesetze und andere Vorschriften) samt Lovforarbejder (Gesetzentwurfe) Domme (Urteile) Patenter og brugsmønstre (Patente und Gebrauchsmuster) Juridiske lærebøger (Juristische Lehrbücher) Artikler i juridiske tidsskrifter (Artikel in juristischen Zeitschriften) Årsagen til, at jeg har set mig nødsaget til at læne mig tæt op ad de aftaleretlige korpora i forbindelse med valget af teksttyper, skal findes i det enorme arbejde, som ligger i en grundig analyse af teksttyperne inden for et hvilket som helst område. Bare definitionen af, hvordan begrebet teksttype skal opfattes, ville kræve flere resurser, end det her er muligt at afsætte. Derudover ligger der helt tydeligt et stort arbejde bag valget af teksttyper i de aftaleretlige korpora, hvor den enkelte teksttype er udvalgt efter en undersøgelse af, i hvor høj grad den er i stand til at belyse hovedtemaet. I det følgende beskrives de væsentligste årsager til, hvorfor de respektive teksttyper er inddraget i korpus, samt hvilke afgrænsende valg der er foretaget i forhold til teksttypens repræsentation i korpus. Alle valg og fravalg er truffet på baggrund af de argumenter, som Dyrberg et. al. er fremkommet med i arbejdet med temainddelingen for de aftaleretlige korpora (Dyrberg et. al. 1988: ) samt i samarbejde med det tidligere 33

33 nævnte advokatkorps. Alle de anførte argumenter er naturligvis set i forhold til temaet for det aktuelle korpus, patentretten. Love og andre regler Eftersom korpus skal omfatte såvel den tyske patentret som brugsmønsterret (Patent- und Gebrauchsmusterrecht), har det været nødvendigt at inddrage to forskellige tyske love i korpus, nemlig Deutsches Patentgesetz og Deutsches Gebrauchsmustergesetz. Dette problem optræder ikke i den europæiske ret, i og med at såvel patentretten som brugsmønsterretten er behandlet i Europäisches Patentübereinkommen. Her har jeg altså kunnet nøjes med en lov. Lovene er inddraget i korpus i deres helhed, da de er helt grundlæggende for temaet, og det ville forekomme unaturligt kun at inddrage dele af lovene, i og med at de er så centrale. Altså fraviger jeg her den hovedregel, at tekstlængden for den enkelte tekst højst må være på 5000 ord i løbende tekst. Ud over disse grundlæggende love er også andre former for relevant lovgivning inddraget. Det drejer sig for eksempel om Arbeitnehmererfindergesetz og Patentanwaltsgesetz. Derudover har jeg inddraget bekendtgørelser, cirkulærer, forordninger osv. Lovforarbejder Som udgangspunkt findes 3 typer lovforarbejder, nemlig lovforslag, nedskreven debat og betænkninger. Anvendelsen af lovforslag og nedskreven debat i det aktuelle korpus er betænkelig. Lovforslag ligner unægtelig de færdige love meget og kan derfor ikke bidrage med synderlig megen ny information i forhold til temaet love og andre regler. Inddragelsen af lovforslag vil altså kun resultere i en overrepræsentation af det sprog, som anvendes i lovene, hvorfor de ikke inddrages. Den nedskrevne debat er også en teksttype, som bør overvejes nøje. Her er det et spørgsmål om, hvorvidt den nedskrevne debat virkelig er et udtryk for kommunikation mellem fagfolk, eller om man bør sætte spørgsmålstegn ved graden af faglighed i debatterne. Der er nemlig ingen garanti for, at den eller de politikere, som deltager i debatterne, er en del af det diskursfællesskab, der beskæftiger sig professionelt med patentret. Derfor inddrages den nedskrevne debat heller ikke i korpus. Med den argumentation er eksempelvis betænkninger udeladt. 34

34 Domme Under denne kategori er inddraget domme fra såvel tyske som europæiske retsinstanser. Forskellige retsinstanser, der træffer afgørelser inden for patent- og brugsmønsterretten, er repræsenteret i korpus, hvilket skyldes, at det er målet at repræsentere så bredt som muligt inden for dette område. Dommene er inddraget i korpus i deres helhed, da domme er så komprimerede tekster, at de ikke udgør en komplet meningsenhed med mindre de inddrages i deres helhed. Det har ikke været hensigten at inddrage domme på en sådan vis, at de, hvis de bliver sammenstillet i et selvstændigt korpus, kan bruges i undersøgelser af netop denne teksttype. Det dog ikke utænkeligt, at netop en sådan sammenstilling ville kunne være genstand for en undersøgelse af tekstinterne faktorer af forskellig art eksempelvis en undersøgelse af, hvilke standardformuleringer der findes inden for teksttypen domme, eller en undersøgelse af, hvor i teksten disse standardformuleringer typisk optræder. Det ville dog højst sandsynligt kræve, at denne teksttype kopieres over i et selvstændigt korpus, som skal suppleres med tekster for at kunne være genstand for seriøse undersøgelser. Patenter og brugsmønstre Inddragelsen af patenter og brugsmønstre i korpus vil begrænse sig til diverse standardformularer samt skabeloner. Det kan måske undre, at selve kernen i patentretten ikke inddrages i korpus, men det skyldes hovedsageligt det faktum, at sproget i tildelte patenter og brugsmønstre kun i ringe grad afspejler juridisk sprogbrug, og i langt højere grad består af teknisk sprog. Selvom et patent eller et brugsmønster er et juridisk dokument, som sikrer ophavsretlige rettigheder, består selve dokumentet af tekniske beskrivelser (Lawson 1983:58). En inddragelse af disse dokumenter i korpus ville derfor resultere i en unødig arbejdsbyrde i og med at der så ville optræde en mængde teknisk fagsprog af forskellig art, som skulle afgrænses fra den patentretlige diskurs. Juridiske lærebøger Fordelen ved lærebøger i arbejdet med sammenstillingen af fagsproglige korpora er mange. Lærebøger giver ofte en grundig gennemgang af hele det tema, som ønskes repræsenteret, og er udformet i et sprog, der henvender sig 35

35 til semifagfolk med et ønske om at blive fagfolk. Derudover er lærebøger forfattet af fagfolk, som, netop fordi de er fagfolk, er i stand til at formulere sig inden for de tekstinterne konventioner, som eksisterer inden for det behandlede emne. Derfor giver lærebøger et godt billede af mange af de fagtermer, som anvendes inden for det overordnede tema og diverse subtemaer. I det patentretlige korpus har jeg dog valgt at udelade overfladiske lærebøger, som kun er ment som eksempelvis en brush-up før eksamen. Artikler i juridiske tidsskrifter For at få det bedst mulige overblik over, hvilke tyske juridiske tidsskrifter der kunne være relevante i forbindelse med sammenstillingen af det patentretlige korpus, har det været til stor hjælp at konsultere den amerikanske hjemmeside Index to Foreign Legal Periodicals (Index to Foreign Legal Periodicals, Her gives et overblik over, hvilke seriøse tidsskrifter der kunne være interessante for den aktuelle korpussammenstilling. Derved sikres, at alle artikler stammer fra faglige tidsskrifter. Det har i forbindelse med udvælgelsen af tidsskriftsartikler også været essentielt, at artiklerne opfylder visse teksteksterne krav, nemlig at artiklerne er alle skrevet af fagmænd og henvender sig til fagmænd, samt at såvel fagligheden som fagsprogligheden er meget høj Udvælgelse af tekster Netop tekstudvælgelsen har givet anledning til en del debat om, hvorvidt det er uproblematisk at anvende korpora i lingvistiske studier. Kritikken går bl.a. på de sproglige fejl og misforståelser, som nødvendigvis også eksisterer i fagsprog skrevet af fagfolk (Vikner 1991:16). Det er selvsagt en uundgåelig del af arbejdet med korpora, at fejl af forskellig art optræder i de valgte tekster, men det er dog ikke et faktum, der bør afholde nogen fra at oprette korpora i hvert fald ikke korpora sammenstillet med henblik på udvælgelsen af fagtermer ud fra frekvensanalyser. Som det også senere vil fremgå, vil langt de fleste fejltyper kunne genkendes og udelades af videre undersøgelser (se afsnit 3.1), om end det er en stor opgave at lokalisere og karakterisere alle fejl. I sammenstillingen af det aktuelle korpus har det også været af stor betydning, at enkelte forfattere ikke var overrepræsenteret i forhold til andre. Dette valg er truffet ud fra W.E. von Eybens diskussion af den juridiske sprogbrug, hvor han bl.a. konstaterer, at 36

36 [ ] hver forfatter efterhånden får et vist særpræg, hver forelsker sig i bestemte vendinger og gør sig skyldig i sproglige synder af den ene eller anden art. (Eyben 1989:16) Eftersom disse særpræg og sproglige synder vil have indvirkning på en eventuel frekvensanalyse, er antallet af tekster af den enkelte forfatter begrænset til tre. Forhåbentlig er der dermed truffet forholdsregler i forhold til den enkelte forfattes skriftlige karakteristika Tekstlængde og tekststed Et andet men bestemt ikke mindre betydningsfuldt aspekt i opnåelsen af størst mulig representativitet er længden på de tekster, som skal inddrages i korpus. En mekanisk udvælgelse af et bestemt antal ord fra et antal tekster vil på ingen måde kunne bidrage til at repræsentere helmængden, da man derved ødelægger tekststrukturen og eksempelvis kollokationer, vil gå tabt (Biber 1993:249). Derimod vil en tekstudvælgelse ud fra den devise, at teksten bør udgøre en meningsenhed, som kan stå alene, resultere i en bevarelse af såvel sætnings- som tekststrukturer. Det har derfor været hensigten, at de tekster som inddrages i korpus, udgør f.eks. et helt kapitel i en bog, en hel artikel i et tidsskrift, en hel dom, en hel lov osv. Som udgangspunkt bør en enkelt tekst i pilotkorpus ikke overstige 5000 tegn. Jeg har i stedet forsøgsmæssigt lænet mig op af det genteknologiske korpus, der som det første fagsproglige korpus havde en sådan fastlagt øvre grænse for tekstlængden (Lauridsen/Andersen 1989:11). Jeg har dog som nævnt i afsnit gjort et par undtagelser mht. tekstlængden i forsøget på at opnå ovenstående meningsenhed i teksterne Den tekstmæssige tidsramme Et af de øverste mål i arbejdet med sammenstillingen af korpus har været at gengive den sprogbrug, som anvendes inden for området patent- og brugsmønsterret i dag. Af den grund er de valgte tekster alle fra de seneste ti år ( ), og der er lagt et stort arbejde i at sikre, at teksterne er udkommet første gang i denne periode. Jeg har sikret mig, at ingen af de valgte tekster blot er nyoptryk eller genoptryk af tidligere publicerede tekster, hvilket har været et af de hårdeste kritikpunkter i analysen af de aftaleretlige korpora (Rasmussen 1990:131). Undtagelsen mht. den tekstmæssige tidsramme er den gældende lovgivning. Den inddragede lovgivning er den, som er gældende på nuværende tidspunkt (juni 2004), også selvom enkelte lovtekster skulle stammer fra før

37 2.3.8 Antal tekster En fastlæggelse af det antal tekster, som bør indgå i korpus kan ifølge Douglas Biber sættes i direkte relation til de teksttypiske træk, som blev undersøgt i testkorpus (Biber 1993:XXX). I dette tilfælde er det teksttypiske træk antallet af fagtermer (se afsnit 2.2). Et eller andet sted må man dog starte, og jeg har derfor valgt at oprette et pilotkorpus som udgør ca. 30% af standardstørrelsen på tidligere sammenstillede fagsproglige tekstkorpora, nemlig ca. 60 tekster af en længde på maksimalt 5000 tegn. For store almensproglige korpora ville det være en stor opgave at sammenstille et pilotkorpus på 30% af den anslåede endelige størrelse på korpus, men i dette tilfælde, hvor den anslåede endelige størrelse er ord i løbende tekst, ville et pilotkorpus som udgør 10% (standardstørrelsen på pilotkorpora) af den anslåede korpusstørrelse, blot være på tekster. Det må siges at være lidt for lidt, når nu alle teksttemaer skal være repræsenteret med lidt mere en bare 1-2 tekster Standardafvigelsen på gennemsnittet - målestok for den endelige korpusstørrelse En beregning af den størrelse, som inden for den statistiske terminologi kaldes standardafvigelsen på gennemsnittet, betyder, at man kan finde frem til, i hvor høj grad der er en ensartethed i forhold til antallet af fagtermer pr. tekst i pilotkorpus. Derigennem kan man fastlægge, hvor mange tekster der skal til for at opnå størst mulig sikkerhed for, at man har fastlagt gennemsnittet for antal fagtermer pr. tekst så tæt på det reelle gennemsnit i helmængden som muligt. Biber udtrykker beregningen af standardafvigelsen på gennemsnittet (s x ) i følgende formel, hvor s udtrykker standardafvigelsen og n udtrykker stikprøvestørrelsen (antallet af tekster i pilotkorpus) (Biber 1993:248): s = s x n ½ For at kunne beregne standardafvigelsen på gennemsnittet (s x ) er det nødvendigt først at beregne standardafvigelsen, som udtrykker hvor meget antallet af fagtermer pr. tekst i pilotkorporaene i gennemsnit afviger fra gennemsnittet. Formlen for beregning af standardafvigelse ser således ud: 38

38 s = s 2 = n i= 1 (x i x) n 1 2 (Aczel/Sounderpandian 2002:31) Her skal det lige bemærkes, at formlen tager udgangspunkt i, at helmængden er normalfordelt, hvilket i dette tilfælde vil sige, at antallet af fagtermer pr. tekst i helmængden er symmetrisk fordelt omkring gennemsnittet. Derudover fastslår den empiriske regel, at ca. 68% af observationerne skal ligge inden for max. 1 standardafvigelse fra gennemsnittet, og 95% af observationerne skal ligge inden for max. 2 standardafvigelser fra gennemsnittet (Aczel/Sounderpandian 2002:40). Dette er efter min opfattelse det svageste punkt i Bibers fremstilling af korpusstørrelse som en faktor, der kan beregnes efter statistiske principper. Er antallet af fagtermer pr. tekst i pilotkorporaerne ikke normalfordelt, findes der ikke et nær så godt statistisk grundlag for at kunne beregne korpusstørrelsen og derigennem opnå en grad af repræsentativitet, der kan understøttes af beregninger. Resultatet af et ikke-normalfordelt pilotkorpus vil derfor være, at Bibers metode ikke kan anvendes til statistiske beregninger med nær den samme sikkerhed som normalfordelte korpora, og man må i værste fald atter ty til den traditionelle sammenstilling af korpora den tilfældige. 2.4 Praktisk oprettelse af pilotkorpus Valg af tekstformat For at sikre sig at undgå problemer ved inddragelsen af konkordansprogrammer i analysen af pilotkorpus et det sikreste valg af tekstformat den rene tekst (.txt-formatet). Ved valget af dette format undgår man, at den type tekstformatering, som ofte forekommer i eksempelvis Word-filer i form af f.eks. fed eller kursiv skrift, skemaer o. lign., kommer i karambolage med konkordansprogrammet. Resultatet af brugen af formateret tekst kunne betyde, at teksten ved indlæsning i konkordansprogrammet omformateres, således at formatering omdannes til tegn, hvilket vil resultere i et mere unøjagtigt pilotkorpus. Et eksempel på et gennemtagged korpus, hvor alt ned til mindste morfem er markeret, er det tyske Index zu Lyrik Paul Celans (Hvidtfelt Nielsen/Pors 1981). En anden fordel ved at sammenstille korpus i.txt-format er, at sådanne tekster vil være meget lette at inkorporere eksempelvis i andre korpora, også selvom disse korpora foreligger i et 39

39 andet format. For i og med at.txt-formatet har renset teksten for alle formateringer, er det også meget let at omformatere teksten. Den rene tekst er nemlig utrolig let at arbejde med, da der ved omformatering til andre tekstformater ikke optræder problemer i form af pludseligt fremkomne tegn og tekststykker, som ikke burde være der. Det er nemlig hyppigt problemet ved omformatering af tekst i et mere avanceret format til et andet Tagging/annotering Ofte forholder det sig sådan, at korpora anvendes til at beskrive og/eller bevise, hvordan et givent sprog opfører sig. Et eksempel kunne være, at man gerne vil undersøge forskellige valensaspekter i det tyske sprog. I sådanne undersøgelser kunne det være nyttigt hurtigt at kunne genkende, om et ord tilhører den ene eller den anden ordklasse, uden at skulle sætte sig ind i konteksten, hvorfor det kunne være af stor interesse for korpusbrugeren, at korpus var tagget eller annoteret på ordniveau. Et andet eksempel kunne være undersøgelser af præog suffikser, hvor en tagging af leksemer kunne være relevant. Eftersom jeg blot vil beskæftige mig med udvælgelsen af fagtermer og ikke grammatiske undersøgelser, finder jeg det ikke nødvendigt at tagge eller annotere korpus med informationer af så specifik art, og det ville også være yderst resurse- og tidskrævende at annotere korpus så dybdegående. Jeg mener dog alligevel, at korpus bør udstyres med forskellige former for informationer. Her optræder dog endnu et problem: Konkordansprogrammer er ikke i stand til at skelne mellem taggingen/annoteringen og teksterne. Igen vil resultatet være, at en række informationer medtages som korpustekst, selvom de egentlig ikke hører hjemme der. For at minimere dette problem har jeg valgt kun at tagge/annotere korpus på simpel vis ved før hver tekst at angive Tekst, tekstnummeret efterfulgt af parentes (ex. Tekst 32)). Denne tagging vil stadig optræde i konkordansen, men den vil være yderst let at skelne fra ordene i det egentlige pilotkorpus, da ordet tekst ikke eksisterer på tysk og derfor hurtigt vil kunne udskilles som dansk tagging. Tekst, tekstnummeret efterfulgt af parentes henviser så til tekstnummeret i den bibliografiske oversigt over pilotkorpus (se vedlagte Cd-rom). Havde det været muligt for konkordansprogrammerne at udskille tagging/annotering fra det egentlige korpus, ville der have været fordele ved at anvende Corpus Encoding Standard, XCES samt at anvende computersproget Extensible Markup Language, XML, som er det hyppigst anvendte computersprog inden for tilføjelsen af informationer til korpora (XCES - Corpus Encoding Standard for XML ( 40

40 Fordelen ved at anvende XML, i dette tilfælde til angivelse af metainformation i korpus, er at dette computersprog gør det muligt at gå uden om metainformationen (her de bibliografiske informationer) ved søgninger i korpora lavet i HTML-format, da dette format gør, at man kan springe over denne type programmeret tekst. Resultatet er, at man ved søgninger i korpus ikke får forpurret sine resultater af tekststykker, som egentlig ikke hører hjemme i selve korpus. Samtidig er det muligt at finde metainformationerne frem i situationer, hvor de er af interesse. Desværre er jeg af tekniske årsager begrænset til at holde mig til et selvstændigt dokument med den bibliografiske oversigt Bibliografiske informationer om pilotkorpus I bibliografien for pilotkorpus har det været vigtigt, at brugerne af dette korpus let kan finde frem til de anvendte tekster, samt hvordan de er klassificeret i pilotkorpus. Derfor noteres følgende om den enkelte artikel, som optræder i korpus: forfatter, titel, sidetal, udgivelsestidspunkt, forlag og udgivelsessted. Internetsider er noteret med titel og dato. 41

41 3 Det endelige korpus det sidste stykke vej I dette tredje og sidste kapitel behandles fem hovedpunkter. For det første foretages en vurdering af det pilotkorpus, som er sammenstillet ud fra de principper, som er beskrevet i de foregående kapitler. Efterfølgende vil det endelige korpus blive anvendt til fremstilling af en frekvensorienteret lemmaliste. Dernæst vil der ud fra denne analyse blive foretaget en lemmaselektion til den kommende udgave af Juridisk ordbog tysk-dansk. Det fjerde punkt, som behandles, er en generel vurdering af anvendelsen af korpora til termudvælgelse, og afslutningsvis vil jeg give et bud på, hvilke metoder man i fremtiden kan anvende for at forbedre lemmaselektionen til fagordbøger. 3.1 Problemer under sammenstillingen af pilotkorpus Under det praktiske arbejde med sammenstillingen af pilotkorpus opstod en række problemer forudsete såvel som uforudsete. De uforudsete problemer viste sig at udgøre en langt væsentligere del end de forudsete. Med hensyn til de forudsete problemer kan man diskutere, om der overhovedet var tale om problemer, eller om det ikke snarere drejede sig om blot at træffe konkrete pragmatiske valg (se afsnit 2.3). De pragmatiske valg, som blev truffet inden sammenstillingen af pilotkorpus, viste sig nemlig at holde vand og fungerede fint i sammenstillingsprocessen. Anderledes forholdt det sig med de uforudsete problemer, som jeg løbende var nødt til at søge løsninger på. Problemerne og hvordan de blev løst er beskrevet i det følgende Optisk tegngenkendelse Af de uforudsete problemer viste den optiske tegngenkendelse i forbindelse med indscanningen af papirtekster sig at udgøre langt den overvejende del. Selvom scanneren, anvendt til indscanning af papirtekster (Dell A920 All-In-One Printer), var installeret med tilhørende software, som bevirkede at scannerprogrammet også kunne tegngenkende optisk, var der i den endelige indscanning hundredvis af eksempler på, at den optiske tegngenkendelse alligevel ikke var optimal. Det skete på trods af, at softwaren var indstillet til tysk tekst. De hyppigst forekomne fejlscanninger var programmets manglende evne til at genkende omlyde (ä, ö og ü). Blot for at illustrere det, vil jeg kort nævne de hyppigste fejlgenkendelser i denne henseende. 42

42 Hvor bogstavet ä optrådte i den originale tekst, optrådte eksempelvis a i indscanningen. I tilfælde med bogstavet ö i originalen optrådte især p, og når der i originalen forekom et ü, viste indscanningen f.eks. i stedet f?, ft, ii eller ti. Dette problem var stort set gennemgående, hvilket betød, at hele den indscannede tekstmængde måtte gennemgås for fejl af denne type og justeres. Samme type problem sås også hvor bogstavet ß optrådte. Her sås afarter som E, fs, g, (?, i?, fi, ft, ff, S og l?. Igen måtte fejlene, som optrådte i stort set samtlige tilfælde, rettes manuelt pilotkorpus igennem. Mindre hyppige problemer af samme skuffe var eksempelvis, at l af og til blev indscannet som i og omvendt, 1 blev indscannet som l, l blev til j og m til nn eller in. En kombination af omlydsproblemerne og de mindre hyppige fejl i indscanningen sås f.eks. hvor nü i originalen blev til mi. Selvom samtlige af disse fejltyper er forholdsvis lette at se, når de optræder, kræver det alligevel lang tid at gennemgå hele teksten manuelt for at opsnappe dem, og eftersom de fleste af disse kombinationer også optræder som dele af rigtigt indscannede ord i teksten, er det ikke muligt at gennemføre en såkaldt søg/erstat. Denne Word-funktion kan kun anvendes, hvor der er altovervejende sikkerhed for, at typen også er en fejl. Bindestreger viste sig også at værre et større problem end forudset. For eftersom korpus er i.txt-format er det ikke muligt for tekstbehandlingsprogrammet Word at genkende orddelingsstregerne som det, de er. I stedet bibeholdes orddelingsstregerne hvilket betyder at de må fjernes fra de ord hvor de optræder. Endnu engang er det ikke muligt at benytte, søg/erstat-funktionen, da der ikke skelnes mellem orddelingsstreger og andre former for bindestreger, f.eks. de streger der markerer en udeladelse af en orddel (ex. Patent- und Gebrauchsmusterrecht) og tankestreger. Man må derfor igen gennemgå hele teksten manuelt og foretage de nødvendige rettelser. Efter at have været nødt til at gennemgå ca. 30 indscannede tekster for fejl af ovennævnte typer så jeg mig nødsaget til at finde en anden løsning. Jeg besluttede mig derfor for at fortsætte indscanningen på en HP PSC2175 ALL-IN-ONE-printer og bruge et program udviklet specielt til OCR-genkendelse til denne proces. Det drejer sig om programmet Abbyy FineReader 7.0 Professional Edition som kan downloades gratis fra Internettet til anvendelse i en 20 dages testperiode. Som med et trylleslag var antallet af indscanningsfejl i de 43

43 efterfølgende scanninger reduceret med ca. 80%. Derfor valgte jeg at fortsætte med denne kombination af soft- og hardware under indscanningen af tekster til mit endelige korpus Afsnit, Grafer, figurer og fodnoter Der er som tidligere nævnt en række fordele ved at oprette sit korpus i.txt-format (se afsnit 2.4.1). Dog har det vist sig, at der også er en række ulemper. Som overskriften i dette afsnit antyder, har der været fire væsentlige problemfelter i forbindelse med oprettelsen af pilotkorpus i.txt-format. For det første er det for både afsnittenes, grafernes, figurernes og fodnoternes vedkommende et problem, at formateringen forsvinder ved omdannelsen af teksterne til.txt-format. Resultatet er, at det ikke længere er muligt at se, hvor tekstforfatterne har lagt deres afsnitsinddeling. Desuden forsvinder grafer og figurer. Jeg har valgt at se stort på dette, da det jo er fagtermerne, der er vigtige, og ikke eksempelvis skemaer med tal, eller hvor der er linieskift. Jeg har dog valgt at bibeholde figurernes og grafernes overskrifter, da de i mange tilfælde vil indeholde oplysninger, som er centrale for teksten. Da formateringen forsvinder fra fodnoterne, er henvisningerne ikke længere lette at opdage med det blotte øje. Det skyldes, at fodnoternes numre står med samme skrifttype og størrelse som resten af teksten og i umiddelbar forlængelse af ord. Jeg har valgt ikke at bruge resurser på at gennemgå hele pilotkorpus for at lokalisere og slette de hundredvis af fodnotehenvisninger, som optræder. Jeg mener ikke, at det i forbindelse med frekvensundersøgelserne senere vil være et problem at konstatere om der er tale om et ord med en påhægtet fodnotehenvisning. Tallet hægtet på ordet vil simpelthen blive ignoreret i frekvensundersøgelserne og ordet vil tælle med, som var tallet slet ikke til stede. Derimod har jeg fjernet selve fodnoterne, da det viste sig at være problematisk, at de optrådte midt i en tekst, eftersom.txt-formatet ikke var i stand til at lægge dem på et logisk sted. De stod simpelthen der, hvor de stod, da de blev scannet ind, dog uden nogen form for markering af, at der her var tale om fodnoter. Man kunne godt argumentere for, at fodnoterne skulle være bibeholdt i pilotkorpus, men jeg mener ikke, at informationerne i fodnoterne er essentielle for tekstsammenhængen. I langt de fleste tilfælde var der nemlig tale om henvisninger til andre værker og altså ikke tematiske henvisninger, som indeholdt fagtermer. Når nu jeg har nævnt, dette vil fremtidige brugere af korpus også være klar over, at man må ty til originalteksterne for at se fodnoterne. 44

44 3.1.3 Gammel og ny retstavning En anden problemtype, som dukkede op under sammenstillingen af pilotkorpus, var, at tekster fra efter den 1. august 1999 er skrevet efter de nye tyske retskrivningsregler. Problemet har ikke været af en sådan art, at det i sig selv gav problemer mht. sammenstillingen af korpus, men snarere, at de forskellige stavemåder har konsekvenser for frekvensundersøgelserne i det endelige korpus. Jeg er dog overbevist om, at dette problem vil være forholdsvist let at lokalisere i konkordansen, og at det for de fleste ords vedkommende ikke vil få nogen betydning (eksempelvis hører hverken dass eller daß med til fagtermerne). Der kunne derimod opstå et mindre problem med ord som Patentverschluss (tidligere Patentverschluß). Men jeg tror dog stadig, at eksemplerne vil være få og lette at få øje på. For en god ordens skyld skal det lige bemærkes, at hvis termerne Patentverschluss og Patentverschluß eksempelvis optræder en gang hver i korpus, vil de i min frekvensundersøgelse blive optalt som én fagterm, der optræder to gange. Et yderligere argument for at dette problem er af overkommelig størrelse er at ß som regel optræder midt i eller i slutningen af ordet, hvilket betyder, at ord som Patentverschluss og Patentverschluß vil stå ved siden af hinanden pga. alfabetiseringsreglerne. Det gør dem lette at lokalisere Fremmedsprog I enkelte tekster indgår der citater eller gloser på andre sprog end tysk. Det drejer sig især om engelsk, fransk og latin. Jeg ser det dog ikke som noget problem, at disse fremmedsprog i forholdsvis begrænset grad er repræsenteret i korpus. Jeg skal kort ridse op, hvorfor jeg ikke ser nogen grund til at udelade disse få gloser. For det første ville det kræve en gennemlæsning af hele pilotkorpus og senere det udvidede korpus. Derudover ville en udeladelse af gloserne skabe unaturlige huller og manglende indholdsmæssig kohærens. Slutteligt ville jeg også være nødt til at overveje, hvor grænsen går mellem fremmedsprog og fremmedord. Eksempelvis er de latinske gloser med pga. manglende tyske termer for det samme (ex. lex specialis) Tematisk klassificering af tekster Også den tematiske klassificering viste sig at være en større udfordring end først antaget. Ikke fordi den udarbejdede temaopdeling (se afsnit 2.3.2) var stratificeret i for høj eller for ringe grad, men snarere fordi stort set alle tekster inden for hovedtemaet berører flere temaer. Og det er ikke kun et spørgsmål, om at teksterne berører flere tematiske områder inden for det fastlagte hovedtema på en gang, men også at teksterne berører tematiske områder uden for 45

45 hovedtemaet. Dette er der i sig selv ikke noget overraskende i (jvf. Fig. 4, s. 13), men det har alligevel vist sig at være mere problematisk end som så, da meget nærliggende juridiske områder uden for det fastlagte hovedtema i høj grad optræder i teksterne. Det drejer sig her typisk om temaet Marken, som ofte også indgår i tekster, der omhandler Patent- und Gebrauchsmuster. Jeg har dog valgt at lade disse blandede tekster forblive i korpus, da det er en naturlig del af det tematiske område. En fravælgelse af sådanne tekster ville nemlig også have en fravælgelse af ex. tekster med teknisk fagterminologi som konsekvens, og i sidste ende ville det betyde, at der ikke var en eneste tekst tilbage i korpus. De tematisk rene tekster er nemlig et særsyn. Jeg har lagt tekster indeholdende blandede temaer ind under det subtema de repræsenterede inden for Patent- und Gebrauchsmusterrecht og dermed set bort fra andre temaer. Men ikke kun tekster, som går ud over hovedtemaets grænser, viste sig at være vanskelige at klassificere. Der er også et utal af tekster, som repræsenterer flere forskellige subtemaer inden for hovedtemaet. Her er især tale om lærebogstekster, lovtekster osv. I stedet for at splitte disse tekster op og komme tekstdele ind under det rette teksttema har jeg valgt at holde teksterne uden for pilotkorpus i den forstand, at de ikke er talt med i de 60 tekster, som pilotkorpus oprindeligt var tiltænkt at være på (se afsnit 2.3.8). Det er der flere årsager til: For det første ville det ikke være hensigtsmæssigt at opdele tekster, som udgør en helhed på samme måde som eksempelvis domme, og for det andet ville det betyde, at andre typer undersøgelser i korpus kunne kompliceres væsentligt. Dette ville være tilfældet, hvis målet for disse andre undersøgelser var netop at undersøge lovene elle lærebogsteksterne, og disse var spredt ud over korpus i tekstbidder. Dertil kommer, at love er delt ind i korte paragraffer, hvor enkelte paragraffer behandler et enkelt tema. Det ville være meget svært at lave statistiske undersøgelser på tekststykker mht. antallet af fagtermer med en længde på helt ned til 103 ord som det er tilfældet med 15 i Patentgesetz ( der som den eneste paragraf i loven falder ind under subtemaet Patente und Gebrauchsmuster im Rechtsverkehr Valg af konkordansprogram For at kunne fremstille en overskuelig liste over alle ord i tekstkorpus er det nødvendigt at anvende et konkordansprogram. Det ikke et problem at anskaffe sig sådanne programmer, da de generelt ikke er dyre; mange af programmerne ligger faktisk som freeware på Internettet. Det skyldes, at det ofte er entusiaster og ikke store kommercielle softwarefirmaer, som udvikler programmerne. De to stærkeste og mest avancerede programmer på markedet er efter min mening Concordance ( og WordSmith 46

46 ( For at tage det sidste først virker WordSmith dog ved første øjekast lidt forældet layoutmæssigt, og det kræver en forholdsvis stor indsats at sætte sig ind i programmets funktioner. En af de klare fordele ved programmet er dog, at store tekstmænger ikke er noget problem for programmet at håndtere. En af de største ulemper ved programmet i den forbindelse, programmet skal anvendes her, er, at ordlisten ikke optræder på samme skærmbillede som konkordansen. Det er til stor gene, når programmet, som det er tilfældet her skal anvendes til at udvælge fagtermer. Det kan ofte være svært at vurdere, om et ord er en term eller ej, hvis ikke konkordansen er ved hånden. Derfor har jeg besluttet at benytte mig af Concordance, som har en mere brugervenlig grænseflade end WordSmith. Der er langt bedre mulighed for at se kontekst og ordliste på samme skærmbillede. Ulempen ved Concordance er, at programmet er lang tid om at bearbejde store tekstmængder programmet var hele 5 minutter om at fremstille konkordansen for det aktuelle endelige korpus på en almindelig hjemmecomputer. Er konkordansen dog lavet én gang, gemmes den automatisk og kan efterfølgende åbnes igen på 1-2 minutter. Er konkordansen først lavet tager det kun få sekunder at sortere ordlisten f.eks. alfabetisk eller efter frekvens. 3.2 Sammenstilling af pilotkorpus Ud fra de kriterier, der blev fastsat i Kapitel 2 og dermed med udgangspunkt i bilag 4, udgøres pilotkorpus af tekster i det forhold, som illustreres i tabel 3. Her ses de subtemaer, som skal er repræsenteret i korpus, samt med hvilken procentsats de skal være repræsenteret. Sammenholder man disse procentsatser med de 60 tekster, som er ønsket tilstræbt i pilotkorpus, fremkommer antallet af tekster (i afrundede tal). Derudover oplyses også, hvilke tekster i pilotkorpus der udgør hvilke subtemaer. Som nævnt i afsnit indgår også en række mere generelle tekster i tekstkorpus, som ikke er indregnet i stratificeringen af de 60 tekster. Disse tekster er dog alligevel inddraget i pilotkorpus (og tæller således ud over de 60, så det endelige antal tekster er 70), fordi de også udgør en del af helmængden. Havde jeg valgt at udelade disse tekster af pilotkorpus, ville det ikke afspejle den dimension disse tekster udgør. 47

47 Tema Antal Tekstnumre i korpus tekster Deutsches Patent- und Gebrauchsmusterrecht 7, 20, 22, 24, 25, 27, 31, Schutzgegenstand und Schutzvoraussetzungen (10%) 6 5, 11, 12, 15, 17, 26, 71, 75, Der Anmeldungsberechtigte (4%) 2 4, 33, 72, Die Entstehung des Patents und Gebrauchmusters (6%) 4 34, 35, 40, 41, 74, 79, 4. Inhalt und Grenzen des Patent- und Gebrauchsmusterrechts (9%) 5 3, 14, 28, 36, 37, 80, 86, Patente und Gebrauchmuster im Rechtsverkehr (5%) 3 2, 48, 49, 84, Das Ende des Patent- und Gebrauchsmusterschutzes (6%) 4 1, 8, 29, 51, 91, Rechtsverletzungen (11%) 7 9, 23, 52, 53, 54, 55, 56, 81, 85, Organisatorische und Verfahrensrechtliche Bestimungen (8%) 5 10, 13, 18, 19, 21, 83 Das Europäische Patentübereinkommen 30, Patentanmeldeverfahren (11%) 6 38, 57, 67, 68, 69, Patenterteilungsverfahren (18%) 11 39, 47, 58, 59, 60, 61, 62, 63, 64, 65, 66, 93, Organisation und Verfahrensrecht des EPÜ (12%) 7 6, 16, 42, 43, 44, 45, 46, 76, 77, 78, 82 Tabel Symmetrisk fordeling af antal fagtermer pr. tekst? Som forklaret i afsnit må man igennem en længere proces for at beregne standardafvigelsen på gennemsnittet, altså ensartetheden i forhold til antallet af fagtermer pr. tekst i pilotkorpus. I stedet for at tælle antallet af fagtermer i hele pilotkorpus har jeg valgt at tælle antallet i de første 200 ord af hver enkelt tekst. Det skyldes, at tekstlængden varierer, endda til tider meget, fra tekst til tekst, og at man ved en optælling af samtlige fagtermer i korpus ville skulle igennem en række udregninger for at gøre resultaterne sammenlignelige. I bilag 5 ses resultatet af denne optælling. Figur 9 viser, hvor mange tekster i pilotkorpus der indeholder det samme antal fagtermer, og hvor mange fagtermer det drejer sig om. Samtidig er det gennemsnitlige antal fagtermer pr. tekst (9,7) grafisk afbilledet i figuren. Hele Douglas Bibers teori på repræsentativitetsområdet er baseret på, at teksterne er normalfordelt omkring gennemsnittet. Det vil sige, at der i figur X burde være en symmetrisk fordeling af tekster omkring markeringen af gennemsnittet. Det står klart for enhver, at fordelingen i figur X ikke er 100% symmetrisk, og det kan der være flere årsager til. 48

48 For det første er optællingen af termer baseret på de første 200 ord pr. tekst. Det kan have haft indvirkning på resultatet, da eksempelvis domme begynder med nogle helt faste vendinger, som ikke kan kategoriseres som termer inden for den undersøgte helmængde. En løsning her kunne eksempelvis have været at have undersøgt ord i stedet for de første 200 ord pr. tekst, men så ville et nyt problem være opstået. Der er nemlig i korpus eksempler på tekster som ikke er meget længere end 200 ord, og skulle man så her have lavet en undtagelse og taget de første 200 ord? Jeg valgte at være konsekvent og tage de første 200 ord i samtlige 70 tekster. Den ikke helt symmetriske afbildning kan også være et resultat af, at ikke alle fagtermer er talt op i teksterne med en efterfølgende justering mht. tekstlængde. Det er dog et enormt og resursekrævende arbejde at tælle fagtermer i hele pilotkorpus som i alt består af ord, så denne løsning kunne heller ikke komme i betragtning. Årsagen kunne også være, at jeg har valgt kun at koncentrere mig om ét lingvistisk træk. Havde jeg som Douglas Biber valgt at undersøge 10 lingvistiske træk, havde billedet muligvis set anderledes ud. Til sidst skal lige nævnes, at en helt fjerde årsag til den manglende symmetri kunne være, at pilotkorpus simpelthen ikke er stort nok med 70 tekster. Selvom pilotkorpus udgør ca. 1/3 af det tilstræbte endelige korpus (se afsnit 2.2), er der alligevel langt fra størrelsen på de fagsproglige korpora til størrelsen på de almensproglige korpora. Eksempler på disse er det tyske Mannheimer Korpus I på 2,2 mio. ord i løbende tekst ( og det engelske The British National Corpus på 49

49 mere end 100 mio. ord i løbende tekst ( I forbindelse med sammenstillingen af et almensprogligt korpus ville pilotkorpus være langt større end 70 tekster, som det er tilfældet her, og dermed ville chancerne for en normalfordeling også forøges betragteligt Standardafvigelsen på gennemsnittet i pilotkorpus Indsætter man tallene for pilotkorpus i formlen for beregning af standardafvigelsen for gennemsnittet (se afsnit 2.3.9), når man frem til det resultat, at standardafvigelsen på gennemsnittet for de første 200 ord/tekst i dette pilotkorpus er 5,92. Dvs. at antallet af fagtermer pr. 200 ord pr. tekst i gennemsnit ligger 5,92 fagtermer fra gennemsnittet (det gennemsnitlige antal fagtermer pr. første 200 ord i teksterne er 9,7). Som nævnt i afsnit fastslår den empiriske regel, at ca. 68% af observationerne skal ligge inden for max. 1 standardafvigelse fra gennemsnittet og 95% af observationerne skal ligge inden for max. 2 standardafvigelser fra gennemsnittet (Aczel/Sounderpandian 2002:40). Som det fremgår af bilag 5 er der 51 tekster (72,9%) der ligger ±1 standardafvigelse fra gennemsnittet (5,92 fagtermer). 66 tekster (94,3%) ligger ±2 standardafvigelser fra gennemsnittet (11,84 fagtermer). Alt i alt må man sige, at dette er et meget glædeligt resultat, som beviser, at pilotkorpus passer fint ind i den empiriske regel mht. fordelingen af observationerne. Selvom det kun er 94,3% procent af teksterne og ikke min. 95% af teksterne som ligger inden for max. to standardafvigelser fra gennemsnittet, er her jo tale om, at kun 0,7% af de 70 tekster i korpus ikke overholder reglen. Omregnet svarer det til at ca. ½ tekst falder uden for den empiriske regel, og det må siges at være ganske pænt Den endelige korpusstørrelse I princippet betyder beregningerne i foregående afsnit, at størrelsen på pilotkorpus rent faktisk også kunne udgøre størrelsen på det endelige korpus. Jeg har dog valgt at øge chancerne for en endnu større grad af normalfordeling ved at forøge størrelsen på det endelige korpus med 50% i forhold til pilotkorpus. Jeg har taget udgangspunkt i at forøge de 60 tekster, der var udgangspunktet under sammenstillingen af korpus, og stadig holde de generelle tekster ude fra stratificeringen. På den måde er det endelige korpus altså blevet på (+10) tekster (de 60 oprindelige tekster, de 30 nye tekster samt de 10 generelle tekster), altså 100 tekster i alt. 50

50 Gennem samtaler med statistiker Anders Frederiksen er jeg nået frem til, at den benyttede stratificering forekommer ganske fornuftig, hvorfor jeg er fortsat ad den vej i arbejdet med sammenstillingen af det endelige korpus. Tabel 4 viser fordelingen af tekster på de respektive subtemaer i det endelige korpus. Det endelige korpus kan findes på den vedlagte CD-rom. Tema Antal Tekstnumre i korpus tekster Deutsches Patent- und Gebrauchsmusterrecht 7, 20, 22, 24, 25, 27, 31, Schutzgegenstand und Schutzvoraussetzungen (10%) 9 5, 11, 12, 15, 17, 26, 74, 80, Der Anmeldungsberechtigte (4%) 4 4, 33, 72, Die Entstehung des Patents und Gebrauchmusters (6%) 6 34, 35, 40, 41, 83, Inhalt und Grenzen des Patent- und Gebrauchsmusterrechts (9%) 8 3, 14, 28, 36, 37, 75, 85, Patente und Gebrauchmuster im Rechtsverkehr (5%) 6 2, 48, 49, 84, 95, Das Ende des Patent- und Gebrauchsmusterschutzes (6%) 6 1, 8, 29, 51, 91, Rechtsverletzungen (11%) 10 9, 23, 52, 53, 54, 55, 56, 79, 81, Organisatorische und Verfahrensrechtliche Bestimungen (8%) 7 10, 13, 18, 19, 21, 90, 97 Das Europäische Patentübereinkommen 30, Patentanmeldeverfahren (11%) 10 38, 57, 67, 68, 69, 70, 71, 94, 98, Patenterteilungsverfahren (18%) 13 39, 47, 58, 59, 60, 61, 62, 63, 64, 65, 66, 89, Organisation und Verfahrensrecht des EPÜ (12%) 11 6, 16, 42, 43, 44, 45, 46, 76, 77, 78, 82 Tabel Termudvælgelse og vurdering af resultat Det endelige korpus er ikke sammenstillet med det formål at kunne anvendes til undersøgelser af semantisk og pragmatisk art, men derimod til at kunne opfylde et mere traditionelt formål, nemlig en fagleksikografisk undersøgelse (Lundquist 1992:8). Målet er udvælgelsen af fagsproglige lemmata, og i den forbindelse er det vigtigt netop at fastlægge, hvilke krav der stilles til disse lemmata. Først og fremmest vil jeg lige slå fast, at lemmaselektionen er baseret på de i kriterier for, hvad fagsprog og en fagterm er, som det er beskrevet i afsnit og De udvalgte lemmata er alle enkeltordstermer. Flerordstermer og kollokationer er udeladt, da det ville være et studium i sig selv at skabe et teoretisk grundlag for, hvad disse egentlig er. 51

51 Ud fra konkordansen af det endelige korpus har jeg valgt at opstille en frekvensliste, hvor de hyppigst forekomne ord står øverst på listen. Grunden til, at frekvenslisten er oplistet på denne måde, er, at man således også får de hyppigst forekomne fagtermer først, hvilket er til hjælp for det videre leksikografiske arbejde. Hyppigheden er nemlig et af de kriterier, som benyttes i (fag)leksikografisk arbejde til udvælgelgelse af lemmata fra (fagsproglige) korpora. Konkordansen viser i alt forskellige forekomne ord, også kaldet types, og et samlet antal ord som ligger på , de såkaldte tokens. Disse tal skal dog tages med et gran salt, da enkeltstående tegn (ex., eller die) og tal også tælles som ord. Nu har man altså en lang ordliste og den egentlige termudvælgelse kan begynde. Ikke overraskende er kendeord og præpositioner de hyppigst forekomne ord, som optræder helt op til ca gange, men allerede meget langt oppe på ordlisten forekommer de første fagtermer (Anmeldung, som optræder 883 gange i sin grundform, og PatG som optræder 869 gange) Praktiske valg i forbindelse med udvælgelsen af fagtermer fra korpus Den endelige termliste (se vedlagte CD-rom for alfabetisk termliste samt termliste opstillet efter frekvens) er sammenstillet på en sådan måde, at alle termer optræder i deres grundform. Det vil sige, at samtlige former af en term, eksempelvis Anmelder, Anmelders og Anmeldern alle er talt med i fagtermen Anmelder, som således i alt optræder 543 gange. Dertil kommer, at også former efterfulgt af ex. en fodnotehenvisning eller et spørgsmålstegn er talt med. Det samme gælder ord, som optræder i former efter både ny og gammel retstavning. Termer, som ikke umiddelbart forekommer at være fagtermer, er ikke inddraget i termlisten. Det skyldes, at disse ord (det drejer sig i høj grad om verber og adjektiver) ofte kun er fagtermer i sammenhæng med andre ord i teksten, hvilket betyder, at de i så fald er en del af en flerordsterm eller kollokation. Da dette ikke er en del af undersøgelsesområdet, er disse halve fagtermer ikke inddraget i termlisten. Et eksempel på dette er adjektivet erfinderisch, som jeg ikke opfatter som fagterm i sig selv. Ordet optræder dog 161 gange i sammenhængen erfinderische Tätigkeit (alle former medregnet), hvorved man i mine øjne pludselig har at gøre med en fagterm. Skulle kollokationerne og flerordstermerne inddrages, ville det kræve, at området kollokationer og flerordstermer blev undersøgt til bunds på såvel praktisk som teoretisk niveau. Denne proces mener jeg ligger et skridt længere fremme i processen i arbejdet med ordbogen end det område, jeg her beskæftiger mig med. 52

52 Et sidste praktisk valg i forbindelse med sammenstillingen af den endelige termliste har været, at de udvalgte fagtermer er understøttet af mindst 3 belæg. Nok har jeg i afsnit 2 citeret Gellerstram for, at sammensætninger først bør medtages, når de understøttes af mindst 2 belæg (Gellerstram 1996:45), men jeg har valgt at øge antallet af belæg til mindst 3. Det skyldes, at jeg ved udvælgelsen af fagtermer fra korpus indså, at en stor del af termerne, som kun er understøttet af et eller to belæg, forekom mig at kunne være ad hoc-termer, ofte lange komposita, som i øvrigt også som regel, når der var tale om to belæg, optrådte i samme tekst. Eksempler på de termer, som mistænkes for at være ad hoc-termer, kunne være Ausführbarkeitserfordernis, PCT-Gebührenverzeichnis og Produzentenleistungsschutzrecht Vurdering af termliste Det første som springer i øjnene, når man skimmer den endelige termliste, både frekvenslisten og den alfabetiske liste over enkeltordstermer (se vedlagte CD-rom), er, at det altovervejende antal termer er substantiver. Ud af de i alt 416 enkeltordstermer fundet i korpus er der blot fundet 14 verber og 12 adjektiver. Forklaringen er nok i høj grad den, at verberne og adjektiverne som nævnt i afsnit som regel optræder i sammenhæng med et eller flere substantiver, hvorfor det i denne undersøgelse af enkeltordstermer ikke er blevet klart, om eksempelvis verberne reelt er fagtermer i den sammenhæng, de optræder i. Jeg er overbevist om, at man ved en undersøgelse af flerordstermer og kollokationer ville nå op på en langt større repræsentation af ord fra andre ordklasser end substantiverne. En anden forklaring kunne muligvis være, at der her er tale om et forholdsvis snævert emneområde, som i høj grad benytter sig af for eksempel verber fra et mere generelt juridisk temaområde. Man kan måske bedre udtrykke det ved, at patent- og brugsmønsterretten låner for eksempel verber fra det mere generelle hovedtema civilret. Man må derfor konkludere, at man, når man undersøger tekstkorpus på den måde, jeg har valgt vil finde frem til substantiverne og i langt ringere grad til andre ordklasser. Det siger dog intet om, hvor anvendeligt korpus er som helhed, og jeg er overbevist om, at man ved langt mere omfattende undersøgelser i korpus også ville få disse andre ordklasser med i sin termliste. Koncentrerer man sig om substantiverne i termlisten alene, vil jeg mene, at termlisten er rigtig god indikator for, hvilke termer fra netop denne ordklasse som er repræsenteret i helmængden, og at den bestemt er meget anvendelig i arbejdet med de patent- og brugsmønsterretlige substantivers repræsentation i ordbogen. 53

53 3.4 Styrker og svagheder ved fagsproglige korpora i arbejdet med lemmaselektion Styrkerne ved anvendelsen af fagsproglige korpora til lemmaselektion er mange. Har man et fornuftigt sammenstillet korpus med en tilstrækkelig høj grad af repræsentativitet, har man en god basis for en brugbar termudvælgelse baseret på empiri. Når det fagsproglige korpus først er sammenstillet, er det en enorm kilde til fagterminologiske undersøgelser af enhver art, og er det sammenstillet på et tilpas højt fagsprogligt niveau, er mængden af fagtermer enorm i forhold til korpusstørrelsen. Samtidig kan man være ret sikker på, at langt de fleste fagtermer er reelle fagtermer, som også anvendes af diskursfællesskabet inden for det undersøgte fagområde. Ulemperne ved anvendelsen af fagsproglige korpora sammenstillet med samme hensigt som i dette speciale er, at det er et omstændeligt arbejde at sammenstille et fagsprogligt korpus, og det kræver en velstruktureret tilgang til arbejdet, hvis man vil udnytte sine resurser optimalt. Større fagsproglige korpora ville efter min mening kræve et samarbejde mellem flere personer, hvis arbejdet skal færdiggøres inden for rimelig tid. Man kan så diskutere, om det ikke ville være mindst lige så omstændeligt at have en subjektiv og introspektiv tilgang til ordbogsarbejdet. Som lægmand inden for fagområdet er man prisgivet, hvis man ikke kan hente hjælp hos fagfolk. Også de statistiske beregningsmodeller har for mit vedkommende krævet en hjælpende hånd. Det kan blive en bekostelig affære med decideret konsulenthjælp, hvis der er tale om større korpora. 3.5 Fremtidens lemmaselektion Jeg er af den opfattelse, at korpora er vejen frem i udvælgelsen af fagtermer til fagordbøger. Den statistiske tilgang og dermed den empiriske tilgang til korpussammenstillingen sikrer en langt større grad af repræsentativitet i korpus, end den introspektive tilgang nogensinde vil kunne gøre det. Fagleksikograferne må i langt højere grad en nu rådføre sig med dem, der befinder sig inden for et givent fagligt diskursfællesskab. Kun ved at benytte sig af diskursfællesskabernes kompetencer kan man sikre, at tilgangen til fagområdet og stratificeringen af dette er af høj kvalitet. Det vil naturligvis ofte føre til øgede udgifter i forbindelse med korpusarbejdet, men 54

54 resultatet vil til enhver tid være af højere kvalitet, end hvis det kun er lægfolk, som er involveret i arbejdet. Udvikling af software til at lette processerne i arbejdet ville også være en fordel. Jeg tror ikke, man nogensinde vil kunne nå frem til ikke at skulle træffe et eneste pragmatisk valg i sammenstillingsprocessen, men man kan måske undgå at skulle træffe så mange. Eksempler på sådant software kunne være bedre OCR-programmer og scannere til en rimelig pris eller programmer udviklet til specielt at kunne udregne f.eks. standardafvigelsen på gennemsnittet for et korpus. Jeg mener naturligvis dermed ikke, at programmerne vil kunne være i stand til selv at kunne genkende de lingvistiske træk, som skal undersøges, men de nævnte elektroniske beregningsmodeller vil helt sikkert kunne lette arbejdet betydeligt. Et tredje eksempel på et elektronisk hjælpemiddel kunne være konkordansprogrammer som er i stand til at skelne mellem tegn, tal og bogstaver på en sådan måde, at man kan udelade de faktorer, som ikke ønskes inddraget i konkordansen. Et sidste, men bestemt ikke mindre væsentligt fremskridt i arbejdet med fagsproglige korpora som basis for lemmaselektion i fagordbøger ville være en større grad af koordinering mht. materiale om sammenstillingen af fagsproglige korpora. Her tænker jeg specielt på, hvor megen nytte man ville kunne drage af en database med oplysninger om, hvilke erfaringer fagleksikograferne har gjort sig under arbejdet med et givent fagsprogligt korpus. Fordelene ville være mange, for det er på nuværende tidspunkt en stor opgave at få et overblik over, hvilke metoder og valg der har vist sig at være givtige, og hvilke metoder og valg der har vist sig at være en blind vej. En sådan koordinering kunne finde sted i en central elektronisk database indeholdende informationer om fagfora, tilgængelig software og erfaringer med sammenstillingen af fagsproglige korpora. Det ville kunne spare såvel tid som kræfter. En sådan database ville kunne give et godt overblik over arbejdet med tekstkorpora i fagleksikografiske studier samt være en samlet inspirationskilde for dem, der i fremtiden opretter fagsproglige korpora. 55

55 4 Konklusion I dette speciale har det vist sig, at det er muligt at oprette et fagsprogligt korpus, nærmere bestemt et patent- og brugsmønsterretligt korpus, ud fra den opskrift, som Douglas Biber har udviklet til oprettelsen af almensproglige korpora. Det skyldes, at en stor del af overvejelserne, der ligger bag oprettelsen af såvel almensproglige og som fagsproglige korpora, er de samme. Dertil kommer, at det er muligt at erstatte de faktorer i Bibers opskrift, som kun er mulige i forbindelse med almensproget, med lignende faktorer inden for fagsproget. Med nogen tilpasning af opskriften, de såkaldte pragmatiske løsninger, kan den således også anvendes inden for fagsproglige områder. Resultatet er blevet et repræsentativt fagsprogligt korpus, som udmærket kan anvendes til en empirisk udvælgelse af fagtermer til Gubbas Juridisk Ordbog tysk-dansk. Dog kræver det mere tilbundsgående undersøgelser af konkordansen for korpus, end det her har været muligt at lave for at få alle fagtermer med. Arbejdet med oprettelsen af det endelige korpus har været større end først antaget, men på trods af det mener jeg, at resultatet er blevet et korpus, som ud over termudvælgelse også kan bruges til en lang række andre formål. Først og fremmest er korpus velegnet til ordbogsarbejde, bl.a. til undersøgelser af kollokationer og flerordstermer inden for fagområdet. Andre vil kunne undersøge sprogbrugen i domme inden for fagområdet patent- og brugsmønsterret eller bruge korpus til hjælp i oversættelsesopgaver for blot at nævne nogle eksempler. Der er dog stadig lang vej, før det bliver en let opgave at sammenstille et fagsprogligt korpus, og en forbedring af eksisterende og udvikling af nye elektroniske hjælpemidler ville være kærkomne tiltag. Også udviklingen af en opskrift specielt møntet på oprettelsen af fagsproglige tekstkorpora, eventuelt i stil med Bibers opskrift, ville være til stor hjælp. 56

56 5 Litteratur 5.1 Bøger Aczel, Amir D./Sounderpandian, Jayavel (2002). Complete Business Statistics. New York: McGraw-Hill Companies. Bergenholtz, Henning/Tarp, Sven (1994). Manual i fagleksikografi. Udarbejdelse af fagordbøger Problemer og løsningsforslag. Herning: Systime. Chomsky, Noam (1957). Syntactic Structures. Den Hagh: Mouton. Chrocziel, Peter (2002). Einführung in den Gewerblichen Rechtsschutz und das Urheberrecht. München: Beck. DIN Deutsches Institut für Normung (1978). Dezimalklassifikation. Internationale mittlere Ausgabe. Berlin: Beuth Verlag GmbH. Ditlevsen, Marianne G./ Engberg, Jan/Kastberg, Peter/Nielsen, Martin (2002). Sprog på arbejde kommunikation i faglige tekster. Udleveret af Jan Engberg og Peter Kastberg, Handelshøjskolen i Århus, i november von Eyben, W. E. (1989). Juridisk Grundbog 3 Dommen Sproget. København: Jurist- og Økonomforlagets Forlag. Gubba, Wilhelm (1995). Juridisk ordbog tysk-dansk. København: G. E. C Gads Forlag. Hubmann, Heinrich/Götting, Horst-Peter (2002). Gewerblicher Rechtsschutz. München: C. H. Beck ohg. Hvidtfelt Nielsen, Karsten/Pors, Harald (1981). Index zur Lyrik Paul Celans. München. 57

57 Hårbøl, Karl/Schack, Jørgen/Spang-Hanssen, Henning/Bang, Jørgen (2002). Dansk Fremmedordbog. Gyldendal. Ilshöfer, Volker (1996). Patent-, Marken- und Urheberrecht. München: Verlag Franz Vahlen. Oakes, Michael P. (1998). Statistics for Corpus linguistics. Edinburgh: Edinburgh University Press. McEnery, Tony/Wilson, Andrew (2001). Corpus Linguistics. An Introduction. Edinburgh: Edinburgh University Press. Tognini-Bonelli, Elena (2001). Corpus Linguistics at Work. Amsterdam: John Benjamins Publishing Co. Vogt, Paul (1999). Dictionary of Statistics & Methodology a Nontechnical Guide for the Social Sciences. London: Sage Publications Inc. 5.2 Artikler Bergenholtz, Henning (1996). Korpusbaseret leksikografi. LexicoNordica3. pp Bergenholtz, Henning/Pedersen, Jette (1994). Zusammensetzung von Textkorpora für die Fachlexikographie. In B. Schaeder/H. Bergenholtz (ed.). Fachlexikographie. Fachwissen und seine Repräsentation in Wörterbüchern. Tübingen: Gunter Narr Verlag Tübingen. Bergenholtz/Tarp (1994). Mehrworttermini und Kollokationen in achwörterbüchern. In B. Schaeder/H. Bergenholtz (ed.). Fachlexikographie. Fachwissen und seine Repräsentation in Wörterbüchern. Tübingen: Gunter Narr Verlag Tübingen. Bergenholtz, Henning/Engberg, Jan (1995). Tendenser inden for den nyere fagsprogsforskning i Danmark. Hermes 15, pp Biber, Douglas (1993). Representativeness in Corpus Design. Literary and Linguistic Computing. Vol. 8, Nr. 4, pp

58 Dalby, David (1971). Language of the Hunt. In Schwenk/Tilander/Willemsen (ed.). Et multum et multa. Beiträge zur Literatur, Geschichte und Kultur der Jagd. Berlin: Walter de Gruyter. Dyrberg, Gunhild/Faber, Dorrit/Hansen, Steffen Leo/Tournay, Joan (1988). Etablering af et juridisk tekstkorpus. Hermes 1, pp Gellerstram, Martin (1996). Rätt och fel I korpusen. LexicoNordica 3, pp de Haan, Pieter (1992). The optimum corpus sample size?. In Gerhard Leitner (ed.). New Directions in English Language Corpora Methodology, Results, Software Developments. New York: Mouton de Gruyter. Holmboe, Henrik (1996). Genbrug af korpora. LexicoNordica 3, pp Jacobsen, Tove (1996). Oversettelseskorpora og tospråklige ordbøker. LexicoNordica 3. pp Lawson, Veronica (1983). The Language of Patents. Lebende Sprachen Nr.2. pp Lauridsen, Ole/Riiber, Theis/Søndergaard, Henning (1991). Erstellung eines dänischen und eines deutschen Textkorpus Fachsprache der Gentechnik. Hermes 6, pp Lauridsen, Ole/Andersen, Ingrid Skytte (1993). Rapport over oprettelsen af et dansk og et tysk maskinlæsbart tekstkorpus inden for området genteknik Ark 66, pp Lundquist, Lita (1992). Korpuslingvistik i fagsprogsforskningen projekter, problemer, perspektiver. In Gert Engel (ed.). Proceedings af seminar om korpuslingvistik i fagsprogsforskningen. Maidahl, Lisbet (1992). Brugen af fagordbøger En empirisk undersøgelse. Ark 65. pp Norling-Christensen, Ole (1996). Klassifikation af korpustekster, og kvantitative mål for sammensætningen af et almensprogligt korpus. LexicoNordica 3, pp

59 Rasmussen, Kirsten Wølch (1990). De aftaleretlige korpora principper, pragmatiske løsninger og praksis. Hermes 4, pp Simonæs, Ingrid (1996). Gubba, Wilhelm: Juridisk ordbog tysk-dansk. G.E.C. Gads Forlag. København LexicoNordica 3, pp Skyum-Nielsen, Peder/Jacobsen, Arnt Lykke (1992). En oversættelsesmodel. Ark 65, pp Teubert, Wolfgang (1999). Korpuslinguistik und Lexikographie. Deutsche Sprache 4. pp Vikner, Carl (1991). Problems in the use of text corpora in linguistic research. In Niels Davidsen-Nielsen (ed.). LSP: Nine Studies on Language for Special Purposes. København: Handelshøjskolens Forlag. 5.3 Internetsider Fachkorpus Jura Senest opdateret 2001 Index to Foreign Legal Periodicals Senest opdateret 1. september 2003 Corpus Encoding Standard for XML Senest opdateret 3. maj 2002 Patentgesetz in Deutschland Senest opdateret 20. juni 2004 Korpora geschriebener Gegenwartssprache Sidst opdateret 15. juni

60 British National Corpus Sidst opdateret 17. december Andet Maidahl, Lisbet (1991) 18 informantprotokoller fra Lisbet Maidahls brugerundersøgelse af brugen af fagordbøger fra Udlånt af Lisbet Maidahl, januar

61 6 Bilag Bilag 1 Emneinddeling for temaerne Patent- und Gebrauchsmusterrecht og Das Europäische Patentübereinkommen Patent- und Gebrauchsmusterrecht 1) Schutzgegenstand und Schutzvoraussetzungen a) Die Erfindung b) Die Patentfähigkeit c) Die Gebrauchsmusterfähigkeit d) Ausnahmen von der Patent- und Gebrauchsmusterfähigkeit 2) Der Anmeldungsberechtigte a) Der Erfinder b) Die Erfindermehrheit c) Der Arbeitnehmer als Erfinder 3) Die Entstehung des Patents und Gebrauchsmusters a) Das Erfinderrecht b) Die Patentanmeldung c) Prioritätsrecht d) Die Patenterteilung e) Die Gebrauchsmusteranmeldung und - eintragung 4) Inhalt und Grenzen des Patent- und Gebrauchsmusterrechts a) Die Benutzerbefugnisse b) Die Benutzungsbefugnisse c) Der Schutzumfang des Patent- und Gebrauchsmusterrechts d) Die Beschränkungen der Technischen Schutzrechte 5) Patente und Gebrauchsmuster im Rechtsverkehr a) Vererbung und Verfügungen 6) Das Ende des Patent- und Gebrauchmusterschutzes a) Das Erlöschen b) Wiederruf, Nichtigerklärung und Löschen 7) Rechtsverletzungen a) Zivilrechtliche Folgen b) Strafrechtliche Folgen 8) Organisatorische und Verfahrensrechtliche Bestimmungen a) Die Organisation des Patentwesens b) Das Verfahren in Patent- und Gebrauchsmustersachen Das Europäische Patentübereinkommen 9) Patentanmeldeverfahren a) Anmeldung und Zugangswege b) Recherche c) Erstpublikation 10) Patenterteilungsverfahren a) Prüfung b) Erteilung c) Einspruch d) Beschwerde e) nationale Verifizierung 11) Organisation und Verfahrensrecht des EP 62

62 Bilag 2 Liste over rådspurgte advokater 1. Christian Cremer Cremer & Cremer Ulmer Str. 9 D Deisenhausen Patent-Cremer@t-online.de 2. Kilian Dittmann Canzler & Bergmeier Friedrich-Ebert-Str. 84 D Ingolstadt bergpatent@t-online.de 3. Michael A. Dahmen Keil & Schaafhausen Cronstettenstraße 66 D Frankfurt am Main mail@kspatent.de 4. Matthias Hofmann Rau, Schneck & Hübner Königstraße 2 D Nürnberg info@rsh-patent.de 5. Klaus Delfs Rothenbaumchaussee 58 D Hamburg delfs@glawe.de 6. Matthias Graf Lambsdorff Lambsdorff & Lange Dingolfinger Straße 6 D München kanzlei@lambsdorff-lange.de 7. Malte Köllner Köllner & Brunotte Robert-Bosch-Str. 7 D Darmstadt, Germany info@kb-patent.com 8. Peter Roos Klinger & Kollegen Bavariaring 20 D München peter.roos@klinger-iplaw.com 9. Fabian Pieper Boehmert & Boehmert Hollerallee 32 D Bremen Boehmert@foni.net 10. Gerrit Prop Gille Hrabal Struck Neidlein Prop Roos Brucknerstraße 20 D Düsseldorf prop@markpat.de 11. Bernhard Frank Rehberg Rehberg+Hüppe Postfach 3162 D Göttingen office@prh.de 12. Hanspeter Reule Patentanwälte Wolf & Lutz Lessingstrasse Baden-Baden wolflutz@aol.com 13. Peter Sommer Viktoriastrasse 28 D Mannheim, Germany sommer@sommer-patent.de 63

63 Bilag 3 Hovedtemaernes repræsentation i pilotkorpus og korpus 64

64 Bilag 4 Subtemaernes repræsentation i pilotkorpus og korpus 65

Rita Lenstrup. Kritiske bemærkninger til artikel af Henning Bergenholtz, Helle Dam og Torben Henriksen i Hermes 5 l990, side

Rita Lenstrup. Kritiske bemærkninger til artikel af Henning Bergenholtz, Helle Dam og Torben Henriksen i Hermes 5 l990, side Rita Lenstrup 109 Kritiske bemærkninger til artikel af Henning Bergenholtz, Helle Dam og Torben Henriksen i Hermes 5 l990, side 127-136. 1. Indledning I Hermes nr. 5 præsenteredes en sammenlignende vurdering

Læs mere

RESUME TRANSLATION MEMORY-SYSTEMER SOM VÆRKTØJ TIL JURIDISK OVERSÆTTELSE. KRITISK VURDERING AF ANVENDELIGHEDEN AF TRANSLATION MEMORY-SYSTEMER TIL

RESUME TRANSLATION MEMORY-SYSTEMER SOM VÆRKTØJ TIL JURIDISK OVERSÆTTELSE. KRITISK VURDERING AF ANVENDELIGHEDEN AF TRANSLATION MEMORY-SYSTEMER TIL RESUME TRANSLATION MEMORY-SYSTEMER SOM VÆRKTØJ TIL JURIDISK OVERSÆTTELSE. KRITISK VURDERING AF ANVENDELIGHEDEN AF TRANSLATION MEMORY-SYSTEMER TIL OVERSÆTTELSE AF SELSKABSRETLIG DOKUMENTATION. I den foreliggende

Læs mere

Et oplæg til dokumentation og evaluering

Et oplæg til dokumentation og evaluering Et oplæg til dokumentation og evaluering Grundlæggende teori Side 1 af 11 Teoretisk grundlag for metode og dokumentation: )...3 Indsamling af data:...4 Forskellige måder at angribe undersøgelsen på:...6

Læs mere

DIO. Faglige mål for Studieområdet DIO (Det internationale område)

DIO. Faglige mål for Studieområdet DIO (Det internationale område) DIO Det internationale område Faglige mål for Studieområdet DIO (Det internationale område) Eleven skal kunne: anvende teori og metode fra studieområdets fag analysere en problemstilling ved at kombinere

Læs mere

Artikler

Artikler 1 af 5 09/06/2017 13.54 Artikler 25 artikler. viden Generel definition: overbevisning, der gennem en eksplicit eller implicit begrundelse er sandsynliggjort sand dokumentation Generel definition: information,

Læs mere

NB: Tilmeldingen til valgfaget gælder for 5. og 6. semester

NB: Tilmeldingen til valgfaget gælder for 5. og 6. semester Sprog og jura Semester: Efteråret 2003 og foråret 2004 NB: Studerende, der har været på udlandsophold i 5. semester, tilbydes et opsamlingsforløb i sprog og jura i foråret 2004. De som ønsker at benytte

Læs mere

NB: Tilmeldingen til valgfaget gælder for 5. og 6. semester

NB: Tilmeldingen til valgfaget gælder for 5. og 6. semester Sprog og jura Semester: Efteråret 2003 og foråret 2004 NB: Studerende, der har været på udlandsophold i 5. semester, tilbydes et opsamlingsforløb i sprog og jura i foråret 2004. De som ønsker at benytte

Læs mere

Hans-Peder Kromann. Base b11: FAGSPROGSBIBLIOGRAFIEN. Sprogbiblioteket, HERMES on-line katalog, Handelshøjskolen

Hans-Peder Kromann. Base b11: FAGSPROGSBIBLIOGRAFIEN. Sprogbiblioteket, HERMES on-line katalog, Handelshøjskolen Hans-Peder Kromann 103 Base b11: FAGSPROGSBIBLIOGRAFIEN Sprogbiblioteket, HERMES on-line katalog, Handelshøjskolen i København En fyldig bibliografi er et nyttigt redskab også for fagsprogsforskere, som

Læs mere

SAMMENFATNING RESUME AF UDREDNINGEN ARBEJDSLIVSKVALITET OG MODERNE ARBEJDSLIV

SAMMENFATNING RESUME AF UDREDNINGEN ARBEJDSLIVSKVALITET OG MODERNE ARBEJDSLIV SAMMENFATNING RESUME AF UDREDNINGEN ARBEJDSLIVSKVALITET OG MODERNE ARBEJDSLIV Af Stine Jacobsen, Helle Holt, Pia Bramming og Henrik Holt Larsen RESUME AF UDREDNINGEN ARBEJDSLIVSKVALITET OG MODERNE ARBEJDSLIV

Læs mere

Forberedelse. Forberedelse. Forberedelse

Forberedelse. Forberedelse. Forberedelse Formidlingsopgave AT er i høj grad en formidlingsopgave. I mange tilfælde vil du vide mere om emnet end din lærer og din censor. Det betyder at du skal formidle den viden som du er kommet i besiddelse

Læs mere

Fremstillingsformer i historie

Fremstillingsformer i historie Fremstillingsformer i historie DET BESKRIVENDE NIVEAU Et referat er en kortfattet, neutral og loyal gengivelse af tekstens væsentligste indhold. Du skal vise, at du kan skelne væsentligt fra uvæsentligt

Læs mere

Projekt 1 Spørgeskemaanalyse af Bedst på Nettet

Projekt 1 Spørgeskemaanalyse af Bedst på Nettet Projekt 1 Spørgeskemaanalyse af Bedst på Nettet D.29/2 2012 Udarbejdet af: Katrine Ahle Warming Nielsen Jannie Jeppesen Schmøde Sara Lorenzen A) Kritik af spørgeskema Set ud fra en kritisk vinkel af spørgeskemaet

Læs mere

Indholdsfortegnelse. Fagleksikografisk speciale Janni Rasmussen & Marianne Elkjær Nielsen. Side 1 af PROBLEMFORMULERING (JANNI & MARIANNE) 3

Indholdsfortegnelse. Fagleksikografisk speciale Janni Rasmussen & Marianne Elkjær Nielsen. Side 1 af PROBLEMFORMULERING (JANNI & MARIANNE) 3 Janni Rasmussen & Marianne Elkjær Nielsen Indholdsfortegnelse 1. PROBLEMFORMULERING (JANNI & MARIANNE) 3 2. HWAM HEAT DESIGN A/S HISTORIE (JANNI & MARIANNE) 8 3. BRUGERUNDERSØGELSEN (JANNI & MARIANNE)

Læs mere

Metoder og struktur ved skriftligt arbejde i idræt.

Metoder og struktur ved skriftligt arbejde i idræt. Metoder og struktur ved skriftligt arbejde i idræt. Kort gennemgang omkring opgaver: Som udgangspunkt skal du når du skriver opgaver i idræt bygge den op med udgangspunkt i de taksonomiske niveauer. Dvs.

Læs mere

Sammenligning af fagsproglige tekstsortkonventioner - et ph.d.- arbejde

Sammenligning af fagsproglige tekstsortkonventioner - et ph.d.- arbejde Jan Engberg, HHÅ 1 Sammenligning af fagsproglige tekstsortkonventioner - et ph.d.- arbejde 21. februar forsvarede jeg ved Handelshøjskolen i Århus en ph.d.-afhandling inden for det ovennævnte emne (originaltitel:

Læs mere

Tekstproduktion: Behov og hjælpemidler:

Tekstproduktion: Behov og hjælpemidler: Tekstproduktion: Behov og hjælpemidler: Microsoft Office Word 2003 i et leksikografisk perspektiv med særligt henblik på programmets danske version og denne versions danske og spanske stave- og grammatikkontrol

Læs mere

NB: Tilmeldingen til valgfaget gælder for 5. og 6. semester

NB: Tilmeldingen til valgfaget gælder for 5. og 6. semester Sprog og jura Semester: Efteråret 2003 og foråret 2004 NB: Studerende, der har været på udlandsophold i 5. semester, tilbydes et opsamlingsforløb i sprog og jura i foråret 2004. De som ønsker at benytte

Læs mere

Formål & Mål. Ingeniør- og naturvidenskabelig. Metodelære. Kursusgang 1 Målsætning. Kursusindhold. Introduktion til Metodelære. Indhold Kursusgang 1

Formål & Mål. Ingeniør- og naturvidenskabelig. Metodelære. Kursusgang 1 Målsætning. Kursusindhold. Introduktion til Metodelære. Indhold Kursusgang 1 Ingeniør- og naturvidenskabelig metodelære Dette kursusmateriale er udviklet af: Jesper H. Larsen Institut for Produktion Aalborg Universitet Kursusholder: Lars Peter Jensen Formål & Mål Formål: At støtte

Læs mere

Brugerundersøgelse Lægemiddelkorpus

Brugerundersøgelse Lægemiddelkorpus 1 Brugerundersøgelse Lægemiddelkorpus Vi føler, at vi med Korpus-redskabet har fået et løft i forbindelse med vores oversættelsesarbejde både kvalitets- og tidsmæssigt (lægemiddelvirksomhed) Oversættelsesredskabet

Læs mere

Rasmus Rønlev, ph.d.-stipendiat og cand.mag. i retorik Institut for Medier, Erkendelse og Formidling

Rasmus Rønlev, ph.d.-stipendiat og cand.mag. i retorik Institut for Medier, Erkendelse og Formidling Rasmus Rønlev, ph.d.-stipendiat og cand.mag. i retorik Institut for Medier, Erkendelse og Formidling Rasmus Rønlev CV i uddrag 2008: Cand.mag. i retorik fra Københavns Universitet 2008-2009: Skrivekonsulent

Læs mere

Vidensbegreber vidensproduktion dokumentation, der er målrettet mod at frembringer viden

Vidensbegreber vidensproduktion dokumentation, der er målrettet mod at frembringer viden Mar 18 2011 12:42:04 - Helle Wittrup-Jensen 25 artikler. Generelle begreber dokumentation information, der indsamles og organiseres med henblik på nyttiggørelse eller bevisførelse Dokumentation af en sag,

Læs mere

Ordbog Biologi Samfundsfag Kemi: Se bilag 1 Matematik: Se bilag 2

Ordbog Biologi Samfundsfag Kemi: Se bilag 1 Matematik: Se bilag 2 Fremstillingsformer Fremstillingsformer Vurdere Konkludere Fortolke/tolke Diskutere Ordbog Biologi Samfundsfag Kemi: Se bilag 1 Matematik: Se bilag 2 Udtrykke eller Vurder: bestemme På baggrund af biologisk

Læs mere

Funktionsterminologi

Funktionsterminologi Funktionsterminologi Frank Nasser 12. april 2011 c 2008-2011. Dette dokument må kun anvendes til undervisning i klasser som abonnerer på MatBog.dk. Se yderligere betingelser for brug her. Bemærk: Dette

Læs mere

Hvad er formel logik?

Hvad er formel logik? Kapitel 1 Hvad er formel logik? Hvad er logik? I daglig tale betyder logisk tænkning den rationelt overbevisende tænkning. Og logik kan tilsvarende defineres som den rationelle tænknings videnskab. Betragt

Læs mere

Akademisk tænkning en introduktion

Akademisk tænkning en introduktion Akademisk tænkning en introduktion v. Pia Borlund Agenda: Hvad er akademisk tænkning? Skriftlig formidling og formelle krav (jf. Studieordningen) De kritiske spørgsmål Gode råd m.m. 1 Hvad er akademisk

Læs mere

Korpusbaseret lemmaselektion og opdatering

Korpusbaseret lemmaselektion og opdatering Korpusbaseret lemmaselektion og opdatering Jørg Asmussen Afdeling for Digitale Ordbøger og Tekstkorpora Det Danske Sprog- og Litteraturselskab www.dsl.dk Program 1. Introduktion til DSL 2. Introduktion

Læs mere

Spørgeskemaundersøgelsen i forbindelse med den offentlige høring

Spørgeskemaundersøgelsen i forbindelse med den offentlige høring RESUMÉ Spørgeskemaundersøgelsen i forbindelse med den offentlige høring Fra april til juli 2015 gennemførte Europa-Kommissionen en åben offentlig høring om fugledirektivet og habitatdirektivet. Høringen

Læs mere

Sprogkundskaber som ansættelsesparameter

Sprogkundskaber som ansættelsesparameter Hans-Otto Rosenbohm * 281 Sprogkundskaber som ansættelsesparameter 1. Baggrunden for undersøgelsen Den tiltagende internationalisering af erhvervslivet medfører et stadig stigende behov for sprogkyndige

Læs mere

Fransk-dansk ordbogsprojekt inden for straffeprocessen

Fransk-dansk ordbogsprojekt inden for straffeprocessen Fransk-dansk ordbogsprojekt inden for straffeprocessen Ordbogsprojektet omfatter: Teoretiske overvejelser i forbindelse med udarbejdelse af en lørnerordbog Ordbogsdel Kandidatafhandling skrevet af Jeppe

Læs mere

Akademisk Idégenrering. Astrid Høeg Tuborgh Læge og PhD-studerende, Børne og Ungdomspsykiatrisk Center, AUH

Akademisk Idégenrering. Astrid Høeg Tuborgh Læge og PhD-studerende, Børne og Ungdomspsykiatrisk Center, AUH Akademisk Idégenrering Akademisk projekt Seminar T Idégenerering Seminar U Akademisk skrivning Seminar V Akademisk feedback Præsentation Læge i børne- og ungepsykiatrien Laver aktuelt PhD om tilknytnings

Læs mere

Analyse af opholdslængde for personer på ulovligt ophold

Analyse af opholdslængde for personer på ulovligt ophold RIGSPOLITIET 2018 Arbejdspapir: Analyse af opholdslængde for personer på ulovligt ophold Empirisk estimeret udskiftningsrate 2013-2017 1 Indledning Der findes en række undersøgelser, som forsøger at estimere

Læs mere

Opfølgningsskema. Løbende opfølgning i dansk som andetsprog supplerende. Til løbende opfølgning på flere elever ad gangen TRIN

Opfølgningsskema. Løbende opfølgning i dansk som andetsprog supplerende. Til løbende opfølgning på flere elever ad gangen TRIN Hele vejen rundt om elevens sprog og ressourcer afdækning af nyankomne og øvrige tosprogede elevers kompetencer til brug i undervisningen Løbende opfølgning TRIN 3 Løbende opfølgning i dansk som andetsprog

Læs mere

Lynkursus i problemformulering

Lynkursus i problemformulering Lynkursus i problemformulering TORSTEN BØGH THOMSEN, MAG. ART. HELLE HVASS, CAND.MAG. kursus lyn OM AKADEMISK SKRIVECENTER DE TRE SØJLER Undervisning - vi afholder workshops for opgave- og specialeskrivende

Læs mere

Håndbog over strategier til før- under og efterlæsning

Håndbog over strategier til før- under og efterlæsning Håndbog over strategier til før- under og efterlæsning Af Lillian Byrialsen, læsekonsulent i Norddjurs Kommune 1 At læse for at lære Indhold Indledning Hvad gør en kompetent læser i 9. kl? Beskrivelse

Læs mere

Prosodi i ledsætninger

Prosodi i ledsætninger Eksamensopgave 2 Dansk talesprog: Prosodi og syntaks Prosodi i ledsætninger Ruben Schachtenhaufen Indledning I denne opgave vil jeg undersøge nogle forhold vedrørende prosodi og syntaks i ledsætninger

Læs mere

Tips og vejledning vedrørende den tredelte prøve i AT, Nakskov Gymnasium og HF

Tips og vejledning vedrørende den tredelte prøve i AT, Nakskov Gymnasium og HF Tips og vejledning vedrørende den tredelte prøve i AT, Nakskov Gymnasium og HF Den afsluttende prøve i AT består af tre dele, synopsen, det mundtlige elevoplæg og dialogen med eksaminator og censor. De

Læs mere

Undersøgelse af. Udarbejdet af: Side 1af 9 Studerende på Peter Sabroe

Undersøgelse af. Udarbejdet af: Side 1af 9 Studerende på Peter Sabroe Undersøgelse af Udarbejdet af: Side 1af 9 Problemformulering...3 Teoriafsnit...4 Undersøgelsen...5 Repræsentativitet...5 Interviewguiderne...5 Begreber...6 Metode...7 Konklusion...8 Litteraturliste...9

Læs mere

Opgavens argumentation

Opgavens argumentation Opgavens argumentation v/ Rikke von Müllen, pædagogisk konsulent Pædagogisk Center Samfundsvidenskab www.samf.ku.dk/pcs Fredag d. 15. okt. 2010 Kl. 12.30-14.30 Toulmins argumentationsmodel Hierarkisk argumentation

Læs mere

AARHUS UNIVERSITET AKADEMISK SKRIVECENTER - EMDRUP FORÅR 2013 LYNKURSUS I ANALYSE HELLE HVASS, CAND. MAG TORSTEN BØGH THOMSEN, MAG.ART.

AARHUS UNIVERSITET AKADEMISK SKRIVECENTER - EMDRUP FORÅR 2013 LYNKURSUS I ANALYSE HELLE HVASS, CAND. MAG TORSTEN BØGH THOMSEN, MAG.ART. FORÅR 2013 LYNKURSUS I ANALYSE HELLE HVASS, CAND. MAG TORSTEN BØGH THOMSEN, MAG.ART lyn kursus OM AKADEMISK SKRIVECENTER DE TRE SØJLER Undervisning - vi afholder workshops for opgave- og specialeskrivende

Læs mere

Større Skriftlig Opgave SSO

Større Skriftlig Opgave SSO Større Skriftlig Opgave SSO Opgavebesvarelsen har et omfang på 10-15 sider a 2400 enheder (ink. Mellemrum). Forside, indholdsfortegnelse, noter, litteraturliste, figurer, tabeller og lign materiale medregnes

Læs mere

Funktionsterminologi

Funktionsterminologi Funktionsterminologi Frank Villa 17. januar 2014 Dette dokument er en del af MatBog.dk 2008-2012. IT Teaching Tools. ISBN-13: 978-87-92775-00-9. Se yderligere betingelser for brug her. Indhold 1 Introduktion

Læs mere

Rapportens udformning Der henvises til»vejledning i udarbejdelse af projektrapport«, som udleveres særskilt.

Rapportens udformning Der henvises til»vejledning i udarbejdelse af projektrapport«, som udleveres særskilt. Til de studerende i store specialefag med projektarbejde. Vedr. Projektarbejde Projektarbejdet gennemføres som et gruppearbejde. De studerende er selv ansvarlige for ved fremmøde til undervisningen at

Læs mere

Det Rene Videnregnskab

Det Rene Videnregnskab Det Rene Videnregnskab Visualize your knowledge Det rene videnregnskab er et værktøj der gør det muligt at redegøre for virksomheders viden. Modellen gør det muligt at illustrere hvordan viden bliver skabt,

Læs mere

Om to hovedtilgange til forståelse af handicap

Om to hovedtilgange til forståelse af handicap Om to hovedtilgange til forståelse af handicap Handicapforståelser 2 To hovedtilgange til forståelse af handicap 2 Det medicinske handicapbegreb 2 Kritik af det medicinske handicapbegreb 3 Det relative

Læs mere

(bogudgave: ISBN , 2.udgave, 4. oplag)

(bogudgave: ISBN , 2.udgave, 4. oplag) Videnskabsteori 1. e-udgave, 2007 ISBN 978-87-62-50223-9 1979, 1999 Gyldendalske Boghandel, Nordisk Forlag A/S, København Denne bog er beskyttet af lov om ophavsret. Kopiering til andet end personlig brug

Læs mere

2 Risikoaversion og nytteteori

2 Risikoaversion og nytteteori 2 Risikoaversion og nytteteori 2.1 Typer af risikoholdninger: Normalt foretages alle investeringskalkuler under forudsætningen om fuld sikkerhed om de fremtidige betalingsstrømme. I virkelighedens verden

Læs mere

Monitorering af danskernes rygevaner. Metodebeskrivelse m.m. Januar 2004

Monitorering af danskernes rygevaner. Metodebeskrivelse m.m. Januar 2004 Monitorering af danskernes rygevaner 2003 Metodebeskrivelse m.m. Januar 2004 Monitorering af danskernes rygevaner 2003 Metodebeskrivelse m.m. Januar 2004 Indhold Side 1.1. Indledning... 1 1.2. Baggrund

Læs mere

BONUSINFORMATIONER i forbindelse med emnet Billeder og grafik

BONUSINFORMATIONER i forbindelse med emnet Billeder og grafik BONUSINFORMATIONER i forbindelse med emnet Billeder og grafik Dette dokument indeholder yderligere informationer, tips og råd angående: Tabelfunktionen SmartArtfunktionen Billedfunktionen Samt en ekstra

Læs mere

Ordbog om effektma ling

Ordbog om effektma ling Ordbog om effektma ling Indhold Allokering... 2 Andre forskningsdesign med kontrolgruppe... 2 Andre forskningsdesign uden kontrolgruppe... 2 Campbell-samarbejdet... 3 Dokumentation... 3 Effektmåling...

Læs mere

Mapping-tabeller. Indholdsfortegnelse. 1. Forord. 1. Forord. 2. Tabellernes opbygning og indhold. 3. Formålet med tabellerne

Mapping-tabeller. Indholdsfortegnelse. 1. Forord. 1. Forord. 2. Tabellernes opbygning og indhold. 3. Formålet med tabellerne Mapping-tabeller Indholdsfortegnelse 1. Forord 2. Tabellernes opbygning og indhold 3. Formålet med tabellerne 4. Tabellernes anvendelsesområde 5. Afsluttende bemærkninger 1. Forord Lige fra dengang de

Læs mere

AKADEMISK IDÉGENERERING JULIE SCHMØKEL

AKADEMISK IDÉGENERERING JULIE SCHMØKEL JULIE SCHMØKEL AKADEMISK PROJEKT Seminar T Idégenerering Seminar U Akademisk skrivning Seminar V Akademisk feedback PRÆSENTATION Julie Schmøkel, 27 år Cand.scient. i nanoscience (2016), Science and Technology,

Læs mere

Fuldstændig fantastisk?

Fuldstændig fantastisk? Fuldstændig fantastisk? Holger Juul, lektor, ph.d., Center for Læseforskning, Københavns Universitet Enten-eller vs. både-og I marts-nummeret af Nyt om Ordblindhed tager Erik Arendal afstand fra det han

Læs mere

TIL OPGAVESKRIVEREN. Før selve opgaveugen. Formål med opgaven.

TIL OPGAVESKRIVEREN. Før selve opgaveugen. Formål med opgaven. TIL OPGAVESKRIVEREN Formål med opgaven. Den større skriftlige opgave i biologi er en eksamensopgave, hvor der gives en selvstændig karakter, som tæller med på eksamensbeviset på lige fod med de øvrige

Læs mere

Pointen med Funktioner

Pointen med Funktioner Pointen med Funktioner Frank Nasser 0. april 0 c 0080. Dette dokument må kun anvendes til undervisning i klasser som abonnerer på MatBog.dk. Se yderligere betingelser for brug her. Bemærk: Dette er en

Læs mere

Artikler

Artikler 1 af 5 09/06/2017 13.47 Artikler 26 artikler. persontilstand Generel definition: tilstand hos en person, der vurderes i forbindelse med en indsats Persontilstanden vurderes og beskrives ud fra den eller

Læs mere

Unges madkultur. Sammenfatning. Forfattet af. Rebekka Bille, Marie Djurhuus, Eline Franck, Louise Weber Madsen & Ben Posetti

Unges madkultur. Sammenfatning. Forfattet af. Rebekka Bille, Marie Djurhuus, Eline Franck, Louise Weber Madsen & Ben Posetti Unges madkultur Sammenfatning Forfattet af Rebekka Bille, Marie Djurhuus, Eline Franck, Louise Weber Madsen & Ben Posetti 2013 Introduktion Denne sammenfatning præsenterer de væsentligste fund fra en undersøgelse

Læs mere

Fransk-dansk ordbogsprojekt inden for varemærker og varemærkeret i Frankrig og Danmark

Fransk-dansk ordbogsprojekt inden for varemærker og varemærkeret i Frankrig og Danmark Fransk Institut Forfatter: Speciale Signe Rousing Østergaard Cand.ling.merc. Eksamensnummer: 243550 Specialevejleder: Kirsten Wølch Rasmussen Fransk-dansk ordbogsprojekt inden for varemærker og varemærkeret

Læs mere

Vildledning er mere end bare er løgn

Vildledning er mere end bare er løgn Vildledning er mere end bare er løgn Fake News, alternative fakta, det postfaktuelle samfund. Vildledning, snyd og bedrag fylder mere og mere i nyhedsbilledet. Både i form af decideret falske nyhedshistorier

Læs mere

Leksikografiske valg ved udarbejdelsen af et udkast til en internetbaseret dansk-engelsk juridisk delfagsordbog

Leksikografiske valg ved udarbejdelsen af et udkast til en internetbaseret dansk-engelsk juridisk delfagsordbog Leksikografiske valg ved udarbejdelsen af et udkast til en internetbaseret dansk-engelsk juridisk delfagsordbog - med særlig henblik på behandling af kulturbundne tekstkonventioner Cand.ling.merc.-speciale

Læs mere

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven.

3.600 kg og den gennemsnitlige fødselsvægt kg i stikprøven. PhD-kursus i Basal Biostatistik, efterår 2006 Dag 1, onsdag den 6. september 2006 Eksempel: Sammenhæng mellem moderens alder og fødselsvægt I dag: Introduktion til statistik gennem analyse af en stikprøve

Læs mere

Kundeanalyse. blandt 1000 grønlandske husstande

Kundeanalyse. blandt 1000 grønlandske husstande Kundeanalyse 2012 blandt 1000 grønlandske husstande Udarbejdet af Tele-Mark A/S Carl Blochs Gade 37 8000 Århus C Partner: Allan Falch November 2012 1 Indholdsfortegnelse 1. Indledning... 3 1.1 Formålet

Læs mere

Sproglig udvikling - et tværgående tema i Fælles Mål. Aarhus 23. oktober 2014

Sproglig udvikling - et tværgående tema i Fælles Mål. Aarhus 23. oktober 2014 Sproglig udvikling - et tværgående tema i Fælles Mål Aarhus 23. oktober 2014 Dagens tal 4004 4004 f. kr. blev jorden skabt kl. 9:00 (det var en søndag!) James Ussher, ærkebiskop i Irland (calvinist) Næsten

Læs mere

Sådan bruger du Den Dansk-Engelske Regnskabsordbog

Sådan bruger du Den Dansk-Engelske Regnskabsordbog Sådan bruger du Den Dansk-Engelske Regnskabsordbog Visning Når du får et søgeresultat, kan du gøre skriften større eller mindre ved at klikke på knapperne yderst til højre på skærmen: større, mindre, nulstil.

Læs mere

a. forstå varierede former for autentisk engelsk både skriftligt og mundtligt,

a. forstå varierede former for autentisk engelsk både skriftligt og mundtligt, Engelsk B 1. Fagets rolle Engelsk er et færdighedsfag, et vidensfag og et kulturfag, der beskæftiger sig med sprog, kultur og samfundsforhold i engelsksprogede områder og i globale sammenhænge. Faget omfatter

Læs mere

OMKOSTNINGER TIL ENERGISYN

OMKOSTNINGER TIL ENERGISYN JUNI 2018 ENERGISTYRELSEN OMKOSTNINGER TIL ENERGISYN - for virksomheder med et lille energiforbrug i Danmark ADRESSE COWI A/S Parallelvej 2 2800 Kongens Lyngby TLF +45 56 40 00 00 FAX +45 56 40 99 99

Læs mere

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik

Statistik Lektion 1. Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Statistik Lektion 1 Introduktion Grundlæggende statistiske begreber Deskriptiv statistik Introduktion Kursusholder: Kasper K. Berthelsen Opbygning: Kurset består af 5 blokke En blok består af: To normale

Læs mere

TIPS OG TRICKS I PROJEKTSKRIVNING

TIPS OG TRICKS I PROJEKTSKRIVNING TIPS OG TRICKS I PROJEKTSKRIVNING FORMELLE KRAV TIL RAPPORTEN Længde: Bilag: 5-10 sider (med font str. svarende til Times New Roman 12) Hvis det ønskes kan evt. ekstra figurer, specifikke udregninger,

Læs mere

Markedsføringsplanlægning og -ledelse

Markedsføringsplanlægning og -ledelse Markedsføringsplanlægning og -ledelse Stig Ingebrigtsen & Otto Ottesen Markedsføringsplanlægning og -ledelse Hvordan bruge teori til at identificere, prioritere og løse praktiske markedsføringsproblemer?

Læs mere

Praktikpladsundersøgelse Computer Science Studerende Forår 2011

Praktikpladsundersøgelse Computer Science Studerende Forår 2011 [Skriv tekst] [Skriv tekst] [Skriv tekst] Praktikpladsundersøgelse Computer Science Studerende Forår 2011 Praktikpladsundersøgelse Computer Science Studerende Forår 2011 Københavns Erhvervsakademi Ryesgade

Læs mere

En intro til radiologisk statistik. Erik Morre Pedersen

En intro til radiologisk statistik. Erik Morre Pedersen En intro til radiologisk statistik Erik Morre Pedersen Hypoteser og testning Statistisk signifikans 2 x 2 tabellen og lidt om ROC Inter- og intraobserver statistik Styrkeberegning Konklusion Litteratur

Læs mere

Forskningsprojekt og akademisk formidling - 18. Den videnskabelige artikel

Forskningsprojekt og akademisk formidling - 18. Den videnskabelige artikel + Forskningsprojekt og akademisk formidling - 18 Den videnskabelige artikel + Læringsmål Definere en videnskabelig artikel Redegøre for de vigtigste indholdselementer i en videnskabelig artikel Vurdere

Læs mere

TEST-skjal til at vísa stødd, snið v.m.

TEST-skjal til at vísa stødd, snið v.m. TEST-skjal til at vísa stødd, snið v.m. Vejledning i projektskrivning Vejledning i rapportskrivning En hjælp til et lettere liv for studerende og undervisere Heini Havreki Verkætlanarfrágreiðing Skeið

Læs mere

gelig tendens til, at fagordbøger bliver skæmmet ved en sjusket leksikografisk udførelse, der medfører, at det faglige og sproglige indhold ikke

gelig tendens til, at fagordbøger bliver skæmmet ved en sjusket leksikografisk udførelse, der medfører, at det faglige og sproglige indhold ikke Alice Lykke Holste, Tinna Nielsen, Marina Orlova-Jermark og Viktor Smith: Russisk rets- og politisprog. Grundlæggende begreber og principper. Russisk-dansk juridisk ordbog. København: Handelshøjskolens

Læs mere

Fag Januar-februar Marts april Maj - juni Faglige mål American business Skrive essay. Skrive essay. Grammatik Læse værk Cultural understanding

Fag Januar-februar Marts april Maj - juni Faglige mål American business Skrive essay. Skrive essay. Grammatik Læse værk Cultural understanding Studieplaner for 2G forår 2019 Fag Januar-februar Marts april Maj - juni Faglige mål Engelsk American business Skrive essay Cultural understanding anvende viden om det Skrive essay Grammatik Læse værk

Læs mere

Rettelsesblade til STUDIEORDNING FOR DEN ERHVERVSSPROGLIGE KANDIDATUDDANNELSE. i sproglig informatik. Forsøgsordning

Rettelsesblade til STUDIEORDNING FOR DEN ERHVERVSSPROGLIGE KANDIDATUDDANNELSE. i sproglig informatik. Forsøgsordning e til STUDIEORDNING FOR DEN ERHVERVSSPROGLIGE KANDIDATUDDANNELSE i sproglig informatik Forsøgsordning Syddansk Universitet, Kolding Gældende fra for studerende, som påbegynder uddannelsen 1. september

Læs mere

Nyhedsbrev om teknologi B og A på htx. Tema: Studieretningsprojektet

Nyhedsbrev om teknologi B og A på htx. Tema: Studieretningsprojektet Nyhedsbrev om teknologi B og A på htx Tema: Studieretningsprojektet Ministeriet for Børn og Undervisning Departementet Kontor for Gymnasiale Uddannelser September 2012 Hvorfor dette nyhedsbrev? I august

Læs mere

Opgavekriterier. O p g a v e k r i t e r i e r. Eksempel på forside

Opgavekriterier. O p g a v e k r i t e r i e r. Eksempel på forside Eksempel på forside Bilag 1 Opgavekriterier - for afsluttende skriftlig opgave ved Specialuddannelse for sygeplejersker i intensiv sygepleje......... O p g a v e k r i t e r i e r Udarbejdet af censorformandskabet

Læs mere

Trekanter. Frank Villa. 8. november 2012

Trekanter. Frank Villa. 8. november 2012 Trekanter Frank Villa 8. november 2012 Dette dokument er en del af MatBog.dk 2008-2012. IT Teaching Tools. ISBN-13: 978-87-92775-00-9. Se yderligere betingelser for brug her. Indhold 1 Introduktion 1 1.1

Læs mere

3.g elevernes tidsplan for eksamensforløbet i AT 2015

3.g elevernes tidsplan for eksamensforløbet i AT 2015 Mandag d. 26.1.15 i 4. modul Mandag d. 2.2.15 i 1. og 2. modul 3.g elevernes tidsplan for eksamensforløbet i AT 2015 AT emnet offentliggøres kl.13.30. Klasserne er fordelt 4 steder se fordeling i Lectio:

Læs mere

Måling af graffiti i Frederiksberg Kommune

Måling af graffiti i Frederiksberg Kommune Måling af graffiti i Frederiksberg Kommune Delrapport nummer 2 Uge 18-2013 Rostra Kommunikation & Research A/S Indhold Baggrund og formål... 4 Konklusioner... 5 Fordelingen på individuelle ruter... 6 Rute

Læs mere

Videnskabsteoretiske dimensioner

Videnskabsteoretiske dimensioner Et begrebsapparat som en hjælp til at forstå fagenes egenart og metode nummereringen er alene en organiseringen og angiver hverken progression eller taksonomi alle 8 kategorier er ikke nødvendigvis relevante

Læs mere

PROBLEMFORMULERING. på videregående uddannelser LOTTE RIENECKER STUDIETEKNIKSERIEN 4. UDGAVE

PROBLEMFORMULERING. på videregående uddannelser LOTTE RIENECKER STUDIETEKNIKSERIEN 4. UDGAVE STUDIETEKNIKSERIEN 4. UDGAVE LOTTE RIENECKER PROBLEMFORMULERING på videregående uddannelser Her er hjælp til at problemformulere en opgave, et projekt eller speciale på en lang eller mellemlang videregående

Læs mere

LUP Fødende læsevejledning til afdelingsrapporter

LUP Fødende læsevejledning til afdelingsrapporter Indhold Hvordan du bruger læsevejledningen... 1 Oversigtsfigur... 2 Temafigur... 3 Spørgsmålstabel... 4 Respondenter og repræsentativitet... 6 Uddybende forklaring af elementer i figurer og tabeller...

Læs mere

BILAG 2. TEORI OG METODE

BILAG 2. TEORI OG METODE BILAG 2. TEORI OG METODE Teori Vi benytter os af kvalitativ metode. Det hører med til denne metode, at man har gjort rede for egne holdninger og opfattelser af anvendte begreber for at opnå transparens

Læs mere

Naturvidenskabelig metode

Naturvidenskabelig metode Naturvidenskabelig metode Introduktion til naturvidenskab Naturvidenskab er en betegnelse for de videnskaber der studerer naturen gennem observationer. Blandt sådanne videnskaber kan nævnes astronomi,

Læs mere

VUC Nordjylland, Aalborg

VUC Nordjylland, Aalborg Eksamensprojektet er en tværfaglig eksamensopgave, og karakteren for den indgår som en selvstændig karakter på eksamensbeviset. Formålet med projektet er, at du skal have lejlighed til at arbejde tværfagligt

Læs mere

LUP læsevejledning til afdelingsrapporter

LUP læsevejledning til afdelingsrapporter Indhold Hvordan du bruger læsevejledningen... 1 Oversigtsfigur... 2 Temafigur... 3 Spørgsmålstabel... 4 Respondenter og repræsentativitet... 6 Oversigtsfigur for afsnit/underopdelinger... 8 Uddybende forklaring

Læs mere

Uwe Kaufmann. Fagordbøger: Ideal og pragmatik. 1. Indledning. 2. Konceptionen af Genteknologisk Ordbog og dens brugergruppe

Uwe Kaufmann. Fagordbøger: Ideal og pragmatik. 1. Indledning. 2. Konceptionen af Genteknologisk Ordbog og dens brugergruppe Uwe Kaufmann 117 Fagordbøger: Ideal og pragmatik 1. Indledning Det er en god ting at diskutere, hvad der kan forventes af en tilfredsstillende fagordbog. Karin Balsgart har i sin artikel Fag, faglighed

Læs mere

Projektbeskrivelsen skal redegøre for følgende punkter (rækkefølgen er vejledende): Præcision af, hvad projektet skal dreje sig om (emne)

Projektbeskrivelsen skal redegøre for følgende punkter (rækkefølgen er vejledende): Præcision af, hvad projektet skal dreje sig om (emne) M12 Projektbeskrivelsen skal redegøre for følgende punkter (rækkefølgen er vejledende): Præcision af, hvad projektet skal dreje sig om (emne) Integrationen blandt indvandrere og efterkommere har en stor

Læs mere

Individer er ikke selv ansvarlige for deres livsstilssygdomme

Individer er ikke selv ansvarlige for deres livsstilssygdomme Individer er ikke selv ansvarlige for deres livsstilssygdomme Baggrunden Både i akademisk litteratur og i offentligheden bliver spørgsmål om eget ansvar for sundhed stadig mere diskuteret. I takt med,

Læs mere

Allan Røder: Danske talemåder, 616 sider. Gads Forlag, Køben-

Allan Røder: Danske talemåder, 616 sider. Gads Forlag, Køben- Recensies 163 Allan Røder: Danske talemåder, 616 sider. Gads Forlag, Køben- 164 TijdSchrift voor Skandinavistiek havn 1998. [Delvist illustreret] ISBN 87-12-03081-3. Stig Toftgaard Andersen: Talemåder

Læs mere

Forberedelse. Forberedelse. Forberedelse

Forberedelse. Forberedelse. Forberedelse Formidlingsopgave AT er i høj grad en formidlingsopgave. I mange tilfælde vil du vide mere om emnet end din lærer og din censor. Dæng dem til med fakta. Det betyder at du skal formidle den viden som du

Læs mere

9. Kursusgang. Validitet og reliabilitet

9. Kursusgang. Validitet og reliabilitet 9. Kursusgang Validitet og reliabilitet 20.04.09 1 På programmet Validitet og reliabilitet - i teori og praksis Midtvejsevaluering 17-18: Oplæg 18-19: El-biler Lectio 19-20: Amnesty Cykelgruppen 1 20-21:

Læs mere

Kvantitative metoder inden for korpuslingvistiske projekter

Kvantitative metoder inden for korpuslingvistiske projekter Kvantitative metoder inden for korpuslingvistiske projekter Illustreret ved eksempler fra Den Danske Ordbogs korpus, Korpus 2000 og Korpus 90 Jørg Asmussen Det Danske Sprog- og Litteraturselskab, DSL ja@dsl.dk

Læs mere

Hvad er skriftlig samfundsfag. Redegør

Hvad er skriftlig samfundsfag. Redegør Hvad er skriftlig samfundsfag... 2 Redegør... 2 Angiv og argumenter... 2 Opstil hypoteser... 3 Opstil en model... 4 HV-ord, tabellæsning og beregninger... 5 Undersøg... 6 Sammenlign synspunkter... 7 Diskuter...

Læs mere

Hans Henrik Sorgenfrey og Simon Ulrik Kragh. Nytænkning i "erhvervssproglig forskning"?

Hans Henrik Sorgenfrey og Simon Ulrik Kragh. Nytænkning i erhvervssproglig forskning? Hans Henrik Sorgenfrey og Simon Ulrik Kragh 281 Nytænkning i "erhvervssproglig forskning"? En kommentar til Hans Peder Kromanns indlæg i Hermes 1 * I første nummer af "Hermes" har Hans-Peder Kromann et

Læs mere

Teknisk kommunikation og projektstyring (10 ECTS)

Teknisk kommunikation og projektstyring (10 ECTS) Teknisk kommunikation og projektstyring (10 ECTS) Formålet med kurset er at sætte de studerende i stand til på højeste professionelle niveau at forfatte og oversætte centrale tekniske tekstgenrer mellem

Læs mere

Søren Sørensen STANDARD RAPPORT. Adaptive General Reasoning Test

Søren Sørensen STANDARD RAPPORT. Adaptive General Reasoning Test Adaptive General Reasoning Test STANDARD RAPPORT Dette er en fortrolig rapport, som udelukkende må anvendes af personer med en gyldig certificering i anvendelse af værktøjet AdaptGRT fra DISCnordic. VIGTIGT

Læs mere

Informationsmanagement - for den tekniske oversætter

Informationsmanagement - for den tekniske oversætter Informationsmanagement - for den tekniske oversætter Siderne her skal forstås som et noteapparat, der i ganske kort form indeholder nogle for det meste alment accepterede holdninger til de temaer, som

Læs mere

Forskningsprojekt og akademisk formidling Den videnskabelige artikel

Forskningsprojekt og akademisk formidling Den videnskabelige artikel + Forskningsprojekt og akademisk formidling - 18 Den videnskabelige artikel + Læringsmål Definere en videnskabelig artikel Redegøre for de vigtigste indholdselementer i en videnskabelig artikel Vurdere

Læs mere