Introduktion til korpusværktøjet CoREST

Størrelse: px
Starte visningen fra side:

Download "Introduktion til korpusværktøjet CoREST"

Transkript

1 Introduktion til korpusværktøjet CoREST Jørg Asmussen Det Danske Sprog- og Litteraturselskab 17. marts 2015 Denne vejledning vedrører CoREST β (2015). En eventuel opdateret version af vejledningen findes her: Resumé Dette dokument er en vejledning i brugen af CoREST. Det beskriver, hvordan man installerer og starter CoREST, og gennemgår herefter samtlige funktioner i værktøjet. Til gennemgangen knytter der sig mange konkrete eksempler, som skal gøre læseren fortrolig med mulighederne i CoREST. 1

2 Indhold I Overblik 5 1 Hvad er CoREST? 6 Sprogkokkens schweizerkniv 2 Hurtigt i gang 9 Gøre gryden klar II Indblik 22 3 Brugerinterfacets funktioner 23 Alle ingredienserne 4 Søgning med jokertegn 47 En gryderet med punktummer og stjerner 5 Avancerede søgeudtryk 51 Det muntre køkken III Udblik 70 A Løsningsforslag til opgaverne 71 Litteratur 73 2

3 Figurer 2.1 CoREST på en tynd klient findes i kategorien Kontor Kommunikationsfejl Ikke kompatibel CoREST-version CoREST-vinduet efter en søgning Venter på resultat Matchliste for blockbuster.* Hyppige naboord til venstre for rimelig Typiske naboord til højre for rimelig Reduceret konkordans Konkordans med mærker Eksporteret konkordansudsnit i regneark Centrale tekstoplysninger Udførlige tekstoplysninger Kopiering fra kontekstfeltet Visning af hele teksten Ordseddelvisning i Ømål-udgaven Ordoplysninger om ordklasse og bøjning Ordoplysninger i KDK-korpora Brugerannoteringer vises og redigeres i dette felt Konkordans på bevægelse Autofuldførelse under indtastning af brugerannoteringer Annoteringer til et match Annoteringer, som kun vedrører en del af matchet Overlappende annoteringer Liste over annoteringer Indstillinger og søgehistorik

4 Tabeller 2.1 Simple søgeudtryk Eksempler på søgninger med kontroltegn Oversigt over centrale tekstoplysninger Eksempler på brug af jokertegnet punktum Gentagelsessymboler Symboler med særlig betydning Ordattributter i KDK-korpora Avancerede over for simple søgeudtryk Ordklassetags Sætning med epos-tags

5 Del I Overblik 5

6 Kapitel 1 Hvad er CoREST? Sprogkokkens schweizerkniv 1.1 Funktioner Udgaver Teknik Ris og ros Indrapportering af fejl Ny og forbedret funktionalitet CoREST-manualen Funktioner CoREST står for Corpus Retrieval System & Tools. CoREST er først og fremmest et værktøj til avancerede sproglige undersøgelser i meget store tekstsamlinger, såkaldte tekstkorpora. Med CoREST kan du udføre komplekse søgninger på enkeltord og grupper af ord bruge tekstoplysninger som filtre i søgningerne se fund som matchlister og konkordanser lave undersøgelser, der viser, hvilke ord der typisk optræder sammen med fundet (kollokationer) finde fremtrædende ord i bestemte tekstgrupper sortere resultater på forskellig vis se større kontekster omkring fund, evt. op til hele teksten se tekstoplysninger som titel, forfatter m.m. 6

7 KAPITEL 1. HVAD ER COREST? 7 se supplerende oplysninger til enkeltord, fx deres grundform, ordklasse og bøjning annotere fund med brugerdefinerede markeringer eksportere fund som tekstfil eller til andre programmer 1.2 Udgaver CoREST findes i forskellige udgaver: DSL Denne udgave bruges internt på Det Danske Sprog- og Litteraturselskab og anvendes især til ordbogsredigering. DSL-udgaven giver adgang til en række specialkorpora samt til visse særlige funktioner. Ømål Denne udgave bruges af Ømålsordbogens redaktion og er særligt tilpasset dens behov, ved at den giver adgang til dialektkorpora og kan udskrive fund til ordsedler. Research Denne udgave er næsten identisk med DSL-udgaven, dog mangler adgangen til visse specialkorpora. Standard Denne udgave indeholder det offentlige KorpusDK. Ellers er funktionerne næsten identiske med de øvrige udgaver, dog er visningen af hele tekster af ophavsretlige grunde ikke mulig. 1.3 Teknik Teknisk set består CoREST-systemet af to dele: Klient Den ene del er en klient, som er installeret på brugerens maskine. I klienten formulerer brugeren søgeforespørgsler, får vist resultater, kan annotere, eksportere osv. Server Via nettet står klienten i forbindelse med den anden del af CoRESTsystemet, nemlig en server på DSL, som tager imod søgeforespørgslerne, udfører dem på DSL s tekstsamlinger og sender resultater tilbage til brugeren. Populært sagt fungerer CoREST-klienten som en slags browser for det indhold, som korpusserveren stiller til rådighed. CoREST-klienten er udviklet i Java og fungerer på alle gængse operativsystemer. CoREST-serveren er opbygget som en REST-baseret webservice, programmeret i Java, og kører som en web-applikation under GlassFish. CoREST-serveren bruger OpenCWB som back-end korpussøgemaskine. CoREST udvikles af Jørg Asmussen, DSL, siden 2011.

8 KAPITEL 1. HVAD ER COREST? Ris og ros CoREST er under stadig udvikling og bør derfor ikke betragtes som et færdigt og fejlfrit produkt! Du vil med sikkerhed konstatere en række fejl og mangler, og det er meget sandsynligt, at du vil savne en række funktioner. For at kunne udvikle CoREST i den rigtige retning, er dine kommentarer meget velkomne! Send dine idéer og forbedringsforslag enten som fejlrapport eller som ønske om ny og forbedret funktionalitet. Forbedringsforslag og flere konkrete eksempler til selve manualen her er også meget velkomne! I de følgende afsnit kan du læse om, hvordan du indsender dine kommentarer og ønsker Indrapportering af fejl Skriv en til [email protected]. I emnefeltet skriver du fejl. Selve mailen skal have følgende opbygning: Fejl Når jeg gør x, sker der y hvor du så indsætter din beskrivelse for x (hvad du gør) og y (hvad der sker) Ny og forbedret funktionalitet Skriv en til [email protected]. I emnefeltet skriver du feature. Selve mailen skal have følgende opbygning: Feature Jeg vil gerne lave x, derfor har jeg brug for funktionalitet y hvor du indsætter din beskrivelse for x (hvilket behov du har) og y (hvilken funktionalitet du mangler i den forbindelse) CoREST-manualen Finder du fejl i manualen, har du forbedringsforslag til den eller gode eksempler, som bør optages her, skriver du til [email protected]. I emnefeltet skriver du manual.

9 Kapitel 2 Hurtigt i gang Gøre gryden klar 2.1 Installere og starte CoREST Generel installation Systemspecifik installation DSL s tynde klienter Tekniske problemer Søgning Valg af korpus Indtastning af søgeudtryk Matchliste Konkordans Konkordanslinjeoplysninger Søgehastighed Finde rundt i programmet Formulere simple søgeudtryk Opgaver: Simple søgeudtryk Bruge kontroltegn i søgeudtryk Opgaver: Brug af kontroltegn Søgehistorik Cache Installere og starte CoREST CoREST-klienten leveres i form af en sammenpakket zip-fil, dvs. en fil, hvis navn ender på.zip. Det fulde navn på zip-filen afhænger blandt andet af udgaven og versionen, men vil altid starte med CoREST eller corest. 9

10 KAPITEL 2. HURTIGT I GANG 10 Første skridt er at pakke zip-filen ud. Det sker som regel ved blot at dobbeltklikke på filen. Eventuelt har din computer (Mac) allerede automatisk sørget for det i forbindelse med download af filen. Næste skridt er selve installationen. Hvis du har Java 8 på din maskine, så er det som regel det nemmeste at vælge generel installation, uanset om du bruger Mac, Windows eller Linux. Hvis du har en ældre version af Java end Java 8 på din maskine eller måske slet ikke har installeret Java, kan du bruge systemspecifik installation, som dog ikke tilbydes til alle versioner af CoREST Generel installation Denne installation forudsætter, at du har Java 8 installeret på din maskine. Efter udpakningen af zip-filen er der oprettet en mappe af samme navn som zip-filen, dog uden endelsen.zip. Vi kalder denne mappe for CoREST s programmappe. Du kan lægge programmappen et vilkårligt sted på din maskine; oplagt er dog det sted, hvor dine øvrige programmer ligger. Når du har lagt programmappen der, hvor du vil have den, åbner du mappen ved at dobbeltklikke på den. Du vil her bl.a. se en fil ved navn CoREST-FX.jar. CoREST-klienten startes ved at dobbeltklikke på denne fil. Hverken denne eller andre filer må fjernes fra programmappen! Derfor kan det være en idé at oprette en genvej til CoREST-FX.jar, fx fra Windows skrivebord eller fra Mac ens dock. Nu er du færdig med installationen og klar til at bruge CoREST. CoREST startes ved at dobbeltklikke på filen CoREST-FX.jar, som ligger i CoREST-programmappen, eller ved at dobbeltklikke på den genvej, du eventuelt har oprettet hertil Systemspecifik installation OBS! Systemspecifik installation tilbydes ikke til CoREST β. Systemspecifik installation findes hvis den tilbydes til Mac og evt. Windows. Ved denne type installation behøver Java 8 ikke at være installeret på din maskine. Du kan have en hvilken som helst Java-version installeret eller slet ingen DSL s tynde klienter På tynde klienter på Det Danske Sprog- og Litteraturselskab starter du CoREST ved at klikke på menuen Programmer, gå ind i kategorien Kontor og vælge CoREST her, se figur 2.1. Vær tålmodig : De tynde klienter er ikke de hurtigste! Der kan gå lidt tid, inden CoREST bliver synlig på skærmen! På de tynde klienter skal der med andre ord ikke laves en særlig installation eller opsætning af CoREST.

11 KAPITEL 2. HURTIGT I GANG 11 Figur 2.1: CoREST på en tynd klient findes i kategorien Kontor Figur 2.2: Kommunikationsfejl Tekniske problemer Det er vigtigt, at CoREST på din maskine kan få adgang til CoREST-serveren. Det vil sige, at din maskine skal være på internettet, og din version af CoREST skal kunne kommunikere med den aktuelle version af serveren. Hvis der opstår fejl i kommunikationen over nettet mellem CoREST og serveren, viser CoREST en fejlmeddelelse om, at serveren ikke svarer som forventet, se figur 2.2. Efter at du har klikket på OK og har sikret dig, at din netforbindelse fungerer, kan du genstarte CoREST. Den seneste søgning er dog sandsynligvis gået tabt. Hvis din version af CoREST er forældet i forhold til serveren, kan du ikke længere bruge CoREST, før den er blevet opdateret til en nyere version. Du vil da få en meddelelse om manglende kompatibilitet, se figur 2.3. Hvis du mener, at dine problemer skyldes en generel fejl i CoREST, er du velkommen til at indsende en fejlrapport som beskrevet i afsnit

12 KAPITEL 2. HURTIGT I GANG 12 Figur 2.3: Ikke kompatibel CoREST-version Figur 2.4: CoREST-vinduet efter en søgning 2.2 Søgning Første gang CoREST startes, udføres automatisk en søgning på velkommen i korpusset KDK-2010, hvorefter CoREST-vinduet omtrent svarer til det, du kan se i figur Valg af korpus Øverst til venstre i vinduet er der en rullemenu, hvor du kan vælge det korpus, som du vil arbejde med. Denne menu kaldes korpusvælgeren. Antallet af tilgængelige korpora afhænger af den CoREST-udgave, du bruger. Når CoREST startes første gang, er korpusset KDK-2010 automatisk valgt. Du bør tjekke, om det faktisk er det korpus, du vil arbejde med, og ellers vælge et andet. Alle udgaver af CoREST giver adgang til korpusset KDK Derfor beror de fleste eksempler her i manualen på dette korpus.

13 KAPITEL 2. HURTIGT I GANG Indtastning af søgeudtryk Til højre for korpusvælgeren er der et indtastningsfelt, hvor du indtaster det, du vil søge på formuleret som et søgeudtryk. Vi kalder dette felt for søgefeltet. I søgefeltet kan du indtaste to typer søgeudtryk: simple og avancerede. Her i hurtigt i gang-kapitlet til CoREST holder vi os udelukkende til simple søgeudtryk, mens de avancerede bliver behandlet i kapitel 5. Et simpelt søgeudtryk består i sin mest enkle form af et eller flere ord. I søgeudtrykket kan der også indgå jokertegn. Ved at klikke på søgeknappen eller ved at taste retur sætter du søgningen i gang i det valgte korpus. Prøv at skrive søgeudtrykket kronisk.* i søgefeltet og tast retur eller klik på søgeknappen. Denne søgning finder alle ord i korpus, som begynder med kronisk inklusive ordet kronisk selv. Jokertegnet.* (punktum stjerne) betyder, at der kan være et vilkårligt antal (også nul) vilkårlige bogstaver på dette sted. En udførlig beskrivelse af, hvordan man bruger jokertegn i CoREST, finder du i kapitel 4. I det følgende gennemgås de forskellige oplysninger, som du får i CoRESTvinduet efter en søgning Matchliste Her vises alle forskellige ord fra korpus, som matcher søgeudtrykket. Listen er som udgangspunkt alfabetisk sorteret. Øverst på listen står altid selve søgeudtrykket rykket lidt ind til højre, så det kan skelnes fra de andre ord på listen. Ud for hvert ord vises en score, der angiver, hvor hyppigt pågældende ord er blandt alle ord, der matcher søgeudtrykket. Alle match tilsammen sættes altid til (svarende til 100 %). En søgning på kronisk.* giver følgende match: kronisk med en score på 6537, altså en andel på 65,37 % af samtlige match, og kroniske med en score på 3462 (34,62 %). Efter en søgning er selve søgeudtrykket øverst på matchlisten markeret med gult. Steder i korpus, der matcher dette udtryk, vises i en såkaldt konkordans til højre for matchlisten. Matchlisten kan også sorteres efter score ved at klikke på overskriften Score over score-kolonnen. En udførlig beskrivelse af matchlisten og andre lister finder du i afsnit Konkordans Konkordansen viser korpusforekomster af de ord, der matcher søgeudtrykket. Hver forekomst vises centreret på en linje med nogle ords kontekst omkring. Konkordansen er som udgangspunkt lige som matchlisten sorteret alfabetisk på matchet. Ved en søgning på kronisk.* i KDK-2010 er det samtlige 644 forekomster af både kronisk og kroniske, der vises i konkordansen. En konkordans kan maksimalt vise 2000 fund fordelt på 20 sider med 100 fund per side. Hvis der er flere match i korpus, reduceres antallet af viste fund automatisk til 2000 fund. Hvis en konkordans indeholder flere end 100 fund og dermed består af flere sider, kan du skifte fra side til side med sidevælgeren, jf. figur 2.4. En udførlig beskrivelse af konkordanser og hvad du kan lave med dem, findes under i afsnit 3.2.

14 KAPITEL 2. HURTIGT I GANG 14 Figur 2.5: Venter på resultat Konkordanslinjeoplysninger Under konkordansen vises yderligere oplysninger om den konkordanslinje, der aktuelt er markeret med gult. Umiddelbart efter en søgning er det altid den første konkordanslinje, der er markeret. Oplysningerne vises i de følgende fire felter fra venstre mod højre under konkordansen: Tekstoplysninger Her vises oplysninger om den tekst, som den markerede konkordanslinje stammer fra. Tekstoplysningernes omfang og art kan variere fra korpus til korpus. Du kan læse mere om tekstoplysninger i afsnit 3.3. Kontekst Her gives matchet med noget mere kontekst omkring, end hvad der kan vises i selve konkordanslinjen. En udførlig beskrivelse af tekst- og kontekstvisning finder du i afsnit 3.4. Ordoplysninger Til hvert ord i korpus kan der være knyttet forskellige oplysninger, fx dets grundform eller dets ordklasse. Et udvalg af disse oplysninger vises i ordoplysningsfeltet. Disse oplysninger varierer fra korpus til korpus. Du kan læse mere om ordoplysninger i afsnit 3.5. Brugerannoteringer Hvis du har lavet annoteringer til fundet i den markerede konkordanslinje, vises de i dette felt. En fuldstændig beskrivelse af brugerannoteringer finder du i afsnit Søgehastighed Søgehastigheden afhænger direkte af det antal forekomster i det valgte korpus, som CoREST finder på baggrund af dit søgeudtryk. Hvis dit søgeudtryk søger på grupper af ord, er det antallet af match på det første ord i gruppen, der er afgørende for hastigheden. Populært sagt Jo flere match søgeudtrykket har i korpus, desto længere tid er Co- REST om at finde dem frem og det selvom CoREST til sidst kun afleverer 2000 eksempler til visning i konkordansen. Mens søgningen foregår, viser CoREST et roterende ventetidssymbol på det sted, hvor søgeknappen ellers befinder sig, se figur 2.5. Prøv at udføre en søgning på i.* i KDK Søgeudtrykket finder forekomster af ord, der begynder med i inklusive ordet i selv. Der er godt 2,5 millioner match i korpus, som det tager CoREST nogle sekunder at finde. Endnu mere ekstremt er en søgning på.*, som matcher alle ord i korpus, godt 45 millioner i KDK

15 KAPITEL 2. HURTIGT I GANG 15 OBS! Undgå denne type søgninger, som medfører hundredtusinder eller millioner af match, da de belaster serveren og kan være til gene for andre samtidige brugere! Desuden giver de ingen relevante resultater. En gentagen søgning på samme søgeudtryk vil som regel gå hurtigere, idet resultaterne så vil blive hentet fra en lokal cache, jf. afsnit 2.7, og ikke fra serveren. 2.3 Finde rundt i programmet Her følger en lille gennemgang af, hvordan du bruger tabulatortasten til at aktivere de forskellige områder af CoREST s brugerinterface. Det aktive område er det, der modtager input fra tastaturet. Man siger også, at området har fokus. Når et område har fokus, vises det i CoREST ved, at det er omgivet af en smal, blå ramme. Søgefeltet Efter en søgning har søgefeltet fokus, og søgeudtrykket er markeret med en blå baggrund. CoREST er klar til at modtage et nyt søgeudtryk, som du kan indtaste umiddelbart uden forudgående klik med musen nogen steder. Matchlisten Du kan bruge tabulatortasten til at skifte fokus mellem de forskellige områder af grænsefladen. Umiddelbart efter en søgning, hvor søgefeltet har fokus, vil et tryk på tabulatortasten skifte fokus til matchlisten. Her kan du nu med pil-ned eller pil-op flytte markøren fra match til match. Tryk på retur viser og fremhæver første forekomst af pågældende match i den tilhørende konkordans. Konkordansen Endnu et tryk på tabulatortasten rykker fokus fra matchlisten til konkordansen. Nu vedrører alle tastetryk konkordansen. Med tryk på pilned og pil-op kan du flytte markøren fra konkordanslinje til konkordanslinje. Konkordanslinjeoplysningerne under konkordansen opdateres løbende og viser altid de oplysninger, som vedrører den aktuelt markerede linje. En konkordans er delt op i sider med 100 linjer per side. En konkordans kan maksimalt være på 20 sider à 100 linjer. Er der flere forekomster, reduceres konkordansen automatisk til 2000 linjer. Du skifter fra side til side ved at taste pil-højre eller pil-venstre, ved at klikke på knapperne pil-højre eller pil-venstre over konkordansen eller ved at vælge en side med sidevælgeren ved siden af pileknapperne. Når konkordansområdet har fokus, kan der også indtastes korte annoteringer, såkaldte mærker, se afsnit 3.2.5, som bliver synlige til højre for konkordanslinjen. Annoteringsfeltet Trykker du på tabulatortasten, mens konkordansområdet er aktivt, flyttes fokus til indtastningsfeltet for avancerede brugerannoteringer annoteringsfeltet, se afsnit 3.6. Her kan du annotere matchet i den markerede konkordanslinje.

16 KAPITEL 2. HURTIGT I GANG 16 Tilbage til søgefeltet Et sidste tryk på tabulatortasten skifter fokus fra annoteringsfeltet tilbage til søgefeltet. 2.4 Formulere simple søgeudtryk Du skulle nu være i stand til selv at prøve at lave nogle simple søgeforespørgsler i CoREST. Tabel 2.1 viser en række søgeudtryk, som du kan starte med. Alle søgningerne er lavet i korpusset KDK I nogle af eksemplerne anvendes jokertegnet.* (punktum stjerne), som betyder nul, ét eller flere vilkårlige bogstaver på jokertegnets plads. Søgeudtryk på flere ord giver resultater, hvor der mellem hvert af de matchende ord kan være op til tre andre vilkårlige ord. Mellemrum mellem ord vises her i manualen som tegnet, men du skal indtaste dem som ganske almindelige ordmellemrum i CoREST s søgefelt. I kapitel 4 får du en fuldstændig introduktion til søgning med jokertegn. I kapitel 5 kan du læse en udførlig beskrivelse af avancerede søgninger, som giver dig fuld kontrol over, hvad du vil finde. Du kan læse mere om, hvordan et ord er defineret i CoREST i afsnit Opgaver: Simple søgeudtryk De følgende opgaver beror på søgninger i KDK Du kan besvare opgaverne ved at formulere passende simple søgeudtryk, udføre søgningerne og betragte de resulterende matchlister, som du nogle gange skal sortere efter hyppighed ved at klikke en eller to gange på feltet Score over listen. 1. Hvad er den hyppigste orddannelse med førsteleddet smart? 2. Hvorfor er der ingen forekomster af smarttelefon? 3. Hvad er de hyppigste to typer telefoner i korpus? 4. Hvilke orddannelser er hyppigst? Dem, der har udbyder som førsteled eller dem, der har udbyder som andetled? 5. Hvad er det hyppigste adjektiv mellem nye og medier? 6. Hvad er det hyppigste substantiv mellem de ord, der matcher ny.* og medier.*? 7. Hvad er de fem hyppigste ordgrupper, der matcher $ud af.*sen? Løsningsforslag findes i appendiks A.1.

17 KAPITEL 2. HURTIGT I GANG 17 Søgeudtryk smart SMART smart.* Kommentar Matcher alle forekomster af smart i korpus Samme resultat som søgningen på smart Matcher alle ord, der begynder med smart smarttelefon.* Matcher alle ord, som begynder med smarttelefon ingen forekomster i KDK-2010.*telefon tele.*en.*udbyder.* nye medier $nye medier ny.* medi.* $ny.* medi.* $ud af.*sen $to værelses $pc en Matcher alle ord, som ender på telefon Matcher alle ord, som begynder med tele og ender på en Matcher alle ord, som indeholder (eller begynder med eller slutter på) udbyder Matcher alle ordgrupper, som starter med nye og slutter med medier med op til 3 vilkårlige ord mellem nye og medier Dollartegnet foran søgeudtrykket bevirker, at det kun matcher nye medier uden andre ord imellem Matcher alle ordgrupper, hvis første ord begynder med ny, og hvis sidste ord begynder med medi, og som har op til 3 vilkårlige ord imellem sig Dollartegnet gør, at søgeudtrykket kun matcher ordpar, hvor det første begynder med ny og det sidste med medi Matcher alle de grupper på 3 ord, som begynder med ordene ud af og ender med et ord, der slutter på sen Matcher både to værelses og to-værelses, idet bindestreg betragtes som ordgrænse Matcher både (giv din) pc en (vitaminindsprøjtning), (en) pc, en (telefon) og pc en, idet apostrof og sætningstegn fungerer som ordgrænser $2 0 Matcher bl.a. 2.0, 2,0, 2-0, da sætningstegn (herunder bindestreg) fungerer som ordgrænser Tabel 2.1: Simple søgeudtryk

18 KAPITEL 2. HURTIGT I GANG Bruge kontroltegn i søgeudtryk Der kan anvendes en række kontroltegn i simple søgeudtryk. Kontroltegn bevirker, at søgningen udføres på en lidt anden måde end ellers. $ = ingen ekstra ord Dette kontroltegn har du allerede lært at kende, se tabel 2.1. Det sættes som det første tegn i et søgeudtryk. Mens søgeudtrykket vanskelig situation finder eksempler på både vanskelig situation, vanskelig finansiel situation, vanskelig og sårbar situation og en række andre (der kan være op til tre ord mellem vanskelig og situation), så finder udtrykket $vanskelig situation kun eksempler, hvor de to ord i søgeudtrykket står umiddelbart ved siden af hinanden. # = ét vilkårligt ord Beslægtet med $ er kontroltegnet #. Det betyder præcist ét ord pågældende sted. Således finder søgeudtrykket vanskelig # situation vanskelig økonomisk situation, vanskelig politisk situation og vanskelig finansiel situation i KDK Husk, at der skal være mellemrum mellem # og de omgivende ord vanskelig#situation giver intet resultat. Kontroltegnet # kan også anvendes flere gange, fx finder vanskelig ## situation eksemplerne vanskelig og sårbar situation og vanskelig og ubehagelig situation, altså eksempler med præcis to ord mellem vanskelig og situation. Hvis du anvender kontroltegnet #, så er et eventuelt foranstillet $ i søgeudtrykket uden virkning, søgeresultatet er det samme. I stedet for kontroltegnet # kan du også bruge [] (kantede parenteser uden noget imellem). Yderligere to kontroltegn vedrører fortolkningen af søgeord i søgeudtryk.! = skelne mellem store og små bogstaver Udråbstegn! umiddelbart foran et ord betyder, at ordet skal være stavet præcist som i søgeudtrykket, hvis det skal matche. Mens søgeudtrykket SMART finder eksempler på smart, Smart og SMART, finder!smart udelukkende eksempler, der er stavet præcist som angivet i søgeudtrykket, i dette tilfælde altså eksempler på SMART. Tilsvarende finder søgeudtrykket café både café og cafe i store og små varianter. Det samme gælder for søgeudtrykket cafe. Derimod finder!cafe kun de stavninger som præcist svarer til den i søgeudtrykket, altså eksempler på = alle bøjningsformer af et ord foran et ord betyder, at der skal søges på samtlige bøjningsformer af pågældende ord. Således alle forekomster af formerne hændelse, hændelsen, hændelsens, hændelser, hændelserne, hændelsernes og hændelsers. I øvrigt er der ingen forekomster af hændelses i KDK-2010, som derfor mangler i matchlisten. Denne type søgninger er kun mulig i korpora, som er forberedt til det korpusset skal være lemmatiseret. Er det ikke det, intet resultat. De to kontroltegn! kan ikke begge sættes foran et og samme ord, et sådant søgeudtryk er ugyldigt og giver ikke noget resultat.

19 KAPITEL 2. HURTIGT I GANG 19 Søgeudtryk uber!uber Kommentar Matcher alle forekomster af über og uber med en hvilken som helst kombination af store og små bogstaver Matcher kun forekomster af uber (stavet nøjagtigt på denne måde)!cirkus.* Matcher alle ord, der begynder med Cirkus (med stort @lærer flere ## end $ud Matcher alle grupper på præcist to ord, hvoraf det første er et vilkårligt ord og det andet er den præcise form Kapel (med stort K ). OBS! Denne søgning kan tage op til et minut Matcher alle bøjningsformer af grundformen cirkus i søgekorpusset Matcher alle bøjningsformer af grundformerne bytte Matcher alle grupper på præcist 3 ord, hvoraf det første er en bøjningsform af lærer, det andet et vilkårligt ord og det tredje en bøjningsform af elev Matcher alle grupper på præcist 4 ord, hvoraf det første er flere, det andet og tredje et vilkårligt ord og det sidste end Matcher alle de grupper på præcist 3 ord, som begynder med ordene ud af og slutter med en bøjningsform af et ord, hvis grundform slutter på skab Tabel 2.2: Eksempler på søgninger med kontroltegn Tabel 2.2 giver en række eksempler på søgninger med kontroltegn Opgaver: Brug af kontroltegn De følgende opgaver beror på søgninger i KDK Du kan besvare opgaverne ved at udføre søgninger i KDK-2010 ved at udføre søgninger på søgeudtryk med kontroltegn og betragte de resulterende matchlister og konkordanser. 1. Hvor mange forekomster er der af ordet själ (stavet på denne måde) i KDK- 2010, og hvilke tekster stammer de fra? 2. Et af resultaterne af en søgning på uber # (altså den tyske præposition über uden prikker over u et fulgt af et vilkårligt ord) er uber cool. Hvad er en mulig grund til, at sprogbrugeren bag dette fund ikke anvender den måske mere normrette stavning übercool?

20 KAPITEL 2. HURTIGT I GANG Hvad er det hyppigste ord i KDK-2010, som begynder med über stavet på præcist denne måde? 4. Hvilke er de tre hyppigste navne (proprier), som begynder med Cirkus med stort C? 5. Hvad er det mest omtalte kapel (proprium) i KDK-2010? Og det næstmest omtalte? 6. Hvilke bøjningsformer af cirkus findes i KDK-2010? 7. Hvorfor findes formen cirkuset ikke, når man søger 8. Hvilken tvetydighed løber man ind i ved en søgning 9. Et af matchene i KDK-2010 er lærer slår eleverne. Hvordan skal dette match fortolkes? 10. Hvad er den hyppigste konstruktion, som matcher udtrykket flere ## end? Løsningsforslag findes i appendiks A Søgehistorik Samtlige søgninger, som du udfører i CoREST, registreres i en lokal søgehistorik på din maskine, altså en liste over dine seneste søgninger. Klik på informationsknappen»i«øverst til højre i CoREST-vinduet for at få adgang til historikken, som vises i et info-vindue, hvor der også er andre indstillingsmuligheder, jf. figur 3.21 på side 46. Søgehistorikken præsenterer sig som en liste med et søgeudtryk for hver linje. Simple søgeudtryk er altid oversat til det tilsvarende avancerede udtryk. Du kan læse mere om avancerede udtryk i kapitel 5. Du kan kopiere udtryk fra historikken og indsætte dem i søgefeltet for at udføre en bestemt søgning igen. Du kan vende tilbage til CoREST s hovedvindu ved at klikke på knappen»concordance«i bjælken over historikken. OBS! Søgehistorikken gemmes ikke, når du lukker CoREST. Hvis du vil gemme historikken, kan du kopiere alt indholdet fra historik-området over i en editor eller et tekstbehandlingsprogram og gemme det herfra. 2.7 Cache CoREST-klienten kommunikerer med CoREST-serveren over internettet. Udvekslingen af data over nettet kan være en tidskrævende faktor ved søgningen. For at få systemet til at reagere så hurtigt som muligt, gemmes alle data, som din CoRESTklient har hentet fra serveren, i en database på din maskine, en såkaldt cache. Får din klient på et senere tidspunkt brug for at hente de samme data igen, undersøger

21 KAPITEL 2. HURTIGT I GANG 21 den først, om de allerede ligger i cachen. Hvis det er tilfældet, hentes data direkte herfra i stedet for at bede serveren om at sende dem en gang til. Normalt behøver du ikke tænke over cachens tilstedeværelse. Hvis der dog optræder problemer med CoREST s funktionalitet, kan de ofte løses ved at slette cachens indhold. Problemer kan optræde, når en ny version af et korpus eller Co- REST tages i brug. Du tømmer cachen ved at klikke på knappen»empty Cache«i info-vinduet, jf. figur 3.21 på side 46.

22 Del II Indblik 22

23 Kapitel 3 Brugerinterfacets funktioner Alle ingredienserne 3.1 Alt om lister Matchliste Naboord Eksportere lister Alt om konkordanser Visning af konkordanser Reduktion af konkordanser Blade i konkordanser Sortere konkordanser Redigere konkordanser Eksportere konkordanser Vise tekstoplysninger Vise tekst og kontekst Umiddelbar kontekst Hele teksten Vise Ordsedler Vise ordoplysninger Brugerannoteringer Sådan annoterer du Annotere hurtigere i»repeat mode« Vise annoterede eksempler Indstillinger Skriftstørrelse Tømme søgecache

24 KAPITEL 3. BRUGERINTERFACETS FUNKTIONER Alt om lister Lister indeholder fundne ord, ordgrupper eller annoteringer. Når du klikker på et emne i en liste, vises korpusforekomster af det i konkordansfeltet. Der kan vises forskellige slags lister, som du vælger ved hjælp af listevælgeren, en rullemenu øverst til venstre over listen, jf. figur 3.1. Antallet af forskellige slags lister afhænger af det valgte korpus. Som regel vil følgende lister være tilgængelige: Matchliste vælg»matches«(er altid automatisk valgt efter en søgning), læs mere under iafsnit Naboord vælg»context«, læs mere i afsnit Brugerannoteringer vælg»tags«, læs mere i afsnit 3.6. OBS! I listerne vises fundene altid med forenklet ortografi, dvs. at store bogstaver er omsat til små og accenttegn er fjernet. I det følgende gennemgås matchlister og kollokationer. Annoteringer behandles under afsnit Matchliste Matchliste-visningen (jf. området matchliste i figur 2.4 på side 12) får du frem ved at vælge»matches«i listevælgeren, se figur 3.1. Som umiddelbart resultat af en søgning vises en alfabetisk sorteret matchliste og en tilhørende konkordans. I matchlisten vises alle enkeltord eller ordgrupper fra korpus, som matcher dit søgeudtryk. Øverst på listen står selve søgeudtrykket rykket lidt ind til højre, så det kan skelnes fra de andre ord på listen. Ud for hvert match vises en score, der angiver, hvor hyppigt pågældende match er blandt alle match. Alle match tilsammen sættes altid til (svarende til 100,00 %). Prøv fx en søgning på blockbuster.* i KDK-2010 og se, hvordan matchlisten kommer til at se ud. Oplysninger Søgeudtrykket blockbuster.* matcher alle forekomster af ord, der begynder med blockbuster inklusive blockbuster selv. Der er præcist 100 forekomster i KDK-2010, så sammenhængen mellem scoren og antallet af forekomster i korpus bliver særlig klart i dette tilfælde: Således udgør ordet blockbuster 72,00 % af alle match (score 7200) svarende til 72 forekomster i korpus, mens fx blockbusterbutikken har 1,00 % af alle match (score 100), som i dette tilfælde svarer til 1 forekomst i korpus. Sortering Som udgangspunkt er matchlisten sorteret alfabetisk på match. Du kan sortere den efter score eller i en anden orden (stigende eller faldende) ved at klikke (evt. gentagne gange) på Match eller Score i titelbjælken over listen. Eksempler i konkordansen Når du klikker på en linje i matchlisten, markeres første forekomst af pågældende match i konkordansen. Dette kræver dog, at konkordansen er sorteret på Match, hvad den som udgangspunkt er. Når

25 KAPITEL 3. BRUGERINTERFACETS FUNKTIONER 25 Figur 3.1: Matchliste for blockbuster.* matchlisten har fokus, jf. afsnit 2.3, kan du navigere fra linje til linje ved at bruge pil-op eller pil-ned på tastaturet. Taster du retur, vises første forekomst af det markerede match i konkordansen, hvis den er sorteret på Match. Eksport Du kan eksportere indholdet fra matchlisten som tekstfil ved at klikke på eksportknappen til højre i bjælken over listen. Tekstfilen er opbygget sådan, at der står ét match per linje sammen med scoren, som er adskilt fra matchet med et tabulatortegn. Filen kan nemt importeres i teksteditorer eller regneark Naboord Et naboord er et ord, der enten optræder hyppigt eller typisk i den umiddelbare omgivelse af et match. Man kalder matchet sammen med dets hyppige eller typiske naboord for kollokation. Den umiddelbare omgivelse af et match er i CoREST fastsat til to ord til højre for og to ord til venstre for matchet. Hvad er hyppige naboord? At et naboord er hyppigt, betyder, at det ofte optræder i forbindelse med matchet uden hensyn til naboordets udbredelse i korpus ellers. Hvad er typiske naboord? At et naboord er typisk, vil sige, at det statistisk set optræder påfaldende ofte sammen med matchet set i forhold til naboordets udbredelse i korpus ellers. En liste over naboord til dit aktuelle søgeudtryk får du frem ved at vælge»context«fra listevælgeren. Når du stiller listevælgeren på»context«, kommer der umiddel-

26 KAPITEL 3. BRUGERINTERFACETS FUNKTIONER 26 Figur 3.2: Hyppige naboord til venstre for rimelig bart til højre for den en rullemenu frem, hvor du kan vælge den type af naboord, som du vil se. Vi kalder denne rullemenu for kollokationstypevælgeren, som du kan se i figur 3.2. Vis hyppige naboord Som udgangspunkt står kollokationstypevælgeren på»frq- L«(Frequency Left), som betyder, at de hyppigst optrædende ord en til to pladser til venstre for rimelig vises i oversigten i figur 3.2 sorteret efter faldende hyppighed. Hyppigheds-scoren angiver ikke den absolutte hyppighed i korpus, men er et relativt tal ligesom i matchlisten. Stiller du typevælgeren på»frq-r«(frequency Right), vises tilsvarende de hyppigste ord en til to pladser til højre for matchet. Vis typiske naboord Ud over kollokationstyperne»frq-l«og»frq-r«findes typerne»log-l«og»log-r«. Når du vælger en af disse to kollokationstyper, laves listen ikke kun på baggrund af naboordenes absolutte hyppighed i konteksten, men hyppigheden sættes også i relation til, hvor hyppigt naboordene optræder i hele korpus. Til beregningen af listen anvendes en lettere tilpasset udgave af den statistiske signifikanstest log likelihood. Således viser»log-l«og»log-r«særligt påfaldende hyppigheder i konteksten, en høj værdi er udtryk for en særlig tiltrækning mellem matchet og pågældende naboord.»log«-kollokationstyperne egner sig blandt andet til at finde forskellige former for flerordsudtryk. Som eksempel kan du udføre en søgning på rimelig. Når søgningen er udført, skifter du listevælgeren fra»matches«til»context«, og kollokationstypevælgeren sætter du til»log-r«. Nu vises der en liste over naboord sorteret efter, hvor påfaldende de er, jf Eksportere lister Samtlige former for lister kan eksporteres som rene tekstfiler. Det gør du ved at klikke på eksportknappen i bjælken over listen, jf. figur 3.1 på foregående side, og

27 KAPITEL 3. BRUGERINTERFACETS FUNKTIONER 27 Figur 3.3: Typiske naboord til højre for rimelig vælge et filnavn og en placering i den dialogboks, der popper op. En eksporteret liste består af to kolonner, den ene med selve ordet, den anden med den talværdi, der knytter sig til ordet. De to kolonner er adskilt med et tabulatortegn. Eksporterede lister kan nemt importeres i andre programmer, fx tekstbehandlere eller regneark. 3.2 Alt om konkordanser Konkordanser (jf. området konkordans i figur 2.4 på side 12) viser fundne ord eller ordgrupper sammen med noget kontekst omkring, sådan som de optræder i den tekst, de stammer fra. I det følgende gennemgås de forskellige funktionaliteter, som knytter sig til konkordanser. Som illustration tjener resultatet af en søgning CoREST s konkordansområde med den øverste del af denne konkordans vises i figur 3.4. Visning af konkordanser I afsnit beskrives, hvordan en konkordans ser ud i CoREST. Reduktion af konkordanser I afsnit forklares, hvad det vil sige, at en konkordans er blevet reduceret, jf. antal forekomster og reduktion i figur 3.4. Blade i konkordanser I afsnit vises, hvordan du blader gennem en konkordans, jf. vælge konkordansside i figur 3.4. Sortere konkordanser I afsnit beskrives sorteringsmulighederne, jf. sortering i figur 3.4.

28 KAPITEL 3. BRUGERINTERFACETS FUNKTIONER 28 Figur 3.4: Reduceret konkordans Redigere konkordanser I afsnit beskrives korte annoteringer og sletning af konkordanslinjer. Eksportere konkordanser I afsnit vises, hvordan du eksporterer en konkordans, så du kan bruge den uden for CoREST, jf. eksport i figur Visning af konkordanser Konkordanser vises i konkordansområdet; det er den centrale del af CoRESTvinduet til højre for området med ordlister. En konkordans viser autentiske korpusforekomster af de fund, der matcher søgeudtrykket. Hver forekomst vises centreret på en linje med nogle ords kontekst omkring. Konkordansen er som udgangspunkt lige som matchlisten sorteret alfabetisk på matchet. I konkordanser vises eksemplerne altid i en ortografi, som er så tæt på den oprindelige, som muligt i modsætning til ordlisterne, som vises i en forenklet ortografi, jf. afsnit 3.1. Tvungne linjeskift fra den oprindelige tekst vises som tegnet i konkordanserne Reduktion af konkordanser I en konkordans kan der maksimalt vises 2000 fund fordelt på 20 sider med 100 fund per side. Hvis der er flere match i korpus, reduceres antallet af viste fund automatisk til Antallet af fund og en eventuel reduktion oplyses i bjælken over konkordansen, jf. antal forekomster og reduktion i figur 3.4. En reduktion laves jævnt fordelt over hele korpus, hvis korpusset har en størrelse på under 100 millioner ord. Her er det med andre ord altså ikke kun de 2000 første fund, du får vist, men et udpluk taget fra hele korpus. Hvis korpusset, som

29 KAPITEL 3. BRUGERINTERFACETS FUNKTIONER 29 du søger i, har et omfang på over 100 millioner ord, vises kun de første 2000 fund fra korpus. 1 Hvis du vil se samtlige match, som dit søgeudtryk har i korpus, må du indsnævre søgningen. I figur 3.4 viser de første to linjer eksempler på brugen af formen advokatundersøgelse. Hvis du vil se flere eller samtlige forekomster af denne form i korpus, kan du fx søge på udtrykkene advokatundersøgelse og du vil da få vist samtlige 18 hhv. 27 fund, da der er under Det kan i øvrigt være en fordel at afslutte et søgeudtryk, der giver mange match, med # eller [], som begge betyder efterfulgt af et vilkårligt ord, idet du så får et søgeresultat, hvor både matchlisten og konkordansen er sorteret efter det følgende ord, og det vil gøre det meget lettere at orientere sig i mængden af fund Blade i konkordanser Du kan blade frem og tilbage fra side til side i konkordansen ved at klikke på pileknapperne øverst til venstre over konkordansen, eller du kan springe direkte til en bestemt side ved at vælge den i rullemenuen umiddelbart til højre for pileknapperne, jf. vælge konkordansside i figur 3.4. I rullemenuen oplyses den aktuelt viste side. Hvis konkordansområdet er aktivt (blå ramme omkring konkordansen), kan du i øvrigt også blade frem og tilbage ved at bruge pil-venstre og pil-højre på dit tastatur Sortere konkordanser En konkordans kan sorteres på forskellige måder. Du kan vælge sorteringen i sorteringsrullemenuen sortering, jf. figur 3.4. Som udgangspunkt er konkordansen sorteret alfabetisk på match (»Match sorted«), altså på samme måde som matchlisten. Andre muligheder er»corpus order«,»left sorted«og»right sorted«. Match sorted Alfabetisk sortering på matchet. Dette er standardsorteringen. Corpus order Med denne sortering vises eksemplerne i den rækkefølge, som de har i korpusset. Rækkefølgen afspejler dermed opbygningen af korpus. For korpusset KDK-2010 er teksterne fx ordnet efter, hvilke kilder de stammer fra, mens de i det DSL-interne korpus KDK-MONITOR er ordnet kronologisk, således at de nyeste eksempler står øverst, og eksemplerne bliver ældre, jo længere du ruller ned gennem konkordansen. Left sorted Sortering på venstre kontekst. Sorteringen sker fra højre mod venstre, altså baglæns, således at ord, der ender på a, kommer før ord, der ender på b, osv. 1 Det er kun KDK-MONITOR, som er på over 100 millioner ord. Dette korpus er ordnet kronologisk, således at det nyeste materiale altid ligger først. De første 2000 fund vil altså samtidig være de 2000 nyeste.

30 KAPITEL 3. BRUGERINTERFACETS FUNKTIONER 30 Right sorted Sortering på højre kontekst. Sorteringen sker fra venstre mod højre, således at ord, der begynder med a, kommer før ord, der begynder med b, osv Redigere konkordanser Du kan markere bestemte match med dine egne oplysninger, som du kan definere, så de passer til dit behov, fx at holde forskellige betydninger af et match ud fra hinanden eller de forskellige sproglige konstruktioner, som matchet indgår i, markere gode eksempler eller sproglige fejl af forskellig art. Vi skelner mellem to typer for markeringer: mærker og annoteringer. I dette afsnit behandler vi kun mærker, mens annoteringer bliver behandlet i afsnit 3.6. Mærker består af ét enkelt bogstav eller ciffer, som vises i kolonnen til højre for konkordansen. Hvilke bogstaver eller cifre, du vil bruge til at markere bestemte egenskaber ved konkordanslinjen med, er op til dig. Fx kan du give gode eksempler et A som mærke og give forskellige betydninger af et ord cifrene 0 9. Der kan dog kun sættes ét mærke på hvert match. Sætter du et mærke på et match, der har et i forvejen, bliver det oprindelige erstattet af det nye. Sætte mærker Klik på konkordansområdet for at gøre det aktivt, eller gør det aktivt ved at bruge tabulatortasten (gentagne gange). Det er aktivt, når der er en blå ramme omkring, jf. afsnit 2.3. Rul med piletasterne til den linje i konkordansen, som du vil forsyne med et mærke eller klik på den. Tast dernæst et bogstav eller et ciffer. Konkordanslinjen er nu mærket. Slette konkordanslinjer Et særligt mærke er bindestregen (minus), som sletter eller snarere undertrykker konkordanslinjen. Dette markeres i konkordanslinjen ved, at kun matchet står tilbage, mens konteksten fjernes. Hermed vises, at der står en konkordanslinje her, som du ikke ønsker at se længere. Denne særlige funktionalitet kan være nyttig ved eksport af konkordanslinjer: Linjer, der er mærket med bindestreg, kommer nemlig ikke med i eksporten. Se mere om eksport af konkordanser i afsnit Fjerne mærker Du kan fjerne et mærke igen ved at markere pågældende linje og taste mellemrum. På denne måde kan du også genoplive undertrykte linjer. Figur 3.5 viser et lille udsnit af en konkordans på blad, hvor match i betydningen tidsskrift er markeret med 1, mens 2 markerer match i betydningen plantedel. Læg mærke til, at tre af linjerne er blevet undertrykt. Hvis dit match omfatter flere ord, knyttes mærket altid til hele matchet. For eksempel finder blandt andet matchet reducere bygningens energiforbrug i KDK Hvis du nu sætter et mærke, for eksempel V ud for pågældende konkordanslinje, vedrører det kun dette match. I

31 KAPITEL 3. BRUGERINTERFACETS FUNKTIONER 31 Figur 3.5: Konkordans med mærker en efterfølgende søgning på $bygningens energiforbrug vil du se, at der ikke længere er et mærke ud for pågældende konkordanslinje. Det samme gælder for eksempel for en efterfølgende søgning på reducere bygningens. Først når reducere bygningens energiforbrug matcher i sin helhed, vises mærket igen, uanset hvilket søgeudtryk der ellers medfører dette match. I afsnit 3.6 vises, hvordan du kan genfinde de eksempler i korpus, som du har givet en mærke uden at skulle lave et passende søgeudtryk. OBS! Brugermarkeringer lægges lokalt på den computer, som du arbejder på. Derfor bør du altid arbejde med samme computer, når du bruger mærker eller annoteringer Eksportere konkordanser Du kan eksportere en konkordans i form af en tekstfil ved at klikke på eksportknappen eksport yderst til højre i bjælken over konkordansen, jf. figur 3.4 på side 28. Tekstfilen er struktureret sådan, at hver linje svarer til en konkordanslinje, hvor matchet altid er omgivet af tabulatortegn. Linjen afsluttes med et tabulatortegn evt. efterfulgt af et mærke, jf. afsnit Vær opmærksom på, at konkordanslinjer, som er markeret med en bindestreg (undertrykte konkordanslinjer) ikke kommer med under eksporten. De er med andre ord endegyldigt slettet fra den eksporterede konkordans. En linje i en eksporteret konkordans er struktureret på følgende måde: [venstre kontekst] <tab> [match] <tab> [højre kontekst] <tab> [evt. mærke] Eksporterede konkordansfiler kan nemt importeres i tekstbehandlingssystemer, regneark, eller de kan behandles videre på anden vis. Figur 3.6 viser det mærkede konkordansafsnit fra figur 3.5 importeret i et regneark.

32 KAPITEL 3. BRUGERINTERFACETS FUNKTIONER 32 Figur 3.6: Eksporteret konkordansudsnit i regneark Figur 3.7: Centrale tekstoplysninger 3.3 Vise tekstoplysninger Tekstoplysninger vises i det første af de fire felter under konkordansen (jf. området tekstoplysninger i figur 2.4 på side 12). Her vises altid oplysninger om den tekst, som den aktuelt markerede konkordanslinje stammer fra. Figur 3.7 viser de oplysninger, som vedrører den markerede (første) konkordanslinje i konkordansen med mærker fra figur 3.5 på foregående side. I denne visning er udvalget af oplysninger altid begrænset til de mest centrale. For KDK-2010 s vedkommende er det oplysninger, som er nærmere forklaret i tabel 3.1. Du kan evt. få mere udførlige tekstoplysninger at se ved at klikke på»+«- knappen i bjælken over oplysningsfeltet. Visse kombinationer af CoREST-udgaver og bestemte korpora tillader ikke visningen af udførlige tekstoplysninger. De udførlige tekstoplysninger for teksten er vist i figur 3.8. De udførlige tekstoplysninger kan eksporteres som HTML ved at klikke på eksportknappen yderst til højre i bjælken over tekstoplysningerne. En gennemgang af samtlige oplysningstyper og deres mulige værdier findes i Asmussen Vise tekst og kontekst Konkordanslinjer er altid opbygget sådan, at selve matchet vises centreret med nogle ords kontekst omkring. I mange tilfælde er denne snævre kontekst nok til, at du kan få en idé om, hvordan ordet er brugt i teksten. Nogle gange er det imidlertid nødvendigt at se noget mere kontekst, end der umiddelbart kan vises i en konkordanslinje.

33 KAPITEL 3. BRUGERINTERFACETS FUNKTIONER 33 Oplysning ID Title Edition Publisher Date Name Role Beskrivelse Det unikke tekst-id, som alle korpustekster i DSL s samlinger har. Id et er altid et 10-cifret tal Tekstens titel Avisens eller tekstsamlingens navn, hvis teksten stammer fra en sådan kilde Forlagets navn Udgivelsesdatoen Navne på de personer, som har haft med teksten at gøre, og deres roller Tekstproducenternes roller: Som regel er det kun author (forfatter), som er nævnt her, men i princippet kan det også være editor (udgiveren) eller translator (oversætteren). Der kan også være anført navne på flere forfattere, udgivere eller oversættere, hvis det er relevant. I eksemplet i figur 3.7 er navnet på forfatteren ukendt, hvorfor der står et spørgsmålstegn det pågældende sted. Tabel 3.1: Oversigt over centrale tekstoplysninger Figur 3.8: Udførlige tekstoplysninger

34 KAPITEL 3. BRUGERINTERFACETS FUNKTIONER 34 Figur 3.9: Kopiering fra kontekstfeltet Umiddelbar kontekst Noget mere kontekst, end hvad der kan vises i selve konkordanslinjen, får du i området med konkordanslinjeoplysningerne under konkordansen, i det andet felt fra venstre (jf. området kontekst i afsnit 2.4 på side 12). Selve matchet i dette felt er markeret med gult og står som regel mere eller mindre i midten af feltet. Fra dette felt kan du kopiere en tekstpassage på samme måde, du kan i de fleste andre programmer i dit system, fx ved at markere det område, du vil have med, højreklikke med musen og vælge»copy«i den lokale menu, der popper op. Du kan herefter indsætte den kopierede passage i andre programmer, fx i en tekstbehandling eller et ordbogsredigeringssystem. Figur 3.9 viser det med en passage omkring matchet spillefilm (i dette tilfælde efter en søgning Afhængig af din CoREST-udgave og det valgte korpus egenskaber kan du evt. også kopiere den markerede passage som xml-stump, der egner sig til at blive sat ind i et xml-baseret redigeringsværktøj. I xml-stumpen indgår der også oplysninger om tekstens kilde. Du kopierer en markeret passage som xml ved at klikke på taleboblen over kontekstfeltet. xml-stumpens opbygning er lavet specielt med henblik på at kunne indsætte autentiske citater i Den Danske Ordbogs artikler. I den nuværende version af Co- REST kan opbygningen ikke ændres af brugeren. Den markerede passage i illustrationen som xml-stump ser således ud: <Citat> <txt>denne formidable komiker og habile skuespillers talent skal udmønte sig i en spillefilm med mere stil og pondus</txt> </Citat> <Kilde> <DDOkilde> </DDOkilde> <Kildeid> </Kildeid> </Kilde>

35 KAPITEL 3. BRUGERINTERFACETS FUNKTIONER 35 Figur 3.10: Visning af hele teksten Hele teksten I visse udgaver af CoREST er det muligt i nogle korpora også at se hele teksten omkring et fund. Af ophavsretlige grunde er det ikke muligt at se hele tekster i offentligt tilgængelige versioner af CoREST. Hvis du vil se teksten, som et fund stammer fra, i sin helhed, skal du klikke på»plus«-knappen over kontekstfeltet. Herefter udvides det til at fylde hele området under konkordansen. Figur 3.10 illustrerer, hvordan kontekstvisningen ser ud. Øverst i bjælken over selve teksten vises et par tekstoplysninger, nemlig titel (Rig reklamesøjle), evt. titlen på bladet eller samlingen, som teksten stammer fra (Se og Hør) samt udgivelsestidspunktet (24. marts 2011). I selve teksten er fundet markeret med gult. Du kan rulle igennem teksten ved hjælp af rullebjælken til højre for teksten. Ligesom under visningen af den umiddelbare kontekst (afsnit 3.4.1), kan du kopiere tekst som ren tekst ved at markere teksten, højreklikke og vælge kopier fra den lokale menu, eller som xml-stump med kildeoplysninger til indsætning i ordbogsredigeringssystemer ved at markere den ønskede tekstpassage og klikke på taleboblen over teksten. Du kan endvidere eksportere teksten som en html-formateret fil, som fx kan vises i en webbrowser og fx udskrives herfra. Hvis du ruller op eller ned i teksten og senere gerne vil hoppe tilbage til selve fundet, kan du klikke på den cirkelformede knap vis fund, jf. figuren. Hvis du bruger Ømål-udgaven af CoREST (jf. afsnit 1.2) sammen med dialektkorpusset DIAKO, kan du endvidere få vist konteksten i form af en klassisk, som du også kan udskrive Vise Ordsedler I Ømål-udgaven af CoREST (jf. afsnit 1.2) kan en mindre del af konteksten vises i form af en klassisk ordseddel, som du kan skrive ud på papir, klippe ud og opbevare i en kartotekskasse. For at få denne visning sætter du hak i boksen»show as

36 KAPITEL 3. BRUGERINTERFACETS FUNKTIONER 36 Figur 3.11: Ordseddelvisning i Ømål-udgaven Card«i panelet over kontekstfeltet. Boksen er kun synlig, hvis DIAKO-korpusset er valgt. Figur 3.11 illustrerer, hvordan ordseddelvisningen tager sig ud. I panelet over tekstfeltet ser du tekst-id et ( ), som giver en indikation af, hvilket sogn den interviewede person stammer fra (1162, hvilket er på Ærø) samt i hvilket år interviewet blev optaget (1981). Disse oplysninger gentages på selve sedlen øverst til højre sammen med flere oplysninger om de(n) interviewede. I panelet er der sat hak i feltet»show as Card«fjerner du hakket, vises hele teksten i stedet for kortet. I tekstfeltet, som i illustrationen er markeret med Opslagsord, kan du skrive stikordet eller opslagsordet for sedlen, i eksemplet lokomobil, sb. Du kan samle flere sedler i form af en stak, idet du for hver seddel klikker på knappen»add to Stack«. Antallet af kort i stakken vises til højre for knappen. På denne måde kan du samle flere sedler. Du kan få vist alle kortene i stakken på en gang, idet du sætter hak i feltet»show«, herefter har du mulighed for at udskrive eller eksportere hele stakken på en gang. Du udskriver enkelte ordsedler eller stakke ved at klikke på knappen med printersymbolet. I forbindelse med udskrivningen kommer der ingen særlig dialogboks frem! Sedlen eller stakken udskrives uden videre tilbagemelding til din default-printer! Hvis printeren ikke er tilgængelig, sker der ingenting! Du kan også eksportere sedler eller stakke til html ved at klikke på eksportsymbolet, jf. beskrivelsen i afsnit og figur En mere detaljeret beskrivelse af ordsedlernes opbygning findes i en særskilt intern manual på Ømålsordbogens redaktion.

37 KAPITEL 3. BRUGERINTERFACETS FUNKTIONER 37 Figur 3.12: Ordoplysninger om ordklasse og bøjning 3.5 Vise ordoplysninger Til hvert ord i et korpus er der knyttet en række oplysninger. Oplysningerne kan godt være forskellige fra korpus til korpus. Du kan se en oversigt over de ordoplysninger, som bruges i alle KDK-korpora, i afsnit 5.2. I det tredje oplysningsfelt under konkordansen (jf. området ordoplysninger i figur 2.4 på side 12) vises ordet med den ortografi, det havde i den originale korpustekst, sammen med ordklasse- og bøjningsoplysninger. Figur 3.12 viser et eksempel fra en søgning på $med hensyn til. Ordklasse- og bøjningsoplysningerne gives som en kode, et såkaldt tag af følgende tilsnit: OU:nnnn:vv:dddd Her har de enkelte dele følgende betydninger: O betegner ordklassen, fx N for substantiv, V for verbum, A for adjektiv U betegner en underklasse til ordklassen, hvis det er relevant (ellers står der blot en bindestreg); ved verber fx F for finit, I for infinitiv, M for imperativ På de fire pladser betegnet n står der oplysninger, der vedrører den nominale bøjning af ordet De to v-pladser giver oplysninger om den verbale bøjning De fire afsluttende d-pladser bruges til forskellige oplysninger, fx om adjektivers gradbøjning eller pronomeners person.

38 KAPITEL 3. BRUGERINTERFACETS FUNKTIONER 38 Figur 3.13: Ordoplysninger i KDK-korpora En detaljeret gennemgang af ordklassetaggets opbygning finder du i afsnit 5.3. Her beskrives også, hvordan du kan bruge disse oplysninger i dine søgninger. Ved at klikke på»+«-knappen i panelet over ordoplysningsfeltet får du vist udvidede ordoplysninger. Figur 3.13 viser samtlige oplysninger, der knytter sig til hvert ord i KDK I det følgende vil oplysningstyperne blive gennemgået kolonne for kolonne. 1. kolonne: Ordet i forenklet ortografi (jf. afsnit 3.1); det er denne form, som der som udgangspunkt søges på i CoREST. 2. kolonne: Ordet i den ortografi, det havde i den oprindelige korpustekst. 3. kolonne: Tegn, der adskiller ordet fra det følgende ord, til højre for i teksten; som regel er der blot tale om et mellemrum, som gengives som en understregningsstreg i visningen, men ofte vil der også være interpunktionstegn, således følger der._ (punktum og mellemrum) efter ordet indtjening i eksemplet i figur kolonne: Ordet i dets grundform (lemma), dvs. den form man vil slå det op under i en ordbog.

39 KAPITEL 3. BRUGERINTERFACETS FUNKTIONER 39 Figur 3.14: Brugerannoteringer vises og redigeres i dette felt 5. kolonne: Ordets ordklasse; der bruges forkortelser bestående af ét stort bogstav; en komplet liste over anvendte forkortelser og deres betydninger findes i afsnit kolonne: Udvidede ordklasse- og bøjningsoplysninger; læs mere afsnit 5.3. Du kan eksportere de udvidede ordklasseoplysninger i form af et html-dokument ved at klikke på eksportknappen yderst til højre i panelet. I afsnit kan du læse om, hvordan et ord grundlæggende er defineret i Co- REST, og hvordan du kan bruge ordoplysningerne i dine søgninger. OBS! I andre korpora, som ikke er en del af KDK-gruppen, fx dialektkorpusset DI- AKO, vil der typisk være andre ordoplysninger end dem, der er beskrevet her. 3.6 Brugerannoteringer I afsnit behandlede vi mærker, dvs. selvvalgte bogstaver eller cifre, som du kan markere et match i en konkordanslinje med. På denne måde kan du bedre skelne de konkordanslinjer, der har noget tilfælles, fra de øvrige. En mere avanceret måde at markere bestemte match på er at bruge annoteringer. I de fire felter under konkordansen vises oplysninger, som vedrører den aktuelt markerede konkordanslinje. Det sidste af disse felter (længst til højre, jf. området brugerannoteringer i figur 2.4 på side 12) viser eventuelle brugerannoteringer og bruges til at redigere brugerannoteringer med. Feltet er også vist i figur Sådan annoterer du Som et eksempel på anvendelsen af brugerannoteringsfunktionaliteten vil vi prøve at annotere et antal forekomster af bevægelse (kun denne form) med de forskellige betydninger, dette ord kan have. Figur 3.15 viser de første ti linjer af en konkordans, sorteret på match, på søgeudtrykket bevægelse i KDK I det første eksempel, Den Forenede Nationale Bevægelse, er der tale om en organisation, i det andet og tredje, har vi en fysisk flytning, mens det fjerde er en ikkefysisk forandring. Vi vil oprette brugermarkeringerne organisation, flytning

40 KAPITEL 3. BRUGERINTERFACETS FUNKTIONER 40 Figur 3.15: Konkordans på bevægelse og forandring 2 til disse tre betydninger. I det følgende gennemgås annoteringsprocessen for de 10 linjer i konkordansudsnittet i figur Vi begynder med den første linje i konkordansen Den Forenede Nationale Bevægelse : Sørg for, at linjen er markeret som i illustrationen ved for eksempel at klikke på den. I brugerannoteringsfeltet (figur 3.14) indtaster du i feltet»add user tag«organisation og taster herefter retur. 2. Markér nu anden konkordanslinje månens bevægelse omkring Jorden og indtast flytning i»add user tag«-feltet, afslut med retur. 3. Tredje linje Jordens bevægelse omkring solen skal også annoteres med flytning. På dette tidspunkt kender CoREST allerede annoteringen flytning og vil foreslå den i en lille pop op-menu under indtastningen, jf. figur Husk at afslutte indtastningerne af annoteringer med tast på retur. 4. en bevægelse mod flere mandlige ansøgere annoteres med forandring. 5. et marked, der er i konstant bevægelse og forandring annoteres med forandring. 6. fire gennemgående temaer: Bevægelse Kredsløb Kommunikation Konstruktion annoteres med flytning. 7. En sådan bevægelse i Fed s holdning annoteres med forandring. 8. Kontrolrummet, hvor hver eneste bevægelse på hotellet følges nøje annoteres med flytning. 2 Det er ligegyldigt, om du bruger store eller små bogstaver, bare du gør det konsekvent, idet CoREST skelner mellem store og små bogstaver, så markeringen BRUGERANNOTERING er forskellig fra Brugerannotering, som er forskellig fra brugerannotering.

41 KAPITEL 3. BRUGERINTERFACETS FUNKTIONER 41 Figur 3.16: Autofuldførelse under indtastning af brugerannoteringer 9. med samlede hænder i en bevægelse væk fra kroppen annoteres med flytning. 10. Regnskabet bliver altså katalysatoren for den nye»bevægelse«annoteres med forandring. For hver annotering bliver der automatisk sat en lille stjerne i kolonnen til højre for konkordansen ud for den linje, som annoteringen vedrører. Stjernen viser kun, at pågældende match er annoteret, men ikke hvordan. Derfor skal du markere konkordanslinjen (klikke på den eller aktivere konkordansfeltet og rulle til den ønskede linje ved hjælp af piletasterne) for at se annoteringen i brugerannoteringsfeltet. Til et match kan der sagtens knyttes flere forskellige annoteringer (mens der derimod kun kan være ét mærke knyttet til, jf. afsnit 3.2.5). For eksempel kan vi udvide vores annoteringer med en grammatisk oplysning om, hvorvidt bevægelse indgår i en styrelse i en præpositionsforbindelse (populært sagt: om der står en præposition et passende sted til venstre for). Hvis bevægelse optræder i en styrelse, annoterer vi det med +præp. I følgende eksempler fra konkordansudsnittet i figur 3.15 optræder bevægelse i en præpositionsstyrelse: i konstant bevægelse (linje 5) i en bevægelse væk fra kroppen (linje 9) katalysatoren for den nye "bevægelse" (linje 10) Ud over at disse fund allerede er annoteret med en betydningskategori ovenfor, annoterer vi dem nu også med +præp. Figur 3.17 viser annoteringerne for det næstsidste fund i konkordansudsnittet, linje 9. Du kan her se, at matchet bevægelse i eksemplet med samlede hænder i en bevægelse væk fra kroppen er annoteret med taggene flytning og +præp. Du kan også se, at der i annoteringsfeltet til højre for hver annotering står selve matchet fra konkordansen, her "bevægelse". Med udgangspunkt i dette eksempel vil vi nu udvide jagten efter forekomster af bevægelse i simple præpositionsforbindelser med præpositionen i.

42 KAPITEL 3. BRUGERINTERFACETS FUNKTIONER 42 Figur 3.17: Annoteringer til et match Figur 3.18: Annoteringer, som kun vedrører en del af matchet For ikke at få for mange eksempler på præpositionsforbindelser udfører vi kun en simpel søgning på $i en bevægelse i KDK-2010, som finder alle tekstsekvenser i korpus, som præcist matcher i en bevægelse. Søgningen vil tage noget tid at udføre (ca. 10 sekunder), da der er mange forekomster af både i og en i korpus, se i øvrigt afsnit om søgehastighed. Der er 24 match i KDK-2010, som vi vil annotere som præpositionsforbindelser med i med tagget +præp-i. Inden vi går i gang med det, vil vi dog lige sikre os, om eksemplet i en bevægelse væk fra kroppen fra før også er med: Det findes ca. midt i konkordansen. Selvom det ikke var matchet i en bevægelse, vi taggede ovenfor, men kun bevægelse, er der en stjerne til højre for konkordanslinjen, som betyder, at enten hele matchet eller en del af det er annoteret. Hvis du stiller markøren på pågældende linje, ser du, at der findes to annoteringer til matchet, +præp og flytning, men at disse dog kun vedrører "bevægelse" i matchet, se figur Annotere hurtigere i»repeat moderepeat mode«er en hurtigere metode at annotere flere fund med samme tag. For at illustrere metoden vil vi tagge samtlige match i konkordansen med fundene i en bevægelse. Alle fund er præpositionsforbindelser med præpositionen i og skal derfor have tagget +præp-i. Selvom der kun er 24 eksempler i konkordansen, som

43 KAPITEL 3. BRUGERINTERFACETS FUNKTIONER 43 Figur 3.19: Overlappende annoteringer vi skal forsyne med samme annotering, er det en noget omstændelig opgave at skulle skrive annoteringen så tit, hvis vi følger fremgangsmåden under 3.6.1, selvom autofuldførelsen hjælper lidt. Opgaven bliver dog lidt enklere, hvis vi vælger»repeat mode«som annoteringsmodus i stedet for standardindstillingen»append mode«, jf. figur For at annotere i»repeat mode«skal du gøre følgende: 1. Annotér først et fund med de annotationer, du vil genbruge på flere følgende eksempler. I dette tilfælde markerer du den første linje i konkordansen og annoterer den med +præp-i. 2. Vælg herefter»repeat mode«i rullemenuen over»add user tag«-feltet som ny annoteringsmodus. Nu er listen med annotationerne grånet ud, og du kan ikke hverken tilføje (»append«) eller slette annoteringer i annotationsfeltet. 3. Ved hjælp af piletasterne eller ved hjælp af musen markerer du den næste konkordanslinje, der skal annoteres og taster retur. Herefter tilføjes de grånede annotationer fra listen automatisk til denne linjes match, allerede eksisterende annotationer for matchet bevares samtidig. Når du på denne måde har annoteret hele konkordansen, kan du igen stille dig på eksemplet i en bevægelse væk fra kroppen. Du vil se, at der nu er knyttet tre annoteringer til matchet: to som vedrører bevægelse alene (+præp og flytning) og ét, som vedrører hele matchet i en bevægelse. Det er således muligt at lave overlappende annoteringer og få vist dem alle, selvom de kun vedrører en del af matchet, jf. figur Opgave: Annoteringer Prøv at lave en konkordans på søgeudtrykket strømning i KDK Hvor mange match vises i konkordansen? Prøv at annotere samtlige match semantisk. I hvilket omfang er det muligt at genbruge tags, som blev oprettet under annoteringen af

44 KAPITEL 3. BRUGERINTERFACETS FUNKTIONER 44 Figur 3.20: Liste over annoteringer konkordansen på bevægelse? Hvilke metoder kan du foreslå til en mere rationel annotering af konkordanser. Løsningsforslag findes i appendiks A Vise annoterede eksempler Samtlige annotationer, som du definerer under dit sproglige analysearbejde med konkordanser, samles i en liste, som du kan se ved at vælge»tags«i listevælgeren (se figur 3.1 på side 25). Lad os som eksempel vende tilbage til den tidligere søgning på bevægelse, som vi forudsætter, du har tagget som beskrevet i afsnit Gentag søgningen på bevægelse. Når søgningen er afsluttet, vælger du»tags«i listevælgeren. Du bliver nu præsenteret for en liste som vist i figur figur På listen ser du som udgangspunkt kun de tags, som vedrører søgningen bevægelse. Et klik på et af dem viser tilhørende konkordanslinjer i konkordansfeltet. På denne måde er det muligt at se beslægtede (det vil sige identisk annoterede) konkordanslinjer samlet. Det er ikke muligt at annotere videre på sådan en delkonkordans eller at sætte mærker. Dette kan kun ske i den originale konkordans, som er baseret på et søgeudtryk, ikke på et bestemt tag. Derfor er annoteringsfeltet under konkordansen inaktivt (grånet ud), når annoteringslisten vises. En brugerannoteret konkordans identificeres på søgeudtrykket. Forskellige søgeudtryk betyder annoteringsmæssigt forskellige konkordanser, selvom matchene er (næsten) ens, for eksempel giver en søgning på bevægels. i KDK-2010 (alle ord, som begynder med bevægels fulgt af ét vilkårligt bogstav) nøjagtigt samme resultat som søgningen på bevægelse, men annoteringsteknisk er der tale om en anden

45 KAPITEL 3. BRUGERINTERFACETS FUNKTIONER 45 konkordans og listen»tags«er derfor tom i dette tilfælde (med mindre der i en anden sammenhæng er blevet annoteret på netop denne konkordans) Ud over konkordansspecifikke annoteringer kan annoteringslisten også vise samtlige annoteringer for hele korpus. Du ændrer visningen fra konkordans til hele korpus ved at vælge»corpus«i stedet for»kwic«i skopusvælgeren til højre over listen, jf. figur Når de samme annoteringer er brugt for match, som er fremkommet på baggrund af forskellige søgeudtryk som i tilfældet bevægelse og strømning ovenfor, får du præsenteret fundene samlet, når du klikker på tagget. For eksempel havde både bevægelse og strømning en fysisk betydning, som vi annoterede flytning ovenfor. Klikker du nu på annoteringen flytning får du vist flytning-fundene fra begge de oprindelige konkordanser samlet. Ved hjælp af annoteringsfunktionen er det således muligt for eksempel at samle vidt forskellige eksempler på bestemte betydninger. Kun fantasien sætter grænser her. OBS! Annoteringer lægges lige som mærker lokalt på den computer, som du arbejder på. Derfor bør du altid arbejde med samme maskine, når du bruger annoteringer. 3.7 Indstillinger I CoREST kan du skifte til et særligt vindue, hvor du dels kan se søgehistorikken, jf. afsnit 2.6, dels foretage brugerindstillinger. Du skifter til dette vindue ved at klikke på informations-knappen»i«øverst til højre i CoREST-standardvinduet, jf. figur 2.4 på side Skriftstørrelse I den nuværende version af CoREST er det kun skærmskriftstørrelsen, du selv kan indstille. Dette gør du ved at bevæge skyderen»font Size«til venstre (mindre skrift) eller til højre (større skrift) med musen. Skriftstørrelsen ændres umiddelbart. Vil du vende tilbage til systemets standardskriftstørrelse, klikker du på knappen»default«til højre for skyderen, jf. figur Tømme søgecache Du kan endvidere tømme søgecachen på din maskine, jf. også afsnit 2.7. Det gør du ved at klikke på knappen»empty Query Cache«, jf. figur Normalt skulle det ikke være nødvendigt at tømme cachen, men har du mistanke om, at noget opfører sig unormalt, fx at søgninger ikke medfører sandsynlige resultater, kan det være en løsning at tømme cachen.

46 KAPITEL 3. BRUGERINTERFACETS FUNKTIONER 46 Figur 3.21: Indstillinger og søgehistorik

47 Kapitel 4 Søgning med jokertegn En gryderet med punktummer og stjerner 4.1 Hvad er jokertegn? Operatorer Jokertegnet punktum Gentagelsessymboler Symboler med særlig betydning Eksempler på brug af jokertegn Hvad er jokertegn? I CoREST kan du udføre søgninger med jokertegn. Ved hjælp af jokertegn opbygges såkaldte regulære udtryk, dvs. søgeudtryk med en vis variabilitet med hensyn til, hvad de matcher i korpus. I afsnit 2.4 brugte vi allerede.* (punktum stjerne) i betydningen nul, ét eller flere bogstaver må matche på dette sted. Således matchede.*telefon alle de ord i korpus, som ender på telefon inklusive selve ordet telefon. Både.* og.*telefon er regulære udtryk. Efter en grundlæggende definition af, hvad et regulært udtryk er, skal vi i dette kapitel se på, hvad de kan bruges til, når du søger i et korpus. Definition af regulært udtryk: Et regulært udtryk (i det følgende blot udtryk) består af ét eller flere tegn, evt. kombineret med operatorer. tegn et tegn er ét bogstav eller ét ciffer, fx a, b, Å, q eller 9 operator en operator beskriver en særlig funktion, som gælder for et tegn eller en gruppe gruppe en gruppe samler et udtryk til en enhed, der funktionelt betragtes, som var den ét tegn 47

48 KAPITEL 4. SØGNING MED JOKERTEGN 48 Udtryk a.ryl...sætte c...ing Match i KDK-2010 (forenklet ortografi) acryl, akryl, arryl frisætte, hensætte, indsætte, knæsætte, lyssætte, modsætte, nedsætte, nulsætte, tilsætte, undsætte,... coaching, crossing, catering, changing, cityring, charming, clearing, clubbing, crawling,... Tabel 4.1: Eksempler på brug af jokertegnet punktum 4.2 Operatorer Gennemgangen af operatorerne kan måske virke en anelse formel, men meningen burde senest blive klar, når vi når til eksemplerne i afsnit Jokertegnet punktum Der findes i virkeligheden kun én operator, som fungerer som jokertegn, nemlig punktum. Et punktum i søgeudtrykket betyder, at der på punktummets plads skal stå præcist ét vilkårligt tegn. Tabel 4.1 viser en række eksempler med tilhørende match i KDK Gentagelsessymboler Tabel 4.2 lister symboler, der bruges til at angive, hvor tit det forudgående tegn eller den forudgående gruppe skal eller kan gentages. En gruppe oprettes ved at samle tilhørende tegn og operatorer mellem runde parenteser, jf. oversigten med eksempler i afsnit 4.3. Symbol Betydning? nul eller én forekomst af forudgående tegn eller gruppe * nul, én eller flere forekomster af forudgående tegn eller gruppe + én eller flere forekomster af forudgående tegn eller gruppe {n} {n,m} {n,} præcist n forekomster af forudgående tegn eller gruppe mellem n og m forekomster af forudgående tegn eller gruppe mindst n forekomster af forudgående tegn eller gruppe Tabel 4.2: Gentagelsessymboler

49 KAPITEL 4. SØGNING MED JOKERTEGN Symboler med særlig betydning Tabel 4.3 lister symboler med en særlig betydning i regulære udtryk. Symbol (u) Betydning runde parenteser samler et udtryk u til en gruppe pågældende sted i udtrykket [t 1 t 2 t 3... t n ] kantede parenteser definerer en mængde af tegn t 1 t 2 t 3... t n, hvoraf ét skal matche pågældende sted i udtrykket [^t 1 t 2 t 3... t n ] kantede parenteser med cirkumfleks-tegnet (^) umiddelbart efter åbningsparentesen definerer en mængde af tegn t 1 t 2 t 3... t n, hvoraf intet må matche pågældende sted i udtrykket u 1 u 2 lodret streg mellem to udtryk (tegn, grupper) u 1 og u 2 betyder»u 1 eller u 2 skal matche pågældende sted i udtrykket«t 1 -t 2 bindestreg mellem to tegn t 1 og t 2 betyder»alle tegn i det alfabetiske interval fra tegn t 1 til t 2 «\ den omvendte skråstreg betyder, at det efterfølgende tegn, som normalt har en særlig betydning i regulære udtryk (fx punktum, bindestreg, parentes), skal opfattes bogstaveligt i udtrykket Tabel 4.3: Symboler med særlig betydning 4.3 Eksempler på brug af jokertegn Prøv at udføre følgende søgninger i KDK Vær opmærksom på, at samme søgeresultat tit kan opnås med forskellige regulære udtryk. Dette kan have følger for tilordningen af brugerdefinerede annoteringer, jf. afsnit cente?ret matcher centeret og centret 2. hi(hi)* matcher hi, hihi, hihihi osv. 3..+undersøgelse matcher ord, der ender på undersøgelse (dog ikke selve ordet undersøgelse), fx forundersøgelse, spørgeskemaundersøgelse, mentalundersøgelse 4..+undersøgelse(n r rne)?s? matcher samme som ovenfor og derudover også alle bøjningsformerne af undersøgelse

50 KAPITEL 4. SØGNING MED JOKERTEGN (hej){2} matcher hejhej 6. (ha){2,4} matcher haha, hahaha og hahahaha 7. å{2,}r?h? matcher ord, som begynder med mindst to å er, evt. efterfulgt af ét r eller ét h eller både r og h: ååh, ååårh, åååå, ååååh, åååårh og ååååårh 8..*[aeiouyæøå]{5,}.* matcher ord, som indeholder en række af mindst 5 vokaler 9. [aeiouyæøå]{4,} matcher ord på mindst 4 bogstaver, der alle skal være vokaler 10. ni[ck]ola[ij] matcher Nicolai, Nikolai, Nicolaj, Nikolaj 11. mor(far mor) matcher morfar, mormor 12. (far mor){2} matcher farfar, farmor, morfar, mormor 13. [0-9]{5} matcher 5-cifrede tal 14..*[bcdf-hj-np-tv-xz]{7,}.* matcher ord med mindst 7 konsonanter efter hinanden 15. \*[^\*].*\* matcher ord, som begynder med og slutter på en stjerne, men som ellers ikke indeholder stjerner, fx *wish*, *suk*, *host*, *lol*, *fniz*

51 Kapitel 5 Avancerede søgeudtryk Det muntre køkken 5.1 Simpelt eller avanceret? Ordoplysninger Ordoplysninger i søgeudtryk Ordklasse og bøjning Definition af ord Ordoplysningen pos Ordoplysningen epos Søgning på grupper af ord Ordbeskrivelser i kantede parenteser Flere ordbeskrivelser efter hinanden Jokertegn på hele ord Søge inden for sætningsgrænser Søgning på adskilte ord Søgning på tekstoplysninger Særligt for dialektkorpusset DIAKO Simpelt eller avanceret? Hidtil blev alle søgninger udført med simple søgeudtryk selvom regulære udtryk, som vi behandlede i kapitel 4, kan virke alt andet end ligefrem simple. Simple søgeudtryk er tilstrækkelige i mange situationer, dog kan det være nødvendigt at udføre søgninger, hvor du endnu mere specifikt angiver, hvad det er, du ønsker at finde. Her kommer avancerede søgeudtryk ind i billedet. 51

52 KAPITEL 5. AVANCEREDE SØGEUDTRYK 52 word ortho bound lemma pos epos jakob Jakob _ Jakob N NP:siu#:--:---- byder byder _ byde V VF:----:sa:---- endnu endnu _ endnu D D-:----:--:u--- engang engang _ engang D D-:----:--:u--- en en _ en P PI:s-uc:--:---- masse masse _ masse N NC:siuc:--:---- lækre lækre _ lækker A AC:p#u#:--:p--- singler singler _ single N NC:piu#:--:---- til til _ til T T-:----:--:---- fest fest.$ fest N NC:siuc:--:---- Tabel 5.1: Ordattributter i KDK-korpora 5.2 Ordoplysninger Et korpus er internt repræsenteret som en lang (lodret) liste af (ortografisk forenklede) ord, som der kan søges på. Men der er mere i denne liste end blot ord, for til hvert af disse ord knytter der sig yderligere oplysninger, fx om ordets originale ortografiske form i teksten, dets grundform og dets ordklasse. Vi kalder disse oplysninger for ordoplysninger eller ord-attributter. Avancerede søgeudtryk gør det muligt at inddrage ordoplysninger i søgningen. Ud over det ortografisk forenklede ord indeholder alle CoREST-korpora oplysninger om ordenes originale stavning og de mellemrum og sætningstegn, der danner grænsen mod det følgende ord. I søgeudtrykkene kaldes disse tre oplysninger word, ortho og bound. I mange korpora findes der ud over disse generelle ordoplysninger yderligere oplysninger, som er specielle for pågældende korpus. Således findes der i KDK og andre KDK-korpora yderligere følgende specielle oplysninger: ordets grundform, dvs. den form, det kan slås op under i ordbog, dets ordklasse samt en udvidet ordklasse- og bøjningsoplysning. Disse tre oplysningstyper kaldes hhv. lemma, pos og epos i søgeudtryk. Tabel 5.1 viser den CoREST-interne repræsentation af et»korpus«, som i dette eksempel kun består af sætningen Jakob byder endnu engang en masse lækre singler til fest. I alle søgeeksemplerne hidtil har vi kun søgt på de oplysninger, der står i wordkolonnen. I det følgende kommer der en række eksempler på, hvordan du kan inddrage de øvrige ordoplysninger i dine søgninger.

53 KAPITEL 5. AVANCEREDE SØGEUDTRYK Ordoplysninger i søgeudtryk Avancerede søgeudtryk har følgende grundstruktur: ordoplysning = "form". I KDK-korpora er ordoplysning en af typerne word, ortho, bound, lemma, pos eller epos; ordoplysning skal matche det, der står mellem anførselstegnene, hvor der står form i grundstrukturen ovenfor. Det udtryk, der står på form s plads kan indeholde de sædvanlige jokertegn, jf. kapitel 4. Du kan kombinere forskellige grundstrukturer med hinanden ved hjælp af & (»og«) og (»eller«), jf. eksemplerne nedenfor. En variant af grundstrukturen er ordoplysning!= "form". Den eneste forskel i forhold til den grundstruktur, vi lige har set, er, at der er sat et udråbstegn foran lighedstegnet. Det betyder, at ordoplysningen ikke må svare til formbeskrivelsen. Pas på! Brug denne type kun i søgeudtryk, hvor du kombinerer flere grundstrukturer med hinanden. Ellers kan du nemt komme galt afsted med denne type, fx betyder [word!="cafe"]»alle ord fra korpus, som ikke er en stavevariant af cafe«, og det er samtlige ord i korpus undtagen stavevarianter af cafe et meningsløst resultat altså, som det tilmed tager en del tid at beregne! OBS! Et avanceret søgeudtryk, hvad enten det kun består af en enkelt grundstruktur eller flere kombineret med hinanden, skal være omgivet af kantede parenteser. Dette gælder søgeudtryk, der vedrører enkeltord. For søgeudtryk, som søger på grupper af ord, er situationen en lidt anden, jf. afsnit 5.4. I det følgende kommer en række eksempler på søgeudtryk for de forskellige ordoplysninger word [word="cafe"] matcher de ortografiske former cafe, café, Café osv. Søgeudtrykket svarer til at skrive cafe i den simple notation. I stedet for [word="cafe"] kan du også nøjes med at skrive "cafe" i avancerede søgeudtryk: ordoplysningen word er den oplysning, CoREST altid vil søge på, når du kun anvender anførselstegn og når ingen anden ordoplysning er nævnt. Pas på! [word="café"] matcher ingenting i korpus, idet word altid repræsenterer korpusordene i en forenklet ortografi, hvor store bogstaver er omsat til små og accenttegn er fjernet. Derimod matcher Café i simple udtryk det samme som [word!="cafe"] i avancerede ortho [ortho="cafe"] matcher kun tilfælde, hvor den originale stavning i korpus præcist svarer til den form, der står mellem anførselstegnene. Således matcher hverken café eller Café. Dette søgeudtryk svarer til!cafe i den simple notation. Ordop-

54 KAPITEL 5. AVANCEREDE SØGEUDTRYK 54 lysningen ortho gør det muligt at finde staveformer med accenttegn, således finder [ortho="café"] kun eksempler på café. Dette svarer til at skrive!cafe i den simple notation. [word="cafe" & ortho!="caf[eé]"] finder alle stavevarianter af cafe, som ikke er stavet med stort C som første bogstav bound [bound=";_"] matcher alle ord i korpus, som har et semikolon til højre for efterfulgt af et mellemrum. Mellemrum angives som understreg i søgeudtrykket. Du kan kombinere de forskellige ordoplysninger med hinanden til et mere komplekst søgeudtryk. Således matcher [word="cafe" & bound="-"] alle ortografiske former af cafe, som følges af en bindestreg lemma [lemma="mand"] matcher samtlige bøjningsformer af grundformen mand og en række af deres ortografiske varianter. Eksemplet matcher således bl.a. mand, mands, mænd, manden og Manden. [lemma="tale" lemma="lytte"] finder alle bøjningsformer af grundformerne tale og lytte. Søgningen kan i øvrigt også udtrykkes således: [lemma="tale lytte"] pos [pos="i"] matcher udråbsord (interjektioner) i korpus, fx nej, Ja, Nej, Fy, Basta, Føj etc. [lemma="tale" & pos="n"] matcher kun de former af lemmaet tale, som er markeret som navneord (substantiver) i korpus. Dvs. at former af tale, som er markeret som verber, ikke matcher. Eksempler: (på) tale, (daglig) tale, (dansk) tale, (nogle) taler (er poetiske). [(lemma="tale" lemma="lytte") & pos="v"] finder alle former af verberne tale og lytte, men ikke former af substantivet tale. Bemærk parenteserne til gruppering af de enkelte logiske dele i det sammensatte udtryk. Udtrykket kan i øvrigt forenkles til [lemma="tale lytte"& pos="v"]. En beskrivelse af, hvilke værdier oplysningstypen pos kan antage, findes i afsnit epos [epos="..:..g.:..:..."] matcher ord i korpus, som har kasusmærket genitiv, uanset ordklasse eller øvrig bøjning. En nærmere beskrivelse af opbygningen af epos findes i afsnit Oversigt Tabel 5.2 sammenfatter de avancerede søgeudtryk og giver de tilsvarende simple udtryk i de tilfælde, hvor det er muligt at udføre en søgning med et simpelt udtryk også.

55 KAPITEL 5. AVANCEREDE SØGEUDTRYK 55 Avanceret udtryk Simpelt udtryk Match-eksempler [word="cafe"] eller "cafe" cafe cafe, café, Café,... [ortho="cafe"]!cafe cafe [ortho="café"]!café café [word="cafe" & ortho!="caf[eé]"] ej muligt stavevarianter af cafe, som ikke er stavet med stort [bound=";_"] ej muligt ord efterfulgt af semikolon og mellemrum [word="cafe" & bound="-"] ej muligt cafe-, café-, Café-,... mand, mands, mænd, manden, Manden,... [lemma="tale" lytte former af tale og lytte [pos="i"] ej muligt udråbsord og lydord: nej, Ja, Nej, Fy, Basta, Føj,... [lemma="tale" & pos="n"] ej muligt former af substantivet tale: (på) tale, (daglig) tale, (dansk) tale, (nogle) taler (er poetiske),... [lemma="tale lytte"& pos="v"] ej muligt former af verberne tale og lytte [epos="..:..g.:..:..."] ej muligt ord i genitiv Tabel 5.2: Avancerede over for simple søgeudtryk 5.3 Ordklasse og bøjning Samtlige ord i KDK-korpusserne er beriget med oplysninger om deres ordklasse og bøjning, de er tagget. Oplysningerne er tilføjet automatisk ved hjælp af ordklassetaggeren epos, udviklet af Jørg Asmussen, DSL. Ordklassetaggeren anvender et bestemt inventar af markeringer for ordklasser og bøjninger, et såkaldt tag-sæt. Inventaret beror på en grammatisk fortolkning af, hvordan de forskellige ordklasser og bøjninger kan defineres hensigtsmæssigt. epos-taggerens grammatiske syn og dermed dets tag-sæt bygger videre på konventionerne i det danske PAROLE-korpus, som fremgik af et europæisk projekt, der skulle etablere nogenlunde fælles opmærkningsstandarder for en række forskellige sprog. I epos-taggeren anvendes en videreudvikling af PAROLE s tag-sæt med en række forbedringer og forenklinger 1 I CoREST kan du søge på ordklasse- og bøjningsoplysningerne, sådan som de kommer til udtryk gennem ordklassetaggene i korpus. Dette forudsætter natur- 1 En detaljeret gennemgang findes i Asmussen (2014).

56 KAPITEL 5. AVANCEREDE SØGEUDTRYK 56 ligvis, at det korpus, som du arbejder med, i det hele taget er blevet tagget med epos-taggeren. Søgninger på ordklasse- og bøjningsoplysninger udfører du ved at anvende ordoplysningerne pos (part of speech = ordklasse) eller epos (extended part of speech) i dine søgeudtryk. Attributtet pos indeholder altid en simpel ordklasseoplysning, mens attributtet epos giver mere udførlige ordklasse- og bøjningsoplysninger Definition af ord I CoREST bruges en meget firkantet regel for opdelingen af en tekst i ord: Ord Et ord er en serie af bogstaver, der står mellem to mellemrum eller sætningstegn Bindestreg, apostrof og skråstreg Som sætningstegn og dermed ordadskiller tæller også bindestreg, apostrof og skråstreg. Derfor er»naturlige«ord som e-butik, to-værelses eller pc en i CoREST s verden hver især to ord hvis du vil søge på dem, må du formulere dine søgeudtryk tilsvarende. Du kan for eksempel finde de ovenstående eksempler ved hjælp af de følgende simple søgeudtryk: $e butik, $to værelses og $pc en. Ellers kan du finde sætningstegn ved hjælp af ordoplysningen bound, fx finder det avancerede søgeudtryk [word="[a-zøæå]{2,}"& bound="'"] alle ord på mindst to bogstaver efterfulgt af apostrof. Da skråstregen også fungerer som ordadskiller, er ord som A/S eller km/t splittet op i to, altså A og S, km og t. I konkordanser vises skråstreger altid normalt, jf. fx A/S. Internt i CoREST er skråstregen imidlertid af tekniske grunde repræsenteret som omvendt skråstreg: \. Du kan søge på skråstreger ved hjælp af søgeudtrykket [bound="\\"]. I søgeudtrykket skal skråstregen altid angives som \\. Det at bindestreg, apostrof og skråstreg betragtes som sætningstegn har konsekvenser for ordklasseopmærkningen og for søgningen af ord, der indeholder bindestreg eller semikolon. Se mere herom i afsnit Sætningstegn og mellemrum Et sætningstegn mellem to ord er nok til at adskille dem, der behøver ikke være et mellemrum. Derfor opfattes 2,0, 2.0, 2-0, bl.a., m.fl., cand.scient. alle som to ord. De tilsvarende simple søgeudtryk ser således ud: $2 0, $bl a, $m fl, $pc en. Søgeudtrykkene finder også varianter, hvor der ud over selve det adskillende sætningstegn også skulle have sneget sig yderligere mellemrum ind som for eksempel i bl. a. eller cand. scient., men matcher også cand.scient., når det for eksempel indgår i cand.scient.pol. Vil du i din søgning differentiere mellem tilfælde med eller uden ekstra mellemrum eller om sætningstegnet er bindestreg, komma, punktum eller andet, må du anvende avancerede søgeudtryk med ordoplysningen bound

57 KAPITEL 5. AVANCEREDE SØGEUDTRYK 57 på grupper af ord. Du kan læse mere om avanceret søgning på grupper af ord i afsnit Sær- og samskrivning Særskrevne ord (fx i går, ad hoc, happy hour, per se, status quo, over for, hen imod, hokus pokus, her til lands, tids nok) betragtes altid som flere ord i CoREST, for eksempel er over for to ord nemlig over og for. Nogle af de nævnte ord kan også samskrives (overfor, henimod, hokuspokus, hertillands, tidsnok), mens andre ofte samskrives, selvom man ikke bør, for eksempel igår. Når ord af denne type samskrives, betragtes de som ét ord. Denne mulighed for variation skal du tage højde for i dine søgninger. Hvis du fx vil finde eksempler på over for i to ord, kan du indtaste det simple søgeudtryk $over for, hvis du derimod vil finde overfor i ét ord, indtaster du det simple søgeudtryk overfor. Du kan finde begge varianter ved hjælp af ét avanceret søgeudtryk, nemlig ("over""for") "overfor". Du kan læse mere om avanceret søgning på grupper af ord i afsnit 5.4. Sær- eller samskrivning har også konsekvenser for ordklasseoplysningerne, for eksempel vil hertillands blive markeret som ét adverbium, mens her til lands vil blive markeret som et adverbium (her), efterfulgt af en præposition (til), efterfulgt af et substantiv (i genitiv): lands Alfabet CoREST kan kun håndtere bogstaver fra det latinske alfabet. Eventuelt forekommende bogstaver fra andre alfabeter er enten udeladt eller omsat til særlige tegnfølger, for eksempel spørgsmålstegn eller som i følgende eksempel: Den hebraiske bibel blev oprindeligt kaldt tanakh (hebr. [ HEB@05EA][ HEB@05E0]"[ Ordoplysningen pos Tabel 5.3 viser de forskellige værdier (tagsættet), som pos-tagget kan have (1. kolonne) samt hvilke ordklasser de svarer til (2. kolonne). Du kan søge på disse ordklasseoplysninger ved at bruge ordoplysningen pos i dine søgeudtryk. Således finder søgeudtrykket [lemma="tale" & pos="v"] eksempler på anvendelsen af verbet tale i korpus, mens [pos="i"] finder eksempler på interjektioner/udråbsord herunder lydord, fx abracadabra, basta, ciao, ding, ehm, fuck, halleluja, ja, muh, nej osv. De fleste af ordklasserne på listen er almindeligt kendte og beskrives derfor ikke nærmere i denne manual. 2 Der er dog et antal særtilfælde. Således mangler ordklassen artikel (kendeord) i epos-tagsættet. Artikler betragtes som pronomener, læs mere herom i afsnit Endvidere er der et antal lidt specielle klasser, nemlig U, E, M og X, som beskrives nærmere i det følgende. 2 Se Asmussen (2014) for en mere detaljeret beskrivelse.

58 KAPITEL 5. AVANCEREDE SØGEUDTRYK 58 Tag V A L N P D I T C U E M X Ordklasse verbum, udsagnsord adjektiv, tillægsord numerale, talord substantiv, navneord pronomen, stedord adverbium, biord interjektion, udråbsord, lydord præposition, forholdsord konjunktion, bindeord som, der, infinitivmarkør leksikalsk element løsrevet bøjningsendelse symboler, fremmede ord, fejl Tabel 5.3: Ordklassetags Tagget U som, der og at Da epos-tagsættet beror på PAROLE, har det i visse tilfælde været nødvendigt at overtage PAROLE s valg. Det gælder for eksempel brugen af tagget U (»unique«) til markering af bestemte typer ord. som Ordformen som kan anvendes som relativpronomen, konjunktion (eller præposition), men epos skelner ikke mellem disse anvendelser og tagger alle forekomster af som med et U. der Det samme tag U bruges til opmærkning af forekomster af der, som kan optræde som formelt subjekt eller som relativpronomen. at Endelig bruges U til at tagge at, når det anvendes som infinitivmarkør i forbindelse med et infinit verbum Tagget E leksikalsk element Leksikalske elementer er dele af ord, som på grund af den mekaniske ordopdeling får status af selvstændige ord. Da for eksempel bindestreger fungerer som ordgrænser, vil ord med bindestreg blive splittet ad. For eksempel består art deco-stil af tre, anti-amerikansk af to, Saudi-Arabien af to, be- eller afkræfte af tre og coproducer af to ord. På denne måde opstår der særlige ord, som normalt ikke op-

59 KAPITEL 5. AVANCEREDE SØGEUDTRYK 59 træder selvstændigt, men kun som del af et andet ord: art, deco, anti, Saudi, be og co. Disse særlige ord betragter epos som leksikalske elementer, og de tagges med E. Du kan danne dig et indtryk af hyppige leksikalske elementer i KDK-2010 ved først at søge på [pos="e"] og siden at sortere den resulterende matchliste efter faldende hyppighed Tagget M løsrevet bøjningsendelse Løsrevne bøjningsendelser minder lidt om leksikalske elementer, jf , og skyldes ligeledes den meget mekaniske ordopfattelse, der ligger til grund for CoREST. Mens leksikalske elementer typisk bliver løsrevet fra deres basis på grund af en bindestreg, som betragtes som ordgrænse, så løsrives bøjningsendelser på grund af apostroffer, der også fungerer som ordgrænser. Eksempler på løsrevne bøjningsendelser er s fra FN s, erne fra 1950 erne, er fra cd er og en fra dj en. Løsrevne bøjningsendelser tagges med et M (»morpheme«). Den konstruerede lemmaform til disse endelser er altid selve endelsen med et @er Du kan danne dig et indtryk af, hvilke løsrevne bøjningsendelser der findes i KDK-2010 ved at udføre en søgning på udtrykket [pos="m"] og sortere den resulterende matchliste efter faldende hyppighed Tagget X symboler m.m. Symboler, fremmede ord og fejl tagges med X. Eksempler på symboler er tegn som % og & eller forkortelser som BBC, com, dk, EUD, A og S i A/S (hvor skråstregen er ordadskiller) etc. Eksempler på fremmede ord er five, greatest eller high. Desuden er der tilfælde, hvor epos ikke har været i stand til at tagge et ord eller en hel sætning, fordi dens viden om sprog af en eller anden grund ikke slog til. Disse tilfælde er ligeledes tagget med X Ordoplysningen epos Ordoplysningen epos (=»extended pos«) er en udvidet udgave af pos. Det indeholder ud over selve ordklasseoplysningen en række yderligere oplysninger. Tagget består af fire oplysningskategorier adskilt ved koloner: klasse : nominal : verbal : diverse klasse Denne oplysningskategori består typisk af to store bogstaver, sommetider af ét stort bogstav efterfulgt af en bindestreg. Det første bogstav betegner ordklassen, sådan som det er beskrevet i tabel 5.3, mens det andet betegner en underklasse til ordklassen. Ikke alle ordklasser har underklasser: Hvis der ikke er underklasser, sættes en bindestreg. De forskellige underklasser og dertil hørende bøjningsparadigmer er beskrevet i afsnit

60 KAPITEL 5. AVANCEREDE SØGEUDTRYK 60 nominal Denne oplysningskategori består af fire tegn, som beskriver ordets nominale (substantiviske) bøjning; se mere i afsnit verbal Denne oplysningskategori omfatter to tegn, der beskriver ordets verbale bøjning; se mere i afsnit diverse Denne oplysningskategori bruges til forskellige bøjningsoplysninger for adjektiver, visse pronomener og visse adverbier; se mere under i afsnit Der er tilfælde, hvor en bestemt bøjningsoplysning ikke er relevant. I så fald sættes en bindestreg pågældende sted. Endvidere er der tilfælde, hvor en bestemt bøjning ikke kan afgøres entydigt; dette markeres ved hjælp af tegnet #. Der er også tilfælde, hvor bøjningen i princippet godt kan afgøres, men hvor det ikke er gjort. Dette er en reminiscens fra PAROLE-korpussets ordklasseopmærkning. I disse tilfælde sættes tegnet pågældende sted i tagget Nominale oplysninger Nominale bøjningsoplysninger er kendetegnende for substantiver eller ord, som også kan bøjes substantivisk, fx adjektiver og verber i visse former. Der er altid fire nominale bøjningsmarkører til stede i epos-tagget. Her gennemgår vi dem i den rækkefølge, de står i i tagget. Rækkefølgen ligger fuldstændig fast. 1. Tal: ental s eller flertal p 2. Bestemthed: ubestemt i eller bestemt d 3. Kasus: umarkeret u, ejefald g, fossileret f og kun for de personlige pronomeners vedkommende nominativ n. Akkusativ er identisk med umarkeret i disse tilfælde og tagges med u 4. Køn: fælleskøn c eller intetkøn n I tilfælde, hvor en bestemt bøjningsoplysning ikke er relevant, sættes en bindestreg pågældende sted. I tilfælde, hvor en bestemt bøjning ikke kan afgøres entydigt, markeres det ved hjælp af tegnet # eller. Se eksempler på taggede ord i tabel 5.4 på side Verbale oplysninger Der er to verbale bøjningsmarkører til stede i epos-tagget. I den rækkefølge, de optræder i, er det: 1. Tid: nutid s eller datid t 2. Diatese: aktiv a eller passiv p Se eksempler på taggede ord i tabel 5.4 på side 64.

61 KAPITEL 5. AVANCEREDE SØGEUDTRYK Diverse oplysninger Der er fire ekstra bøjningsmarkører til stede i epos-tagget. Her gennemgår vi dem i den rækkefølge, de står i i tagget: 1. Grad (adjektiver og visse adverbier): positiv p, komparativ c, superlativ s eller absolut superlativ a 2. Person (personlige og possessive pronomener): første 1, anden 2 eller tredje 3 3. Refleksivitet (personlige og possessive pronomener): ja y eller nej n 4. Possessor (possessive pronomener): ental s eller flertal p Se eksempler på taggede ord i tabel 5.4 på side Underklasser og bøjningsmønstre I det følgende gives en oversigt over de forskellige underklasser, som ordklasserne kan opdeles i. Til hver underklasse knytter der sig et særligt bøjningsmønster. Et bøjningsmønster er karakteriseret ved, at kun bestemte bøjningsoplysninger (= positioner i epos-tagget) er i brug, mens de øvrige som regel slet ikke bruges og derfor er markeret med en streg - i tagget. I oversigterne nedenfor er de positioner i tagget, som er i brug, markeret med en bolle. Grammatikken bag opdelingen i underklasserne behandles ikke i denne manual. Der henvises til generelle grammatiske beskrivelser af ordenes bøjning på dansk. Verber Underklasse I infinitiv F finit M imperativ G gerundium P participium T perf. part. D adv. part. Mønster VI:----:- :---- VF:----: :---- VM:----:--:---- VG: :--:---- VP: : -:---- VT:siu#: -:---- VD:----: -:----

62 KAPITEL 5. AVANCEREDE SØGEUDTRYK 62 Adjektiver Underklasse C almindelige D adverbielle Mønster AC: :--: --- AD:----:--: --- Numeraler Underklasse C kardinale O ordinale Mønster LC:-- -:--:---- LO:-- :--:---- Substantiver Underklasse C appellativ P proprium Mønster NC: :--:---- NP: :--:---- Pronomener Underklasse C reciprokke M demonstrative I indefinitte O possessive P personlige R relative Mønster PC: - -:--:---- PM: - :--:---- PI: - :--:---- PO: -- :--:- PP: - :--:- - PR: - :--:---- Adverbier Underklasse Mønster - ingen D-:----:--: --- Interjektioner Underklasse Mønster - ingen I-:----:--:----

63 KAPITEL 5. AVANCEREDE SØGEUDTRYK 63 Præpositioner Underklasse Mønster - ingen T-:----:--:---- Konjunktioner Underklasse C sideordnende S underordnende Mønster CC:----:--:---- CS:----:--:---- Infinitivmarkør og som/der Underklasse I infinitivmarkør S som/der Mønster UI:----:--:---- US:----:--:---- Leksikalske elementer Underklasse W orddannelse Mønster EW:----:--:---- Løsrevne bøjningsendelser Underklasse N fra substantiv V fra verbum A fra adjektiv Mønster MN: :--:---- MV:----: :---- MA: :--: --- Symboler m.m. Underklasse S symbol F fremmed Y taggefejl Mønster XS:----:--:---- XF:----:--:---- XY:----:--:----

64 KAPITEL 5. AVANCEREDE SØGEUDTRYK 64 # word lemma epos 1 de den PM:p-u#:--: fleste mange AC:p#u#:--:s--- 3 af af T-:----:--: ulandenes uland NC:pdg#:--: egne egen AC:p#u#:--:p--- 6 beslutningstagere beslutningstager NC:piu#:--: er være VF:----:sa: økonomer økonom NC:piu#:--: uddannet uddanne VT:siu#:t-: i i T-:----:--: neoliberal neoliberal AC:siuc:--:p økonomi økonomi NC:siuc:--: på på T-:----:--: amerikanske amerikansk AC:p#u#:--:p eller eller CC:----:--: i i T-:----:--: hvert hver PI:s-un:--: fald fald NC:siun:--: vestlige vestlig AC:p#u#:--:p universiteter universitet NC:piu#:--:---- Tabel 5.4: Sætning med epos-tags Eksempler på taggede ord For at få illustreret brugen af epos-tags betragter vi følgende sætning fra KDK- 2010: De fleste af ulandenes egne beslutningstagere er økonomer, uddannet i neoliberal økonomi på amerikanske eller i hvert fald vestlige universiteter. I tabel 5.4 er sætningen opstillet med ét ord per række med tilhørende grundform (lemma) og epos-tag.

65 KAPITEL 5. AVANCEREDE SØGEUDTRYK 65 Kommentarer til tabel 5.4 de (#1) er tagget som et demonstrativt pronomen: PM. Ofte bliver et sådant de også betragtet som en bestemt artikel, men ordklassen artikel findes ikke i epos, i stedet for bruges pronomen. Til pronomenet er i dette tilfælde knyttet en række nominale bøjningsoplysninger: p-u#. Numerusoplysningen på førstepladsen angiver flertal p (pluralis). Demonstrative pronomener bøjes ikke i bestemthed, så derfor er der på bestemthedspladsen (plads 2) en bindestreg. Kasus (plads 3) er umarkeret u. Da pronomenet optræder i flertal (modsat ental, hvor man kan skelne mellem den og det), kan kønnet ikke afgøres, så derfor ser vi tagget # på fjerdepladsen, hvor kønnet oplyses. fleste (#2) er tagget som almindeligt adjektiv: AC, dvs. et adjektiv, der er brugt attributivt eller prædikativt, men ikke adverbielt. Der gives følgende nominale bøjningsoplysninger i tagget p#u# : tal er flertal p (pluralis), bestemthed oplyst på andenpladsen er ikke entydig: #, kasusoplysningen på tredjepladsen er umarkeret u og kønnet på fjerdepladsen er ikke entydigt: #. Adjektiver bruger også grad-oplysningen på førstepladsen i diverse-kategorien af tagget: s---. Graden er i dette tilfælde oplyst som superlativ s. af, i, på (#3, #10, #13, #16) er tagget som præpositioner: T-. Præpositioner inddeles ikke i underklasser, derfor har vi en bindestreg som underklasseoplysning. Præpositioner bøjes heller ikke, derfor er alle bøjningsoplysningerne sat til bindestreger. ulandenes (#4) er tagget som appellativisk substantiv: NC. Substantiver bøjes i tal (her flertal p), bestemthed (bestemt d) og kasus (ejefald g) oplyst på plads 1, 2 og 3 i den nominale del af tagget. Desuden oplyses deres køn på plads 4 i den nominale del. Kønnet fremgår kun direkte af substantivet, hvis det optræder i bestemt form ental, for eksempel ulandets, og indirekte af sammenhængen, hvis det optræder i ubestemt form ental, for eksempel et uland. I dette eksempel optræder det dog i flertal, hvorfor kønnet ikke kan afgøres, hverken direkte på baggrund af ordets form eller indirekte af konteksten. Derfor er køn oplyst som #. egne (#5) er tagget som et almindeligt adjektiv: AC. Den nominale del af tagget p#u# oplyser, at adjektivet her optræder i flertal p, at det ud fra formen ikke kan afgøres, om den er bestemt eller ubestemt: #, at kasus er umarkeret u, og at køn ikke kan afgøres: #. Endvidere er gradbøjningen sat til positiv p i diverse-kategorien af tagget. beslutningstagere, økonomer (#6, #8) er tagget som appellativiske substantiver: NC, som her optræder i flertal p, er i ubestemt form i med umarkeret kasus u. Køn kan ikke afgøres, da der er tale om en flertalsform: #. er (#7) er tagget som et finit verbum: VF. Ved verberne er den verbale del af tagget som regel i brug her oplyses om tid og diatese. I dette tilfælde er tid nutid s

66 KAPITEL 5. AVANCEREDE SØGEUDTRYK 66 (præsens) og diatese er aktiv: a. Finite verber er karakteriseret ved, at de kun har disse to bøjningskategorier. uddannet (#9) er tagget som et verbum, der i dette tilfælde fungerer som perfektum participium: VT. Alle verber i denne funktion, hvor de er del af et komplekst verbal er/blive uddannet, er i deres nominale og verbale del låst fast til formerne siu# hhv. t- (præteritum, datid). Participiumsformer, som ikke indgår i verbaler, for eksempel en uddannet økonom, er tagget VP. Disse er ikke låst til bestemte former i nominal- og verbaldelen af bøjningsmønsteret. 5.4 Søgning på grupper af ord Ordbeskrivelser i kantede parenteser Hidtil har vi kun set på avancerede søgeudtryk, som var begrænset til søgninger på et enkelt ord. Således finder udtrykket [lemma=".+arbejde" & pos="n"] alle ord, som er en form af et substantiv, hvis grundform ender på arbejde. Det, der står mellem kantede parenteser, er altid en opskrift på, hvilke egenskaber et ord skal opfylde, i dette tilfælde altså, at det skal være en form af et lemma, der ender på arbejde, som skal være tagget som substantiv Flere ordbeskrivelser efter hinanden Vi kan udvide dette udtryk til at omfatte flere ord, fx finder [lemma=".+arbejde" & pos="n"] [word="med"] [word="henblik"] [word="på"] alle former af substantiviske lemmaer, som ender på arbejde efterfulgt af de tre ord med, henblik og på. Hvis der mellem to kantede parenteser kun står en opskrift på, hvordan ordoplysningen word skal se ud, fx [word="på"] eller [word="med.+"], kan du nøjes med at skrive "på" eller "med.+" pågældende sted i udtrykket. Husk, at word altid er den ordoplysning, CoREST automatisk søger på, hvis intet andet er oplyst, word indeholder altid et korpusord i en forenklet ortografi, jf. afsnit Således kan ovenstående udtryk forenkles til [lemma=".+arbejde" & pos="n"] "med" "henblik" "på". Er du ligeglad med, om formerne af lemmaet er substantiver eller ej, kan ovenstående søgning også udføres ved hjælp af et simpelt søgeudtryk, nemlig $@.+arbejde med henblik på, dog får du i dette tilfælde også verber med arbejde med i dit resultat. Avancerede søgeudtryk giver en højere grad af præcision end simple, men omkostningen er et betydeligt længere søgeudtryk. Vi vil nu ændre vores eksempel, så vi kan finde former af et substantivisk lemma, der ender på arbejde efterfulgt af en form af verbet være efterfulgt af et adjektiv. Søgeudtrykket, vi skal formulere i dette tilfælde, ser sådan ud: [lemma=".+arbejde" & pos="n"] [lemma="være"] [pos="a"]. De tre hyppigst forekommende eksempler i KDK-2010 er samarbejde er godt, forarbejdet

67 KAPITEL 5. AVANCEREDE SØGEUDTRYK 67 er vigtigt og samarbejde er meget. Ganske vist er meget et adjektiv (lemmaform megen), dog anvendes det adverbielt i dette tilfælde, som epos-tagget viser, idet underklassen er oplyst som D, som står for et adjektiv i adverbiel anvendelse, jf. afsnit Det følgende søgeudtryk begrænser søgningen til adjektiver i»almindelig«attributiv anvendelse: [lemma=".+arbejde" & pos="n"] [lemma="være"] [epos="ac.*"] Jokertegn på hele ord Problemet med søgningerne hidtil er, at de ikke fanger tilfælde, hvor der mellem formen af være og adjektivet står adverbielle størrelser, som fx samarbejde er meget vigtigt. Vi kunne ændre vores søgeudtryk til [lemma=".+arbejde" & pos="n"] [lemma="være"] [epos="ad.*"] [epos="ac.*"], men så ville vi udelukke de eksempler, vi fandt med søgeudtrykket lige før. Vi skal altså oplyse, at ordet beskrevet ved [epos="ad.*"] også kan udelades. Dette gøres ved at anvende regulære udtryk, jf. kapitel 4, direkte på ord. Således betyder [epos="ad.*"]? nul eller én forekomst af ordet, altså netop det, vi har brug for. Søgeudtrykket [lemma=".+arbejde" & pos="n"] [lemma="være"] [epos="ad.*"]? [epos="ac.*"] kombinerer således de to forudgående søgeudtryk til ét. Vi kan også skrive [epos="ad.*"]*, som betyder nul, én eller flere forekomster af adverbielt brugte adjektiver pågældende sted i søgeudtrykket. Endelig kan vi oplyse antal-intervaller i krøllede parenteser, altså fx [epos="ad.*"]{0,1} eller [epos="ad.*"]{0,}, hvor {0,1} betyder»mindst nul og højst 1«, mens {0,} betyder»mindst nul«, hvilket jo svarer til? hhv. *. Selvfølgelig kan der også bruges andre tal end 0 og 1 i intervalangivelserne, dog skal de være positive, og det første tal skal være mindre end eller lig med det andet. Du kan i dine søgeudtryk også bruge kantede parenteser uden yderligere beskrivelse imellem: []. Det betyder»et vilkårligt ord på dette sted«og svarer således til # (eller []) i simple søgeudtryk. Disse vilkårlige ord kan ligeledes udvides med angivelserne?, * eller intervalangivelser i krøllede parenteser Søge inden for sætningsgrænser Et problem ved søgeudtryk, der matcher grupper af ord, er, at det ignorerer sætningsgrænser og bare matcher hen over dem. Således finder udtrykket [lemma=".+arbejde" & pos="n"] [lemma="være"] [epos="ad.*"]? [epos="ac.*"], som vi brugte ovenfor, også eksemplet: (Siden har han modtaget flere andre priser for sit) revyarbejde. Er kunstnerisk (leder, instruktør og skuespiller), med revyarbejde som en form af substantivet revyarbejde, Er (i begyndelsen af en ny sætning) som en form af være og kunstnerisk et ikke adverbielt brugt adjektiv. Blot er dette ikke et eksempel på det, vi forventede, fordi det går hen over en sætningsgrænse. Man kunne udelukke denne type match ved at tilføje & bound!="\..*" til første, andet og tredje ord i søgeudtrykket. 3 I øvrigt kan du også bruge disse angivelser efter # i simple søgeudtryk.

68 KAPITEL 5. AVANCEREDE SØGEUDTRYK 68 Nemmere er det dog at tvinge CoREST til kun at matche inden for en sætning with at tilføje within s til søgeudtrykket: [lemma=".+arbejde" & pos="n"] [lemma="være"] [epos="ad.*"]? [epos="ac.*"] within s giver således det ønskede resultat. Da opsplitningen af korpusteksterne i sætninger er sket automatisk, og der her sagtens kan være sket fejl, er tilføjelsen af within s ikke altid fuldkommen pålidelig Søgning på adskilte ord I afsnit blev et ord defineret som en serie af bogstaver, der står mellem to mellemrum eller sætningstegn. Både bindestreg, apostrof og skråstreg betragtes som sætningstegn, hvorfor ord som e-butik, to-værelses eller pc en i CoREST splittes op i flere ord, i disse eksempler to ord, jf. afsnit Andre sætningstegn som punktum eller komma skiller ligeledes ord ad, hvad enten der ud over sætningstegnet også forekommer mellemrum eller ej, jf. afsnit Derfor opfattes 2,0, 2.0, 2-0, bl.a., m.fl., cand.scient. alle som to ord, som kan findes med de simple søgeudtryk $2 0, $bl a, $m fl og $pc en. Søgeudtrykkene finder også varianter, hvor der ud over selve det adskillende sætningstegn også skulle have sneget sig yderligere mellemrum ind som for eksempel i bl. a. eller cand. scient., men matcher også cand.scient., når det for eksempel indgår i cand.scient.pol. Vil du i din søgning differentiere mellem tilfælde med og uden ekstra mellemrum eller om sætningstegnet er bindestreg, komma, punktum eller andet, kan du vha. et avanceret søgeudtryk med ordoplysningen bound søge på grupper af ord, fx [word="2" & bound="\."] "0" for at matche 2.0 eller [word="cand" & bound="\."] [word="scient" & bound="\._"] for at matche cand.scient. hvilket udelukker cand.scient.pol., men ikke fx cand.scient. pol. eller cand.scient. soc. Hvis cand.scient.pol. erne og -soc. erne skal udelukkes helt, kan udtrykket [word="cand" & bound="\."] [word="scient" & bound="\._"] [word!="pol soc"] bruges. 5.5 Søgning på tekstoplysninger De fleste korpora har tilknyttet en række tekstoplysninger (metadata) til hver enkelt tekst. Nogle af disse oplysninger kan du bruge til at indsnævre dine søgninger med, altså»filtrere«dem, så du kun får de resultater at se, hvor tekstoplysningerne svarer til dem, som du har fastlagt i din søgning. Hvilke metadata du kan bruge som filtre i dine søgninger, afhænger af det korpus, du har valgt, de varierer lidt fra korpus til korpus. Nogle korpora har ingen søgbare metadata. Du slår filterfunktionen til ved at sætte hak i Filter-boksen til højre for søgefeltet. Under søgefeltet åbner der sig en række felter, hvor du kan specificere de tekstfiltre, der skal gælde for søgningen. Du kan her bruge de kendte jokertegn, jf. kapitel 4, dog skelnes der aldrig mellem store og små bogstaver. Et minus-tegn (bindestreg) som første tegn i et filterfelt betyder, at filteret ikke må være opfyldt, fx

69 KAPITEL 5. AVANCEREDE SØGEUDTRYK 69 betyder -politiken i filterfeltet Edition Title (jf. ndf.), at teksterne ikke må stamme fra Politiken. I de fleste KDK-korpora kan følgende metadata bruges som filtre i søgningen: Year-month Udgivelsestidspunktet for teksten udtrykt i formen åååå-mm, altså fx Edition Title Udgivelsens navn, fx Politiken (der tages ikke hensyn til store eller små bogstaver i søgningen). Author Forfatterens navn, fx finder.*hansen.* samtlige eksempler fra tekster, hvor der indgår hansen i forfatteroplysningen, uanset om det er stavet med stort eller lille. Publisher Udgiveren eller forlaget, fx Clio online; for aviser er udgiveren som regel identisk med udgivelsens navn Edition Title. Group Tekstgruppen, som teksten tilhører; beslægtede tekster (typisk samme leverandør, kilde, type eller tidsrum) er altid samlet i grupper. Fx bevirker oplysningen -i[mo].* i filterfeltet Group, at søgningen kun bliver udført blandt tekster, som ikke er leveret via Infomedia, mens bg.* kun søger i blogtekster. Project Projektet, som stod for indsamlingen af pågældende tekst Særligt for dialektkorpusset DIAKO Dette korpus er kun tilgængeligt i Ømål- og DSL-udgaverne af CoREST. Korpusset består i 2015 af 200 transskriberede interviews med dialekttalende fra forskellige områder i Danmark. Korpusset har et omfang på i alt godt 1,3 millioner løbende ord og indgår i det redaktionelle arbejde på Ømålsordbogen. Visse typer søgninger og funktioner i CoREST vedrører specifikt DIAKO-korpusset og er kun tilgængelige, når dette korpus er valgt, herunder udskrift af fund til ordsedler. Disse beskrives i en særlig dokumentation udarbejdet af Ømålsordbogen. I DIAKO kan du søge på følgende tekstfiltre: Landsdel, Dialektområde, Sogne-id, Rolle, Optagelsesår, Tagget. 4 Dette filter virker desværre ikke i den aktuelle version af CoREST.

70 Del III Udblik 70

71 Appendiks A Løsningsforslag til opgaverne A.1 Opgaver: Simple søgeudtryk 1. smartphone 2. Fordi smartphone åbenbart er en betydelig mere udbredt betegnelse end synonymet smarttelefon. 3. mobiltelefon og fastnettelefon 4. andetled 5. elektroniske 6. type i ny type medicin 7. ud af krisen, ud af statskassen, ud af posen, ud af halsen, ud af boksen A.2 Opgaver: Brug af kontroltegn 1. Der er 2 forekomster, som begge er svenske salmetitler fra wikipedia-tekster. 2. Eksemplet stammer fra en (ældre) forumtekst. Det er sandsynligt, at der her er tale om et indlån fra (amerikansk) engelsk, hvor stavningen af über med u i stedet for omlyd i denne type orddannelser er udbredt. 3. übercool med 6 forekomster 4. Cirkusrevyen (hhv. Cirkusrevy), Cirkusbygningen, Cirkuskroen 5. Det Kongelige Kapel har flest forekomster, fulgt af Det Sixtinske Kapel. 6. cirkus og cirkusset 7. Fordi cirkuset er en uofficiel form og derfor ikke er blevet genkendt som en form af cirkus af lemmatiseringsalgoritmen. 71

72 APPENDIKS A. LØSNINGSFORSLAG TIL OPGAVERNE 72 finder både alle bøjningsformerne af substantivet (et) bytte samt af verbet (at) bytte. Vil du begrænse resultaterne til en bestemt ordklasse, fx kun verberne, må du formulere et [avanceret søgeudtryk][avancerede søgeudtryk] 9. Kigger man kun på matchlisten med forekomsten lærer slår eleverne, kan man forledes til at tro, at det er en lærer, der udfører handlingen at slå elever, altså at lærer er agens og eleverne patiens. Imidlertid forholder det sig omvendt, som konteksten i konkordansen afslører: For en god lærer slår eleverne vel ikke på? 10. flere penge væk(,) end med 7 forekomster. Hvis søgningen skal tage hensyn til, om der er et komma til stede i matchet eller ej, [avanceret søgeudtryk][avancerede søgeudtryk] A.3 Opgave: Annoteringer Konkordansen består af 109 linjer. Det er et overkommeligt antal at annotere fra ende til anden inden for overskuelig tid. Det er muligt at genbruge taggene organisation (for eksempel Claus Christensen refererer til den filmiske strømning, der tog sit udgangspunkt i det såkaldte Dogme 95), forandring (for eksempel den generelle strømning i retning af anerkendelse af udenlandske eksamener) og flytning (Vandets strømning, der med et fint ord kaldes hydrodynamik). En mere rationel fremgangsmåde er det dels at benytte sig af»repeat Mode«under annoteringen, dels at sortere konkordansen. I dette tilfælde, hvor vi søger på et substantiv, er det en god idé at sortere på venstre kontekst.

73 Litteratur Asmussen, J. (2014). Design of the epos tagger. Technical report, DK-CLARIN, korpus.dsl.dk/clarin/corpus-doc/pos-design.pdf. 55, 57 Asmussen, J. (2015). Text metadata. Technical report, DK-CLARIN, korpus.dsl.dk/clarin/corpus-doc/text-header.pdf

Daglig brug af JitBesked 2.0

Daglig brug af JitBesked 2.0 Daglig brug af JitBesked 2.0 Indholdsfortegnelse Oprettelse af personer (modtagere)...3 Afsendelse af besked...4 Valg af flere modtagere...5 Valg af flere personer der ligger i rækkefølge...5 Valg af flere

Læs mere

ViKoSys. Virksomheds Kontakt System

ViKoSys. Virksomheds Kontakt System ViKoSys Virksomheds Kontakt System 1 Hvad er det? Virksomheds Kontakt System er udviklet som et hjælpeværkstøj til iværksættere og andre virksomheder som gerne vil have et værktøj hvor de kan finde og

Læs mere

IsenTekst Indhold til Internettet. Manual til Wordpress.

IsenTekst Indhold til Internettet. Manual til Wordpress. Manual til Wordpress Sådan opdaterer du din hjemmeside i Wordpress. Dette er en manual til de mest grundlæggende ting, så du selv kan redigere indholdet eller tilføje nyt på din hjemmeside. Guiden er skrevet

Læs mere

Velkommen til REX onlinehjælp

Velkommen til REX onlinehjælp Velkommen til REX onlinehjælp I REX onlinehjælp kan du finde information om følgende emner: Indhold Enkel søgning...3 Hvordan kan du bruge søgefeltet?...3 Søg efter sætninger...3 Søg efter specifikke ord

Læs mere

Manual til Wordpress. 1. Log ind på din Wordpress-side. Indhold:

Manual til Wordpress. 1. Log ind på din Wordpress-side. Indhold: Manual til Wordpress Sådan opdaterer du din hjemmeside i Wordpress: Dette er en manual til de mest grundlæggende ting, så du selv kan redigere indholdet eller tilføje nyt på din hjemmeside. Guiden er skrevet

Læs mere

Elevvejledning til SkoleKomNet - Min egen hjemmeside

Elevvejledning til SkoleKomNet - Min egen hjemmeside Indledning...1 Sådan får du adgang...2 Dit KlasseWeb skrivebord Overblik...2 Dit arbejdsområde...3 Din hjemmeside på nettet...3 Sådan laver du en hjemmeside i 4 trin...3 Trin 1 Dit personlige billede på

Læs mere

It-@fdelingen UC Syddanmark 7266 2400

It-@fdelingen UC Syddanmark 7266 2400 UNI-Login Installation af SkoleKom og ændring af kodeord SkoleKom er et udbredt mail- og konferencesystem i skoleverdenen i Danmark. For at komme på SkoleKom, skal du oprettes som bruger, hvor du får 3

Læs mere

Generelt Windows tidligere versioner... 1 Windows Apple Mac Log på... 2 Rediger dokumentet Tilføj et tillægsdokument...

Generelt Windows tidligere versioner... 1 Windows Apple Mac Log på... 2 Rediger dokumentet Tilføj et tillægsdokument... Vejledning i brug af dli dokumenthåndteringssystemet til forfattere og referenter Indhold Vejledning i brug af dli dokumenthåndteringssystemet til forfattere og referenter... 1 Generelt... 1 Windows tidligere

Læs mere

Vejledning til Politikens Retskrivnings- og Betydningsordbog

Vejledning til Politikens Retskrivnings- og Betydningsordbog Vejledning til Politikens Retskrivnings- og Betydningsordbog INDHOLD VALGMULIGHEDER UNDER MENUEN FILER UDSKRIV KOPIER AFSLUT VALGMULIGHEDER UNDER MENUEN SØGEMULIGHEDER OPSLAGSORD ORDFORBINDELSER AL TEKST

Læs mere

Windows Vista 1. Side 1 af 10

Windows Vista 1. Side 1 af 10 Windows vista...2 Lukke for PC,en...3 Velkomstcenter...3 Finde/starte et program...4 Alle programmer...5 Menuen Start...5 Stifinder...6 Windows Sidepanel og gadgets...7 Dokumenter...7 Tilbehør...8 Windows

Læs mere

Picto Selector. Lav dine egne flotte symbolark på den nemme måde. Version: Oktober 2012

Picto Selector. Lav dine egne flotte symbolark på den nemme måde. Version: Oktober 2012 Picto Selector Lav dine egne flotte symbolark på den nemme måde Version: Oktober 2012 Indholdsfortegnelse Hvad er Picto Selector?...4 USB?...4 Hent programmet...4 Installer programmet på din computer...5

Læs mere

FC-intranet: FC-intranet er et fælles mail- og konferencesystem, hvor lærere og elever kan kommunikere.

FC-intranet: FC-intranet er et fælles mail- og konferencesystem, hvor lærere og elever kan kommunikere. IT-intro 9. august 2011 14:56 IT-introduktion på Risskov Gymnasium FC-intranet: FC-intranet er et fælles mail- og konferencesystem, hvor lærere og elever kan kommunikere. Før end man kan logge sig ind

Læs mere

WebTV. Vejledning til WebTV på web. Vejledningen beskriver upload og deling af videoer på WebTV

WebTV. Vejledning til WebTV på web. Vejledningen beskriver upload og deling af videoer på WebTV WebTV Vejledning til WebTV på web Vejledningen beskriver upload og deling af videoer på WebTV ITS 24-11-2015 WebTV Vejledning til WebTV på web Indholdsfortegnelse WebTV... 2 Login... 2 Navigation... 3

Læs mere

Manual til CD-ORD. Randers Realskole

Manual til CD-ORD. Randers Realskole Randers Realskole CD-ORD Læs og skriv på computeren CD-ORD er et pc-værktøj, der hjælper dig med at læse og skrive hvad enten du har brug for støtte i undervisningen, har svært ved at læse eller skrive

Læs mere

Manual til Wordpress. 1. Log ind på din Wordpress-side. Indhold: Sådan opdaterer du din hjemmeside i Wordpress.

Manual til Wordpress. 1. Log ind på din Wordpress-side. Indhold: Sådan opdaterer du din hjemmeside i Wordpress. Manual til Wordpress Sådan opdaterer du din hjemmeside i Wordpress. Dette er en manual til de mest grundlæggende ting, så du selv kan redigere indholdet og lægge nyt på din hjemmeside. Guiden er skrevet

Læs mere

IT-Brugerkursus. Modul 1 - Introduktion til skolens netværk og FC. Modul 1 - Introduktion til FC og Lectio. Printvenligt format. Indholdsfortegnelse

IT-Brugerkursus. Modul 1 - Introduktion til skolens netværk og FC. Modul 1 - Introduktion til FC og Lectio. Printvenligt format. Indholdsfortegnelse Modul 1 - Introduktion til FC og Lectio IT-Brugerkursus Modul 1 - Introduktion til skolens netværk og FC Printvenligt format Indholdsfortegnelse Formål og opbygning Opgave Vejledning til intranettet Åbne

Læs mere

Manual til WordPress CMS

Manual til WordPress CMS Manual til WordPress CMS 1. Log ind på din Wordpress-side For at arbejde på din hjemmeside skal du først logge ind på administrationsdelen. Muligvis har du et direkte link på siden. Ellers er adressen

Læs mere

Picto Selector. Lav dine egne symbolark. Version: August 2012

Picto Selector. Lav dine egne symbolark. Version: August 2012 Picto Selector Lav dine egne symbolark Version: August 2012 Indholdsfortegnelse Hvad er Picto Selector?...4 USB?...4 Hent programmet...4 Installer programmet på din computer...5 Picto Selector på USB...8

Læs mere

5.0 Velkommen til manualen for kanalen HTML-grab Introduktion til kanalen HTML-grab kanalside Hvad er et spot?

5.0 Velkommen til manualen for kanalen HTML-grab Introduktion til kanalen HTML-grab kanalside Hvad er et spot? 5.0 Velkommen til manualen for kanalen HTML-grab 1 5.1 Introduktion til kanalen 1 5.2 HTML-grab kanalside 1 5.2.1 Hvad er et spot? 2 5.2.2 Opret et nyt spot 2 5.2.3 Aktivt og inaktivt spot 3 5.2.4 Rediger

Læs mere

Vistemmernu. Et webbaseret værktøj udviklet af Programdatateket i Skive. E-mail: [email protected] Web: http://www.programdatateket.

Vistemmernu. Et webbaseret værktøj udviklet af Programdatateket i Skive. E-mail: programdatateket@viauc.dk Web: http://www.programdatateket. Vistemmernu Et webbaseret værktøj udviklet af Programdatateket i Skive E-mail: [email protected] Web: http://www.programdatateket.dk Kolofon HVAL-vejledning Vistemmernu på HVAL.DK Forfatter: Susanne

Læs mere

Genvejstaster til Windows

Genvejstaster til Windows Genvejstaster til Windows Selvom musen er et praktisk redskab, er den langt fra altid den hurtigste måde at styre computeren på. Ofte vil det være meget hurtigere at bruge genvejstaster. Hvis du sidder

Læs mere

E-MAIL G-MAIL (GOOGLE)

E-MAIL G-MAIL (GOOGLE) E-MAIL G-MAIL (GOOGLE) Erik Thorsager, Esbjerg. 3. udgave: G-mail Side 1 G-mail E-mail: Det engelske ord mail betyder post. E står for elektronisk. E-mail betyder altså elektronisk post. Elektronisk post

Læs mere

Sådan opdaterer og vedligeholder du din hjemmeside i Wordpress.

Sådan opdaterer og vedligeholder du din hjemmeside i Wordpress. Wordpress manual Sådan opdaterer og vedligeholder du din hjemmeside i Wordpress. Dette er en manual til de mest grundlæggende ting og funktioner i Wordpress, så du selv kan redigere indholdet eller tilføje

Læs mere

elib Aleph, ver.18 Introduktion til GUI FUJITSU SERVICES A/S

elib Aleph, ver.18 Introduktion til GUI FUJITSU SERVICES A/S Introduktion til GUI FUJITSU SERVICES A/S, 2008 Indholdsfortegnelse 1. Skrivebordet... 3 2. Flytte rundt m.m.... 4 3. Log ind... 6 4. Valg af database... 7 5. Rudernes størrelse... 8 6. Kolonner... 9 7.

Læs mere

Vejledning i brug af dli dokumenthåndteringssystemet til virksomheder

Vejledning i brug af dli dokumenthåndteringssystemet til virksomheder Vejledning i brug af dli dokumenthåndteringssystemet til virksomheder Indhold Generelt... 1 Windows tidligere versioner... 1 Windows 10... 2 Apple Mac... 2 Log på... 2 Rediger dokumentet... 2 Tilføj et

Læs mere

Zotero er et smart værktøj til at få styr på dine referencer og litteraturlister. Zotero er gratis og på dansk.

Zotero er et smart værktøj til at få styr på dine referencer og litteraturlister. Zotero er gratis og på dansk. 1 Indhold: Hvorfor Zotero?... 3 Installation... 3 Firefox... 3 Installation af Zotero... 3 Registrer dig som bruger af Zotero... 4 Zotero oversigt over programmet... 4 Tilføj referencer manuelt... 5 Eksempel

Læs mere

IDAP manual Emission

IDAP manual Emission IDAP manual Emission Dato: 08-06-2005 16:32:35 Indhold INDHOLD... 1 1 EMISSION... 2 1.1 KURVER... 2 1.2 RAPPORTER... 5 1.3 DATA REDIGERING... 6 1.3.1 Masse redigering... 7 1.3.2 Enkelt redigering... 10

Læs mere

En lille vejledning til lærere og elever i at bruge matematikprogrammet WordMat (begynderniveau)

En lille vejledning til lærere og elever i at bruge matematikprogrammet WordMat (begynderniveau) Matematik i WordMat En lille vejledning til lærere og elever i at bruge matematikprogrammet WordMat (begynderniveau) Indholdsfortegnelse 1. Introduktion... 3 2. Beregning... 4 3. Beregning med brøker...

Læs mere

How to do in rows and columns 8

How to do in rows and columns 8 INTRODUKTION TIL REGNEARK Denne artikel handler generelt om, hvad regneark egentlig er, og hvordan det bruges på et principielt plan. Indholdet bør derfor kunne anvendes uden hensyn til, hvilken version

Læs mere

I denne manual kan du finde en hurtig introduktion til hvordan du:

I denne manual kan du finde en hurtig introduktion til hvordan du: VORES NORDSJÆLLAND HURTIGT I GANG MANUAL 01: Bruger HVAD INDEHOLDER DENNE MANUAL? I denne manual kan du finde en hurtig introduktion til hvordan du: 1. Finder Vores Nordsjælland hjemmesiden 2. Opretter

Læs mere

Oktober Dokumentpakker

Oktober Dokumentpakker Oktober 2017 Dokumentpakker Dokumentpakkerne er et værktøj til at udskrive dynamiske breve, som har en standardtekst i brevet, og hvor der automatisk sættes blandt andet patientens navn, adresse og aftaletid

Læs mere

3.0 Velkommen til manualen for kanalen Shift 1. 3.1 Introduktion til kanalen 1. 3.2.1 Hvad er et spot? 2. 3.2.2 Opret et nyt spot 2

3.0 Velkommen til manualen for kanalen Shift 1. 3.1 Introduktion til kanalen 1. 3.2.1 Hvad er et spot? 2. 3.2.2 Opret et nyt spot 2 3.0 Velkommen til manualen for kanalen Shift 1 3.1 Introduktion til kanalen 1 3.2 Shift kanalside 1 3.2.1 Hvad er et spot? 2 3.2.2 Opret et nyt spot 2 3.2.3 Aktivt og inaktivt spot 3 3.2.4 Rediger et spot

Læs mere

Spil og svar. Journal nr. 13.12.599. Et webbaseret værktøj udviklet af Programdatateket i Skive

Spil og svar. Journal nr. 13.12.599. Et webbaseret værktøj udviklet af Programdatateket i Skive Journal nr. 13.12.599 Spil og svar Et webbaseret værktøj udviklet af Programdatateket i Skive E-mail: [email protected] Web: http://www.programdatateket.dk Kolofon HVAL-vejledning Spil og svar

Læs mere

dpix til Word Indholdsfortegnelse

dpix til Word Indholdsfortegnelse dpix til Word Indholdsfortegnelse dpix til Word...1 Installation af Java...1 Klargøring af Word...1 Installation (opdatering) af dpix...2 Første start af Word med dpix...2 Udarbejdelse af et opgavesæt...4

Læs mere

Du kan også bruge Dropbox sammen med din Iphone, Android telefon eller anden smartphone.

Du kan også bruge Dropbox sammen med din Iphone, Android telefon eller anden smartphone. Dropbox Introduktion til Dropbox Dropbox er en online tjeneste, hvor man ganske gratis kan få noget lagerplads til sine dokumenter, billeder og meget mere. Der er mange muligheder med Dropbox, som bliver

Læs mere

Brug af Office365 med Onedrive, nyeste Officepakke mv

Brug af Office365 med Onedrive, nyeste Officepakke mv Egedal Gymnasium og HF september 2014 Brug af Office365 med Onedrive, nyeste Officepakke mv Dette dokument beskriver, hvordan du kan opnå adgang til nogle resurser i skyen og hente ny software. Hvordan

Læs mere

xgalleri Mulige filtyper Installation web-version

xgalleri Mulige filtyper Installation web-version xgalleri xgalleri opstod ud fra ønsket om at lægge en større samling billeder på nettet. Der findes mange programmer, som kan bruges til at lægge datafiler på nettet; men de fungerer typisk på den måde,

Læs mere

Indhold Outlook Web App... 1

Indhold Outlook Web App... 1 Outlook Web App Outlook Web App (OWA) bruges til at håndtere e-mails og kalendere uden at skulle have Outlook klient programmet installeret. OWA kan bruges på en hvilken som helst computer, der har adgang

Læs mere

Sådan redigerer du en hjemmeside i Umbraco

Sådan redigerer du en hjemmeside i Umbraco Brugermanual til din boligafdelings hjemmeside Sådan redigerer du en hjemmeside i Umbraco Indhold Introduktion... 2 Log på Umbraco og redigér din hjemmeside... 3 Opret ny side... 7 Gem side uden at udgive/publicere

Læs mere

DRFLive - dynamisk visning af resultater fra DRF Stævnesystem

DRFLive - dynamisk visning af resultater fra DRF Stævnesystem DRFLive - dynamisk visning af resultater fra DRF Stævnesystem Resumé: Beskrivelse af program (DRFLive) til dynamisk visning af resulter fra DRF Stævnesystem Forfatter: Claus Hulstrøm Dato: 15. januar 2010

Læs mere

Manual til at arbejde med POI på Garmin GPS.

Manual til at arbejde med POI på Garmin GPS. Manual til at arbejde med POI på Garmin GPS. Michael Pedersen (mike42dk) [email protected] Juli 2009 Version 2.1 Jeg fralægger mig alt ansvar for den skade du kan komme til at forsage ved din GPS,

Læs mere

Øvelser rundt på computeren

Øvelser rundt på computeren Øvelser rundt på computeren Kursister med it-færdigheder bør læse øvelserne igennem. Hvis der er elementer, som er ukendte, bør du udføre øvelserne. Hvis øvelserne derimod er kendt information kan øvelserne

Læs mere

Indhold. 1. Adgang og afslutning

Indhold. 1. Adgang og afslutning 1 Indhold 1. Adgang og afslutning 2. Menupunkter 3. Tekst 4. Billeder 5. Video 6. Lyd 7. Bannere 8. Bokse 9. Dokumenter 10. Links 11. Iframe 12. Markedspladsen 13. Nyheder 14. Job 15. Kalender 16. Selvbetjeningsbjælken

Læs mere

Vejledning til brug af FirstClass

Vejledning til brug af FirstClass Vejledning til brug af FirstClass - opdateret januar 2013 Indhold Installation af FirstClass foretages kun første gang... 2 Hent FirstClass-klienten... 2 Installer FirstClass-klienten... 3 Ændre kodeord...

Læs mere

09/03 2009 Version 1.4 Side 1 af 37

09/03 2009 Version 1.4 Side 1 af 37 Login til DJAS Gå ind på adressen http://www.djas.dk I feltet Brugernavn skrives den e-mail adresse som brugeren er registeret med i systemet. I feltet Password skrives brugerens adgangskode. Ved at sætte

Læs mere

Bogfunktionen eller Slægtsbogen i FTM

Bogfunktionen eller Slægtsbogen i FTM Bogfunktionen eller Slægtsbogen i FTM En blandt mange af Family Tree Maker s styrker er evnen til at præsentere data på mange forskellige måder, og i dette skrift vil bogfunktionen blive gennemgået. Funktionen

Læs mere

SÅDAN BRUGER DU REGNEARK INTRODUKTION

SÅDAN BRUGER DU REGNEARK INTRODUKTION SÅDAN BRUGER DU REGNEARK INTRODUKTION I vejledningen bruger vi det gratis program Calc fra OpenOffice som eksempel til at vise, hvordan man bruger nogle helt grundlæggende funktioner i regneark. De øvrige

Læs mere

Startvejledning. Microsoft PowerPoint 2013 ser anderledes ud end tidligere versioner, så vi lavet denne guide for at gøre din læreproces nemmere.

Startvejledning. Microsoft PowerPoint 2013 ser anderledes ud end tidligere versioner, så vi lavet denne guide for at gøre din læreproces nemmere. Startvejledning Microsoft PowerPoint 2013 ser anderledes ud end tidligere versioner, så vi lavet denne guide for at gøre din læreproces nemmere. Find det du skal bruge Klik på en fane på båndet for at

Læs mere

Hvordan søger du i LARM.fm?

Hvordan søger du i LARM.fm? Hvordan søger du i LARM.fm? Før vi beskriver, hvordan du søger og arbejder i LARM.fm, vil vi først introducere, hvordan LARM.fm brugerinterfacet ser ud. I øverste venstre hjørne findes søgefeltet og nedenunder

Læs mere

Kom godt i gang med SMS fra Outlook

Kom godt i gang med SMS fra Outlook Grundlæggende funktionalitet Med SMS fra Outlook kan du enkelt sende både SMS, MMS og fax fra Outlook. Programmet er integreret med din personlige Outlook-kontaktliste, og gør afsendelse af meddelelser

Læs mere

Sådan installeres og teste WordPress på en lokal server

Sådan installeres og teste WordPress på en lokal server Sådan installeres og teste WordPress på en lokal server Det gratis WordPress blog værktøj er vokset gennem årene til et fuldgyldigt CMS-system content management system). WordPress har forenklet processen

Læs mere

INDHOLDSFORTEGNELSE. INDLEDNING... Indledning. KAPITEL ET... Kom videre med Excel. KAPITEL TO... 27 Referencer og navne

INDHOLDSFORTEGNELSE. INDLEDNING... Indledning. KAPITEL ET... Kom videre med Excel. KAPITEL TO... 27 Referencer og navne INDHOLDSFORTEGNELSE INDLEDNING... Indledning KAPITEL ET... Kom videre med Excel Flyt markering efter Enter... 8 Undgå redigering direkte i cellen... 9 Markering ved hjælp af tastaturet... 10 Gå til en

Læs mere

Introduktion til FileMaker Pro 4.0/4.1

Introduktion til FileMaker Pro 4.0/4.1 1 Introduktion til FileMaker Pro 4.0/4.1 Hvad er en database? En database er en samling data, som er organiseret på en systematisk måde og er tilgængelig i digital form. Med andre ord er det en slags elektronisk

Læs mere

Vejledning PROPHIX 11. Driftsbudgettering ved åbning af templates (Kun til Avanceret-brugere)

Vejledning PROPHIX 11. Driftsbudgettering ved åbning af templates (Kun til Avanceret-brugere) PROPHIX 11 Systemansvarlige Michael Siglev Økonomiafdelingen 9940 3959 [email protected] Daniel Nygaard Ricken Økonomiafdelingen 9940 9785 [email protected] Vejledning (Kun til Avanceret-brugere) Opdateret:

Læs mere

Se Billeder i Picasa.

Se Billeder i Picasa. Se Billeder i Picasa. Selvom det er vigtigt at organisere, redigere og udskrive sine billeder, er det også vigtigt, at man ønsker at lære om de forskellige måder man kan se sine billeder på. Visning af

Læs mere

Formular modul. Sitecore Foundry januar Version 1.0

Formular modul. Sitecore Foundry januar Version 1.0 22. januar 2015 - Version 1.0 Pentia A/S Store Kongensgade 66, Baghuset 1264 København K Telefon: 7023 3330 E-mail: [email protected] Indholdsfortegnelse Indledning... 3 Opret en ny formular... 4 Skjult

Læs mere

SÅDAN BRUGER DU TEKST- BEHANDLING INTRODUKTION

SÅDAN BRUGER DU TEKST- BEHANDLING INTRODUKTION SÅDAN BRUGER DU TEKST- BEHANDLING INTRODUKTION I vejledningen bruger vi det gratis program Writer fra OpenOffice som eksempel til at vise, hvordan man bruger nogle helt grundlæggende funktioner i tekstbehandling.

Læs mere

Manual til hjemmeside i Typo3

Manual til hjemmeside i Typo3 Manual til hjemmeside i Typo3 Gode tips og genvejstaster Ét linieskift Ctrl + A Ctrl + C Ctrl + X Ctrl + V shift + enter (tasten du normalt bruger til linieskift) Markér alt Kopier Klip Sæt ind Oprettelse

Læs mere

I Windows fil struktur er der følgende ting Drev, Mapper, Filer og Genveje.

I Windows fil struktur er der følgende ting Drev, Mapper, Filer og Genveje. Windows Fil Struktur I Windows fil struktur er der følgende ting Drev, Mapper, Filer og Genveje. Hvad er et drev Et drev, er en afgrænsning af fil strukturen. Når du går ind på et drev vil du stå i roden

Læs mere

Ruko Security Master Central Database

Ruko Security Master Central Database Ruko Security Master Central Database RSM benytter en central database, til at udveksle låsesystemer mellem Ruko og låsesmeden. Udvekslingen sker via Internettet, så det er derfor nødvendigt at have en

Læs mere

E-MAIL WINDOWS LIVE MAIL

E-MAIL WINDOWS LIVE MAIL E-MAIL WINDOWS LIVE MAIL Erik Thorsager, Esbjerg. 3. udgave: Live Mail Side 1 Windows Live Mail Hvordan skriver og sender jeg en e-mail? Det engelske ord mail betyder post. E står for elektronisk. E-mail

Læs mere

Selene brugervejledning

Selene brugervejledning Selene brugervejledning F2 : Åbner en oversigt med data for det aktive felt. F3: Gemmer data i det aktive vindue Salgsordre : Bruges til oprettelse af Ordre/Arbejdskort/Fakrura Debitor: Debitorregister,

Læs mere

Annemette Søgaard Hansen/www.dinwebvejleder.dk

Annemette Søgaard Hansen/www.dinwebvejleder.dk Google Docs Dokumenter Indholdsfortegnelse Værktøjer... Side 3 Menuer... Side 5 Opgave... Side 8 Få adgang til filerne fra din computer... Side 16 Vejledende løsning... Side 17 GoogleDocs Dokumenter 2

Læs mere

KMD Brugeradministration til Navision og LDV

KMD Brugeradministration til Navision og LDV KMD Brugeradministration til Navision og LDV Vejledning for Statens Administration og ØSC institutioner. Opdateret 09-09-2015 Indholdsfortegnelse 1 Kom godt i gang... 2 1.1 Login til KMD Brugeradministration...

Læs mere

GUIDE TIL CLOUD DRIVE

GUIDE TIL CLOUD DRIVE GUIDE TIL CLOUD DRIVE Dette er en guide du kan anvende til nemt at komme effektivt i gang med at anvende Cloud Drive Indholdsfortegnelse 1. Tilgængelige Cloud Drive klienter 2. Guide til Windows klienten

Læs mere

Redaktørvejledning for www.bredstrup-pjedsted.dk Skriv en artikel

Redaktørvejledning for www.bredstrup-pjedsted.dk Skriv en artikel Arbejdsgang - Skriv artiklens tekst - Gør billeder klar - Log-in på hjemmesiden - Opret ny artikel - Vælg kategori - Skriv overskrift - Indsæt tekst - Tilføj billeder - Gennemgå artiklens indstillinger

Læs mere

vorbasse.dk Redaktørmanual Kentaur

vorbasse.dk Redaktørmanual Kentaur Redaktørmanual Kentaur Indholdsfortegnelse Kapitel 1 - TYPO3 Brugerfladen 3 Log ind 3 Backend 4 Frontend 5 Hvor skal jeg klikke? 5 Gem, gem og vis, gem og luk 6 Kapitel 2 - Sider & menuer 7 Sammenhæng

Læs mere

Hvordan afspilles/vises materialet i LARM.fm

Hvordan afspilles/vises materialet i LARM.fm Hvordan afspilles/vises materialet i LARM.fm Når du har lært de mange måder, hvorpå det er muligt at søge i LARM.fm s materiale, er det relevant at vide, hvilke muligheder du har for at afspille radio-

Læs mere

Indholdsfortegnelse. 1. Installation af LØN... 1. 2. Introduktion til LØN... 2. 3. Indtastning af lønseddel... 7. 4. Udskrifter...

Indholdsfortegnelse. 1. Installation af LØN... 1. 2. Introduktion til LØN... 2. 3. Indtastning af lønseddel... 7. 4. Udskrifter... Løn til Windows Indholdsfortegnelse 1. Installation af LØN... 1 2. Introduktion til LØN... 2 2.1. Første start af LØN...2 2.1.1. Ét eller flere distrikter...2 2.1.2. Lønperioder...3 2.1.3. Kartoteker...4

Læs mere

Sonofon Erhverv. Kom godt i gang. med SMS fra Outlook Brugervejledning. 1107V01-93.010.014 gældende fra 29. oktober

Sonofon Erhverv. Kom godt i gang. med SMS fra Outlook Brugervejledning. 1107V01-93.010.014 gældende fra 29. oktober Sonofon Erhverv Kom godt i gang med SMS fra Outlook Brugervejledning 1107V01-93.010.014 gældende fra 29. oktober Grundlæggende funktionalitet Med SMS fra Outlook kan du enkelt sende både SMS, MMS og fax

Læs mere

BRUGERVEJLEDNING FIONA ONLINE

BRUGERVEJLEDNING FIONA ONLINE BRUGERVEJLEDNING FIONA ONLINE Indberetning til Nationalbankens betalingsbalance for erhvervsvirksomheder, forsikrings- og pensionsselskaber samt visse finansielle institutter Statistisk Afdeling Version

Læs mere

Grundlæggende WordPad i 11 lette trin Til Elisabeth 2013 SeniorKultur/AluData :: Vanløse

Grundlæggende WordPad i 11 lette trin Til Elisabeth 2013 SeniorKultur/AluData :: Vanløse Grundlæggende WordPad i 11 lette trin Til Elisabeth 2013 SeniorKultur/AluData :: Vanløse 1 ordpad er en grundlæggende tekstbehandlingsprogram, der er inkluderet i Windows W (siden Windows 95, hvor det

Læs mere

Introduktion til CD ere og Arkivdeling Gammel Dok - September-oktober 2003. Jonas Christiansen Voss

Introduktion til CD ere og Arkivdeling Gammel Dok - September-oktober 2003. Jonas Christiansen Voss Introduktion til CD ere og Arkivdeling Gammel Dok - September-oktober 2003 Jonas Christiansen Voss 2. marts 2004 Indhold 1 CD ere 2 1.1 Brænde dokumenter til CD....................... 2 1.2 Disk Copy.................................

Læs mere

Carsten hjælp. Carsten 4.0. Mikro Værkstedet A/S

Carsten hjælp. Carsten 4.0. Mikro Værkstedet A/S Carsten hjælp Carsten 4.0 Mikro Værkstedet A/S Carsten hjælp: Carsten 4.0 Mikro Værkstedet A/S Revision 1.25, 25. juni 2009 Indholdsfortegnelse Forord... v 1. Hjælp i Carsten... 1 2. Carsten-stemmen i

Læs mere

Indholdsfortegnelse Opret engelsk version af hjemmesiden... 2

Indholdsfortegnelse Opret engelsk version af hjemmesiden... 2 Indholdsfortegnelse Opret engelsk version af hjemmesiden... 2 Indledning:... 2 Metode 1 en samling af sider, med kun en engelsk version:... 3 Metode 2 Eksisterende sider med både en dansk og en engelsk

Læs mere

SIDEN PÅ WORDPRESS.COM

SIDEN PÅ WORDPRESS.COM WordPress WordPress er et fantastisk program til blog og til hjemmesider, hvor du gerne vil kunne rette via din browser. WordPress er meget udbredt og det er derfor nemt at finde fora, templates og hjælp

Læs mere

ActiveBuilder Brugermanual

ActiveBuilder Brugermanual ActiveBuilder Brugermanual Forfatter: TalkActive I/S Dato: Juni 2004 Version: R. 1.01 Sprog: Dansk Copyright 2004 - Talk Active - all rights reserved. Indhold: 1. INDLEDNING...2 2. QUICK-START...3 3. OPBYGNINGEN

Læs mere

Vejledning i redigering af apotekets hjemmeside

Vejledning i redigering af apotekets hjemmeside i redigering af apotekets hjemmeside It-afdelingen Januar 2007 INDHOLDSFORTEGNELSE FEJL! BOGMÆRKE ER IKKE DEFINERET. 1 INTRODUKTION 3 2 ADMINISTRATION 4 3 OPBYGNING 4 SIDER 5 FIL ARKIV 6 ARTIKLER 7 ØVRIGE

Læs mere

Åbn Paint, som er et lille tegne- og billedbehandlingsprogram der findes under Programmer i mappen Tilbehør. Åbn også Word.

Åbn Paint, som er et lille tegne- og billedbehandlingsprogram der findes under Programmer i mappen Tilbehør. Åbn også Word. 75 Paint & Print Screen (Skærmbillede med beskæring) Åbn Paint, som er et lille tegne- og billedbehandlingsprogram der findes under Programmer i mappen Tilbehør. Åbn også Word. 1. Minimer straks begge

Læs mere

VUC IT Niveau G. Drev Mapper Filer

VUC IT Niveau G. Drev Mapper Filer VUC IT Niveau G Drev Mapper Filer Harddiske og andre lagringsmedier ( drev ) Det mest enkle er at tænke på disk-drev som et arkivskab. Drev navngives med et bogstav. Normalt navngives med C:, D:, E: osv.

Læs mere

Indholdsfortegnelse. Hvorfor skal jeg tage backup af min blog? Side 3. Tag backup med UpDraft Side 4. Tag manuelt backup Side 8 - 2 -

Indholdsfortegnelse. Hvorfor skal jeg tage backup af min blog? Side 3. Tag backup med UpDraft Side 4. Tag manuelt backup Side 8 - 2 - - 1 - Indholdsfortegnelse Hvorfor skal jeg tage backup af min blog? Side 3 Tag backup med UpDraft Side 4 Tag manuelt backup Side 8-2 - Hvorfor skal jeg tage backup af min blog? Lige meget om du har opbygget

Læs mere

Internettet. Tema. på ipad Opdateret d Ældresagens datastue Aktivitetscentret Bavnehøj. Nørre Snede Tema: Internettet på ipad

Internettet. Tema. på ipad Opdateret d Ældresagens datastue Aktivitetscentret Bavnehøj. Nørre Snede Tema: Internettet på ipad n Tema Internettet på ipad Opdateret d. 14.10.2017 Sofus Opdateret d. 31. januar 2017 Side 1 Indhold Side 3 Side 3 Side 4 Side 4 Side 5 Side 6 Side 7-8 Side 9 Side 10 Side 11 Side 12 Side 13 Side 14 Side

Læs mere

Søgning af varekoder i IDEP.web

Søgning af varekoder i IDEP.web Søgning af varekoder i IDEP.web Oktober 2018 Denne vejledning beskriver, hvordan man kan søge varekoder i IDEP.web. Har du brug for at læse mere om, hvordan man opretter Egne varekoder i IDEP.web, kan

Læs mere

Brugermanual. Outlook Web Access for Exchange Server 2003 (OWA 2003) Udarbejdet af IT-afdelingen 2006

Brugermanual. Outlook Web Access for Exchange Server 2003 (OWA 2003) Udarbejdet af IT-afdelingen 2006 Brugermanual Outlook Web Access for Exchange Server 2003 (OWA 2003) Udarbejdet af IT-afdelingen 2006 Indholdsfortegnelse INDLEDNING... 3 HVORDAN DU FÅR ADGANG TIL DIN EMAIL... 3 OWA 2003 BRUGERGRÆNSEFLADE...

Læs mere

E-MAIL MICROSOFT OUTLOOK 2010

E-MAIL MICROSOFT OUTLOOK 2010 E-MAIL MICROSOFT OUTLOOK 2010 Erik Thorsager, Esbjerg. 3. udgave: Outlook Side 1 Microsoft Outlook 2010 Hvordan skriver og sender jeg en e-mail? Det engelske ord mail betyder post. E står for elektronisk.

Læs mere

CD-ORD 9.0. Kom godt i gang

CD-ORD 9.0. Kom godt i gang CD-ORD 9.0 Kom godt i gang CD-ORD Denne manual giver de mest nødvendige informationer om CD-ORD 9.0. Du kan finde en uddybende manual om programmet i CD-ORDs værktøjslinje. Hjælp i værktøjslinjen. Kom

Læs mere

Skyfillers Online Backup. Kundemanual

Skyfillers Online Backup. Kundemanual Skyfillers Online Backup Kundemanual Kundemanual Indhold Opsætning... 2 Installation... 2 Download software... 2 Installation under Windows... 2 Installation under Mac OS X... 3 Log ind... 3 Tilpas kontoindstillinger...

Læs mere

BRUGERMANUAL FOR KLUBKOORDINATORER. Version 2.0

BRUGERMANUAL FOR KLUBKOORDINATORER. Version 2.0 BRUGERMANUAL FOR KLUBKOORDINATORER Version 2.0 Login Du skal vælge den klub som du tilhøre og dernæst indtaste din kode i feltet: Password. Regionsgolf-Danmark Administration Når du er logget ind i system

Læs mere

Norddjurs hjemmefra. Vejledning. Få adgang til Citrix hjemmefra på en Norddjurs Kommune PC IT-AFDELINGEN

Norddjurs hjemmefra. Vejledning. Få adgang til Citrix hjemmefra på en Norddjurs Kommune PC IT-AFDELINGEN Af: Anders C. H. Pedersen E-mail: [email protected] Revideret: 7. januar 2015 IT-AFDELINGEN Vejledning Norddjurs hjemmefra Få adgang til Citrix hjemmefra på en Norddjurs Kommune PC Norddjurs Kommune. Torvet

Læs mere

Anklagemyndighedens Vidensbase

Anklagemyndighedens Vidensbase Anklagemyndighedens Vidensbase Indhold 1 OM DENNE VEJLEDNING... 2 2 LOGIN... 3 3 SØGNINGER... 4 3.1 SØG EFTER DOKUMENTER... 4 3.2 NAVIGÉR DIG FREM... 5 3.3 KOMBINÉR SØGNING OG NAVIGATION... 6 3.4 VISNING

Læs mere