Korpusværktøjet CoREST Manual. Version 2017

Størrelse: px
Starte visningen fra side:

Download "Korpusværktøjet CoREST Manual. Version 2017"

Transkript

1 Korpusværktøjet CoREST Manual Version 2017 Jørg Asmussen Det Danske Sprog- og Litteraturselskab 14. juni 2017 Denne manual vedrører STANDARDUDGAVEN af CoREST. Resumé Manualen er en introduktion til brugen af CoREST. Den beskriver, hvordan man installerer og starter CoREST, og den gennemgår herefter samtlige funktioner i værktøjet. Til gennemgangen knytter der sig mange konkrete eksempler, som skal gøre læseren fortrolig med mulighederne i CoREST. Nyheder i forhold til den tidligere version af CoREST og denne manual er markeret med»nyt«i margin, mens vigtige ændringer i forhold til tidligere er markeret med»obs!«. NYT OBS! 1

2 Indhold I Overblik 5 1 Hvad er CoREST? 6 Sprogkokkens schweizerkniv 2 Hurtigt i gang 9 Gøre gryden klar II Indblik 24 3 Brugerinterfacets funktioner 25 Alle ingredienserne 4 Søgning med jokertegn 50 En gryderet med punktummer og stjerner 5 Avancerede søgeudtryk 54 Det muntre køkken 6 Korpusser i CoREST 76 Så er der serveret III Udblik 79 A Løsningsforslag til opgaverne 80 B Korpussammensætninger 82 Litteratur 86 2

3 Figurer 2.1 Kommunikationsfejl Ikke kompatibel CoREST-version Korpusserver opdateret CoREST-vinduet efter en søgning Intet match fundet i korpus Intet match fundet i korpus Søgeområdet Matchliste for blockbuster.* Hyppige naboord til højre for rimelig Reduceret konkordans på.*undersøgelse Konkordansudsnit med mærker Liste over mærker Eksporteret konkordansudsnit i regneark Konkordansudsnit fra delkorpus i et sammensat korpus Liste over fordelingen på tre delkorpusser Diagram over fordelingen på tre delkorpusser Frekvensdiagram for en række ord Frekvensdiagram af sjældne og hyppige ord over tid Variationsdiagram med frekvensafvigelser fra gennemsnittet Tilsyneladende store udsving i hyppigheden af og Tekstoplysninger Kopiering fra kontekstfeltet Ordoplysninger om ordklasse og bøjning Ordoplysninger i CoREST-korpusser Indstillinger og søgehistorik Match på grupper af ord Søgning med tekstfiltre

4 Tabeller 2.1 Simple søgeudtryk Eksempler på søgninger med kontroltegn De tre mest prominente ord for alle månederne i Oversigt over centrale tekstoplysninger Eksempler på brug af jokertegnet punktum Gentagelsessymboler Symboler med særlig betydning Ordattributter i CoREST-korpusser Avancerede over for simple søgeudtryk Ordklassetags Sætning med epos-tags Korpuskoder i»group«-oplysningstypen Søgning i delkorpusser

5 Del I Overblik 5

6 Kapitel 1 Hvad er CoREST? Sprogkokkens schweizerkniv 1.1 Funktioner Udgaver Teknik Ris og ros Indrapportering af fejl Ny og forbedret funktionalitet CoREST-manualen Funktioner CoREST står for Corpus Retrieval System & Tools. CoREST er et værktøj til avancerede sproglige undersøgelser i meget store tekstsamlinger, såkaldte tekstkorpusser. Med CoREST kan du udføre avancerede søgninger på enkeltord og grupper af ord bruge tekstoplysninger som filtre i søgningerne se fund som matchlister, konkordanser og grafiske præsentationer udføre undersøgelser, der viser, hvilke ord der hyppigt optræder sammen med fundet (kollokationer) se lister over fremtrædende ord i bestemte tidsintervaller sortere resultater på forskellig vis se større kontekster omkring fund se tekstoplysninger som titel, forfatter m.m. 6

7 KAPITEL 1. HVAD ER COREST? 7 se supplerende oplysninger til enkeltord, fx deres grundform, ordklasse og bøjning markere fund eksportere fund som tekstfil til brug i andre programmer 1.2 Udgaver CoREST findes i forskellige udgaver: DSL Denne udgave bruges internt på Det Danske Sprog- og Litteraturselskab og anvendes især til ordbogsredigering. DSL-udgaven giver adgang til en række specialkorpusser samt til visse særlige funktioner, som bruges i forbindelse med ordbogsredigering. Ømål Denne udgave bruges af Ømålsordbogens redaktion og er særligt tilpasset dens behov: Den giver adgang til et dialektkorpus og kan udskrive fund til ordsedler. Research Denne udgave er næsten identisk med DSL-udgaven, dog mangler adgangen til visse specialkorpusser og specialfunktioner. Standard Denne udgave indeholder lidt færre korpusser end de øvrige udgaver. Ellers er funktionerne næsten identiske, dog er visningen af hele tekster af ophavsretlige grunde ikke mulig. Denne manual beskriver Standardudgaven. Du bør skaffe dig en af de andre manualer, hvis du bruger en anden udgave af CoREST. 1.3 Teknik Teknisk set består CoREST-systemet af to dele: Klient Den ene del er en klient, som er installeret på brugerens maskine. I klienten formulerer brugeren søgeforespørgsler, får vist resultater, kan markere fund, eksportere osv. Server Via internettet står klienten i forbindelse med den anden del af CoRESTsystemet, nemlig en server på DSL, som tager imod søgeforespørgslerne, udfører dem på DSL s tekstsamlinger og sender resultater tilbage til brugeren. Populært sagt fungerer CoREST-klienten som en slags browser for det indhold, som korpusserveren stiller til rådighed. CoREST-klienten er udviklet i programmeringssproget Java og fungerer derfor på alle gængse operativsystemer. CoRESTserveren er opbygget som en REST-baseret webservice, ligeledes programmeret i

8 KAPITEL 1. HVAD ER COREST? 8 Java, og kører som en web-applikation under GlassFish. CoREST-serveren bruger OpenCWB som back-end korpussøgemaskine. CoREST, tekstsamlingerne samt tilhørende manualer, sprogteknologiske metoder og værktøjer er udviklet af Jørg Asmussen, DSL. 1.4 Ris og ros CoREST og tilhørende korpusser er under stadig udvikling. Der er derfor ikke tale om et færdigt og fejlfrit produkt! Du vil helt sikkert konstatere en række fejl og mangler, og det er meget sandsynligt, at du vil savne en række funktioner. For at kunne videreudvikle CoREST, så systemet tilgodeser brugernes behov, er dine kommentarer meget velkomne! Send dine idéer og forbedringsforslag enten som fejlrapport eller som ønske om ny og forbedret funktionalitet. Forbedringsforslag og flere konkrete eksempler til selve manualen er også meget velkomne! I de følgende afsnit kan du læse om, hvordan du indsender dine kommentarer og ønsker Indrapportering af fejl Skriv en til corest@dsl.dk. I emnefeltet skriver du fejl. Selve mailen skal have følgende opbygning: Fejl Når jeg gør x, sker der y hvor du så indsætter din beskrivelse for x (hvad du gør) og y (hvad der sker) Ny og forbedret funktionalitet Skriv en til corest@dsl.dk. I emnefeltet skriver du feature. Selve mailen skal have følgende opbygning: Feature Jeg vil gerne lave x, derfor har jeg brug for funktionalitet y hvor du indsætter din beskrivelse for x (hvilket behov du har) og y (hvilken funktionalitet du mangler i den forbindelse) CoREST-manualen Finder du fejl i manualen, har du forbedringsforslag til den eller gode eksempler, som bør optages her, skriver du til corest@dsl.dk. I emnefeltet skriver du manual.

9 Kapitel 2 Hurtigt i gang Gøre gryden klar 2.1 Installere og starte CoREST Downloade CoREST Forudsætning: Java Installere CoREST Kommunikation med serveren Cache Søgning Valg af korpus Indtastning af søgeudtryk Søgeliste Matchliste Annoteringer Konkordans Konkordanslinjeoplysninger Søgehastighed Intet match Finde rundt i programmet Formulere simple søgeudtryk Opgaver: Simple søgeudtryk Bruge kontroltegn i søgeudtryk Opgaver: Brug af kontroltegn Installere og starte CoREST I det følgende beskrives, hvor du kan downloade CoREST, hvordan du installerer programmet på din computer og starter det. Endvidere beskrives korpusserverens meddelelser til brugeren. 9

10 KAPITEL 2. HURTIGT I GANG Downloade CoREST Du kan downloade CoREST-klienten fra CoREST s hjemmeside. 1 Du får den i form af en sammenpakket zip-fil, dvs. en fil, hvis navn ender på.zip. Det fulde navn på zip-filen afhænger blandt andet af udgaven og versionen, men vil altid starte med CoREST eller corest. Første skridt er at pakke zip-filen ud. Det sker som regel ved blot at dobbeltklikke på filen. Eventuelt har din computer allerede automatisk sørget for det i forbindelse med download af filen Forudsætning: Java CoREST er et Java-program. Det kan derfor køre på alle operativsystemer, forudsat at Java 8 (eller højere) er installeret. På langt de fleste maskiner, som er nogenlunde up to date, er dette tilfældet. Hvis den aktuelle version af Java af en eller anden grund ikke er på din maskine, vil CoREST ikke kunne køre. Du finder Java på Oracles hjemmeside, 2 hvor der også er hjælp at hente omkring installationen Installere CoREST Efter udpakningen af zip-filen er der oprettet en mappe af samme navn som zipfilen, dog uden endelsen.zip. Vi kalder denne mappe for CoREST s programmappe. Du kan lægge programmappen et vilkårligt sted på din maskine; oplagt er dog det sted, hvor dine øvrige programmer ligger. Når du har lagt programmappen der, hvor du vil have den, åbner du mappen ved at dobbeltklikke på den. Du vil her bl.a. se en fil ved navn CoREST-FX.jar. CoREST-klienten startes ved at dobbeltklikke på denne fil. Hverken denne eller andre filer må fjernes fra programmappen! Derfor kan det være en idé at oprette en genvej til CoREST-FX.jar, fx fra Windows skrivebord eller fra Mac ens dock. Nu er du færdig med installationen og klar til at bruge CoREST. CoREST startes ved at dobbeltklikke på filen CoREST-FX.jar, som ligger i CoREST-programmappen, eller ved at dobbeltklikke på den genvej, du eventuelt har oprettet hertil »Ukendt udvikler«på Mac Første gang, du åbner CoREST på en Mac, kan der komme en meddelelse om, at programmet stammer fra en ukendt udvikler og derfor ikke kan startes. I så fald finder du frem til filen CoREST-FX.jar, højreklikker på den, så en lokal menu kommer op, og vælger Åbn fra denne menu. Igen bliver du advaret om, at programmet stammer fra en ukendt udvikler, men denne gang kan du åbne det ved at klikke på

11 KAPITEL 2. HURTIGT I GANG 11 Figur 2.1: Kommunikationsfejl Figur 2.2: Ikke kompatibel CoREST-version knappen Åbn i den dialogboks, der kommer op. Du skal kun igennem denne manøvre én gang, da CoREST fremover vil kunne startes som alle øvrige programmer på din Mac Kommunikation med serveren Det er vigtigt, at CoREST kan få adgang til CoREST-serveren fra din computer. Det vil sige: Din computer skal have internetforbindelse Din version af CoREST skal kunne kommunikere med den aktuelle version af CoREST-serveren. Hvis der opstår problemer med kommunikationen over nettet mellem CoREST og serveren, viser CoREST en fejlmeddelelse om, at serveren ikke svarer som forventet, se figur 2.1. Efter at du har klikket på OK og har sikret dig, at din netforbindelse fungerer, kan du forsøge at genstarte CoREST. Hvis din version af CoREST er forældet i forhold til serveren, kan du ikke længere bruge CoREST, før den er blevet opdateret til en nyere version. Du vil da få en meddelelse om manglende kompatibilitet, se figur 2.2. Endelig kan du få en meddelelse om, at serveren er blevet opdateret, se figur 2.3. Der er i dette tilfælde oftest tale om, at et korpus er blevet udvidet eller forbedret. I dette tilfælde slettes CoREST s lokale cache (jf. afsnit 2.1.5) på din maskine og dine indstillinger nulstilles, så CoREST ikke viser forældede eller fejlagtige resultater. Efter en sådan opdatering opfører CoREST sig, som var den blevet startet for første gang, hvilket betyder, at du skal være opmærksom på, at korpusset KORPUS-DK automatisk er valgt, jf. afsnit 2.2.

12 KAPITEL 2. HURTIGT I GANG 12 Figur 2.3: Korpusserver opdateret Hvis der opstår problemer, som du mener skyldes en generel fejl i CoREST, er du velkommen til at indsende en fejlrapport som beskrevet i Cache CoREST-klienten kommunikerer med CoREST-serveren over internettet. Udvekslingen af data over nettet kan være en tidskrævende faktor ved søgningen. For at få systemet til at reagere så hurtigt som muligt, gemmes alle data, som din CoRESTklient har hentet fra serveren, i en dertil oprettet database på din maskine, en såkaldt cache. Får din klient på et senere tidspunkt brug for at hente de samme data igen, undersøger den først, om de allerede ligger i cachen. Hvis det er tilfældet, hentes data direkte herfra i stedet for serveren. Normalt behøver du ikke tænke over cachens tilstedeværelse. Hvis der dog optræder problemer med CoREST s funktionalitet, kan de sommetider løses ved at slette cachens indhold. Problemer kan optræde, når en ny version af et korpus eller CoREST tages i brug, eller når en søgning slog fejl. Du tømmer cachen ved at klikke på knappen»empty Cache«i info-vinduet, jf. figur 3.19 på side Søgning Første gang CoREST startes, er korpusset KORPUS-DK 3 automatisk valgt og der er indsat en søgning på korpus i søgefeltet. Du kan nu enten taste retur eller klikke på søgeknappen det er knappen til højre for søgefeltet, som ligner en lup. Herefter udfører CoREST søgningen på ordet korpus i KORPUS-DK og viser som resultat alle fund fra korpus, hvert på en linje med søgeordet centreret og noget kontekst omkring. En sådan opstilling kaldes en konkordans. Efter søgningen svarer CoREST-vinduet omtrent til det, du kan se i figur Valg af korpus Øverst til venstre i CoREST-vinduet er der en rullemenu, hvor du kan vælge det korpus, som du vil arbejde med. Denne menu kaldes korpusvælgeren. Når CoREST startes første gang, er standardkorpusset KORPUS-DK automatisk valgt. Alle udgaver af CoREST giver adgang til korpusset KORPUS-DK. 3 Du kan læse mere om dette korpus under 6.1 på side 76.

13 KAPITEL 2. HURTIGT I GANG 13 Figur 2.4: CoREST-vinduet efter en søgning Sammensatte og ikke-sammensatte korpusser I CoREST findes der to slags korpusser: sammensatte og ikke-sammensatte. Et sammensat korpus består af en række mindre delkorpusser. Fx består det sammensatte korpus TiDK 2017 af ét delkorpus per år for perioden En søgning i et sammensat korpus vil give resultater fra samtlige delkorpusser. Fordelen ved et sammensat korpus er, at man kan foretage sammenlignende undersøgelser de enkelte delkorpusser imellem. Resultaterne af disse undersøgelser kan også præsenteres i form af diagrammer. Sammensatte korpusser kan du i korpusvælgeren kende på, at deres navne begynder med en bindestreg. Et ikke-sammensat korpus som KORPUS-DK derimod er kun ét korpus, det består kun af sig selv, er ikke sammensat af andre, mindre korpusser. Indtil videre vil vi her i gennemgangen holde os til det ikke-sammensatte KORPUS-DK. Dette korpus findes i øvrigt også i en sammensat version; søgninger i dette korpus demonstreres i på side 37. Desuden vises eksempler på søgninger i det sammensatte TiDK-korpus i 3.4 på side 38. I korpusvælgeren begynder sammensatte korpusser altid med en bindestreg, fx -KORPUS-DK og -TiDK.

14 KAPITEL 2. HURTIGT I GANG Indtastning af søgeudtryk Til højre for korpusvælgeren er der et indtastningsfelt, hvor du indtaster det, du vil søge på, formuleret som et søgeudtryk. Dette felt kaldes søgefeltet. I søgefeltet kan du indtaste to typer søgeudtryk: simple og avancerede. Her i hurtigt i gang-kapitlet til CoREST holder vi os udelukkende til simple søgeudtryk, mens de avancerede bliver behandlet i kapitel 5. Et simpelt søgeudtryk består i sin mest enkle form af et eller flere ord. I søgeudtrykket kan der også indgå såkaldte jokertegn (regulære udtryk). Ved at klikke på søgeknappen eller ved at taste retur sætter du søgningen i gang i det valgte korpus. Prøv at skrive søgeudtrykket fantom.* i søgefeltet og tast retur eller klik på søgeknappen. Denne søgning finder alle eksempler fra korpus, som indeholder ord, som begynder med fantom inklusive ordet fantom selv. Jokertegnet.* (punktum stjerne) betyder, at der kan være et vilkårligt antal (også nul) vilkårlige bogstaver på dette sted. En udførlig beskrivelse af, hvordan man bruger jokertegn i CoREST, finder du i kapitel 4. I det følgende gennemgås de forskellige oplysninger, som du får i CoRESTvinduet efter en søgning Søgeliste Efter start af CoREST er fanebladet»searches«i området med lister til venstre for konkordansområdet automatisk valgt, efter søgningen på fantom.* står dette søgeudtryk øverst på søgelisten»my Queries«. Søgelisten indeholder måske i forvejen andre søgeudtryk, som stammer fra tidligere søgninger. I søgelisten»my Queries«registreres alle dine søgninger i kolonnen»query«sammen med det antal gange, du har udført dem i kolonnen»count«. Hvis du hurtigt vil vende tilbage til en tidligere søgning, kan du nøjes med at markere søgeudtrykket på søgelisten og taste retur. En udførlig beskrivelse af søgelister finder du i på side 27. OBS! Matchliste Til højre for fanebladet»searches«er der et med navnet»matches«. Klikker du på det efter søgningen på fantom.*, vises alle forskellige ord fra korpus, som matcher søgeudtrykket. Listen er som udgangspunkt alfabetisk sorteret. Øverst på listen står altid selve søgeudtrykket rykket lidt ind til højre, så det kan skelnes fra de andre ord på listen. Ud for hvert ord vises en score, der angiver, hvor hyppigt pågældende ord er blandt alle ord, der matcher søgeudtrykket. Alle match tilsammen sættes altid til (svarende til 100 %). En søgning på fantom.* giver blandt mange andre følgende match: fantom med en score på 2244, altså en andel på 22,44 % af samtlige match, og fantomet med en score på 2598 (25,98 %). Disse to former udgør tilsammen altså knap halvdelen af alle match. Matchlisten kan også sorteres efter score ved at klikke på overskriften Score over score-kolonnen. Klikker du på et match på matchlisten, fx på fantombillede, fremhæves den første

15 KAPITEL 2. HURTIGT I GANG 15 forekomst af denne form i konkordansen. En udførlig beskrivelse af matchlisten finder du i Annoteringer Et tredje faneblad»tags«er ikke relevant i denne hurtige gennemgang af funktionerne. Det beskrives i Konkordans Konkordansen viser korpusforekomster af de ord, der matcher søgeudtrykket. Hver forekomst vises centreret på en linje med nogle ords kontekst omkring. Konkordansen er som udgangspunkt lige som matchlisten sorteret alfabetisk på matchet. Ved en søgning på fantom.* i KORPUS-DK er det samtlige 254 forekomster af alle former fra matchlisten, der vises i konkordansen. En konkordans kan maksimalt vise 2000 fund fordelt på 20 sider med 100 fund per side. Hvis der er flere match i korpus, reduceres antallet af viste fund automatisk til 2000 fund. Hvis en konkordans indeholder flere end 100 fund og dermed består af flere sider, kan du skifte fra side til side med sidevælgeren, jf. figur 2.4. En udførlig beskrivelse af konkordanser og hvad du kan lave med dem, findes under i afsnit Konkordanslinjeoplysninger Under konkordansen vises yderligere oplysninger om den konkordanslinje, der aktuelt er markeret. Umiddelbart efter en søgning er det altid den første konkordanslinje, der er markeret. Oplysningerne vises i de følgende tre felter fra venstre mod højre under konkordansen, jf. figur 2.4:»Text«Tekstoplysninger Her vises oplysninger om den tekst, som den markerede konkordanslinje stammer fra. Tekstoplysningernes omfang og art kan variere fra korpus til korpus. Du kan læse mere om tekstoplysninger i afsnit 3.5.»Context«Kontekst Her vises matchet med noget mere kontekst omkring, end hvad der kan vises i selve konkordanslinjen. En udførlig beskrivelse af tekstog kontekstvisning finder du i afsnit 3.6.»Tags«Ordoplysninger Til hvert ord i korpus kan der være knyttet forskellige oplysninger, fx dets grundform eller dets ordklasse. Et udvalg af disse oplysninger vises i ordoplysningsfeltet. Disse oplysninger varierer fra korpus til korpus. Du kan læse mere om ordoplysninger i afsnit 3.7.

16 KAPITEL 2. HURTIGT I GANG 16 Figur 2.5: Intet match fundet i korpus Figur 2.6: Intet match fundet i korpus Søgehastighed Søgehastigheden afhænger direkte af det antal forekomster, som CoREST finder på baggrund af dit søgeudtryk. Hvis dit søgeudtryk søger på grupper af ord, er det antallet af match på det første ord i gruppen, der er afgørende for hastigheden. Populært sagt Jo flere match søgeudtrykket har i korpus, desto længere tid er Co- REST om at finde dem frem, også selvom CoREST til sidst kun afleverer 2000 eksempler til visning i konkordansen. Mens søgningen foregår, viser CoREST et roterende ventetidssymbol på det sted, hvor søgeknappen ellers befinder sig. Hvis du fx prøver at udføre en søgning på.*, som matcher alle ord i korpus, altså knap 110 millioner i KORPUS-DK, bliver søgningen afvist af CoREST, fordi den er for tidskrævende. Når CoREST blokerer bestemte søgninger, vises meddelelsen i figur 2.5. En gentagen søgning på samme søgeudtryk vil som regel gå hurtigere, idet resultaterne så vil blive hentet fra en lokal cache, jf. afsnit 2.1.5, og ikke fra serveren Intet match Hvis der i det valgte korpus ikke findes noget match på din søgning, markeres søgefeltet med en rødlig farve, som vist i figur 2.6. Prøv at udføre en søgning på vxlkommen for at få meddelelsen frem. Den samme tilbagemelding får du, hvis dit søgeudtryk indeholder formelle fejl, som bevirker, at CoREST ikke kan fortolke søgeudtrykket. Det gælder fx velkommen] som slutter på en kantet parentes. Kantede parenteser har en særlig funktion i søgeudtryk (jf ), og de skal derfor anvendes på en særlig måde, som ikke er overholdt her.

17 KAPITEL 2. HURTIGT I GANG Finde rundt i programmet I dette afsnit gennemgås, hvordan du gør de forskellige områder af CoREST s brugerinterface aktive på skift. Det aktive område er det, der modtager input fra tastaturet, det område, som har fokus. Når et område har fokus, vises det i CoREST ved, at det er omgivet af en smal, blå ramme. Du kan bruge tabulatortasten til at skifte fokus mellem de forskellige områder af grænsefladen. Søgefeltet Efter en søgning har søgefeltet fokus, og søgeudtrykket er markeret med en blå baggrund. CoREST er klar til at modtage et nyt søgeudtryk, som du kan indtaste umiddelbart uden forudgående klik med musen nogen steder. Ordliste Efter endnu et tryk på tabulatortasten skifter fokus til den aktuelt valgte ordliste (som udgangspunkt»searches«). Her kan du nu med pil-ned eller pil-op flytte markøren fra linje til linje. Hvis fanebladet»searches«er valgt, medfører et tryk på retur en søgning på pågældende ord eller udtryk. Hvis fanebladet»matches«er valgt, medfører et tryk på retur, at første forekomst af pågældende match bliver vist og fremhævet i den tilhørende konkordans, jf. søgningen på fantom.* i Fanebladet»Annotations«har en særlig funktionalitet, som bliver nærmere beskrevet under følgende punkt»konkordansen«. OBS! Konkordansen Endnu et tryk på tabulatortasten rykker fokus fra matchlisten til konkordansen. Nu vedrører alle tastetryk konkordansen. Med tryk på pilned og pil-op kan du flytte markøren fra konkordanslinje til konkordanslinje. Konkordanslinjeoplysningerne under konkordansen opdateres løbende og viser altid de oplysninger, som vedrører den aktuelt markerede linje. En konkordans er delt op i sider med 100 linjer per side. En konkordans kan maksimalt være på 20 sider à 100 linjer. Er der flere forekomster, reduceres konkordansen automatisk til 2000 linjer. Du skifter fra side til side ved at taste pil-højre eller pil-venstre, ved at klikke på knapperne pil-højre eller pil-venstre over konkordansen eller ved at vælge en side med sidevælgeren ved siden af pileknapperne. Når konkordansområdet har fokus, kan der også indtastes korte annoteringer, såkaldte mærker eller tags, se 3.3.5, som bliver synlige til højre for konkordanslinjen. Mærkerne samles under fanebladet»tags«. Ved at trykke retur på et mærke fra listen får du vist de fund i korpus, som har fået tildelt pågældende mærke. Tilbage til søgefeltet Et sidste tryk på tabulatortasten skifter fokus fra annoteringsfeltet tilbage til søgefeltet. Pladsfordelingen mellem ordlisteområdet til venstre i CoREST-vinduet og konkordansområdet kan forskydes, idet du med musen forskyder skillelinjen mellem disse områder. Hvis du skyder denne linje helt ud til venstre, kan du skjule området

18 KAPITEL 2. HURTIGT I GANG 18 med ordlister helt. Du kan tilsvarende forskyde fordelingen mellem konkordans og konkordansoplysningerne under den, og mellem konkordansoplysningerne indbyrdes, dog ikke så meget, at du kan skjule nogen af disse områder helt. 2.4 Formulere simple søgeudtryk Nu kan du lave nogle simple søgeforespørgsler i CoREST. Tabel 2.1 viser en række søgeudtryk, som du kan starte med. Alle søgningerne er lavet i korpusset KORPUS- DK. I nogle af eksemplerne anvendes jokertegnet.* (punktum stjerne), som betyder nul, ét eller flere vilkårlige bogstaver på jokertegnets plads. Søgeudtryk på flere ord giver resultater, hvor der mellem hvert af de matchende ord kan være op til tre andre vilkårlige ord. Mellemrum mellem ord vises her i manualen som tegnet, men du skal indtaste dem som ganske almindelige ordmellemrum i CoREST s søgefelt. Det er en god idé at vælge fanebladet»matches«blandt listefanebladene, inden du afprøver søgningerne, for her får du altid vist en oversigt over alle forskellige match til hver enkelt søgning. I kapitel 4 får du en fuldstændig introduktion til søgning med jokertegn. I kapitel 5 kan du læse en udførlig beskrivelse af avancerede søgninger, som giver dig fuld kontrol over, hvad du vil finde. Du kan læse mere om, hvordan et ord er defineret i CoREST i Opgaver: Simple søgeudtryk De følgende opgaver beror på søgninger i KORPUS-DK. Du kan besvare opgaverne ved at formulere passende simple søgeudtryk, udføre søgningerne og betragte de resulterende matchlister (vælg listefanebladet»matches«), som det kan være en fordel at sortere efter faldende hyppighed ved at klikke to gange på feltet»score«over listen. Her betragter vi kun grundformerne af et ord, øvrige bøjningsformer behandles i næste afsnit. 1. Hvad er den hyppigste orddannelse med førsteleddet smart? 2. Hvorfor er der ingen forekomster af smarttelefon? 3. Hvad er de hyppigste to typer telefoner i korpus? 4. Hvilke orddannelser er hyppigst? Dem, der har udbyder som førsteled eller dem, der har udbyder som andetled? 5. Hvad er det hyppigste adjektiv mellem nye og medier? 6. Hvad er det hyppigste substantiv mellem de ord, der matcher ny.* og medi.*?

19 KAPITEL 2. HURTIGT I GANG 19 Søgeudtryk smart SMART smart.* Kommentar Matcher alle forekomster af smart i korpus Samme resultat som søgningen på smart Matcher alle ord, som begynder med smart smarttelefon.* Matcher alle ord, som begynder med smarttelefon ingen forekomster i KORPUS-DK.*telefon tele.*en.*udbyder.* nye medier $nye medier ny.* medi.* $ny.* medi.* $ud af boks.* $to værelses $pc en Matcher alle ord, som ender på telefon Matcher alle ord, som begynder med tele og ender på en Matcher alle ord, som indeholder (eller begynder med eller slutter på) udbyder Matcher alle ordgrupper, som starter med nye og slutter med medier med op til 3 vilkårlige ord mellem nye og medier Dollartegnet foran søgeudtrykket bevirker, at det kun matcher nye medier uden andre ord imellem Matcher alle ordgrupper, hvis første ord begynder med ny, og hvis sidste ord begynder med medi, og som har op til 3 vilkårlige ord imellem sig Dollartegnet gør, at søgeudtrykket kun matcher ordpar, hvor det første begynder med ny og det sidste med medi Matcher alle de grupper på 3 ord, som begynder med ordene ud af og ender med et ord, der begynder med boks Matcher både to værelses og to-værelses, idet bindestreg betragtes som ordgrænse Matcher både (giv din) pc en (vitaminindsprøjtning), (en) pc, en (telefon) og pc en, idet apostrof og sætningstegn fungerer som ordgrænse $2 0 Matcher bl.a. 2.0, 2,0, 2-0, da sætningstegn (herunder bindestreg) fungerer som ordgrænser Tabel 2.1: Simple søgeudtryk

20 KAPITEL 2. HURTIGT I GANG Hvad er de fire hyppigste ordgrupper, der matcher høre.* gro? Løsningsforslag findes i appendiks A Bruge kontroltegn i søgeudtryk Der kan anvendes en række kontroltegn i simple søgeudtryk. Kontroltegn bevirker, at søgningen udføres på en lidt anden måde end ellers. $ = ingen ekstra ord Dette kontroltegn har du allerede lært at kende, se tabel 2.1. Det sættes som det første tegn i et søgeudtryk. Mens søgeudtrykket vanskelig situation finder eksempler på både vanskelig situation, vanskelig finansiel situation, vanskelig og sårbar situation og en række andre (der kan være op til tre ord mellem vanskelig og situation), så finder udtrykket $vanskelig situation kun eksempler, hvor de to ord i søgeudtrykket står umiddelbart ved siden af hinanden. # = ét vilkårligt ord Beslægtet med $ er kontroltegnet #. Det betyder præcist ét ord pågældende sted. Søgeudtrykket vanskelig # situation finder således blandt andet vanskelig økonomisk situation, vanskelig politisk situation og vanskelig finansiel situation i KORPUS-DK. Husk, at der skal være mellemrum mellem # og de omgivende ord vanskelig#situation giver intet resultat. Kontroltegnet # kan også anvendes flere gange, fx finder vanskelig ## situation eksemplerne vanskelig og penibel situation, vanskelig og sårbar situation og vanskelig og ubehagelig situation, altså eksempler med præcis to ord mellem vanskelig og situation. Hvis du anvender kontroltegnet #, så er et eventuelt foranstillet $ i søgeudtrykket uden virkning, søgeresultatet er det samme. I stedet for kontroltegnet # kan du også bruge [] (kantede parenteser uden noget imellem). Yderligere to kontroltegn vedrører fortolkningen af søgeord i søgeudtryk.! = skelne mellem store og små bogstaver Udråbstegn! umiddelbart foran et ord betyder, at ordet skal være stavet præcist som i søgeudtrykket, hvis det skal matche. Mens søgeudtrykket SMART finder eksempler på smart, Smart og SMART, finder!smart udelukkende eksempler, der er stavet præcist som angivet i søgeudtrykket, i dette tilfælde altså eksempler på SMART. Tilsvarende finder søgeudtrykket café både café og cafe i store og små varianter. Det samme gælder for søgeudtrykket cafe. Derimod finder!cafe kun de stavninger som præcist svarer til den i søgeudtrykket, altså eksempler på = alle bøjningsformer af et ord foran et ord betyder, at der skal søges på samtlige bøjningsformer af pågældende ord. Således alle forekomster af formerne hændelse, hændelsen, hændelsens, hændelser, hændelserne, hændelsernes, hændelsers og hændelses.

21 KAPITEL 2. HURTIGT I GANG 21 Denne type søgninger er kun mulig i korpusser, som er forberedt til det korpusset skal være lemmatiseret. Er det ikke det, intet resultat. De to kontroltegn! kan ikke begge sættes foran samme ord, et sådant søgeudtryk er ugyldigt og giver ikke noget resultat. % = bøjningsformer og ord, som begynder med søgeudtrykket Dette kontroltegn virker men samtidig udføres også en søgning på søgeordet med et tilføjet.* i slutningen, som finder alle ord, der begynder med søgeordet inklusive søgeordet selv. Denne søgning kan betragtes som et alternativ især i de tilfælde, hvor ikke giver det forventede resultat. Ikke alle ordformer er identificeret korrekt i korpus, hvilket kan have indflydelse på resultatet af Det tager noget mere tid at udføre en %-søgning end eller.*-søgning alene. Tabel 2.2 giver en række eksempler på søgninger med kontroltegn Opgaver: Brug af kontroltegn De følgende opgaver beror på søgninger i KORPUS-DK. Du kan besvare opgaverne ved at udføre søgninger i KORPUS-DK ved at udføre søgninger på søgeudtryk med kontroltegn og betragte de resulterende matchlister og konkordanser. NB! I matchlisterne vises altid normaliserede former af de match, CoERST finder, mens de i selve konkordansen er gengivet i deres originale form. 1. Hvor mange forekomster er der af ordet själ (stavet på denne måde) i KORPUS-DK, og hvilke tekster stammer de fra? 2. Et af resultaterne af en søgning på uber # (altså den tyske præposition über uden prikker over u et fulgt af et vilkårligt ord) er uber cool. Hvad er en mulig grund til, at sprogbrugeren bag dette fund ikke anvender den måske mere normrette stavning übercool? 3. Hvad er det hyppigste ord i KORPUS-DK, som begynder med über stavet på præcist denne måde? 4. Hvilke er de tre hyppigste navne (proprier), som begynder med Cirkus med stort C? 5. Hvad er det mest omtalte kapel (proprium) i KORPUS-DK? Og det næstmest omtalte? 6. Hvilke bøjningsformer af cirkus findes i KORPUS-DK? 7. Hvorfor findes formen cirkuset ikke, når man søger 8. Hvilken tvetydighed løber man ind i ved en søgning

22 KAPITEL 2. HURTIGT I GANG 22 Søgeudtryk uber!uber Kommentar Matcher alle forekomster af über og uber med en hvilken som helst kombination af store og små bogstaver Matcher kun forekomster af uber (stavet nøjagtigt på denne måde)!cirkus.* Matcher alle ord, der begynder med Cirkus (med stort C) Matcher alle grupper på præcist tre ord, hvoraf det første er en staveform af det, det andet et vilkårligt ord og det tredje den præcise staveform Kapel (med stort K ) Matcher alle bøjningsformer af grundformen cirkus i søgekorpusset Matcher alle bøjningsformer af grundformerne Matcher alle grupper på præcist 3 ord, hvoraf det første er en bøjningsform af lærer, det andet et vilkårligt ord og det tredje en bøjningsform af elev flere ## %drink Matcher alle grupper på præcist 4 ord, hvoraf det første er flere, det andet og tredje et vilkårligt ord og det sidste end Matcher alle de grupper på præcist 2 ord, som begynder med en form af se og slutter med en bøjningsform af et ord, hvis grundform slutter på udsendelse Matcher drink, drinken, drink og drinksene Matcher og derudover blandt mange andre drinkens, drinks og drinksenes Tabel 2.2: Eksempler på søgninger med kontroltegn

23 KAPITEL 2. HURTIGT I GANG Et af matchene i KORPUS-DK er lærer slår eleverne. Hvordan skal dette match fortolkes? 10. Hvad er den hyppigste konstruktion, som matcher flere ### end? Løsningsforslag findes i appendiks A.2.

24 Del II Indblik 24

25 Kapitel 3 Brugerinterfacets funktioner Alle ingredienserne 3.1 Søgning NYT 3.2 Alt om lister Lister med søgninger Lister med fund Eksportere lister Alt om konkordanser Visning af konkordanser Reduktion af konkordanser Blade i konkordanser Sortere konkordanser Annotere konkordanser Eksportere konkordanser Konkordanser i sammensatte korpusser Alt om grafiske oversigter Visning af tekstoplysninger Kontekstvisning Mere kontekst Visning af ordoplysninger Indstillinger og systeminformationer Slette indstillinger Tømme søgecache Tømme søgelisten med egne søgninger Udseende Skriftstørrelse Visning af rullebjælker Sessionsprotokol

26 KAPITEL 3. BRUGERINTERFACETS FUNKTIONER Søgning NYT Øverst i CoREST-vinduet finder du alle betjeningselementer, som bruges til at udføre søgninger i et korpus med, se figur 3.1. Figur 3.1: Søgeområdet Fra venstre mod højre er der følgende elementer: Korpusvælger: Med korpusvælgeren vælger du det korpus, som du vil søge i. Antallet af tilgængelige korpusser afhænger af den CoREST-udgave, du bruger. CoREST husker det valgte korpus fra gang til gang, men når du starter Co- REST for første gang, eller når CoREST eller et korpus er blevet opdateret, vil CoREST altid automatisk vælge standardkorpusset KORPUS-DK. Så efter start af CoREST bør du huske at tjekke, om CoREST faktisk søger i det korpus, du forventer. Alle udgaver af CoREST giver adgang til korpusset KORPUS- DK. Derfor beror de fleste eksempler her i manualen på dette korpus. Du kan læse mere om de forskellige korpusser i CoREST i kapitel 6. Søgefelt: Til højre for korpusvælgeren er der et indtastningsfelt, hvor du indtaster det, du vil søge på formuleret som et søgeudtryk. I dette søgefelt kan du indtaste to typer søgeudtryk: simple og avancerede. Simple søgeudtryk er behandlet i 2.4 på side 18, mens de avancerede behandles i kapitel 5. Du kan ikke blande de to typer søgeudtryk i en og samme søgning. Søgeknap: Søgeknappen befinder sig til højre for søgefeltet. Når du klikker på søgeknappen (eller taster retur) sættes en søgning på det indtastede søgeudtryk i gang i det valgte korpus. Ved længerevarende søgninger forvandles søgeknappen til et roterende ventetidssymbol. Filterboks: Sætter du et hak i filterboksen til højre for søgeknappen, åbnes der en række med forskellige filtermuligheder, så du fx kan begrænse søgningen til kun at omfatte tekster fra et bestemt år eller en bestemt kilde. Du kan læse mere om denne type søgninger i afsnit 5.5. Gemme og hente søgninger: Til højre for filterboksen er der to knapper, der henholdsvis tjener til at gemme en søgning som en fil på din maskine og senere hente den ind i CoREST igen. Ved meget komplekse søgninger med et avanceret søgeudtryk og detaljerede filtre kan det være en fordel at gemme "opskriften" på søgningen til genbrug ved en senere lejlighed. Endvidere kan disse søgeopskrifter også deles med andre brugere. Indstillinger og systeminfo: Tandhjulsymbolet yderst til højre giver adgang til indstillinger og systeminformation, som er nærmere beskrevet i afsnit 3.8.

27 KAPITEL 3. BRUGERINTERFACETS FUNKTIONER Alt om lister CoREST kan vise tre typer lister i området til venstre for konkordansområdet. Du vælger en af typerne ved at klikke på et af fanebladene markeret med listevælgere i figur 2.4 på side 13: Søgninger, fund og annoteringer, hvilket svarer til fanebladene»searches«,»matches«og»tags«. I det følgende gennemgås søgninger og fund, mens annoteringer behandles i afsnit Lister med søgninger Under fanebladet»searches«finder du lister med søgeudtryk, fx de søgninger, som du selv har lavet, eller andre relevante søgninger. Omfanget og arten af disse lister afhænger af, hvilken udgave af CoREST du bruger, og hvilket korpus du har valgt Søgehistorik Alle søgninger, som du laver, registreres i listen»my Queries«sammen med det antal gange, du har udført hver enkelt søgning. Normalt er listen sorteret sådan, at dine nyeste søgninger står øverst på listen, mens de ældste står nederst. Du kan dog også sortere dem alfabetisk eller efter deres hyppighed ved at klikke på kolonneoverskrifterne. Gentagne klik skifter mellem de forskellige sorteringsmuligheder. Du får udført en søgning fra»my Queries«-listen, idet du markerer det ønskede søgeudtryk og taster retur. Du kan slette søgehistorikken fra indstillingsvinduet, se Søgehistorikken vedrører altid det aktuelt valgte korpus, skifter du korpus (se 2.2.1), indeholder søgehistorikken søgningerne for netop dette korpus. OBS! Månedens ord og årets ord: Hvis du anvender TiDK-korpusset vil der for hver måned, hvor der har været tilstrækkeligt med tekstmateriale, være en liste over særligt påfaldende ord. Vi kalder dem månedens fremtrædende ord. Hver af disse lister indeholder typisk mellem 50 og 100 ord. Manglende måneder skyldes, at der ikke har været data nok for pågældende måned. Månedens ord er ord, som havde en vis udbredelse den pågældende måned, men som på den anden side heller ikke er alt for hyppige i sproget. Ofte er der tale om nye ord. Månedens ord kan også fortælle noget om årets gang. Lad os tage år 2011 som eksempel og se på de tre mest fremtrædende ord for hver måned. Så får vi 2011 sammenfattet i 36 stikord, som vist i tabel 3.1. For de fleste år findes der også en liste for måneden»00«denne særlige liste indeholder ord fra tekster, som ikke kan relateres til en bestemt måned, men blot blev skrevet på et eller andet tidspunkt pågældende år. NYT

28 KAPITEL 3. BRUGERINTERFACETS FUNKTIONER 28 Måned Januar Februar Marts April Maj Juni Juli August September Oktober November December Ord forbrugerminister, tunesisk, efterløn statsløs, libysk, egypter libysk, europagt, atomkatastrofe påskeæg, skærtorsdag, påske grænsekontrol, tryghedspakke, toldkontrol grænseaftale, toldkontrol, folkemøde gældsloft, skybrud, medieimperium valgudskrivelse, betalingsring, vækstpakke betalingsring, valgfest, regeringsforhandling regeringsgrundlag, rekapitalisering, løftebrud narkogæld, vækstminister, finanslovsudspil skattesag, uannonceret, undersøgelseskommission Tabel 3.1: De tre mest prominente ord for alle månederne i 2011 En automatisk beregnet, tilstrækkelig høj score er, hvad der skal til for at gøre et ord fremtrædende. Scoren beregnes ved en sammenligning af samtlige tekster fra en bestemt måned (typisk ca. 3 mio. ords tekstmateriale fra Infomedia) med samtlige tekster fra de 12 forudgående måneder. Beregningen prøver både på at ramme tidsånden og det leksikografisk interessante. Listerne viser ordene i lemmatiseret form, altså omsat til deres opslagsform, og deres score er beregnet på denne opslagsform, ikke på deres faktiske bøjningsformer i korpus. Der er dog også en del ord, som lemmatiseringsalgoritmen ikke kan genkende, enten fordi de er for nye eller for afvigende, og disse eksemplarer behandles ulemmatiseret. Der er også nogle, som af samme grund er lemmatiseret forkert, fx er uannonceret fra december måned i oversigten blevet lemmatiseret som uannoncere. Der oplyses ikke ordklasser i listerne, men den giver sig selv i langt de fleste tilfælde, og det er ikke overraskende primært substantiver, der optræder. Ordklasser er udeladt for at gøre hele beregningen teknisk mere enkel. Listerne indeholder i princippet hverken egennavne eller tal, alligevel kan der sommetider slippe egennavne igennem lidt afhængig af lemmatiseringsalgoritmens luner og andre sprogteknologiske genvordigheder. For enkelte måneder optræder der ord, som egentlig er dele af ord fremkommet ved orddeling. De stammer ofte fra scannede og dårligt efterbehandlede tekster. Sommetider kan der også optræde tyskklingende ord på listerne. De stammer

29 KAPITEL 3. BRUGERINTERFACETS FUNKTIONER 29 typisk kommer fra tyske tekster i Flensborg Avis, som også leveres via Infomedia. Under korpusopbygningen forsøges disse tekster automatisk at sies fra, men engang imellem slipper der nogle igennem. Endelig kan der forekomme uforklarlige forkortelser, som måske er journalistinitialer og andet snask. Listerne er lavet fuldautomatisk, altså ikke af mennesker, og det medfører altså sommetider nogle unøjagtigheder. Se månedens ord i CoREST: Vælg først korpusset TiDK. Under fanebladet»searches«klikker du dernæst på»my Queries«og vælger»månedens ord«i rullemenuen for at se ordene for den seneste måned, som er med i korpus. Du kan vælge andre måneder i vælgeren, der bliver synlig til højre for ordliste-rullemenuen. Du kan klikke på et af disse ord og få vist en konkordans (3.3.1) og hyppigheden af ordet over tid (afsnit 3.4) ved at taste retur. Konkordanser laves dog altid på baggrund af hele korpus, ikke kun den pågældende måned. I TiDK findes lister over årets ord for årene 2011 frem til sidste år som et særligt punkt i søgeliste-rullemenuen. De er fremkommet på samme måde som månedens ord og kan være præget af de samme mangler Lister med fund Under fanebladet»matches«finder du dels listen over ord og udtryk, som umiddelbart matcher dit søgeudtryk, dels lister over hyppige naboord i konteksten omkring dine match i korpus. Når du taster retur, mens listen har fokus, vises korpusforekomster af det markerede fund i konkordansfeltet. Der kan vises forskellige slags lister med fund fremkommet af dit søgeudtryk. Dem vælger du ved hjælp af listevælgeren, en rullemenu øverst til venstre over listen, jf. figur 3.2. Følgende lister er tilgængelige: Matchliste vælg»matches«, læs mere i Naboord vælg»collocations«, læs mere i OBS! I listerne vises fundene altid med forenklet ortografi, dvs. at store bogstaver er omsat til små og accenttegn er fjernet. I det følgende gennemgås matchlister og kollokationer Matchliste Matchliste-visningen får du frem ved at vælge fanebladet»matches«i listeområdet, se figur 2.4 på side 13. I matchlisten vises alle forskellige ord eller ordgrupper fra korpus, som matcher dit søgeudtryk. Øverst på listen står selve søgeudtrykket rykket lidt ind til højre, så det kan skelnes fra de andre ord på listen. Ud for hvert match vises en score, der angiver, hvor hyppigt pågældende match er blandt alle

30 KAPITEL 3. BRUGERINTERFACETS FUNKTIONER 30 Figur 3.2: Matchliste for blockbuster.* match. Alle match tilsammen sættes altid til (svarende til 100,00 %). Prøv fx en søgning på blockbuster.* i KORPUS-DK og se, hvordan matchlisten kommer til at se ud. Oplysninger Søgeudtrykket blockbuster.* matcher alle forekomster af ord, der begynder med blockbuster inklusive blockbuster selv. Der er 121 forekomster i KORPUS-DK. Ordet blockbuster udgør 73,55 % af alle match (score 7355) svarende til 89 forekomster i korpus, mens fx blockbusterbutikken har 0,82 % af alle match (score 82), som i dette tilfælde svarer til 1 forekomst i korpus. Sortering Som udgangspunkt er matchlisten sorteret alfabetisk på match. Du kan sortere den efter score eller i en anden orden (stigende eller faldende) ved at klikke (evt. gentagne gange) på»match«eller»score«i titelbjælken over listen. Eksempler i konkordansen Når du klikker på en linje i matchlisten, markeres første forekomst af pågældende match i konkordansen. Dette kræver dog, at konkordansen er alfabetisk sorteret på»match«, hvad den som udgangspunkt er. Når matchlisten har fokus, jf. afsnit 2.3, kan du navigere fra linje til linje ved at bruge pil-op eller pil-ned på tastaturet. Taster du retur, vises første forekomst af det markerede match i konkordansen, hvis konkordansen er sorteret på»match«. Eksport Du kan eksportere indholdet fra matchlisten som tekstfil ved at klikke på eksportknappen til højre over listen. Tekstfilen er opbygget sådan, at der står

31 KAPITEL 3. BRUGERINTERFACETS FUNKTIONER 31 Figur 3.3: Hyppige naboord til højre for rimelig ét match per linje sammen med scoren, som er adskilt fra matchet med et tabulatortegn. Filen kan nemt importeres i teksteditorer eller regneark Naboord Et naboord er et ord, der optræder hyppigt i den umiddelbare omgivelse af et match. Man kalder matchet sammen med dets hyppige naboord for kollokation. Den umiddelbare omgivelse af et match er i CoREST fastsat til to ord til højre for og to ord til venstre for matchet. Hvad er hyppige naboord? At et naboord er hyppigt, betyder, at det ofte optræder i forbindelse med matchet uden hensyn til naboordets udbredelse i korpus ellers. En liste over naboord til dit aktuelle søgeudtryk får du frem ved at vælge»collocations«fra matchlistevælgeren, se 3.2 på forrige side. Når du stiller listevælgeren på»collocations«, kommer der umiddelbart til højre for den en rullemenu frem, hvor du kan vælge den kontekst (»Right«eller»Left«), hvor den hyppige nabo skal stå, se figur 3.3. Vis hyppige naboord Som udgangspunkt står kollokationstypevælgeren på»left«, som betyder, at de hyppigst optrædende ord en til to pladser til venstre for rimelig vises i oversigten i figur 3.3 sorteret efter faldende hyppighed. Hyppigheds-scoren angiver ikke den absolutte hyppighed i korpus, men er et relativt tal ligesom i matchlisten. Stiller du typevælgeren på»right«, vises tilsvarende de hyppigste ord en til to pladser til højre for matchet, jf. figur 3.3.

32 KAPITEL 3. BRUGERINTERFACETS FUNKTIONER 32 Figur 3.4: Reduceret konkordans på.*undersøgelse Eksportere lister CoREST kan eksportere alle lister som tekstfiler. Hertil klikker klikker du på eksportknappen til højre over listen, jf. figur 3.2 på side 30, og vælger et filnavn og en placering i den dialogboks, der popper op. En eksporteret liste består af to kolonner, den ene med selve ordet, den anden med den talværdi, der knytter sig til ordet. De to kolonner er adskilt med et tabulatortegn. Eksporterede lister kan nemt importeres i andre programmer, fx tekstbehandlere eller regneark. 3.3 Alt om konkordanser Konkordanser (jf. området konkordans i figur 2.4 på side 13) viser fundne ord eller udtryk sammen med noget kontekst. I det følgende gennemgås de forskellige funktionaliteter, som knytter sig til konkordanser. Vær opmærksom på, at der er visse forskelle på konkordanser i og sammensatte og ikke-sammensatte korpusser. I det følgende beskrives konkordanser i ikke-sammensatte korpusser, mens afsnit på side 37 gør rede for konkordanser i sammensatte korpusser. Som illustration tjener resultatet af en søgning på.*undersøgelse. Co- REST s konkordansområde med den øverste del af denne konkordans vises i figur 3.4. Visning af konkordanser I beskrives, hvordan en konkordans ser ud i Co- REST. Reduktion af konkordanser I forklares, hvad det vil sige, at en konkordans er blevet reduceret, jf. antal forekomster og reduktion i figur 3.4. Blade i konkordanser I vises, hvordan du blader gennem en konkordans, jf. vælge konkordansside i figur 3.4.

33 KAPITEL 3. BRUGERINTERFACETS FUNKTIONER 33 Sortere konkordanser I beskrives sorteringsmulighederne, jf. sortering i figur 3.4. Redigere konkordanser I beskrives korte annoteringer og sletning af konkordanslinjer. Eksportere konkordanser I vises, hvordan du eksporterer en konkordans, så du kan bruge den uden for CoREST, jf. eksport i figur Visning af konkordanser Konkordanser vises i konkordansområdet; det er den centrale del af CoRESTvinduet til højre for området med ordlister. En konkordans viser autentiske tekstforekomster af de fund, der matcher søgeudtrykket. Hver forekomst vises centreret på en linje med nogle ords kontekst omkring. Konkordansen er som udgangspunkt lige som matchlisten sorteret alfabetisk på matchet. I konkordanser vises eksemplerne altid i en ortografi, som er så tæt på den oprindelige, som muligt i modsætning til ordlisterne, som vises i en forenklet ortografi, jf. afsnit 3.2. Tvungne linjeskift fra den oprindelige tekst vises som tegnet i konkordanserne Reduktion af konkordanser I en konkordans kan der maksimalt vises 2000 fund fordelt på 20 sider med 100 fund per side. Hvis der er flere match i korpus, reduceres antallet af viste fund automatisk til Antallet af fund og en eventuel reduktion oplyses i bjælken over konkordansen, jf. antal forekomster og reduktion i figur 3.4. En reduktion laves jævnt fordelt over hele korpus. Her er det med andre ord altså ikke kun de 2000 første fund, du får vist, men et udpluk taget fra hele korpus. Hvis du vil se samtlige match, som dit søgeudtryk har i korpus, må du indsnævre søgningen. I figur 3.4 viser de første to linjer eksempler på brugen af formen advokatundersøgelse. Hvis du vil se flere eller samtlige forekomster af denne form i korpus, kan du fx søge på udtrykkene advokatundersøgelse og du vil da få vist 38 hhv. 51 fund, altså samtlige forekomster i korpus, da der nu er under 2000 i alt Blade i konkordanser Du kan blade frem og tilbage fra side til side i konkordansen ved at klikke på pileknapperne øverst til venstre over konkordansen, eller du kan springe direkte til en bestemt side ved at vælge den i rullemenuen umiddelbart til højre for pileknapperne, jf. vælge konkordansside i figur 3.4. I rullemenuen oplyses den aktuelt viste side. Hvis konkordansområdet er aktivt (blå ramme omkring konkordansen), kan du også blade frem og tilbage ved at bruge pil-venstre og pil-højre på dit tastatur.

34 KAPITEL 3. BRUGERINTERFACETS FUNKTIONER Sortere konkordanser En konkordans kan sorteres på forskellige måder. Du kan vælge sorteringen i sorteringsrullemenuen sortering, jf. figur 3.4. Som udgangspunkt er konkordansen sorteret alfabetisk på match (»Match sorted«), altså på samme måde som matchlisten. Andre muligheder er»corpus order«,»left sorted«og»right sorted«. Match sorted Alfabetisk sortering på matchet. Dette er standardsorteringen. Corpus order Med denne sortering vises eksemplerne i den rækkefølge, som de har i korpusset. Rækkefølgen afspejler dermed opbygningen af korpus. For alle CoREST-korpusser er rækkefølgen kronologisk, således at de nyeste eksempler står øverst, og eksemplerne bliver ældre, jo længere du ruller ned gennem konkordansen. Left sorted Sortering på venstre kontekst. Sorteringen sker fra højre mod venstre, altså baglæns, således at ord, der ender på a, kommer før ord, der ender på b, osv. Right sorted Sortering på højre kontekst. Sorteringen sker fra venstre mod højre, således at ord, der begynder med a, kommer før ord, der begynder med b, osv Annotere konkordanser Du kan give matchene i konkordansen egne markeringer. På denne måde kan du fx holde forskellige betydninger af et match ud fra hinanden eller de forskellige sproglige konstruktioner, som matchet indgår i, markere gode eksempler eller sproglige fejl af forskellig art. I det følgende kalder vi disse markeringer mærker Markere match i konkordansen Du markerer et match i konkordansen ved at give det et mærke. Mærker kan være et bogstav (A-Z) eller ciffer (0-9), og de vises ud for konkordanslinjerne i kolonnen til højre for konkordansen. Hvilke bogstaver eller cifre, du vil bruge til at markere bestemte egenskaber ved konkordanslinjen med, er op til dig. Fx kan du give gode eksempler et A som mærke og give forskellige betydninger af et ord cifrene 0 9. Der kan dog kun sættes ét mærke på hvert match. Sætter du et mærke på et match, der har et i forvejen, bliver det oprindelige erstattet af det nye.

35 KAPITEL 3. BRUGERINTERFACETS FUNKTIONER 35 Figur 3.5: Konkordansudsnit med mærker Sætte mærker Klik på konkordansområdet for at give det fokus eller bruge tabulatortasten (evt. gentagne gange). Konkordansområdet har fokus, når der er en blå ramme omkring, jf. afsnit 2.3. Rul med piletasterne til den linje i konkordansen, som du vil forsyne med et mærke eller klik på den. Tast dernæst et bogstav eller et ciffer. Matchet i konkordanslinjen er nu mærket. Slette konkordanslinjer Et særligt mærke er bindestregen (minus), som sletter eller snarere undertrykker konkordanslinjen. En undertrykt konkordanslinje vises nedtonet. Funktionen er især nyttig ved eksport af konkordanslinjer: Linjer, der er mærket med bindestreg, kommer nemlig ikke med i eksporten. Se mere om eksport af konkordanser i Fjerne mærker Du kan fjerne et mærke igen ved at markere pågældende linje og taste mellemrum. På denne måde kan du også genoplive undertrykte linjer. Figur 3.5 viser et lille udsnit af en konkordans på blad, hvor match i betydningen tidsskrift er markeret med 1, mens 2 markerer match i betydningen plantedel. Læg mærke til, at tre linjer er blevet undertrykt. Hvis dit match omfatter flere ord, knyttes mærket altid til hele matchet. For eksempel finder blandt andet matchet reducere bygningens energiforbrug i KORPUS-DK. Hvis du nu sætter et mærke, for eksempel E ud for pågældende konkordanslinje, vedrører det kun dette match. I en efterfølgende søgning på $bygningens energiforbrug vil du se, at der ikke længere er et mærke ud for pågældende konkordanslinje, fordi reducere nu ikke længere er en del af matchet. Det samme gælder for eksempel for en efterfølgende søgning på reducere bygningens. Først når reducere bygningens energiforbrug matcher i sin helhed, vises mærket igen, uanset hvilket søgeudtryk der ellers medfører dette match. OBS! Markeringer gemmes på din lokale computer. Derfor bør du altid arbejde med samme computer, når du bruger markeringer.

36 KAPITEL 3. BRUGERINTERFACETS FUNKTIONER 36 Figur 3.6: Liste over mærker Vise konkordanslinjer med markerede match Samtlige mærker, som du bruger i dine konkordanser, samles i en liste, som du kan se ved at vælge listefanebladet»tags«. Inden vi ser nærmere på denne liste, vil vi opstille endnu en konkordans, dennegang på Lidt længere nede i konkordansen findes matchet øge effektiviteten i vores energiforbrug markér linjen og mærk den med E, altså med samme mærke som i matchet reducere bygningens energiforbrug fra forrige afsnit. Nu vælger du»tags«i listefanebladet. Du ser nu en liste som vist i figur figur 3.6. På listen ser du som udgangspunkt mærkerne for hele korpus. Hvis der er tale om et sammensat korpus (se ), vises dog kun mærkerne for det valgte delkorpus, ikke det samlede korpus. I figuren er der kun de mærker, vi hidtil har brugt i eksemplerne her i manualen. Taster du retur, når tag-listen har fokus (blå ramme), vises konkordanslinjerne med det pågældende mærke i konkordansområdet. På denne måde er det muligt at se beslægtede (det vil sige identisk mærkede) konkordanslinjer samlet, selv hvis de oprindelig stammer fra forskellige konkordanser En konkordans med markeringer identificeres på søgeudtrykket. Forskellige søgeudtryk medfører markeringsmæssigt forskellige konkordanser, selvom matchene er (næsten) ens. For eksempel er der markeringsteknisk forskel på en konkordans på bevægelse og en på bevægels. (alle ord, som begynder med bevægels fulgt af ét vilkårligt bogstav 1 ), selvom de i KORPUS-DK giver nøjagtigt samme resultat. Markeringer, som gælder den ene af disse to søgninger, vil ikke optræde i listen til den anden søgning, selvom den resulterende konkordans i begge tilfælde er den samme. Ud over markeringer for hele korpus kan annoteringslisten også nøjes med at vise markeringer, som kun gælder den aktuelle konkordans. Du ændrer visningen OBS! OBS! 1 Punktummet er et jokertegn. Du kan læse mere om jokertegn i afsnit 4.1

37 KAPITEL 3. BRUGERINTERFACETS FUNKTIONER 37 Figur 3.7: Eksporteret konkordansudsnit i regneark fra hele korpus til aktuel konkordans ved at vælge»kwic«i stedet for»corpus«i vælgeren til venstre over listen, jf. figur 3.6. Særligt om markerede match i sammensatte korpusser Hvert delkorpus i et sammensat korpus (se ) udgør under mærkningen et selvstændigt korpus. Visningen»KWIC«, som viser samtlige annoteringer for et korpus, viser i dette tilfælde altså ikke mærkerne for det samlede sammensatte korpus, men kun for det aktuelt valgte delkorpus Eksportere konkordanser Du kan eksportere en konkordans i form af en tekstfil ved at klikke på eksportknappen eksport yderst til højre i bjælken over konkordansen, jf. figur 3.4 på side 32. Tekstfilen er struktureret sådan, at hver linje svarer til en konkordanslinje, hvor matchet altid er omgivet af tabulatortegn. Linjen afsluttes med et tabulatortegn evt. efterfulgt af et mærke, jf Vær opmærksom på, at konkordanslinjer, som er markeret med en bindestreg (undertrykte konkordanslinjer) ikke kommer med i eksporten. De er med andre ord endegyldigt slettet fra den eksporterede konkordans. En linje i en eksporteret konkordans er struktureret på følgende måde: [V E N S T R E K O N T E K S T] <T A B> [M A T C H] <T A B> [H Ø J R E K O N T E K S T] <T A B> [E V T. M Æ R K E] Eksporterede konkordansfiler kan nemt importeres i tekstbehandlingssystemer, regneark, eller de kan behandles videre på anden vis. Figur 3.7 viser det mærkede konkordansafsnit fra figur 3.5 importeret i et regneark Konkordanser i sammensatte korpusser Konkordanser i sammensatte korpusser (se ) vises på en lidt anden måde end i simple korpusser. Her vises én særskilt konkordans for hvert delkorpus. Som udgangspunkt vises altid konkordansen for det delkorpus, som i forhold til dets størrelse har flest forekomster af matchet. Du skifter til et andet delkorpus ved at vælge det i delkorpusvælgeren til venstre i værkstøjsbjælken over konkordansen. Hvis der mangler delkorpusser i vælgeren, skyldes det, at der ikke er forekomster af det søgte i pågældende delkorpus. Prøv at vælge korpusset -TiDK 2017 korpusvælgeren øverst til venstre i CoREST-vinduet og udfør herefter en søgning på Der vil som resultat blive vist en konkordans fra delkorpusset T-2009, se figur 3.8. Dette OBS!

38 KAPITEL 3. BRUGERINTERFACETS FUNKTIONER 38 Figur 3.8: Konkordansudsnit fra delkorpus i et sammensat korpus delkorpus indeholder udelukkende tekster fra Konkordansen bliver lavet på dette delkorpus, fordi der her er relativt flest forekomster af det søgte. Tallet 17 i delkorpusvælgeren fortæller, hvor tit ordet optræder per 10 millioner ords tekst i det pågældende år; dette er ordets frekvens. Dette svarer til 69 faktiske forekomster i dette delkorpus, da det er på ca. 39,5 millioner ord. Antallet af faktiske forekomster vises lidt længere mod højre i bjælken over konkordansen i oplysningen»69 matches of 561«der er 561 forekomster i det samlede -TiDK 2017 fordelt over samtlige delkorpusser. Du kan klikke på delkorpusvælgeren og her få et hurtigt overblik over, hvordan udbredelsen af lemmaet skattesag har været igennem de seneste ti år, og du kan vælge et andet år og se eksempler herfra. I stedet for som udgangspunkt at få vist eksempler fra det delkorpus, hvor der er relativt flest forekomster af et match, altså hvor frekvensen er højest, kan du også få vist eksempler fra det delkorpus, hvor antallet af faktiske forekomster er højst. Til dette skal du sætte hakke i tjekboksen»totals«. I eksemplet her vil du da få vist eksemplerne fra T-2012 som det første. 3.4 Alt om grafiske oversigter Når du søger i sammensatte korpusser, kan du få vist fordelingen af match på de forskellige delkorpusser i grafisk. Grafiske oversigter kan vises for alle typer søgninger, også sammen med jokertegn (jf. kapitel 4 på side 50) eller avancerede søgeudtryk (jf. kapitel 5 på side 54). Du kan også benytte filtre, når du laver søgninger (jf. afsnit 5.5 på side 73). Både -TiDK 2016 og -KORPUS-DK (med streg foran, jf ) er sammensatte korpusser. -TiDK er et såkaldt monitorkorpus, der til enhver tid afspejler sproget gennem de sidste ti år. Version 2016 af dette korpus indeholder således materiale fra årene KORPUS-DK er sammensat af tre korpusser, nemlig KORPUS-90 med tekster fra omkring 1990, KORPUS-2000 med tekster fra omkring år 2000 og endelig KORPUS-2010 med tekster fra omkring Lad os se på et eksempel i det sammensatte -KORPUS-DK, som du vælger ved hjælp af korpusvælgeren, jf. figur 2.4 på side 13. Prøv at udføre en søgning CoREST viser som resultat en konkordans fra KORPUS-2000,

39 KAPITEL 3. BRUGERINTERFACETS FUNKTIONER 39 Figur 3.9: Liste over fordelingen på tre delkorpusser hvor der i forhold til dette delkorpus størrelse er flest forekomster af lemmaet, nemlig 506 per 10 millioner ord svarende til 1530 faktiske forekomster. Klikker du på delkorpusvælgeren, vil du se tallene for de øvrige to korpusser også, jf. figur 3.9. Et bedre overblik får du ved at klikke på fanebladet»charts«, som viser fordelingen grafisk i form af et lagkagediagram, jf. figur 3.10, hvor man hurtigt ser, at mobiltelefoner åbenbart var mest udbredte i tekster fra omkring år 2000 med hele 59% af samtlige forekomster. 2 Farverne i lagkagediagrammet vælges automatisk og kan ændre sig fra søgning til søgning. Farverne kan ikke fastlægges af brugeren. Fanebladet»Charts«kan i øvrigt kun vælges, hvis du arbejder med et sammensat korpus, ellers er det grånet ud og ude af funktion. Mens du i det sammensatte -KORPUS-DK altid får vist lagkagediagrammer, der viser fordelingen af antallet af forekomster på de tre delkorpusser, består det sammensatte korpus -TiDK af ti delkorpusser, nemlig ét for hvert af de seneste ti år. Prøv at vælge -TiDK i korpusvælgeren og udfør dernæst en søgning på tablet. Klik herefter på fanebladet»charts«. Du får nu vist en graf, som for hvert delkorpus, dvs. for hvert af de seneste ti år (x-aksen) viser antal forekomster per 10 millioner løbende ord (y-aksen). Du vil se, at der er en markant stigning i antallet af forekomster i årene fra 2010 til Mens tablet forekom 8 gange per 10 millioner ords løbende tekst i 2010, lå tallet på 83 for 2013, altså en tidobling! Prøv herefter at udføre følgende søgninger: hashtag, selfie, smartphone. Du vil se, at de nye grafer tilføjes til de allerede eksisterende og at koordinatsystemet skaleres løbende, så alle grafer kan vises. Efter søgningen på disse ord ser grafen cirka ud som i figur Kurvernes farver fastlægges automatisk af CoREST og kan ikke ændres af brugeren. Du kan slette kurverne fra oversigten ved at klikke på sletteknappen øverst til højre i koordinatsystemet. Under»Charts«kan du vælge mellem to slags grafiske visninger, som du hver især får frem ved at klikke på et af fanebladene»distribution«eller»variation«til højre for grafen:»distribution«viser hyppigheden af matchet i hvert delkorpus som en kurve. Da der er ét delkorpus per år, og da de er ordnet kronologisk, viser kurven udviklingen i hyppigheden af pågældende match gennem årene. Hyppigheden 2 Det samlede procenttal for lagkagediagrammet kan sommetider afvige fra 100 på grund af afrunding til heltal.

40 KAPITEL 3. BRUGERINTERFACETS FUNKTIONER 40 Figur 3.10: Diagram over fordelingen på tre delkorpusser vises som antal forekomster per 10 millioner ord i pågældende korpus. Kurven er glattet lidt ud for at kompensere for udsving, der skyldes et for spinkelt korpusgrundlag.»variation«viser for hvert delkorpus afvigelsen til den gennemsnitlige hyppighed for hele korpus. Afvigelsen vil typisk svinge omkring nul. Værdien nul repræsenterer gennemsnittet for alle delkorpusser, hvori fundet optræder. Ligger værdien over nul for en årgang, er hyppigheden af matchet over gennemsnittet, ligger den under nul, er hyppigheden under gennemsnittet. Er der slet ingen forekomster i pågældende delkorpus, sættes værdien ligeledes til nul. Værdien nul betyder altså enten slet ingen forekomster i pågældende korpus eller præcist gennemsnitlig mange. De interessante værdier er dem, der er over eller under nul. For at få et indtryk af, hvad variationsdiagrammer kan vise, kan du først betragte frekvensdiagrammet i figur Her er der på ét og samme diagram vist frekvensudviklingen over tid for lemmaerne tsunami og folketingsvalg, der begge i forhold til ordet og, hvis hyppighed over tid også er afbildet i diagrammet, er sjældne i sproget: Mens og år for år forekommer knap gange per 10 millioner ord,

41 KAPITEL 3. BRUGERINTERFACETS FUNKTIONER 41 Figur 3.11: Frekvensdiagram for en række ord ligger både tsunami og folketingsvalg temmelig tæt på nul, så man hverken kan se udsving fra år til år eller skelne de to grafer fra hinanden. Eksemplet viser, at det kan være problematisk at kombinere grafer for høj- og lavfrekvente ord i ét diagram. Hvis man undlod at vise udbredelsen af det højfrekvente og sammen med de lavfrekvente tsunami og folketingsvalg i ét og samme diagram, ville de to sidstnævnte vise betydeligt mere markante udsving. Hvis du nu betragter de samme tre ord, altså det højfrekvente og sammen med de lavfrekvente tsunami og folketingsvalg, i et variationsdiagram, jf. figur 3.13, vil du se, at og år for år har en fuldstændig gennemsnitlig hyppighed, hvilket ikke overrasker, da der normalt ikke forekommer udsving i hyppigheden af sprogets mest højfrekvente ord. Variationsdiagrammet viser samtidig, at udbredelsen af ordet tsunami ligger markant over gennemsnittet i 2011 (Fukushima-uheldet i Japan), mens folketingsvalg er markant overgennemsnitlig repræsenteret i de år, hvor der afholdtes folketingsvalg, nemlig i 2007, 2011 og Variationsdiagrammer giver især mening, hvis du vil sammenligne hyppighedsudsving for flere ord eller vendinger. Hvis du kun ser på et enkelt ord, skal du være særligt opmærksom på skaleringen af y-aksen. Figur 3.14 viser variationen af og alene. Ser man kun på grafens form, kan man forledes til at tro, at der er store udsving i hyppigheden af dette ord år for år. Aflæser man værdierne på y-aksen, viser det sig dog, at udsvingene er forstørret ganske gevaldigt op og i virkeligheden ganske ubetydelige. OBS!

42 KAPITEL 3. BRUGERINTERFACETS FUNKTIONER 42 Figur 3.12: Frekvensdiagram af sjældne og hyppige ord over tid 3.5 Visning af tekstoplysninger Tekstoplysninger vises i det første af de fire felter under konkordansen (jf. området tekstoplysninger i figur 2.4 på side 13). Her vises altid oplysninger om den tekst, som den aktuelt markerede konkordanslinje stammer fra. Figur 3.15 viser de oplysninger, som vedrører den markerede (første) konkordanslinje i konkordansen figur 2.4 på side 13. Tabel 3.2 forklarer de forskellige oplysningstyper nærmere. I afsnit 5.5 beskrives, hvordan du kan bruge disse oplysninger i dine søgninger. 3.6 Kontekstvisning Konkordanslinjer er altid opbygget sådan, at selve matchet vises centreret med nogle ords kontekst omkring. I langt de fleste tilfælde er denne snævre kontekst nok til, at du kan få en idé om, hvordan ordet bliver brugt i teksten. I enkelte tilfælde kan det dog være nødvendigt at kunne se noget mere kontekst, end der umiddelbart kan vises i en konkordanslinje.

43 KAPITEL 3. BRUGERINTERFACETS FUNKTIONER 43 Figur 3.13: Variationsdiagram med frekvensafvigelser fra gennemsnittet 0 Oplysning Date Group Source Title Author Beskrivelse Udgivelsesdatoen for teksten Tekstgruppe, som denne tekst tilhører. Teksterne i et korpus tilhører normalt en gruppe af beslægtede tekster Kilden, som teksten stammer fra, fx navnet på en hjemmeside eller en avis Tekstens titel Tekstens forfatter Tabel 3.2: Oversigt over centrale tekstoplysninger

44 KAPITEL 3. BRUGERINTERFACETS FUNKTIONER 44 Figur 3.14: Tilsyneladende store udsving i hyppigheden af og Figur 3.15: Tekstoplysninger

45 KAPITEL 3. BRUGERINTERFACETS FUNKTIONER 45 Figur 3.16: Kopiering fra kontekstfeltet Mere kontekst Noget mere kontekst, end hvad der kan vises i selve konkordanslinjen, får du i området med konkordanslinjeoplysningerne under konkordansen, i det andet felt fra venstre (jf. området kontekst i afsnit 2.4 på side 13). Selve matchet i dette felt er markeret med en særlig farve og står som regel mere eller mindre i midten af feltet. Fra dette felt kan du kopiere en tekstpassage på samme måde, som du kan i de fleste andre programmer i dit system, fx ved at markere det område, du vil have med, højreklikke med musen og vælge»copy«i den lokale menu, der popper op. Du kan herefter indsætte den kopierede passage i andre programmer, fx i en tekstbehandling eller et ordbogsredigeringssystem. Figur 3.16 viser det med en passage omkring matchet actionfilm (i dette tilfælde efter en søgning i KORPUS-DK). 3.7 Visning af ordoplysninger Til hvert ord i et korpus er der knyttet en række oplysninger. Du kan se en oversigt over ordoplysningerne i afsnit 5.2. I det tredje oplysningsfelt under konkordansen (jf. området ordoplysninger i figur 2.4 på side 13) vises ordet med den ortografi, det havde i den originale korpustekst, sammen med ordklasse- og bøjningsoplysninger. Figur 3.17 viser et eksempel fra en søgning på $med hensyn til. Ordklasse- og bøjningsoplysningerne gives som en kode, et såkaldt tag med følgende opbygning: OU:nnnn:vv:dddd Her har de enkelte dele følgende betydninger: O betegner ordklassen, fx N for substantiv, V for verbum, A for adjektiv

46 KAPITEL 3. BRUGERINTERFACETS FUNKTIONER 46 Figur 3.17: Ordoplysninger om ordklasse og bøjning U betegner en underklasse til ordklassen, hvis det er relevant (ellers står der blot en bindestreg på denne plads); ved verber fx F for finit, I for infinitiv, M for imperativ På de fire pladser betegnet n står der oplysninger, der vedrører den nominale bøjning af ordet De to v-pladser giver oplysninger om den verbale bøjning De fire afsluttende d-pladser bruges til forskellige oplysninger, fx om adjektivers gradbøjning eller pronomeners person. En detaljeret gennemgang af ordklassetaggets opbygning finder du i afsnit 5.3. Her beskrives også, hvordan du kan bruge disse oplysninger i dine søgninger. Når du klikker på»+«-knappen i panelet over ordoplysningsfeltet får du vist udvidede ordoplysninger. Figur 3.18 viser samtlige oplysninger, der knytter sig til hvert ord i KORPUS-DK. I det følgende vil oplysningstyperne blive gennemgået kolonne for kolonne. 1. kolonne: Ordet i forenklet ortografi (jf. afsnit 3.2); det er denne form, som der som udgangspunkt søges på i CoREST. 2. kolonne: Ordet i den ortografi, det havde i den oprindelige korpustekst. 3. kolonne: Tegn, der adskiller ordet fra det følgende ord, til højre for i teksten; som regel er der blot tale om et mellemrum, som gengives som en understregningsstreg i visningen, men ofte vil der også være sætningstegn, således

47 KAPITEL 3. BRUGERINTERFACETS FUNKTIONER 47 Figur 3.18: Ordoplysninger i CoREST-korpusser følger der._ (punktum og mellemrum) efter ordet indtjening i eksemplet i figur??. 4. kolonne: Ordet i dets grundform (lemma), dvs. den form man vil slå det op under i en ordbog. 5. kolonne: Ordets ordklasse; der bruges forkortelser bestående af ét stort bogstav; en komplet liste over anvendte forkortelser og deres betydninger findes i afsnit kolonne: Udvidede ordklasse- og bøjningsoplysninger; læs mere afsnit 5.3. Du kan eksportere de udvidede ordklasseoplysninger i form af et html-dokument ved at klikke på eksportknappen yderst til højre i panelet. I kan du læse om, hvordan et ord grundlæggende er defineret i CoREST, og hvordan du kan bruge ordoplysningerne i dine søgninger. 3.8 Indstillinger og systeminformationer I CoREST kan du skifte til et særligt vindue, hvor du dels kan se en logfil over de søgninger, du har lavet, dels sætte en række indstillinger. Du skifter til dette vindue ved at klikke på tandhjulsymbolet øverst til højre i CoREST-standardvinduet, jf. figur 2.4 på side 13. Du kan lukke vinduet med indstillingerne ved at klikke på

48 KAPITEL 3. BRUGERINTERFACETS FUNKTIONER 48 Figur 3.19: Indstillinger og søgehistorik hakket i øverste højre hjørne, hvorefter du vender tilbage til CoREST s hovedvindue. OBS! Logfilen over dine søgninger gemmes ikke, når du lukker CoREST. Hvis du vil gemme filen, kan du kopiere alt indholdet over i en editor eller et tekstbehandlingsprogram og gemme den herfra Slette indstillinger Du kan slette dine indstillinger. Efter genstart vil CoREST bruge de grundindstillinger, programmet havde allerførste gang, det blev startet. Sletning af indstillinger medfører genstart af CoREST. OBS! Tømme søgecache Du kan tømme søgecachen (se afsnit 2.1.5) på din maskine ved at klikke på knappen»clear Cache«, jf. figur Normalt skulle det ikke være nødvendigt at tømme cachen, men har du mistanke om, at noget opfører sig unormalt, fx at søgninger ikke medfører sandsynlige resultater, kan det være en løsning at tømme cachen Tømme søgelisten med egne søgninger Søgelisten med dine egne tidligere søgninger sletter du, idet du klikker på knappen»clear History«. Du kan læse mere om denne liste i

49 KAPITEL 3. BRUGERINTERFACETS FUNKTIONER Udseende CoREST kan køres med forskellige udseender. Ud over en lidt gammeldags»classic«-visning, som i øvrigt overvejende bruges til skærmbilleder vist her i manualen, kan du vælge mellem og 2017-designet af CoREST. Ændring af udseende kræver genstart af CoREST. NYT Skriftstørrelse Du kan indstille skriftstørrelse ved at bevæge skyderen»font Size«til venstre (mindre skrift) eller til højre (større skrift) med musen. Skriftstørrelsen ændres umiddelbart. Vil du vende tilbage til systemets standardskriftstørrelse, klikker du på knappen»default«til højre for skyderen, jf. figur Visning af rullebjælker De fleste rullebjælker i siden (og bunden) af visninger kan skjules. Denne mulighed kan især være interessant, hvis du styrer din computer med et pegefelt e.l. i stedet for en mus. NYT Sessionsprotokol Sessionsprotokollen ses i området til højre for indstillingerne. Her registreres CoREST-klientens kommunikation med serveren: Der gives oplysninger fx om software- og korpusversioner, samt de søgeudtryk, som CoREST har sendt til serveren. Her er simple søgeudtryk altid oversat til det tilsvarende avancerede udtryk, jf. kapitel 5. Du kan kopiere udtryk fra protokollen og indsætte dem i søgefeltet for at udføre en bestemt søgning igen, nemmere er det dog at bruge listen»my Searches«til højre for konkordansområdet, se

50 Kapitel 4 Søgning med jokertegn En gryderet med punktummer og stjerner 4.1 Regulære udtryk Et regulært udtryks komponenter Almindelige tegn Jokertegnet punktum Gentagelsesoperatorer Symboler med særlig betydning Eksempler på brug af jokertegn Regulære udtryk I CoREST kan du udføre søgninger med jokertegn, altså tegn, der betyder noget andet, end hvad deres pålydende er. Ved at bruge jokertegn laver du søgeudtryk, der har en vis variabilitet med hensyn til, hvad de matcher i korpus. Man kalder denne type variable søgeudtryk for regulære udtryk. I afsnit 2.4 brugte vi allerede.* (punktum stjerne) i betydningen nul, ét eller flere bogstaver må matche på dette sted. Således matchede.*telefon alle de ord i korpus, som ender på telefon inklusive selve ordet telefon. Både.* og.*telefon er regulære udtryk. Efter en formel definition af, hvad et regulært udtryk er, skal vi i dette kapitel se på, hvad de præcist kan bruges til, når du søger i et korpus. Definition af regulært udtryk: Et regulært udtryk (i det følgende blot udtryk) består af ét eller flere tegn eller grupper, evt. kombineret med operatorer. OBS! OBS! almindeligt tegn et tegn er ét bogstav eller ét ciffer m.m. (fx a, b, Å, q eller 9) jokertegn et særligt tegn (punktum), som kan stå for et vilkårligt almindeligt tegn 50

51 KAPITEL 4. SØGNING MED JOKERTEGN 51 Udtryk a.ryl...sætte c...ing Match i KORPUS-DK (forenklet ortografi) acryl, akryl, arryl frisætte, hensætte, indsætte, knæsætte, modsætte, målsætte, nedsætte, nulsætte, tilsætte, undsætte,... coaching, crossing, catering, changing, cityring, charming, clearing, clubbing, crawling,... Tabel 4.1: Eksempler på brug af jokertegnet punktum operator en operator beskriver en særlig funktion, som gælder for et tegn eller en gruppe gruppe en gruppe samler et udtryk til en enhed, der funktionelt betragtes, som var den ét tegn 4.2 Et regulært udtryks komponenter Gennemgangen af de enkelte komponenter i regulære udtryk kan måske forekomme en anelse vanskelig, men meningen burde senest blive klar, når vi når til eksemplerne i afsnit 4.3. OBS! Almindelige tegn Almindelige tegn er bogstaver, cifre og en række interpunktionstegn, som tages bogstaveligt i en søgning, som betyder det, deres pålydende er. Således finder søgeudtrykket akryl alle eksempler på akryl i korpus og intet andet, fordi tegnene a, k, r, y og l tages fuldstændig bogstaveligt under søgningen. NYT Jokertegnet punktum Der findes ét jokertegn, nemlig punktum. Et punktum i søgeudtrykket betyder, at der på punktummets plads skal stå præcist ét vilkårligt almindeligt tegn. Tabel 4.1 viser en række eksempler med tilhørende match i KORPUS-DK. OBS! Gentagelsesoperatorer Tabel 4.2 lister operatorer, der bruges til at angive, hvor tit det forudgående tegn eller den forudgående gruppe skal eller kan gentages. En gruppe oprettes ved at samle tilhørende tegn og operatorer mellem runde parenteser, jf. oversigten med eksempler i afsnit 4.3. OBS!

52 KAPITEL 4. SØGNING MED JOKERTEGN 52 Symbol Betydning? nul eller én forekomst af forudgående tegn eller gruppe * nul, én eller flere forekomster af forudgående tegn eller gruppe + én eller flere forekomster af forudgående tegn eller gruppe {n} {n,m} {n,} præcist n forekomster af forudgående tegn eller gruppe mellem n og m forekomster af forudgående tegn eller gruppe mindst n forekomster af forudgående tegn eller gruppe Tabel 4.2: Gentagelsessymboler Symboler med særlig betydning Tabel 4.3 lister symboler med en særlig betydning i regulære udtryk. Symbol (u) Betydning runde parenteser samler et udtryk u til en gruppe pågældende sted i udtrykket [t 1 t 2 t 3... t n ] kantede parenteser definerer en mængde af tegn t 1 t 2 t 3... t n, hvoraf ét skal matche pågældende sted i udtrykket [^t 1 t 2 t 3... t n ] kantede parenteser med cirkumfleks-tegnet (^) umiddelbart efter åbningsparentesen definerer en mængde af tegn t 1 t 2 t 3... t n, hvoraf intet må matche pågældende sted i udtrykket u 1 u 2 lodret streg mellem to udtryk (tegn, grupper) u 1 og u 2 betyder»u 1 eller u 2 skal matche pågældende sted i udtrykket«t 1 -t 2 bindestreg mellem to tegn t 1 og t 2 betyder»alle tegn i det alfabetiske interval fra tegn t 1 til t 2 «\ den omvendte skråstreg betyder, at det efterfølgende tegn, som normalt har en særlig betydning i regulære udtryk (fx punktum, bindestreg, parentes), skal opfattes bogstaveligt i udtrykket Tabel 4.3: Symboler med særlig betydning

53 KAPITEL 4. SØGNING MED JOKERTEGN Eksempler på brug af jokertegn Prøv at udføre følgende søgninger i KORPUS-DK. Vær opmærksom på, at samme søgeresultat tit kan opnås med forskellige regulære udtryk. 1. cente?ret matcher centeret og centret 2. hi(hi)* matcher hi, hihi, hihihi osv. 3..+undersøgelse matcher ord, der ender på undersøgelse (dog ikke selve ordet undersøgelse), fx forundersøgelse, spørgeskemaundersøgelse, mentalundersøgelse 4..+undersøgelse(n r rne)?s? matcher samme som ovenfor og derudover også alle bøjningsformerne af undersøgelse 5. (hej){2} matcher hejhej 6. (ha){2,4} matcher haha, hahaha og hahahaha 7. å{2,}r?h? matcher ord, som begynder med mindst to å er, evt. efterfulgt af ét r eller ét h eller både r og h: ååh, ååårh, åååå, ååååh, åååårh og ååååårh 8..*[aeiouyæøå]{5,}.* matcher ord, som indeholder en række af mindst 5 vokaler 9. [aeiouyæøå]{4,} matcher ord på mindst 4 bogstaver, der alle skal være vokaler 10. ni[ck]ola[ij] matcher Nicolai, Nikolai, Nicolaj, Nikolaj 11. mor(far mor) matcher morfar, mormor 12. (far mor){2} matcher farfar, farmor, morfar, mormor 13. [0-9]{5} matcher 5-cifrede tal 14..*[bcdf-hj-np-tv-xz]{7,}.* matcher ord med mindst 7 konsonanter efter hinanden 15. \*[^\*].*\* matcher ord, som begynder med og slutter på en stjerne, men som ellers ikke indeholder stjerner, fx *wish*, *suk*, *host*, *lol*, *fniz*

54 Kapitel 5 Avancerede søgeudtryk Det muntre køkken 5.1 Simpelt eller avanceret? Ordoplysninger Brug af ordoplysninger i søgeudtryk Ordklasse og bøjning Definition af ord Ordoplysningen pos Ordoplysningen epos Søgning på grupper af ord Ordbeskrivelser i kantede parenteser Flere ordbeskrivelser efter hinanden Jokertegn på ord Søge inden for sætningsgrænser Søgning på adskilte ord Søgning på tekstoplysninger Simpelt eller avanceret? Hidtil blev alle søgninger udført med simple søgeudtryk selvom regulære udtryk, som vi behandlede i kapitel 4, kan virke alt andet end ligefrem simple. Simple søgeudtryk er tilstrækkelige i mange situationer, dog kan det være nødvendigt at udføre søgninger, hvor du endnu mere specifikt angiver, hvad det er, du ønsker at finde. Her kommer avancerede søgeudtryk ind i billedet. 5.2 Ordoplysninger Et korpus kan man forestille sig som en lang (lodret) liste af (ortografisk forenklede) ord, som der kan søges på. Men der er mere i denne liste end blot ord, for 54

55 KAPITEL 5. AVANCEREDE SØGEUDTRYK 55 til hvert af disse ord knytter der sig yderligere oplysninger, fx om ordets originale ortografiske form i teksten, dets grundform og dets ordklasse. Vi kalder disse oplysninger for ordoplysninger eller ord-attributter. Avancerede søgeudtryk gør det muligt at inddrage ordoplysninger i søgningen. Ud over det ortografisk forenklede ord indeholder alle CoREST-korpusser oplysninger om ordenes originale stavning og de mellemrum og sætningstegn, der danner grænsen mod det følgende ord. I søgeudtrykkene kaldes disse tre oplysninger word, ortho og bound: word Ordet i en lettere forenklet ortografisk form ortho Ordet i præcis ortografisk gengivelse bound De teksttegn, der tilsammen udgør grænsen til det følgende ord Herudover kan der findes ordoplysninger, som er specielle for et korpus. I Co- REST 2016 findes der således i alle korpusser yderligere følgende tre specielle oplysninger, som kaldes kaldes hhv. lemma, pos og epos i søgeudtryk: lemma Ordets grundform, dvs. den form, det kan slås op under i ordbog pos Ordets ordklasse epos En udvidet ordklasse- og bøjningsoplysning Tabel 5.1 viser den CoREST-interne repræsentation af et»korpus«, som i dette eksempel kun består af sætningen Jakob byder endnu engang en masse lækre singler til fest. I alle søgeeksemplerne hidtil har vi kun søgt på de oplysninger, der står i wordkolonnen. I det følgende kommer der en række eksempler på, hvordan du kan inddrage de øvrige ordoplysninger i dine søgninger Brug af ordoplysninger i søgeudtryk Avancerede søgeudtryk har følgende grundstruktur: ordoplysning = "form". I CoREST-korpusser er ordoplysning en af typerne word, ortho, bound, lemma, pos eller epos; ordoplysning skal matche det, der står mellem anførselstegnene, hvor der står form i grundstrukturen ovenfor. Det udtryk, der står på form s plads kan indeholde de sædvanlige jokertegn, jf. kapitel 4. Du kan kombinere forskellige grundstrukturer med hinanden ved hjælp af & (»og«) og (»eller«), jf. eksemplerne nedenfor. En variant af grundstrukturen er ordoplysning!= "form".

56 KAPITEL 5. AVANCEREDE SØGEUDTRYK 56 word ortho bound lemma pos epos jakob Jakob _ Jakob N NP:siu#:--:---- byder byder _ byde V VF:----:sa:---- endnu endnu _ endnu D D-:----:--:u--- engang engang _ engang D D-:----:--:u--- en en _ en P PI:s-uc:--:---- masse masse _ masse N NC:siuc:--:---- lækre lækre _ lækker A AC:p#u#:--:p--- singler singler _ single N NC:piu#:--:---- til til _ til T T-:----:--:---- fest fest.$ fest N NC:siuc:--:---- Tabel 5.1: Ordattributter i CoREST-korpusser Den eneste forskel i forhold til den grundstruktur, vi lige har set, er, at der er sat et udråbstegn foran lighedstegnet. Det betyder, at ordoplysningen ikke må svare til formbeskrivelsen. Pas på! Brug denne type kun i søgeudtryk, hvor du kombinerer flere grundstrukturer med hinanden. Ellers kan du nemt komme galt afsted med denne type, fx betyder [word!="cafe"]»alle ord fra korpus, som ikke er en stavevariant af cafe«, og det er samtlige ord i korpus undtagen stavevarianter af cafe et meningsløst resultat altså, som det tilmed tager en del tid at beregne! OBS! Et avanceret søgeudtryk, hvad enten det kun består af en enkelt grundstruktur eller flere kombineret med hinanden, skal være omgivet af kantede parenteser. Dette gælder søgeudtryk, der vedrører enkeltord. For søgeudtryk, som søger på grupper af ord, er situationen en lidt anden, jf I det følgende kommer en række eksempler på søgeudtryk for de forskellige ordoplysninger word [word="cafe"] matcher de ortografiske former cafe, café, Café osv. Søgeudtrykket svarer til at skrive cafe i den simple notation. I stedet for [word="cafe"] kan du også nøjes med at skrive "cafe" i avancerede søgeudtryk: ordoplysningen word er den oplysning, CoREST altid vil søge på, når du kun anvender anførselstegn og når ingen anden ordoplysning er nævnt.

57 KAPITEL 5. AVANCEREDE SØGEUDTRYK 57 Pas på! [word="café"] matcher ingenting i korpus, idet word altid repræsenterer korpusordene i en forenklet ortografi, hvor store bogstaver er omsat til små og accenttegn er fjernet ortho [ortho="cafe"] matcher kun tilfælde, hvor den originale stavning i korpus præcist svarer til den form, der står mellem anførselstegnene. Således matcher hverken café eller Café. Dette søgeudtryk svarer til!cafe i den simple notation. Ordoplysningen ortho gør det muligt at finde staveformer med accenttegn, således finder [ortho="café"] kun eksempler på café. Dette svarer til at skrive!cafe i den simple notation. [word="cafe" & ortho!="caf[eé]"] finder alle stavevarianter af cafe, som ikke er stavet med stort C som første bogstav bound [bound=";_"] matcher alle ord i korpus, som har et semikolon til højre for efterfulgt af et mellemrum. Mellemrum angives som understreg i søgeudtrykket. Du kan kombinere de forskellige ordoplysninger med hinanden til et mere komplekst søgeudtryk. Således matcher [word="cafe" & bound="-"] alle ortografiske former af cafe, som følges af en bindestreg lemma [lemma="mand"] matcher samtlige bøjningsformer af grundformen mand og en række af deres ortografiske varianter. Eksemplet matcher således bl.a. mand, mands, mænd, manden og Manden. [lemma="tale" lemma="lytte"] finder alle bøjningsformer af grundformerne tale og lytte. Søgningen kan i øvrigt også udtrykkes således: [lemma="tale lytte"] pos [pos="i"] matcher udråbsord (interjektioner) i korpus, fx nej, Ja, Nej, Fy, Basta, Føj etc. [lemma="tale" & pos="n"] matcher kun de former af lemmaet tale, som er markeret som navneord (substantiver) i korpus. Dvs. at former af tale, som er markeret som verber, ikke matcher. Eksempler: (på) tale, (daglig) tale, (dansk) tale, (nogle) taler (er poetiske). [(lemma="tale" lemma="lytte") & pos="v"] finder alle former af verberne tale og lytte, men ikke former af substantivet tale. Bemærk parenteserne til gruppering af de enkelte logiske dele i det sammensatte udtryk. Udtrykket kan i øvrigt forenkles til [lemma="tale lytte" & pos="v"]. En beskrivelse af, hvilke værdier oplysningstypen pos kan antage, findes i

58 KAPITEL 5. AVANCEREDE SØGEUDTRYK 58 Avanceret udtryk Simpelt udtryk Match-eksempler [word="cafe"] eller "cafe" cafe cafe, café, Café,... [ortho="cafe"]!cafe cafe [ortho="café"]!café café [word="cafe" & ortho!="caf[eé]"] ej muligt stavevarianter af cafe, som ikke er stavet med stort [bound=";_"] ej muligt ord efterfulgt af semikolon og mellemrum [word="cafe" & bound="-"] ej muligt cafe-, café-, Café-,... mand, mands, mænd, manden, Manden,... [lemma="tale" lytte former af tale og lytte [pos="i"] ej muligt udråbsord og lydord: nej, Ja, Nej, Fy, Basta, Føj,... [lemma="tale" & pos="n"] ej muligt former af substantivet tale: (på) tale, (daglig) tale, (dansk) tale, (nogle) taler (er poetiske),... [lemma="tale lytte" & pos="v"] ej muligt former af verberne tale og lytte [epos="..:..g.:..:..."] ej muligt ord i genitiv Tabel 5.2: Avancerede over for simple søgeudtryk epos [epos="..:..g.:..:..."] matcher ord i korpus, som har kasusmærket genitiv, uanset ordklasse eller øvrig bøjning. En nærmere beskrivelse af opbygningen af epos findes i Oversigt Tabel 5.2 sammenfatter de avancerede søgeudtryk og giver de tilsvarende simple udtryk i de tilfælde, hvor det er muligt at udføre en søgning med et simpelt udtryk også. 5.3 Ordklasse og bøjning Samtlige ord i CoREST-korpusserne er beriget med oplysninger om deres ordklasse og bøjning, de er tagget. Oplysningerne er tilføjet automatisk ved hjælp af ordklassetaggeren epos, udviklet af Jørg Asmussen, DSL.

59 KAPITEL 5. AVANCEREDE SØGEUDTRYK 59 epos-ordklassetaggeren anvender et bestemt inventar af markeringer for ordklasser og bøjninger, et såkaldt tag-sæt. Inventaret beror på en grammatisk fortolkning af, hvordan de forskellige ordklasser og bøjninger kan defineres hensigtsmæssigt. epos-taggerens grammatiske syn og dermed dets tag-sæt bygger videre på konventionerne i det danske PAROLE-korpus, som fremgik af et europæisk projekt, der skulle etablere nogenlunde fælles opmærkningsstandarder for en række forskellige sprog. I epos-taggeren anvendes en videreudvikling af PAROLE s tagsæt med en række forbedringer og forenklinger. 1 I CoREST kan du søge på ordklasse- og bøjningsoplysningerne, sådan som de kommer til udtryk gennem ordklassetaggene i korpus. Dette forudsætter naturligvis, at det korpus, som du arbejder med, i det hele taget er blevet tagget med epos-taggeren. Dette er tilfældet for alle korpusser i CoREST Søgninger på ordklasse- og bøjningsoplysninger udfører du ved at anvende ordoplysningerne pos (part of speech = ordklasse) eller epos (extended part of speech) i dine søgeudtryk. Attributtet pos indeholder altid en simpel ordklasseoplysning, mens attributtet epos giver mere udførlige ordklasse- og bøjningsoplysninger Definition af ord I CoREST bruges en meget firkantet regel for opdelingen af en tekst i ord: Ord Et ord er en række af bogstaver, der står mellem to mellemrum eller sætningstegn Bindestreg, apostrof og skråstreg Som sætningstegn og dermed ordskilletegn tæller også bindestreg, apostrof og skråstreg. Derfor er»naturlige«ord som e-butik, to-værelses eller pc en i CoREST s verden hver især to ord hvis du vil søge på dem, må du formulere dine søgeudtryk tilsvarende. Du kan for eksempel finde de ovenstående eksempler ved hjælp af de følgende simple søgeudtryk: $e butik, $to værelses og $pc en. Ellers kan du finde sætningstegn ved hjælp af ordoplysningen bound, fx finder det avancerede søgeudtryk [word="[a-zøæå]{2,}"& bound="'"] alle ord på mindst to bogstaver efterfulgt af apostrof. Da skråstregen også fungerer som ordskilletegn, er ord som A/S eller km/t splittet op i to, altså A og S, km og t. I konkordanser vises skråstreger altid normalt, jf. fx A/S. Internt i CoREST er skråstregen imidlertid af tekniske grunde repræsenteret som omvendt skråstreg: \. Du kan søge på skråstreger ved hjælp af søgeudtrykket [bound="\\"]. I søgeudtrykket skal skråstregen altid angives som \\. At bindestreg, apostrof og skråstreg betragtes som sætningstegn har konsekvenser for ordklasseopmærkningen og for søgningen af ord, der indeholder bindestreg eller semikolon. Se mere herom i En detaljeret gennemgang findes i Asmussen (2014).

60 KAPITEL 5. AVANCEREDE SØGEUDTRYK Sætningstegn og mellemrum Et sætningstegn mellem to ord er nok til at adskille dem, der behøver ikke være et mellemrum. Derfor opfattes 2,0, 2.0, 2-0, bl.a., m.fl., cand.scient. alle som to ord. De tilsvarende simple søgeudtryk ser således ud: $2 0, $bl a, $m fl, $cand scient. Søgeudtrykkene finder også varianter, hvor der ud over selve det adskillende sætningstegn også skulle have sneget sig yderligere mellemrum ind som for eksempel i bl. a. eller cand. scient., men matcher også cand.scient., når det for eksempel indgår i cand.scient.pol. Vil du i din søgning differentiere mellem tilfælde med eller uden ekstra mellemrum eller om sætningstegnet er bindestreg, komma, punktum eller andet, må du anvende avancerede søgeudtryk med ordoplysningen bound på grupper af ord. Du kan læse mere om avanceret søgning på grupper af ord i Sær- og samskrivning Særskrevne ord (fx i går, ad hoc, happy hour, per se, status quo, over for, hen imod, hokus pokus, her til lands, tids nok) betragtes altid som flere ord i CoREST, for eksempel er over for to ord nemlig over og for. Nogle af de nævnte ord kan også samskrives (overfor, henimod, hokuspokus, hertillands, tidsnok), mens andre ofte samskrives, selvom man ikke bør, for eksempel igår. Når ord af denne type samskrives, betragtes de som ét ord. Denne mulighed for variation skal du tage højde for i dine søgninger. Hvis du fx vil finde eksempler på over for i to ord, kan du indtaste det simple søgeudtryk $over for, hvis du derimod vil finde overfor i ét ord, indtaster du det simple søgeudtryk overfor. Du kan finde begge varianter ved hjælp af ét avanceret søgeudtryk, nemlig ("over""for") "overfor". Du kan læse mere om avanceret søgning på grupper af ord i 5.4. Sær- eller samskrivning har også konsekvenser for ordklasseoplysningerne, for eksempel vil hertillands blive markeret som ét adverbium, mens her til lands vil blive markeret som et adverbium (her), efterfulgt af en præposition (til), efterfulgt af et substantiv (i genitiv): lands Alfabet CoREST kan kun håndtere bogstaver fra det latinske alfabet. Eventuelt forekommende bogstaver fra andre alfabeter er enten udeladt eller omsat til særlige tegnfølger, for eksempel spørgsmålstegn eller som i følgende eksempel: Den hebraiske bibel blev oprindeligt kaldt tanakh (hebr. [ HEB@05EA][ HEB@05E0]"[ Ordoplysningen pos Tabel 5.3 viser de forskellige værdier (tagsættet), som pos-tagget kan have (1. kolonne) samt hvilke ordklasser de svarer til (2. kolonne).

61 KAPITEL 5. AVANCEREDE SØGEUDTRYK 61 Tag V A L N P D I T C U E M X Ordklasse verbum, udsagnsord adjektiv, tillægsord numerale, talord substantiv, navneord pronomen, stedord adverbium, biord interjektion, udråbsord, lydord præposition, forholdsord konjunktion, bindeord som, der, infinitivmarkør leksikalsk element løsrevet bøjningsendelse symboler, fremmede ord, fejl Tabel 5.3: Ordklassetags Du kan søge på disse ordklasseoplysninger ved at bruge ordoplysningen pos i dine søgeudtryk. Således finder søgeudtrykket [lemma="tale" & pos="v"] eksempler på anvendelsen af verbet tale i korpus, mens [pos="i"] finder eksempler på interjektioner/udråbsord herunder lydord, fx abracadabra, basta, ciao, ding, ehm, fuck, halleluja, ja, muh, nej osv. De fleste af ordklasserne på listen er almindeligt kendte og beskrives derfor ikke nærmere i denne manual. 2 Der er dog et antal særtilfælde. Således mangler ordklassen artikel (kendeord) i epos-tagsættet. Artikler betragtes som pronomener, læs mere herom i Endvidere er der et antal lidt specielle klasser, nemlig U, E, M og X, som beskrives nærmere i det følgende Tagget U som, der og at Da epos-tagsættet beror på PAROLE, har det i visse tilfælde været nødvendigt at overtage PAROLE s valg. Det gælder for eksempel brugen af tagget U (»unique«) til markering af bestemte typer ord. som Ordformen som kan anvendes som relativpronomen, konjunktion (eller præposition), men epos skelner ikke mellem disse anvendelser og tagger alle forekomster af som med et U. 2 Se Asmussen (2014) for en mere detaljeret beskrivelse.

62 KAPITEL 5. AVANCEREDE SØGEUDTRYK 62 der Det samme tag U bruges til opmærkning af forekomster af der, som kan optræde som formelt subjekt eller som relativpronomen. at Endelig bruges U til at tagge ordet at, når det anvendes som infinitivmarkør i forbindelse med et infinit verbum Tagget E leksikalsk element Leksikalske elementer er dele af ord, som på grund af den mekaniske ordopdeling får status af selvstændige ord. Da for eksempel bindestreger fungerer som ordgrænser, vil ord med bindestreg blive splittet ad. For eksempel består art deco-stil af tre, anti-amerikansk af to, Saudi-Arabien af to, be- eller afkræfte af tre og coproducer af to ord. På denne måde opstår der særlige ord, som normalt ikke optræder selvstændigt, men kun som del af et andet ord: art, deco, anti, Saudi, be og co. Disse særlige ord betragter epos som leksikalske elementer, og de tagges med E. Du kan danne dig et indtryk af hyppige leksikalske elementer i KORPUS-DK ved først at søge på [pos="e"] og siden at sortere den resulterende matchliste efter faldende hyppighed Tagget M løsrevet bøjningsendelse Løsrevne bøjningsendelser minder lidt om leksikalske elementer, jf , og skyldes ligeledes den meget mekaniske ordopfattelse, der ligger til grund for CoREST. Mens leksikalske elementer typisk bliver løsrevet fra deres basis på grund af en bindestreg, som betragtes som ordgrænse, så løsrives bøjningsendelser på grund af apostroffer, der også fungerer som ordgrænser. Eksempler på løsrevne bøjningsendelser er s fra FN s, erne fra 1950 erne, er fra cd er og en fra dj en. Løsrevne bøjningsendelser tagges med et M (»morpheme«). Den konstruerede lemmaform til disse endelser er altid selve endelsen med et @er Du kan danne dig et indtryk af, hvilke løsrevne bøjningsendelser der findes i KORPUS-DK ved at udføre en søgning på udtrykket [pos="m"] og sortere den resulterende matchliste efter faldende hyppighed Tagget X symboler m.m. Symboler, fremmede ord og fejl tagges med X. Eksempler på symboler er tegn som % og & eller forkortelser som BBC, com, dk, EUD, A og S i A/S (hvor skråstregen er ordskilletegn) etc. Eksempler på fremmede ord er five, greatest eller high. Desuden er der tilfælde, hvor epos ikke har været i stand til at tagge et ord eller endda en hel sætning, fordi dens viden om sprog af en eller anden grund ikke slog til. Disse tilfælde er ligeledes tagget med X.

63 KAPITEL 5. AVANCEREDE SØGEUDTRYK Ordoplysningen epos Ordoplysningen epos (=»extended pos«) er en udvidet udgave af pos. Det indeholder ud over selve ordklasseoplysningen en række yderligere oplysninger. Tagget består af fire oplysningskategorier adskilt ved koloner: klasse : nominal : verbal : diverse klasse Denne oplysningskategori består typisk af to store bogstaver, sommetider af ét stort bogstav efterfulgt af en bindestreg. Det første bogstav betegner ordklassen, sådan som det er beskrevet i tabel 5.3, mens det andet betegner en underklasse til ordklassen. Ikke alle ordklasser har underklasser: Hvis der ikke er underklasser, sættes en bindestreg. De forskellige underklasser og dertil hørende bøjningsparadigmer er beskrevet i nominal Denne oplysningskategori består af fire tegn, som beskriver ordets nominale (substantiviske) bøjning; se mere i verbal Denne oplysningskategori omfatter to tegn, der beskriver ordets verbale bøjning; se mere i diverse Denne oplysningskategori bruges til forskellige bøjningsoplysninger for adjektiver, pronomener og visse adverbier; se mere under i Der er tilfælde, hvor en bestemt bøjningsoplysning ikke er relevant. I så fald sættes en bindestreg pågældende sted. Endvidere er der tilfælde, hvor en bestemt bøjning ikke kan afgøres entydigt; dette markeres ved hjælp af tegnet #. Der er også tilfælde, hvor bøjningen i princippet godt kan afgøres, men hvor det ikke er gjort. Dette er en reminiscens fra PAROLE-korpussets ordklasseopmærkning. I disse tilfælde sættes tegnet pågældende sted i tagget Nominale oplysninger Nominale bøjningsoplysninger er kendetegnende for substantiver eller ord, som også kan bøjes substantivisk, fx adjektiver og verber i visse former. Der er altid fire nominale bøjningsmarkører til stede i epos-tagget. Her gennemgår vi dem i den rækkefølge, de står i i tagget. Rækkefølgen ligger fuldstændig fast. 1. Tal: ental s eller flertal p 2. Bestemthed: ubestemt i eller bestemt d 3. Kasus: umarkeret u, ejefald g, fossileret f og kun for de personlige pronomeners vedkommende nominativ n. Akkusativ er identisk med umarkeret i disse tilfælde og tagges med u 4. Køn: fælleskøn c eller intetkøn n

64 KAPITEL 5. AVANCEREDE SØGEUDTRYK 64 I tilfælde, hvor en bestemt bøjningsoplysning ikke er relevant, sættes en bindestreg pågældende sted. I tilfælde, hvor en bestemt bøjning ikke kan afgøres entydigt, markeres det ved hjælp af tegnet # eller. Se eksempler på taggede ord i tabel 5.4 på side Verbale oplysninger Der er to verbale bøjningsmarkører til stede i epos-tagget. I den rækkefølge, de optræder i, er det: 1. Tid: nutid s eller datid t 2. Diatese: aktiv a eller passiv p Se eksempler på taggede ord i tabel 5.4 på side Diverse oplysninger Der er fire ekstra bøjningsmarkører til stede i epos-tagget. Her gennemgår vi dem i den rækkefølge, de står i i tagget: 1. Grad (adjektiver og visse adverbier): positiv p, komparativ c, superlativ s eller absolut superlativ a 2. Person (personlige og possessive pronomener): første 1, anden 2 eller tredje 3 3. Refleksivitet (personlige og possessive pronomener): ja y eller nej n 4. Possessor (possessive pronomener): ental s eller flertal p Se eksempler på taggede ord i tabel 5.4 på side Underklasser og bøjningsmønstre I det følgende gives en oversigt over de forskellige underklasser, som ordklasserne kan opdeles i. Til hver underklasse knytter der sig et særligt bøjningsmønster. Et bøjningsmønster er karakteriseret ved, at kun bestemte bøjningsoplysninger (= positioner i epos-tagget) er i brug, mens de øvrige som regel slet ikke bruges og derfor er markeret med en streg - i tagget. I oversigterne nedenfor er de positioner i tagget, som er i brug, markeret med en bolle. Grammatikken bag opdelingen i underklasserne behandles ikke i denne manual. Der henvises til generelle grammatiske beskrivelser af ordenes bøjning på dansk.

65 KAPITEL 5. AVANCEREDE SØGEUDTRYK 65 Verber Underklasse I infinitiv F finit M imperativ G gerundium P participium T perf. part. D adv. part. Mønster VI:----:- :---- VF:----: :---- VM:----:--:---- VG: :--:---- VP: : -:---- VT:siu#: -:---- VD:----: -:---- Adjektiver Underklasse C almindelige D adverbielle Mønster AC: :--: --- AD:----:--: --- Numeraler Underklasse C kardinale O ordinale Mønster LC:-- -:--:---- LO:-- :--:---- Substantiver Underklasse C appellativ P proprium Mønster NC: :--:---- NP: :--:---- Pronomener

66 KAPITEL 5. AVANCEREDE SØGEUDTRYK 66 Underklasse C reciprokke M demonstrative I indefinitte O possessive P personlige R relative Mønster PC: - -:--:---- PM: - :--:---- PI: - :--:---- PO: -- :--:- PP: - :--:- - PR: - :--:---- Adverbier Underklasse Mønster - ingen D-:----:--: --- Interjektioner Underklasse Mønster - ingen I-:----:--:---- Præpositioner Underklasse Mønster - ingen T-:----:--:---- Konjunktioner Underklasse C sideordnende S underordnende Mønster CC:----:--:---- CS:----:--:---- Infinitivmarkør og som/der Underklasse I infinitivmarkør S som/der Mønster UI:----:--:---- US:----:--:----

67 KAPITEL 5. AVANCEREDE SØGEUDTRYK 67 Leksikalske elementer Underklasse W orddannelse Mønster xw:----:--:---- Løsrevne bøjningsendelser Underklasse N fra substantiv V fra verbum A fra adjektiv Mønster MN: :--:---- MV:----: :---- MA: :--: --- Symboler m.m. Underklasse S symbol F fremmed Y taggefejl Mønster XS:----:--:---- XF:----:--:---- XY:----:--: Eksempler på taggede ord For at få illustreret brugen af epos-tags betragter vi følgende sætning fra KORPUS- DK: De fleste af ulandenes egne beslutningstagere er økonomer, uddannet i neoliberal økonomi på amerikanske eller i hvert fald vestlige universiteter. I tabel 5.4 er sætningen opstillet med ét ord per række med tilhørende grundform (lemma) og epos-tag. Kommentarer til tabel 5.4 de (#1) er tagget som et demonstrativt pronomen: PM. Ofte bliver et sådant de også betragtet som en bestemt artikel, men ordklassen artikel findes ikke i epos, i stedet for bruges pronomen. Til pronomenet er i dette tilfælde knyttet en række nominale bøjningsoplysninger: p-u#. Numerusoplysningen på førstepladsen angiver flertal p (pluralis). Demonstrative pronomener bøjes ikke i bestemthed, så derfor er der på bestemthedspladsen (plads 2) en bindestreg. Kasus (plads 3) er umarkeret u. Da pronomenet optræder i flertal (modsat ental, hvor man kan skelne mellem den og det), kan kønnet ikke afgøres, så derfor ser vi tagget # på fjerdepladsen, hvor kønnet oplyses.

68 KAPITEL 5. AVANCEREDE SØGEUDTRYK 68 # word lemma epos 1 de den PM:p-u#:--: fleste mange AC:p#u#:--:s--- 3 af af T-:----:--: ulandenes uland NC:pdg#:--: egne egen AC:p#u#:--:p--- 6 beslutningstagere beslutningstager NC:piu#:--: er være VF:----:sa: økonomer økonom NC:piu#:--: uddannet uddanne VT:siu#:t-: i i T-:----:--: neoliberal neoliberal AC:siuc:--:p økonomi økonomi NC:siuc:--: på på T-:----:--: amerikanske amerikansk AC:p#u#:--:p eller eller CC:----:--: i i T-:----:--: hvert hver PI:s-un:--: fald fald NC:siun:--: vestlige vestlig AC:p#u#:--:p universiteter universitet NC:piu#:--:---- Tabel 5.4: Sætning med epos-tags

69 KAPITEL 5. AVANCEREDE SØGEUDTRYK 69 fleste (#2) er tagget som almindeligt adjektiv: AC, dvs. et adjektiv, der er brugt attributivt eller prædikativt, men ikke adverbielt. Der gives følgende nominale bøjningsoplysninger i tagget p#u# : tal er flertal p (pluralis), bestemthed oplyst på andenpladsen er ikke entydig: #, kasusoplysningen på tredjepladsen er umarkeret u og kønnet på fjerdepladsen er ikke entydigt: #. Adjektiver bruger også grad-oplysningen på førstepladsen i diverse-kategorien af tagget: s---. Graden er i dette tilfælde oplyst som superlativ s. af, i, på (#3, #10, #13, #16) er tagget som præpositioner: T-. Præpositioner inddeles ikke i underklasser, derfor har vi en bindestreg som underklasseoplysning. Præpositioner bøjes heller ikke, derfor er alle bøjningsoplysningerne sat til bindestreger. ulandenes (#4) er tagget som appellativisk substantiv: NC. Substantiver bøjes i tal (her flertal p), bestemthed (bestemt d) og kasus (ejefald g) oplyst på plads 1, 2 og 3 i den nominale del af tagget. Desuden oplyses deres køn på plads 4 i den nominale del. Kønnet fremgår kun direkte af substantivet, hvis det optræder i bestemt form ental, for eksempel ulandets, og indirekte af sammenhængen, hvis det optræder i ubestemt form ental, for eksempel et uland. I dette eksempel optræder det dog i flertal, hvorfor kønnet ikke kan afgøres, hverken direkte på baggrund af ordets form eller indirekte af konteksten. Derfor er køn oplyst som #. egne (#5) er tagget som et almindeligt adjektiv: AC. Den nominale del af tagget p#u# oplyser, at adjektivet her optræder i flertal p, at det ud fra formen ikke kan afgøres, om den er bestemt eller ubestemt: #, at kasus er umarkeret u, og at køn ikke kan afgøres: #. Endvidere er gradbøjningen sat til positiv p i diverse-kategorien af tagget. beslutningstagere, økonomer (#6, #8) er tagget som appellativiske substantiver: NC, som her optræder i flertal p, er i ubestemt form i med umarkeret kasus u. Køn kan ikke afgøres, da der er tale om en flertalsform: #. er (#7) er tagget som et finit verbum: VF. Ved verberne er den verbale del af tagget som regel i brug her oplyses om tid og diatese. I dette tilfælde er tid nutid s (præsens) og diatese er aktiv: a. Finite verber er karakteriseret ved, at de kun har disse to bøjningskategorier. uddannet (#9) er tagget som et verbum, der i dette tilfælde fungerer som perfektum participium: VT. Alle verber i denne funktion, hvor de er del af et komplekst verbal er/blive uddannet, er i deres nominale og verbale del låst fast til formerne siu# hhv. t- (præteritum, datid). Participiumsformer, som ikke indgår i verbaler, for eksempel en uddannet økonom, er tagget VP. Disse er ikke låst til bestemte former i nominal- og verbaldelen af bøjningsmønsteret.

70 KAPITEL 5. AVANCEREDE SØGEUDTRYK Søgning på grupper af ord Ordbeskrivelser i kantede parenteser Hidtil har vi kun set på avancerede søgeudtryk, som var begrænset til søgninger på et enkelt ord. Således finder udtrykket [lemma=".+arbejde" & pos="n"] alle ord, som er en form af et substantiv, hvis grundform ender på arbejde. Det, der står mellem kantede parenteser, er altid en opskrift på, hvilke egenskaber et ord skal opfylde, i dette tilfælde altså, at det skal være en form af et lemma, der ender på arbejde, som skal være tagget som substantiv Flere ordbeskrivelser efter hinanden Vi kan udvide dette udtryk til at omfatte flere ord, fx finder [lemma=".+arbejde" & pos="n"] [word="med"] [word="henblik"] [word="på"] alle former af substantiviske lemmaer, som ender på arbejde efterfulgt af de tre ord med, henblik og på. Hvis der mellem to kantede parenteser kun står en opskrift på, hvordan ordoplysningen word skal se ud, fx [word="på"] eller [word="med.+"], kan du nøjes med at skrive "på" eller "med.+" pågældende sted i udtrykket. Husk, at word altid er den ordoplysning, CoREST automatisk søger på, hvis intet andet er oplyst; word indeholder altid et korpusord i en forenklet ortografi, jf Således kan ovenstående udtryk forenkles til [lemma=".+arbejde" & pos="n"] "med" "henblik" "på". Er du ligeglad med, om formerne af lemmaet er substantiver eller ej, kan ovenstående søgning også udføres ved hjælp af et simpelt søgeudtryk, nemlig $@.+arbejde med henblik på, dog får du i dette tilfælde også verber med arbejde med i dit resultat. Avancerede søgeudtryk giver en højere grad af præcision end simple, men omkostningen er et betydeligt længere søgeudtryk. Vi vil nu ændre vores eksempel, så vi kan finde former af et substantivisk lemma, der ender på arbejde efterfulgt af en form af verbet være efterfulgt af et adjektiv. Søgeudtrykket, vi skal formulere i dette tilfælde, ser sådan ud: [lemma=".+arbejde" & pos="n"] [lemma="være"] [pos="a"]. De tre hyppigst forekommende eksempler i KORPUS-DK er vist i figur 5.1. Der forekommer også matchet samarbejde er meget, hvor meget ganske vist er et adjektiv (lemmaform megen), dog anvendes det adverbielt i dette tilfælde, som epos-tagget

71 KAPITEL 5. AVANCEREDE SØGEUDTRYK 71 Figur 5.1: Match på grupper af ord viser, idet underklassen er oplyst som D, som står for et adjektiv i adverbiel anvendelse, jf Det følgende søgeudtryk begrænser søgningen til adjektiver i»almindelig«attributiv anvendelse: [lemma=".+arbejde" & pos="n"] [lemma="være"] [epos="ac.*"] Jokertegn på ord Problemet med søgningerne hidtil er, at de ikke fanger tilfælde, hvor der mellem formen af være og adjektivet står adverbielle størrelser, som fx samarbejde er meget vigtigt. Du kunne ændre dit søgeudtryk til [lemma=".+arbejde" & pos="n"] [lemma="være"] [epos="ad.*"] [epos="ac.*"], men så ville det udelukke de eksempler, du fandt med søgeudtrykket lige før. Du skal altså oplyse, at ordet beskrevet ved [epos="ad.*"] også kan udelades. Dette gør du ved at anvende regulære udtryk, jf. kapitel 4, direkte på ord. Således betyder [epos="ad.*"]? nul eller én forekomst af ordet, altså netop det, du har brug for. Søgeudtrykket [lemma=".+arbejde" & pos="n"] [lemma="være"] [epos="ad.*"]? [epos="ac.*"]

72 KAPITEL 5. AVANCEREDE SØGEUDTRYK 72 kombinerer således de to forudgående søgeudtryk til ét. Du kan også skrive [epos="ad.*"]*, som betyder nul, én eller flere forekomster af adverbielt brugte adjektiver pågældende sted i søgeudtrykket. Endelig kan du oplyse antal-intervaller i krøllede parenteser, altså fx [epos="ad.*"]{0,1} eller [epos="ad.*"]{0,}, hvor {0,1} betyder»mindst nul og højst 1«, mens {0,} betyder»mindst nul«, hvilket jo henholdsvis svarer til? og *. Selvfølgelig kan der også bruges andre tal end 0 og 1 i intervalangivelserne, dog skal de være positive, og det første tal skal være mindre end eller lig med det andet. Du kan i dine søgeudtryk også bruge kantede parenteser uden yderligere beskrivelse imellem: []. Det betyder»et vilkårligt ord på dette sted«og svarer således til # (eller []) i simple søgeudtryk. Disse vilkårlige ord kan ligeledes udvides med angivelserne?, * eller intervalangivelser i krøllede parenteser Søge inden for sætningsgrænser Et problem ved søgeudtryk, der matcher grupper af ord, er, at de ignorerer sætningsgrænser og bare matcher hen over dem. Således finder udtrykket [lemma=".+arbejde" & pos="n"] [lemma="være"] [epos="ad.*"]? [epos="ac.*"], som vi brugte ovenfor, også eksemplet: Siden har han modtaget flere andre priser for sit revyarbejde. Er kunstnerisk leder, instruktør og skuespiller med revyarbejde som en form af substantivet revyarbejde, Er (i begyndelsen af en ny sætning) som en form af være og kunstnerisk et ikke adverbielt brugt adjektiv. Blot er dette ikke et eksempel på det forventede, fordi matchet går hen over en sætningsgrænse. Man kunne udelukke denne type match ved at tilføje & bound!="\..*" til første, andet og tredje ord i søgeudtrykket. Nemmere er det dog at tvinge CoREST til kun at matche inden for en sætning with at tilføje within s til søgeudtrykket: [lemma=".+arbejde" & pos="n"] [lemma="være"] [epos="ad.*"]? [epos="ac.*"] within s giver således det ønskede resultat. Da opsplitningen af korpusteksterne i sætninger er sket automatisk, og der her sagtens kan være sket fejl, er tilføjelsen af within s ikke altid fuldkommen pålidelig. 3 I øvrigt kan du også bruge disse angivelser efter # i simple søgeudtryk.

73 KAPITEL 5. AVANCEREDE SØGEUDTRYK Søgning på adskilte ord I blev et ord defineret som en række af bogstaver, der står mellem to mellemrum eller sætningstegn. Både bindestreg, apostrof og skråstreg betragtes som sætningstegn, hvorfor ord som e-butik, to-værelses eller pc en i CoREST splittes op i flere ord, i disse eksempler to ord, jf Andre sætningstegn som punktum eller komma skiller ligeledes ord ad, hvad enten der ud over sætningstegnet også forekommer mellemrum eller ej, jf Derfor opfattes 2,0, 2.0, 2-0, bl.a., m.fl., cand.scient. alle som to ord, som kan findes med de simple søgeudtryk $2 0, $bl a, $m fl og $cand scient. Søgeudtrykkene finder også varianter, hvor der ud over selve det adskillende sætningstegn også skulle have sneget sig yderligere mellemrum ind som for eksempel i bl. a. eller cand. scient., men matcher også cand.scient., når det for eksempel indgår i cand.scient.pol. Vil du i din søgning differentiere mellem tilfælde med og uden ekstra mellemrum eller om sætningstegnet er bindestreg, komma, punktum eller andet, kan du vha. et avanceret søgeudtryk med ordoplysningen bound søge på grupper af ord, fx [word="2" & bound="\."] "0" for at matche 2.0 eller [word="cand" & bound="\."] [word="scient" & bound="\._"] for at matche cand.scient. hvilket udelukker cand.scient.pol., men ikke fx cand.scient. pol. eller cand.scient. soc. Hvis cand.scient.pol. erne og -soc. erne skal udelukkes helt, kan udtrykket [word="cand" & bound="\."] [word="scient" & bound="\._"] [word!="pol soc"] bruges. 5.5 Søgning på tekstoplysninger De fleste korpusser har tilknyttet en række tekstoplysninger (metadata) til hver enkelt tekst. Nogle af disse oplysninger kan du bruge til at indsnævre dine søgninger med, altså»filtrere«dem, så du kun får de resultater at se, hvor tekstoplysningerne svarer til dem, som du har fastlagt i din søgning. Hvilke metadata du kan bruge som filtre i dine søgninger, afhænger principielt af det korpus, du har valgt, i Co- REST 2017 bruges imidlertid de samme metadata for alle korpusser. Du slår filterfunktionen til ved at sætte hak i»filter«-boksen til højre for søgefeltet. Under søgefeltet åbner der sig en række af seks felter, hvor du kan specificere de tekstfiltre, der skal gælde for søgningen. I filtrene kan du bruge de kendte jokertegn, jf. kapitel 4, dog skelnes der aldrig mellem store og små bogstaver. En

74 KAPITEL 5. AVANCEREDE SØGEUDTRYK 74 Kode Delkorpus Årstal 100 Korpus Korpus Korpus Tabel 5.5: Korpuskoder i»group«-oplysningstypen bindestreg ( minus ) som første tegn i et filterfelt betyder, at filteret ikke må være opfyldt. Filtrene»Group«,»Source«,»Title«og»Author«er identiske med de oplysninger, du finder i området med tekstoplysningerne under konkordansen, og de er beskrevet i tabel 3.2 på side 43. Du kan lade dig inspirere af de værdier, som vises i dette område, til at formulere dine egne filterværdier, idet du fx overtager avisnavne, bestemte ord fra titler osv. i dine filtre. Ud over de nævnte fire filtre findes der to yderligere, nemlig»size«og»quality«. Særligt for feltet»source«kan du fx bruge en af kilderne under hovedkildefortegnelserne i appendiks B. NYT Size fastlægger tekstens omfang. Der er fire kategorier: L (mindst ord), M ( ord), S ( ord) og XS (under 200 ord). Mindre tekststørrelser vil overvejende være avisartikler, mens længere tekster kan komme fra kilder, som ikke nødvendigvis er nyhedsstof. Quality fastlægger ikke teksters, men sætningers sproglige kvalitet (og er derfor ikke metadata på tekstniveau, men på sætningsniveau). Der er to kvalitetstrin: hi og lo. Opdelingen af sætninger i en formodet højere eller lavere sproglig kvalitet er beregnet automatisk og er indtil videre af ren eksperimentel karakter. Figur 5.2 viser et eksempel, hvor der er søgt på søgeudtrykket spare.+ i KORPUS- DK i tekster fra Jyllands-Posten, hvor der i avisartiklens overskrift indgår strengen bank, og hvor de fundne sætninger skal være af»høj«sproglig kvalitet. Bemærk, at figuren viser CoREST-vinduet med usynligt ordlisteområde, jf. afsnit 2.3. For KORPUS-DK bruges nogle særlige tekstgruppebetegnelser, som blandt andet gør det muligt at søge direkte i de tre delkorpusser, som KORPUS-DK består af, enten hvert korpus for sig eller i en hvilken som helst kombination. Tekstgruppebetegnelserne består af to tal adskilt ved bindestreg. Korpuskoden, som er tallet foran bindestregen, består af tre cifre og betegner det delkorpus, som teksten stammer fra, se tabel 5.5. Tallet efter bindestregen er årstallet for udgivelsen af teksten. I tabel tabel 5.6 kan du se, hvad du skal indtaste i filterfeltet»group«for at søge i de forskellige delkorpusser eller kombinationer af dem. Alle indtastede værdier NYT

75 KAPITEL 5. AVANCEREDE SØGEUDTRYK 75 Figur 5.2: Søgning med tekstfiltre Indtastning Søger i 100-.* Korpus * Korpus * Korpus * Korpus * Korpus * Korpus Tabel 5.6: Søgning i delkorpusser i»group«-feltet skal afsluttes med jokertegnet.* som vist i tabellen, fordi gruppebetegnelsen oplyser udgivelsesåret efter bindestregen, som vi ikke tager højde for i dette eksempel. Naturligvis kan du også inddrage årstal, hvis du ønsker det.

Korpusværktøjet CoREST Manual. Version 2017

Korpusværktøjet CoREST Manual. Version 2017 Korpusværktøjet CoREST Manual Version 2017 Jørg Asmussen Det Danske Sprog- og Litteraturselskab 14. juni 2017 Denne manual vedrører DSL-UDGAVEN af CoREST. Resumé Denne version af manualen beskriver DSL-udgaven

Læs mere

Korpusværktøjet CoREST Manual. Version 2016

Korpusværktøjet CoREST Manual. Version 2016 Korpusværktøjet CoREST Manual Version 2016 Jørg Asmussen Det Danske Sprog- og Litteraturselskab 11. februar 2016 Denne manual vedrører Standardudgaven af CoREST. En eventuel nyere version af manualen findes

Læs mere

Introduktion til korpusværktøjet CoREST

Introduktion til korpusværktøjet CoREST Introduktion til korpusværktøjet CoREST Jørg Asmussen Det Danske Sprog- og Litteraturselskab 17. marts 2015 Denne vejledning vedrører CoREST β (2015). En eventuel opdateret version af vejledningen findes

Læs mere

Daglig brug af JitBesked 2.0

Daglig brug af JitBesked 2.0 Daglig brug af JitBesked 2.0 Indholdsfortegnelse Oprettelse af personer (modtagere)...3 Afsendelse af besked...4 Valg af flere modtagere...5 Valg af flere personer der ligger i rækkefølge...5 Valg af flere

Læs mere

ViKoSys. Virksomheds Kontakt System

ViKoSys. Virksomheds Kontakt System ViKoSys Virksomheds Kontakt System 1 Hvad er det? Virksomheds Kontakt System er udviklet som et hjælpeværkstøj til iværksættere og andre virksomheder som gerne vil have et værktøj hvor de kan finde og

Læs mere

Elevvejledning til SkoleKomNet - Min egen hjemmeside

Elevvejledning til SkoleKomNet - Min egen hjemmeside Indledning...1 Sådan får du adgang...2 Dit KlasseWeb skrivebord Overblik...2 Dit arbejdsområde...3 Din hjemmeside på nettet...3 Sådan laver du en hjemmeside i 4 trin...3 Trin 1 Dit personlige billede på

Læs mere

It-@fdelingen UC Syddanmark 7266 2400

It-@fdelingen UC Syddanmark 7266 2400 UNI-Login Installation af SkoleKom og ændring af kodeord SkoleKom er et udbredt mail- og konferencesystem i skoleverdenen i Danmark. For at komme på SkoleKom, skal du oprettes som bruger, hvor du får 3

Læs mere

Introduktion. Sådan finder du dokumenterne. Opslag ved hjælp af menustrukturen. Opslag ved hjælp af personlige bogmærker.

Introduktion. Sådan finder du dokumenterne. Opslag ved hjælp af menustrukturen. Opslag ved hjælp af personlige bogmærker. Version 5 Introduktion Sådan finder du dokumenterne Opslag ved hjælp af menustrukturen Klik dig frem i menuerne med musen eller brug tabulatortasten. Klik dig frem via menuerne i dokumentvinduet: Klik

Læs mere

Windows Vista 1. Side 1 af 10

Windows Vista 1. Side 1 af 10 Windows vista...2 Lukke for PC,en...3 Velkomstcenter...3 Finde/starte et program...4 Alle programmer...5 Menuen Start...5 Stifinder...6 Windows Sidepanel og gadgets...7 Dokumenter...7 Tilbehør...8 Windows

Læs mere

WebTV. Vejledning til WebTV på web. Vejledningen beskriver upload og deling af videoer på WebTV

WebTV. Vejledning til WebTV på web. Vejledningen beskriver upload og deling af videoer på WebTV WebTV Vejledning til WebTV på web Vejledningen beskriver upload og deling af videoer på WebTV ITS 24-11-2015 WebTV Vejledning til WebTV på web Indholdsfortegnelse WebTV... 2 Login... 2 Navigation... 3

Læs mere

Manual til CD-ORD. Randers Realskole

Manual til CD-ORD. Randers Realskole Randers Realskole CD-ORD Læs og skriv på computeren CD-ORD er et pc-værktøj, der hjælper dig med at læse og skrive hvad enten du har brug for støtte i undervisningen, har svært ved at læse eller skrive

Læs mere

dpix til Word Indholdsfortegnelse

dpix til Word Indholdsfortegnelse dpix til Word Indholdsfortegnelse dpix til Word...1 Installation af Java...1 Klargøring af Word...1 Installation (opdatering) af dpix...2 Første start af Word med dpix...2 Udarbejdelse af et opgavesæt...4

Læs mere

En lille vejledning til lærere og elever i at bruge matematikprogrammet WordMat (begynderniveau)

En lille vejledning til lærere og elever i at bruge matematikprogrammet WordMat (begynderniveau) Matematik i WordMat En lille vejledning til lærere og elever i at bruge matematikprogrammet WordMat (begynderniveau) Indholdsfortegnelse 1. Introduktion... 3 2. Beregning... 4 3. Beregning med brøker...

Læs mere

Velkommen til REX onlinehjælp

Velkommen til REX onlinehjælp Velkommen til REX onlinehjælp I REX onlinehjælp kan du finde information om følgende emner: Indhold Enkel søgning...3 Hvordan kan du bruge søgefeltet?...3 Søg efter sætninger...3 Søg efter specifikke ord

Læs mere

Introduktion til CD ere og Arkivdeling Gammel Dok - September-oktober 2003. Jonas Christiansen Voss

Introduktion til CD ere og Arkivdeling Gammel Dok - September-oktober 2003. Jonas Christiansen Voss Introduktion til CD ere og Arkivdeling Gammel Dok - September-oktober 2003 Jonas Christiansen Voss 2. marts 2004 Indhold 1 CD ere 2 1.1 Brænde dokumenter til CD....................... 2 1.2 Disk Copy.................................

Læs mere

7DVWHYHMOHGQLQJ#²#,QWHUQHW#([SORUHU

7DVWHYHMOHGQLQJ#²#,QWHUQHW#([SORUHU 7DVWHYHMOHGQLQJ#²#,QWHUQHW#([SORUHU,QGKROGVIRUWHJQHOVH BROWSEREN - DE VIGTIGSTE FUNKTIONER OG BEGREBER.... 2 TILPAS BROWSEREN... 3 GÅ DIREKTE TIL EN KENDT ADRESSE... 5 LAV ET BOGMÆRKE... 6 ORGANISÉR DINE

Læs mere

elib Aleph, ver.18 Introduktion til GUI FUJITSU SERVICES A/S

elib Aleph, ver.18 Introduktion til GUI FUJITSU SERVICES A/S Introduktion til GUI FUJITSU SERVICES A/S, 2008 Indholdsfortegnelse 1. Skrivebordet... 3 2. Flytte rundt m.m.... 4 3. Log ind... 6 4. Valg af database... 7 5. Rudernes størrelse... 8 6. Kolonner... 9 7.

Læs mere

Sådan opdaterer og vedligeholder du din hjemmeside i Wordpress.

Sådan opdaterer og vedligeholder du din hjemmeside i Wordpress. Wordpress manual Sådan opdaterer og vedligeholder du din hjemmeside i Wordpress. Dette er en manual til de mest grundlæggende ting og funktioner i Wordpress, så du selv kan redigere indholdet eller tilføje

Læs mere

Manual til Wordpress. 1. Log ind på din Wordpress-side. Indhold: Sådan opdaterer du din hjemmeside i Wordpress.

Manual til Wordpress. 1. Log ind på din Wordpress-side. Indhold: Sådan opdaterer du din hjemmeside i Wordpress. Manual til Wordpress Sådan opdaterer du din hjemmeside i Wordpress. Dette er en manual til de mest grundlæggende ting, så du selv kan redigere indholdet og lægge nyt på din hjemmeside. Guiden er skrevet

Læs mere

Manual og Hjælp Skoletasken 2

Manual og Hjælp Skoletasken 2 Manual og Hjælp Skoletasken 2 I Skoletasken 2 - Hjælp Indhold I Introduktion 1 Velkomst 2... 2 2 Systemkrav... 2 3 Installation... 3 4 Skoletasken... 8 II Opsætning 10 1 Systemopsætning... 10 2 Bogopsætning...

Læs mere

Manual til Wordpress. 1. Log ind på din Wordpress-side. Indhold:

Manual til Wordpress. 1. Log ind på din Wordpress-side. Indhold: Manual til Wordpress Sådan opdaterer du din hjemmeside i Wordpress: Dette er en manual til de mest grundlæggende ting, så du selv kan redigere indholdet eller tilføje nyt på din hjemmeside. Guiden er skrevet

Læs mere

Større skriftlige opgaver i Microsoft Word 2007 Indhold

Større skriftlige opgaver i Microsoft Word 2007 Indhold Større skriftlige opgaver i Microsoft Word 2007 Indhold Større skriftlige opgaver i Microsoft Word 2007... 1 Inddeling i afsnit... 2 Sideskift... 2 Sidetal og Sektionsskift... 3 Indholdsfortegnelse...

Læs mere

Picto Selector. Lav dine egne flotte symbolark på den nemme måde. Version: Oktober 2012

Picto Selector. Lav dine egne flotte symbolark på den nemme måde. Version: Oktober 2012 Picto Selector Lav dine egne flotte symbolark på den nemme måde Version: Oktober 2012 Indholdsfortegnelse Hvad er Picto Selector?...4 USB?...4 Hent programmet...4 Installer programmet på din computer...5

Læs mere

IDAP manual Emission

IDAP manual Emission IDAP manual Emission Dato: 08-06-2005 16:32:35 Indhold INDHOLD... 1 1 EMISSION... 2 1.1 KURVER... 2 1.2 RAPPORTER... 5 1.3 DATA REDIGERING... 6 1.3.1 Masse redigering... 7 1.3.2 Enkelt redigering... 10

Læs mere

Generelt Windows tidligere versioner... 1 Windows Apple Mac Log på... 2 Rediger dokumentet Tilføj et tillægsdokument...

Generelt Windows tidligere versioner... 1 Windows Apple Mac Log på... 2 Rediger dokumentet Tilføj et tillægsdokument... Vejledning i brug af dli dokumenthåndteringssystemet til forfattere og referenter Indhold Vejledning i brug af dli dokumenthåndteringssystemet til forfattere og referenter... 1 Generelt... 1 Windows tidligere

Læs mere

How to do in rows and columns 8

How to do in rows and columns 8 INTRODUKTION TIL REGNEARK Denne artikel handler generelt om, hvad regneark egentlig er, og hvordan det bruges på et principielt plan. Indholdet bør derfor kunne anvendes uden hensyn til, hvilken version

Læs mere

Vejledning. Excel-skabelon. til oprettelse af kalendere. Oversigtskalender_Skabelon_Revideret 05_06.xls

Vejledning. Excel-skabelon. til oprettelse af kalendere. Oversigtskalender_Skabelon_Revideret 05_06.xls Vejledning Excel-skabelon til oprettelse af kalendere Oversigtskalender_Skabelon_Revideret 05_06.xls 20-03-2017 Out of date Vejledningen til makrosikkerhed er nok noget forældet i forhold til nyere versioner

Læs mere

Introduktion til FileMaker Pro 4.0/4.1

Introduktion til FileMaker Pro 4.0/4.1 1 Introduktion til FileMaker Pro 4.0/4.1 Hvad er en database? En database er en samling data, som er organiseret på en systematisk måde og er tilgængelig i digital form. Med andre ord er det en slags elektronisk

Læs mere

Sådan opretter du en elektronisk aflevering

Sådan opretter du en elektronisk aflevering Sådan arbejder du med opgaver i Gradebook/karakterbog Denne vejledning indeholder en detaljeret beskrivelse af hvordan du bruger gradebook/karakterbogen når du vil arbejde med opgaver og give karakterer

Læs mere

Åbn Paint, som er et lille tegne- og billedbehandlingsprogram der findes under Programmer i mappen Tilbehør. Åbn også Word.

Åbn Paint, som er et lille tegne- og billedbehandlingsprogram der findes under Programmer i mappen Tilbehør. Åbn også Word. 75 Paint & Print Screen (Skærmbillede med beskæring) Åbn Paint, som er et lille tegne- og billedbehandlingsprogram der findes under Programmer i mappen Tilbehør. Åbn også Word. 1. Minimer straks begge

Læs mere

Vistemmernu. Et webbaseret værktøj udviklet af Programdatateket i Skive. E-mail: programdatateket@viauc.dk Web: http://www.programdatateket.

Vistemmernu. Et webbaseret værktøj udviklet af Programdatateket i Skive. E-mail: programdatateket@viauc.dk Web: http://www.programdatateket. Vistemmernu Et webbaseret værktøj udviklet af Programdatateket i Skive E-mail: programdatateket@viauc.dk Web: http://www.programdatateket.dk Kolofon HVAL-vejledning Vistemmernu på HVAL.DK Forfatter: Susanne

Læs mere

SÅDAN BRUGER DU TEKST- BEHANDLING INTRODUKTION

SÅDAN BRUGER DU TEKST- BEHANDLING INTRODUKTION SÅDAN BRUGER DU TEKST- BEHANDLING INTRODUKTION I vejledningen bruger vi det gratis program Writer fra OpenOffice som eksempel til at vise, hvordan man bruger nogle helt grundlæggende funktioner i tekstbehandling.

Læs mere

Manual til Dynamicweb Februar 2010

Manual til Dynamicweb Februar 2010 Manual til Dynamicweb Februar 2010 Login... 2 Skabeloner og formater... 3 Filarkivet... 4 Lav en PDF... 5 Opret en ny side... 7 Navngiv siden... 9 Aktiver siden... 9 Sorter sider... 9 Flyt siden... 11

Læs mere

Startvejledning. Microsoft PowerPoint 2013 ser anderledes ud end tidligere versioner, så vi lavet denne guide for at gøre din læreproces nemmere.

Startvejledning. Microsoft PowerPoint 2013 ser anderledes ud end tidligere versioner, så vi lavet denne guide for at gøre din læreproces nemmere. Startvejledning Microsoft PowerPoint 2013 ser anderledes ud end tidligere versioner, så vi lavet denne guide for at gøre din læreproces nemmere. Find det du skal bruge Klik på en fane på båndet for at

Læs mere

Vejledning til brug af FirstClass

Vejledning til brug af FirstClass Vejledning til brug af FirstClass - opdateret januar 2013 Indhold Installation af FirstClass foretages kun første gang... 2 Hent FirstClass-klienten... 2 Installer FirstClass-klienten... 3 Ændre kodeord...

Læs mere

Vejledning. Excel-skabelon. til oprettelse af kalendere. Oversigtskalender_Skabelon_Revideret 05_01.xls

Vejledning. Excel-skabelon. til oprettelse af kalendere. Oversigtskalender_Skabelon_Revideret 05_01.xls Vejledning Excel-skabelon til oprettelse af kalendere Oversigtskalender_Skabelon_Revideret 05_01.xls 18-03-2017 Out of date Vejledningen til makrosikkerhed er nok noget forældet i forhold til nyere versioner

Læs mere

FC-intranet: FC-intranet er et fælles mail- og konferencesystem, hvor lærere og elever kan kommunikere.

FC-intranet: FC-intranet er et fælles mail- og konferencesystem, hvor lærere og elever kan kommunikere. IT-intro 9. august 2011 14:56 IT-introduktion på Risskov Gymnasium FC-intranet: FC-intranet er et fælles mail- og konferencesystem, hvor lærere og elever kan kommunikere. Før end man kan logge sig ind

Læs mere

MANUAL. Siteloom CMS

MANUAL. Siteloom CMS MANUAL Siteloom CMS www.hjerteforeningen.dk/cms Brugernavn: Password: 3. oktober, 2013 BASIS FUNKTIONER 1. Kalender... 4 1.a. Opret... 5 1.b. Rediger eller slet... 9 2. Sider...12 2.a. Opret side...13

Læs mere

IT-Brugerkursus. Modul 1 - Introduktion til skolens netværk og FC. Modul 1 - Introduktion til FC og Lectio. Printvenligt format. Indholdsfortegnelse

IT-Brugerkursus. Modul 1 - Introduktion til skolens netværk og FC. Modul 1 - Introduktion til FC og Lectio. Printvenligt format. Indholdsfortegnelse Modul 1 - Introduktion til FC og Lectio IT-Brugerkursus Modul 1 - Introduktion til skolens netværk og FC Printvenligt format Indholdsfortegnelse Formål og opbygning Opgave Vejledning til intranettet Åbne

Læs mere

Vejledning PROPHIX 11. Driftsbudgettering ved åbning af templates (Kun til Avanceret-brugere)

Vejledning PROPHIX 11. Driftsbudgettering ved åbning af templates (Kun til Avanceret-brugere) PROPHIX 11 Systemansvarlige Michael Siglev Økonomiafdelingen 9940 3959 msi@adm.aau.dk Daniel Nygaard Ricken Økonomiafdelingen 9940 9785 dnr@adm.aau.dk Vejledning (Kun til Avanceret-brugere) Opdateret:

Læs mere

Filupload LEJERBO.DK FILARKIV UNDER MØDER OSV. Upload filer til et eksisterende filupload-komponent

Filupload LEJERBO.DK FILARKIV UNDER MØDER OSV. Upload filer til et eksisterende filupload-komponent 1 Filupload Tips! Vi har forberedt nogle sider til dig med et filupload-komponent. Blandt andet siden Møder. På den måde kan du nemt uploade filer, fx referater, vedtægter eller husorden til jeres hjemmeside.

Læs mere

Få adgang til medieovervågningen

Få adgang til medieovervågningen Få adgang til medieovervågningen Som ansat har du mulighed for at modtage den daglige medieovervågning, som Forsvaret og Forsvarsministeriet abonnerer på. Medieovervågningen giver dig adgang til artikler

Læs mere

MANUAL. Siteloom CMS

MANUAL. Siteloom CMS MANUAL Siteloom CMS www.hjerteforeningen.dk/cms Brugernavn: Password: 3. september, 2012 BASIS FUNKTIONER 1. Kalender... 4 1.a. Opret... 5 1.b. Rediger eller slet... 8 2. Sider... 10 2.a Opret side...

Læs mere

IsenTekst Indhold til Internettet. Manual til Wordpress.

IsenTekst Indhold til Internettet. Manual til Wordpress. Manual til Wordpress Sådan opdaterer du din hjemmeside i Wordpress. Dette er en manual til de mest grundlæggende ting, så du selv kan redigere indholdet eller tilføje nyt på din hjemmeside. Guiden er skrevet

Læs mere

Oktober Dokumentpakker

Oktober Dokumentpakker Oktober 2017 Dokumentpakker Dokumentpakkerne er et værktøj til at udskrive dynamiske breve, som har en standardtekst i brevet, og hvor der automatisk sættes blandt andet patientens navn, adresse og aftaletid

Læs mere

Kom godt i gang med SMS fra Outlook

Kom godt i gang med SMS fra Outlook Grundlæggende funktionalitet Med SMS fra Outlook kan du enkelt sende både SMS, MMS og fax fra Outlook. Programmet er integreret med din personlige Outlook-kontaktliste, og gør afsendelse af meddelelser

Læs mere

Sonofon Erhverv. Kom godt i gang. med SMS fra Outlook Brugervejledning. 1107V01-93.010.014 gældende fra 29. oktober

Sonofon Erhverv. Kom godt i gang. med SMS fra Outlook Brugervejledning. 1107V01-93.010.014 gældende fra 29. oktober Sonofon Erhverv Kom godt i gang med SMS fra Outlook Brugervejledning 1107V01-93.010.014 gældende fra 29. oktober Grundlæggende funktionalitet Med SMS fra Outlook kan du enkelt sende både SMS, MMS og fax

Læs mere

Picto Selector. Lav dine egne symbolark. Version: August 2012

Picto Selector. Lav dine egne symbolark. Version: August 2012 Picto Selector Lav dine egne symbolark Version: August 2012 Indholdsfortegnelse Hvad er Picto Selector?...4 USB?...4 Hent programmet...4 Installer programmet på din computer...5 Picto Selector på USB...8

Læs mere

Manual til opsætning af Jit-klient version 2.0. Opsætning. Copyright Jit-Danmark ApS 2008. Find mere information på www.jitbesked.

Manual til opsætning af Jit-klient version 2.0. Opsætning. Copyright Jit-Danmark ApS 2008. Find mere information på www.jitbesked. Opsætning 1 Indholdsfortegnelse Sådan finder du indstillingerne...3 Generelt...5 Brugerstyring...6 Brugerstyring Enkeltbruger-system(standard)...7 Brugerstyring Flerbruger-system med Logon...8 Brugervedligeholdelse

Læs mere

Få din hjemmeside på internettet

Få din hjemmeside på internettet DEL DIN FÆRDIGE HJEMMESIDE MED HELE VERDEN: Afsnit 03 Dette nummer: Få din hjemmeside gjort færdig og læg den på nettet. Få din hjemmeside på internettet Når du er tilfreds med din hjemmeside, skal den

Læs mere

Vejledning i brug af dli dokumenthåndteringssystemet til virksomheder

Vejledning i brug af dli dokumenthåndteringssystemet til virksomheder Vejledning i brug af dli dokumenthåndteringssystemet til virksomheder Indhold Generelt... 1 Windows tidligere versioner... 1 Windows 10... 2 Apple Mac... 2 Log på... 2 Rediger dokumentet... 2 Tilføj et

Læs mere

At indsætte ord og billeder og brug af hjælpefunktionen.

At indsætte ord og billeder og brug af hjælpefunktionen. Udarbejdelse af kommunikationsbøger Noter og øvelser i forbindelse med at udarbejde kommunikationsbøger vha. programmet Phraseit (Genlyd). Følgende øvelser og instruktion er baseret på at Phrase-it 2.1

Læs mere

PC - installation af Maple 18 med GYM-pakken

PC - installation af Maple 18 med GYM-pakken PC - installation af Maple 18 med GYM-pakken Download først de relevante installere til både Maple 18 og til Gym-pakken, og placer dem et sted på din PC, hvor du kan finde dem igen. Hvis du højre-klikker

Læs mere

Introduktion til Orddatabasen

Introduktion til Orddatabasen Introduktion til Orddatabasen Skærmviste ordbanker udgør en nyttig teknik til at indføre elever i ordbehandling og skrivning ved hjælp af en computer. Børn lærer generelt at genkende ord, før de kan sammensætte

Læs mere

Genvejstaster til Windows

Genvejstaster til Windows Genvejstaster til Windows Selvom musen er et praktisk redskab, er den langt fra altid den hurtigste måde at styre computeren på. Ofte vil det være meget hurtigere at bruge genvejstaster. Hvis du sidder

Læs mere

DRFLive - dynamisk visning af resultater fra DRF Stævnesystem

DRFLive - dynamisk visning af resultater fra DRF Stævnesystem DRFLive - dynamisk visning af resultater fra DRF Stævnesystem Resumé: Beskrivelse af program (DRFLive) til dynamisk visning af resulter fra DRF Stævnesystem Forfatter: Claus Hulstrøm Dato: 15. januar 2010

Læs mere

OM STATISTIKBANKEN. 2002:6 December Om Statistikbanken nr. 6. Indhold i nr. 6:

OM STATISTIKBANKEN. 2002:6 December Om Statistikbanken nr. 6. Indhold i nr. 6: OM STATISTIKBANKEN 2002:6 December 2002 Om Statistikbanken nr. 6 Statistikbanken udkommer mandag den 9. december i et helt nyt design. Det er ikke kun Statistikbankens udseende, der er ændret, der er også

Læs mere

09/03 2009 Version 1.4 Side 1 af 37

09/03 2009 Version 1.4 Side 1 af 37 Login til DJAS Gå ind på adressen http://www.djas.dk I feltet Brugernavn skrives den e-mail adresse som brugeren er registeret med i systemet. I feltet Password skrives brugerens adgangskode. Ved at sætte

Læs mere

Afgrænsning/filtrering, sortering m.v. i Klienten

Afgrænsning/filtrering, sortering m.v. i Klienten Afgrænsning/filtrering, sortering m.v. i Klienten Afgrænsning/filtrering I det efterfølgende gennemgås de tre standard afgrænsnings-/filtrerings metoder i Prisme Klient: Avanceret filter Er den overordnede

Læs mere

Prøveeksempler 2012. ClinicCare. Web

Prøveeksempler 2012. ClinicCare. Web ClinicCare Web Prøveeksempler 2012 Hvem er ClinicCare? ClinicCare udvikles af firmaet Novolog, som siden 1995 har udviklet systemer til sundhedssektoren. Over 900 klinikker anvender idag ClinicCare. Det

Læs mere

MANUAL. Siteloom CMS

MANUAL. Siteloom CMS MANUAL Siteloom CMS www.hjerteforeningen.dk/cms Brugernavn: Password: 13. marts, 2014 BASIS FUNKTIONER 1. Kalender... 4 1.a. Opret... 5 1.b. Rediger eller slet... 9 2. Sider...12 2.a. Opret side...13 2.b.

Læs mere

Hvordan søger du i LARM.fm?

Hvordan søger du i LARM.fm? Hvordan søger du i LARM.fm? Før vi beskriver, hvordan du søger og arbejder i LARM.fm, vil vi først introducere, hvordan LARM.fm brugerinterfacet ser ud. I øverste venstre hjørne findes søgefeltet og nedenunder

Læs mere

mac - installation af Maple 2018 med SKOLE-pakken

mac - installation af Maple 2018 med SKOLE-pakken mac - installation af Maple 2018 med SKOLE-pakken Download først de relevante installere til både Maple 2018 og til Skole-pakken. De downloadede filer vil som standard havne i mappen Overførsler den har

Læs mere

Organisering af billeder.

Organisering af billeder. Organisering af billeder. Da du startede Picasa op for første gang, havde du mulighed for at scanne hele computeren igennem for billeder eller lade Picasa holde øje med nogle bestemte mapper (mine billeder,

Læs mere

Indhold Outlook Web App... 1

Indhold Outlook Web App... 1 Outlook Web App Outlook Web App (OWA) bruges til at håndtere e-mails og kalendere uden at skulle have Outlook klient programmet installeret. OWA kan bruges på en hvilken som helst computer, der har adgang

Læs mere

Kom godt i gang CD-ORD 8.3

Kom godt i gang CD-ORD 8.3 Kom godt i gang CD-ORD 8.3 CD-ORD Denne manual giver de mest nødvendige informationer om CD-ORD 8.3. Du kan finde en uddybende manual om programmet i CD-ORDs værktøjslinje. Hjælp i værktøjslinjen. Kom

Læs mere

TK/TBL / 25.08.2014 v.0.1. DigiMatch. Elektronisk Kamprapport

TK/TBL / 25.08.2014 v.0.1. DigiMatch. Elektronisk Kamprapport TK/TBL / 25.08.2014 v.0.1 DigiMatch Elektronisk Kamprapport 1 Procedure før kampstart... 3 DigiMatch download... 3 Registerniveau... 7 Indstillinger... 9 Login... 9 Tilpas knapperne... 10 Kampregistrering...

Læs mere

Manual til Kundekartotek

Manual til Kundekartotek 2016 Manual til Kundekartotek ShopPlanner Customers Med forklaring og eksempler på hvordan man håndterer kundeoplysninger www.obels.dk 1 Introduktion... 3 1.1 Formål... 3 1.2 Anvendelse... 3 2 Referencer...

Læs mere

Det nye husdyrgodkendelse.dk Sagsbehandlermodulet Fra ansøgning til godkendelse V. 1.0 28/4 2011

Det nye husdyrgodkendelse.dk Sagsbehandlermodulet Fra ansøgning til godkendelse V. 1.0 28/4 2011 2. Sådan kommer du fra ansøgning til godkendelse Før du kan komme i gang med at arbejde på en miljøgodkendelse, skal du have åbnet den tilhørende ansøgning. Det gør du enten ved at indtaste skemanummer

Læs mere

Søgninger. AOF Vejle-Fredericia Annemette Søgaard Hansen. Windows Vista Søgefunktionen side 1 af7

Søgninger. AOF Vejle-Fredericia Annemette Søgaard Hansen. Windows Vista Søgefunktionen side 1 af7 Windows Vista Søgefunktionen side 1 af7 Søgninger En af de smarte nyheder i Windows Stifinder er den dynamiske søgefunktion. Den bygger på en avanceret indeksering af brugerdokumenter, som hele tiden foregår

Læs mere

Huskesedler. Design og automatisering af regneark. Microsoft Excel 2013

Huskesedler. Design og automatisering af regneark. Microsoft Excel 2013 Huskesedler Design og automatisering af regneark Microsoft Excel 2013 Januar 2017 Knord Side 2 Indholdsfortegnelse Ark... 4 Beskyttelse... 6 Diagram... 7 Eksport af data... 8 Fejlretning i formler... 9

Læs mere

INDHOLDSFORTEGNELSE... 1 FORORD... 2 1. ORDBOGSVÆRKTØJET I VÆRKTØJSLINJEN... 3 2. ORDBOGEN... 3

INDHOLDSFORTEGNELSE... 1 FORORD... 2 1. ORDBOGSVÆRKTØJET I VÆRKTØJSLINJEN... 3 2. ORDBOGEN... 3 Ordbogsværktøjet 1.0 Indholdsfortegnelse INDHOLDSFORTEGNELSE... 1 FORORD... 2 1. ORDBOGSVÆRKTØJET I VÆRKTØJSLINJEN... 3 2. ORDBOGEN... 3 MINIMER OG LUK... 3 SØGEFELT... 4 SØGERESULTAT... 4 Resultater...

Læs mere

5.0 Velkommen til manualen for kanalen HTML-grab Introduktion til kanalen HTML-grab kanalside Hvad er et spot?

5.0 Velkommen til manualen for kanalen HTML-grab Introduktion til kanalen HTML-grab kanalside Hvad er et spot? 5.0 Velkommen til manualen for kanalen HTML-grab 1 5.1 Introduktion til kanalen 1 5.2 HTML-grab kanalside 1 5.2.1 Hvad er et spot? 2 5.2.2 Opret et nyt spot 2 5.2.3 Aktivt og inaktivt spot 3 5.2.4 Rediger

Læs mere

Først skal du oprette dig i systemet, d. v. s. du skal have en såkaldt Googlekonto bestående af en mailadresse og et kodeord.

Først skal du oprette dig i systemet, d. v. s. du skal have en såkaldt Googlekonto bestående af en mailadresse og et kodeord. Gmail Indhold Indhold...1 Introduktion...2 Opret dig i systemet...2 At skrive mails...5 Sende en mail til flere personer...8 Vedhæfte en fil...9 Kladde...10 Signatur...11 Modtagne mails...12 Stjernemarkering...14

Læs mere

Fable Kom godt i gang

Fable Kom godt i gang Fable Kom godt i gang Opdateret: 26-03-2018 Indholdsfortegnelse 1. Først skal du installere programmet på din computer 3 2. Når programmet er installeret er du klar til at pakke robotten ud 4 3. Nu er

Læs mere

SÅDAN BRUGER DU REGNEARK INTRODUKTION

SÅDAN BRUGER DU REGNEARK INTRODUKTION SÅDAN BRUGER DU REGNEARK INTRODUKTION I vejledningen bruger vi det gratis program Calc fra OpenOffice som eksempel til at vise, hvordan man bruger nogle helt grundlæggende funktioner i regneark. De øvrige

Læs mere

FORMATERING AF REGNEARK

FORMATERING AF REGNEARK FORMATERING AF REGNEARK Indtil nu har vi set på, hvordan du kan udføre beregninger i dit regneark, og hvordan du kan redigere i regnearket, for hurtigt at få opstillet modellerne. Vi har derimod overhovedet

Læs mere

Selene brugervejledning

Selene brugervejledning Selene brugervejledning F2 : Åbner en oversigt med data for det aktive felt. F3: Gemmer data i det aktive vindue Salgsordre : Bruges til oprettelse af Ordre/Arbejdskort/Fakrura Debitor: Debitorregister,

Læs mere

WebLager brugervejledning. Vælg: Generel. Esbjerg Kommune. Version Opdateret af Solveig Ketelsen

WebLager brugervejledning. Vælg: Generel. Esbjerg Kommune. Version Opdateret af Solveig Ketelsen WebLager brugervejledning WebLager brugervejledning Vælg: Generel Esbjerg Kommune Version 2.03 Opdateret 2018-04-16 af Solveig Ketelsen WebLager brugervejledning Generel brugervejledning Indholdsfortegnelse

Læs mere

Download, installation og ibrugtagning af CQ

Download, installation og ibrugtagning af CQ Download, installation og ibrugtagning af CQ 1. Download og installation 2. Grundlæggende opsætning af CQ 3. Opdatering af CQ herunder registrering af CQ og licenser (3.12) 4. Opsætning af CQ til netværk.

Læs mere

E-MAIL G-MAIL (GOOGLE)

E-MAIL G-MAIL (GOOGLE) E-MAIL G-MAIL (GOOGLE) Erik Thorsager, Esbjerg. 3. udgave: G-mail Side 1 G-mail E-mail: Det engelske ord mail betyder post. E står for elektronisk. E-mail betyder altså elektronisk post. Elektronisk post

Læs mere

Velkommen til Electro Energy s Prisprogram

Velkommen til Electro Energy s Prisprogram Velkommen til Electro Energy s Prisprogram Denne guide hjælper dig igennem installationen fra download via vores hjemmeside til du kan køre programmet og søge i vores varenumre. Programmet er designet

Læs mere

Manual til hjemmeside i Typo3

Manual til hjemmeside i Typo3 Manual til hjemmeside i Typo3 Gode tips og genvejstaster Ét linieskift Ctrl + A Ctrl + C Ctrl + X Ctrl + V shift + enter (tasten du normalt bruger til linieskift) Markér alt Kopier Klip Sæt ind Oprettelse

Læs mere

Hvordan afspilles/vises materialet i LARM.fm

Hvordan afspilles/vises materialet i LARM.fm Hvordan afspilles/vises materialet i LARM.fm Når du har lært de mange måder, hvorpå det er muligt at søge i LARM.fm s materiale, er det relevant at vide, hvilke muligheder du har for at afspille radio-

Læs mere

Edb-tekstbehandling, præsentation mm

Edb-tekstbehandling, præsentation mm Edb-tekstbehandling, præsentation mm I denne lektion skal du: - hente kopier et skærmbillede og sætte det ind i et dokument - beskære billedet, så det passer til dit dokument Der findes specielle programmer

Læs mere

Vejledning til Politikens Retskrivnings- og Betydningsordbog

Vejledning til Politikens Retskrivnings- og Betydningsordbog Vejledning til Politikens Retskrivnings- og Betydningsordbog INDHOLD VALGMULIGHEDER UNDER MENUEN FILER UDSKRIV KOPIER AFSLUT VALGMULIGHEDER UNDER MENUEN SØGEMULIGHEDER OPSLAGSORD ORDFORBINDELSER AL TEKST

Læs mere

Login og introduktion til SEI2

Login og introduktion til SEI2 BRUGERVEJLEDNING 2019 Login og introduktion til SEI2 Sundhedsdatastyrelsens Elektroniske Indberetningssystem Forord Dette er en brugermanual (1. udgave), der teknisk beskriver, hvordan man logger på Sundhedsdatastyrelsens

Læs mere

SKYPE FOR BUSINESS QUICK CARDS KOM GODT I GANG MED SKYPE FOR BUSINESS

SKYPE FOR BUSINESS QUICK CARDS KOM GODT I GANG MED SKYPE FOR BUSINESS SKYPE FOR BUSINESS QUICK CARDS KOM GODT I GANG MED SKYPE FOR BUSINESS . Indstillinger.. Installer Skype for Business på din computer.. Basis-indstillinger.. Indstil og skift headset og webcam.. Statusvisning

Læs mere

Vejledning til opbygning af hjemmesider

Vejledning til opbygning af hjemmesider Side 1 af 9 Vejledning til opbygning af hjemmesider Hvis du er inde på din klubs hjemmeside, fx på forsiden, kan du nu gå i gang med at redigere. For at få redigeringsværktøjet frem, skal du klikke på

Læs mere

Kom godt i gang med I-bogen

Kom godt i gang med I-bogen Kom godt i gang med I-bogen At åbne bogen Det allerførste, du skal gøre, for at kunne arbejde med i-bogen, er at aktivere den. Det gøres ved at oprette en konto på systime.dk og derefter aktivere bogen

Læs mere

Zotero er et smart værktøj til at få styr på dine referencer og litteraturlister. Zotero er gratis og på dansk.

Zotero er et smart værktøj til at få styr på dine referencer og litteraturlister. Zotero er gratis og på dansk. 1 Indhold: Hvorfor Zotero?... 3 Installation... 3 Firefox... 3 Installation af Zotero... 3 Registrer dig som bruger af Zotero... 4 Zotero oversigt over programmet... 4 Tilføj referencer manuelt... 5 Eksempel

Læs mere

Opret en side/artikel og rediger din side

Opret en side/artikel og rediger din side 1 Opret en side/artikel og rediger din side Tips! Når du skal opbygge din hjemmeside og oprette sider og lægge indhold ind, så kig her. Nogle gange har vi oprettet nogle sider på forhånd, andre gange skal

Læs mere

Kom i gang med... Kapitel 12 Arbejde med skabeloner. OpenOffice.org

Kom i gang med... Kapitel 12 Arbejde med skabeloner. OpenOffice.org Kom i gang med... Kapitel 12 Arbejde med skabeloner OpenOffice.org Rettigheder Dette dokument er beskyttet af Copyright 2005 til bidragsyderne som er oplistet i afsnittet Forfattere. Du kan distribuere

Læs mere

Den digitale Underviser. Clouds. Dropbox

Den digitale Underviser. Clouds. Dropbox Den digitale Underviser Clouds Dropbox Indhold Indhold... 1 Dropbox... 1 Installer Dropbox... 2 Åbn Dropbox fra egen computer... 2 Åbn Dropbox fra en anden computer... 3 Lagre filer i Dropbox (offline

Læs mere

E-MAIL WINDOWS LIVE MAIL

E-MAIL WINDOWS LIVE MAIL E-MAIL WINDOWS LIVE MAIL Erik Thorsager, Esbjerg. 3. udgave: Live Mail Side 1 Windows Live Mail Hvordan skriver og sender jeg en e-mail? Det engelske ord mail betyder post. E står for elektronisk. E-mail

Læs mere

KMD Brugeradministration til Navision og LDV

KMD Brugeradministration til Navision og LDV KMD Brugeradministration til Navision og LDV Vejledning for Statens Administration og ØSC institutioner. Opdateret 09-09-2015 Indholdsfortegnelse 1 Kom godt i gang... 2 1.1 Login til KMD Brugeradministration...

Læs mere

I denne manual kan du finde en hurtig introduktion til hvordan du:

I denne manual kan du finde en hurtig introduktion til hvordan du: VORES NORDSJÆLLAND HURTIGT I GANG MANUAL 01: Bruger HVAD INDEHOLDER DENNE MANUAL? I denne manual kan du finde en hurtig introduktion til hvordan du: 1. Finder Vores Nordsjælland hjemmesiden 2. Opretter

Læs mere

Brugervejledning til Tildeling.dk For superbrugere - Udbyder

Brugervejledning til Tildeling.dk For superbrugere - Udbyder Brugervejledning til Tildeling.dk For superbrugere - Udbyder Opdateret den 15. november 2017 Side 1 af 20 Indholdsfortegnelse 1 Formål... 4 2 Adgang... 4 3 Menu... 4 3.1 Ret mine data... 4 3.2 Opret opgave...

Læs mere