Automatisk analyse af Zaccos og Ankiros tekstmateriale

Størrelse: px
Starte visningen fra side:

Download "Automatisk analyse af Zaccos og Ankiros tekstmateriale"

Transkript

1 Automatisk analyse af Zaccos og Ankiros tekstmateriale Bart Jongejan, Bolette S. Pedersen, Costanza Navarretta VID-rapport nr. 3 Center for Sprogteknologi 2004

2 Center for Sprogteknologi 2003 Rapporten kan fås ved henvendelse til CST, eller hentes fra CST s hjemmeside VID-projektet er støttet af Center for Informationsteknologi (nu overgået til Forskningsstyrelsen). II

3 Om VID: Viden- og Dokumenthåndtering med sprogteknologi Der er et udtalt behov hos danske virksomheder for at kunne supplere deres eksisterende sproglige kompetence og viden med sprogteknologiske IT-værktøjer og metoder som dels kan støtte medarbejderne, dels forankre viden og processer i virksomhedens ITsystemer, dels danne grundlag for den udvikling der kræves hvis virksomhederne skal overleve og vokse i den stadigt mere globaliserede økonomi. VID-projektet er et forsknings- og udviklingsprojekt der har til formål at udforske de forskellige muligheder som sprogteknologi frembyder inden for informationssøgning og dokumentproduktion, og at understøtte de deltagende virksomheder i at udvikle værktøjer til bedre udnyttelse af egen viden, samt til bedre og mere effektiv produktion af dokumentation, herunder flersproget dokumentation. Foruden CST omfatter projektet på den ene side virksomhederne Bang & Olufsen A/S, Zacco A/S og Nordea A/S, som i dette projekt udgør teknologiens brugere, på den anden Navigo Systems A/S og Ankiro, som er teknologiproducenter. Projektet omfatter følgende forskningsopgaver: analyse af de tekstuelle data virksomhederne skal kunne håndtere for at kunne fastlægge tesauruser/ontologier for de relevante semantiske domæner, undersøgelse af den bedst egnede formalisme/teknologi til at udtrykke disse; afdækning og videreudvikling af sprogteknologiske komponenter til brug for automatisk tekstklassifikation og begrebsorienteret informationssøgning, indbefattende tilpasning af sprogteknologiske 'basismoduler' til opmærkning af tekst; udforskning af flertydighed i tekstuelle data som kan vanskeliggøre informationssøgning; ligeledes den omvendte problematik: at samme indhold kan udformes forskelligt rent sprogligt og derfor kan være svær at fremfinde i store datamængder; forskning inden for kontrolleret sprog - også set i et flersproget perspektiv - til brug for dokumentproduktion; herunder analyse af den sprogstil og tone som virksomhederne ønsker at anvende, samt opstilling af modeller for dette sprog; undersøgelse af hvilke sprogteknologiske metoder der kan anvendes til denne kvalitetssikring af dokumentproduktionen i form af f.eks. termstyring og grammatikkontrol. Projektet er støttet af Center for IT-forskning og løber i perioden III

4

5 Indhold 1 Indledning Facts om teksterne Zaccos tekster Zaccos standardtekster Zaccos varemærketekster Ankiros tekster Processering af teksterne Zaccos tekster Konvertering til flad tekst Ordklassebestemmelse Opbygning af korpusser Ankiros tekster Konvertering til tokenliste Ordklassebestemmelse (Brill) Parsing (Cass) Kollationering Generering af output Semiautomatisk produktion af termlister Automatisk processering af lister Supplering af termlister Evaluering Identifikation af tekststumper Konklusion og fremtidigt arbejde Evaluering af den automatiske analyse Videre arbejde med Zaccos materiale Videre arbejde med Ankiros materiale...22 Referencer...25 Bilag A Parole tags...a-1 Bilag B Cass-grammatik...B-1 V

6

7 1 Indledning Denne VID-rapport omhandler automatisk analyse af det tekstmateriale som CST har modtaget i relation til delprojektet om ontologi og søgning fra to af de deltagende virksomheder i VID: Zacco A/S og Ankiro. Som nævnt i det indledende afsnit om VIDprojektet udgør Zacco som IPR-virksomhed en såkaldt bruger i projektet, dvs. at de har et konkret sprogteknologisk behov: virksomheden ønsker at opbygge en videnbase indenfor sagsbehandling af patent- og varemærkesager således at dokumentproduktion og vedligeholdelse kan blive mere effektiv, og således at der kommer et bedre videnflow i virksomheden. Til dette formål har de bl.a. brug for at få afdækket deres fagterminologi og opstillet denne i en struktureret form, gerne i form af en ontologi. Zaccos standarddokumenter til sagsbehandling danner udgangspunkt for dette arbejde. Ankiro er derimod en teknologiudviklervirksomhed som bl.a. arbejder med at udvikle intelligente søgemaskiner. Et af deres mål som deltagere i VID-projektet er at undersøge nogle sprogteknologiske metoder i forbindelse med nogle meget specifikke, ontologisk relaterede problemer så som hvordan man automatisk kan identificere synonymer og synonyme udtryk; altså udtryk der refererer til samme begreb. I denne rapport fokuseres der på en meget specifik problemstilling i relation til dette, nemlig sammensatte ord og søgefunktionaliteten i relation til dette. Det er et kendt problem at det kan være vanskeligt at søge på sammensatte ord fordi disse typisk har mange alternative udtryksformer; udtryksformer som har samme semantiske indhold. Om man siger byrådsmedlem eller medlem af byrådet, husholdningsaffald eller affald fra husholdninger er altså mere eller mindre underordnet; udtrykkene er parvis synonyme. Men søger man på byrådsmedlem vil man med en almindelig søgemaskine kun få fremfundet tekster hvor lige præcis det sammensatte ord forekommer, og det betyder at søgemaskinens recall bliver relativt lavt 1 ; der er altså højst sandsynligt mange relevante tekster der ikke bliver fundet. Virksomheden er derfor interesseret i at få undersøgt hvilke sprogteknologiske analyser der kan være med til at bestemme om hits med splittede 2 sammensatte ord er gode eller dårlige. De har derfor leveret to korpora bestående af en række tekstudsnit i form af søgehits som er fremkommet ved at man har splittet sammensatte ord og søgt på disse. I stedet for at søge på byrådsmedlem har man altså søgt på byråd og medlem. En af de grundlæggende hypoteser for de sprogteknologiske analyser har været at hits hvor begge søgeord var at finde inden for den samme navnefrase, sandsynligvis var gode hits som skulle prioriteres relativt højt. Rapporten består af 4 kapitler udover indledningen. Kapitel 2 omhandler faktuelle data om teksterne, mens kapitel 3 omhandler den automatiske processering af teksterne som er foregået på CST (bl.a. tokenisering, tagging og parsing). I kapitel 4 berettes om den 1 Hvis en given database antages at indeholde i alt 50 dokumenter, der kan karakteriseres som værende relevante i forhold til en forespørgsel, og samme forespørgsel fremfinder alle 50 dokumenter, så har den en recall på 1. Hvis der kun fremfindes 10 af de 50 relevante dokumenter, så er recall på 10/50=0,2, hvilket omvendt betyder 0,8 (80%) af de relevante dokumenter ikke blev fundet, og derfor stadigvæk er ukendte for brugeren (http://www.pce-web.dk/search/size.htm). 2 Medlem af byrådet opfattes altså i denne sammenhæng som splittet. 1

8 semiautomatiske produktion af termlister, mens vi i kapitel 5 rapporterer om arbejdet med identifikation af tekststumper i Zaccos materiale. I kapitel 6 konkluderer vi på det udførte arbejde og diskuterer hvilke manuelle analyser af data som forestår. 2

9 2 Facts om teksterne 2.1 Zaccos tekster Zaccos tekster er en slags halvfabrikater. Noget af teksterne vil bogstaveligt stå i en endelig tekst, mens andre dele af teksterne snarere er forfatterhjælp, som kan tage mange former: 1) Som inputfelt (En grå boks uden eller med tekst, som forsvinder ved input fra tastaturet og erstattes af den indtastede tekst.) a. Et felt med forklarende tekst af feltens indhold, fx Dato: XX måned XXXX b. Et tomt felt uden forklarende tekst, fx I henhold til Deres instruktioner af har vi den indleveret ovennævnte patentansøgning med prioritet fra patentansøgning af. c. Et tomt felt med forklarende tekst som kommentar, fx 2) Som kommentar a. I parenteser, fx til brugen af ovennævnte varemærke i Danmark (angiv evt. mere begrænset geografisk område) i forbindelse med (angiv varer/tjenesteydelser eller all goods/services covered by the registration). (Vores kommentarer) Vi imødeser Deres snarlige kommentarer og instruktioner inden fristens udløb den Bemærk at tekst i parenteser ikke nødvendigvis er kommentar. b. Ikke i parenteser, fx Vedlæg overdragelsesdokument(er) til underskrivning eller ryk for oplysninger om ansøger(e) og opfinder(e) Vedlæg andre eventuelle bilag 3) Som et valg a. Mellem alternative termer adskilt med skråstreg 3

10 i. Uden blanktegn omkring skråstreg sagsøger/sagsøgte ii. Med blanktegn omkring skråstreg overdragelsen / navneændringen / adresseændringen b. Mellem alternative dele af termer adskilt med skråstreg i. Med bindestreg Navne-/adresseændring i EF-varemærkeansøgning/- registrering ii. Uden bindestreg at notere navne/adresseændringen i EFvaremærkeregisteret c. Ved hjælp af en valgfri tilføjelse, fx (bemærk at e et i (e) ikke er valgfrit, medmindre man erstatter følgende med en!): fra følgende national(e) registrering(er) i forbindelse med ovennævnte EF-varemærke Nogle gange er det svært for en udenforstående at afgøre om tekst skal tages bogstaveligt eller opfattes som forfatterhjælp, jvf. denne formular som måske kun kræver indtastning af felterne, mens teksten, parenteser inklusive, skal forblive uændret: Ordrebekræftelse - Dansk grundansøgning... Indleveringsdata Ansøger(e): Navn: Adresse: Oplysninger vedrørende ansøger(e) (navn og adresse) bedes fremsendt hurtigst muligt Bilag Vedlagte overdragelseserklæring(er) bedes underskrevet som anført og returnet 4

11 til undertegnede hurtigst muligt og senest inden indleveringen af ansøgningen Overdragelseserklæring(er) til underskrivelse vil blive fremsendt, når vi har modtaget de nødvendige oplysninger fra Dem Zaccos standardtekster Denne samling omfatter 202 Word (DOC) filer i 25 undermapper af 9 mapper og er modtaget I alt er der ord. Sproget er dansk. Der var problemer ved modtagelse pr. Filerne blev modtaget i ca. 30 s. Nogle forsendelser blev dog kaldt tilbage. Dokumentnavnene indeholdt ingen mappespecificering. Da det viste sig at mange dokumenter havde samme navn, var det nødvendigt manuelt at oprette en mappestruktur for at undgå at dokumenter overskrev hinanden. Disse problemer kunne have været undgået ved at Zippe alle dokumenter i én zipfil før forsendelsen. Et sådant Zip-arkiv af alle dokumenter fylder 920 KB, mens dokumenterne tilsammen fylder 5,63 MB Zaccos varemærketekster Denne pulje består af 76 filer i én mappe, modtaget Format: Microsoft Word skabelon (DOT). Problemer ved modtagelse: 1) Én fil optrådte to gange (AS400 VEJLEDNING.dot) i forsendelsen. Der kunne være tale om to forskellige filer. (Se forrige afsnit.) 2) Det var umuligt (eller i hvert fald svært) at konvertere skabelonerne til RTF filer. Zacco sendte os et nyt sæt filer, denne gang i DOC format. Der var igen problemer ved modtagelsen. 1) Filnavnene på mange af dokumenterne var forvansket af mailsystemet. Selve mail-filen havde et format der indeholdt fejl på grund af dokumenternes filnavne. Først efter manuel redigering af mail-filen kunne dokumenterne pakkes ud. 2) To dokumenter optrådte to gange i forsendelsen: CTM - Rapport klient vedr notering af navne-adresseændring og Konflikt - Told og skat - anm om 10 dages suspension. Se tidligere problembeskrivelse. 5

12 3) Forsendelsen indeholdt ikke alle tekster som var med i den første forsendelse: AS400 VEJLEDNING manglede. Efter fjernelse af dubletter indeholdt det anden sæt ord i 74 filer. Sproget er dansk. 2.2 Ankiros tekster Vi har modtaget 3 filer: 1) vid_data.zip Denne fil indeholder en flad tekstfil vid_data.txt på KB 2) vid_data1.zip Denne fil indeholder en flad tekstfil vid_data1.txt på KB 3) vid_data1.zip Denne fil indeholder en flad tekstfil vid_data1.txt på KB Filerne har samme opbygning. Hver fil indeholder et antal søgespecifikationer, efterfulgt af hittene for hver søgning. Den sidste version af vid_data1.zip indeholder resultaterne for 1044 søgninger og i alt resultater. En søgespecifikation ser således ud: <WORD>dataadministration administration data</word><count>363</count> Resultaterne vises i to kolonner, ét søgeresultat per række: Liste over <T9>data</T9> grupper. DataGroupList (<T9>Administration</T9>) Hjælp til nr Redigering af specifik <T9>data</T9> gruppe. DataGroupEdit (<T9>Administration</T9>) Hjælp til nr sektor. Den omfattende anvendelse af IT i kommunernes <T9>administration</T9> tilvejebringer masser af <T9>data</T9> og informationer - men systemerne er ofte lavet med Normalt indeholder et søgeresultat to markerede ord. Markeringen sker ved hjælp af sgml tags <Tn> </Tn>, n = Jo højere n, jo bedre er resultatet. Et søgeresultat er en stump tekst som indeholder søgeordets komponenter eller synonymer deraf. Stumpen er valgt således at teksten før det første markerede ord indeholder cirka lige så mange ord som teksten efter det andet markerede ord. Med andre ord: resultatet er centreret omkring det markerede ordpar. Nogle resultater indeholder færre eller flere end to markerede ord. Forskellene mellem vid_data.txt og vid_data1.txt er, at vid_data1.txt er meget større, at søgeresultaterne indeholder mere tekst og at der ikke ekspanderes til synonymer. I den første version af vid_data1.txt var der nogle fejl: de taggede ord var ikke altid centreret 6

13 og mange resultater indeholdt ikke markerede ord. Det viste sig at der var lavet fejl ved genereringen af vid_data1.txt, hvorfor vi senere modtog en forbedret udgave. 7

14 3 Processering af teksterne 3.1 Zaccos tekster For at få overblik over Zaccos tekster er det nødvendigt at have et repræsentativt tekstkorpus til rådighed. Ved hjælp af et korpus og et passende søgeprogram kan man hurtigt og nøjagtigt fastslå hvordan en given term bruges i Zaccos eksisterende dokumenter, fx hvor ofte termen bruges, og om den bruges i mere end én betydning. Zacco forsynede CST med et stort antal dansksprogede tekster. Disse tekster blev konverteret til flade tekster (dokumenter kun indeholdende bogstaver, mellemrum og læsetegn, blottet for afsnits- og tekstformatering og billeder). De flade tekster blev behandlet af et program som bestemmer ordklassen for hvert ord. Tekst og ordklassebestemmelserne blev derefter lagt sammen i et tekstkorpus som er tilgængelig for diverse søgeprogrammer. Ydermere brugte vi førnævnte analyseværktøj til at lave rå analyser af teksterne Konvertering til flad tekst For at kunne bestemme et ords ordklasse er det nødvendigt at arbejde på både ord- og sætningsniveau. For et computerprogram er det ikke altid ligetil at bestemme hvor et ord starter og slutter. Problemet er endnu større ved bestemmelsen af start og slut på en sætning. Normalt kan et program nøjes med at søge efter blanktegn og punktummer, men det er ikke altid nok. Fx afslutter et punktum normalt en sætning, men det kan også være en del af en forkortelse. Og nogle sætninger slutter ikke med et punktum, fx overskrifter. Ved konvertering fra et dokument med lay-out oplysninger til et dokument uden disse er det derfor vigtigt at udnytte lay-out oplysninger til bestemmelse af ord- og sætningsgrænserne, før lay-out oplysningerne bliver fjernet. Fx kan overskrifter normalt kendes ved at de er sat i en anden skrifttype eller skriftstørrelse end brødteksten. Særdeles svære er bullets. Disse er symboler hvorom det kan siges at de står forrest på en linje og gentages mindst én gang, men udformningen kan variere fra specielle tegn til kombinationer af tegn som også bruges andre steder, fx en bindestreg efterfulgt af et blanktegn. Og det står hen i det uvisse om bullets skal bibeholdes i den flade tekst, og hvis ja, om de skal repræsenteres på en ensartet måde. Det viste sig at standardapplikationer som kan konvertere fra DOC format til flad tekst (TXT), ikke selv er i stand til at opdele teksten i sætninger. Ej heller var det muligt, på grund af tabt lay-outinformation, at opdele teksterne i sætninger ved en efterbehandling. Derfor udviklede vi et program som kan konvertere RTF-tekster til flad tekst - med én sætning per linje. RTF er et format som de anvendte dokumentformater kan konverteres til med bibeholdelse af det meste af relevant lay-out. Samtidig er RTF en åben standard, om end med en komplicerende udviklingshistorie på bagen. Konverteringsprogrammet løser problemet med punktummer som afslutter en forkortelse ved at slå kandidatforkortelser op i en liste af kendte forkortelser-med-punktum. Programmet er også i stand til at spotte flerordsenheder ved hjælp af opslag i en ekstern liste. 8

15 3.1.2 Ordklassebestemmelse Vi brugte et offentligt tilgængeligt værktøj til at bestemme ordenes ordklasse, Eric Brills POS-tagger 3 (POS = Part Of Speech). Vi har ændret programmet for bedre at håndtere overskrifter og ord som starter med stort bogstav. POS-taggeren tager flad tekst som input, med én sætning per linje og alle ord og tegn adskilt med blanktegn. Til tagging af Zaccos tekster brugte vi denne tagger med CST s egne danske lingvistiske resurser. 4 Taggeren fungerer forholdsvis dårligt med Zaccos tekster på grund af de mange felter, indføjede kommentarer og valgmuligheder. Vi har ikke forsøgt at lave en intelligent behandling af disse støjkilder. Problemet er at vi ikke ved hvad man skal stille op med fx EF-varemærkeansøgning/-registrering for at tilfredsstille både taggeren, parseren og de værktøjer som skal kigge nøjere på de anvendte termer. Og hvad kan man gøre ved en ugrammatisk sætning som følgende? I henhold til Deres instruktioner af har vi den indleveret ovennævnte patentansøgning med prioritet fra patentansøgning af. Det kræver en mere avanceret tagger end Brill s at tage højde for huller og valgmuligheder i teksten. De mest frekvente problemer med den automatiske processering skyldtes følgende fænomener: Filnavne (som også indgår i dokumenterne) indeholder blanktegn, parenteser og kommaer samt danske bogstaver. De første tre typer tegn må ikke bruges i filnavne i UNIX. Danske bogstaver kan anvendes, men kræver tilpasning af visse UNIX-programmer. Dokumenterne indeholdt en del engelske ord og termer som bliver behandlet som danske ord. Forkortelser af typen dokument(er) og ord- i ord- og termbase, samt alternationer som rapport/dokument/brev bliver behandlet som enkelte tokens. Kun nogle forkortelser, som blev anvendt i dokumenterne, bliver genkendt i den anvendte tokeniser. Det samme gælder flerordstermer (både på engelsk og på dansk). Tegn - blev nogle gange genkendt som tegn, andre gange som del af ord. Sekvenser af flere punktummer. bliver ikke genkendt på en korrekt måde

16 De oprindelige word-dokumenter indeholdt en del sektionsnavne, tabeller og punktopstillinger som, konverteret til tekstfiler, er resulteret i usædvanlige rækkefølger af ord. Da taggeren er trænet på regelmæssige sætninger, behandles disse ordrækker som sætninger. Dette resulterer i opmærkningen med forkerte tags. Ord der startede med store bogstaver bliver i de fleste tilfælde tagget som proprier, mens nogle proprier ikke bliver genkendt korrekt. Dokumenterne indeholder en del imperativer, som ikke bliver genkendt korrekt af taggeren (trænet på andre typer konstruktioner) Opbygning af korpusser De flade, POS-taggede tekster er blevet kopieret efter hinanden i store filer, én fil for standardteksterne og én fil for trademarkteksterne. Disse store filer er blevet lagt ind i et søgesystem, XKWIC. Programmet gør det muligt at søge på ord, men også avancerede søgestrenge, indeholdende (dele af) ord, jokertegn og ordklasser, er mulige. Resultatet af søgningen vises som en konkordans, hvilket vil sige at man får en liste af alle tekstdele hvori søgemønstret forekommer, med søgemønstret i midten af resultatvinduet, omgivet af konteksten af ordet. Men kan vælge at få vist hvilken ordklasse ordene tilhører og fra hvilke dokumenter linjerne stammer. 10

17 Via internettet med brug af passwords kan man søge i Zaccos korpusser med en forenklet udgave af XKWIC Ankiros tekster Formålet med processeringen af Ankiros tekster var at finde ud af hvordan de markerede ord forholdt sig til hinanden, set fra en syntaktisk synsvinkel. Især ville vi undersøge om hits med begge søgeord i samme NP generelt var bedre hits end de øvrige. For at undersøge dette var det nødvendigt at POS-tagge og parse søgeresultaterne. Vi stødte på følgende komplikationer: 5 11

18 1) Søgeresultaterne bestod normalt ikke af hele sætninger, men af en, fra en syntaktisk synsvinkel set, vilkårlig sekvens af n ord, hvor n er et antal som var næsten ens for næsten alle søgeresultater. (20 for vid_data.txt, ca 40 for vid_data1.txt). Både POS-taggeren og parseren kunne have problemer med sætninger som manglede starten og/eller slutningen. 2) <Tn> og </Tn> markeringerne skulle ikke tagges. Da Brill s tagger ikke kan lade disse markeringer være uberørt, men prøver at tagge dem, var det nødvendigt at fjerne markeringerne, tagge, parse teksten, og genindsætte markeringerne. Det sidste var det svære. 3) Tallene i den første kolonne, som ellers ville have været en fin identifikator på et søgeresultat, skulle ikke tagges og måtte derfor fjernes. 4) Efter at <Tn>- og </Tn>-markeringerne og tallene var fjernet og før taggeren skulle processere teksten, var det nødvendigt at tokenisere teksten og opbryde teksten således at to sætninger ikke stod på samme linje. Ved tokenisering blev nogle ord delt op, fx.svar.. + Svar +.. Andre ord blev derimod føjet sammen, fx i form af i_form_af. Egentlig burde også følgende sammenføjninger ske: m. + fl. m.fl., Det var den anvendte tokeniser dog ikke i stand til. Disse opdelinger og sammenlægninger gjorde det meget svært senere at indsætte <Tn> og </Tn> markeringerne de rigtige steder: hvad der oprindeligt stod i teksten var der ikke mere, mens tekstens identitet netop var det eneste der kunne afgøre hvor markeringerne skulle sættes ind. Man kunne fx ikke bruge antallet af ordseparatorer (blanktegn) fra starten af sætningen til at bestemme markeringernes position. Problemet af kollationeringen (sammenfletningen) af søgeresultaterne med markeringer på den ene side og den taggede og parsede tekst på den anden, blev endnu større på grund af opdelingen af linjerne i sætninger, for dermed mistede vi også muligheden for at synkronisere på basis af linjenummer. Det betød at kollationeringen når den røg af sporet kunne have svært ved at komme på sporet igen. 5) Nogle specielle tegn optrådte ikke direkte i teksterne, men som en kode bestående af flere tegn, fx står for. For at undgå at forvirre taggeren i dens morfologiske analyse er det generelt nødvendigt at foretage en konvertering fra koden til selve tegnet. Uheldigvis manglede det sidste tegn (semikolon) nogle gange i en kode når den stod i slutningen af en linje. Det skulle der tages højde for. 6) Nogle søgeresultater manglede af ikke kendte årsager markeringer. Dette gjaldt den første version af vid_data1.txt. I den anden version var problemet løst. 12

19 3.2.1 Konvertering til tokenliste Kun linjerne med søgeresultater skulle analyseres, mens linjerne med søgeordene ikke skulle berøres. Derfor fik linjerne med søgeresultater en behandling som gjorde dem egnede til det næste trin i processeringen: tallet i starten af linjen og markeringerne i resultatteksten blev fjernet, og koder som udtrykker specielle tegn blev konverteret til disse tegn. Den resulterende tekstfil blev overført til CST s tokeniser. Tokeniseren tog sig også af flerordsenheder. Flerordsenheder som i alt opfatter tokeniseren som ét token og binder det sammen med strege: i_alt. Programmet tager også højde for punktummer i forkortelser. Andre punktummer opfattes som sætningsafgrænsere. Resutatet af denne proces er en fil med ét token pr. linje. Efter tokenisering omdannede et andet program tokenfilen til en fil med én sætning pr. linje Ordklassebestemmelse (Brill) Brill s tagger, med små modifikationer for bedre at håndtere ord som begynder med store bogstaver, tog førnævnte fil med én sætning per linje som input. Programmet var på forhånd blevet trænet til dansk og blevet kørt med disse parametre: tagger FINAL.LEXICON.concat..\sents.txt BIGBIGRAMLIST LEXRULEOUTFILE CONTEXT-RULEFILE Denne tagger anvender Parole-tagsættet (se Bilag A) Parsing (Cass) 6 Den taggede tekst blev forberedt til input til Steve Abneys Cass-parser. Eventuelle forekomster af tegnene [ og ], som er reserverede tegn i parserens output, blev lavet om til OPENSQUARE og CLOSESQUARE. I outputfilen fyldte hvert ord én linje. Linjens format er ord <tab> POS-tag. Sætningsafslutninger blev repræsenteret med en ekstra, tom, linje. Denne fil blev overført fra pc til en Sun-workstation for der at afvikle parsningen, som anvender Cass-parseren med en grammatik som beskrevet i filen np_pp_pp_gram.fsc (se Bilag B). Outputtet af parseren er en i høj grad struktureret tekstfil, igen med højst ét ord per linje: [ADV Herudover] [V_PRES skal] [NP [N kommunen]] [V_INF etablere] [NP2 [NP

20 [NP [PRON_UBST en] [N indsamlingsordning]] [PRÆP for] [NP [ADJ PVC-holdigt] [N affald]]] [PRÆP fra] [NP [N husholdninger]]] [ADV dog] [ADV ikke] [PRÆP fra] [TEGN.] Kollationering Outputtet fra Cass blev kombineret med det oprindelige søgeresultat. Fx skulle førbeskrevne eksempel på Cass-output kombineres med dette søgeresultat: Herudover skal kommunen etablere en indsamlingsordning for PVC-holdigt <T9>affald</T9> fra <T9>husholdninger</T9> dog ikke fra. Resultatet af denne kombination er: [ADV Herudover] [V_PRES skal] [NP[N kommunen]] [V_INF etablere] [NP2[NP1[NP[PRON_UBST en] [N indsamlingsordning]] [PRÆP for] [NP[ADJ PVC-holdigt] <T9>[N affald]]] </T9> [PRÆP fra] <T9>[NP[N husholdninger]]] </T9> [ADV dog] [ADV ikke] [PRÆP fra] [TEGN.] Generering af output Vi var specielt interesserede i at vide hvilke konstituenter søgeordene befinder sig i. Især ville vi gerne hurtigt kunne se om de ligger i samme konstituent og om denne fælles konstituent er en NP. Dertil skrællede vi alle strukturinformationer væk som ikke indeholder de markerede ord og vi brugte farver for nemt at finde rundt: wght # <WORD>husholdningsaffald affald husholdning</word><count>113</count> Skema 1. [NP1 [NP [EGEN <T9>Affald</T9>]] [PRÆP fra] [NP [N <T9>husholdninger</T9>]]]. Kommunens udgifter til affaldshåndtering. Skema 1 omhandler kommunens udgifter til håndtering af [NP1 [NP [N <T9>affald</T9>]] [PRÆP fra] [NP [N <T9>husholdninger</T9>]]]. [NP1 [NP [EGEN <T9>Affald</T9>]] [PRÆP fra] [NP [N <T9>husholdninger</T9>]]] Kommunens udgifter til affaldshåndtering Kr ekskl moms inkl affaldsafgift Driftsudgifter til indsam-ling og transport Udgifter til samt private og offentlige institutioner til enten genanvendelse eller deponering. 14

21 Herudover skal kommunen etablere [NP2 [NP1 [NP [PRON_UBST en] [N indsamlingsordning]] [PRÆP for] [NP [ADJ PVC-holdigt] [N <T9>affald</T9>]]] [PRÆP fra] [NP [N <T9>husholdninger</T9>]]] dog ikke fra. dagrenovation, til enten genanvendelse eller deponering. Miljøstyrelsen udsendte i forbindelse med revision af affaldsbekendtgørelsen et orienteringsbrev bebyggelser, hvor der til stadighed er mere end 2000 husstande ( Ref. 17 ). Papir. Kommunen skal have [NP1 [NP [V_PARTC_PAST etableret] [N indsamlingsordning]] [PRÆP for] [NP [N <T9>affald</T9>]]] fra [NP1 [NP [N <T9>husholdninger</T9>]] i form [PRÆP af] [NP [N dagblade]]], distriktsblade, uge- og månedsblade, herunder fag- og medlemsblade, adresseløse tryksager, adresserede forsendelser og telefonbøger fra Ved»<T9>affald</T9>«forstås enhver form for levnedsmiddel-, <T9>husholdnings</T9>- og driftsaffald, som fremkommer ved skibets normale drift og som bortskaffes løbende eller periodevis. Definitionen omfatter enhver <T9>Affald</T9>«omfatter i denne bekendtgørelse enhver form for levnedsmiddel-, <T9>husholdnings</T9>-, eller driftsaffald, som fremkommer ved skibets normale drift og som bortskaffes løbende eller periodevis.»[np [EGEN <T9>Affald</T9>]] Denne output er i html-format og kan læses i en browser. For at lette den manuelle analyse er alle søgeresultater vægtet med følgende algoritme: hvor ( I N O) T vægt =10 + I = antal <Tn> tags som ligger indenfor en eller anden konstituent. Konstituenter er ord eller grupper af ord som parseren har genkendt på basis af den valgte grammatik. I dette tilfælde er alle fundne konstituenter NP er. N = antal konstituenter (dvs. NP er) som indeholder <Tn>-tags. O = antal <Tn> tags som ligger udenfor enhver konstituent (dvs. udenfor NP erne). T = gennemsnittet af T-værdierne i søgeresultatet. Vægten er stillet op således at resultater med de højeste vægte er de bedste ifølge hypotesen at et resultat som samler flere T-taggede ord i én konstituent (NP) er bedre en et resultat som spreder de T-taggede ord over flere konstituenter eller lader dem havne udenfor konstituenter. Og selvfølgelig er resultater med høje T-værdier bedre end resultater med lave. Læg også mærke til at T-taggede ord som ligger udenfor en 15

22 konstituent trækker vægten ned. Man kunne også have valgt blot at se bort fra disse ord i beregningen af vægten. I det viste eksempel er tallene i linje # ( samt private og offentlige ) således I =2, N = 1, O = 0 og T = ( 9 + 9) / 2= 9. Dermed bliver vægt = 10 ( 2 1 0) + 9= 19 16

23 4 Semiautomatisk produktion af termlister 4.1 Automatisk processering af lister Til brug for termharmonisering og ontologiopbygning indenfor sagsbehandling af fagområderne patenter og varemærker i IPR-virksomheden Zacco, har det været relevant at foretage en semiautomatisk produktion af termlister uddraget fra Zaccos tekstmateriale. Vi har til dette arbejde valgt at afprøve en metode som blev udviklet i STO-projektet til udvidelse af fagsprogligt ordforråd (Jørgensen et al. 2003). Outputtet fra tekstprocesseringen beskrevet i kapitel 3 danner udgangspunkt for termlisten; grundlaget for udvælgelsen af termer er altså den liste af ord der forekommer efter lemmatiseringen, men som ikke findes i STO s almene ordforråd. Denne liste kaldes termkandidatlisten. Den frekvenssorterede termkandidatliste er blevet gennemgået manuelt ved CST og uegnede termkandidater markeret; dette kan fx være almensproglige ord der ved et tilfælde ikke er med i STO, fx honorarændring og helium. Samtidig er lemmatisering og ordklassebetegnelser for kandidaterne blevet kontrolleret og oplagte slåfejl og ortografiske fejl blevet rettet. Generelt har vi slettet person- og stednavne som ikke synes specifikt interessante for domænet (fx landenavne). Andre former for proprier er blevet på listen: navne på fagrelevante organisationer og institutioner er blevet bibeholdt, fx. Sø- og Handelsretten og Patent- og Varemærketidende. Til at automatisk uddrage flerordtermer og kollokationer har vi kigget på den pointwise mutual information (Church and Hanks, 1989) af taggede bi-, trigrammer. Som værktøj brugte vi CMU-Cambridge Statistical Language Tool (Clarkson and Rosenfeld, 1997). De analyserede n-grammer var taggede med en reduceret mængde af tags, således at kun ordklasseinformation var opmærket for hvert ord. Vi har ekskluderet n-grammer som indeholdt ordklasser som tal og adverbier og vi har især fokuseret på n-grammer med høj indbyrdes information som bestod af flere substantiver (EGEN eller N) eller af en substantiv, en præposition og en substantiv. Vi fandt nogle flerordstermer og identificerede navne på udenlandske og danske organisationer, firmaer, adresser og standarder. Eksempler af de automatisk uddragede data er de følgende: Burkina/EGEN Faso/EGEN Eurasian/ADJ patent/n office/n information/n disclosure/n document/n den/pron_demo ikke-registrerede/adj design/n EF/EGEN design/n Skånefrist/N for/præp design/n 17

24 4.2 Supplering af termlister Efter denne manuelle gennemgang hvor oplagte fejl er blevet rettet, er termlisterne blevet overdraget til termeksperterne hos Zacco. Disse har gennemgået listerne og slettet yderligere lemmaer som de ikke mente var fagtermer inden for deres domæne. Endvidere har de suppleret termlisterne med hjælp fra interne ordlister og opslagsværker (16 % af termerne). Parallelt med denne supplering af termkandidatlisterne, har man på CST set på om listerne yderligere burde suppleres med lemmaer der i første omgang var sorteret fra automatisk. Mange af termerne i Zacco s dokumenter, især dem fra det juridiske område, er kodede i STO. Derfor er disse automatisk blevet slettet i første omgang. Vi har derfor kigget på de ord som ikke var blevet udvalgt som termer i første omgang og har valgt nogle af disse som mulige termer. Udvælgelsen er sket ved bland andet automatisk at finde ord som indgår som dele i allerede fundne sammensatte termer (baglæns sortering af ord). 4.3 Evaluering Vi har evalueret den automatisk producerede liste af termkandidater ved at beregne precision og recall i forhold til den endelige termliste produceret ved hjælp af termeksperterne. Precision indikerer den procentdel af de foreslåede termkandidater som termeksperterne har godkendt som termer, og er 71,14%. Fejl i de automatisk producerede lister skyldes delvis forkert opmærkning af ord især i de sætninger som indeholder mange engelske ord, delvis det faktum at nogle af termerne er kodede i STO, og derfor ikke bliver taget i betragtning som mulige termkandidater. Recall bliver beregnet som den procentdel af alle relevante termer i dokumenterne som er blevet fundet automatisk, og er 77,24%. 18

25 5 Identifikation af tekststumper Zacco A/S ønsker at effektivisere produktionen af deres dokumenter, samt at forbedre dokumenternes kvalitet. Der antages at der indgår fælles tekststumper i mange af firmaets standard dokumenter og breve. Disse tekststumper skal findes, opmærkes, navngives og organiseres i en passende struktur, således at medarbejderne nemt kan finde dem, eventuelt ved hjælp af naturligt sprog. Formålet med strukturering af tekststumper er at skabe standard-dokumenter og -breve ud fra passende tekststumper, som nemt og effektivt kan vedligeholdes og ajourføres. Det første trin i arbejdet med tekststumper er at definere hvad en tekststump er og, dernæst, identificere tekststumper og markere de dokumenter, hvor tekststumper optræder. Da det ikke har været muligt at definere a priori hvad en tekststump er, har vi, i første omgang, besluttet at definere en tekststump som en sekvens af mere end seks tokens, hvor en token er et ord eller et tegn. Vi er specielt interesserede i tekststumper som forekommer mindst to gange i de kollektioner af dokumenter som vi har fået af Zacco. Vi har tilpasset og/eller udvidet eksisterende standard UNIX-programmel, samt små perl-programmer som genkender bigrams og trigrams. Vi har udviklet programmer der genkender n-grams (i første omgang 6-grams, 10-grams, 15-grams, 20-grams, 25- grams, 30-grams og 35-grams, men de kan hurtigt tilpasses til at håndtere andre typer n- grams) i de eksisterende tekstkollektioner. Programmerne finder n-grams i tekster, tæller deres frekvens og udskriver disse resultater i en fil. Man kan dernæst finde hvilke filer de forskellige n-grams optræder i ved hjælp af UNIX grep-kommandoer. I UNIX er der særlige regler for hvilke tegn der kan anvendes i filnavne og, som beskrevet i afsnit 3.2.1, er disse regler ikke overholdt i filnavnene for Zaccos dokumenter. Inden vi kunne anvende grep-kommandoer har vi skiftet alle filnavne for patentdomænet således at de følger reglerne for UNIX-filnavne. Vi har afprøvet metoden til at identificere tekststumper på patentteksterne og har fundet frem til tekststumper af størrelse 10 til 35 tokens. Via grep-kommandoer har vi identificeret de dokumenter i patentteksterne hvor tekststumper optræder. Konklusionen af vores første undersøgelse er at de største teksttumper som optræder i flere dokumenter svarer til selvstændige paragraffer i patentdokumenterne. Desuden optræder disse paragraffer i filer, hvis navne er relateret til hinanden. Dette indikerer at paragrafferne i patentdokumenter ofte svarer til selvstændige tekstenheder, som Zaccomedarbejderne har genkendt og opmærket. Mindre tekststumper gentages på tværs af dokumenterne, men eksperter fra Zacco bør vurdere om de kan betragtes som selvstændige tekstenheder. Vi har afsluttet det første arbejde med tekststumpidentifikation. Fremtidige aktiviteter vil være forbundet med arbejdet med termlister. Der anvendes i enkelte tilfælde synonyme termer i de nuværende standarddokumenter. Alle synonyme termer bør genkendes, og man bør erstatte synonymer med den ene term i tekstkollektionerne inden tekststumperne genkendes, således at identifikationen af tekststumperne bliver mere 19

26 præcist. Firmaets terminologi skal også anvendes i navngivning og måske strukturering af tekststumperne. 20

27 6 Konklusion og fremtidigt arbejde 6.1 Evaluering af den automatiske analyse Erfaringer fra den automatiske tekstanalyse har givet os den erkendelse at det ville have været fordelagtigt at tilpasse de sprogteknologiske værktøjer så de passede bedre til teksttypen; dvs. man kunne have udført en manuel vurdering af teksterne inden man påbegyndte det automatiske arbejde. Dette er især tilfældet for Zaccos tekster som har forskellige specifikke karakteristika i form af at de som nævnt er en slags halvfabrikata. Dette giver, som vi har set, problemer for værktøjerne som er konstrueret til almindelig tekst. En anden erfaring vedrører STOs egnethed som en slags stopordsliste for termidentifikation. STO indeholder en del såkaldte gråzoneord, og en del af disse ord det gælder som nævnt især de juridiske termer regnes for termer af termeksperterne og skal derfor ikke sorteres fra. Derfor er det tanken på længere sigt at raffinere metoden yderligere således at også eventuelle termordbøger inddrages i udtrækningsprocessen (jf. Jaquemin 2001). Ord der er i de relevante termordbøger og som forekommer i teksterne, bør altså bibeholdes på kandidatlisten også selv om de er i STO. 6.2 Videre arbejde med Zaccos materiale Hvad angår det fremtidige arbejde så vil den manuelle analyse af Zaccos data forløbe parallelt med den ontologiske analyse af domænevokabularet. Dette arbejde er påbegyndt, men endnu ikke afsluttet. Analysen vil ligesom produktion af termlisterne foregå i tæt samarbejde med termeksperterne. Nedenfor ses et udsnit af det forslag til en patentontologi der i første omgang blev opbygget ud fra patenttermlisten. Under dette arbejde afsløres bl.a. uhensigtsmæssige synonymer eller ujævnheder i terminologien, fx blev patenteksperterne via ontologiskitsen opmærksomme på at de to termer årsafgift og årsgebyr refererer til samme begreb (her etableret som Årsgebyr). Relationerne i ontologien etableres også ud fra tekstsammenhængen; i tilfældet med Årsgebyr er der etableret en relation til begreberne Betaling og Omkostning. 21

28 Parallelt med den manuelle ontologiopbygning er det også tanken at udforske clusteringmetoder til automatisk ontologiopnygning. Til dette arbejde er det imidlertid nødvendigt at opbygge større korpora, fx. på basis af patenttekster på nettet. 6.3 Videre arbejde med Ankiros materiale Hvad angår Ankiros søgeudtræk med ord fra sammensatte udtryk, vil den manuelle analyse fokusere på følgende aspekter: holder hypotesen om at hits hvor begge søgeord optræder i samme NP generelt er gode hits? hvad betyder afstanden ml. søgeordene inden for et NP mht. om et hit er godt eller dårligt? hvilke syntaktiske og leksikalske principper holder for gode hits? fx: er nogle præpositioner bedre end andre? hvad betyder valens? (valensbundne præpositioner vs. ikke valensbundne) typer af sammensatte ord: er deverbale sammesætninger mere variable end ikke deverbale sammensætninger? ved deverbale sammensætninger: hvilke regler for disse. 22

29 23

30

31 Referencer Church, K.W. and P.Hanks Word association norms, mutual information and lexicography. In: Proceedings of ACL 27, pp Clarkson, P. and R. Rosenfeld Statistical Language Modeling Using the CMU- Cambridge Toolkit. In Proceedings of ESCA Eurospeech Haltrup D Træning og brug af Brill-taggeren på danske tekster. ONTOQUERY Teknisk Rapport, København (http://cst.dk/tagger/rapport/index.html). Jacquemin, C Spotting and Discovering Terms through National Language Processing. MIT Press. Cambridge, Massachusetss. Jørgensen SW, Hansen C, Drost J, Haltrup D, Braasch A, Olsen S Domain specific corpus building and lemma selection in a computational lexicon. Proceedings of the Corpus Linguistics 2003 conference, Lancaster, pp

32

33 Bilag A Parole tags Dette er tagsættet som anvendes af POS-taggeren. ADJ ADJ_GEN ADV EGEN EGEN_GEN FORK FORM INTERJ N N_GEN NUM NUM_GEN NUM_ORD NUM_ORD_GEN PRON_DEMO PRON_DEMO_GEN PRON_INTER_REL PRON_INTER_REL_GEN PRON_PERS PRON_POSS PRON_REC PRON_REC_GEN PRON_UBST PRON_UBST_GEN PRÆP SKONJ SYMBOL TEGN UKONJ UL UNIK V_GERUND V_IMP V_INF V_MED_INF V_MED_PARTC_PAST V_MED_PAST V_MED_PRES V_PARTC_PAST V_PARTC_PRES V_PAST V_PRES XX A-1

34

35 Bilag B Cass-grammatik Dette er np_pp_pp_gram.reg :np determ = PRON_DEMO PRON_UBST PRON_INTER_REL ; attr = ADJ FORK UL FORK SYMBOL FORK ADJ NUM NUM_ORD V_PARTC_PAST V_PARTC_PRES; gen = N_GEN EGEN_GEN ADJ_GEN PRON_POSS PRON_DEMO_GEN PRON_UBST_GEN NUM_GEN PRON_REC_GEN PRON_INTER_REL_GEN; DP = FORK? determ+ determ SKONJ determ gen SKONJ* gen* ; AP = attr+ ADV? ADJ+ ADV? attr TEGN ADV? attr ADV? attr TEGN? ADV? attr? SKONJ ADV? attr ADV? attr?; NP_G = DP AP* gen DP* AP gen EGEN gen; kerne = N EGEN+ NUM UL FORK XX SKONJ N ; NP -> ADJ? DP? AP? kerne ADJ? NP_G? AP? kerne PRON_DEMO attr NUM N N PRON_UBST ADJ? N N N EGEN+; :np1 PP = PRÆP NP; NP1 -> NP PP; :np2 PP = PRÆP NP; NP2 -> NP1 PP; B-1

VID. VID-projektets mission. at foretage en række sprogteknologiske eksperimenter i et dynamisk trekantsmiljø: forskningsinstitution

VID. VID-projektets mission. at foretage en række sprogteknologiske eksperimenter i et dynamisk trekantsmiljø: forskningsinstitution Sprogteknologiske komponenter i ontologi og søgning Bolette Sandford Pedersen, Costanza Navarretta, Dorte Haltrup Hansen, Bart Jongejan Center for Sprogteknologi, KU VID-projektets mission at foretage

Læs mere

- Hvad er det, og hvilke fordele kan opnås ved fælles løsninger?

- Hvad er det, og hvilke fordele kan opnås ved fælles løsninger? Semantik, ontologi, tesaurus mv. - Hvad er det, og hvilke fordele kan opnås ved fælles løsninger? Seniorforsker, Center for Sprogteknologi, Københavns Universitet Indhold Hvorfor er semantik relevant for

Læs mere

Sproglige problemstillinger ved informationssøgning

Sproglige problemstillinger ved informationssøgning Sproglige problemstillinger ved informationssøgning Patrizia Paggio Center for Sprogteknologi Københavns Universitet patrizia@cst.dk Disposition Søgemaskiner i dag: nogle problemer Nogle krav til fremtidig

Læs mere

Effektiv søgning på web-steder

Effektiv søgning på web-steder Effektiv søgning på web-steder 7. maj 1998 Udarbejdet af DialogDesign ved Rolf Molich, Skovkrogen 3, 3660 Stenløse Indhold 1. Indledning 3 1.1. Model for søgning 3 2. Forskellige former for søgning 4 2.1.

Læs mere

Seniorklubben TDC Jylland Cloud Computing Kursus 2011_5: Rev. 02.11.2011

Seniorklubben TDC Jylland Cloud Computing Kursus 2011_5: Rev. 02.11.2011 1. Om 2. Valg af Google som gratis udbyder ved 3. Valg af browser 4. Oprette en mail-adresse (G-mail) og en konto ved Google 5. Hierarkisk opbygning af mappe- og filsystem i Google 6. Oprette mapper i

Læs mere

Kontrolleret sprog. Indledende analyse af virksomhedernes regelsæt og sammenligning med eksisterende regelsæt

Kontrolleret sprog. Indledende analyse af virksomhedernes regelsæt og sammenligning med eksisterende regelsæt Kontrolleret sprog Indledende analyse af virksomhedernes regelsæt og sammenligning med eksisterende regelsæt Lina Henriksen, Bart Jongejan, Bente Maegaard VID-rapport nr. 1 Center for Sprogteknologi September

Læs mere

Intro til design og brug af korpora

Intro til design og brug af korpora Intro til design og brug af korpora Jørg Asmussen ja@dsl.dk Det Danske Sprog- og Litteraturselskab www.dsl.dk Intro til design og brug korpuslingvistik af korpora Jørg Asmussen ja@dsl.dk Det Danske Sprog-

Læs mere

Ontologibaseret teksthåndtering med sprogteknologi

Ontologibaseret teksthåndtering med sprogteknologi Ontologibaseret teksthåndtering med sprogteknologi Bolette S. Pedersen, Costanza Navarretta & Dorte Haltrup Hansen VID-rapport nr. 6 Center for Sprogteknologi Marts 2005 Center for Sprogteknologi 2003

Læs mere

Kort og godt om test af arkiveringsversioner

Kort og godt om test af arkiveringsversioner Kort og godt om test af arkiveringsversioner Data og dokumenter fra den offentlige forvaltnings it-systemer, som skal bevares for eftertiden, skal afleveres til arkiv i form af arkiveringsversioner. Arkiveringsversioner

Læs mere

Vejledning til udskrivning af etiketter/labels og konvolutter i Blåt Medlem

Vejledning til udskrivning af etiketter/labels og konvolutter i Blåt Medlem Vejledning til udskrivning af etiketter/labels og konvolutter i Blåt Medlem Blåt Medlem giver mulighed for at udskrive etiketter/labels og kuverter til medlemmerne af den enhed man er medlemsansvarlig

Læs mere

PRINCE2 PRACTITIONER EKSAMEN VEJLEDNING TIL EKSAMINANDER

PRINCE2 PRACTITIONER EKSAMEN VEJLEDNING TIL EKSAMINANDER PRINCE2 PRACTITIONER EKSAMEN VEJLEDNING TIL EKSAMINANDER 1 INTRODUKTION 1.1 Formålet med Practitioner-eksamen er at give eksaminanden mulighed for at demonstrere forståelse af PRINCE2. Samtidig skal eksaminanden

Læs mere

5. OPSÆTNING DOKUMENTSKABELONER 5.1 TRIN

5. OPSÆTNING DOKUMENTSKABELONER 5.1 TRIN 5. OPSÆTNING DOKUMENTSKABELONER Under fanen Dok. skabeloner kan du arbejde med de skabeloner som du har i systemet, eller du kan oprette nye. I denne vejledning kigger vi på hvordan du kan tilrette selve

Læs mere

Ministeriet for Børn og Undervisnings forfattervejledning til ministeriets publikationer

Ministeriet for Børn og Undervisnings forfattervejledning til ministeriets publikationer Ministeriet for Børn og Undervisnings forfattervejledning til ministeriets publikationer Denne forfattervejledning er et bilag til de interne retningslinjer for udarbejdelse af publikationer Sammen med

Læs mere

Manuskriptvejledning pr. 2015 Bachelorprisen

Manuskriptvejledning pr. 2015 Bachelorprisen Manuskriptvejledning pr. 2015 Bachelorprisen Fremsendelse af artikel Artikler skrevet på baggrund af bachelorprojekter, der er afleveret og bestået på det annoncerede tidspunkt, kan deltage i konkurrencen

Læs mere

Først skal du oprette dig i systemet, d. v. s. du skal have en såkaldt Googlekonto bestående af en mailadresse og et kodeord.

Først skal du oprette dig i systemet, d. v. s. du skal have en såkaldt Googlekonto bestående af en mailadresse og et kodeord. Gmail Indhold Indhold...1 Introduktion...2 Opret dig i systemet...2 At skrive mails...5 Sende en mail til flere personer...8 Vedhæfte en fil...9 Kladde...10 Signatur...11 Modtagne mails...12 Stjernemarkering...14

Læs mere

It-støttet excerpering og registrering af nye ord og ordforbindelser

It-støttet excerpering og registrering af nye ord og ordforbindelser It-støttet excerpering og registrering af nye ord og ordforbindelser Møde i Selskab for Nordisk Filologi 30. oktober 2008 Jakob Halskov Projektforsker, ph.d. Dansk Sprognævn jhalskov@dsn.dk Disposition

Læs mere

Hvilke felter i GeoEnviron, der benyttes i tilsynsrapporter, er angivet i disse to pdf-filer:

Hvilke felter i GeoEnviron, der benyttes i tilsynsrapporter, er angivet i disse to pdf-filer: TILSYNSRAPPORT FOR LANDBRUG ELLER VIRKSOMHED Med kan I lave omfattende tilsynsrapporter. Begge rapporter skrives i Word med alle data fra GeoEnviron. Data overføres til Word via bogmærker i en prædefineret

Læs mere

Manual til Dynamicweb Februar 2010

Manual til Dynamicweb Februar 2010 Manual til Dynamicweb Februar 2010 Login... 2 Skabeloner og formater... 3 Filarkivet... 4 Lav en PDF... 5 Opret en ny side... 7 Navngiv siden... 9 Aktiver siden... 9 Sorter sider... 9 Flyt siden... 11

Læs mere

Typografi og layout i Word 2010

Typografi og layout i Word 2010 Ret&Rigtigt F12 Niels Erik Wille Typografi og layout i Word 2010 Papirformat og papirets orientering (højformat / bredformat) Vælges i menuen Sidelayout: Man kan vælge Retning (højformat / bredformat)

Læs mere

Professionel Udvælgelse i byggeriet Skabeloner

Professionel Udvælgelse i byggeriet Skabeloner Professionel Udvælgelse i byggeriet Skabeloner Vejledning i anvendelsen af skabeloner til brug for udvælgelse, herunder prækvalifikation i byggeriet Marts 2013 Byggeriets Evaluerings Center SOLIDARISK

Læs mere

1. Opbygning af et regneark

1. Opbygning af et regneark 1. Opbygning af et regneark Et regneark er et skema. Vandrette rækker og lodrette kolonner danner celler, hvori man kan indtaste tal, tekst, datoer og formler. De indtastede tal og data kan bearbejdes

Læs mere

PORTFOLIO Version 2.0

PORTFOLIO Version 2.0 Nikolaj Lisberg Hansen Løsningsarkitekt og partner nikolaj.hansen@empisto.dk Tlf. 22 90 91 22 PORTFOLIO Version 2.0 Kvalitetsstyring med sags og dokumenthåndtering Teknisk revision af energimærker Portfolio

Læs mere

xgalleri Mulige filtyper Installation web-version

xgalleri Mulige filtyper Installation web-version xgalleri xgalleri opstod ud fra ønsket om at lægge en større samling billeder på nettet. Der findes mange programmer, som kan bruges til at lægge datafiler på nettet; men de fungerer typisk på den måde,

Læs mere

Daglig brug af JitBesked 2.0

Daglig brug af JitBesked 2.0 Daglig brug af JitBesked 2.0 Indholdsfortegnelse Oprettelse af personer (modtagere)...3 Afsendelse af besked...4 Valg af flere modtagere...5 Valg af flere personer der ligger i rækkefølge...5 Valg af flere

Læs mere

Pensioneringsprocessen/Statens Administration

Pensioneringsprocessen/Statens Administration PENSAB Pensioneringsprocessen/Statens Administration Indhold 1. Overblik over den samlede proces... 2 2. Tildel pensionssag... 3 2.1 Søg i listen [Pensionssager]... 5 2.2 Tildel sag... 5 2.3 Afgiv sag...

Læs mere

Email Archiving. SaaS Email Archiving. Brugervejledning Udgave D

Email Archiving. SaaS Email Archiving. Brugervejledning Udgave D Brugervejledning Udgave D SaaS Email Archiving Email Archiving Email Archiving er en skybaseret tjeneste, der automatisk arkiverer din mail på et sikkert centralt sted. Desuden giver Email Archiving dig

Læs mere

Kom godt igang med Inventar registrering

Kom godt igang med Inventar registrering Kom godt igang med Inventar registrering (InventoryDB) (Med stregkodesupport) programmet fra PetriSoft Introduktion... 1 Inventar registrering... 2 Værktøjsudleje... 3 Service database til reperationer

Læs mere

Kort introduktion til Google.

Kort introduktion til Google. Google Side 1 af 10 Kort introduktion til Google.... 2 Tilpas din søgning... 2 Generelle Tips... 2 Udelukkelse af ord... 2 Brug af *... 3 Sætningssøgninger... 3 Jeg Føler Mig Heldig... 3 Avanceret søgning...

Læs mere

Orddeling. Automatisk orddeling. Manuel orddeling. Word 2010 18 thoremil.dk. Vælg fanebladet [Sidelayout] Vælg [Orddeling] Markér Automatisk orddeling

Orddeling. Automatisk orddeling. Manuel orddeling. Word 2010 18 thoremil.dk. Vælg fanebladet [Sidelayout] Vælg [Orddeling] Markér Automatisk orddeling Orddeling Automatisk orddeling Vælg [Orddeling] Markér Automatisk orddeling Manuel orddeling Vælg [Orddeling] Klik [Manuelt] For hvert ord, som vises, kan der gøres følgende: Accepter det foreslåede orddelingssted

Læs mere

Microsoft. fra Word 2003

Microsoft. fra Word 2003 I denne vejledning Microsoft Word 2010 ser meget anderledes ud end Word 2003, og vi har derfor oprettet denne vejledning, så du hurtigere kan komme i gang med at bruge programmet. Læs videre for at få

Læs mere

Billedoptimering i indkaldelsesbreve

Billedoptimering i indkaldelsesbreve Billedoptimering i indkaldelsesbreve Af Flemming Madsen I denne vejledning vil vi vise, hvordan du som skoleadministrator optimerer billeder i rtfdokumenter og dermed kan generere breve med skolens logo

Læs mere

EUROPOL JOINT SUPERVISORY BODY

EUROPOL JOINT SUPERVISORY BODY EUROPOL JOINT SUPERVISORY BODY Udtalelse 12/05 fra den fælles kontrolinstans for Europol om Europols anmeldelse af behandling af personoplysninger: Arbejdstider/flekstid/overarbejde/rådighedstjeneste/skifteholdstjeneste

Læs mere

Manual for Synkron hjemmesider

Manual for Synkron hjemmesider Manual for Synkron hjemmesider Denne manual tilhører: Brugernavn: (username) Adgangskode: (password) 1 Start med sitetræet: Sitetræet er centralt. Det er her, dit website er. Det er her, du bygger dine

Læs mere

Web MTC manual. Version 1.1 08-11-2012

Web MTC manual. Version 1.1 08-11-2012 Web MTC manual Version 1.1 08-11-2012 1 Revisioner: Version 1.0, 11-10-2012: Oprettelse af dokument Version 1.1, 08-11-2012: Afsnit om udskrivning af rapport tilføjet. 2 Indhold Sideopbygning... 5 Startside...

Læs mere

Sådan bruger du Den Danske Regnskabsordbog

Sådan bruger du Den Danske Regnskabsordbog Sådan bruger du Den Danske Regnskabsordbog Visning Når du får et søgeresultat, kan du gøre skriften større eller mindre ved at klikke på knapperne yderst til højre på skærmen: større, mindre, nulstil.

Læs mere

Velkommen til IT for let øvede

Velkommen til IT for let øvede Velkommen til IT for let øvede at dias ligger på hjemmesiden, så I kan se dem igen hjemme. Peter har ordet Blev vi færdige med vinduerne?? Øvelse tastatur og mus vi ikke kunne sidste gang får I som hjemmeopgave

Læs mere

Vejledning om e-arkivet - sagsområderne Teknik, Vej og Miljø

Vejledning om e-arkivet - sagsområderne Teknik, Vej og Miljø Vejledning om e-arkivet - sagsområderne Teknik, Vej og Miljø Hvordan fungerer e-arkivet - sagsområderne Teknik, Vej og Miljø i praksis? Hvordan anvendes funktionerne?. Dette og meget mere gives der svar

Læs mere

Manual til hjemmeside i Typo3

Manual til hjemmeside i Typo3 Manual til hjemmeside i Typo3 Gode tips og genvejstaster Ét linieskift Ctrl + A Ctrl + C Ctrl + X Ctrl + V shift + enter (tasten du normalt bruger til linieskift) Markér alt Kopier Klip Sæt ind Oprettelse

Læs mere

Inspirationsdag Brug af skolens sider

Inspirationsdag Brug af skolens sider Inspirationsdag Brug af skolens sider Lisbeth Jørgensen og Susanne Baunelund Jørgensen VEU konsulenter November 2012 Hvorfor bruge skolens sider? Overblik over tilmeldinger/indkaldelser/aflysninger Besparelse

Læs mere

Microsoft Office Project 2013 DK

Microsoft Office Project 2013 DK T a r g e t G r u p p e n Microsoft Office Project 2013 DK I n d h o l d s f o r t e g n e l s e Lidt om Microsoft Office Project 2013... 1 Hvorfor skal man anvende Microsoft Office Project 2013?... 1

Læs mere

Vejledning til registrering af virksomheder og personer (effekter) Projektrapporteringsværktøj - PRV

Vejledning til registrering af virksomheder og personer (effekter) Projektrapporteringsværktøj - PRV Vejledning til registrering af virksomheder og personer (effekter) Projektrapporteringsværktøj - PRV Registrering af virksomheder og personer Erhvervsstyrelsen og de regionale vækstfora ønsker at styrke

Læs mere

Sådan bruger du Den Dansk-Engelske Regnskabsordbog

Sådan bruger du Den Dansk-Engelske Regnskabsordbog Sådan bruger du Den Dansk-Engelske Regnskabsordbog Visning Når du får et søgeresultat, kan du gøre skriften større eller mindre ved at klikke på knapperne yderst til højre på skærmen: større, mindre, nulstil.

Læs mere

BRUGERVEJLEDNING TYPO3 CMS Nyhedsbrev modul

BRUGERVEJLEDNING TYPO3 CMS Nyhedsbrev modul BRUGERVEJLEDNING TYPO3 CMS Nyhedsbrev modul TYPO3 CMS Ext:direct_mail Side 1 Indhold Tilmeldings / Afmeldings processen... 2 Manuel tilføjelse af e-mail adresser... 3 Oprettelse af nyhedsbreve... 4 Udsendelse

Læs mere

MANUAL - Joomla! Version 1

MANUAL - Joomla! Version 1 MANUAL - Joomla! Version 1 Indhold Retningslinjer for hjemmesiden... 3 Log ind... 3 Ret i en artikel, der allerede er oprettet... 4 Opret ny artikel... 8 a) Skriv direkte i tekstfelt... 9 b) Indsæt tekst

Læs mere

Tilpas: Hurtig adgang

Tilpas: Hurtig adgang Tilpas: Hurtig adgang Genveje, Se skærmtips Se tips Hold alt tasten nede. Og brug bogstaver Word Fanen Filer PDF dokument Brug skabelon Visninger Husk Luk ved fuldskærmsvisning Brug zoom skyder Marker,

Læs mere

Heldigvis har systemet indbygget en hjælp, som man kan benytte, hvis denne vejledning ikke berører det opståede problem.

Heldigvis har systemet indbygget en hjælp, som man kan benytte, hvis denne vejledning ikke berører det opståede problem. Indhold Introduktion...2 Hjælp...2 Office knappen...2 Menulinjen...3 Fast værktøjslinje Hurtig adgang...3 Menupunkter...4 Startside...4 Indsæt...5 Sidelayout...5 Referencer...6 Forsendelser...6 Gennemse...6

Læs mere

Sådan bruger du Den Engelske Regnskabsordbog

Sådan bruger du Den Engelske Regnskabsordbog Sådan bruger du Den Engelske Regnskabsordbog Visning Når du får et søgeresultat, kan du gøre skriften større eller mindre ved at klikke på knapperne yderst til højre på skærmen: større, mindre, nulstil.

Læs mere

Finanstilsynets indberetningssystem. Vejledning til Regnearksskabelonerne

Finanstilsynets indberetningssystem. Vejledning til Regnearksskabelonerne Finanstilsynets indberetningssystem Vejledning til Regnearksskabelonerne Finanstilsynet - 2. udgave oktober 2009 Indholdsfortegnelse 1 INDLEDNING... 2 2 FORUDSÆTNINGER... 3 3 TRIN FOR TRIN... 4 3.1 Hent

Læs mere

Indhold Børnehaveklassen... 1 1.Klasse... 2 2.klasse... 3 3.klasse... 4 4.klasse... 5 5.klasse... 6 6.klasse... 7 7.-9.klasse... 7

Indhold Børnehaveklassen... 1 1.Klasse... 2 2.klasse... 3 3.klasse... 4 4.klasse... 5 5.klasse... 6 6.klasse... 7 7.-9.klasse... 7 Indhold Børnehaveklassen... 1 1.Klasse... 2 2.klasse... 3 3.klasse... 4 4.klasse... 5 5.klasse... 6 6.klasse... 7 7.-9.klasse... 7 Børnehaveklassen Kunne bruge tænde/slukke funktionen på maskinen Kunne

Læs mere

Afhentning af ansøgninger til de videregående. Brugervejledning Optagelse.dk

Afhentning af ansøgninger til de videregående. Brugervejledning Optagelse.dk Afhentning af ansøgninger til de videregående uddannelser Brugervejledning Optagelse.dk Afhentning af ansøgninger til de videregående uddannelser Brugervejledning Optagelse.dk Forfatter: Tine Kanne Sørensen

Læs mere

Annemette Søgaard Hansen/www.dinwebvejleder.dk

Annemette Søgaard Hansen/www.dinwebvejleder.dk Google Docs Dokumenter Indholdsfortegnelse Værktøjer... Side 3 Menuer... Side 5 Opgave... Side 8 Få adgang til filerne fra din computer... Side 16 Vejledende løsning... Side 17 GoogleDocs Dokumenter 2

Læs mere

Vejledning i brug af system til online indberetning af mønstringsdata

Vejledning i brug af system til online indberetning af mønstringsdata Vejledning i brug af system til online indberetning af mønstringsdata Søfartsstyrelsen kan tilbyde samtlige rederier mulighed for at kunne indberette mønstringsdata elektronisk. Den elektroniske indberetning

Læs mere

Patient Database - Manual

Patient Database - Manual Patient Database - Manual Side 1 af 36 Adgang til systemet... 4 Glemt brugernavn og kode... 4 Opret projekt (kun System Administrator)... 6 Klik på NYT PROJEKT -knappen øverst til venstre.... 6 Udfyld

Læs mere

Sprogteknologi skal gøre fremtidens søgemaskiner intelligente

Sprogteknologi skal gøre fremtidens søgemaskiner intelligente Sprogteknologi skal gøre fremtidens søgemaskiner intelligente Hvad hjælper det, at den nødvendige viden er tilgængelig på internettet, hvis vi ikke kan trække den ned på vores pc-skærme, når vi har brug

Læs mere

Kommandonavn Ændringstaster Tast Menu Accepter Alle Viste. Accepter Ændringer Accepter Alle Ændringer. Accepter Afslut

Kommandonavn Ændringstaster Tast Menu Accepter Alle Viste. Accepter Ændringer Accepter Alle Ændringer. Accepter Afslut Genvejstaster i Word 2003 Kommandonavn Ændringstaster Tast Menu Accepter Alle te Accepter Ændringer Accepter Alle Ændringer Accepter Afslut Afsnit Ned Ctrl+ Ned Afsnit Ned Udvid Ctrl+Skift+ Ned Afsnit

Læs mere

Danhost Webshop. Bliv fundet på Google

Danhost Webshop. Bliv fundet på Google Danhost Webshop Bliv fundet på Google SEO - Søgemaskineoptimering Når du arbejder med SEO, er det med henblik på, at din hjemmeside eller webshop skal dukke op i søgeresultaterne på f.eks. Google når en

Læs mere

vejledning sådan ARBejdeR du i ebg s RAppoRTvæRKTøj

vejledning sådan ARBejdeR du i ebg s RAppoRTvæRKTøj vejledning sådan arbejder du i ebg s rapportværktøj Vejledning for 2013/2014 Sådan arbejder du i EBG's rapportværktøj www.business-games.dk Indholdsfortegnelse: Forord... 2 Login... 2 Rapportværktøjet...

Læs mere

Velkommen til 6. omgang

Velkommen til 6. omgang Velkommen til 6. omgang I dag Internet Hjemmeopgave 5 Mapper og filer Internet Vi så på faner sidst. og hurtigt på favoritter som ikke må forveksles med faner Favoritter Kan med fordel bruges til internetsider

Læs mere

ectrl Skabelonkonvertering

ectrl Skabelonkonvertering ectrl Skabelonkonvertering Indholdsfortegnelse 1. Indledning 3 2. Import ved hjælp af standardskabeloner 4 Kolonneopsætning og feltdefinition 6 3. Opsætning af konverteringsdefinitioner 8 4. Udvidede muligheder

Læs mere

Manual til at arbejde med POI på Garmin GPS.

Manual til at arbejde med POI på Garmin GPS. Manual til at arbejde med POI på Garmin GPS. Michael Pedersen (mike42dk) mike42dk@gratispoi.dk Juli 2009 Version 2.1 Jeg fralægger mig alt ansvar for den skade du kan komme til at forsage ved din GPS,

Læs mere

Studieordning for tilvalget på bachelorniveau i. It og sprog, 2013-ordningen

Studieordning for tilvalget på bachelorniveau i. It og sprog, 2013-ordningen Studieordning for tilvalget på bachelorniveau i It og sprog, 2013-ordningen Institut for Nordiske Studier og Sprogvidenskab Det Humanistiske Fakultet Københavns Universitet Indhold Kapitel 1. Hjemmel,

Læs mere

Kom i gang med... Kapitel 11 Math: Formelredigering med OpenOffice.org. OpenOffice.org

Kom i gang med... Kapitel 11 Math: Formelredigering med OpenOffice.org. OpenOffice.org Kom i gang med... Kapitel 11 Math: Formelredigering med OpenOffice.org OpenOffice.org Rettigheder Dette dokument er beskyttet af Copyright 2005 til bidragsyderne som er oplistet i afsnittet Forfattere.

Læs mere

Hjælp til MV-ID Administration

Hjælp til MV-ID Administration Hjælp til MV-ID Administration - til brugere af MV-Login Mikro Værkstedet A/S Dokumentversion: 20131002A 1 Indholdsfortegnelse Forord... 3 Kapitel 1. Aktivér MV-Login administratorkontoen... 4 Kapitel

Læs mere

Kort om CoinDB (Mønt- og seddelsamling):

Kort om CoinDB (Mønt- og seddelsamling): Kom godt i gang med CoinDB programmet fra PetriSoft (Holder styr på din Mønt- seddel- eller frimærkesamling) Kort om CoinDB (Mønt- og seddelsamling): CoinDB er et Windows program, der anvendes af mønt-

Læs mere

Indlæsning af tilskud fra UVM

Indlæsning af tilskud fra UVM Indlæsning af tilskud fra UVM Brugervejledning version 1.0 Side 1 Indholdsfortegnelse Indledning... 3 Download bogføringskladde fra brevportalen... 3 Gem regneark på din arbejdsplads... 3 Bearbejdning

Læs mere

Oversigt over formateringsmærker i Microsoft Word

Oversigt over formateringsmærker i Microsoft Word Oversigten på de følgende sider viser størstedelen af de forskellige formateringsmærker, der kan optræde i et Microsoft Word-dokument. Formateringsmærker vises kun på skærmen de kommer ikke med i udskrift.

Læs mere

Kontakthierarkier i. Denne vejledning beskriver forskellige måder, man kan præsentere sin myndighed over for borgere og virksomheder

Kontakthierarkier i. Denne vejledning beskriver forskellige måder, man kan præsentere sin myndighed over for borgere og virksomheder Kontakthierarkier i digital post Denne vejledning beskriver forskellige måder, man kan præsentere sin myndighed over for borgere og virksomheder i digital post. Version: 3.0 Udarbejdet: november 2011 Udarbejdet

Læs mere

Beredskab TNG. Beredskab TNG er en opgradering af det "gamle" beredskabsmodul i SecureAware, og er tilgængelig fra version 4.7.0.

Beredskab TNG. Beredskab TNG er en opgradering af det gamle beredskabsmodul i SecureAware, og er tilgængelig fra version 4.7.0. Beredskab TNG Beredskab TNG er en opgradering af det "gamle" beredskabsmodul i SecureAware, og er tilgængelig fra version 4.7.0. Beredskab TNG... 1 Kom godt i gang... 2 Redigér beredskabsdokumentet...

Læs mere

VEU-godtgørelse og befordringstilskud. Virksomheder

VEU-godtgørelse og befordringstilskud. Virksomheder VEU-godtgørelse og befordringstilskud Virksomheder Side 2 af 31 Indholdsfortegnelse Indledning... 3 Adgang til ansøgningsskema... 3 Ansøgningen... 4 Trin 1 Hvad søges?... 5 Trin 2 Personlige oplysninger...

Læs mere

Google Apps. Lær at oprette, organisere, dele og slette dokumenter. Udarbejdet af PLC, version 2013!!!!!!! Side 1 af 9

Google Apps. Lær at oprette, organisere, dele og slette dokumenter. Udarbejdet af PLC, version 2013!!!!!!! Side 1 af 9 Lær at oprette, organisere, dele og slette dokumenter. Udarbejdet af PLC, version 2013!!!!!!! Side 1 af 9 Arbejde i faner Google Apps arbejder i faner, derfor er det vigtigt, du er bekendt med det. Mappen

Læs mere

FESD-standardiseringsgruppen Att: Palle Aagaard IT- og Telestyrelsen IT-strategisk kontor Holsteinsgade 63 2100 København Ø

FESD-standardiseringsgruppen Att: Palle Aagaard IT- og Telestyrelsen IT-strategisk kontor Holsteinsgade 63 2100 København Ø FESD-standardiseringsgruppen Att: Palle Aagaard IT- og Telestyrelsen IT-strategisk kontor Holsteinsgade 63 2100 København Ø Høringssvar vedr. FESD GIS-integrationsmodel version 2.0 Geodata Danmark har

Læs mere

Hos Lasse Ahm Consult vurderer vi at følgende supplerende krav i de enkelte kravelementer er væsentlige at bemærke:

Hos Lasse Ahm Consult vurderer vi at følgende supplerende krav i de enkelte kravelementer er væsentlige at bemærke: ISO 9001:2015 (Draft) Side 1 af 9 Så ligger udkastet klar til den kommende version af ISO 9001. Der er sket en række strukturelle ændringer i form af standardens opbygning ligesom kravene er blevet yderligere

Læs mere

Introduktion til FileMaker Pro 4.0/4.1

Introduktion til FileMaker Pro 4.0/4.1 1 Introduktion til FileMaker Pro 4.0/4.1 Hvad er en database? En database er en samling data, som er organiseret på en systematisk måde og er tilgængelig i digital form. Med andre ord er det en slags elektronisk

Læs mere

Når du har logget dig ind, ser du Randers Kommunes byvåben midt på siden. I venstre side er der en række mapper:

Når du har logget dig ind, ser du Randers Kommunes byvåben midt på siden. I venstre side er der en række mapper: DXP vejledning Generelt: DXP er et værktøj til at fremstille præsentationsmaterialer (foldere, brochurer, løbesedler mv.) DXP egner sig kun til mindre brochurer og lign., da den største skabelon kan rumme

Læs mere

Arbejd videre med statistik

Arbejd videre med statistik Danmarks Statistik databanker@dst.dk Arbejd videre med statistik Vejledning i PC-AXIS og Statistikbanken Danmarks Statistik juni 2003 1 www.dst.dk www.statistikbanken.dk Indholdsfortegnelse INDHOLDSFORTEGNELSE...2

Læs mere

Sammenknytning af listedata fra MUD til tabel i MapInfo (SVM-eksempel)

Sammenknytning af listedata fra MUD til tabel i MapInfo (SVM-eksempel) Sammenknytning af listedata fra MUD til tabel i MapInfo (SVM-eksempel) Indhold Introduktion...1 Eksport og tilpasning af tabeldata MUD...1 Direkte til Excel...1 Via Rapport i Word-format til Excel...1

Læs mere

MANUAL. Siteloom CMS

MANUAL. Siteloom CMS MANUAL Siteloom CMS www.hjerteforeningen.dk/cms Brugernavn: Password: 3. oktober, 2013 BASIS FUNKTIONER 1. Kalender... 4 1.a. Opret... 5 1.b. Rediger eller slet... 9 2. Sider...12 2.a. Opret side...13

Læs mere

Word 2007 Vejledning til rapportskrivning

Word 2007 Vejledning til rapportskrivning Indholdsfortegnelse Generelt om Word 2007... 2 Opsætning af dokument... 2 Afsnit... 2 Sidelayout... 3 Skrifttype... 3 Indsæt sidetal... 4 Indsæt indholdsfortegnelse... 5 Overskrift til indholdsfortegnelse

Læs mere

Afgrænsning/filtrering, sortering m.v. i Klienten

Afgrænsning/filtrering, sortering m.v. i Klienten Afgrænsning/filtrering, sortering m.v. i Klienten Afgrænsning/filtrering I det efterfølgende gennemgås de tre standard afgrænsnings-/filtrerings metoder i Prisme Klient: Avanceret filter Er den overordnede

Læs mere

IKT-teknisk kommunikationsspecifikation

IKT-teknisk kommunikationsspecifikation Bilag til IKT Ydelsesspecifikation Dato 2012-10-01, Revisionsdato: 2013-04-15 Samarbejdsdokument for byggesagens parter Projekt: Byggesag: Projektledelse: IKT Koordinator: Dato: Revision: Revision dato:

Læs mere

Billeder og tegninger i Word 2007 Indhold

Billeder og tegninger i Word 2007 Indhold Billeder og tegninger i Word 2007 Indhold Indhold...1 Introduktion...2 Indsætte billeder...2 Formater billedet...3 Layout...4 Beskære billedet...4 Størrelse...5 Streger/ramme...6 Billedeffekter...6 Skygge...7

Læs mere

Afdækning af digitale kompetencer 2013

Afdækning af digitale kompetencer 2013 Afdækning af digitale kompetencer 2013 Sådan kan du bruge nedenstående skema til at vurdere dine digitale kompetencer Når du skal vurdere dine personlige it og digitale kompetence i forhold til kategorien

Læs mere

Databaseteori. 19. Databaser. 20. Kartotek eller database. 21. Database

Databaseteori. 19. Databaser. 20. Kartotek eller database. 21. Database Databaseteori 19. Databaser Fra længe før EDB alderen har man haft arkiver med viden: lande har haft folkeregistre med oplysninger om landet borgere, firmaer har haft oplysninger om kunder og salg, man

Læs mere

7DVWHYHMOHGQLQJ#²#,QWHUQHW#([SORUHU

7DVWHYHMOHGQLQJ#²#,QWHUQHW#([SORUHU 7DVWHYHMOHGQLQJ#²#,QWHUQHW#([SORUHU,QGKROGVIRUWHJQHOVH BROWSEREN - DE VIGTIGSTE FUNKTIONER OG BEGREBER.... 2 TILPAS BROWSEREN... 3 GÅ DIREKTE TIL EN KENDT ADRESSE... 5 LAV ET BOGMÆRKE... 6 ORGANISÉR DINE

Læs mere

A. Overførsel af billeder fra kamera til PC... 1. B. Filstruktur på pc en... 2. C. Filtyper (CR2, NEF, DNG, JPG samt andre)... 3

A. Overførsel af billeder fra kamera til PC... 1. B. Filstruktur på pc en... 2. C. Filtyper (CR2, NEF, DNG, JPG samt andre)... 3 FOTOKLUBBEN KRONBORG KURSUSAKTIVITETER 2011 8. SEPTEMBER 2011 Medbring kamera, USB-stick, kortlæser, kabel og bærbar pc. Der vil være brug for flere instruktører, så også de, der allerede kan organisere

Læs mere

18/11 2010 Version 2.0 Side 1 af 36

18/11 2010 Version 2.0 Side 1 af 36 Login til DJAS Gå ind på adressen http://www.djas.dk I feltet Brugernavn skrives den e-mail adresse som brugeren er registeret med i systemet. I feltet Password skrives brugerens adgangskode. Ved at sætte

Læs mere

VUC IT Niveau G. Drev Mapper Filer

VUC IT Niveau G. Drev Mapper Filer VUC IT Niveau G Drev Mapper Filer Harddiske og andre lagringsmedier ( drev ) Det mest enkle er at tænke på disk-drev som et arkivskab. Drev navngives med et bogstav. Normalt navngives med C:, D:, E: osv.

Læs mere

WEB-DIRECT Brugerguide Eksportfunktion i WEB-DIRECT

WEB-DIRECT Brugerguide Eksportfunktion i WEB-DIRECT WEB-DIRECT Brugerguide Eksportfunktion i WEB-DIRECT Indhold 1. Kom godt i gang med eksportfunktionen... 3 2. Eksport... 4 2.1 Eksport i WEB-DIRECT... 4 2.2 Brugerdefineret eksport i WEB-DIRECT... 6 2.2.1

Læs mere

Dækbranchens Miljøfond Vejledning til digital dækindberetning

Dækbranchens Miljøfond Vejledning til digital dækindberetning Dækbranchens Miljøfond Vejledning til digital dækindberetning Indhold: Indledning Kom godt i gang side 2 Login side 3 Indsamlingssteder side 4-6 Opret side 4 Redigér side 5 Slet side 6 Eksportér side 6

Læs mere

Afsnittet er temmelig teoretisk. Er du mere til det praktiske, går du blot til det næste afsnit.

Afsnittet er temmelig teoretisk. Er du mere til det praktiske, går du blot til det næste afsnit. Afsnittet er temmelig teoretisk. Er du mere til det praktiske, går du blot til det næste afsnit. XML (eng. extensible Markup Language) XML er en måde at strukturere data på i tekstform. På samme måde som

Læs mere

Oversigt over ændringer i patentbekendtgørelsen med kommentarer. Forslag til nye/ændrede bestemmelser i bekendtgørelsen.

Oversigt over ændringer i patentbekendtgørelsen med kommentarer. Forslag til nye/ændrede bestemmelser i bekendtgørelsen. Oversigt over ændringer i patentbekendtgørelsen med kommentarer. Revision af patentbekendtgørelsen 2009 Gældende bestemmelser i bekendtgørelsen Forslag til nye/ændrede bestemmelser i bekendtgørelsen. Kommentarer

Læs mere

Tjek dine miljøvalg på nettet - når det gælder en tryksag. www.miljonet.org

Tjek dine miljøvalg på nettet - når det gælder en tryksag. www.miljonet.org Tjek dine miljøvalg på nettet - når det gælder en tryksag Kære læser, Du sidder med en brochure, der beskriver et nyt websted,. Det er et websted med rigtig mange oplysninger om de miljøpåvirkninger, der

Læs mere

OPDATERINGSVEJLEDNING FOR AKC5 1.20 DECEMBER 2008

OPDATERINGSVEJLEDNING FOR AKC5 1.20 DECEMBER 2008 OPDATERINGSVEJLEDNING FOR AKC5 1.20 DECEMBER 2008 Denne vejledning beskriver installation af opdatering, nyheder og ændringer som skal bruges fra og med 1. januar 2009. Det er derfor meget vigtigt at du

Læs mere

Typografisk formatering i forskellige tekstbehandlingssystemer: Word, OpenOffice og WordPerfect. Foreløbig udgave.

Typografisk formatering i forskellige tekstbehandlingssystemer: Word, OpenOffice og WordPerfect. Foreløbig udgave. Niels Erik Wille Universitetslektor (emeritus), cand.mag. Kurset Ret&Rigtigt F10 Typografisk formatering i forskellige tekstbehandlingssystemer:, og Perfect. Foreløbig udgave. Kapitæler / Small caps Kapitæler

Læs mere

RIGSPOLITIET. Vejledning i konvertering. fra. Word -dokument. til. PDF-fil. på politi.dk. Rigspolitiets websektion

RIGSPOLITIET. Vejledning i konvertering. fra. Word -dokument. til. PDF-fil. på politi.dk. Rigspolitiets websektion RIGSPOLITIET Vejledning i konvertering fra Word -dokument til PDF-fil på politi.dk Rigspolitiets websektion Indledning Da vi skal leve op til kravene om tilgængelighed på Internettet, skal alle tekster

Læs mere

AutoPilot Sagsøkonomi, planlægning og prognose. Mappe- og filstyring

AutoPilot Sagsøkonomi, planlægning og prognose. Mappe- og filstyring AutoPilot Sagsøkonomi, planlægning og prognose Mappe- og filstyring MAPPESTYRING AutoPilot mappestyring er en programudvidelse, der giver dig adgang til en sags filer på serveren med et enkelt klik. Ved

Læs mere

Axapta 3.0 Konverteringsvejledning

Axapta 3.0 Konverteringsvejledning Axapta 3.0 Konverteringsvejledning ectrl Dokumentversion 3.0 Juli 2008 - Datakonvertering 2008 Side 1 af 14 Indholdsfortegnelse DATAKONVERTERINGSVÆRKTØJET:...3 KARTOTEK INFORMATIONSOVERSIGT - FANEBLAD...5

Læs mere

1. Opret din nye Google konto

1. Opret din nye Google konto Indhold 1. Opret din nye Google konto... 2 2. Test din nye konto... 5 3. Kom i gang med Gmail indstil sprog til dansk... 6 4. Gmail indhold på skærmen... 8 5. Skriv og send en mail... 9 Til:... 9 Cc:...

Læs mere

MANUAL. Siteloom CMS

MANUAL. Siteloom CMS MANUAL Siteloom CMS www.hjerteforeningen.dk/cms Brugernavn: Password: 13. marts, 2014 BASIS FUNKTIONER 1. Kalender... 4 1.a. Opret... 5 1.b. Rediger eller slet... 9 2. Sider...12 2.a. Opret side...13 2.b.

Læs mere