DK-Clarin-WP2-format. Dokumentation af processeringspipeline

Størrelse: px
Starte visningen fra side:

Download "DK-Clarin-WP2-format. Dokumentation af processeringspipeline"

Transkript

1 DK-Clarin-WP2-format Dokumentation af processeringspipeline Fællesdokument for WP2.2 og WP2.6 Dorte Haltrup Hansen, CST, KU 25/ GENERELT OM PROCESSEN PROCESSEN KØRSEL AF PROCESSEN FEJLSØGNING EKSEMPELOUTPUT FRA PROCESSERING PROGRAMBESKRIVELSER ET STYREPROGRAM FOR PIPELINEN Præprocesser Annotation ANDRE STYREPROGRAMMER FRA WP STYREPROGRAMMER FRA WP FÆLLES (STØRRE) PROGRAMMER PROG.segmenter.pl PROG.ClarinDaTokeniser.pl PROG.ClarinEnTokeniser.pl PROG.sent-segmenter.pl csttaggerxml Optionsfiler for csttaggerxml cststlemma Optionsfiler for cstlemma DSN termtagger (termtagger_loglikelihood_teip5.pl) Generelt om processen I DK-Clarin WP2 har vi vedtaget et fælles basisformat der skal favne de forskellige måder at tokenisere tekst på i arbejdspakkens undergrupper. Vi har også vedtaget et fælles headerformat der bygger på TEIP5 (TEIP5DKCLARIN). I arbejdspakkerne WP2.2 og WP2.6 har vi desuden skabt en fælles processeringspipeline hvor segmentering, annotering og til dels headermodellering er processer der kan genbruges. De enkelte dele i processeringspipelinen bliver beskrevet i detaljer i dette dokument. 1

2 2 Processen Input (utf8, xml, nummereret paragrafinddeling, m. header) Evt. præproces Format: Segmentering i Clarin Basic Format (cbf) Headermodellering /generering til Clarin Header Format Annotation: Tokenisering + evt. normalisering termtagging Sætnings- og paragrafsegmentering POStagging Lemmatisering Samling af: Header, cbf-segmenteret body og annotations- SpanGrps = Output (utf8, xml) 2

3 Input er en tekstfil i xml, utf8 med fortløbende nummererede paragrafinddelinger og en paragraf på hver linje. Hvis en af delene ikke er tilfældet, skal der laves en præproces som indsættes allerførst i pipelinen. Som præproces kan man fx også konvertere html eller rette uregelmæssigheder i inputteksten. Bemærk at der pt. arbejdes med 3 xml-entiteter: <, >, & hvilket vil sige at hvis <, >, & optræder i inputtet bliver det transformeret til <, >,&amp. I cbf-segmenteringen splittes inputteksten i: - interpunktionstegn, - spaces og i - andet (stort set svarende til ord). Da det kun er strenge der indledes af <p el. <head som segmenteres, er det vigtigt at præprocesseringen er i orden. Hvert cbf-element forsynes med et unikt id der kan refereres til i senere processer. Dernæst modelleres inputtekstens header så den kan validere mod det fastlagte skema. Hvis der endnu ikke er lavet en TEIP5DKCLARIN-header til teksten, skal den genereres på dette tidspunkt. Dette modul varierer derfor efter inputtets headerformat. Efter det basale Clarinformat er skabt, kan annotationslagene lægges på. Hver annotation lægges i en spangroup ved siden af teksten, og hvert led i de forskellige annotationslag refererer tilbage til et unikt id: - tokeniseringen refererer til cbf- id, - pos-annotation, lemmatisering og term-annotation refererer til de unikke token-id. I tokeniseringen samles de atomare cbf-segmenter i tokens, dvs. at interpunktionstegn og ord holdes adskilt, mens fx punktummer i forkortelser og komma i tal samles med de størrelser hvor de hører til. Hvis man ønsker at normalisere teksten fx ved at ændre stavefejl, transformere store bogstaver el.lign. kan man indsætte et script i pipelinen her. På baggrund af tokeniseringen identificeres sætningspunktummer og teksten opdeles i nummererede sætningssegmenter og paragrafsegmenter. Næste led i annotationen er POS-tagging. Pt. kræver taggeren at input er markeret med de enheder der skal tagges, fx sætninger eller paragraffer. Output ligger i en spangroup med pos-tagget klistret til tokenet. Der er derfor brug for en postproces som fjerner selve tokenet så kun POS-tag samt referencer lades tilbage i spangruppen. Samme gør sig gældende for lemmatiseringen hvor hvert token er blevet annoteret med ordets grundform, lemmaet. For både POS-tagger og lemmatiser ligger de forskellige optioner til programmerne i optionsfiler der er datomærket. Domænespecifikke tekster (fra WP2.2 og årsrapporter fra WP2.6) annoteres med en termhoodvægtning. Sidst i processen samles alle spangroups med cbf-formatet og headeren (se eksempel på en samlet fil i afsnit 5). 3

4 3 Kørsel af processen Pipelinen styres af et RUN-script (perl) der varierer en smule alt efter om det er engelske, danske, WP22-, WP26-, Acquis- eller andre tekster der køres. Pt. ligger alle scripts/programmer på serveren IDA : /opt/clarin/wp2-tools/wp26-specific (senere kaldet $wp26dir/) /opt/clarin/wp2-tools/wp22-specific (senere kaldet $wp22dir/) /opt/clarin/wp2-tools/tools (fællesscripts, senere kaldet $tooldir/) /opt/wp2_2/konverteringsscripts /var/csttools/bin/csttaggerxml /var/csttools/bin/cstlemma Pipelinen (for danske Acquis-tekster) køres med kommandoen: perl RUN_daProcesAcquis.pl. Der er på nuværende tidspunkt implementeret flere RUN-scripts, se afsnit 6. Flg. information er hard-coded og ændres derfor i RUN-scriptet: Inputfilnavn (listen af filer som skal processeres, filnavne er uden stinavne) Inputdirektorier Outputdirektorier OBS! Man kan på et senere tidspunkt implementere de hard-coded informationer som input-parametre. Underkataloger med Source year, som er en del af Acquis-input/output-katalogerne beregnes ud fra Acquis-filnavnene. Dette er ikke tilfældet for andre ikke-acquis-tekster. Input: 1) en liste af filnavne på de dokumenter der skal processeres (u. stinavn, som er hardcoded i RUN-scriptet) Format: txtfil, utf8, et filnavn på hver linje. Filnavne må ikke indeholde # Eks. fra filen da-acquis-files jrc31958q1101-da.xml jrc31958r0001-da.xml jrc31958r0003_01-da.xml jrc31960d0511-da.xml 2) selve dokumenterne der skal processeres (listet i inputfilen fra 1.) Format: xml, utf8, fortløbende nummererede paragraffer, en paragraf på hver linje, filen forsynet m. header. Filnavnet skal ende på.xml. Bemærk at hvis inputtet ikke har fortløbende paragrafnummerering, skal det laves i en præproces, fordi både segmentering og tokenisering bruger nummereringen i processering af teksterne. Endvidere skal paragrafteksten starte på samme linje som paragrafnummereringen fx:<p n="2">tillægsaftale til aftalen.</p> da det kun er strenge der indledes af <p el. <head som segmenteres. Eks. fra filen jrc21970a0720_01-da.xml <teiheader> </teiheader> <text> <body> <head n="1">tillægsaftale til aftalen vedrørende urmagervarer mellem Det europæiske </head> 4

5 <p n="2">tillægsaftale til aftalen vedrørende urmagervarer mellem Det </p> </body></text> Output: Fil(er) med ekstensionen FILNAVN.unite.xml (fx jrc21970a0720_01-da-unite.xml) Outputdirektoriet er defineret i RUN-scriptet fx: $acquisdir /OUTPUT/da/acquis-unite ( $acquisdir = /opt/clarin/wp2-tools/wp26-specific/acquis) I processen genereres en række direktorier med midlertidige outputfiler. Disse slettes til sidst når alle outputspangroups er samlet i FILNAVN.unite.xml. Bemærk at Acquis-filerne også her er anderledes end de andre filer der processeres, fordi der skabes sourceyear -underdirektorier til outputtet. Sourceyear genereres automatisk fra filnavnet. Format: xml, utf8, der overholder TEI P5 formatet og validerer mod et Clarin-WP2-skabt xml-skema: <TEI xmlns= xmlns:schemalocation=" 5

6 4 Fejlsøgning Her gives eksempler på potentielle fejlkilder i processen. Opdater gerne listen efterhånden som nye fejlkilder opstår. a) Source year Det er kun ved Acquis-filerne at der beregnes og skabes underdirektorier for source year. Hvis man modellerer sit RUN-script over RUN_daProcesAcquis.pl og ikke retter den del af programmet kommer der intet output. b) Inputfilnavn Kontroller at inputfilen (listen af filnavne) har samme filnavn som i RUN-scriptet: open(files,filnavn) c) Inputfilformat Filerne skal være utf8. Kun linjer der startes af <p og <head processeres d) Stinavn Pt. er stinavne for filer der skal processeres, hard-coded i RUN-scriptet. Inputfilen (listen af filnavne) skal derfor ikke indeholde stinavne. e) Outputdirektorier Ouputdirektorierne burde genereres under kørslen, hvor er defineret i RUN-scriptsene. Af en eller anden grund lykkes det ikke altid; men så kan de skabes manuelt inden kørslen. f) Paragrafnumre Inputfilerne (filerne der skal processeres) skal være opmærket med nummererede paragraffer. Og da det kun er linjer indledt af <p eller <head der processeres, skal der stå en paragraf med flg. Syntaks på hver linje: <p n="2">tillægsaftale til aftalen vedrørende urmagervarer mellem Det </p> g) Intet tagger/lemmatiser output Kontroler at stinavne til tagger/lemmatiser-koden er korrekt i optionsfilerne. h) perl version Der benyttes perl v som ligger: /opt/clarintools/localperl/bin/perl 6

7 5 Eksempeloutput fra processering Eksemplet er fra WP2.2-filen: 1.pdf, fra Region Hovenstaden. POS-taggeren cstclarintaggerxml er pt. kun brugt i WP2.6-filerne fra Rapid samt i dette eksempel. <TEI xmlns=" xmlns:schemalocation=" <teiheader type="text"> </teiheader> <text> <body> <p n="1"> <w xml:id="i1.1">rapport</w> <c xml:id="i1.2" type="s"/> <w xml:id="i1.3">fra</w> <c xml:id="i1.4" type="s"/> <w xml:id="i1.5">specialegruppen</w> <c xml:id="i1.6" type="s"/> <w xml:id="i1.7">i</w> <c xml:id="i1.8" type="p">:</c> </p> <p n="2"> <w xml:id="i2.1">allergologi</w> </p> <p n="3"> <w xml:id="i3.1">19</w> <c xml:id="i3.2" type="p">.</c> <w xml:id="i3.3">1</w> <c xml:id="i3.4" type="p">.</c> <w xml:id="i3.5">2006</w> </p> <p n="4"> <w xml:id="i4.1">specialegruppens</w> <c xml:id="i4.2" type="s"/> <w xml:id="i4.3">medlemmer</w> <c xml:id="i4.4" type="p">:</c> <c xml:id="i4.5" type="s"/> <w xml:id="i4.6">sygeplejedirektør</w> <c xml:id="i4.7" type="s"/> <w xml:id="i4.8">kirsten</w> <c xml:id="i4.9" type="s"/> <w xml:id="i4.10">poulsen</w> </p> </body> <spangrp ana="#cstclarindatokeniser"> <span xml:id="t1" from="#i1.1">rapport</span> <span xml:id="t2" from="#i1.3">fra</span> <span xml:id="t3" from="#i1.5">specialegruppen</span> <span xml:id="t4" from="#i1.7">i</span> <span xml:id="t5" from="#i1.8">:</span> <span xml:id="t6" from="#i2.1">allergologi</span> <span xml:id="t7" from="#i3.1" to="#i3.5"> </span> 7

8 <span xml:id="t8" from="#i4.1">specialegruppens</span> <span xml:id="t9" from="#i4.3">medlemmer</span> <span xml:id="t10" from="#i4.4">:</span> <span xml:id="t11" from="#i4.6">sygeplejedirektør</span> <span xml:id="t12" from="#i4.8">kirsten</span> <span xml:id="t13" from="#i4.10">poulsen</span> </spangrp> <spangrp ana="#cstclarinsentencesegmenter"> <span xml:id="s1" type="sseg" from="#t1" to="#t5"/> <span xml:id="s2" type="sseg" from="#t6" to="#t6"/> <span xml:id="s3" type="sseg" from="#t7" to="#t7"/> <span xml:id="s4" type="sseg" from="#t8" to="#t53"/> </spangrp> <spangrp ana="#cstclarinparagraphsegmenter"> <span xml:id="p1" type="pseg" from="#t1" to="#t5"/> <span xml:id="p2" type="pseg" from="#t6" to="#t6"/> <span xml:id="p3" type="pseg" from="#t7" to="#t7"/> <span xml:id="p4" type="pseg" from="#t8" to="#t53"/> </spangrp> <spangrp ana="#csttaggerxml"> <span xml:id="p1" from="#t1">n_indef_sing</span> <span xml:id="p2" from="#t2">præp</span> <span xml:id="p3" from="#t3">n_def_sing</span> <span xml:id="p4" from="#t4">præp</span> <span xml:id="p5" from="#t5">tegn</span> <span xml:id="p6" from="#t6">n_indef_sing</span> <span xml:id="p7" from="#t7">num</span> <span xml:id="p8" from="#t8">n_def_sing_gen</span> <span xml:id="p9" from="#t9">n_indef_plu</span> <span xml:id="p10" from="#t10">tegn</span> <span xml:id="p11" from="#t11">v_inf</span> <span xml:id="p12" from="#t12">egen</span> <span xml:id="p13" from="#t13">egen</span> </spangrp> <spangrp ana="#cstclarintaggerxml"> <span xml:id="pc1" from="t1"> NN_COM_SING_INDEF </span> <span xml:id="pc2" from="t2"> PREP </span> <span xml:id="pc3" from="t3"> NN_COM_SING_DEF </span> <span xml:id="pc4" from="t4"> PREP </span> <span xml:id="pc5" from="t5"> RESID_SIGN </span> <span xml:id="pc6" from="t6"> NPROP </span> <span xml:id="pc7" from="t7"> NPROP </span> <span xml:id="pc8" from="t8"> NN_COM_SING_GEN_DEF </span> <span xml:id="pc9" from="t9"> NN_NEUT_PLU_INDEF </span> <span xml:id="pc10" from="t10"> RESID_SIGN </span> <span xml:id="pc11" from="t11"> NN_COM_SING_INDEF </span> <span xml:id="pc12" from="t12"> NPROP </span> <span xml:id="pc13" from="t13"> NPROP </span> </spangrp> <spangrp ana="#cstlemma"> <span xml:id="l1" from="#t1" >Rapport</span> <span xml:id="l2" from="#t2" >fra</span> 8

9 <span xml:id="l3" from="#t3" >specialegruppe</span> <span xml:id="l4" from="#t4" >i</span> <span xml:id="l5" from="#t5" >:</span> <span xml:id="l6" from="#t6" >Allergologi</span> <span xml:id="l7" from="#t7" > </span> <span xml:id="l8" from="#t8" >Specialegruppe</span> <span xml:id="l9" from="#t9" >medlem</span> <span xml:id="l10" from="#t10" >:</span> <span xml:id="l11" from="#t11" >Sygeplejedirektør</span> <span xml:id="l12" from="#t12" >Kirsten</span> <span xml:id="l13" from="#t13" >Poulsen</span> </spangrp> <spangrp ana="#dsnclarindatermtaggerloglikelihood"> <span xml:id="th1" from="#t1" >2.985</span> <span xml:id="th2" from="#t2" >-4.467</span> <span xml:id="th3" from="#t3" >26.735</span> <span xml:id="th4" from="#t4" >0</span> <span xml:id="th5" from="#t5" >0</span> <span xml:id="th6" from="#t6" > </span> <span xml:id="th7" from="#t7" >0</span> <span xml:id="th8" from="#t8" >26.735</span> <span xml:id="th9" from="#t9" >3.172</span> <span xml:id="th10" from="#t10" >0</span> <span xml:id="th11" from="#t11" >18.491</span> <span xml:id="th12" from="#t12" >1.638</span> <span xml:id="th13" from="#t13" >3.990</span> </spangrp> </text> </TEI> 9

10 6 Programbeskrivelser 6.1 Et styreprogram for pipelinen Styreprogrammerne har til opgave at kalde alle andre programmer i processen samt definere input- og output direktorier og filnavne. Nedenfor er pipelinen eksemplificeret gennem styreprogrammet for Acquis. RUN_daProcesAcquis.pl Håndterer Acquis-formatet, dvs. input organiseret efter source year og i xml-format TEI P2. Modellering af Clarin-headeren tager udgangspunkt i Acquis-headeren. Input: (udførligt beskrevet i Kap. 3 Kørsel af processen) Output: (udførligt beskrevet i Kap. 3 Kørsel af processen) Præprocesser $wp26dir/prog.acquis_pre_segment.pl: transformerer specielle enheder i Acquisfilerne som fx %Aring% $tooldir/prog.conv_html_entities.pl: konverterer html-elementer fx ø ø Input: inputfil, xml, utf8, nummereret paragrafinddeling Output: Udskrives ikke men sendes direkte videre til segmentering Cbf-segmentering: Bygger på præprossering, xml, utf8 m. fortløbende paragrafnummerering Segment-id starter m. i fx <w xml:id="i1.1">region</w> $tooldir/prog.segmenter.pl: segmenterer i Clarin Basis Format (cbf). Fælles for alle styreprogrammer, beskrives nedenfor. $tooldir/prog.conv_danish_letters.pl: konverterer danske bogstaver fx ae æ Input: kommer direkte fra præproces Output: fil-cbf.xml Efter cbf-segmentering tælles antal ord, dvs. <w> -tags, og summen indsættes i headeren. Fælles for alle RUN scripter. Headermodellering: PROG.Acquis_header_converter Acquis-headeren omformes til Clarin-wp2-header-format således at Acquis headeroplysningerne genbruges. Programmet processerer alle linjer indtil tagget</teiheader mødes (headeren ender). Det er derfor vigtigt at headeren er af typen <teiheader>. De segmenterede linjer røres ikke. Der sendes flg. parametre med: source year, word count, language code (da, en, ). Disse parametre genereres automatisk i RUN-scriptet og skal sendes til programmet i nævnte rækkefølge. Oplysningerne der indsættes i headeren kommer altså fra: Acquis-headeren, som inputvariabler eller er hardcoded i scriptet. Input: fil-cbf.xml Output: fil-cbf-header.xml, fil-header.log 10

11 6.1.2 Annotation Tokenisering Bygger på cbf-segmentering, id erne i to og from er af formen: i+paragrafnr.+ segmentnr. Token-id starter altid med t fx <span xml:id="t1" from="i1.1">region</span> $tooldir/prog.clarindatokeniser.pl: samler Clarin Basis Format (CBF) til tokens (se beskrivelse nedenfor) $tooldir/prog.normaliser.pl: transformerer fx sætningsinitiale store bogstaver til små. Det er meningen at man med tiden kan tilføje flere typer normalisering. OBS! Fungerer pt. ikke (28/ ) Input: fil-cbf-header.xml Output: fil-cbf-header-tok.xml Sætningssegmentering Bygger på tokenisering, id erne i to og from starter derfor altid m. t Sætnings-id starter m. Sseg fx <span xml:id="s1" type="sseg" from="t1" to="t3"/>, Paragraf-id starter m. Pseg fx <span xml:id="p1" type="pseg" from="t1" to="t3"/> $tooldir/prog.sent-segmenter.pl: segmenterer i sætninger og paragraffer (se beskrivelse nedenfor). Segmenteringen bruges pt. ikke i POS-tagging. Input: fil-cbf-header-tok.xml Output: fil-cbf-header-tok-sent.xml og fil-cbf-header-tok-para.xml POS-tagging Bygger på tokenisering, id erne i to og from starter derfor altid med t POS-id starter med p fx <span xml:id="p1" from="t1">n_indef_sing</span> Den nuværende POS-tagger har brug for en markering af de enheder der skal tagges. Indtil sætningssegmenteringen (beskrevet ovenfor) kan anvendes af taggeren, foretages en primitiv segmentering i flg. præproces $tooldir/prog.pre-pos.pl: sætter <br/> efter hver paragraf som en simulering af sætningssegmentering Input: fil-cbf-header-tok.xml Output: fil-cbf-header-tok-prepos.xml /var/csttools/bin/csttaggerxml POS-tagging af spangrps beskrives nærmere nedenfor. For Rapid-filerne er der 2 taggere i spil: csttaggerxml (kaldet med tagger-options_ _da) og cstclarintaggerxml (kaldet med taggeroptions_clarintagger_ _da) Input: -i fil-cbf-header-tok-prepos.xml, -@ $tooldir/tagger-options_ _da Output: -o fil-cbf-header-tok-tmppos.xml 11

12 Input: -i fil-cbf-header-tok-prepos.xml, $tooldir/ tagger-options_clarintagger_ _da Output: -o fil-cbf-header-tok-tmpclarinpos.xml $tooldir/prog.post-pos.pl og $tooldir/prog.post-clarinpos.pl Postproces til POS der fjerner <br\> igen, omdøber t-id til p-id, fjerner i-referencerne (der er overlevet i to og from i token-spangrps) og indsætter reference til t (tokenformat) i to og from, fjerner selve ordene og lader kun POS-tag tilbage. Processen er samtidig en præproces til lemmatiseren. Her bibeholdes selve ordet og POS-tagget indsættes som et pos-attribut og der indsættes et tomt lemma-attribut. Input: fil-cbf-header-tok-tmppos.xml Output: fil-cbf-header-tok-pos.xml, fil-cbf-header-tok-tmppos-prelemma.xml Lemmatisering Bygger på tokenisering, id erne i to og from starter derfor altid med t Lemma-id starter med l fx <span xml:id="l1" from="t1" >region</span> Præproces er samlet med postprocessen for PoS-taggeren (se beskrivelsen af PROG.post-POS.pl ovenfor) /var/csttools/bin/cstlemma Lemmatisering af spangrps og optionsfil beskrives nærmere nedenfor Input: fil-cbf-header-tok-tmppos-prelemma.xml, -@ lemma-options_ _da Output: fil-cbf-header-tok-pos-tmplemma.xml $tooldir/prog.post-lemma.pl Postproces til lemmatiseringen der modellerer den spangrp (fra POS) som var input. Omdøber p-id til l-id, fjerner POS-tagget, ordformen og lader kun lemmaet stå tilbage. Input: fil-cbf-header-tok-pos-tmplemma.xml Output: fil-cbf-header-tok-pos-lemma.xml Samling af spangrps: Alle spangrps med header + cbf samles med unix-commandoen cat Input: fil-cbf-header.xml, fil-cbf-header-tok.xml, fil-cbf-header-tok-sent.xml, fil-cbf-header-tok-poslemma.xml Output: fil-preunite.xml $tooldir/prog.change_unite_header_da.pl: Retter i fil-preunite.xml så den kan validere fx slutter med: </text></tei>. Indsætter information om annotationsværktøjerne i headeren, disse er pt. hardcoded. Indsætter revisionsdato i headeren Input: fil-preunite.xml Output: fil-unite.xml Sidst slettes midlertidige outputfiler og kun den samlede fil-unite.xml beholdes. TEI-validering: xmllint --relaxng /var/vhosts/dkclarin.dk/schemas/wp2/teidkclarin.rng --noout fil-unite.xml 12

13 6.2 Andre styreprogrammer fra WP.2.6 RUN_enProcesAcquis.pl: identisk med RUN_daProcesAcquis.pl bortset fra at det er de engelske versioner af programmerne der kaldes. Formatet er det samme som i det danske Acquis. RUN_daProcesRapid.pl: Processerer pressemeddelelser fra EU pressetjeneste Rapid. Præprocesserne er lidt anderledes end for Acquis-filerne fordi Rapid-filerne foreligger i html. Annoteringen er stort set den samme; dog er cstclarintaggerxml (POS-tagger) tilføjet. RUN_enProcesRapid.pl: som RUN_daProcesRapid.pl uden cstclarintaggerxml. RUN_daProcesAnnualReports.pl: Processerer årsrapporter fra store danske virksomheder. Præprocesserne er lidt anderledes end Acquis-filerne fordi udgangspunktet er pdf-filer konverteret til text vha. unixkommandoen pdftotext. Annoteringen er stort set den samme; dog er DSN-termtagger er tilføjet. RUN_enProcesAnnualReports.pl: som RUN_daProcesAnnualReports.pl: uden DSN-termtagger. 6.3 Styreprogrammer fra WP.2.2 Der er 28 styreprogrammer for filerne i WP2.2. Det høje antal skyldes at der er mange tekstleverandører og flere filformater (pdf og html). Alle scripts er bygget over RUN_daProcesAcquis.pl men adskiller sig fra det dels ved præprocesserne og dels ved at alle filer er term-tagget. Styrerprogrammerne ligger i IDA:/opt/clarin/wp2-tools/wp22-specific. Pdf-filerne er konverteret til text-format vha. unix-kommandoen pdftotext; mens HTML-filerne viste sig i de fleste tilfælde relativt enkle at konvertere til XML, idet værktøjet TagSoup ( muliggør nem konvertering fra (muligvis invalid) HTML til valid XHTML som igen kan konverteres til XML ved hjælp af et XSLT-script og en XSLT-fortolker som Saxon ( I nogle tilfælde var det også muligt automatisk at trække alle relevante metadata om teksten ud af det originale HTML. XSLT-scriptsne ligger i /opt/wp2_2/konverteringsscripts/. Præprocesser: /opt/wp2_2/konverteringsscripts/prog_texttoxml. Indsætter <p> og sletter bindestreg over linjeskift. /opt/wp2_2/konverteringsscripts/prog_modifyrawpdftotext.pl. Laver velformet xml. makeutf8. Konverterer input til utf8. Bruges kun til ISO-filer $wp22dir/prog.wp22preproces.pl. Modellerer selve xml-inputtet og nummererer <p>-tags Headermodellering: $wp22dir/prog.dawp22convert-header.pl.indsætter antal ord og paragraffer i headeren. WP2.2 styreprogrammer: - RUN_agrsci_daProcesWP22.pl (fra pdf) - RUN_AktuelNatur_1_daProcesWP22.pl (fra pdf) 13

14 - RUN_AktuelNatur_2_daProcesWP22.pl (fra pdf) - RUN_DMU_daProcesWP22.pl (fra pdf) - RUN_erhvervsOgByggestyrelsen_daProcesWP22.pl (fra pdf) - RUN_erhvervsOgByggestyrelsen_2_daProcesWP22.pl (fra html) - RUN_erhvervsOgSelskabsstyrelsen_daProcesWP22.pl (fra pdf) - RUN_finanstilsynet_daProcesWP22.pl (fra pdf) - RUN_finanstilsynet_2_daProcesWP22.pl (fra html) - RUN_Hovedland_daProcesWP22.pl (fra pdf) - RUN_librisIT_daProcesWP22.pl (fra html) - RUN_librisSundhed_daProcesWP22.pl (fra pdf) - RUN_muro_daProcesWP22.pl (fra pdf) - RUN_nano_1_daProcesWP22.pl (fra pdf) - RUN_nano_2_daProcesWP22.pl (fra pdf) - RUN_nano_3_daProcesWP22.pl (fra pdf) - RUN_nano_4_daProcesWP22.pl (fra html) - RUN_nano_5_daProcesWP22.pl (fra html) - RUN_nano_6_daProcesWP22.pl (fra html) - RUN_netpatient_daProcesWP22.pl (fra html) - RUN_OekRaad_daProcesWP22.pl (fra html) - RUN_OO_it_daProcesWP22.pl (fra html) - RUN_regionH_daProcesWP22.pl (fra pdf) - RUN_SBI_daProcesWP22.pl (fra pdf) - RUN_SKAT_daProcesWP22.pl (fra html) - RUN_soefartsstyrelsen_daProcesWP22.pl (fra pdf) - RUN_SST_daProcesWP22.pl (fra pdf) - RUN_sundhed_dk_daProcesWP22.pl (fra html) 14

15 6.4 Fælles (større) programmer Nedenfor beskrives de større programmer der kaldes fra alle styreprogrammer. Input, output samt hvor i pipelinen de kaldes er beskrevet i afsnit 6.1, outputformat er beskrevet i Kap 5. Programmerne ligger alle i: /opt/clarin/wp2-tools/tools PROG.segmenter.pl Segmenterer input til Clarin Basic Format. Inputtet indeholder en header; men denne røres ikke på nuværende tidspunkt. Segmenterne inddeles i: - space-agtige entiter som benævnes type="s": (\s \t ) Ex. <c xml:id="i1.7" type="s"/> Bemærk at den space-agtige entitet ikke er udtrykt! - punctuation entiteter som benævnes type="p": [\', \(, \), \[, \], \{, \}, \:, \,, \-, \, \, \, \!, \., \, \, \«, \», \?, \, \, \, \, \;, \\, \/, \"] Ex. <c xml:id="i1.8" type="p">:</c> - andet som benævnes type="w": Ex. <w xml:id="i2.1">allergologi </w> Segmenterne nummereres i+ paragrafnr.+ordnr. Kun linjer der starter med <p eller <head i inputtet processeres da det er her den relevante tekst forventes. Det er derfor vigtigt at inputtet har det korrekte format. Eks. på inputformat: fx:<p n="1">rapport fra specialegruppen i:.</p> Eks. på outputformat: <w xml:id="i1.1">rapport</w> <c xml:id="i1.2" type="s"/> <w xml:id="i1.3">fra</w> <c xml:id="i1.4" type="s"/> <w xml:id="i1.5">specialegruppen</w> <c xml:id="i1.6" type="s"/> <w xml:id="i1.7">i</w> <c xml:id="i1.8" type="p">:</c> Desuden fjernes flere efterfølgende spaces, initialt og finalt space og <, >, & omformes til til xml-valide entiteter (<, >, &) PROG.ClarinDaTokeniser.pl CstClarinDaTokeniser version 1.0 Tokeniseren samler CBF-elementer til relevante tokens. Paragrafnummereringen bruges således at de samlede dele af et token skal findes inden for samme paragraf (der ca. svare til en sætning i Acquis). Der gøres brug af en liste af forkortelse uden punktum fork_short-utf8 og en liste af interpunktionstegn punctuation. Følgende tilfælde behandles: 15

16 1) Punktum 1.1 Forkortelsespunktummer 1.2 Uautoriserede forkortelser - hvor der ikke kommer ord med stort eller tal efter punktummet 1.3 Ordenstal <100 og datoer m. evt. årstal samlet m. punktummer 1.4 Inde midt i ord, fx i url og tal 2) Semikolon 2.1 Semikolon som del af &apos; midt i et ord 2.2 Semikolon som del af & midt i et ord 3) Komma 3.1 Komma mellem 2 tal, også hvis der er tusindtalseparator i 4) Bindestreg 4.1 Bindestreg mellem 2 tal eller ord 4.2 Bindestreg i slutningen af et ord/tal (Er endnu ikke implementeret!!) 5) Skråstreg / 5.1 Skråstreg midt i et ord 6) Backslash 6.1 Backslash midt i et ord 7) Apostrof ' 7.1 Hvis der er 'noget' (tal eller bogstaver) på begge sider af apostrof('), samles det (det gælder både genitiv 's, 'er, 'erne osv.) 8) en slags apostrof Hvis der er 'noget' (tal eller bogstaver) på begge sider af apostrof( ), samles det (det gælder både genitiv s, er, erne osv.) PROG.ClarinEnTokeniser.pl CstClarinEnTokeniser version 1.0 Programmet er modelleret over PROG.ClarinDaTokeniser.pl, derfor er beskrivelsen nærmest identisk. Det er specielt ved apostrof at de to tokenisere er forskellige. Tokeniseren samler CBF-elementer til relevante tokens. Paragrafnummereringen bruges således at de samlede dele af et token skal findes inden for samme paragraf (ca. en sætning). Der gøres brug af en liste af forkortelser uden punktum en-abbr og en liste af interpunktionstegn punctuation. Outputtet er en spangrp uden header: <spangrp ana="# CstClarinEnTokeniser"> </spangrp> Følgende tilfælde behandles: 1. Punktum 1.1 Forkortelsespunktummer 1.2 Uautoriserede forkortelser- der stater m stort og indeholder max 3 tegn 1.3 Uautoriserede forkortelser - hvor der ikke kommer ord med stort efter 1.4 Ordenstal <100 og datoer m. evt. årstal samlet m. punktummer 1.5 Inde midt i ord, fx i url og tal 2. Semikolon 2.1 Semikolon som del af &apos; midt i et ord 2.2 Apostrof (&apos; )mellem n og t i fx aren't 16

17 2.3 Semikolon som del af & midt i et ord 3. Komma 3.1 Komma mellem 2 tal, også hvis der er tusindtalsseparator i 4. Bindestreg 4.1 Bindestreg mellem 2 tal eller ord 4.2 Bindestreg i slutningen af et ord/tal (Er endnu ikke implementeret!!) 5. Skråstreg / 5.1 Skråstreg midt i et ord 6. Backslash 6.1 Backslash midt i et ord 7. Apostrof ' 7.1 Apostrof mellem n og t i fx aren't (aren't => are n't, aren(id=1)'(id=2)t(id=3)) => are(id=1) n't(id: from=2 to=3)) 7.2 Apostrof før m,s,d 7.3 Apostrof før re, ve, ll PROG.sent-segmenter.pl CstClarinSentenceAndParagraphSegmenter version 1.0 Markerer teksten med udstrækning af sætninger og paragraffer. Udstrækning af paragraffer er kodet som første tal i det tokeniserede inputs from attribut (fx from="i4.1). Udstrækningen af sætninger beregnes på baggrund af sætningspunktum (identificeret af tokeniseren), udråbtegn og spørgsmålstegn (.!?). Der laves to outputfiler: én for sætningssegmentering og én for paragrafsegmentering Eks. tokeniseret input: <span xml:id="t1" from="#i1.1">rapport</span> <span xml:id="t2" from="#i1.3">fra</span> <span xml:id="t3" from="#i1.5">specialegruppen</span> <span xml:id="t4" from="#i1.7">i</span> <span xml:id="t5" from="#i1.8">:</span> <span xml:id="t6" from="#i2.1">allergologi</span> Eks. spangrp-output: <span xml:id="s1" type="sseg" from="#t1" to="#t5"/> <span xml:id="s2" type="sseg" from="#t6" to="#t6"/> <span xml:id="p1" type="pseg" from="#t1" to="#t5"/> <span xml:id="p2" type="pseg" from="#t6" to="#t6"/> csttaggerxml csttaggerxml version 3.1 (Ida: /var/csttools/bin/csttaggerxml) CST s videreudvikling af Brills tagger så den kan fungere på xml og de spangrp vi definerer i Clarin-WP2, ud over det er funktionaliten som den almindelige tagger. Taggeren kræver at det tokeniserede input er markeret ift. de størrelser der skal tagges (fx sætninger eller paragraffer). Pt. gøres det ved at indsætte <br> via en præproces, men det er tanken at sætningssegmenteringen skal bruges. Outputtet er også en spangrp, hvor en postproces skal fjerne <br> og token, så filen kun indeholder info om POS-tags. 17

18 6.4.6 Optionsfiler for csttaggerxml I optionsfilerne er defineret hvilke ordbøger, regler, defaulttags, sætningsmarkør og inputformat. Den danske version af POS-taggeren bruger dels CSTtags (50 tags som brugt i MOSES-projektet) og dels Clarintags(103 tags defineret i DK-Clarin). I den engelske version bruges PennTreebank-tags. Disse oplysninger er ikke eksplicit udtrykt, i optionsfilerne; men ligger implicit i hvilke ordbøger og regler der bruges. Bemærk derfor at både STO-, PoS-, PAROLE- og lemmatiserens tags (de morfosyntaktiske oplysningstyper) skal ændres hvis man ændrer i POS-tagsættet. - tagger-options_ _da definerer CSTtags, - tagger-options_clarintagger_ _da definerer Clarintags. - tagger-options_ _en definerer PennTreebank-tags cststlemma cstlemma version 4.0 (Ida: /var/csttools/bin/cstlemma) Som taggeren er lemmatiseren en videreudvikling af den eksisterende lemmatiser, så den kan håndtere xml og spangrps. I inputtet til lemmatiseren kræves at selve ordet bibeholdes, at POS-tagget indsættes som et pos-attribut og der indsættes et tomt lemma-attribut. Det gøres i en præproces. En postproces omformer id og fjerner ordformerne og POS-tags igen Optionsfiler for cstlemma I optionsfilerne defineres input og outputformat samt ordbøger og regler som lemmatiseren skal bruge. Lemmatiseren er trænet på STO og det tagsæt der bruges til beregning af lemmaerne er det samme som POStaggeren bruger. Derfor skal både STO-, PoS-, PAROLE- og lemmatiserens tags (de morfosyntaktiske oplysningstyper) ændres hvis man ændrer i POS-tagsættet. - lemma-options_ _da definerer dansk lemmatisering. - lemma-options_ _en definerer engelsk lemmatisering DSN termtagger (termtagger_loglikelihood_teip5.pl) Genererer en spangroup med termhood-værdier for samtlige tokens i input. Termhood-værdierne beregnes på basis af frekvensoplysninger i et almensprogligt referencekorpus sammenholdt med frekvensen af den givne token lokalt i inputdokumentet. Værdierne beregnes med den statistiske metode log-likelihood. Input: dokumentets token-lag og termlag (sidstnævnte indeholder dummy-værdier) Output: dokumentets termlag (nu med de aktuelle termhood-værdier) Valg af referencekorpus: Referencekorpusset med de almensproglige ordfrekvenser er en stor samling nyhedsartikler fra 2007 (i alt ca. 90 mio. løbende ord) som er leveret til Dansk Sprognævn af Infomedia. Årsagen til at vælge dette korpus frem for fx Korpus 2000 er at de almensproglige tekster helst skulle stamme fra samme periode som de fagsproglige tekster. Normalisering: alle tokens i input omformes til lower-case. Det sker da der ikke skelnes mellem store og små bogstaver i MySQL-databasen med de almensproglige ordfrekvenser, og da det erfaringsmæssigt giver mere 18

19 pålidelige resultater at slå varianterne sammen. Årsagen til at arbejde med tokenlaget i stedet for lemmalaget er at referencekorpusset ikke er lemmatiseret og at der ved lemmatisering erfaringsmæssigt kan gå vigtige fagsproglige karakteristika tabt. Fx har passivformer generelt en større hyppighed i fagsproglige tekster end i almensproglige tekster, og fagsproget kan i visse tilfælde have monopol på passivformen af et givet verbum. Udfaldsrum for termhood: - - Valg af statistisk metode for termhood: kollokationsstatistik med såkaldte contingency tables (jf. anvendes ofte i den datatmatiske terminologi til automatisk termgenkendelse (ATR). Vi har valgt formlen log-likelihood, da denne formel er mere konservativ og tillægger lav-frekvente fænomener lidt mindre vægt end fx den alternative formel log-odds. Log-likelihood inddrager både de forventede frekvenser og de observerede frekvenser i reference- kontra analysekorpusset, mens log-odds kun tager de observerede frekvenser i betragtning. Erfaringsmæssigt giver log-odds derfor lidt for meget støj i form af fx stavefejl. En fremtidig version af term-taggeren burde imidlertid generere termlag med begge formler, da de kan supplere hinanden. Negativ termhood: Hvis den relative frekvens af en given token er større i det almensproglige korpus end i det fagsproglige korpus ganges termhood med -1. Dermed kan termhood både bruges til at identificere tokens som er særligt karakteristiske for de fagsproglige tekster (høje, positive termhood-værdier) og tokens som er særligt ukarakteristiske (underrepræsenterede) for de fagsproglige tekster (høje, negative termhoodværdier). Neutrale tokens: Termtaggeren tildeler alle tokens der har en længde på ét eller to tegn termhood-værdien 0. Talord og ikke-ord (ord som alene indeholder ikke-alfanumeriske tegn) tildeles ligeledes termhood-værdien 0. 19

Find resurser i CLARIN-DK

Find resurser i CLARIN-DK Find resurser i CLARIN-DK Introduktion CLARIN-DK-repositoriet indeholder et væld af digitalt materiale, digitale forskningsobjekter, som i CLARINregi kaldes resurser. Det er langt overvejende tekstfiler,

Læs mere

DK-CLARIN FAGSPROGLIGT KORPUS

DK-CLARIN FAGSPROGLIGT KORPUS DK-CLARIN FAGSPROGLIGT KORPUS Dokumentation Indhold Dokumentation... 1 1 Indledning... 2 2 Korpusopbygning... 2 2.1 Domæner i korpusset... 3 2.2 Tekster fordelt på kommunikationstyper... 4 3 Tekstindsamling

Læs mere

Det islandske ordklasseopmærkede korpus MÍM Sigrún Helgadóttir

Det islandske ordklasseopmærkede korpus MÍM Sigrún Helgadóttir Det islandske ordklasseopmærkede korpus MÍM Sigrún Helgadóttir Det islandske ordklasseopmærkede korpus Oversigt over foredraget: Hvor stammer projektet fra? Hvad er et ordklasseopmærket korpus? Hvordan

Læs mere

Klargøring af tekstresurser til deponering i CLARIN-DK

Klargøring af tekstresurser til deponering i CLARIN-DK Klargøring af tekstresurser til deponering i CLARIN-DK Introduktion Du kan deponere tekstresurser i CLARIN-DK på 2 måder: som tekstklumper (kaldet data) der er komprimerede i zip-filer som ikke bliver

Læs mere

Encoding:...1 Et tegn sæt (character set):...1 UTF-8 og UTF-16 (Unicode):...2

Encoding:...1 Et tegn sæt (character set):...1 UTF-8 og UTF-16 (Unicode):...2 Encoding:...1 Et tegn sæt (character set):...1 UTF-8 og UTF-16 (Unicode):...2 Encoding: Vi har tidligere set på spørgsmålet om et XML dokuments encoding. Det er generelt altid en god ide at gemme et dokument

Læs mere

I denne artikel, vil der blive gennemgået de grundlæggende PHP-funktioner, såsom udskrift til skærmen, tid og dato og if-sætningen.

I denne artikel, vil der blive gennemgået de grundlæggende PHP-funktioner, såsom udskrift til skærmen, tid og dato og if-sætningen. Denne guide er oprindeligt udgivet på Eksperten.dk Grundlæggende PHP I denne artikel, vil der blive gennemgået de grundlæggende PHP-funktioner, såsom udskrift til skærmen, tid og dato og if-sætningen.

Læs mere

R E D C A P M A N U A L. Importér data til REDCap fra CSV-fil. Opbyg din eksisterende database i REDCap Version 1.0

R E D C A P M A N U A L. Importér data til REDCap fra CSV-fil. Opbyg din eksisterende database i REDCap Version 1.0 R E D C A P M A N U A L Importér data til REDCap fra CSV-fil Opbyg din eksisterende database i REDCap Version 1.0 Introduktion Der opstår ofte et ønske om at importere data fra andre databaser til REDCap,

Læs mere

Det. Bind. Journal of. Citations. Impact Factor. Articles. Books. Patents

Det. Bind. Journal of. Citations. Impact Factor. Articles. Books. Patents Det Natur og Biovidenskabelige Fakultet SCIENCE Forskningsdokumentation Guide til Rapportgenerering i CURIS Bind 1: Grundlæggendee rapportering 160 70 140 60 120 50 100 40 80 60 30 40 20 20 10 0 0 Journal

Læs mere

En Kort Introduktion til Oracle

En Kort Introduktion til Oracle En Kort Introduktion til Oracle Henrik Bulskov 12. februar 2001 bulskov@ruc.dk 1 Start SQL*Plus... 1 1.1 TELNET... 1 1.2 WINDOWS SQL PLUS... 2 2 Kør et SQL-script... 3 3 Hjælp i SQL*Plus... 3 4 Editering

Læs mere

Brug af CLARIN s værktøjer til at skabe AcaDan, et korpus for dansk akademisk sprog

Brug af CLARIN s værktøjer til at skabe AcaDan, et korpus for dansk akademisk sprog Brug af CLARIN s værktøjer til at skabe AcaDan, et korpus for dansk akademisk sprog Anne Sofie Jakobsen, ph.d.-stipendiat Institut for Engelsk, Germansk og Romansk Dias 1 LUNAS nordisk netværk 2013-2016

Læs mere

Håndbog Til CPR services. Bilag 8 GCTP-standard m.m. CPR-kontoret

Håndbog Til CPR services. Bilag 8 GCTP-standard m.m. CPR-kontoret Håndbog Til CPR services Bilag 8 GCTP-standard m.m. CPR-kontoret Datavej 20, Postboks 269, 3460 Birkerød E-post: cpr@cpr.dk. Telefax 45 82 51 10. Hjemmeside: www.cpr.dk Side 2 af 14 Indholdsfortegnelse

Læs mere

Integration af DocuBizz og Helios

Integration af DocuBizz og Helios Integration af DocuBizz og Helios v. 0.2 Side 1 af 7 Integration af DocuBizz og Helios 1 Overordnet beskrivelse... 1 2 Format for de overførte data... 1 3 Overførsel af stamdata fra Helios til DocuBizz...

Læs mere

DIVISIONSMATCHBEREGNING VERSION 1.07

DIVISIONSMATCHBEREGNING VERSION 1.07 DIVISIONSMATCHBEREGNING VERSION 1.07 ANDERS KLINTING FIF HILLERØD ORIENTERING 2. MAJ 2013 1 INDHOLD Divisionsmatchberegning... 3 Historik... 3 Løbsdata... 3 løbsdata fra OE2003... 3 Løbsdata andre programmer...

Læs mere

PHP 3 UGERS FORLØB PHP, MYSQL & SQL

PHP 3 UGERS FORLØB PHP, MYSQL & SQL PHP 3 UGERS FORLØB PHP, MYSQL & SQL Uge 1 & 2 Det basale: Det primære mål efter uge 1 og 2, er at få forståelse for hvordan AMP miljøet fungerer i praksis, og hvordan man bruger PHP kodesproget til at

Læs mere

Installationsvejledning til Virk Tæller

Installationsvejledning til Virk Tæller Installationsvejledning til Virk Tæller Version 1 Indhold Hvad er Virktælleren?... 2 Brugeradfærd... 2 Brugeranvisning til indsættelse af JavaScript... 2... 2 Start-script... 2 Completed-script... 2 Test

Læs mere

Brugervejledning til registrant

Brugervejledning til registrant Brugervejledning til registrant Når man logger på kommer man ind på en side der ser ud som nedenfor. På siden optræder alle de metadatabeskrivelser som man har rettigheder over. 1 2 3 4 5 6 7 8 9 10 11

Læs mere

0.9 19-09-2012 DAVAR Omdøbt til SagDokumentFormat. Attention er skilt ud i et selvstændigt format, AttentionFormat.

0.9 19-09-2012 DAVAR Omdøbt til SagDokumentFormat. Attention er skilt ud i et selvstændigt format, AttentionFormat. Specifikation 19. september 2012 DAVAR J.nr. 2012-6211-281 Sagdokumentformat Versionshistorik Version Dato Initialer Noter 0.7 15-06-2012 DAVAR Høringsversion. Indsat MeddelelseAttention. 0.9 19-09-2012

Læs mere

Sproget Six. Til brug i rapportopgaven på kurset Oversættere. Vinter 2006. Abstract

Sproget Six. Til brug i rapportopgaven på kurset Oversættere. Vinter 2006. Abstract Sproget Six Til brug i rapportopgaven på kurset Oversættere Vinter 2006 Abstract Six er baseret på det sprog, der vises i figur 6.2 og 6.4 i Basics of Compiler Design. Den herværende tekst beskriver basissproget

Læs mere

Indledning. På de følgende sider vises, primært i tegneserieform, lidt om mulighederne i PC-AXIS for Windows.

Indledning. På de følgende sider vises, primært i tegneserieform, lidt om mulighederne i PC-AXIS for Windows. Indledning PC-AXIS for Windows er et talbehandlingsprogram, der kan håndtere store mængder statistisk materiale. PC-AXIS giver mulighed for at arbejde videre med det statistiske materiale i egne programmer

Læs mere

De vigtigste SQL-sætninger. SQL kap Oprette database. DDL og DML

De vigtigste SQL-sætninger. SQL kap Oprette database. DDL og DML SQL kap 6-7 + 17-20 DDL og DML 1 De vigtigste SQL-sætninger Data Definition Language (DDL) create table: opretter en ny tabel create unique index: tilføjer et index til en tabel drop table : sletter en

Læs mere

Oprette Aktiviteter, Møder, Tilbud, Produkter, Tilbud og Leverancer fra en import.

Oprette Aktiviteter, Møder, Tilbud, Produkter, Tilbud og Leverancer fra en import. Dataimport Introduktion Dataimport i webcrm er designet til at: Importere data fra en eksisterende database eller en ny datafil Opdatere eksisterende data med ny data Oprette Aktiviteter, Møder, Tilbud,

Læs mere

PHP guide af Daniel Pedersen

PHP guide af Daniel Pedersen PHP guide af Daniel Pedersen Side 1 af 12 Indholdsfortegnelse PHP guide af Daniel Pedersen Side 2 af 12 Indledning I dette hæfte finder du forklaringer til PHP funktioner, løkker, variabler samt en række

Læs mere

Dokumentation af programmering i Python 2.75

Dokumentation af programmering i Python 2.75 Dokumentation af programmering i Python 2.75 Af: Alexander Bergendorff Jeg vil i dette dokument, dokumentere det arbejde jeg har lavet i løbet opstarts forløbet i Programmering C. Jeg vil forsøge, så vidt

Læs mere

Eksamen, DSDS, forår 2009

Eksamen, DSDS, forår 2009 Eksamen, DSDS, forår 2009 Introduktion til Scripting, Databaser og Systemarkitektur Jonas Holbech IT Universitetet i København 3. juni 2009 Alle hjælpemidler er tilladte, dog ikke computer og kommunikationsmidler.

Læs mere

FESD-standardiseringsgruppen Att: Palle Aagaard IT- og Telestyrelsen IT-strategisk kontor Holsteinsgade 63 2100 København Ø

FESD-standardiseringsgruppen Att: Palle Aagaard IT- og Telestyrelsen IT-strategisk kontor Holsteinsgade 63 2100 København Ø FESD-standardiseringsgruppen Att: Palle Aagaard IT- og Telestyrelsen IT-strategisk kontor Holsteinsgade 63 2100 København Ø Høringssvar vedr. FESD GIS-integrationsmodel version 2.0 Geodata Danmark har

Læs mere

It-støttet excerpering og registrering af nye ord og ordforbindelser

It-støttet excerpering og registrering af nye ord og ordforbindelser It-støttet excerpering og registrering af nye ord og ordforbindelser Møde i Selskab for Nordisk Filologi 30. oktober 2008 Jakob Halskov Projektforsker, ph.d. Dansk Sprognævn jhalskov@dsn.dk Disposition

Læs mere

Vejledning til validator test af metadata

Vejledning til validator test af metadata Vejledning til validator test af metadata Test af metadata finds under kategorien Metadata (Technical Guidance version 1.3). Man kan teste en eller flere ISO 19115/19119 metadata XML og GML filer, ved

Læs mere

PHP Snippets. De små korte. Skrevet af Daniel Pedersen

PHP Snippets. De små korte. Skrevet af Daniel Pedersen PHP Snippets De små korte Skrevet af Daniel Pedersen Indhold PHP Snippets De små korte er en samling af små og praktiske kode eksempler med kort forklaring, som med formål at kunne benyttes til opsalgsværk

Læs mere

Manual til opsætning af Jit-klient version 1.0. Opsætning. Copyright Jit-Danmark Aps 2006. Find mere information på www.jitbesked.

Manual til opsætning af Jit-klient version 1.0. Opsætning. Copyright Jit-Danmark Aps 2006. Find mere information på www.jitbesked. Opsætning Indholdsfortegnelse Sådan finder du indstillingerne...3 Muligheder og begrænsninger...6 Hvilke søgeord skal jeg bruge?...6 Ting man skal passe på...6 Tilføjning/nedlægning af søgeord...6 Ændring

Læs mere

Web sider. Introduktion: Har du nogensinde spekuleret over, hvordan det verdesomspændende internet virker og hvordan man snakker med det?

Web sider. Introduktion: Har du nogensinde spekuleret over, hvordan det verdesomspændende internet virker og hvordan man snakker med det? Introduktion: Har du nogensinde spekuleret over, hvordan det verdesomspændende internet virker og hvordan man snakker med det? I dag skal du lære at lave hjemmesider, så du også kan bidrage til at opbygge

Læs mere

Afsnittet er temmelig teoretisk. Er du mere til det praktiske, går du blot til det næste afsnit.

Afsnittet er temmelig teoretisk. Er du mere til det praktiske, går du blot til det næste afsnit. Afsnittet er temmelig teoretisk. Er du mere til det praktiske, går du blot til det næste afsnit. XML (eng. extensible Markup Language) XML er en måde at strukturere data på i tekstform. På samme måde som

Læs mere

Korpusbaseret lemmaselektion og opdatering

Korpusbaseret lemmaselektion og opdatering Korpusbaseret lemmaselektion og opdatering Jørg Asmussen Afdeling for Digitale Ordbøger og Tekstkorpora Det Danske Sprog- og Litteraturselskab www.dsl.dk Program 1. Introduktion til DSL 2. Introduktion

Læs mere

Byggebasen Javascript

Byggebasen Javascript EG Data Inform Byggebasen Javascript Implementering af ansvarsperioder og produktdata på eget site Jens Karsø 2013 Indhold Byggebasen javascript-plugin til DB12-site... 2 DB12-site kommunikationsmodel...

Læs mere

Digitale Videnssystemer: Notater

Digitale Videnssystemer: Notater Digitale Videnssystemer: Notater Sigfred Hyveled Nielsen IVA / Københavns Universitet 3. Semester Denne tekst er skrevet af Sigfred Nielsen, og stillet til rådighed under Creative Commons Navngivelse-IkkeKommerciel-DelPåSammeVilkår

Læs mere

ITD ecmr WEB Services. Af Allan Wisborg, IT Udvikler

ITD ecmr WEB Services. Af Allan Wisborg, IT Udvikler Af Allan Wisborg, IT Udvikler Til løsningen ecmr Det elektroniske fragtbrev udbydes en række offentlige WEB services. Dette er beskrivelsen af disse services og hvorledes de anvendes. 21. December 2015

Læs mere

DK CLARIN: METADATA FOR WP4 RESSOURCER

DK CLARIN: METADATA FOR WP4 RESSOURCER DK CLARIN: METADATA FOR WP4 RESSOURCER DK CLARIN WP 4 Version 2011 02 01 Bolette S. Pedersen, KU, bspedersen@hum.ku.dk Lene Offersgaard, KU, leneo@hum.ku.dk Nicolai H. Sørensen, DSL, nhs@dsl.dk Viggo Sørensen,

Læs mere

Skabelonfilen er udarbejdet i Word til Windows (Office 2010) og er også afprøvet i Word til Mac.

Skabelonfilen er udarbejdet i Word til Windows (Office 2010) og er også afprøvet i Word til Mac. Nordiske Studier i Leksikografi 13 (København 2015) Brug af stilark Vi vil gerne have at alle forfattere benytter den Word-fil som redaktionen har udarbejdet og sendt ud, både forfattere og redaktører

Læs mere

BRUGERMANUAL TIL N-PDF

BRUGERMANUAL TIL N-PDF BRUGERMANUAL TIL N-PDF NORRIQ A/S Side 1 1. Opsætning af edocprinter PDF Pro... 4 2. Opsætning af dokumenttyper... 9 2.1 Fanebladet Generelt... 10 2.1.1 Feltet Rapport-id... 10 2.1.2 Feltet Rapportnavn...

Læs mere

xgalleri Mulige filtyper Installation web-version

xgalleri Mulige filtyper Installation web-version xgalleri xgalleri opstod ud fra ønsket om at lægge en større samling billeder på nettet. Der findes mange programmer, som kan bruges til at lægge datafiler på nettet; men de fungerer typisk på den måde,

Læs mere

Sprogteknologi I Undervisningsplan Forårssemester 2008

Sprogteknologi I Undervisningsplan Forårssemester 2008 Sprogteknologi I Undervisningsplan Forårssemester 2008 Patrizia Paggio 27/9/2007 1 Introduktion til sprogteknologi Hvad er sprogteknologi Hvorfor er det svært at processere sprog Eksempler på applikationer

Læs mere

Sprogteknologi I Undervisningsplan Forårssemester 2009

Sprogteknologi I Undervisningsplan Forårssemester 2009 Sprogteknologi I Undervisningsplan Forårssemester 2009 Version 1 Patrizia Paggio 25/1/2009 6.feb: Lektion 1. Introduktion til sprogteknologi Hvad er sprogteknologi Hvorfor er det svært at processere sprog

Læs mere

TravelTales; håndtering af konfigurationsfil

TravelTales; håndtering af konfigurationsfil TravelTales; håndtering af konfigurationsfil 1 (7) TravelTales; håndtering af konfigurationsfil Synopsis Dette dokument beskriver indholdet i en TravelTales konfigurationsfil og metoder til hvordan man

Læs mere

Kort om CoinDB (Mønt- og seddelsamling):

Kort om CoinDB (Mønt- og seddelsamling): Kom godt i gang med CoinDB programmet fra PetriSoft (Holder styr på din Mønt- seddel- eller frimærkesamling) Kort om CoinDB (Mønt- og seddelsamling): CoinDB er et Windows program, der anvendes af mønt-

Læs mere

HOHA er defineret som en positiv mikrobiologisk resultat for Clostridium difficile (PCR eller

HOHA er defineret som en positiv mikrobiologisk resultat for Clostridium difficile (PCR eller Notat om fejl i tal for Clostridium difficile d. 19. november 2015 Sammenfatning I september 2015 blev der fundet en fejl i kodningen af HAIBA s case definition, idet enkelte infektioner blev talt dobbelt.

Læs mere

Intro til design og brug af korpora

Intro til design og brug af korpora Intro til design og brug af korpora Jørg Asmussen ja@dsl.dk Det Danske Sprog- og Litteraturselskab www.dsl.dk Intro til design og brug korpuslingvistik af korpora Jørg Asmussen ja@dsl.dk Det Danske Sprog-

Læs mere

Vejledning for annoncering

Vejledning for annoncering Side 1 Denne vejledning indeholder oplysninger til brug ved annoncering på Aller Media A/S ( Aller ) prisportaler, EDBpriser.dk, DVDpriser.dk, HIFIpriser.dk, SPILpriser.dk og PRISER.dk. Vejledningen har

Læs mere

Delfi Connect. Bruger vejledning 1. TILSLUTNING...2 2. INSTALLATION...3 3. MENUSTRUKTUR...4

Delfi Connect. Bruger vejledning 1. TILSLUTNING...2 2. INSTALLATION...3 3. MENUSTRUKTUR...4 Delfi Connect Bruger vejledning INDHOLD 1. TILSLUTNING...2 2. INSTALLATION...3 3. MENUSTRUKTUR...4 TOOLS...4 4. KOMMUNIKATIONS OPSÆTNING...5 5. GENEREL OPSÆTNING OG DATA KONFIGURATION...6 RECORD...8 BASAL

Læs mere

Tilslutning til ecomone Basis (OIO Faktura)

Tilslutning til ecomone Basis (OIO Faktura) Tilslutning til ecomone Basis (OIO Faktura) 1. november 2009, Version 1.1 1. POST DANMARKS ECOMONE BASIS (OIO FAKTURA)... 3 1.1 BEGREBER... 3 2 KANALER... 3 3 MODEL FOR DATAUDVEKSLING... 4 4 KOMMUNIKATION...

Læs mere

Vejledning til anvendelse af MeMo og SMTP. Næste generation Digital Post Maj 2018, version 0.9

Vejledning til anvendelse af MeMo og SMTP. Næste generation Digital Post Maj 2018, version 0.9 Vejledning til anvendelse af MeMo og SMTP Næste generation Digital Post Maj 2018, version 0.9 Indhold Indhold 2 1 Introduktion 3 1.1 Præciseringer 3 1.2 Terminologi 3 2 Anvendelse af SMTP-felter 5 3 Anvendelse

Læs mere

Axapta 3.0 Konverteringsvejledning

Axapta 3.0 Konverteringsvejledning Axapta 3.0 Konverteringsvejledning ectrl Dokumentversion 3.0 Juli 2008 - Datakonvertering 2008 Side 1 af 14 Indholdsfortegnelse DATAKONVERTERINGSVÆRKTØJET:...3 KARTOTEK INFORMATIONSOVERSIGT - FANEBLAD...5

Læs mere

Denne artikel gennemgår kort nogle mulighederne for brug af XML i ASP. Det sker ved brug af eksempler. Eksemplerne vil være i VBS.

Denne artikel gennemgår kort nogle mulighederne for brug af XML i ASP. Det sker ved brug af eksempler. Eksemplerne vil være i VBS. Denne guide er oprindeligt udgivet på Eksperten.dk XML i ASP Denne artikel gennemgår kort nogle mulighederne for brug af XML i ASP. Det sker ved brug af eksempler. Eksemplerne vil være i VBS. Den forudsætter

Læs mere

FMK-online's brug af SmartFraming

FMK-online's brug af SmartFraming Side 1 af 9 FMK-online's brug af SmartFraming Version 1.1 2011-11-01 Side 2 af 9 Indholdsfortegnelse Indledning...3 Initialisering og login...3 Kontekst Properties...4 user.id.authorizationid...4 userorganization.id.number...4

Læs mere

DDElibra H Å N D B O G

DDElibra H Å N D B O G H Å N D B O G Axiell Danmark A/S 2016-10-12 Version 9.11.60 GUI Copyright 2016 2 1 Indholdsfortegnelse 1 Indholdsfortegnelse... 2 2 Introduktion... 3 3 Søgning i dokumentationen... 3 4 Åbning af ""...

Læs mere

VEJLEDNING. Hastigheden for afspilning kan ændres og det er muligt at lave hurtig spring frem og tilbage

VEJLEDNING. Hastigheden for afspilning kan ændres og det er muligt at lave hurtig spring frem og tilbage VEJLEDNING DANDAS-TV Viewer er lavet til håndtering af TV-inspektion. (Skærm billeder og funktionalitet kan afvige fra den seneste version af programmet. DB adgang er ikke inkluderet) Programmet kan Indlæse

Læs mere

Udgivelsen er beskyttet af Creative Commons license, Navngivning 2.5

Udgivelsen er beskyttet af Creative Commons license, Navngivning 2.5 OIOUBL Guideline OIOUBL Valutakurser og -koder UBL 2.0 Currency Exchange Rates G18 Version 1.2 Udgivelsen er beskyttet af Creative Commons license, Navngivning 2.5 OIOUBL Valutakurser og -koder Version

Læs mere

Annonceimport på GulogGratis.dk

Annonceimport på GulogGratis.dk Annonceimport på GulogGratis.dk Indhold Annonceimport på GulogGratis.dk...1 Hvad er det?...2 Hvordan foregår det?...2 Hvad er arbejdsprocessen?...2 Hvor skal feedet ligge?...2 Hvordan skal feedet udformes?...2

Læs mere

Boligportal.dk s kravspecifikation til XML-feed

Boligportal.dk s kravspecifikation til XML-feed Boligportal.dk s kravspecifikation til XML-feed Introduktion I forbindelse med automatisk import af lejeboliger til Boligportal.dk skal der udarbejdes en XML-feed, som Boligportal.dk kan hente på en URL.

Læs mere

Pivottabeller, diagrammer og databehandling. Underviser: Nina Kirkegaard Schou Mobil

Pivottabeller, diagrammer og databehandling. Underviser: Nina Kirkegaard Schou Mobil Pivottabeller, diagrammer og databehandling Underviser: Nina Kirkegaard Schou Mobil 21 48 65 16 E-mail: ns@teamcrm.dk Emner: Excel Pivottabeller/diagrammer og databehandling Brugerfladen Import af data

Læs mere

Boligportal.dk s kravspecifikation til XML-feed

Boligportal.dk s kravspecifikation til XML-feed Boligportal.dk s kravspecifikation til XML-feed Introduktion I forbindelse med automatisk import af lejeboliger til Boligportal.dk skal der udarbejdes en XML-feed, som Boligportal.dk kan hente på en URL.

Læs mere

Modul 2 Database projekt Multimediedesign 3. semester Gruppe 3 IRF/TUJE

Modul 2 Database projekt Multimediedesign 3. semester Gruppe 3 IRF/TUJE Modul 2 Database projekt Multimediedesign 3. semester Gruppe 3 IRF/TUJE Fact sheet Indholdsfortegnelse Fact Sheet Gantt kort Valgt af virksomhed Brainstorm Attribut tabel ER-diagram Skitse MySQLWorkbench

Læs mere

ectrl Skabelonkonvertering

ectrl Skabelonkonvertering ectrl Skabelonkonvertering Indholdsfortegnelse 1. Indledning 3 2. Import ved hjælp af standardskabeloner 4 Kolonneopsætning og feltdefinition 6 3. Opsætning af konverteringsdefinitioner 8 4. Udvidede muligheder

Læs mere

Manuskriptvejledning De Studerendes Pris

Manuskriptvejledning De Studerendes Pris Fremsendelse af artikel Artikler skrevet på baggrund af bachelorprojekter, der er afleveret og bestået i det annoncerede tidsrum, kan deltage i konkurrencen om De Studerendes Pris. Det er kun muligt at

Læs mere

Punktskrift eller Tale Via e-mail

Punktskrift eller Tale Via e-mail Punktskrift eller Tale Via e-mail Send et dokument via e-mail og få det retur som forkortet punktskrift eller syntetisk tale. Det er ideen bag Sensus Braille Mail Robotten, en e-mail baseret tjeneste som

Læs mere

Guide til implementering af Danske Medier Research målekode fra TNS Gallup. Version 0.4

Guide til implementering af Danske Medier Research målekode fra TNS Gallup. Version 0.4 1 Guide til implementering af Danske Medier Research målekode fra TNS Gallup Version 0.4 2 Introduktion Danske Medier Research har valgt TNS Gallup til at overtage den officielle internetmåling (som tidligere

Læs mere

PDF-filer Vejledning til tilgængelige PDF-filer

PDF-filer Vejledning til tilgængelige PDF-filer PDF-filer Vejledning til tilgængelige PDF-filer OBS I dette dokument får du en vejledning til, hvordan du kan rette nogle af de mest gængse tilgængelighedsproblemer. For at rette dem kræver det, at du

Læs mere

Snitfladebeskrivelse Import og Eksport af.csv fil til Tabulex Skema

Snitfladebeskrivelse Import og Eksport af.csv fil til Tabulex Skema Snitfladebeskrivelse Import og Eksport af.csv fil til Tabulex Skema Version 2.0 9. juli 2012 Side 1 af 8 Dokument oplysninger Dette dokument er udfærdiget af Tabulex ApS og beskyttet af copyright. Ret

Læs mere

Vejledning til opgraderet version af Danmarks Arealinformation

Vejledning til opgraderet version af Danmarks Arealinformation Vejledning til opgraderet version af Danmarks Arealinformation Følgende funktioner virker anderledes i HTML5-versionen end i Silverlight-versionen: 1) Vælg/tænd kortlag... 2 2) Tilføj kortlag fra Lagkatalog...

Læs mere

Vejledning til Teknisk opsætning

Vejledning til Teknisk opsætning Vejledning til Teknisk opsætning v. 1.0 Adm4you, 2010. Indhold Kort om denne vejledning... 3 Generelt om easyourtime... 3 Installation af databasen... 3 Sikkerhed og rettigheder... 4 SQL Login... 4 Rettigheder

Læs mere

Dokumentering af umbraco artikeleksport:

Dokumentering af umbraco artikeleksport: Dokumentering af umbraco artikeleksport: Lav en artikel side 2-3. Installationsguide side 3-5. Opsættelse af databasen og web.config side 5-8. Umbraco: templates side 8. Umbraco: borger.dk tab side 8.

Læs mere

TeamShare 2.1 Versionsnoter Oktober 2009

TeamShare 2.1 Versionsnoter Oktober 2009 TeamShare 2.1 Versionsnoter Oktober 2009 TeamShare version 2.1.292 Denne version af TeamShare har fået mange nye funktioner, samt forbedringer på eksisterende. Hver ny feature er gennemgået i hvert sit

Læs mere

Vejledning til Kilometer Registrering

Vejledning til Kilometer Registrering Vejledning til Kilometer Registrering iphone Appen som holder styr på dit firma og privat kørsel. Udviklet af Trisect Development 2011. www.trisect.dk For iphone version 4.2 og nyere. Med Kilometer Registrering

Læs mere

Anvendelse af Model- View koncept i SAS Stored Processer

Anvendelse af Model- View koncept i SAS Stored Processer Anvendelse af Model- View koncept i SAS Stored Processer Peter Sandal Boll Chefkonsulent Professional Services, Skanderborg SAS Institute A/S Agenda Model-View-Controller konceptet (MVC) Eksempel med put-rapport

Læs mere

OR sektionens publikationsliste En lille brugervejledning

OR sektionens publikationsliste En lille brugervejledning OR sektionens publikationsliste En lille brugervejledning Jesper Larsen 1. november 1999 version 2.0 1 Indledning En af følgerne af det nye overordnede web-design der blev indført på instituttet i løbet

Læs mere

Sporbarhed og Rapportering i Quality Center. Kim Stenbo Nielsen NNIT Application Management Services

Sporbarhed og Rapportering i Quality Center. Kim Stenbo Nielsen NNIT Application Management Services Sporbarhed og Rapportering i Quality Center Kim Stenbo Nielsen NNIT Application Management Services Indhold INTRODUKTION Hvem er jeg Hvad vil jeg fortælle om QC std. rapporteringsfaciliteter EXCEL RAPPORTER

Læs mere

Startvejledning. Tilpasse udseende og design Giv dine tegninger et koordineret udseende med temaer og matchende farver. Find dem under fanen Design.

Startvejledning. Tilpasse udseende og design Giv dine tegninger et koordineret udseende med temaer og matchende farver. Find dem under fanen Design. Startvejledning Microsoft Visio 2013 ser anderledes ud end tidligere versioner, så vi har oprettet denne vejledning, så du hurtigere kan lære programmet at kende. Opdaterede skabeloner Skabeloner hjælper

Læs mere

Resumé NSI har udviklet en funktionel prototype med en visuel brugergrænseflade, der giver ikke-teknikere mulighed for at tilgå adviseringsservicen.

Resumé NSI har udviklet en funktionel prototype med en visuel brugergrænseflade, der giver ikke-teknikere mulighed for at tilgå adviseringsservicen. Fælles testmiljøer Statens Serum Institut Sektor for National Sundheds-it - Anvenderguide: Visuel adviseringsklient, en funktionel prototype Artillerivej 5 2300 København S Dato: 12.12.2013 Version: 1.0

Læs mere

Intranet anvendes til klubbens interne forhold, som kun skal kunne ses og betjenes af klubbens egne medlemmer.

Intranet anvendes til klubbens interne forhold, som kun skal kunne ses og betjenes af klubbens egne medlemmer. Y s Men s Club Nordstjernen Manual for anvendelse af Intranet Intranet anvendes til klubbens interne forhold, som kun skal kunne ses og betjenes af klubbens egne medlemmer. Intranet kan indeholde både

Læs mere

Procesbeskrivelse - Webprogrammering

Procesbeskrivelse - Webprogrammering Procesbeskrivelse - Webprogrammering Indholdsfortegnelse Forudsætninger... 1 Konceptet... 2 Hjemmesiden... 2 Server-side... 3 Filstrukturen... 3 Databasehåndtering og serverforbindelse... 4 Client-side...

Læs mere

Lav dine egne hjemmesider/websider

Lav dine egne hjemmesider/websider Sider, der skal publiceres på World Wide Web, laves i et særligt format, html, som fortæller browseren, hvordan den skal vise tekst og billeder. Html (Hypertext markup language) er meget fleksibelt og

Læs mere

Introduktion til Oracle, Datalogi, RUC Af: Jens Lauterbach (jeans@ruc.dk) 2002

Introduktion til Oracle, Datalogi, RUC Af: Jens Lauterbach (jeans@ruc.dk) 2002 Introduktion til Oracle, Datalogi, RUC Af: Jens Lauterbach (jeans@ruc.dk) 2002 På datalogi har vi en databaseserver, som de studerende på datalogi kan benytte til projekter og som også benyttes i forbindelse

Læs mere

OPBYGNING AF INSTRUMENTER. Online Designeren Record ID Felttyper Validering og variabelnavne

OPBYGNING AF INSTRUMENTER. Online Designeren Record ID Felttyper Validering og variabelnavne OPBYGNING AF INSTRUMENTER Online Designeren Record ID Felttyper Validering og variabelnavne Online Designer Online designeren er det primære værktøj til at opbygge skemaet til dataindsamling. I REDCap

Læs mere

Loginsystem (med MySQL)

Loginsystem (med MySQL) Denne guide er oprindeligt udgivet på Eksperten.dk Loginsystem (med MySQL) Dette er en guide til, hvordan man kan lave et loginsystem med php og muligvis også med sessioner og MySQL Skrevet den 02. Feb

Læs mere

PHP Quick Teknisk Ordbog

PHP Quick Teknisk Ordbog PHP Quick Teknisk Ordbog Af Daniel Pedersen PHP Quick Teknisk Ordbog 1 Indhold De mest brugte tekniske udtryk benyttet inden for web udvikling. Du vil kunne slå de enkelte ord op og læse om hvad de betyder,

Læs mere

Integration af online tilbud

Integration af online tilbud Brugervejledning til udviklere Integration af online tilbud Version 2018-05-04 Opdateret og seneste version kan altid hentes på http://webtour.dk/manual Der arbejdes til stadighed på at forbedre vores

Læs mere

ectrl-scannerløsning Vejledning

ectrl-scannerløsning Vejledning ectrl-scannerløsning Vejledning Version 3.2 Side 1 af 11 Indholdsfortegnelse 1. Forberedelse og installation... 3 1.1. Forberedelse... 3 1.2. Software til stregkodegenkendelse... 3 1.3. Klistermærker med

Læs mere

DIVISIONSMATCHBEREGNING

DIVISIONSMATCHBEREGNING DIVISIONSMATCHBEREGNING ANDERS KLINTING FIR HILLERØD ORIENTERING JANUAR 2013 INDHOLD Divisionsmatchberegning... 3 Løbsdata fra OE2003... 3 Klasser... 3 Klubber... 5 Resultater... 7 Brug af programmet...

Læs mere

Harald Michalsen og Lasse Storr-Hansen. Log på med administrator rettigheder, så du ser ovenstående hovedmenu

Harald Michalsen og Lasse Storr-Hansen. Log på med administrator rettigheder, så du ser ovenstående hovedmenu Importér skemadata fra Lectio 1 af 16 Log på med administrator rettigheder, så du ser ovenstående hovedmenu Vælg Konverter skemadata Klik på Eksporter skemadata Importér skemadata fra Lectio 2 af 16 Vælg

Læs mere

DM507 Eksamen Obligatorisk Opgave Rejseplanlægning

DM507 Eksamen Obligatorisk Opgave Rejseplanlægning Institut for Matematik og Datalogi Syddansk Universitet, Odense 21. februar 2011 LMF DM507 Eksamen Obligatorisk Opgave Rejseplanlægning 1 Problemet Denne opgave går ud på at lave et program, som ud fra

Læs mere

It og informationssøgning Forelæsning december 2006 Jakob Grue Simonsen. Diverse emner af almen interesse

It og informationssøgning Forelæsning december 2006 Jakob Grue Simonsen. Diverse emner af almen interesse It og informationssøgning Forelæsning 12 6. december 2006 Jakob Grue Simonsen Diverse emner af almen interesse 1 Gemme objekter til filer I python skal en fil på disken åbnes, før man kan læse eller skrive

Læs mere

Finanstilsynets indberetningssystem. Vejledning til Regnearksskabelonerne

Finanstilsynets indberetningssystem. Vejledning til Regnearksskabelonerne Finanstilsynets indberetningssystem Vejledning til Regnearksskabelonerne Finanstilsynet - 2. udgave oktober 2009 Indholdsfortegnelse 1 INDLEDNING... 2 2 FORUDSÆTNINGER... 3 3 TRIN FOR TRIN... 4 3.1 Hent

Læs mere

ectrl Tilknytning af dokumenter

ectrl Tilknytning af dokumenter ectrl Tilknytning af dokumenter Indholdsfortegnelse 1. Tilknytning til poster (dokumentstyring) 3 1.1. Aktivering af dokumentstyring 3 1.2. Opsætning af arkivering 4 1.3. Opret ekstra dokumenttyper 5 1.4.

Læs mere

Integration af online tilbud

Integration af online tilbud Brugervejledning til udviklere Integration af online tilbud Version 2015-05-15 Opdateret og seneste version kan altid hentes på http://webtour.dk/manual Der arbejdes til stadighed på at forbedre vores

Læs mere

MIU datakonverteringsprogram til brug for radioaflæsning af vandmålere

MIU datakonverteringsprogram til brug for radioaflæsning af vandmålere MIU datakonverteringsprogram til brug for radioaflæsning af vandmålere INDHOLDSFORTEGNELSE: MIU datakonverteringsprogram til brug for radioaflæsning af vandmålere... 1 1 Indledning... 3 2 Understøttede

Læs mere

Velkommen til REX onlinehjælp

Velkommen til REX onlinehjælp Velkommen til REX onlinehjælp I REX onlinehjælp kan du finde information om følgende emner: Indhold Enkel søgning...3 Hvordan kan du bruge søgefeltet?...3 Søg efter sætninger...3 Søg efter specifikke ord

Læs mere

Indholdsfortegnelse. Systembeskrivelse kapitel 8 Administrationsdatabase

Indholdsfortegnelse. Systembeskrivelse kapitel 8 Administrationsdatabase Indholdsfortegnelse 5. Administrationsdatabase... 2 5.1 Metadata... 2 5.2 Administrationsdata... 3 5.2.1 Indstillingsmuligheder... 3 5.2.2 Webside... 4 5.2.3 Klikafgift (Udgået)... 4 5.2.4 Modtageboks...

Læs mere

It og informationssøgning Forelæsning november 2006 Jakob Grue Simonsen. Hypertekst og Python. Andersen & Simonsen: kap. 12

It og informationssøgning Forelæsning november 2006 Jakob Grue Simonsen. Hypertekst og Python. Andersen & Simonsen: kap. 12 It og informationssøgning Forelæsning 11 29. november 2006 Jakob Grue Simonsen Hypertekst og Python Andersen & Simonsen: kap. 12 I dag gennemgås materiale af uhyre praktisk (og kun i lidet omfang generel)

Læs mere

IKT og Videnrepræsentationer

IKT og Videnrepræsentationer IKT og Videnrepræsentationer CSTBI-2 2010 5. kursusgang Introduktion til html Kjeld Svidt ks@civil.aau.dk Personlige hjemmesider De enkelte gruppemedlemmer kan lave egne hjemmesider i mappen public_html

Læs mere

Guide til implementering af Danske Medier Research målekode fra TNS Gallup. Version 1.0

Guide til implementering af Danske Medier Research målekode fra TNS Gallup. Version 1.0 1 Guide til implementering af Danske Medier Research målekode fra TNS Gallup Version 1.0 2 Introduktion Danske Medier Research har valgt TNS Gallup til at varetage den officielle internetmåling (som hidtil

Læs mere

2. SEMESTER PROJEKT 3 INTERAKTIONSUDVIKLING

2. SEMESTER PROJEKT 3 INTERAKTIONSUDVIKLING 2. SEMESTER PROJEKT 3 INTERAKTIONSUDVIKLING Baggrund Udgangspunktet er projekt 2, dvs. en blog om cupcakes, hvor målgruppe, afsender og modtager allerede er defineret. Du bliver nu bedt om at udvikle et

Læs mere