Udlægning til og ordning af registre i onlinekataloger

Relaterede dokumenter
Udlægning til og ordning af registre i onlinekataloger

Bilag A 50. danzig-møde

VEJLEDNING I OPBYGNING OG BRUG AF IEVHs BIBLIOTEK

danmarc2 tegnrepertoiret

danmarc2 tegnrepertoiret

Håndbog Til CPR services

B. Rådet bød velkommen til Statsbibliotekets nye medlem af Bibliografisk Råd, Dorete Bøving Larsen, der afløser Elsebeth Kirring.

Håndbog Til CPR services

Håndbog Til CPR services

Indholdsfortegnelse. Validering af journalnumre og genstandsnumre samt eksport til Regin. Museernes Udgravningsdata (MUD)

Dialog om tidlig indsats Udveksling af oplysninger i det tværfaglige SSD-samarbejde og fagpersoners underretningspligt

6. Forenkling af bedømmelse af ansøgere til videnskabelige stillinger

Kender du allerede disse systemer, kan du også finde arkivalierne direkte her:

Manual Søg & erstat. Søg efter tekst

Håndbog Til CPR services

Nyt fra Kulturstyrelsen. 22. Marts 2012 Møde i Netværk for lånesamarbejde Leif Andresen

Indledning... 2 Opbygning... 2 Servicesegmenternes sammenhæng... 3 UNA... 4 UNB... 6 UNH UNT UNZ... 14

Værkmatch af musik (dc.type=work:music) Værkmatch af noder (dc.type=work:sheetmusic) Værkmatch af periodika (dc.type=work:periodica)...

REFERAT. Bibliografisk Råd. Referat af møde den

Brugervejledning om søgning, der blev idriftsat sommer 2009

Håndbog Til CPR services

Oprids over grundforløbet i matematik

Dokumentlog. Dato Version Beskrivelse Applikation version Ny godkendelsesproces. Reference Forfatter Godkender.

FAGLIG REGNING Pharmakon, farmakonomuddannelsen september 2007

Unitel til pc Kommasepareret format for kreditadvis på indenlandske bankoverførsler September 2007

Manuskriptvejledning De Studerendes Pris

Periodiske kædebrøker eller talspektre en introduktion til programmet periodisktalspektrum

OR sektionens publikationsliste En lille brugervejledning

Senest opdateret 10. juni DanBib søgekoder oversigt over søgekodehierarkier

Mat C HF basisforløb-intro side 1. Kapitel 5. Parenteser

KOMMENTARSKABELON. ccs_- _strukturelle_aspekter_r1_ pdf Allan Dam Jepsen, CPC Center for Product Customization Aps

RDA i Danmark Hvad er det nu lige det går ud på og hvad er planerne?

Import betalinger i netbank

Håndbog Til CPR services

Manuskriptvejledning pr Bachelorprisen

Uge

TEKST: CAMILLA BØDKER THOMSEN / ILLUSTRATIONER: CHARLOTTE PARDI

Hvordan importerer jeg stamdata?

Krav til dataformat ved indberetning

Retrokonverteringsbevilling

Lagervisning. Dina Friis, og Niels Boldt,

Kildehenvisninger. - Information og guide til korrekte kildehenvisninger

Bibliografisk Råd REFERAT. Referat af møde den Dagsorden

(Retsakter hvis offentliggørelse ikke er obligatorisk) RÅD RÅDETS DIREKTIV. af 18. december 1975

Velkommen til REX onlinehjælp

ISLAMAKADEMIETS STANDARD FOR TRANSLITTERATION

Retningslinjer for manuskripter til Dansk Tidsskrift for Teologi og Kirke

Formatbeskrivelse til ERH - Bankens Erhvervsformat (BEC format) Oktober 2005

STANDARD FOR ELEKTRONISK STATISTIK INDBERETNING - LØNSTATISTIK

Ændringer i SLS efter teknologiomlægning Maj 2012

Bekendtgørelse om energiforsyningsvirksomhedernes indberetningspligt til Bygnings- og Boligregistret (BBR)

Lokale, finske betalinger Business Online

Grundliggende regning og talforståelse

Håndbog Til CPR services

Hvordan søger jeg i Slægtsforskernes Bibliotek?

TYPOGRAFI & OMBRYDNING

Tekniske retningslinjer for opgaveskrivning

REFERAT Slots- og Kulturstyrelsen H.C. Andersens Boulevard København V

REFERAT. Bibliografisk Råd. Referat fra møde i Bibliografisk Råd. Fredag den 4. december 2015 kl :00

Håndbog Til CPR services

MØDEREFERAT. Møde i Bibliografisk Råd fredag den 4. juni 2010

LaserTryk.dk præsenterer. Typiske sprogbøffer. Udgivet med tilladelse af den oprindelige forfatter, Telia

REFERAT. Bibliografisk Råd. Dagsorden. Referat af møde den

Side 1 af 9. Hvordan er resultatrapporten bygget op? Hvordan følger vi op på vores undersøgelse? 1. Simple tabeller. Besvarelser i alt.

Håndbog Til CPR services

DDElibra H Å N D B O G

Brugervejledning til Dictus Android

Indhold, indeks og krydshenvisning

STANDARD FOR ELEKTRONISK STATISTIK INDBERETNING

Standardisering og fælles fodslag

Retrokonverteringsbevilling

IK TEKNIK TEKNIK TEKNIK TEKNIK TEKNIK TEKNIK TEKNIK TEKN. Regnehæfte Elektronik

Silkeborg Review Mine sider

Doros nemme guide til: Sms-beskeder. En begynderguide til at skrive, sende og læse sms-beskeder

DDElibra Håndbog. DDElibra GO. Axiell Danmark A/S Version

ISO RFID in Libraries del 1 og 3 i henhold til DS/INF ISO og ISO

Håndbog Til CPR services

Unitel EDI MT940 Juni Baseret på: SWIFT Standards - Category 9 MT940 Customer Statement Message (januar 2004)

MedWin programopdatering: EG Data Inform A/S. Lautrupvang Ballerup. Dusager Aarhus N. Albert Ginges Vej Hjørring

It og informationssøgning Forelæsning september 2006 Nils Andersen. Gentagelser og tekster

Dette kursus er for dig, der en gang for alle vil mestre grammatikken og have styr på de sproglige faldgruber.

8GYLNOLQJHQ L WLOVNXGGHQH WLO (8' Sn ILQDQVORYHQ RJ IUHPWLGHQV Y

Kursus i Infomedia. Udarbejdet af Annette Öhrström, Silkeborg bibliotek, september 2016

Bekendtgørelse om stemmesedler til brug ved kommunale og regionale valg

I denne artikel, vil der blive gennemgået de grundlæggende PHP-funktioner, såsom udskrift til skærmen, tid og dato og if-sætningen.

Brug af Word til matematik

Kapitel 2 Tal og variable

Bibliografisk Råd. Referat af møde den

Opgave 1 Basal select med (stjerne)

TIDSSKRIFTET ANTROPOLOGI

Lovtidende A Bekendtgørelse om energiforsyningsselskabernes indberetningspligt til Bygnings- og Boligregistret (BBR) 16. november 2010.

Systemspecifikt bilag til Rakat e-handel

Du er velkommen på KDA bibliotek

I denne rubrik anføres visummets territoriale gyldighed. Denne rubrik kan kun udfyldes på en af følgende måder:

Ejere og lejere. Ændring af vejnavn for to dele af Hyrdehøj Bygade

3. Hold ALT nede, og tryk på F1 (så snart du har gjort det, behøver du ikke længere holde ALT nede).

Viser alt i anførselstegn som konstanttegn. Gennemtvinger venstrejustering i stedet for højrejustering.

Elementær Matematik. Mængder og udsagn

Vejledning i kildeindtastning

Transkript:

danzig møde 51, bilag B 15. oktober 2012/LEA Kulturstyrelsen Udlægning til og ordning af registre i onlinekataloger Udarbejdet af en arbejdsgruppe nedsat af Bibliografisk Råd København Kulturstyrelsen 2012

Indhold Forord Indledning 1. Terminologi 2. Generelt om udlægning 3. Tegnenes indbyrdes ordning 4. Udlægning af bogstaver 5. Udlægning af tal 6. Udlægning af symboler 7. Udlægning af blanktegn (mellemrum) 8. Udlægning af skilletegn 9. Udlægning til sætningsregistre 10. Forkortelser side 3 side 5 side 5 side 6 side 6 side 8 side 9 side 10 side 11 side 11 side 12 side 13 2

Forord I 1999 udkom vejledningen Ordning af registre i onlinekataloger, som omhandlede registeroplægning inklusive tegnsortering, normaliseringsregler vedrørende Den faktiske implementering i bibliotekerne har senere vist et behov for en enklere model. Samtidig har verden ændret sig. Bibliotekskatalogen udstilles mere og mere uden for bibliotekerne. En tilpasning til denne virkelighed vil gøre et samspil mellem biblioteker og verden omkring nemmere. Som en konsekvens heraf er der i Bibliografisk Råd blevet taget en principbeslutning om at afskaffe alfabetiseringstegn ( ) og gammelt dansk aa, og som følge heraf revidere Ordning af registre i onlinekataloger. Resultatet er den foreliggende Udlægning til og ordning af registre i onlinekataloger, som er udarbejdet af en arbejdsgruppe bestående af Leif Andresen, Hanne Hørl Hansen, Leif Makholm og Camilla Riis Petersen, og som er godkendt af Bibliografisk Råd september 2012. Hovedprincippet i den nye specifikation er at alle tegn normaliseres maskinelt til ingen, et eller flere tegn, som udlægges i søgeregistre og som her ved listning på skærm ordnes alfanumerisk tegn-for-tegn. Dobbeltudlægning sker i enkelte tilfælde (eksempelvis å som både å og aa). Der er i en række tilfælde behov for supplerende udlægninger for at tilgodese brugerbehov. Dette håndteres i forbindelse med katalogiseringen ved supplerende inddatering i stort delfelt (eksempelvis som tal ved et romertal i et lille delfeltfelt). Der er ingen afvigelser fra den rent alfanumeriske ordning tegn-for-tegn. Behov herudover tilgodeses alene som supplerende eller dublerende udlægninger. Hvis der skal ske supplerende udlægning af et opslag (Katalogiseringsreglernes begreb) og den supplerende udlægning ikke svarer til skriftbilledet, skal der inddateres et alternativt skriftbillede i stort delfelt. Dette er dog ikke nødvendigt for den i 9.1.2 dublerende udlægning uden de i 9.1.1 anførte artikler. Der er endvidere i en række tilfælde sket forenklinger i forhold til udgaven fra 1999. Alle regler er formuleret beregnet for maskinel håndtering eller for håndtering med stort delfelt ved inddatering. Specifikationen skal ses i sammenhæng med anvendelse af UNICODE som tegnsæt. Principielt har danmarc2 fuld UNICODE som referencetegnsæt, også selv om nogle systemer (danbib, DDElibra m.v.) pt. anvender den særlige indkodning til latin1. Alle UNICODE tegn er principielt dækket af denne specifikation, men der er i sagens natur ikke en specifikation tegn-for-tegn, men nogle generelle regler. Der er eksempler på hvordan ofte forekommende tegn udenfor det danske alfabet og tallene 0-9 3

normaliseres. Det skal understreges at specifikationen alene omhandler udlægning og ordning. Hvorledes at sætningsregistreret præsenteres ligger udenfor denne specifikation. Alfabetiseringsregler for danske biblioteker og bibliografier kan fortsat betragtes som vejledende for ordning af bibliografiske lister i trykt form. 4

Indledning Specifikationen tager udgangspunkt i det danske tegnsæt, da den retter sig mod danske kataloger. Hovedprincipperne i ordningen er: det danske alfabet inklusive æ ø å skal anvendes den fastsatte rækkefølge af tegn skal følges konsekvent alfabetiseringen skal baseres på skriftbilledet Reglerne for numerisk ordning af tal er ophævet. Tal ordnes ciffer for ciffer. Der kan dog være problemer med implementeringen af meget specielle regler, som 5.5 og 9.1.2 1. Terminologi I specifikationen anvendes følgende terminologi: Normalisering af enkelttegn: Den værdi et tegn i ordnings- og søgesammenhæng skal opfattes som værende lig med hvad enten værdien er lig tegnet selv (fx a som a) eller et eller flere andre tegn (fx ä som æ, ß som ss og ½ som 1 2) Ordning: Den indbyrdes sortering af de normaliserede enkelttegn Udlægning til registre: Den sekvens af tegn man ønsker repræsenteret i registret. Der kan være tale om en tegnsekvens ud fra en normalisering af de enkelte tegn i sekvensen, eller en tegnsekvens repræsenterende en semantisk værdi forskellig fra værdien af den normaliserede tegnsekvens (fx 9 for romertallet IX). Supplerende udlægning til registre: Når enkelttegn eller en tegnsekvens formodes at ville blive søgt på flere forskellige måder af brugerne, laves der supplerende udlægninger, så brugeren får et resultat uanset søgemåde. 5

2. Generelt om udlægning 2.1 Udgangspunktet for udlægning i registre er tegnsekvenser, som de fremgår af felterne i katalogposten (skriftbilledet). Den konkrete udlægning er derfor teksten som den står justeret efter reglerne i afsnit 4 10. 2.2 Supplerende udlægning i registre kan ske ved hjælp af en af følgende metoder: 1. Ud fra tegnbestemte regler, der angiver at en dublerende udlægning indeholdende en supplerende normalisering bør finde sted fx at udlægge å som både aa og å. Dublerende udlægning forudsættes løst maskinelt 2. Ud fra supplerende inddatering i ordningsdelfelt (stort delfelt). Metoden angives i det efterfølgende som brug af stort delfelt 3. Tegnenes indbyrdes ordning 3.1 Ordning af tegn sker på den normaliserede form. Typografiske koder kan ikke normaliseres til tegn. I enkelte tilfælde dog til blanktegn, se 5.5. 3.2 Tegnenes rækkefølge. Den grundlæggende rækkefølge er: 1. Blanktegn (mellemrum) 2. Symboler 3. Tal 4. Bogstaver 3.3 Blanktegn. Blanktegn ordnes foran alle andre tegn (»intet kommer før noget«). Reglen bevirker, at et kortere ord ordnes foran et længere ord, hvis begyndelse er identisk med det kortere. 3.4 Symboler. Følgende tegn regnes som symboler og ordnes i følgende rækkefølge: # nummertegn $ dollar % procent & et (og, ampersand) * asterisk + plus < mindre end = lig med > større end @ commercial at 6

cent pund sterling generel valuta yen paragraf copyright logisk ikke registreret varemærke grader ± plus minus gange gange division/minus uendelig 3.5 Tal. Ordningen baseres på cifrene 0-9 i denne rækkefølge: 0123456789 3.6 Bogstaver. Ordningen baseres på det danske alfabet, dvs. følgende små bogstaver i denne rækkefølge: abcdefghijklmnopqrstuvwxyzæøå 7

4. Udlægning af bogstaver 4.1 De små bogstaver udlægges som de er. 4.2 Andre bogstaver og bogstavforbindelser end tegn nævnt i 3.6 normaliseres efter følgende principper: 4.2.1 Store bogstaver normaliseres til de tilsvarende små bogstaver 4.2.2 Umlautbogstaverne normaliseres til det tilsvarende bogstav i det danske alfabet. ä normaliseres til æ, ö og ungarsk ı normaliseres til ø, ü og ungarsk ő normaliseres til y (se også 4.4.3) 4.2.3 I øvrigt ses der bort fra accenter og andre diakritiske tegn. ë, é, è, ê og ē normaliseres til e; ç og č normaliseres til c; ł normaliseres til l. 4.2.4 Ikke-danske bogstaver i det latinske alfabet normaliseres til nærmeste danske bogstaver. œ (sammenskrevet oe) normaliseres til oe ð (islandsk ð) normaliseres til d, þ (islandsk thorn) normaliseres til th ı (tyrkisk i uden prik) normaliseres til i. 4.3 Andre alfabeter. Bogstaver fra andre alfabeter end det latinske translittereres til latinske bogstaver og normaliseres som disse. Valg af translitterationsstandard ligger uden for denne specifikation. Bogstav Translittereret efter Latinsk bogstav Normaliseret til 8

Б ISO 9 b b В ISO 9 v v Ж ISO 9 ž z Ю ISO 9 Û u Ю DS 378 Ju ju DS/ISO 843 D d Θ DS/ISO 843 TH th Ψ DS/ISO 843 PS ps ב ISO 259 b b ו ISO 259 w w 4.4 Supplerende normalisering. For at sikre at bibliotekssystemernes brugere kan få relevante svar på søgninger, er det muligt supplerende at normalisere bogstaver til alternative bogstaver i dublerende udlægning i søgeregistrene. 4.4.1 Da aa og å i mange sammenhænge repræsenterer samme bogstav, normaliseres de supplerende til den anden form, dvs. å får supplerende normalisering til aa og aa får supplerende normalisering til å. 4.4.2 De 2 danske bogstaver æ og ø kan normaliseres supplerende til tobogstavsforbindelserne ae og oe. 4.4.3 For nogle ord kan de foranstående regler suppleres med andre supplerende udlægninger, hvis det i det enkelte tilfælde sikrer en søgbarhed, som kan forventes at afspejle opslag fra brugere. *A Leus *a Leüs Note: Ovenfor er givet et eksempel, hvor det diakritiske kun har betydning for udtalen (navnet Leüs) og ikke for ordning af f.eks. franske ord og navne.. I dette tilfælde kan stort delfelt bruges til at angive den supplerende udlægning. Herved opnås samme funktion som trema gav i det tidligere danbib-tegnsæt. 5. Udlægning af tal 5.1 Ved udlægning af tal i søgeregistre sker dette som hovedregel efter dokumentets form med de tilføjelser, som fremgår af efterfølgende. 5.2 Udlægning i sætningsregistre: Ved udlægning i sætningsregistre skal tal udlægges ciffer-for-ciffer. 5.3 Normalisering af romertal. Romertal inddateres med arabertal i stort delfelt. 9

*a Louis *E 14 *e XIV *f konge af Frankrig 5.4 Brøker. Et brøk-tegn udlægges først med tælleren, dernæst med nævneren. Brøkstregen behandles som et blanktegn. 5.4.1 Er et helt tal sat foran brøken, ordnes talstørrelsen som om der var et blanktegn mellem det hele tegn og brøken. 2½ ordnes som 2 1 2 5.5 Hævede og sænkede tal normaliseres til de tilsvarende cifre. Hvis det hævede eller sænkede tal er kombineret med et tal, indføjes et blanktegn mellem tallet og det hævede eller sænkede tal. Dette gælder både ved typografiske tegn og ved specifikke Unicode-tegn. 10 2 inddateret som 10 2, udlægges som 10 2 CO 2 inddateret som CO@UDA2, udlægges som CO2 10 4 inddateret som 10@UD94, udlægges som 10 4 5.6 Numerisk ordning af tal. Hvis der ønskes en numerisk ordning af tal, kan der maskinelt udlægges foranstillede nuller i udpegede delfelter efter behov, f.eks. ved lille delfelt ved serienumre. 5.7 For nogle tal og talkombinationer kan de foranstående regler suppleres med andre supplerende udlægninger, hvis det i det enkelte tilfælde sikrer en søgbarhed, som kan forventes at afspejle opslag fra brugere. 248 00 *V 003 *v 3 6. Udlægning af symboler 6.1 Symboler, udover de i 3.4 nævnte, normaliseres til # (nummertegn) 6.2 For nogle symboler kan de foranstående regler suppleres med andre supplerende udlægninger, hvis det i det enkelte tilfælde sikrer en søgbarhed, som kan forventes at 10

afspejle opslag fra brugere, f.eks. ved en titel udelukkende bestående af symboler. Note: bemærk at Katalogiseringsreglernes 123A1 indebærer, at der skal laves et henvisningsfelt. 7. Udlægning af blanktegn (mellemrum) 7.1 Blanktegn eller et andet tegn normaliseret til blanktegn i starten af en tegnsekvens ignoreres. 7.2 Kombinationer af blanktegn og tegn, der normaliseres til blanktegn normaliseres til ét blanktegn. Post- og telegrafvæsen normaliseres til post og telegrafvæsen 8. Udlægning af skilletegn 8.1 Skilletegn Skriftbillede Normaliseres som Anførselstegn Ingenting Apostrof Ingenting Bindestreg - Blanktegn Kolon : Ingenting Komma, Ingenting Parenteser ( ) [ ] { } Ingenting Punktum. Ingenting Semikolon ; Ingenting Skråstreg / Blanktegn Tankestreg - Blanktegn Udråbstegn! Blanktegn 2 4/5 udlægges som 2 4 5 Basse udlægges som basse 8.2 Et skilletegn ignoreres, når det optræder som første tegn i en tegnsekvens (se 7.1). 8.3 Ved udlægning til særlige registre, f.eks. for klassifikationskoder, kan skilletegn have betydning for ordningen. For disse kan udlægning ske med anden udlægning af skilletegn end defineret i denne specifikation. 11

Note: Eksempler på felter, der udlægges i særlige registre, kan være 080 UDK og 082 DDC (Dewey Decimal Classification). 9. Udlægning til sætningsregistre 9.1 Titelregistre og andre ordsammenstillinger 9.1.1 Ved udlægning til sætningsregistre bestående af titler, skal den fulde titel udlægges inklusiv eventuel indledende artikel. 9.1.2 Der bør foretages dublerende udlægning til sætningsregistre, hvis titlen indledes med ét af ordene på efterfølgende liste. Den dublerende udlægning sker uden det pågældende ord: En, et, den, det, the, a, der, die, das 9.1.3 Der kan foretages dublerende udlægning til sætningsregistre, hvis titlen indledes med andre ord, som på et anvendt sprog er en artikel. 9.1.4 Reglen om dublerende udlægning i 9.1.2 gælder også selvom det pågældende ord ikke er en artikel, men et talord eller påpegende stedord, som f.eks. den, det, m.v. 9.2 Navneregistre 9.2.1 Særskilte præfikser og artikler og kombinationer heraf, udlægges som de fremgår af navnet. 9.2.2 Ved efternavne, der begynder med et særskilt skrevet præfiks (en præposition, en artikel eller en kombination heraf), bør der foretages supplerende udlægning, der ser bort fra blanktegn, som adskiller præfikset fra resten af navnet eller adskiller præfiksets enkelte ord (fx»de la«). Det samme gør sig gældende for stednavne af samme art. 700 00 *A delaroche *a De la Roche *h Mazo 9.2.3 Særlig regel: Præfikserne Mc og M c (hævet c) normaliseres til mc. Der foretages supplerende udlægning under mac. 700 00 *A macmanus *a McManus 9.3 Generelt for sætningsregistre 9.3.1 Foranstående regler vedrører alene udlægning. For udlægning af tal i specielle tilfælde, 12

henvises til 5.6 og 8.3. Præsentation ved listning af sætningsregistre ligger uden for denne specifikation. 9.3.2 For nogle titler og navne kan de foranstående regler suppleres med andre supplerende udlægninger, hvis det i det enkelte tilfælde sikrer en søgbarhed, som kan forventes at afspejle opslag fra brugere. 10. Forkortelser 10.1 Udlægning af initialer og forkortelser bestemmes ved inddatering af blanktegn. 245 *a H.C Andersen som ung. (H.C. udlægges som hc) 100 *a Andersen *h H. C. (H. C. udlægges som h c) 100 *a Hansen *h H.-C. (H.-C. udlægges som h c) 13