Metadatakataloger. Udarbejdet for Biblioteksstyrelsen af Arbejdsgruppen vedrørende Metadatakataloger



Relaterede dokumenter
ABM standard arbejdsgruppen nedsat af Statens Arkiver, Biblioteksstyrelsen og Kulturarvsstyrelsen

ABM standard arbejdsgruppen nedsat af Statens Arkiver, Styrelsen for Bibliotek og Medier og Kulturarvsstyrelsen

ABM standard arbejdsgruppen nedsat af Statens Arkiver, Styrelsen for Bibliotek og Medier og Kulturarvsstyrelsen

Under revision. Personnavn som søgeelement (efternavn, fornavn(e), romertal, tilføjelse, fødselsår)

domæne.dk og nationalbibliografien 2004 registrering af netpublikationer, estimering af mængder

Brugerskabte data en national service (BSD) - produktbeskrivelse

Fremtidens metadata. Oplæg på DDELibra brugergruppemøde 19. november Susanne Thorborg, DBC. Vejle

Forsvarsakademiets Informationsservice. Kom godt i gang. - med at bruge EBSCO Host Research Databases

DDElibra H Å N D B O G

TEKST: CAMILLA BØDKER THOMSEN / ILLUSTRATIONER: CHARLOTTE PARDI

PsycINFO (Ebsco) VIA manual

Dansk Strategi for registrering og formidling af Internetressourcer

Metadata i danske netpublikationer. Brugervejledning. Udarbejdet af Biblioteksstyrelsen

Søgevejledning til Cinahl Plus with Full Text (Ebsco) Bibliotekerne i Professionshøjskolen Metropol. Søgevejledning til CINAHL Plus with Full Text

Litteratursøgning i PubMed

Dina Lemming Pedersen Rosa Andersen

Søgevejledning til SocINDEX with Full Text - 1

PsycINFO (Ebsco) VIA manual

MØDEREFERAT. Møde i Bibliografisk Råd fredag den 4. juni 2010

Bibliotek.dk som lokal grænseflade notat

RDA i Danmark Hvad er det nu lige det går ud på og hvad er planerne?

Matematik, maskiner og metadata

Q&A for Bogproduktionsstatistik

Standardisering og fælles fodslag

Velkommen til REX onlinehjælp

Vejledning om e-arkivet - sagsområderne Teknik, Vej og Miljø

Web of Science Core Collection

Sådan bruger du Schultz lovportaler

2 Få adgang til CropNote

Kædesøgning via citationer (Cited Reference Search) Web of Science er et citationsindex, som gør artiklernes referencelister er søgbare.

Google Scholar. Søgning. Udgiver Google

Elektronisk informationsformidling og forskningspublicering

PubMed - tips til søgning

Overordnet beskrivelse af projektet, herunder ændringer ifht oprindelig projektbeskrivelse

Her kan du skrive noter til dit oplæg

Elektroniske tidsskrifter og databaser via Regionslicenser

1. SCREENING OG BAGGRUND

Linked open data. Fra cataloguing til catalinking. Den traditionelle bibliografiske post er i opbrud. De enkelte dataelementer,

Emneord Bibliografiske standarder, Katalogiseringsregler, danmarc2, Dansk bogfortegnelse, Bogmarkedet, Nationalbibliografien.

Velkommen til REX onlinehjælp

Zotero er et smart værktøj til at få styr på dine referencer og litteraturlister. Zotero er gratis og på dansk.

Opsummering af høringssvar vedrørende den fremtidige fælleskatalogfunktion i Danmark

adfgvrga Open Access Hvor og Hvordan Steen Ammentorp

Elektroniske tidsskrifter og databaser via Regionslicenser

Vælg det emneord, du vil bruge og klik på Continue. Nu vises de subheadings som knytter sig til emneordet:

Vidensbasens Søgeguide

Elektroniske tidsskrifter og databaser via Medicinsk Biblioteks hjemmeside. Procedure når du sidder ved en PC, der er koblet til sygehusets netværk

Vejledning til registrering af dit afsluttende projekt i UC SYD

Værkmatch af musik (dc.type=work:music) Værkmatch af noder (dc.type=work:sheetmusic) Værkmatch af periodika (dc.type=work:periodica)...

Embase Vejledning. Avanceret søgning (Advanced Search)

Kom godt i gang med PubMed

BRUG HOVEDET! -SØG ORDENTLIGT PÅ NETTET

Du kan søge på emner, forfattere eller titler og lave kædesøgninger på baggrund af artiklernes referencelister.

arkiver, biblioteker og museer på internettet

PubMed Vejledning. Fritekstsøgning (Basic search) Fremvisningsformater

Formålet med undervisning fra mediateket er at styrke elevernes informationskompetence, således de bliver i stand til:

Hvordan søger jeg i Slægtsforskernes Bibliotek?

Dansk overgang til nye, internationale katalogiseringsregler, RDA

MANUAL. Siteloom CMS

CINAHL Complete - tips til søgning

Hjemmesiden er opdelt i et sidehoved, en sidefod og mellem disse 3 kolonner: venstre, midterste og højre. Højre kolonne vises dog kun på forsiden.

I denne manual kan du finde en hurtig introduktion til hvordan du:

Søgeeksempel i PubMed:

Statistikudtræk. 1 Introduktion

Bibliografisk Råd. Dagsorden. Referat af møde afholdt: Onsdag den 9. september 2009 kl hos Styrelsen for Bibliotek og Medier

Brugervejledning til FOKUSpartnere

Business Source Premier EBSCO

Konverteringsbeskrivelse for Dublin Core til danmarc2 J.nr marts 2004

SAPAs forretningsmæssige behov i relation til Dialogintegration. SAPAs behov for Dialogintegration. Fordele ved brug af dialogintegration i SAPA

Indhold Basen dækker sygepleje(videnskab), samt til en vis grad ergoterapi, fysioterapi, diætetik, radiografi, audiologi, rehabilitering

VEJE TIL VIDEN VIDEN

SecureAware Compliance Analysis Manual

Embase Vejledning. Tryk på det ønskede emneord for at se dens plads i emnehierarkiet, så du kan se over- og underemner samt synonymer til begrebet.

Retningsliner for etwinning værktøjer

Hvordan søger du i LARM.fm?

SARA. Kvik Guide 2. udgave. Denne vejledning vil på mindre end en time vise dig, hvordan du kommer i gang med at bruge SARA.

PH udviklingsønsker - oplæg til møde den Formidling

PubMed Vejledning. Fritekstsøgning (Basic search) Fremvisningsformater

Danske biblioteker i WorldCat - et DEFF-projekt

CINAHL er en forkortelse for Cumulative Index to Nursing and Allied Health Literature.

Axiell Danmark. facebib. en vejledning

Søgeeksempel i CINAHL:

Til boligorganisationer og administrationsfællesskaber

PsycINFO Vejledning. Tryk på det ønskede emneord for at se dens plads i emnehierarkiet, så du kan se over- og underemner samt synonymer til begrebet.

Vejledning til Jobnet for Arbejdsgiver JobAG. CV-søgning

29. juli 2014 Vedr. afrapportering af projektet Fremfinding og tildeling af PID er fra Netarkivet til statslige digitale udgivelser.

Søgeeksempel i PubMed:

Hardeknud gruppe. Brugermanual. Tilegnet redaktører af gruppeweb hjemmeside

Vejledning til CINAHL Plus with Full Text

SkoleKomNet Administrationsvejledning

Brugervejledning til oprettelse af metadata

Præsentation af deff.dk. Mogens Sandfær Center for Videnteknologi DTV DTU

Vejledning for metadatabasen

VIA University College VIA Bibliotekerne CINAHL Plus

Vejledning til upload af e-bog via web-formular på

SmartWeb Brugermanual

I det kommende afsnit vil vi løbende komme ind på de enkelte resultater og samtidig komme med bud på, hvordan disse kunne løses i fremtiden.

TILLÆG TIL MANUAL Excel-indlæsning i Vvskatalogets administrationssystem

2. Godkendelse af referat fra møde 2. den DK5 udvikling? oplæg om kommende ændringer v. Birgit Gøtterup Dansk BiblioteksCenter

Mbridge tilmeldingssystem Version Vejledning.

Transkript:

Metadatakataloger Udarbejdet for Biblioteksstyrelsen af Arbejdsgruppen vedrørende Metadatakataloger Rapporter fra Biblioteksstyrelsen 5 Redaktion Vibeke Cranfield Udgivet i 2003 af Biblioteksstyrelsen Nyhavn 31 E 1051 København K Telefon: 33 73 33 73 Telefax: 33 73 33 72 E-post: bs@bs.dk Hjemmeside: www.bs.dk Rapporten er kun tilgængelig på Biblioteksstyrelsens hjemmeside Forsidelayout: Stæhr Reklame & Marketing Typografi: Times New Roman PS ISSN: 1397-887X Elektronisk ISBN: 87-91115-45-0

Metadatakataloger Udarbejdet af Arbejdsgruppen vedrørende metadatakataloger 2

Indholdsfortegnelse Indledning 4 Kommissorium og medlemmer 6 Kapitel 1 7 Functional Requirements for Bibliographic Records og anbefalingerne fra American Libraries Association Kapitel 2 11 CORC - registrering af internetressourcer i USMARC og DC Kapitel 3 13 Dublin Core, danmarc2 og katalogisering Kapitel 4 16 Danske nettjenesters og portalers brug af metadata som katalogdata Kapitel 5 32 Registrering af Internetressourcer i DC på Dansk BiblioteksCenter Kapitel 6 36 Opsummering og anbefalinger Referencer 39 3

Indledning I Danmark foregår der registreringer af netpublikationer til bibliotekers websider, til nettjenester og fagportaler, her kan nævnes BibHit, Folkebibliotekernes Net Guide, Netkat, Dansk BiblioteksCenters registreringer og fagportalerne i regi af Danmarks Elektroniske Forskningsbibliotek. Fælles for de registreringer der sker i dag, er at man i mere eller mindre grad har opfundet format og katalogiseringsregler til lejligheden eller efter behov. I nogle af projekterne har man taget udgangspunkt i Dublin Core-skemaet, undertiden med individuelle tilføjelser af flere felter. I andre har man opbygget en selvstændig registreringsform. Med udgangspunkt i registreringsniveau og genfindingsmulighed i de enkelte projekter har man i nærværende fremstilling fundet det relevant at sammenholde projekternes nuværende indhold med de mere generelle anbefalinger der er fremsat vedrørende brug af metadata som katalogdata. Rapporten beskæftiger sig primært med Dublin Core, og i mindre grad med MARC. Til belysning af udfordringer og fordele ved registrering i Dublin Core og Dublin Core-lignende formater, opridses indledningsvist kravene til katalogen. De overvejelser om brugen af DC som katalogdataformat, der er udgivet af ALA, er draget frem. De belyser bl.a. de forskelle der er mellem funktionalitet ved brug af henholdsvis DC og MARC. Som eksempel på et stort metadatakatalog er CORC/Connexion beskrevet. Endvidere beskrives og vurderes registeringsniveauerne hos de danske bibliotekers nettjenester, portaler og Dansk BiblioteksCenter. Dansk BiblioteksCenter har venligt stillet oplysninger og overvejelser om metadataregistreringerne i eget regi til rådighed, herunder beskrivelsen af den endnu ikke offentliggjorte database MetaNet. Da kapitlet (5) er udarbejdet af den involverede part, har det en lidt anden karakter end de efterfølgende vurderinger af øvrige danske nettjenester og portaler. Arbejdsgruppen har dog vurderet at indsigten i arbejdet med MetaNet er væsentlig for biblioteksoffentligheden, og i sammenhængen med emnet for nærværende rapport. Ønsket er at nærværende rapport kan danne baggrund for en fælles opfattelse af de minimumskrav vi ønsker at stille til en registrering/katalogisering af en bibliografisk enhed i det samarbejdende danske biblioteksvæsen. Formålet er derudover at anbefale en registreringspraksis der kan medvirke til at sikre mulighederne for samsøgning og understøtte datafællesskaber. Beskrivelserne i nærværende rapport er udarbejdet i slutningen af 2001 og i løbet af 2002. Vurderingerne grunder sig derfor til en vis grad på et øjebliksbillede. Der tages forbehold for at der kontinuerligt kommer nye 4

fagportaler til, og at der, måske medens dette læses, sker ændringer i eksisterende nettjenester. 5

Kommissorium Arbejdsgruppen, der startede sin udredning i starten af 2001, fik følgende kommissorium: Formål At undersøge og vurdere anvendelsen af metadata (Dublin Core) som katalogposter, samt udarbejde danske retningslinier for hvornår der bruges metadata og hvornår der foretages DanMARC2-katalogiseringer. Opgave Biblioteksstyrelsens vejledninger om metadata i danske netpublikationer er planlagt at skulle suppleres med et bind om metadatakataloger. Som baggrund herfor skal arbejdsgruppen: undersøge anvendelsen af metadata som katalogdata i udlandet undersøge anvendelsen af metadata som katalogdata i danske forsøg og kataloger udarbejde danske retningslinier for brug af metadata som katalogposter. Tidsplan Arbejdsgruppen udarbejder tidsplan på sit første møde og forelægger den på nærmest følgende KDU møde. Medlemmer Mona Brügge-Nielsen, Det nordjyske Landsbibliotek Henriette Fog, Danmarks Natur- og Lægevidenskabelige Bibliotek Birgit Gøtterup, Dansk BiblioteksCenter Erik Thorlund Jepsen, Danmarks Biblioteksskole Charlotte C. Pedersen, Biblioteksstyrelsen Jytte Hansen, Dansk BiblioteksCenter har bidraget med rapportens kapitel 5. 6

Kapitel 1 Functional Requirements for Bibliographic Records og anbefalingerne fra American Libraries Association - De teoretiske og de internationale overvejelser om metadata som katalogdata - Functional Requirements for Bibliographical Records (FRBR) og metadata. - ALA s (American Libraries Association) metadatarapport. Anvendelse af metadata som katalogdata har i international sammenhæng været, og er løbende, genstand både for stor interesse samt grundige overvejelser og undersøgelser. Der har i særlig grad været fokus på de metadataformater som er udviklet til brug for netpublikationer, især Dublin Core og TEI. American Library Association har udarbejdet en rapport der evaluerer metadata i den sammenhæng (især DC og TEI) som kilde til katalogdata for kataloger, som baserer deres regelsæt på AACR2. MARC-katalogiseringerne berøres, men behandles ikke i dybden. Der indgår i nærværende rapport en gennemgang og vurdering af disse anbefalinger i dansk sammenhæng. Dublin Core Metadata Initiative har udarbejdet retningslinier for en Library Application Profile, der skal kunne anvendes til implementering af Dublin Core i bibliotekssammenhæng. Resultaterne af dette arbejde vil ligeledes være af interesse for danske bibliotekers brug af metadata som katalogdata. Et eksempel på metadatagenerering foregår i OCLCs CORC-base (nu Connexion), hvor der automatisk tildeles Dublin Core metadata ved tilmelding af et givet link. CORC er under stadig udvikling, i øjeblikket arbejdes der med manuel tilknytning af autoritetsposter til registreringerne. Der udvikles endvidere på et automatisk opslag i en autoritetsfil. Planen er at den skal være færdig i løbet af 2002-3. 7

Hvad er metadatakataloger? Defintionen af metadata er grundlæggende : data om data. Metadataformatet beskriver det elementsæt, de felter og delfelter eller de tags der angiver hvilke data (f.eks. forfatter, udgiver, årstal, emne) der kan beskrives ved hjælp af det givne format. Katalogiseringsregler er regler der angiver hvilke data der medtages i registreringen, angiver dataindholdets form, samt foreskriver hvilke kilder der skal konsulteres. De mest udbyggede regler, og de med den længste historie, for angivelse af indholdets form, er AACR (Anglo American Cataloguing Rules). I bibliotekssammenhæng bruges i Danmark - og de fleste andre lande - metadataformatet MARC (eller MARC-kompatible formater) som er udviklet til brug for bibliotekskatalogerne og indeholder bibliotekernes kildedata. MARC-formatet skaber i sammenhæng med katalogiseringsreglerne grundlag for en ensartet registrering der sikrer genfinding af dokumenter (Information Retrieval), og mulighed for at forfølge relationer mellem dokumenter. Formatets primære funktion er at understøtte brugerens mulighed for at kunne søge/finde information, at kunne identificere information, at kunne udvælge information og at få adgang til dokumenterne. Andre metadataformater f.eks. Dublin Core er udviklet til brug for registrering af Internetressourcer og hovedsageligt for at opfylde to hensigter: understøtte søgning og skaffe adgang til informationen. De er som hovedregel udviklet for ikke-professionelle. Termen metadata har vundet indpas i fagsproget i takt med udviklingen af Dublin Core-formatet. Derfor ligger det implicit i arbejdsgruppens kommissorium at det der vurderes her, er kataloger der indeholder og præsenterer Dublin Core-registreringer. Functional Requirements for Bibliographical Records De funktionelle krav til katalogen, Functional Requirements for Bibliographical Records (FRBR), foreskriver at man ved hjælp af katalogen skal kunne Finde Identificere Udvælge Få adgang til bibliografiske entiteter. 8

Dublin Core, som elementsæt betragtet, kan i nogen udstrækning understøtte opfyldelsen af brugerkravene, som de er udtrykt i FRBR, men den i praksis manglende etablering af regelsæt og procedurer for at styre indhold af dataelementerne gør dem mindre egnet som katalogdata. Katalogdata, som de er udtrykt i MARC-posten, er optimeret til at understøtte ovenstående fire krav på en måde som ikke kan forventes af f.eks. Dublin Core-data. Brugen af autoritetskontrol forøger muligheden for at finde dokumenter som har samme ophav, emne eller er forskellige repræsentationer af samme værk. En homogen katalogpraksis tilføjer betragtelige værdier til de rådata der beskrives. Ved en homogen katalogpraksis forstås at ressourcen er beskrevet i en bibliografisk post og at de tilføjede værdier understøtter genfinding, identifikation, udvælgelse og adgang. Poster fra en katalogpraksis som ikke understøtter dette, behøver derfor ikke at være bedre end en Dublin Coreregistrering. Anbefalingerne i det følgende er udformet på baggrund af FRBR. Kapitel 1.2 ALA s anbefalinger I relation til emnet for nærværende rapport, har arbejdsgruppen fundet det væsentligt at præsentere de anbefalinger der blev fremlagt af en arbejdsgruppe under American Libraries Association. Konklusionerne blev publiceret i 1998. Den danske arbejdsgruppe har vurderet at rapporten stadig indeholder en velunderbygget vurdering af metadata som katalogdata. Hovedkonklusionerne er følgende : 1.2.1 Metadata udnyttes mest effektivt i et system der er designet til at understøtte disse. Metadata såsom DC er ikke til brug i bibliotekskataloger, medmindre disse bliver dannet med samme betydning og indhold som er besluttet ud fra AACR2 regler og regler for emne-indeksering. Imidlertid kan disse metadata anvendes som en nyttig kilde for dem der katalogiserer elektroniske ressourcer. 1.2.2 De fleste metadata er ikke lavet for at give tilstrækkelig information til at understøtte en skelnen mellem ressourcer, ej heller versioner. De tjener til genfinding og ikke til beskrivelse. Skal de bruges, skal der gives link til en fuld beskrivelse, eller der skal kunne linkes direkte til ressourcen. 1.2.3 Autoritetskontrol af data som lægges i metadataformater, er ikke et krav. Skal disse data genbruges til en katalog, skal der udføres kontrol inden data lægges ind. Undlader man imidlertid dette, anbefales det at disse data lægges i 9

en separat base. Ellers mister databasen en betydelig del af sin konsistens og standard. Det vil også betyde at katalogprincipperne brydes (Cutter 1 ). 1.2.4 Metadataudviklere har fokuseret mere på struktur af format/formular end på regler for semantik og indhold, hvilket AACR2 understøtter. Der har været fokuseret på mulighederne for dataoverførsel mellem forskellige formater og skemaer, men ikke på om der var overensstemmelse mellem, og fælles regler for, dataindholdets form (som f.eks. AACR). 1.2.5 Metadata fra en ikke-aacr-tilpasset kilde vil altid kræve en rekatalogisering ved integrering i bibliotekskatalogen. 1.2.6 Anvendelsen af metadataskemaer som Dublin Core må understøttes af institutioner der fungerer som ansvarlige autoriteter i forhold til dataregistrering og vedligeholdelse. 1.3 Sammenfatning af de generelle overvejelser Dublin Core bør primært anvendes til genfinding og ikke til vidensrepræsentation, det sidste foregår bedst ved hjælp af strukturerede repræsentationer som i MARC-formater, med anvendelse af katalogiseringsregler og struktureret emnerepræsentation(f.eks. klassifikationssystemer). Det er også væsentligt at notere sig at anbefalingen går på at man ikke uden videre bør integrere metadata fra forskellige kilder (jvnf. 1.2.5.). 1 Cutter, C.A. (1876). Rules for a Printed Dictionary Catalogue. I: Public Libraries in the United States of America : Their History, Condition & Management : A Special Report of the U.S. Commissioner of Education: 1876. Part II. Washington : Government Printing Office. S. 3-89 10

Kapitel 2 CORC registrering af internetressourcer i USMARC og DC - OCLC's kvalitetsvurderede links, katalog og metadatagenerator - OCLC's CORC metadatagenerator (Connexion) Cooperative Online Ressource Catalogue (CORC) er en fælleskatalog startet og understøttet af Online Computer Library Center 2 (OCLC). CORC s målsætning er som fælleskatalogen at opbygge en global database og et netværk med udvalgte og kvalitetsvurderede internetressourcer. OCLC s opgave er at understøtte de deltagende institutioner via dette delesystem, og de tilbyder at man kan få sine forpligtelser i forbindelse med disse ressourcer opfyldt på en hensigtsmæssig og økonomisk rentabel måde. I CORCsamarbejdet er i øjeblikket ca. 481 institutioner, hovedsagelig biblioteker. Det skal for god ordens skyld bemærkes at siden beskrivelsen til denne rapport, har CORC skiftet navn til Connexion. De faciliteter, som OCLC understøtter, er 1) Vejledninger til katalogisering og håndtering af USMARC/MARC21 og DC 2) opretholde katalogens integritet og udvikling 3) udvælge kvalitetsressourcer 4) løbende kontrol af links. CORC-systemet understøtter følgende faciliteter i katalogiseringsprocessen: Kontrolmuligheder for valg af kontrollerede emneord i Thesauri (bl.a. MESH), og kontrol og valg af navneformer i autoritetsfiler. Katalogiseringsregelsættet er Anglo American Cataloguing Rules 2. ed. (AACR2) og vejledning er udarbejdet af OCLC. De inddaterende biblioteker kan registrere i to formater USMARC og DC. I retningslinierne gives dog udtryk for at MARC er standarden og DC er supplement. Der er ingen retningslinier for i hvilke tilfælde man anbefaler MARC fremfor Dublin Core. Der er kun givet udtryk for at begge formater er valgt til at understøtte databasen, idet man kan udnyttet begge formaters fordele og ulemper. I CORC s orientering er ingen angivelse af hvilke, og hvor mange, biblioteker der rent faktisk indddaterer i CORC. CORC konverterer USMARC/MARC21 posterne til DC og angiver at denne konverteringsproces er uproblematisk. Navneformer i DC er inverterede og delfelterne fra MARC er angivet med prik. Problematisk er konverteringen den 2 OCLC er en ikke-kommerciel medlemsorganisation der betjener 42.489 biblioteker i 86 lande verden over. http://www.oclc.org/about 11

anden vej, hvilket der ikke er fundet en endelig løsning på fra OCLC s side endnu, men det angives at det er en af udviklingsopgaverne. I arbejdsgruppens undersøgelse af CORC-databasen er det korrekt at posterne fremstår i begge formater. Posterne bærer præg af ensartethed. Tidsskriftposter mangler til tider beholdningsangivelser og oplysninger om adgangsforhold. D.v.s. at man får indtryk af at de mere administrative dataelementer ikke er vægtet højt. I OCLC s retningslinier er angivet at lokalkatalogernes adgangsforhold skal angives i MARC-formatets 856-felt. Alle typer af dataelementer er rigt repræsenteret inden for de beskrivende og normative data. Dataelementer såsom sprog, publiceringstid etc. er mere uensartede. I det samlede hele fremstår posterne i høj grad som anvendelige til at kunne understøtte de primære bibliografiske funktioner: genfinding, identificering, udvælgelse og lokalisering. Autoritetskontrolfaciliteten fremstår som godt integreret i inddataformularerne. Nærmere undersøgelse i databasen viser at AACR2 s krav til håndtering af navneformer ikke er opfyldt. Der laves automatisk et url-check af adressen i inddateringsformularen, når den opdateres. Ved gennemgang af DC-postfremvisningen får man helt klart en oplevelse af at se på et MARC-format hvor felterne i stedet er benævnt med Dublin Coreelementer. OCLC s udmelding om at MARC er standard-formatet og DC er det supplerende format, understreges af databasens fremtræden. CORC/Connexion databasen fremstår i sin helhed meget konsistent og ensartet og de lovede faciliteter synes at være til stede. DC s rolle i datasamarbejdet fremstår som sekundær, men DC s fordele er vægtet. Data indtastes af professionelle med fælles retningslinier og gode arbejdsfaciliteter. Konklusionen er at anvendes DC i et meget veldefineret miljø med central styring og fælles retningslinier, kan formatet anvendes. Det er dog ikke muligt at pege på at DC kan anvendes som et hovedinddata-format. Konvertering fra DC til MARC er ikke løst og DC er ikke indført på lige fod med MARC, men som et supplerende format. Guidelines for bibliographic description of internet resources: http://www.oclc.org/oclc/man/9256cat/chap2.htm Connexion http://www.oclc.org/connexion/ 12

Kapitel 3 Dublin Core, danmarc2 og katalogisering Kvaliteten af en registrering af en netressource kan vurderes ud fra om registreringen kan levere de nødvendige oplysninger i forhold til Functional Requirements for Bibliographic Records (FRBR) krav om mulighed for at finde, identificere, vælge og skaffe netressourcen. Nedenfor undersøges kravene til registreringen i FRBR i forhold til Dublin Core. Et X i en rubrik betyder at elementet er af høj værdi for den pågældende funktion. Omvendt betyder et tomt felt ikke nødvendigvis at elementet slet ikke kan anvendes til den pågældende funktion. DC-element Finde Identificere Vælge skaffe Titel Udgave X X X X X X Forfatter eller ophav X X X Emne og nøgleord X X Beskrivelse X Udgiver X X X Anden bidragyder X X X Dato (udgivelsestidspunkt) X X Ressourcetype X X X Format X Identifikator X X X Kilde X X Sprog X X Relationer Filfortegnelse parallel trykt udgave programmel forudsat X X X X X X X Dækning X X Rettigheder X Dublin Core indeholder oplysninger som for nogle dokumenttypers vedkommende, er egnet til at finde, identificere, vælge og skaffe netressourcer, men for at oplysningerne skal fungere i en bibliografisk database stilles krav om entydighed i registreringen af de enkelte elementer. Dette betyder f.eks. at for at titlen skal kunne fungere som søgeelement, skal man forsøge at identificere den mest hensigtsmæssige titel, ligesom relevante alternative titler kan bringes som søgeelementer. 13

Nedenfor gennemgås Dublin Core elementerne med henblik på hvilke krav der stilles til de enkelte elementer: DC-element Titel Udgave Forfatter eller ophav Emne og nøgleord Beskrivelse Udgiver Anden bidragyder Krav Definition af hvad der opfattes som titel, og registrering af relevante titelelementer. Registrering af uniforme titler og standardtitler for musik Definition af forfatterbegrebet, især i forhold til udgivere og andre bidragydere Navneformsregler: inverteret m.v. Autoritetskontrol Angivelse af emnesystem og tilsvarende autoritetskontrol Definition af udgiverbegrebet i forhold til ophav Navneformsregler: Autoritetskontrol Definition af bidragyderbegrebet, f.eks. hvor meget skal der være bidraget med for at en bidragyder medtages Navneformsregler: Autoritetskontrol Dato (udgivelsestidspunkt) Standardiseret datoformat Ressourcetype Standardiserede typebetegnelser Format Standardiserede formatbetegnelser Identifikator Standardiserede identifikatorer Kilde Sprog Standardiserede sprogbetegnelser Relationer Standardiserede betegnelser Filfortegnelse parallel trykt udgave programmel forudsat Dækning Rettigheder Angivelse af standardiseringssystem og tilsvarende autoritetskontrol Kravene til registrering handler i meget høj grad om standardisering, dvs. regulering af de forhold som også for traditionelle materialer reguleres af katalogiseringsregler, standarder og autoritetskontrol. En simplificering af formatet i form af Dublin Core medfører altså ikke en reduktion i kravene til katalogisering. Registreringens kvalitet vil stadig afhænge af det valgte katalogiseringsniveau. Autoritetskontrol For at øge precision og recall i søgninger er autoritetskontrol nødvendig. Internationalt er der arbejdet med genbrug af det meget kostbare arbejde med 14

autoritetskontrol i en del år. Dette har indtil videre resulteret i at der er udarbejdet et sæt minimumskrav til autoritetsposter. De findes i Mandatory Data Elements for Internationally Shared Resource Authority Records : Report of the IFLA UBCIM Working Group on Minimal Level Authority Records and ISADN http://www.ifla.org/vi/3/p1996-2/mlar.htm Derudover er der i IFLA-regi netsat en arbejdsgruppe som arbejder med autoritetskontrol: Functional Requirements and Numbering of Authority Records working group Endvidere er der i EU-regi taget initiativ til at undersøge mulighederne for en fælles standard for autoritetskontrol for biblioteker, museer og arkiver. Arbejdet foregår i LEAF-projektet: http://www.crxnet.com/leaf/index.html 15

Kapitel 4 Danske nettjenesters og portalers brug af metadata som katalogdata - Resumé - BibHit - FNG - Fagportalerne i Danmarks Elektroniske Forskningsbibliotek - Sammenligning af funktionalitet ved henholdsvis Dublin Core og Dansk BiblioteksCenters retningslinier for registrering af Internetressourcer i danmarc2. Resumé For de nettjenester og portaler der er vurderet, er der en række fælles karakteristika Der er mangel på regelanvendelse i inddateringerne, og registreringerne fremstår derfor samlet set som mere eller mindre uensartede Der er manglende homogenitet i opslagene Der er ikke mulighed for autoritetskontrol. Dublin Core-skemaet er anvendt i de fleste af projekterne, men der vælges ret forskelligt med hensyn til katalogiseringsniveau, også inden for det enkelte projekt. Hvis der ikke stilles krav til uddannelsesniveau og katalogiseringserfaring hos katalogisatorerne, er det svært at opnå homogenitet i databasen/katalogen. En fælles metadata-pool, dvs. fællesmængden af registrerede publikationer og websider i de danske nettjenester og portaler vil sandsynligvis fremstå som rodet og usammenhængende, både p.g.a. den manglende dækning inden for et bestemt område/en bestemt kategori, og på grund af den uensartede katalogiseringspraksis, dels inden for det enkelte projekt, dels projekterne imellem. BibHit BibHit er et søgeværktøj udviklet af Århus Kommunes Biblioteker, Hobro Bibliotek, Gladsaxe Bibliotekerne og Silkeborg Bibliotek med støtte fra Biblioteksstyrelsens Udviklingspulje for folke- og skolebiblioteker og Overbygningsspuljen. www.bibhit.dk giver adgang til søgning i en metadatakatalog med kvalitetsvurderede internetressourcer. Nettjenesten er designet til unge og voksne biblioteksbrugere som primær målgruppe og bibliotekernes informationsformidlere som sekundær målgruppe. 16

Formål Det overordnede formål med metadatakatalogen er at gøre kvalitetsvurderede internetressourcer i fuldtekstform til en integreret del af vidensformidlingen på bibliotekerne. Endvidere er det formålet at give slutbrugerne mulighed for at vælge samsøgning i metadatabasen og i en eller flere af de deltagende bibliotekers lokale bibliotekskataloger (ultimo juli 2002 i 8 bibliotekers databaser). På sigt skal samsøgning i BibHit være mulig via bibliotekernes egne brugergrænseflader. I BibHit-projektet deltager p.t. 25 biblioteker med Silkeborg Bibliotek som projektansvarlig samt et antal studerende på Biblioteksskolen. Metadatakatalogen indeholder omkring 8.550 poster (ultimo juli 2002). Indsamling og selektion Indsamlingen af internetressourcer foretages dels automatisk via en høstmaskine, Combine harvester, hvor hver høstning udgør en deldatabase på serveren som katalogisatorerne kan udvælge ressourcer fra til katalogisering, og dels manuelt herunder forslag fra brugerne. Som hjælperedskaber til udvælgelse af ressourcer til metadatakatalogen findes der en guide til afsøgning af nettet (http://www.bibhit.dk/info/godelinksguide.htm), en materialevalgspolitik med få meget overordnede retningslinjer og en kort checkliste til kvalitetsbedømmelse af ressourcerne (http://www.bibhit.dk/info/mat_man.htm). De ressourcer der katalogiseres, er primært fuldtekstdokumenter på dansk, skandinavisk og engelsk, og det tilstræbes at dokumenterne skal være tilgængelige for brugerne inden for 1-2 klik. Betalingsressourcer medtages ikke. Katalogisering Formatet der anvendes i BibHit, er baseret på Dublin Core Metadata Element Set. Inddateringsformularen indeholder 10 af de 15 elementer som DCMES består af samt 8 supplerende elementer, hvoraf nogle er af administrativ karakter som ikke fremvises ved søgning. Nedenstående skema illustrerer formatets overensstemmelse med Dublin Core: Elementer i BibHit s inddateringsformular Tilsvarende element i Dublin Core Obligatorisk/ikke obligatorisk Automatisk generering Adresse (URL) DC.Identifier Obligatorisk Automatisk hvis indsamlet maskinelt Titel DC.Title Obligatorisk. Undertitel medtages også Forfatter DC.Creator Ikke obligatorisk. Ingen autoritetskontrol - slå gerne op i biblioteksdatabasen for 17

at finde den autoriserede udgave af forfatternavnet jf. hjælpeteksten. Personnavne inverteres. Navne på organisationer med klart hierarki angives i nedadgående rækkefølge Udgiver DC.Publisher Ikke obligatorisk. Ingen autoritetskontrol. Er ophav og udgiver identiske, udfyldes Udgiver også Beskrivelse DC.Description Obligatorisk Kontrollerede emneord DC.Subject Obligatorisk. Autoritetskontrol via BibHits emneordsliste baseret på DBC s liste over kontrollerede emneord Ukontrollerede emneord DC.Subject 18 Ikke obligatorisk. Kan udfyldes jf. hjælpeteksten. Ressourcens egne emneord på originalsproget kan også placeres her Sprog DC.Language Obligatorisk + drop down menu Dato for udgivelse DC.Date Ikke obligatorisk Opdateringsdato Ikke obligatorisk Slettedato Ikke obligatorisk Ressourcetype DC.Type Ikke obligatorisk + drop down menu med 6 hovedkategorier - følger BS anbefalinger Format DC.Format Ikke obligatorisk + drop down menu følger BS anbefalinger Automatisk Text Automatisk Text/html Størrelse Ikke obligatorisk Bytes og/eller sider Egnethed Ikke obligatorisk Bibliotekstype Obligatorisk Automatisk via login Bibliotek + initialer Obligatorisk Automatisk via login Behandling Obligatorisk Automatisk Dato for katalogisering Obligatorisk Automatisk

Dato for opdatering af posten Automatisk ved efterfølgende rettelser Dublin Core-elementerne Andre bidragydere (DC.Contributor), Rettigheder (DC.Rights), Dækning (DC.Coverage), Kilde (DC.Source), Relationer (DC.Relation) har tidligere været integreret i formularen, men er blevet fravalgt i 2001. Elementet Dækning (DC.Coverage) dækkes i nogen grad af de kontrollerede emneord for perioder og stednavne i emneordsfeltet (jvf. BS definition af elementet). Som hjælperedskaber for katalogisatorerne findes der En katalogiseringsmanual med vejledning og gode råd til henholdsvis automatisk og manuelt indsamlede ressourcer. Indeholder kun få egentlige regler (http://www.bibhit.dk/info/kat_man.htm) Korte hjælpetekster med få regler og eksempler i inddateringsformularen Emneordsmanual og browser (http://www.bibhit.dk/info/emne_man.htm) DC-BibHit knappen - en form for Dublin Core metadata editor der muliggør automatisk overførsel af ressourcens metadata til de respektive elementer i BibHits inddateringsformular Databasen vedligeholdes ved automatisk url-check. Søgning Der findes to søgeflader en simpel og en avanceret (sidstnævnte netop implementeret i en forbedret udgave) begge med mulighed for at vælge parallelsøgning i en eller flere af p.t. 8 bibliotekers databaser. I fritekstsøgningen er frasesøgning og søgning med booleske operatorer mulig. Ved mange hits er det muligt at præcisere søgningen inden for titel, forfatter, udgiver og sprog. I den avancerede søgning kan der vælges sprog, og søgningen kan præciseres med booleske operatorer inden for elementerne titel, forfatter, udgiver, emneord og url. Hjælpetekster er tilknyttet de enkelte elementer. Skanning i systemets registre er ikke mulig undtagen i forbindelse med de kontrollerede emneord, hvor der i den avancerede søgeflade er adgang til emneordslisten. Der er to fremvisningsformater et oversigtsformat der viser titel, hel eller delvis beskrivelse (max. ca. 125 tegn), emneord og url samt ikon for materialetype et flere oplysninger - format med overskrifter tilknyttet der ud over de obligatoriske elementer fremviser forfatter, udgiver, dato (udgivelse/opdatering) og størrelse, hvis de er registreret. 19

Format, ressourcetype samt dato for registrering fremvises ikke. Sidstnævnte burde imidlertid fremvises på grund af ressourcernes overvejende dynamiske karakter. Dokumenternes indre formbetegnelse indgår i registreringen fra omkring 2002 via kontrollerede emneord, hvilket forbedrer søgemulighederne især i forbindelse med samsøgning i bibliotekskatalogerne. På søgeresultatsiden fremvises antallet af hits i BibHit samt ved samsøgning antal hits i bibliotekernes databaser øverst i skærmbilledet. Søgeresultatet fremvises med 10 poster ad gangen fra henholdsvis BibHit og bibliotekskatalogerne. Rækkefølgen af posterne ved fritekstsøgning i BibHit bestemmes af antal gange søgeordene optræder i posterne, mens posterne i bibliotekskatalogerne fremvises efter registreringstidspunktet. Vurdering En undersøgelse af et udvalg af katalogiseringer i BibHit fra 2002 viser at katalogiseringerne ofte fremtræder inkonsistente, og at katalogiseringsniveauet er svingende. Posterne bærer præg af at der ikke findes et udførligt regelsæt for katalogiseringspraksis, og at der ikke er krav om navneformskontrol. Der er stor forskel på præcisionen i og omfanget af den indholdsbeskrivende note samt graden af udførlighed og specificitet i emneindekseringen. Endvidere mangler der ofte et samspil mellem indholdsnote og emneord. Der er ligeledes flere eksempler på problemer med bestemmelsen af funktionerne ophav/udgiver. Posterne understøtter derfor i varierende grad de fire brugertasks i FRBR. Overordnet set er vurderingen imidlertid at posterne udmærket kan understøtte genfinding ved emnesøgninger, som er brugernes foretrukne søgekriterium, enten ved brug af fritekstsøgningen og muligheden for at præcisere søgningen ved mange hits, eller via den avancerede søgeflade hvor den kontrollerede emneordsliste kan anvendes, hvilket mindsker støj i søgningen og samtidig forbedrer kvaliteten af søgningen ved samsøgning i bibliotekskatalogerne. Derimod understøttes genfinding ved søgninger på personligt/korporativt ophav i ringe grad på grund af den manglende navneformskontrol samt ophav/udgiver problematikken, specielt ved samsøgning i bibliotekskatalogerne en problemstilling der intensiveres i takt med, at antallet af poster vokser i BibHits database. Med hensyn til at identificere er grundlaget i posterne utilstrækkeligt. Af obligatoriske data findes kun titel (ikke varianttitler), url og sprog som primært identificerende data. Oplysninger om ophav og udgiver er ikke obligatoriske, dato for udgivelse/opdatering er ofte fraværende, type og format fremvises ikke, og oplysninger om kilde og relationer er fravalgt. Som helhed betragtet kan posterne udmærket understøtte brugerne i at udvælge internetressourcer gennem de obligatoriske elementer titel, beskrivelse og emneord i forening. Relevansbedømmelsen kan ofte foretages i oversigtsformatet ved emnesøgninger, da både titel, hel eller delvis beskrivelse, 20