Digital Article Database System (DADS) den fleksible konfigurerbare, integrationsvenlige løsning Christian Tønsberg, DTIC Konferencen Well11, 8. februar 2011, Dansk Design Center
En databrønd og landskabet omkring den Løbende indsamling fra kilder (stor variation) Normalisering, harmonisering, berigelse (lille variation) Databrønd Søgemaskiner / Indexering af delmængder (variation) Eksponering / portal (stor variation) 2
Indsamling - tidsskriftsartikel data Forlag: Academic Press, Association for Computing Machinery, American Chemical Society, Annual Reviews, Berkeley Electronic Press, Blackwell, BioMedCentral, Cambridge University Press, Central Eastern European Online Library, Cell Press, Cochrane Library, Elsevier, Emerald, Highwire Current, IEL (IET/IEEE), Institute of Physics, Inter-research Science Center, JStor, Karger, Kluwer, Mary Ann Liebert, National Research Council of Canada, Nature, Oxford University Press, Proceedings of the National Acad. of Sciences, Royal Society of Chemistry, Sage, Science Magazine, Science Research Publishing, Society for Industrial and Applied Mathematics, SPIE (International Society For Optics and Photonics), Springer, Taylor and Francis, Walther de Gruyter, Wiley A&I: ABI Inform, Biosis Previews, Compendex, Ebsco Academic Search Elite, Ebsco Academic Search Premier, Ebsco Business Source Premier, Food Science and Technology Abstracts, Inspec, Periodicals Index Online (Proquest), PubMed, Web Of Science, Wilson Art and Humanities, (på vej: Scopus) Aggregators: Swets, DOAJ, Dansk Artikel Index Fed = lokal fulltext 3
Indsamling - anden data E-bøger: ACLS Humanities ebook, ACM digtial Library, Blackwell Online reference books, CRC e-books, EBSCOhost Academic Search Elite, EBSCOhost Business Source Premier Ebooks, Elsevier, IEEE Conference Proceedings, IEEE Xplore Standards, IEEE/Wiley E- books, IOS Ebooks, Knovel Ebooks, Myilibrary, National Academies Press Free e-books, SPIE Digital Library ebooks, SPIE Digital Library Proceedings, Springer ebooks, Springer Protocols, Springer Lecture Notes in computer Science, Wiley Open Access Preprints: Arxiv.org Eprint Archive, Cern Document Server, Citeseer, Digital Library for Earth System Education (dlese), Digital Library for Information Science and Technology (dlist), Dspace@MIT, Electronics and Computer Science Eprints Database (ecs prints), Mathworld, Nasa Technical Report Server (NTRS), Numdam, Organic Eprints, Project Euclid (Cornell University) Fed = lokal fulltext 4
Indsamling - generelt Understøtter variationen i (og forandringen over tid af): formater, encodings, protokoller, pakninger, medier opdateringsfrekvenser, vækstrater Håndterer ikke ubetydelig støj : korrektioner retrodigitaliseringer leverandør-evolution (nytilkomne, sammenlægninger, opsplitninger, etc) fulde gensendelser næsten fulde gensendelser Afvikles på DTIC infrastruktur; skaleres efter faktiske forudsigelige udviklinger på dataområdet (erfaring: langtidsforudsigelser meget usikkerhedsbehæftet) 5
Normalisering, harmonisering, berigelse Normalisering til fælles internt format Reparation af data (eksempler: manglende ISSN numre, properitære character encodings, etc) Udregning af dedubliceringsnøgle Berigelse: Fra eksterne kilder (WorldCat, BFI, etc) Berigelse (på vej): Fulltext mining 6
DADS Databrønd - en reel databrønd Løbende indholds aggregering - uafhængigt af specifik aftager-scenarier Dækkende aftageres annoncerede - og realiserbare - behov Udvikles til at dække aftagerenes behov Tidsskriftsartikeler: Ca. 200M poster Svarende til ca. 120M publikationer Ca. 12M fulltexter lokalt opbevaret Pga. historik (hos DTIC, aftagere og på datamarkedet): Primær dækning i STM (de seneste år: udvidet med non- STM kilder); STM overrepræsenteret i de Primært engelsksproget materiale (seneste år: udvidet med dansksproget indhold) 7
Indexeringer / Søgemaskiner Fleksibilitet: Integrerer med eksponerings-/portallaget Skåret til aftagers data-adkomst (licenser+aftaler) Opsætning/udvikling i samspil med aftageren og dennes eventuelle tekniske setup og leverandør Eksempler: Klassisk DADS - post-orienteret, ingen deduplicering, internt datafomat (udfases 2011) Erhvervsorienteret DADS variant (FindIT) PRIMO 3rd Node - post-orienteret, dedupliceret (prioriteret liste af leverandører), PNX-svar DTU Digital Library - publikations-orienteret, dedupliceret (sammenklyngning), compound-xml Erfaringer: Stor behovs-variation hos aftagere, behov for aftager-tilrettede løsninger for at opnå ønsket eksponering Gæt: Usvækket behov for fleksibilitet i en verden med virtuelle databrønde 8
Eksponeringer / portaler Overbygninger på DTIC s databrønd Nogle udviklet/hosted af DTIC (Eksempel: DADS, DTU Digital Library) Andre udviklet og/eller hosted hos aftageren (Eksempel: PRIMO) Erfaring: Meget stor variation i behov Stigende lyst til selv at tage ansvar for slutbruger oplevelsen 9
Erfaringer og muligheder Dokumenteret driftserfaring gennem mere end et årti Aftale grundlag med data leverandørerne, som åbner for danske aftagere af DTIC-hostede indexeringer Præcedens for internationale aftagere skabt Bredt og dybt dækkende i STM Dokumenteret erfaring med tilpasning til aftageres behov Integreret søgning vha. koblede (virtuelle) databrønde kan give udfordringer med at tilsikre rette kombination af brugeroplevelse, pris, data og index konfigurering. Fleksibilitet mht. data og indexeringer kan være nødvendig At holde sig til en/få databrønd - og/eller at samarbejde tæt med en fleksibel databrøndsleverandør - kan skabe værdi. Et par eksempler... 10
Eksempel 1 - Overblik over tidsskrifter (1) 11
Eksempel 1 - Overblik over tidsskrifter (2) 12
Eksempel 1 - Overblik over tidsskrifter (2) 12
Eksempel 1 - Overblik over tidsskrifter (2) Overblik over databrønds indhold Med mulighed for issuefremvisning } 12
Eksempel 1 - Overblik over tidsskrifter (2) Overblik over databrønds indhold Med mulighed for issuefremvisning } Notifikation om nyt 12
Eksempel 2 - Bro til forskningsregistrering (1) 13
Eksempel 2 - Bro til forskningsregistrering (1) Summarisk overblik over forskningsregistreringer Samt registreringer på vej 13
Eksempel 2 - Bro til forskningsregistrering (1) 13
Eksempel 2 - Bro til forskningsregistrering (1) Benyt databrønd til kompletering 13
Eksempel 2 - Bro til forskningsregistrering (2) Specialiseret søgning efter egne publikationer 14
Eksempel 2 - Bro til forskningsregistrering (3) Anmeld fundne publikationer til central forskningsregistrering 15
Eksempel 2 - Bro til forskningsregistrering (4) Upload ufundne publikationer til central forskningsregistrering 16
? (eller senere) 17