Internationalt udblik: Digital bevaring på Rigsarkivet i Danmark Jan Dalsten Sørensen Digital Bevaring og Oparbejdning 29. November 2016 1
Agenda Generelt om udfordringer ved digital bevaring Strategivalg Implementering i Danmark 2
Arkivalier
Digital forvaltning (e-förvaltning) Dokumenter skabes og lagres digitalt Journalisering (diarieföring) sker digitalt Store mængder bevaringsværdig information findes i fagsystemer (specialistsystem) Nye udfordringer både i forhold til medier og formater 4
Den store Jellingesten Foto: Jürgen Howaldt
Data mistes over tid Teknologien forældes Medier 6
Forældet teknologi Foto: Bilby 30-11-2016 7
Programmer og formater forældes 30-11-2016 8
Udfordringer Medier nedbrydes (vi kan ikke bruge runesten til at bevare al information ) Teknologi til læsning af medier forældes Formater forældes Langsigtet forståelse og genanvendelse forudsætter dækkende dokumentation Digital bevaring koster penge! 9
Computermuseum Foto: Marcin Wichary 30-11-2016 10
Valg af strategi Migrering? Emulering? Vi har valgt migreringsstrategien Data og dokumenter migreres til arkivformat ved aflevering, og efterfølgende efter behov Vi bevarer ikke en original, men evnen til at reproducere original information 11
Konkret implementering i Danmark It-systemer med bevaringsværdige data/handlinger skal identificeres tidligt Data og dokumenter afleveres ofte/frekvent til Rigsarkivet i systemuafhængigt format Rigsarkivet gennemfører løbende migrering og bevaringsplanlægning
Identifikation og godkendelse Illustration: digitalbevaring.dk
Anmeldelse & godkendelse Alle statslige it-systemer skal anmeldes til Rigsarkivet Bevarings-/kassationsvurdering (gallringsutredning) sker som første trin Systemer, der skal bevares, skal godkendes med henblik på aflevering.
Tilsyn Tilsyn med IT-systemer med dokumenter efter 2 år Periodiske tilsyn med om anmeldelsespligten overholdes
Frekvente afleveringer/leverancer Illustration: digitalbevaring.dk 16
Frekvente afleveringer, systemuafhængige arkiveringsversioner Aflevering ca. hvert 5. år Arkiveringsversion (SIP): Bestemt struktur Dokumentation, fastsat af Rigsarkivet Bestemte formater: XML, UTF-8 TIFF, JPEG2000 GML MP3, MPEG-2, MPEG-4
Migrering/dokumenter Migreres/ konverteres til TIFF JPEG-2000 MP3 MPEG 2/4 GML 30-11-2016 18
Migrering/databaser Originaldatabase Migreres/ konverteres til standardformater og leveres i Rigsarkivets XML-format Baseret på SIARD (Software Independent Archiving of Relational Databases) 30-11-2016 19
Dokumentation Datanær dokumentation 30-11-2016 20
Datanær dokumentation 30-11-2016 21
Dokumentation Metadata om leverancen Datanær dokumentation 30-11-2016 22
Eksempelvis: Metadata om leverancen Arkivskaber År Overordnet beskrivelse af variable og population ( Indeholder oplysninger om alle danske skoleelever. Bl.a. karakterer, fagvalg samt forældre og søskende ) 30-11-2016 23
Dokumentation Kontekstdokumentation Metadata om leverancen Datanær dokumentation 30-11-2016 24
Kontekstdokumentation Dokumenter, som fortæller om it-systemet og dets anvendelse Teknisk dokumentation Brugerhåndbøger/manualer Instrukser Skærmbilleder Dokumenterne indscannes og indgår i arkivformat i den samlede leverance 30-11-2016 25
Bevaringsplanlægning Illustration: digitalbevaring.dk
Behov for nye formater og metoder Den digitale verden skaber til stadighed nye digitale objekter Nogle af disse bør bevares på langt sigt krav til nye bevaringsformater Eksempel: Geodata vokser enormt i forvaltningen og stiller nye krav til formater (GML) 27
Kriterier for valg af formater til bevaring Standardiseret eller i hvert fald velbeskrevet Bredt understøttet Platformsuafhængigt og åbent Ikke tabsgivende på en måde, så kvaliteten af data forringes Forventet lang levetid, ikke dynamisk Kunne konverteres til nye formater (dvs. må ikke indeholde specielle funktioner, som relaterer sig til bestemte operativsystemer eller programmer) Skal kunne valideres 28
PDF/A hvad er problemet? Meget komplekst Kan ikke valideres, dvs. det kan (endnu) ikke testes, om et dokument overholder standarden. Evt. validering af PDF/A garanterer ikke validering af PDF-standarden Findes i mange varianter, og udvikles hele tiden (p.t. meget dynamisk), og indeholder mange features 30-11-2016 29
Eksempel: Manglende fonte 30-11-2016 30
Eksempel: Manglende fonte 30-11-2016 31
Eksempel: Lag (layers) 30-11-2016 32
Eksempel: Lag (layers) 30-11-2016 33
Din organisation? Hvordan og hvornår identificeres de it-systemer, hvor der skabes og lagres information/handlinger/records? Hvornår træffes bevaringsbeslutning og af hvem? Er der tilsyn med og kvalitetssikring af it-systemer med bevaringsværdig information? Hvilken strategi er der for bevaring på mellemlangt og langt sigt? Dette gælder både mht. formater og dokumentation. 34
Spørgsmål? E-post: jds@sa.dk Twitter: jdalsten Illustration: digitalbevaring.dk