Hvad udgør en ADA-test? Dokumentation af testfunktioner i ADA (version 3.0.0)

Relaterede dokumenter
Hvad udgør en ADA-test? Dokumentation for maskintest ved ADA (version 2.3.0) iht. bekendtgørelse 1007 af 20. august 2010

Hvad udgør en ADA-test? Dokumentation af hvad ADA (version 3.3.3) tester for.

Bekendtgørelse om arkiveringsversioner

Udkast til revideret bekendtgørelse om arkiveringsversioner

Udkast til revideret bekendtgørelse om arkiveringsversioner

Bilag B2: Oversigt over foreslåede ændringer i bekendtgørelse om arkiveringsversioner Høringsudgave, august 2017

Vejledning til bekendtgørelse om arkiveringsversioner

Oversigt over de mest almindelige fejl ved test

Vejledning til bekendtgørelse om arkiveringsversioner

Vejledning til bekendtgørelse om arkiveringsversioner

Vejledning til bekendtgørelse om arkiveringsversioner

Releasenote ADA 3.3.3

Kort og godt om test af arkiveringsversioner

Anvisning i aflevering af bitemporale data

Vejledning om produktion af arkiveringsversioner. Oktober 0 1

Vejledning til aflevering af dokumenter fra it-systemer til Statens Arkiver. Marts 1

Afleveringsbestemmelse for Kingo

Dokumentvejledningen. Rigsarkivet december 2015, BETA-version

@ 1. Vejledning til Bekendtgørelse om arkiveringsversioner af bevaringsværdige data fra elektroniske arkivsystemer

Bekendtgørelse om arkiveringsversioner af bevaringsværdige data fra elektroniske arkivsystemer

FESD-standardiseringsgruppen Att: Palle Aagaard IT- og Telestyrelsen IT-strategisk kontor Holsteinsgade København Ø

DAVAR Omdøbt til SagDokumentFormat. Attention er skilt ud i et selvstændigt format, AttentionFormat.

Internationalt udblik: Digital bevaring på Rigsarkivet i Danmark

Brugervejledning til ADA

De præmisser vi arbejdede under, har haft betydning for det endelige valg af format.

Hvad er en relationsdatabase? Odense, den 19. januar Version 1.0

CAREArkiv. -Pligtaflevering af arkivdata fra RAMBØLL CARE.

- beskrivelse af snitflader

Aflevering af kommuner og og regioners digitale data og dokumenter til Statens Arkiver. En generel vejledning til kommunale og regionale myndigheder

Finanstilsynets indberetningssystem. Vejledning til Regnearksskabelonerne

Anvendelse af dobbelthistorik i GD2

Tilslutning til ecomone Basis (OIO Faktura)

IKT-teknisk kommunikationsspecifikation

Annoncering af opgave om udarbejdelse af arkiveringsversion af Guldborgsund Kommunes ESDH-system. Annonceringsmateriale

Udkast til: Cirkulære om anmeldelse og godkendelse af it-systemer

Vejledning om IT-arkivering

Vejledning i skabelse og test af metadata

Vejledning til SQL Converter - databaseindlæsning af arkiveringsversioner Side 1 af 17

Integration af DocuBizz og Helios

OIOUBL Guideline. OIOUBL Guideline

Skriftlig eksamen i. Databaser. Vinter 2002/2003

Bilag til vejledning i anvendelse af attentionformatet i Digital Post-løsningen. December 2017, version 0.9

Side 1. Databaser og SQL. Dagens gang. Databasebegreber. Introduktion til SQL Kap 1-5

Snitfladebeskrivelse Import og Eksport af.csv fil til Tabulex Skema

Kapitel 1 Anvendelsesområde. Kapitel 2 Behandling og opbevaring

Udgivelsen er beskyttet af Creative Commons license, Navngivning 2.5

Brugermanual SOFIA 2.1 Til brugere på læsesalen. Rigsarkivets program til visning af digitale arkivalier august 2015

Notat. Indholdsfortegnelse. Statens Arkiver. Ang.: Statens Arkivers terminologi for digital bevaring, v. 18 Til: BK-Afdelingen Fra: ALT

Skriftlig eksamen i. Databaser. Vinter 2002/2003. Vejledende løsninger

Database for udviklere. Jan Lund Madsen PBS10107

OBJEKTKODE Kodeværdi for objekttype Integer(2) 30 Objektkode 30 gælder for planer der knyttes til en lokalplan. Se evt. kodeliste for Plandk2+

kv AC Station. Kontrolanlæg Relæbeskyttelse. Dataudveksling med SIMEAS SAFIR. ETS Rev. 1

bips F104, Dokumenthåndtering

Installations- og. Brugervejledning. Rambøll CAREArkiv - version feb Rambøll Informatik A/S. j.nr. LLP feb.

Bilag 9 - Særlige krav til sikrings-dokumentation

Indholdsfortegnelse for kapitel 3

Sådan afleverer du forskningsdata til arkivering

DKAL Snitflader Masseforsendelse

Strategi for arkivering af digitalt skabte arkivalier

Det er et krav, at skannings-løsningen kan integreres til ESDH-løsningen & det digitale arkiv, så de kan modtage de indskannede dokumenter.

Afsnittet er temmelig teoretisk. Er du mere til det praktiske, går du blot til det næste afsnit.

Dokumentation af optagelse.dk

Axapta 3.0 Konverteringsvejledning

Handlingsplan for effektivisering af processerne knyttet til aflevering af data til Statens Arkiver August 2014

FKG datamodellen Version ArcGIS integration Sidste revisionsdato: 23. maj 2014

09/ Version 1.4 Side 1 af 37

BILAG A KØBENHAVNS UNIVERSITET IKT-TEKNISK KOMMUNIKATIONSSPECIFIKATION

Indholdsfortegnelse. Validering af journalnumre og genstandsnumre samt eksport til Regin. Museernes Udgravningsdata (MUD)

Indberetning til eindkomst via SFTP. Folder: J:\Kunder\eIndkomst Projektdokumentation\SFTP\Vejledninger\EC SFTP_eIndkomst

Bilag 9 - Sikring. Særlige krav til dokumentation Bilag 9 - Sikring. side 1(10)

Erfaringer med CPR-replikering

KOMMENTARSKABELON. ccs_- _strukturelle_aspekter_r1_ pdf Allan Dam Jepsen, CPC Center for Product Customization Aps

Eksterne Sundhedsinstitutioners import af sundhedsenheder til SOR

Dokumentation af optagelse.dk

Bilag 4. Screening af markblokke. Snitfladebeskrivelse

PlanDK2+: Byggefelt OBS. Byggefelter er implementeret i PDK som en selvstændig Plantype (30.4) under objektkode 30 (lokalplandelområde).

Vejledning til validator test af metadata

Nedenstående oversigt viser elementerne i den meddelelse, der skal overføres fra fødeafdeling til kirkekontor/sogn.

Håndbog Til CPR services. Bilag 8 GCTP-standard m.m. CPR-kontoret

2. SEMESTER PROJEKT 3 INTERAKTIONSUDVIKLING

Septimas høringssvar vedrørende dokumenteterne FKG datamodellen - Version Fysisk implementering.pdf og FKG_2_3_1_mssql.sql

Region Hovedstaden Center for It, Medico og Telefoni Arkivering af data til Rigsarkivet

OIS - Applikationskatalog

BILAG 1 GENERELLE BETINGELSER INTERN (VERSION 1.0 AF 31. MAJ 2005) (I DET FØLGENDE KALDET GENERELLE BETINGELSER) OIO STANDARDAFTALE FOR WEB SERVICES

Vejledning til prototypen af RaConverter

DM507 Algoritmer og datastrukturer

Brugervejledning til databrowseren

Indberetning af afregninger teknik

Boligportal.dk s kravspecifikation til XML-feed

eskattekortsanmodninger fra og med 2011

Dataanalyse og databaser

fotografisk kommunikation

- P-nummer medtages på niveauerne anvisning og alternativ adresse.

Boligportal.dk s kravspecifikation til XML-feed

TravelTales; håndtering af konfigurationsfil

SUP-specifikation, version 2.0. Bilag 14. SUP-Styregruppen. Ordliste (informativ) Udkast af 12. juni Udarbejdet for

Eksport FI-indbetalinger i Netbanken

Vejledning til udtræk fra UNIK (Version: UNIK Bolig 4)

Klargøring af data til aflevering til DDA. Instruks

1 Brug af snitfladebeskrivelsen Formål og beskrivelse Hvad er formålet med snitfladen? Beskrivelse af snitfladen...

Transkript:

Hvad udgør en ADA-test? Dokumentation af testfunktioner i ADA (version 3.0.0)

Om dette dokument ADA er navnet på den applikation, som Rigsarkivet har udviklet til at teste, om en given arkiveringsversion lever op til de tekniske bestemmelser i bekendtgørelse nr. 1007 af 20. august 2010. ADA vedligeholdes løbende og er fortsat i udvikling, da Rigsarkivet har et ønske om at bibeholde, effektivisere og forbedre kvalitetssikringen af afleverede data fra IT-systemer. Dette dokument behandler bilagsbestemmelserne i bek. 1007 med henblik på at dokumentere: 1. ADAs testgrænser (hvilke bestemmelser det vurderes, at ADA på intet tidspunkt direkte kan teste 1 ) 2. ADAs testfunktionaliteter (hvilke bestemmelser ADA på nuværende tidspunkt tester for) 3. ADAs testpotentiale (hvilke bestemmelser ADA på nuværende tidspunkt ikke tester for, men som burde kunne automatiseres og integreres) Bekendtgørelse 1007 indeholder 8 bilag, hvor de tekniske bestemmelser er beskrevet: Bilag 1 Bilag 2 Bilag 3 Bilag 4 Bilag 5 Bilag 6 Bilag 7 Bilag 8 Bilagsoversigt Angiver i overbliksform, hvorledes en arkiveringsversion strukturelt og indholdsmæssigt skal se ud. Beskriver konkret de tekniske krav til udformningen af en arkiveringsversion. Beskriver bestemmelser for afleveringsmedier og henvisning til skemaer, som Rigsarkivet stiller til rådighed. Dette dokument behandler derfor alle bestemmelser i Bilag 4, 5, og 6 i bekendtgørelse 1007. Dette dokument omhandler specifikt ADA version 3.0.0. 1 ADA kan dog i nogle tilfælde understøtte en visuel/manuel test af disse. 2 19-09-2016

Indholdsfortegnelse ADAs testpotentiale... 4 Oversigt over testpotentiale (tabel 1)... 4 ADAs testområder... 10 Oversigt over testområder (tabel 2)... 10 Generel opbygning af testområderne... 15 Testområde 4 A. (Generelle regler om datastruktur)... 17 Testområde 4.B.1 (Placering af mapper og filer)... 19 Testområde 4.B.2 (Placering af mapper og filer)... 20 Testområde 4.C (Mappen Indices)... 22 Testområde 4.C.1 (Mappen Indices indeksfiler well-formed og valide)... 23 Testområde 4.C.2 (Mappen Indices fileindex.xml)... 24 Testområde 4.C.4 (Mappen Indices contextdocumentationindex.xml)... 25 Testområde 4.C.5 (Mappen Indices tableindex.xml)... 26 Testområde 4.C.6 (Mappen Indices docindex.xml)... 27 Testområde 4.D (Mappen Tables)... 28 Testområde 4.E (Mappen ContextDocumentation)... 30 Testområde 4.F (Mappen Schemas)... 32 Testområde 4.G (Mappen Documents)... 33 Testområde 5.A (Tabelindhold)... 35 Testområde 5.B (Datatyper)... 35 Testområde 5.D (Tekstformat)... 36 Testområde 5.E (Digitale dokumenter)... 37 Testområde 5.F (Lyd og video)... 39 Testområde 5.G (Geodata)... 40 Testområde 6.A (Arkivbeskrivelsesfil)... 42 Testområde 6.B (Kontekstdokumentation)... 43 Testområde 6.C (Data om arkiveringsversionens tabeller)... 44 ADAs testfunktionalitet... 47 Oversigt over testfunktionalitet (tabel 3)... 47 Fuld liste over kendte fejl og mangler... 52 3 19-09-2016

ADAs testpotentiale I følgende tabel 1 er bestemmelserne på afsnitniveau gennemgået for at vurdere, om ADA på sigt kan teste for dem. Tabellen er altså udelukkende en oversigt over ADAs potentielle testfunktionaliteter og er ikke et udtryk for ADAs testfunktionaliteter på nuværende tidspunkt. Oversigt over testpotentiale (tabel 1) Ordlyd i bekendtgørelsen Automatiserbar Bilag 4 4.A Generelle regler om datastruktur 4.A.1 I en arkiveringsversion skal alle nøgler have en entydig identifikator. Der må ikke forekomme situationer, hvor det er nødvendigt at uddrage dele af nøglefelter for at forstå it-systemets indhold eller funktion. 4.A.2 Når en værdi i et felt er en kode som repræsentation for en fast og entydig værdi, skal koderne forklares. Såfremt værdien ikke findes i en kode- eller opslagstabel i it-systemet, skal der i arkiveringsversionen genereres én eller flere tabeller med angivelse af værdierne i kodede Nej felter. Alternativt skal kodeværdien i tabeldata ved udtræk til arkiveringsversion udskiftes med det egentlige indhold. 4.A.3 Såfremt dokumenterne i et it-system med dokumenter er lagret i en betydningsbærende struktur, skal denne struktur i arkiveringsversionen omdannes til en eller flere tabeller Nej 4.B. Placering af mapper og filer 4.B.1 I roden af filsystemet på afleveringsmediet, jf. bilag 7, skal der være placeret en mappe navngivet med mediets navn. Mediets navn består af det unikke arkiveringsversionsid med tilføjelse af et suffiks».n«, der angiver rækkefølgen af medierne, hvor n er et fortløbende medieløbenummer begyndende med 1. 4.B.2 Arkiveringsversionens indhold fordeles i mapper, som angivet i figur 4.1. 4.B.3 Mapperne skal navngives som angivet i figur 4.1. 4.B.4.a Et arkiveringsversionsid består af præfikset AID, en kode på 2-4 bogstaver, som angiver det modtagende arkiv, samt et arkiveringsversionsløbenummer. Elementerne adskilles med punktum. 4.B.4.b ArkiveringsversionsID udleveres af Statens Arkiver. Nej 4.B.5.a En arkiveringsversion, som ikke kan være på ét medie, jf. bilag 7, kan fordeles over flere medier. 4.B.5.b Mapperne ContextDocumentation, Indices og Schemas skal altid være placeret på afleveringens første medie. 4.B.5.c Mappen i roden på efterfølgende medier skal kun indeholde de mapper, hvis indhold kræver fordeling over flere medier. Disse mapper navngives altid som angivet i figur 4.1 uden brug af suffiks. 4.B.6 Der må kun være én af hver af de i figur 4.1 angivne mapper på hvert medie. 4.C Mappen Indices 4.C.1.a Mappen Indices skal indeholde følgende indeksfiler med oplysninger om arkiveringsversionen og dens indhold: fileindex.xml archiveindex.xml contextdocumentationindex.xml tableindex.xml 4 19-09-2016

4.C.1.b Hvis arkiveringsversionen indeholder digitale dokumenter, lyd, video eller geodata, skal mappen Indices endvidere indeholde følgende indeksfil: docindex.xml 4.C.1.c Alle indeksfiler skal overholde deres tilhørende skema, jf. bilag 8. 4.C.2.a fileindex.xml skal indeholde en komplet liste over samtlige filer, der findes i arkiveringsversionen. fileindex.xml er dog undtaget fra denne regel. 4.C.2.b For hver enkelt fil i arkiveringsversionen angives de oplysninger, som fremgår af figur 4.2. 4.C.3 archiveindex.xml skal indeholde de oplysninger, som fremgår af 6.A. 4.C.4.a contextdocumentationindex.xml skal indeholde et indeks over de dokumenter, som findes i arkiveringsversionens kontekstdokumentation. 4.C.4.b For hvert dokument i kontekstdokumentationen angives de oplysninger, som fremgår af figur 4.3. 4.C.5.a tableindex.xml skal indeholde en angivelse af en relationel databasestruktur på 1. normalform eller højere. Samtlige tabeller i arkiveringsversionen skal angives. 4.C.5.b»tableIndex.xml«skal overholde det generelle XML-skema»tableIndex.xsd«, jf. 4.F. 4.C.5.c Hvis et felt må have værdien NULL, skal der i»tableindex.xml«være angivet værdien»true«for kolonnens tilhørende element»nullable«. 4.C.6.a docindex.xml skal danne forbindelsen mellem hvert dokument og dets placering.»docindex.xml«skal desuden indeholde oplysninger om dokumenternes oprindelige filnavne, filtype i arkiveringsversionen samt eventuelle overordnede dokumenter.»docindex.xml«skal ikke indeholde oplysninger om dokumenterne i kontekstdokumentationen. 4.C.6.b For hvert enkelt dokument i docindex.xml angives de oplysninger, som fremgår af figur 4.4. 4.D. Mappen Tables 4.D.1 Mappen Tables skal indeholde én mappe for hver tabel i arkiveringsversionen. 4.D.2.a Mappen for en tabel navngives»table[fortløbende nummer]«. 4.D.2.b Den fortløbende nummerering begynder med 1. Foranstillede nuller må ikke anvendes. 4.D.3 Mappen for hver tabel skal indeholde to filer: table[fortløbende nummer].xsd table[fortløbende nummer].xml 4.D.4»table[fortløbende nummer].xsd«er et XML-skema, der kun angiver strukturen for den enkelte pågældende tabel, og skal være i overensstemmelse med XML-instansen»tableIndex.xml«, jf. 4.C.5.a, der angiver strukturen for hele den pågældende relationelle database, herunder samtlige tabeller. 4.D.5»table[fortløbende nummer].xml«er en XML-instans, der indeholder data for den pågældende tabel, og dens struktur skal være i overensstemmelse med det tilhørende XML-skema,»table[fortløbende nummer].xsd«. 4.D.6 Hvis et felt i en tabel kan have værdien NULL, skal den pågældende kolonne i det tilhørende skema (»table[fortløbende nummer].xsd«) indeholde attributten nillable=»true«. Tilsvarende skal XML-instansens (»table[fortløbende nummer].xml«) element indeholde attributten xsi:nil=»true«jf. W3C standarden for håndtering af NULL værdier i XML. 4.E. Mappen ContextDocumentation 4.E.1 Mappen ContextDocumentation skal indeholde én eller flere dokumentsamlingsmapper med kontekstdokumentation, jf. 6.B. 5 19-09-2016

4.E.2 En dokumentsamlingsmappe med kontekstdokumentation må indeholde op til 10.000 dokumentmapper. 4.E.3 Dokumentsamlingsmapperne navngives»doccollection[fortløbende nummer]«, begyndende med 1. Navnet skal være unikt inden for ContextDocumentation. 4.E.4 Hvert dokument i kontekstdokumentationen skal tildeles et ID på op til 12 cifre. Dokumentets ID skal være unikt inden for ContextDocumentation. 4.E.5 En dokumentmappe skal indeholde ét dokument, som består af én eller flere filer af samme format, og navngives med dokumentets ID. Foranstillede nuller må ikke anvendes. 4.E.6 Et dokuments fil (eller filer) navngives fortløbende med et nummer, begyndende med 1 samt formatets ekstension, jf. 4.G.8 4.F. Mappen Schemas 4.F.1 Mappen Schemas skal være opdelt i undermapperne standard og localshared. 4.F.2 Mappen standard skal indeholde skemaer for arkiveringsversionens indeksfiler, jf. bilag 8, samt W3C standard XML-skema, jf. http://www.w3.org/2001/xmlschema.xsd. 4.F.3 For skemaerne fileindex.xsd, archiveindex.xsd, contextdocumentationindex.xsd, tableindex.xsd, docindex.xsd samt W3Cs standard XMLskema gælder, at der altid skal anvendes de skemaer, som Rigsarkivet stiller til rådighed. Skemaerne og deres navngivning må ikke ændres i arkiveringsversionen. 4.F.4 Mappen localshared skal indeholde eventuelle GML-skemaer, som ikke er placeret sammen med det pågældende GML-dokument, jf. 4.G.7.a. 4.G. Mappen Documents 4.G.1 Mappen Documents skal indeholde én eller flere dokumentsamlingsmapper, dog maksimalt 10.000. 4.G.2 Dokumentsamlingsmapperne navngives»doccollection[fortløbende nummer]«, begyndende med 1. Navnet skal være unikt inden for Documents. 4.G.3 En dokumentsamlingsmappe må indeholde op til 10.000 dokumentmapper. 4.G.4 Hvert dokument skal i arkiveringsversionen tildeles et ID på op til 12 cifre. Dokumentets ID skal være unikt inden for Documents. 4.G.5 En dokumentmappe skal indeholde ét dokument, som består af én eller flere filer af samme format, og navngives med dokumentets ID. Foranstillede nuller må ikke anvendes. 4.G.6 Et dokuments fil (eller filer) navngives fortløbende med et nummer, begyndende med 1 samt formatets ekstension. Foranstillede nuller må ikke anvendes. 4.G.7 For GML-filer lagres det relevante skema i samme mappe som GML-filen, og navngives med fortløbende nummer efterfulgt af.xsd, jf. dog 4.G.7.a. Foranstillede nuller må ikke anvendes. 4.G.7.a GML-skemaer kan alternativt lagres i den skema-mappe, som navngives localshared, jf. 4.F. GMLskemaer i mappen localshared navngives»localschema[fortløbende nummer]«, begyndende med 1. 4.G.8 Anvendelse af ekstensions Blot en overskrift 4.G.8.a Dokumenter i formatet TIFF skal have ekstension tif. 4.G.8.b Dokumenter i formatet MP3 skal have ekstension mp3. 4.G.8.c Dokumenter i formatet MPEG-2 og MPEG-4 skal have ekstension mpg. 4.G.8.d Dokumenter i formatet JPEG-2000 skal have ekstension jp2. 6 19-09-2016

4.G.8.e Dokumenter i formatet GML skal have ekstension gml. 4.G.8.f Dokumenter i formatet WAE skal have ekstension wav. 4.G.9 Muligheden for at fremsøge sagligt sammenhørende dokumenter skal overføres til arkiveringsversionen efter det modtagende arkivs nærmere anvisning. Nej Bilag 5 5.A. Tabelindhold 5.A.1.a I overensstemmelse med den tabelstruktur, der er defineret for hver tabel i hvert sit tilhørende XMLskema, navngivet»table[fortløbende nummer].xsd«, jf. 4.D, skal hver tabel findes i en XML-instans navngivet»table[fortløbende nummer].xml«. 5.A.1.b Den fortløbende nummerering begynder med 1. Foranstillede nuller må ikke anvendes. 5.A.2 Indholdet af de enkelte felter skal renses for eventuelle foran- og efterstillede blanktegn. 5.B. Datatyper 5.B.1.a De standardiserede datatyper, som skal anvendes for tabelindhold, er angivet i figur 5.1. De er et uddrag af datatyper fra standarden SQL:1999 repræsenteret som datatyper i W3C XML Schema Language 1.0. 5.B.1.b Det er datatypen i W3C XML Schema Language 1.0, som skal anvendes. Oversættelsen fra datatyper i SQL:1999 er angivet for at vise, hvorledes oversættelsen til datatyper i W3C XML Schema Language 1.0 skal foretages. 5.B.2 Datatypen string må kun indeholde ikke-opmærket tekst, som umiddelbart kan fortolkes. Nej 5.B.3 Datatypen boolean kan jf. W3C kun antage værdierne 1; 0 eller true; false. 5.B.4 Datatyperne date, time og datetime kan bruges med eller uden Time Zone. 5.C. Konvertering af tabelindhold til digitale dokumenter, lyd, video eller geodata 5.C.1 Tabelindhold skal overholde de angivne datatyper, jf. 5.B. Det følger heraf, at dataindhold i tabelform fra et it-system, som skal overføres til en arkiveringsversion og som ikke umiddelbart kan overholde dette krav, skal have sit dataindhold konverteret således: Ikke relevant 5.C.1.a til digitale dokumenter, lyd, video eller geodata, idet indholdet konverteres til de formater, som fremgår af 5.E - 5.G. Ikke relevant 5.C.1.b til tabelindhold af datatypen string, jf. 5.B, idet andet indhold end det for datatypen tilladte slettes. Ikke relevant 5.C.2 Det modtagende arkiv anviser, om et givet indhold skal håndteres iht. 5.C.1.a eller 5.C.1.b. Ikke relevant 5.D. Tekstformat 5.D.1 Unicode indkodning Blot en overskrift 5.D.1.a Data i arkiveringsversionens indeksfiler og tabelindhold skal være indkodet som well-formed UTF-8, som angivet i ISO/IEC 10646:2003 Annex D og som beskrevet i The Unicode Standard 5.1, kapitel 3. 5.D.1.b De indkodede karakterer skal være gyldige Unicode skalarværdier. Surrogater/RC-elementer og Unicode noncharacters må ikke anvendes. 5.D.1.c Ingen karakterer i Private Use Area må indkodes. 5.D.1.d Styrekodetegnene fra og med #x00 til og med #x1f er ikke tilladt med undtagelse af styrekodetegnene tabulator (TAB) #x09, nylinje (LF) #x0a og vognretur (CR) #x0d. 5.D.2 XML indkodning Blot en overskrift 5.D.2.a I henhold til XML-standarden gælder de regler for angivelse af de pågældende tegn, som fremgår af figur 5.2. 5.D.2.b Tegnene fra og med #x7f til og med #x9f skal angives med deres decimale eller hexadecimale tegnreference. 7 19-09-2016

5.D.2.c CDATA sektioner <![CDATA ]]> må ikke anvendes. 5.E. Digitale dokumenter 5.E.1.a Et digitalt dokument, jf. dog 5.F og 5.G, skal lagres i ét af følgende formater: det grafiske bitmapformat TIFF, version 6.0 baseline. JPEG-2000 efter standarden ISO/IEC 15444-1:2004. Information technology - JPEG 2000 image coding system - Part 1: Core coding system. 5.E.1.b Det er tilladt at benytte begge formater inden for samme arkiveringsversion. 5.E.2 Dokumenter i TIFF skal komprimeres efter følgende kompressionsregler: Blot en overskrift 5.E.2.a Sort/hvide dokumenter skal komprimeres med CCITT/TSS grp. 3, grp. 4, PackBit eller LZW. 5.E.2.b Dokumenter med gråtoner eller farver skal komprimeres med PackBit eller LZW. 5.F. Lyd og video 5.F.1 Lydfiler skal lagres efter standarden MP3 DS/EN ISO/IEC 11172-3. 5.F.2 Det modtagende arkiv kan tillade, at lydfiler afleveres i formatet WAE LPCM som specificeret i Multimedia Programming Interface and Data Specifications 1.0. IBM Corporation and Microsoft Corporation, August 1991. Dog begrænset til bitdybder, der er hele multipla af 8. 5.F.3 ideofiler skal lagres efter en af følgende standarder: MPEG-2 DS/EN ISO/IEC 13818-2. Eventuel lyd indkodes som MP3, som specificeret i ISO/IEC 13818-3. MPEG-4 AC DS/EN ISO/IEC 14496-10 (ITU-T H.264). ideo indkodes som specificeret i ISO/IEC 14496-10. Eventuel lyd indkodes som AAC, som specificeret i ISO/IEC 14496-3. ideo og lyd indpakkes i MPEG-4 formatet som defineret i ISO/IEC 14496-14. 5.G. Geodata 5.G.1 Data fra geografiske informationssystemer samt øvrige geodata lagres som GML-filer iht. GML 3.1.1 GML-standarden ISO 19136. 5.G.2 GML-filer, som er større end 1 GB, opdeles i enheder efter det modtagende arkivs anvisning. 5.G.3 Hver GML-fil, evt. efter opdeling jf. 5.G.2, behandles som et separat dokument iht. reglerne i 4.G. 5.G.4 De nødvendige XML-skemaer til validering af GML-filerne skal indgå i arkiveringsversionen. 5.H. Komprimering 5.H.1 En arkiveringsversion må ikke være komprimeret udover den kompression, som er anvist for eller følger af de dokumentformater, der kræves til brug for arkiveringsversionen, jf. 5.E og 5.F. Ikke relevant 5.I. Optimering 5.I.1 Det modtagende arkiv kan i konkrete tilfælde træffe afgørelse om nedbringelse af dokumenters pladsforbrug, f.eks. ved at anvise anvendelse af optimal bitdybde. Ikke relevant 5.J. Ingen forringelse 5.J.1 I forbindelse med generering af arkiveringsversionen må der ikke ske en kvalitetsmæssig forringelse af dokumenterne, herunder lyd og video, ud over hvad der måtte være en konsekvens af det krævede format til brug for arkiveringsversionen eller de anvisninger, som i Nej øvrigt gives af det modtagende arkiv. Bilag 6 6.A. Arkivbeskrivelsesfil 8 19-09-2016

6.A.1 Enhver arkiveringsversion skal indeholde en arkivbeskrivelsesfil med angivelse af oplysninger iht. figur 6.1. 6.A.2 Arkivbeskrivelsesfilen navngives archiveindex.xml og skal overholde det tilhørende skema, jf. bilag 8. 6.A.3 Indholdet af arkivbeskrivelsesfilen fastlægges efter drøftelse mellem den afleverende myndighed og det modtagende arkiv. Ikke relevant 6.B. Kontekstdokumentation 6.B.1 Enhver arkiveringsversion skal indeholde dokumenter, som dokumenterer it-systemets administrative funktion samt struktur og funktionalitet. Nej 6.B.2 Det modtagende arkiv fastlægger efter drøftelse med den afleverende myndighed, hvilke dokumenter der skal afleveres, herunder hvilke punkter i figur 6.2, som ikke er relevante at dokumentere i den konkrete aflevering. Ikke relevant 6.B.3.a Dokumenterne indplaceres i én eller flere af de kategorier, som fremgår af figur 6.2. 6.B.3.b Oplysninger om kategoriseringen registreres i indeksfilen contextdocumentationindex, jf. 4.C.4.a. 6.B.4 Dokumenterne skal lagres i ét af de i arkiveringsversionen tilladte dokumentformater, jf. 5.E - 5.F. 6.C. Data om arkiveringsversionens tabeller 6.C.1 En arkiveringsversion skal indeholde dokumentation af arkiveringsversionens tabeller og relationer (tabelindeks). Tabelindekset skal indeholde de oplysninger, som fremgår af figur 6.3 nedenfor. 6.C.2 Systemviews medtages ikke. Nej 6.C.3 Det modtagende arkiv kan anvise, at de væsentligste views skal have en beskrivelse, jf. figur 6.3, 7.c. Nej 6.C.4 Der skal opmærkes særlige oplysninger for it-systemer med registrering af oplysninger om dokumenter. Ikke relevant 6.C.5 For arkiveringsversioner af it-systemer, som nævnt i 6.C.4, skal kolonner, der indeholder særlige informationer, jf. figur 6.4 - figur 6.6, identificeres via elementet functionaldescription, jf. figur 6.3, 4.h. 6.C.6 De særlige oplysninger, der er angivet i figur 6.6, skal opmærkes i det omfang, de er registreret i it-systemet. Hvis oplysningerne i figur 6.6 ikke findes registreret i it-systemet, skal der i forbindelse med afleveringen aftales eventuelle alternative opmærkninger, der sikrer identifikation af sagligt sammenhørende dokumenter, jf. gældende bestemmelser herom. 6.D. SQL-forespørgsler 6.D.1 Det modtagende arkiv kan fastsætte, at der til en arkiveringsversion skal defineres et antal SQLforespørgsler til dokumentation af bestemte sammenhænge i arkiveringsversionen. Ikke relevant 6.D.2 SQL-forespørgslerne udformes efter standarden SQL:1999 (core). 6.D.3 Forespørgslerne placeres i»oplysninger om views og forespørgsler«i tabelindekset jf. figur 6.3, 7, og navngives efter myndighedens eget valg, dog således at navnet på de pågældende forespørgsler begynder med»a«. 9 19-09-2016

ADAs testområder For at kunne dokumentere hvilke bestemmelser ADA på nuværende tidspunkt tester for, har Rigsarkivet formuleret et antal testområder, der relaterer sig til de konkrete bestemmelser i bekendtgørelsen. Følgende tabel 2 indeholder i de to første kolonner alle bestemmelser, der er fundet automatiserbare, og de enkelte bestemmelser er indplaceret i et testområde i tredje kolonne. Da afsnittene ofte henviser til andre afsnit, er det angivet med hvid baggrundsfarve, i hvilke testområder bestemmelserne testes. Oversigt over testområder (tabel 2) Ordlyd i bekendtgørelsen Bilag 4 4.A Generelle regler om datastruktur 4.A.1 I en arkiveringsversion skal alle nøgler have en entydig identifikator. Der må ikke forekomme situationer, hvor det er nødvendigt at uddrage dele af nøglefelter for at forstå it-systemets indhold eller funktion. 4.B. Placering af mapper og filer 4.B.1 I roden af filsystemet på afleveringsmediet, jf. bilag 7, skal der være placeret en mappe navngivet med mediets navn. Mediets navn består af det unikke arkiveringsversionsid med tilføjelse af et suffiks».n«, der angiver rækkefølgen af medierne, hvor n er et fortløbende medieløbenummer begyndende med 1. 4.B.2 Arkiveringsversionens indhold fordeles i mapper, som angivet i figur 4.1. 4.B.3 Mapperne skal navngives som angivet i figur 4.1. 4.B.4.a Et arkiveringsversionsid består af præfikset AID, en kode på 2-4 bogstaver, som angiver det modtagende arkiv, samt et arkiveringsversionsløbenummer. Elementerne adskilles med punktum. 4.B.5.a En arkiveringsversion, som ikke kan være på ét medie, jf. bilag 7, kan fordeles over flere medier. 4.B.5.b Mapperne ContextDocumentation, Indices og Schemas skal altid være placeret på afleveringens første medie. 4.B.5.c Mappen i roden på efterfølgende medier skal kun indeholde de mapper, hvis indhold kræver fordeling over flere medier. Disse mapper navngives altid som angivet i figur 4.1 uden brug af suffiks. 4.B.6 Der må kun være én af hver af de i figur 4.1 angivne mapper på hvert medie. 4.C Mappen Indices 4.C.1.a Mappen Indices skal indeholde følgende indeksfiler med oplysninger om arkiveringsversionen og dens indhold: fileindex.xml archiveindex.xml contextdocumentationindex.xml tableindex.xml 4.C.1.b Hvis arkiveringsversionen indeholder digitale dokumenter, lyd, video eller geodata, skal mappen Indices endvidere indeholde følgende indeksfil: docindex.xml 10 19-09-2016 Testområde 4.A 4.B.1 4.B.2 4.C 4.C.1

4.C.1.c Alle indeksfiler skal overholde deres tilhørende skema, jf. bilag 8. 4.C.2.a fileindex.xml skal indeholde en komplet liste over samtlige filer, der findes i arkiveringsversionen. fileindex.xml er dog undtaget fra denne regel. 4.C.2 4.C.2.b For hver enkelt fil i arkiveringsversionen angives de oplysninger, som fremgår af figur 4.2. 4.C.3 archiveindex.xml skal indeholde de oplysninger, som fremgår af 6.A. Testes under 6.A 4.C.4.a contextdocumentationindex.xml skal indeholde et indeks over de dokumenter, som findes i arkiveringsversionens kontekstdokumentation. 4.C.4.b For hvert dokument i kontekstdokumentationen angives de oplysninger, som fremgår af figur 4.3. 4.C.4 4.C.5.a tableindex.xml skal indeholde en angivelse af en relationel databasestruktur på 1. normalform eller højere. Samtlige tabeller i arkiveringsversionen skal angives. 4.C.5.b»tableIndex.xml«skal overholde det generelle XML-skema»tableIndex.xsd«, jf. 4.F. 4.C.5 4.C.5.c Hvis et felt må have værdien NULL, skal der i»tableindex.xml«være angivet værdien»true«for kolonnens tilhørende element»nullable«. 4.C.6.a docindex.xml skal danne forbindelsen mellem hvert dokument og dets placering.»docindex.xml«skal desuden indeholde oplysninger om dokumenternes oprindelige filnavne, filtype i arkiveringsversionen samt eventuelle overordnede dokumenter.»docindex.xml«skal ikke indeholde oplysninger om dokumenterne i kontekstdokumentationen. 4.C.6 4.C.6.b For hvert enkelt dokument i docindex.xml angives de oplysninger, som fremgår af figur 4.4. 4.D. Mappen Tables 4.D.1 Mappen Tables skal indeholde én mappe for hver tabel i arkiveringsversionen. 4.D.2.a Mappen for en tabel navngives»table[fortløbende nummer]«. 4.D.2.b Den fortløbende nummerering begynder med 1. Foranstillede nuller må ikke anvendes. 4.D.3 Mappen for hver tabel skal indeholde to filer: table[fortløbende nummer].xsd table[fortløbende nummer].xml1 4.D.4»table[fortløbende nummer].xsd«er et XML-skema, der kun angiver strukturen for den enkelte pågældende tabel, og skal være i overensstemmelse med XML-instansen»tableIndex.xml«, jf. 4.C.5.a, der angiver strukturen for hele den pågældende relationelle database, 4.D herunder samtlige tabeller. 4.D.5»table[fortløbende nummer].xml«er en XML-instans, der indeholder data for den pågældende tabel, og dens struktur skal være i overensstemmelse med det tilhørende XML-skema,»table[fortløbende nummer].xsd«. 4.D.6 Hvis et felt i en tabel kan have værdien NULL, skal den pågældende kolonne i det tilhørende skema (»table[fortløbende nummer].xsd«) indeholde attributten nillable=»true«. Tilsvarende skal XML-instansens (»table[fortløbende nummer].xml«) element indeholde attributten xsi:nil=»true«jf. W3C standarden for håndtering af NULL værdier i XML. 4.E. Mappen ContextDocumentation 4.E.1 Mappen ContextDocumentation skal indeholde én eller flere dokumentsamlingsmapper med kontekstdokumentation, jf. 6.B. 4.E.2 En dokumentsamlingsmappe med kontekstdokumentation må indeholde op til 10.000 dokumentmapper. 4.E.3 Dokumentsamlingsmapperne navngives»doccollection[fortløbende nummer]«, begyndende med 1. Navnet skal være unikt inden for 4.E ContextDocumentation. 11 19-09-2016

4.E.4 Hvert dokument i kontekstdokumentationen skal tildeles et ID på op til 12 cifre. Dokumentets ID skal være unikt inden for ContextDocumentation. 4.E.5 En dokumentmappe skal indeholde ét dokument, som består af én eller flere filer af samme format, og navngives med dokumentets ID. Foranstillede nuller må ikke anvendes. 4.E.6 Et dokuments fil (eller filer) navngives fortløbende med et nummer, begyndende med 1 samt formatets ekstension, jf. 4.G.8 4.F. Mappen Schemas 4.F.1 Mappen Schemas skal være opdelt i undermapperne standard og localshared. 4.F.2 Mappen standard skal indeholde skemaer for arkiveringsversionens indeksfiler, jf. bilag 8, samt W3C standard XML-skema, jf. http://www.w3.org/2001/xmlschema.xsd. 4.F.3 For skemaerne fileindex.xsd, archiveindex.xsd, contextdocumentationindex.xsd, tableindex.xsd, docindex.xsd samt W3Cs standard XMLskema gælder, at der altid skal anvendes de skemaer, som Rigsarkivet stiller til rådighed. Skemaerne og deres navngivning må ikke ændres i arkiveringsversionen. 4.F.4 Mappen localshared skal indeholde eventuelle GML-skemaer, som ikke er placeret sammen med det pågældende GML-dokument, jf. 4.G.7.a. 4.G. Mappen Documents 4.G.1 Mappen Documents skal indeholde én eller flere dokumentsamlingsmapper, dog maksimalt 10.000. 4.G.2 Dokumentsamlingsmapperne navngives»doccollection[fortløbende nummer]«, begyndende med 1. Navnet skal være unikt inden for Documents. 4.G.3 En dokumentsamlingsmappe må indeholde op til 10.000 dokumentmapper. 4.G.4 Hvert dokument skal i arkiveringsversionen tildeles et ID på op til 12 cifre. Dokumentets ID skal være unikt inden for Documents. 4.G.5 En dokumentmappe skal indeholde ét dokument, som består af én eller flere filer af samme format, og navngives med dokumentets ID. Foranstillede nuller må ikke anvendes. 4.G.6 Et dokuments fil (eller filer) navngives fortløbende med et nummer, begyndende med 1 samt formatets ekstension. Foranstillede nuller må ikke anvendes. 4.G.7 For GML-filer lagres det relevante skema i samme mappe som GML-filen, og navngives med fortløbende nummer efterfulgt af.xsd, jf. dog 4.G.7.a. Foranstillede nuller må ikke anvendes. 4.G.7.a GML-skemaer kan alternativt lagres i den skema-mappe, som navngives localshared, jf. 4.F. GMLskemaer i mappen localshared navngives»localschema[fortløbende nummer]«, begyndende med 1. 4.G.8.a Dokumenter i formatet TIFF skal have ekstension tif. 4.G.8.b Dokumenter i formatet MP3 skal have ekstension mp3. 4.G.8.c Dokumenter i formatet MPEG-2 og MPEG-4 skal have ekstension mpg. 4.G.8.d Dokumenter i formatet JPEG-2000 skal have ekstension jp2. 4.G.8.e Dokumenter i formatet GML skal have ekstension gml. 4.G.8.f Dokumenter i formatet WAE skal have ekstension wav. Bilag 5 4.F 4.G 12 19-09-2016

5.A. Tabelindhold 5.A.1.a I overensstemmelse med den tabelstruktur, der er defineret for hver tabel i hvert sit tilhørende XMLskema, navngivet»table[fortløbende nummer].xsd«, jf. 4.D, skal hver tabel findes i en XML-instans navngivet»table[fortløbende nummer].xml«. 5.A.1.b Den fortløbende nummerering begynder med 1. Foranstillede nuller må ikke anvendes. 5.A.2 Indholdet af de enkelte felter skal renses for eventuelle foran- og efterstillede blanktegn. 5.B. Datatyper 5.B.1.a De standardiserede datatyper, som skal anvendes for tabelindhold, er angivet i figur 5.1. De er et uddrag af datatyper fra standarden SQL:1999 repræsenteret som datatyper i W3C XML Schema Language 1.0. 5.B.1.b Det er datatypen i W3C XML Schema Language 1.0, som skal anvendes. Oversættelsen fra datatyper i SQL:1999 er angivet for at vise, hvorledes oversættelsen til datatyper i W3C XML Schema Language 1.0 skal foretages. 5.B.3 Datatypen boolean kan jf. W3C kun antage værdierne 1; 0 eller true; false. 5.B.4 Datatyperne date, time og datetime kan bruges med eller uden Time Zone. 5.D. Tekstformat 5.D.1.a Data i arkiveringsversionens indeksfiler og tabelindhold skal være indkodet som well-formed UTF-8, som angivet i ISO/IEC 10646:2003 Annex D og som beskrevet i The Unicode Standard 5.1, kapitel 3. 5.D.1.b De indkodede karakterer skal være gyldige Unicode skalarværdier. Surrogater/RC-elementer og Unicode noncharacters må ikke anvendes. 5.D.1.c Ingen karakterer i Private Use Area må indkodes. 5.D.1.d Styrekodetegnene fra og med #x00 til og med #x1f er ikke tilladt med undtagelse af styrekodetegnene tabulator (TAB) #x09, nylinje (LF) #x0a og vognretur (CR) #x0d. 5.D.2.a I henhold til XML-standarden gælder de regler for angivelse af de pågældende tegn, som fremgår af figur 5.2. 5.D.2.b Tegnene fra og med #x7f til og med #x9f skal angives med deres decimale eller hexadecimale tegnreference. 5.D.2.c CDATA sektioner <![CDATA ]]> må ikke anvendes. 5.E. Digitale dokumenter 5.E.1.a Et digitalt dokument, jf. dog 5.F og 5.G, skal lagres i ét af følgende formater: det grafiske bitmapformat TIFF, version 6.0 baseline. JPEG-2000 efter standarden ISO/IEC 15444-1:2004. Information technology - JPEG 2000 image coding system - Part 1: Core coding system. 5.E.1.b Det er tilladt at benytte begge formater inden for samme arkiveringsversion. 5.E.2 Dokumenter i TIFF skal komprimeres efter følgende kompressionsregler: 5.E.2.a Sort/hvide dokumenter skal komprimeres med CCITT/TSS grp. 3, grp. 4, PackBit eller LZW. 5.E.2.b Dokumenter med gråtoner eller farver skal komprimeres med PackBit eller LZW. 5.F. Lyd og video 5.F.1 Lydfiler skal lagres efter standarden MP3 DS/EN ISO/IEC 11172-3. 5.F.2 Det modtagende arkiv kan tillade, at lydfiler afleveres i formatet WAE LPCM som specificeret i Multimedia Programming Interface and Data Specifications 1.0. IBM Corporation and Microsoft Corporation, August 1991. Dog begrænset til bitdybder, der er hele multipla af 8. 5.F.3 ideofiler skal lagres efter en af følgende standarder: Testes under 4.D Testes under 4.D 5.D 5.E 5.F 13 19-09-2016

MPEG-2 DS/EN ISO/IEC 13818-2. Eventuel lyd indkodes som MP3, som specificeret i ISO/IECf 13818-3. MPEG-4 AC DS/EN ISO/IEC 14496-10 (ITU-T H.264). ideo indkodes som specificeret i ISO/IEC 14496-10. Eventuel lyd indkodes som AAC, som specificeret i ISO/IEC 14496-3. ideo og lyd indpakkes i MPEG-4 formatet som defineret i ISO/IEC 14496-14. 5.G. Geodata 5.G.1 Data fra geografiske informationssystemer samt øvrige geodata lagres som GML-filer iht. GML 3.1.1 GML-standarden ISO 19136. 5.G.2 GML-filer, som er større end 1 GB, opdeles i enheder efter det modtagende arkivs anvisning. 5.G.3 Hver GML-fil, evt. efter opdeling jf. 5.G.2, behandles som et separat dokument iht. reglerne i 4.G. 5.G.4 De nødvendige XML-skemaer til validering af GML-filerne skal indgå i arkiveringsversionen. Bilag 6 6.A. Arkivbeskrivelsesfil 6.A.1 Enhver arkiveringsversion skal indeholde en arkivbeskrivelsesfil med angivelse af oplysninger iht. figur 6.1. 6.A.2 Arkivbeskrivelsesfilen navngives archiveindex.xml og skal overholde det tilhørende skema, jf. bilag 8. 6.A 6.B. Kontekstdokumentation 6.B.3.a Dokumenterne indplaceres i én eller flere af de kategorier, som fremgår af figur 6.2. Testes under 6.B.3.b Oplysninger om kategoriseringen registreres i indeksfilen contextdocumentationindex, jf. 4.C.4.a. 4.C.4, 5.E og 6.B.4 Dokumenterne skal lagres i ét af de i arkiveringsversionen tilladte dokumentformater, jf. 5.E - 5.F. 5.F 6.C. Data om arkiveringsversionens tabeller 6.C.1 En arkiveringsversion skal indeholde dokumentation af arkiveringsversionens tabeller og relationer (tabelindeks). Tabelindekset skal indeholde de oplysninger, som fremgår af figur 6.3 nedenfor. 6.C.5 For arkiveringsversioner af it-systemer, som nævnt i 6.C.4, skal kolonner, der indeholder særlige informationer, jf. figur 6.4 - figur 6.6, identificeres via elementet functionaldescription, jf. figur 6.3, 4.h. 6.C 6.C.6 De særlige oplysninger, der er angivet i figur 6.6, skal opmærkes i det omfang, de er registreret i it-systemet. Hvis oplysningerne i figur 6.6 ikke findes registreret i it-systemet, skal der i forbindelse med afleveringen aftales eventuelle alternative opmærkninger, der sikrer identifikation af sagligt sammenhørende dokumenter, jf. gældende bestemmelser herom. 6.D. SQL-forespørgsler 6.D.2 SQL-forespørgslerne udformes efter standarden SQL:1999 (core). Testes under 6.D.3 Forespørgslerne placeres i»oplysninger om views og forespørgsler«i tabelindekset jf. figur 6.3, 7, og navngives efter myndighedens eget 6.C valg, dog således at navnet på de pågældende forespørgsler begynder med»a«. 5.G 14 19-09-2016

Generel opbygning af testområderne Dannelsen af testområder har været nødvendig, fordi de konkrete bestemmelser omfangsmæssigt er forskellige i testhenseende. Det er ikke altid muligt at beskrive en enkelt test for hver bestemmelse i bekendtgørelsen. Det er for eksempel mere enkelt at formulere en testproces for, om en dokumentsamlingsmappe indeholder under 10.000 dokumentmapper (bek. 4.G.3), end det er at formulere en testproces for, om alle nøgler har en entydig identifikator (bek. 4.A.1). Ydermere skal mange bestemmelser også forstås i forlængelse af andre bestemmelser. Derfor er der dannet testområder, hvis formål er at teste den række af bestemmelser, der indholdsmæssigt hænger sammen som følge af bekendtgørelsen. I det følgende vil hvert testområde blive præsenteret hver for sig og på følgende form: 1. En samling af de konkrete bestemmelser for testområdet. 2. Præciserende definitioner (se uddybning) 3. Testformulering (se uddybning) 4. Testbemærkninger (se uddybning) 5. Kendte mangler Uddybning: 2. Præciserende definitioner. Der hvor det findes nødvendigt at skabe en forståelse og præcisering for aktuelle begreber (f.eks. primær- og fremmednøgler i testområde 4.A), vil der være udformet en præciserende definition af, hvordan Rigsarkivet fortolker og fastsætter denne problemstilling. Definitionen skal være med til at tydeliggøre, hvordan og hvorfor Rigsarkivet har formuleret testene for de konkrete testområder. 3. Testformulering De enkelte testformuleringer er optegnet i et skema med følgende felter: Testnr. Fast løbenummer, der referer til den aktuelle deltest Testnavn. Referencenavn til pågældende deltest Testforløb beskrivelse. Beskrivelse af testforløb for den enkelte deltest Implementeret. Her angives om den aktuelle deltest er blevet implementeret i ADA. Altså en direkte dokumentation af ADAs testfunktionalitet. Såfremt der skulle være uenighed om graden af en implementering af en deltest eller testområde, er du velkommen til at kontakte os på: ada-meldinger@sa.dk. Rigsarkivet vurderer løbende de indkomne forslag og problemer, og prioriterer løsningen af dem. Som udgangspunkt rettes i øjeblikket kun fejl og mangler, som betyder, at en arkiveringsversion ikke kan testes. Du er dog som hidtil også velkommen til at indsende ønsker til ny funktionalitet. Disse ønsker vil blive opsamlet og prioriteret på et senere tidspunkt. 15 19-09-2016

4. Testbemærkninger I forbindelse med hvert enkelt testnummer, vil der i fornødent omfang være en supplerende beskrivelse og uddybning af testforløbet med en reference til deltestnummeret. 5. Kendte mangler En opsummering af kendte mangler i testområdet. 16 19-09-2016

Testområde 4 A. (Generelle regler om datastruktur) 4.A.1 I en arkiveringsversion skal alle nøgler have en entydig identifikator. Der må ikke forekomme situationer, hvor det er nødvendigt at uddrage dele af nøglefelter for at forstå it-systemets indhold eller funktion. Præciserende definition af begreberne primær- og fremmednøgler: En primærnøgle kan bestå af et eller flere felter, der tilsammen udgør en entydig unik nøgle inden for den pågældende tabel. Dele af en primærnøgle må ikke bestå af enten felter med NULL- værdier eller værdier kun indeholdende forskellige former for blanktegn eks. ASCII hex 09,20 (tabulator, mellemrumstegn). Det er heller ikke acceptabelt, at et eller flere af felterne i en primærnøgle begynder eller afsluttes med et eller flere mellemrumstegn eller andre lignende blanktegn. En fremmednøgle er et eller flere felter i en tabel, der relateres til primærnøglen i en anden eller egen tabel. Der skal være fuld overensstemmelse mellem datatyper og længde i fremmednøglen og den refererede primærnøgle. En fremmednøgle kan ikke referere til dele af en primærnøgle, kun til hele nøglen. Testformulering: Testnr. Testnavn Testforløb beskrivelse Implementeret 4.A_1 Primærnøgletest unik Der testes for, om der findes primærnøgler, der ikke er unikke. Testen foretages ved sammensatte nøgler som enkelt felter, og ikke som en konkatenering af tekststrenge. 4.A_2 Primærnøgletest NULL Der testes for, om der findes felter i primærnøglen, der har en NULL værdi. 4.A_3 Primærnøgletest, blank Der testes for, om primærnøglefelter starter eller afslutter, med en eller anden form for blanktegn. 4.A_4 Primærnøgletest opsummering Afslutningsvis, opgøres i (n) procent antallet af primærnøglefejl i procent ud fra det samlede antal poster i den pågældende tabel. 4.A_5 Fremmednøgletest, uden reference Der testes for, om der til alle instanser af en fremmednøgle findes en identisk reference i den refererede primærnøgle (Dangling tuples). 4.A_6 Fremmednøgletest, del af Der testes for, at primærnøglens felter i referencetabellen, er identisk med fremmednøglens felter, herunder primærnøgle den opmærkede rækkefølge af felter. 4.A_7 Fremmednøgletest, ikke Der testes for, om fremmednøglens reference udgøres af en erklæret og opmærket primærnøgle i primærnøgle referencetabellen. 4.A_8 Fremmednøgletest, datatyper Der testes for, om fremmednøglens og referencetabellens felter er identiske i relation til datatype. 4.A_9 Fremmednøgletest, Afslutningsvis, opgøres i (n) procent antallet af fremmednøglefejl i procent ud fra det samlede antal poster i opsummering den pågældende tabel. 17 19-09-2016

Bemærkninger til test: Overordnet gælder for nøgletest, at antallet af specifikke delfejl for samme nøgle der vises på skærm, afbrydes når fejlantallet overstiger 10. Dog forsættes logningen af alle fejl. ed flere fremmednøgler i samme tabel vises der en opgørelse individuelt for de enkelte nøgler. 1. ærdierne af de ikke unikke primærnøgler vises i fejlloggen. Når fejlen angives, oplyses samtidigt, hvilken tabel og pågældende kolonne/kolonner der er berørt af nøglefejlen. 2. Samme som 1 med nil/null værdier. Indholdsløse felter i en xml-tabelinstans opfattes altid som værende nil/null. 3. Samme som 1 med blanktegn 4. Efter gennemførelsen af samtlige primærnøgle-deltest 1-3, opgøres antallet af fejl i procent for primærnøglen. 5. - 6. - 7. i tillader ikke fremmednøglereferencer til mulige kandidatnøgler i primærtabellen. 8. Med hensyn til datatyper, skelner vi om det er den samme datatype jf. SQL:1999. Afvigelser i forhold til længde på tekststrenge er uden betydning. Det samme gør sig gældende med hensyn til forskel på store og små bogstaver i navngivning af felter. Der er ikke foretaget en fuld implementeringstest af om alle datatypefejl detekteres, da 20 tilfældige fejlkombinationer er testet. 9. Hvis der findes flere fremmednøgler i den samme tabel, opgøres antallet af fremmednøglefejl i procent for hver af de individuelle nøgler. Dog slås deltest 4 sammen til en opgørelse, for samme nøgle. Kendte mangler: 4.A.1_4 Der er konstateret fejl i optællingsmetode ved primærnøgler med værdien NULL/nil. Det tyder på, at ADA optæller en fejl, når der er NULL/nil i en primærnøgle, samtidig med at den tæller det som en ekstra fejl i og med at primærnøglen ikke er unik. 18 19-09-2016

Testområde 4.B.1 (Placering af mapper og filer) 4.B.1 I roden af filsystemet på afleveringsmediet, jf. bilag 7, skal der være placeret en mappe navngivet med mediets navn. Mediets navn består af det unikke arkiveringsversionsid med tilføjelse af et suffiks».n«, der angiver rækkefølgen af medierne, hvor n er et fortløbende medieløbenummer begyndende med 1. Testformulering: Testnr. Testnavn (internt referencenavn) Testforløb beskrivelse Implementeret 4.B.1_1 Mappestrukturtest, manglende første medie Der testes for om der findes et medie, som er korrekt navngivet, inklusiv medieløbenummer 4.B.1_2 Mappestrukturtest, samme medieløbenummer Der testes for den fortløbende nummerering af medier. 4.B.1_3 Mappestrukturtest, rækkefølge Der testes for, om rækkefølgen af medier er ubrudt Bemærkninger til test: Det antages implicit, at navngivningen af en arkiveringsversion starter med præfixet AID efterfulgt af en arkivkode på 2-4 bogstaver, samt et arkiveringsversionsløbenummer, afsluttet med et fortløbende medieløbenummer f.eks. (AID.SA.18000.1) 1. Der skal være angivet et medieløbenummer, for at testen kan gennemføres 2. Det er ikke muligt for mappestrukturtest at afsløre, hvis de/t sidste medie/r mangler eller er navngivet forkert. Det må efterfølgende bero på andre test der fejler, som følge af denne problemstilling. Fejl af denne karakter kan opstå, hvis udstrækningen af arkiveringsversionen strækker sig over flere medier. 3. Alle medier skal være navngivet med et fortløbende medieløbenummer startende fra 1. Kendte mangler: Ingen. 19 19-09-2016

Testområde 4.B.2 (Placering af mapper og filer) 4.B.2 Arkiveringsversionens indhold fordeles i mapper, som angivet i figur 4.1. 4.B.3 Mapperne skal navngives som angivet i figur 4.1. 4.B.4.a Et arkiveringsversionsid består af præfikset AID, en kode på 2-4 bogstaver, som angiver det modtagende arkiv, samt et arkiveringsversionsløbenummer. Elementerne adskilles med punktum. 4.B.5.a En arkiveringsversion, som ikke kan være på ét medie, jf. bilag 7, kan fordeles over flere medier. 4.B.5.b Mapperne ContextDocumentation, Indices og Schemas skal altid være placeret på afleveringens første medie. 4.B.5.c Mappen i roden på efterfølgende medier skal kun indeholde de mapper, hvis indhold kræver fordeling over flere medier. Disse mapper navngives altid som angivet i figur 4.1 uden brug af suffiks. 4.B.6 Der må kun være én af hver af de i figur 4.1 angivne mapper på hvert medie. Testnr. Testnavn (internt referencenavn) Testforløb beskrivelse Implementeret 4.B.2_1 Mappestruktur, Indices Der testes for om mappen Indices findes på første medie 4.B.2_2 Mappestruktur, Schemas Der testes for om mappen Schemas findes på første medie 4.B.2_3 Mappestruktur, ContextDocumentation Der testes for om mappen ContextDocumentation findes på første medie 4.B.2_4 Mappestruktur, Tables mangler Der testes for om der i hele arkiveringsversionen findes en mappe, navngivet som Tables 4.B.2_5 Mappestruktur, flere indices Der testes for, om der findes flere Indicesmapper, end den der skal ligge på første medie 4.B.2_6 Mappestruktur, flere Schemas Der testes for, om der findes flere Schemamapper, end den der skal ligge på første medie 4.B.2_7 Mappestruktur, flere Der testes for, om der findes flere ContextDocumentationmapper, end den der skal ligge på første ContextDocumentation medie 4.B.2_8 Mappestruktur, Documents Der undersøges om arkiveringsversionen indeholder en eller flere mapper, navngivet som Documents 4.B.2_9 Mappestruktur, Tables Der undersøges om arkiveringsversionen indeholder en eller flere mapper navngivet som Tables Bemærkninger til test: 1. - 2. - 3. - 4. - 20 19-09-2016

5. Arkiveringsversionen gennemløbes og der vises på hvilke drev/medier der ligger en Indicesmappe 6. Arkiveringsversionen gennemløbes og der vises på hvilke drev/medier der ligger en Schemamappe 7. Arkiveringsversionen gennemløbes og der vises på hvilke drev/medier der ligger en ContextDocumentationmappe 8. Oplysningstekst: Her oplyses om, hvilke medier der indeholder en dokumentmappe. Hvis der findes flere dokumentmapper på forskellige medier oplyses dette ligeledes. En test for om der i ArchiveIndex.xml, er opmærket, at der findes digitale dokumenter, vil blive beskrevet i forbindelse med test af denne indeksfil. 9. Oplysningstekst: Her oplyses om, hvilke medier der indeholder en Tables mappe. Hvis der findes flere tabelmapper på forskellige medier, oplyses dette ligeledes Kendte mangler: Ingen. 21 19-09-2016

Testområde 4.C (Mappen Indices) 4.C.1.a Mappen Indices skal indeholde følgende indeksfiler med oplysninger om arkiveringsversionen og dens indhold: fileindex.xml archiveindex.xml contextdocumentationindex.xml tableindex.xml 4.C.1.b Hvis arkiveringsversionen indeholder digitale dokumenter, lyd, video eller geodata, skal mappen Indices endvidere indeholde følgende indeksfil: docindex.xml Testformulering: Testnr. Testnavn (internt referencenavn) Testforløb beskrivelse Implementeret 4.C.1_1 Indicestest, fileindex Der testes for om mappen Indices indeholder en fileindex.xml 4.C.1_2 Indicestest,archiveIndex Der testes for om mappen Indices indeholder en archiveindex.xml 4.C.1_3 Indicestest,ContextDocumentatationIndex Der testes for om mappen Indices indeholder en ContextDocumentatationIndex.xml 4.C.1_4 Indicestest, tableindex Der testes for om mappen Indices indeholder en tableindex.xml 4.C.1_5 Indicestest, docindex Der testes for om mappen Indices indeholder en docindex.xml Bemærkninger til test: 5. Kun, hvis arkiveringsversionen indeholder digitale dokumenter, skal der også testes for, om der findes en docindex.xml i mappen Indices. Hvis der er opstået en fejlsituation, køres dokumenttest ikke, resten af testen gennemføres. Kendte mangler: Ingen 22 19-09-2016

Testområde 4.C.1 (Mappen Indices indeksfiler well-formed og valide) 4.C.1.c Alle indeksfiler skal overholde deres tilhørende skema, jf. bilag 8. Testnr. Testnavn (internt referencenavn) Testforløb beskrivelse Implementeret 4.C.1_1 Skematest, fileindex well-formed. Der testes for om fileindex.xml er well-formed. 4.C.1_2 Skematest, fileindex valid. Der testes for om fileindex.xml er valid. 4.C.1_3 Skematest, archiveindex well-formed. Der testes for om archiveindex.xml er well-formed. 4.C.1_4 Skematest, archiveindex valid. Der testes for om archiveindex.xml er valid. 4.C.1_5 Skematest, ContextDocumentatation well-formed. Der testes for om ContextDocumentation.xml er well-formed. 4.C.1_6 Skematest, ContextDocumentation valid. Der testes for om ContextDocumentation.xml er valid. 4.C.1_7 Skematest, tableindex well-formed. Der testes for om tableindex.xml er well-formed. 4.C.1_8 Skematest, tableindex valid. Der testes for om tableindex.xml er valid. 4.C.1_9 Skematest, docindex well-formed. Der testes for om docindex.xml er well-formed. 4.C.1_10 Skematest, docindex valid. Der testes for om docindex.xml er valid. 2. I forbindelse med parsning af fileindex.xml, vil skemabegrænsningen samtidig gennemføre en test af indhold jf. bekendtgørelsestekst 4. C.2.b 4. Kan køre videre i testen uden at terminere. I forbindelse med parsning af archiveindex.xml, vil skemabegrænsningen samtidig gennemføre en test af indhold jf. bekendtgørelsestekst 4. C.3. 6. I forbindelse med parsning af ContextDocumentation.xml, vil skemabegrænsningen samtidig, gennemføre en test af indhold jf. bekendtgørelsestekst 4. C.4.b 7-8. I forbindelse med parsning af tableindex.xml, vil skemabegrænsningen samtidig gennemføre en test af indhold jf. bekendtgørelsestekst 4.C.5b 3-8. Med hensyn til fejltype bruges xmlparserens fejlangivelse samt placeringen af den pågældende fejl. ed well-formed fejl stopper parseren, og der rapporteres kun den først opståede fejl. ed validering fortsætter parsingen og alle opståede fejl rapporteres. Det vil med tiden være ønskeligt, at den engelske meget tekniske fejlmeddelelse bliver oversat til en mere forståelig dansk tekst. 9. Kun hvis arkiveringsversionen indeholder digitale dokumenter, skal der også testes for, om docindex.xml er well-formed. 10. Kun hvis arkiveringsversionen indeholder digitale dokumenter, skal der også testes for, om docindex.xml er valid. Kun dokumenttesten termineres, den øvrige test gennemføres. Kendte mangler: Ingen. 23 19-09-2016

Testområde 4.C.2 (Mappen Indices fileindex.xml) 4.C.2.a fileindex.xml skal indeholde en komplet liste over samtlige filer, der findes i arkiveringsversionen. fileindex.xml er dog undtaget fra denne regel. 4.C.2.b For hver enkelt fil i arkiveringsversionen angives de oplysninger, som fremgår af figur 4.2. Testformulering: Testnr. 4.C.2_1 4.C.2_2 Testnavn (internt referencenavn) fileindex, filindhold manglende filer fileindex, filindhold overskydende filer Testforløb beskrivelse Der testes for, om alle de filer der er opmærket i fileindex.xml, findes fysisk i arkiveringsversion. Der testes for, om alle de filer der fysisk befinder sig i arkiveringsversionen, er opmærket i fileindex.xml. 4.C.2_3 fileindex, kontrolsum Der testes for, om den enkelte fil i arkiveringsversionen, som er korrekt opmærket i fileindex.xml, har en identisk kontrolsum iflg. den opmærkede værdi. Implementeret Bemærkninger til test: Skemadel for 4.C.2: 4.C.2.b bliver der testet for i 4.C.1.c under testområde 4.C.1 i og med, at der valideres op imod Rigsarkivets skemaer. 3. Denne test skal kun køre, hvis test 1-2 er udført fejlfrit for den enkelte fil. Kendte mangler: Ingen umiddelbart. Det er dog konstateret, at ADA ved større arkiveringsversioner hænger i MD5-testen ved 99% (4.C.2_3). 24 19-09-2016