Hvad udgør en ADA-test? Dokumentation af hvad ADA (version 3.3.3) tester for.

Relaterede dokumenter
Hvad udgør en ADA-test? Dokumentation af testfunktioner i ADA (version 3.0.0)

Hvad udgør en ADA-test? Dokumentation for maskintest ved ADA (version 2.3.0) iht. bekendtgørelse 1007 af 20. august 2010

Udkast til revideret bekendtgørelse om arkiveringsversioner

Bekendtgørelse om arkiveringsversioner

Udkast til revideret bekendtgørelse om arkiveringsversioner

Bilag B2: Oversigt over foreslåede ændringer i bekendtgørelse om arkiveringsversioner Høringsudgave, august 2017

Oversigt over de mest almindelige fejl ved test

Releasenote ADA 3.3.3

Vejledning til bekendtgørelse om arkiveringsversioner

Vejledning til bekendtgørelse om arkiveringsversioner

Vejledning til bekendtgørelse om arkiveringsversioner

Vejledning til bekendtgørelse om arkiveringsversioner

Vejledning om produktion af arkiveringsversioner. Oktober 0 1

Kort og godt om test af arkiveringsversioner

Afleveringsbestemmelse for Kingo

Anvisning i aflevering af bitemporale data

Vejledning til aflevering af dokumenter fra it-systemer til Statens Arkiver. Marts 1

Brugervejledning til ADA

Bekendtgørelse om arkiveringsversioner af bevaringsværdige data fra elektroniske arkivsystemer

Dokumentvejledningen. Rigsarkivet december 2015, BETA-version

@ 1. Vejledning til Bekendtgørelse om arkiveringsversioner af bevaringsværdige data fra elektroniske arkivsystemer

DAVAR Omdøbt til SagDokumentFormat. Attention er skilt ud i et selvstændigt format, AttentionFormat.

Integration af DocuBizz og Helios

- beskrivelse af snitflader

Side 1. Databaser og SQL. Dagens gang. Databasebegreber. Introduktion til SQL Kap 1-5

FESD-standardiseringsgruppen Att: Palle Aagaard IT- og Telestyrelsen IT-strategisk kontor Holsteinsgade København Ø

OIOUBL Guideline. OIOUBL Guideline

Internationalt udblik: Digital bevaring på Rigsarkivet i Danmark

Database for udviklere. Jan Lund Madsen PBS10107

Hvad er en relationsdatabase? Odense, den 19. januar Version 1.0

IKT-teknisk kommunikationsspecifikation

Skriftlig eksamen i. Databaser. Vinter 2002/2003

Installations- og. Brugervejledning. Rambøll CAREArkiv - version feb Rambøll Informatik A/S. j.nr. LLP feb.

Brugermanual SOFIA 2.1 Til brugere på læsesalen. Rigsarkivets program til visning af digitale arkivalier august 2015

OIOUBL Guideline. OIOUBL Guideline

DKAL Snitflader Masseforsendelse

Afsnittet er temmelig teoretisk. Er du mere til det praktiske, går du blot til det næste afsnit.

CAREArkiv. -Pligtaflevering af arkivdata fra RAMBØLL CARE.

Dataanalyse og databaser

OBJEKTKODE Kodeværdi for objekttype Integer(2) 30 Objektkode 30 gælder for planer der knyttes til en lokalplan. Se evt. kodeliste for Plandk2+

De præmisser vi arbejdede under, har haft betydning for det endelige valg af format.

Skriftlig eksamen i. Databaser. Vinter 2002/2003. Vejledende løsninger

Anvendelse af dobbelthistorik i GD2

Vejledning om IT-arkivering

Region Hovedstaden Center for It, Medico og Telefoni Arkivering af data til Rigsarkivet

Kursusbeskrivelse. Forarbejde. Oprettelse af en Access-database

Tilslutning til ecomone Basis (OIO Faktura)

Bilag til vejledning i anvendelse af attentionformatet i Digital Post-løsningen. December 2017, version 0.9

Encoding:...1 Et tegn sæt (character set):...1 UTF-8 og UTF-16 (Unicode):...2

Indholdsfortegnelse. Validering af journalnumre og genstandsnumre samt eksport til Regin. Museernes Udgravningsdata (MUD)

Snitfladebeskrivelse Import og Eksport af.csv fil til Tabulex Skema

kv AC Station. Kontrolanlæg Relæbeskyttelse. Dataudveksling med SIMEAS SAFIR. ETS Rev. 1

Finanstilsynets indberetningssystem. Vejledning til Regnearksskabelonerne

Aflevering af kommuner og og regioners digitale data og dokumenter til Statens Arkiver. En generel vejledning til kommunale og regionale myndigheder

Generelt Udtræk leveres som Zip-filer indeholdende udtræk i det format, som man som kunde har valgt.

Annoncering af opgave om udarbejdelse af arkiveringsversion af Guldborgsund Kommunes ESDH-system. Annonceringsmateriale

eskattekortsanmodninger fra og med 2011

Kapitel 1 Anvendelsesområde. Kapitel 2 Behandling og opbevaring

Nedenstående oversigt viser elementerne i den meddelelse, der skal overføres fra fødeafdeling til kirkekontor/sogn.

TravelTales; håndtering af konfigurationsfil

Håndbog Til CPR services. Bilag 8 GCTP-standard m.m. CPR-kontoret

FKG datamodellen Version ArcGIS integration Sidste revisionsdato: 23. maj 2014

VANSEnvelope TESTPROTOKOL FOR DEN GODE VANSENVELOPE. Namespace: urn:oio:medcom:vans-envelope: VANS

Kommunikationsvejledning omkring kopimodtagere, videresendelse og kvitteringer m.m.

Modul 2 Database projekt Multimediedesign 3. semester Gruppe 3 IRF/TUJE

Brugervejledning til databrowseren

Guideline. EAN-systemet

2. SEMESTER PROJEKT 3 INTERAKTIONSUDVIKLING

Eksport FI-indbetalinger i Netbanken

BILAG A KØBENHAVNS UNIVERSITET IKT-TEKNISK KOMMUNIKATIONSSPECIFIKATION

Vejledning til validator test af metadata

Bilag 9 - Særlige krav til sikrings-dokumentation

Axapta 3.0 Konverteringsvejledning

Indholdsfortegnelse for kapitel 3

PlanDK2+: Byggefelt OBS. Byggefelter er implementeret i PDK som en selvstændig Plantype (30.4) under objektkode 30 (lokalplandelområde).

Bilag 4. Screening af markblokke. Snitfladebeskrivelse

Vejledning i skabelse og test af metadata

XML webservice for pensionsordninger. Version 1.0 Draft A

Dokumentation af optagelse.dk

Data lagring. 2. iteration (implement backend)

OIS - Applikationskatalog

Bilag 9 - Sikring. Særlige krav til dokumentation Bilag 9 - Sikring. side 1(10)

1. Orientering Denne projektspecifikke beskrivelse er gældende for den digitale aflevering af D&Vdokumentation

Udgivelsen er beskyttet af Creative Commons license, Navngivning 2.5

Datalagring og formater

Namespaces. Vi kan kvalificere elementer på denne måde: <?xml version="1.0" encoding="iso "?>

Tietgenskolen - Nørrehus. Data warehouse. Database for udviklere. Thor Harloff Lynggaard DM08125

Problemstilling ved DBK integration i BIM Software Hvad skal der til. Nicolai Karved, Betech Data A/S

Databasesystemer. Databaser, efterår Troels Andreasen. Efterår 2002

Vejledning til SQL Converter - databaseindlæsning af arkiveringsversioner Side 1 af 17

Forslag til ny struktur - overblik

Indberetning til eindkomst via SFTP. Folder: J:\Kunder\eIndkomst Projektdokumentation\SFTP\Vejledninger\EC SFTP_eIndkomst

KOMMENTARSKABELON. ccs_- _strukturelle_aspekter_r1_ pdf Allan Dam Jepsen, CPC Center for Product Customization Aps

Harald Michalsen og Lasse Storr-Hansen

Hent filoplysninger fra billeder og filer

Notat. Indholdsfortegnelse. Statens Arkiver. Ang.: Statens Arkivers terminologi for digital bevaring, v. 18 Til: BK-Afdelingen Fra: ALT

Dokumentation af optagelse.dk

Septimas høringssvar vedrørende dokumenteterne FKG datamodellen - Version Fysisk implementering.pdf og FKG_2_3_1_mssql.sql

bips F104, Dokumenthåndtering

Vejledning til prototypen af RaConverter

Transkript:

Hvad udgør en ADA-test? Dokumentation af hvad ADA (version 3.3.3) tester for.

Indholdsfortegnelse Hvad tester ADA for?... 3 Oversigt over testområder... 3 Generel opbygning af testområderne... 8 Testområde 4.A.1 (Generelle regler om datastruktur)... 9 Testområde 4.B.1 (Placering af mapper og filer)... 10 Testområde 4.B.2 (Placering af mapper og filer)... 11 Testområde 4.C (Mappen Indices)... 12 Testområde 4.C.1 (Mappen Indices indeksfiler well-formed og valide)... 13 Testområde 4.C.2 (Mappen Indices fileindex.xml)... 14 Testområde 4.C.4 (Mappen Indices contextdocumentationindex.xml)... 15 Testområde 4.C.5 (Mappen Indices tableindex.xml)... 16 Testområde 4.C.6 (Mappen Indices docindex.xml)... 17 Testområde 4.D (Mappen Tables)... 18 Testområde 4.E (Mappen ContextDocumentation)... 21 Testområde 4.F (Mappen Schemas)... 23 Testområde 4.G (Mappen Documents)... 24 Testområde 5.A (Tabelindhold)... 26 Testområde 5.B (Datatyper)... 26 Testområde 5.D (Tekstformat)... 27 Testområde 5.E (Digitale dokumenter)... 28 Testområde 5.F (Lyd og video)... 30 Testområde 5.G (Geodata)... 31 Testområde 6.A (Arkivbeskrivelsesfil)... 33 Testområde 6.B (Kontekstdokumentation)... 34 Testområde 6.C (Data om arkiveringsversionens tabeller)... 35 Kendte mangler... 38 2 07-04-2017

Hvad tester ADA for? ADA er navnet på den applikation, som Rigsarkivet har udviklet til at teste, om en given arkiveringsversion lever op til bestemmelserne i bekendtgørelse nr. 1007 af 20. august 2010. Når man afvikler en ADA-test på en arkiveringsversion, vil ADA således gennemgå arkiveringsversionen for en lang række af bestemmelserne. Bemærk, at det ikke er alt, at ADA kan detektere. For eksempel lyder bekendtgørelsen 4.A.2, at Når en værdi i et felt er en kode som repræsentation for en fast og entydig værdi, skal koderne forklares. 5.B.2 lyder ligeledes: Datatypen string må kun indeholde ikke-opmærket tekst, som umiddelbart kan fortolkes.. Der er således nogle få bestemmelser, som ADA af gode grunde ikke kan detektere automatisk. Det er ikke altid muligt at beskrive en enkelt test for hver bestemmelse i bekendtgørelsen - forholdet er ikke altid 1:1. Det er for eksempel mere enkelt at formulere og implementere en test i ADA for, om en dokumentsamlingsmappe indeholder under 10.000 dokumentmapper (bek. 4.G.3), end det er at formulere en test for, om alle nøgler har en entydig identifikator (bek. 4.A.1). Ydermere skal mange bestemmelser også forstås i forlængelse af andre bestemmelser. Derfor er der dannet testområder, hvis formål er at teste den række af bestemmelser, der indholdsmæssigt hænger sammen som følge af bekendtgørelsen. Følgende tabel indeholder de bestemmelser fra bekendtgørelse 1007, hvor en automatisk test kan finde frem til om en given arkiveringsversion lever op til bestemmelserne. I de to første kolonner findes de enkelte bestemmelser og i tredje kolonne er det angivet hvilket tematisk testområde, som de er indplaceret i. Oversigt over testområder Ordlyd i bekendtgørelsen Bilag 4 4.A Generelle regler om datastruktur 4.A.1 I en arkiveringsversion skal alle nøgler have en entydig identifikator. Der må ikke forekomme situationer, hvor det er nødvendigt at uddrage dele af nøglefelter for at forstå it-systemets indhold eller funktion. 4.B. Placering af mapper og filer 4.B.1 I roden af filsystemet på afleveringsmediet, jf. bilag 7, skal der være placeret en mappe navngivet med mediets navn. Mediets navn består af det unikke arkiveringsversionsid med tilføjelse af et suffiks».n«, der angiver rækkefølgen af medierne, hvor n er et fortløbende medieløbenummer begyndende med 1. 4.B.2 Arkiveringsversionens indhold fordeles i mapper, som angivet i figur 4.1. 4.B.3 Mapperne skal navngives som angivet i figur 4.1. 4.B.4.a Et arkiveringsversionsid består af præfikset AID, en kode på 2-4 bogstaver, som angiver det modtagende arkiv, samt et arkiveringsversionsløbenummer. Elementerne adskilles med punktum. 4.B.5.a En arkiveringsversion, som ikke kan være på ét medie, jf. bilag 7, kan fordeles over flere medier. 4.B.5.b Mapperne ContextDocumentation, Indices og Schemas skal altid være placeret på afleveringens første medie. 4.B.5.c Mappen i roden på efterfølgende medier skal kun indeholde de mapper, hvis indhold kræver fordeling over flere medier. Disse mapper navngives altid som angivet i figur 4.1 uden brug af suffiks. 4.B.6 Der må kun være én af hver af de i figur 4.1 angivne mapper på hvert medie. 4.C Mappen Indices Testområde 4.A.1 4.B.1 4.B.2 3 07-04-2017

4.C.1.a Mappen Indices skal indeholde følgende indeksfiler med oplysninger om arkiveringsversionen og dens indhold: fileindex.xml archiveindex.xml 4.C contextdocumentationindex.xml tableindex.xml 4.C.1.b Hvis arkiveringsversionen indeholder digitale dokumenter, lyd, video eller geodata, skal mappen Indices endvidere indeholde følgende indeksfil: 4.C.1 docindex.xml 4.C.1.c Alle indeksfiler skal overholde deres tilhørende skema, jf. bilag 8. 4.C.2.a fileindex.xml skal indeholde en komplet liste over samtlige filer, der findes i arkiveringsversionen. fileindex.xml er dog undtaget fra denne regel. 4.C.2 4.C.2.b For hver enkelt fil i arkiveringsversionen angives de oplysninger, som fremgår af figur 4.2. 4.C.3 archiveindex.xml skal indeholde de oplysninger, som fremgår af 6.A. Testes under 6.A 4.C.4.a contextdocumentationindex.xml skal indeholde et indeks over de dokumenter, som findes i arkiveringsversionens kontekstdokumentation. 4.C.4.b For hvert dokument i kontekstdokumentationen angives de oplysninger, som fremgår af figur 4.3. 4.C.4 4.C.5.a tableindex.xml skal indeholde en angivelse af en relationel databasestruktur på 1. normalform eller højere. Samtlige tabeller i arkiveringsversionen skal angives. 4.C.5.b»tableIndex.xml«skal overholde det generelle XML-skema»tableIndex.xsd«, jf. 4.F. 4.C.5 4.C.5.c Hvis et felt må have værdien NULL, skal der i»tableindex.xml«være angivet værdien»true«for kolonnens tilhørende element»nullable«. 4.C.6.a docindex.xml skal danne forbindelsen mellem hvert dokument og dets placering.»docindex.xml«skal desuden indeholde oplysninger om dokumenternes oprindelige filnavne, filtype i arkiveringsversionen samt eventuelle overordnede dokumenter.»docindex.xml«skal ikke indeholde oplysninger om dokumenterne i kontekstdokumentationen. 4.C.6 4.C.6.b For hvert enkelt dokument i docindex.xml angives de oplysninger, som fremgår af figur 4.4. 4.D. Mappen Tables 4.D.1 Mappen Tables skal indeholde én mappe for hver tabel i arkiveringsversionen. 4.D.2.a Mappen for en tabel navngives»table[fortløbende nummer]«. 4.D.2.b Den fortløbende nummerering begynder med 1. Foranstillede nuller må ikke anvendes. 4.D.3 Mappen for hver tabel skal indeholde to filer: table[fortløbende nummer].xsd table[fortløbende nummer].xml1 4.D 4.D.4»table[fortløbende nummer].xsd«er et XML-skema, der kun angiver strukturen for den enkelte pågældende tabel, og skal være i overensstemmelse med XML-instansen»tableIndex.xml«, jf. 4.C.5.a, der angiver strukturen for hele den pågældende relationelle database, herunder samtlige tabeller. 4.D.5»table[fortløbende nummer].xml«er en XML-instans, der indeholder data for den pågældende tabel, og dens struktur skal være i 4 07-04-2017

overensstemmelse med det tilhørende XML-skema,»table[fortløbende nummer].xsd«. 4.D.6 Hvis et felt i en tabel kan have værdien NULL, skal den pågældende kolonne i det tilhørende skema (»table[fortløbende nummer].xsd«) indeholde attributten nillable=»true«. Tilsvarende skal XML-instansens (»table[fortløbende nummer].xml«) element indeholde attributten xsi:nil=»true«jf. W3C standarden for håndtering af NULL værdier i XML. 4.E. Mappen ContextDocumentation 4.E.1 Mappen ContextDocumentation skal indeholde én eller flere dokumentsamlingsmapper med kontekstdokumentation, jf. 6.B. 4.E.2 En dokumentsamlingsmappe med kontekstdokumentation må indeholde op til 10.000 dokumentmapper. 4.E.3 Dokumentsamlingsmapperne navngives»doccollection[fortløbende nummer]«, begyndende med 1. Navnet skal være unikt inden for ContextDocumentation. 4.E.4 Hvert dokument i kontekstdokumentationen skal tildeles et ID på op til 12 cifre. Dokumentets ID skal være unikt inden for ContextDocumentation. 4.E.5 En dokumentmappe skal indeholde ét dokument, som består af én eller flere filer af samme format, og navngives med dokumentets ID. Foranstillede nuller må ikke anvendes. 4.E.6 Et dokuments fil (eller filer) navngives fortløbende med et nummer, begyndende med 1 samt formatets ekstension, jf. 4.G.8 4.F. Mappen Schemas 4.F.1 Mappen Schemas skal være opdelt i undermapperne standard og localshared. 4.F.2 Mappen standard skal indeholde skemaer for arkiveringsversionens indeksfiler, jf. bilag 8, samt W3C standard XML-skema, jf. http://www.w3.org/2001/xmlschema.xsd. 4.F.3 For skemaerne fileindex.xsd, archiveindex.xsd, contextdocumentationindex.xsd, tableindex.xsd, docindex.xsd samt W3Cs standard XML-skema gælder, at der altid skal anvendes de skemaer, som Rigsarkivet stiller til rådighed. Skemaerne og deres navngivning må ikke ændres i arkiveringsversionen. 4.F.4 Mappen localshared skal indeholde eventuelle GML-skemaer, som ikke er placeret sammen med det pågældende GML-dokument, jf. 4.G.7.a. 4.G. Mappen Documents 4.G.1 Mappen Documents skal indeholde én eller flere dokumentsamlingsmapper, dog maksimalt 10.000. 4.G.2 Dokumentsamlingsmapperne navngives»doccollection[fortløbende nummer]«, begyndende med 1. Navnet skal være unikt inden for Documents. 4.G.3 En dokumentsamlingsmappe må indeholde op til 10.000 dokumentmapper. 4.G.4 Hvert dokument skal i arkiveringsversionen tildeles et ID på op til 12 cifre. Dokumentets ID skal være unikt inden for Documents. 4.G.5 En dokumentmappe skal indeholde ét dokument, som består af én eller flere filer af samme format, og navngives med dokumentets ID. Foranstillede nuller må ikke anvendes. 4.G.6 Et dokuments fil (eller filer) navngives fortløbende med et nummer, begyndende med 1 samt formatets ekstension. Foranstillede nuller må ikke anvendes. 4.G.7 For GML-filer lagres det relevante skema i samme mappe som GML-filen, og navngives med fortløbende nummer efterfulgt af.xsd, jf. dog 4.G.7.a. Foranstillede nuller må ikke anvendes. 4.G.7.a GML-skemaer kan alternativt lagres i den skema-mappe, som navngives localshared, jf. 4.F. GMLskemaer i mappen localshared navngives»localschema[fortløbende nummer]«, begyndende med 1. 5 07-04-2017 4.E 4.F 4.G

4.G.8.a Dokumenter i formatet TIFF skal have ekstension tif. 4.G.8.b Dokumenter i formatet MP3 skal have ekstension mp3. 4.G.8.c Dokumenter i formatet MPEG-2 og MPEG-4 skal have ekstension mpg. 4.G.8.d Dokumenter i formatet JPEG-2000 skal have ekstension jp2. 4.G.8.e Dokumenter i formatet GML skal have ekstension gml. 4.G.8.f Dokumenter i formatet WAE skal have ekstension wav. Bilag 5 5.A. Tabelindhold 5.A.1.a I overensstemmelse med den tabelstruktur, der er defineret for hver tabel i hvert sit tilhørende XMLskema, navngivet»table[fortløbende nummer].xsd«, jf. 4.D, skal hver tabel findes i en XML-instans navngivet»table[fortløbende nummer].xml«. 5.A.1.b Den fortløbende nummerering begynder med 1. Foranstillede nuller må ikke anvendes. 5.A.2 Indholdet af de enkelte felter skal renses for eventuelle foran- og efterstillede blanktegn. 5.B. Datatyper 5.B.1.a De standardiserede datatyper, som skal anvendes for tabelindhold, er angivet i figur 5.1. De er et uddrag af datatyper fra standarden SQL:1999 repræsenteret som datatyper i W3C XML Schema Language 1.0. 5.B.1.b Det er datatypen i W3C XML Schema Language 1.0, som skal anvendes. Oversættelsen fra datatyper i SQL:1999 er angivet for at vise, hvorledes oversættelsen til datatyper i W3C XML Schema Language 1.0 skal foretages. 5.B.3 Datatypen boolean kan jf. W3C kun antage værdierne 1; 0 eller true; false. 5.B.4 Datatyperne date, time og datetime kan bruges med eller uden Time Zone. 5.D. Tekstformat 5.D.1.a Data i arkiveringsversionens indeksfiler og tabelindhold skal være indkodet som well-formed UTF-8, som angivet i ISO/IEC 10646:2003 Annex D og som beskrevet i The Unicode Standard 5.1, kapitel 3. 5.D.1.b De indkodede karakterer skal være gyldige Unicode skalarværdier. Surrogater/RC-elementer og Unicode noncharacters må ikke anvendes. 5.D.1.c Ingen karakterer i Private Use Area må indkodes. 5.D.1.d Styrekodetegnene fra og med #x00 til og med #x1f er ikke tilladt med undtagelse af styrekodetegnene tabulator (TAB) #x09, nylinje (LF) #x0a 5.D og vognretur (CR) #x0d. 5.D.2.a I henhold til XML-standarden gælder de regler for angivelse af de pågældende tegn, som fremgår af figur 5.2. 5.D.2.b Tegnene fra og med #x7f til og med #x9f skal angives med deres decimale eller hexadecimale tegnreference. 5.D.2.c CDATA sektioner <![CDATA ]]> må ikke anvendes. 5.E. Digitale dokumenter 5.E.1.a Et digitalt dokument, jf. dog 5.F og 5.G, skal lagres i ét af følgende formater: det grafiske bitmapformat TIFF, version 6.0 baseline. JPEG-2000 efter standarden ISO/IEC 15444-1:2004. Information technology - JPEG 2000 image coding system - Part 1: Core coding system. 5.E 5.E.1.b Det er tilladt at benytte begge formater inden for samme arkiveringsversion. 5.E.2 Dokumenter i TIFF skal komprimeres efter følgende kompressionsregler: 6 07-04-2017 Testes under 4.D Testes under 4.D

5.E.2.a Sort/hvide dokumenter skal komprimeres med CCITT/TSS grp. 3, grp. 4, PackBit eller LZW. 5.E.2.b Dokumenter med gråtoner eller farver skal komprimeres med PackBit eller LZW. 5.F. Lyd og video 5.F.1 Lydfiler skal lagres efter standarden MP3 DS/EN ISO/IEC 11172-3. 5.F.2 Det modtagende arkiv kan tillade, at lydfiler afleveres i formatet WAE LPCM som specificeret i Multimedia Programming Interface and Data Specifications 1.0. IBM Corporation and Microsoft Corporation, August 1991. Dog begrænset til bitdybder, der er hele multipla af 8. 5.F.3 ideofiler skal lagres efter en af følgende standarder: MPEG-2 DS/EN ISO/IEC 13818-2. Eventuel lyd indkodes som MP3, som specificeret i ISO/IECf 13818-3. MPEG-4 AC DS/EN ISO/IEC 14496-10 (ITU-T H.264). ideo indkodes som specificeret i ISO/IEC 14496-10. Eventuel lyd indkodes som AAC, som specificeret i ISO/IEC 14496-3. ideo og lyd indpakkes i MPEG-4 formatet som defineret i ISO/IEC 14496-14. 5.F 5.G. Geodata 5.G.1 Data fra geografiske informationssystemer samt øvrige geodata lagres som GML-filer iht. GML 3.1.1 GML-standarden ISO 19136. 5.G.2 GML-filer, som er større end 1 GB, opdeles i enheder efter det modtagende arkivs anvisning. 5.G.3 Hver GML-fil, evt. efter opdeling jf. 5.G.2, behandles som et separat dokument iht. reglerne i 4.G. 5.G 5.G.4 De nødvendige XML-skemaer til validering af GML-filerne skal indgå i arkiveringsversionen. Bilag 6 6.A. Arkivbeskrivelsesfil 6.A.1 Enhver arkiveringsversion skal indeholde en arkivbeskrivelsesfil med angivelse af oplysninger iht. figur 6.1. 6.A.2 Arkivbeskrivelsesfilen navngives archiveindex.xml og skal overholde det tilhørende skema, jf. bilag 8. 6.A 6.B. Kontekstdokumentation 6.B.3.a Dokumenterne indplaceres i én eller flere af de kategorier, som fremgår af figur 6.2. Testes under 6.B.3.b Oplysninger om kategoriseringen registreres i indeksfilen contextdocumentationindex, jf. 4.C.4.a. 4.C.4, 5.E og 6.B.4 Dokumenterne skal lagres i ét af de i arkiveringsversionen tilladte dokumentformater, jf. 5.E - 5.F. 5.F 6.C. Data om arkiveringsversionens tabeller 6.C.1 En arkiveringsversion skal indeholde dokumentation af arkiveringsversionens tabeller og relationer (tabelindeks). Tabelindekset skal indeholde de oplysninger, som fremgår af figur 6.3 nedenfor. 6.C.5 For arkiveringsversioner af it-systemer, som nævnt i 6.C.4, skal kolonner, der indeholder særlige informationer, jf. figur 6.4 - figur 6.6, identificeres via elementet functionaldescription, jf. figur 6.3, 4.h. 6.C 6.C.6 De særlige oplysninger, der er angivet i figur 6.6, skal opmærkes i det omfang, de er registreret i it-systemet. Hvis oplysningerne i figur 6.6 ikke findes registreret i it-systemet, skal der i forbindelse med afleveringen aftales eventuelle alternative opmærkninger, der sikrer identifikation af sagligt sammenhørende dokumenter, jf. gældende bestemmelser herom. 6.D. SQL-forespørgsler 6.D.2 SQL-forespørgslerne udformes efter standarden SQL:1999 (core). Testes under 6.D.3 Forespørgslerne placeres i»oplysninger om views og forespørgsler«i tabelindekset jf. figur 6.3, 7, og navngives efter myndighedens eget valg, 6.C dog således at navnet på de pågældende forespørgsler begynder med»a«. 7 07-04-2017

Generel opbygning af testområderne I det følgende vil hvert testområde blive præsenteret hver for sig og på følgende form: 1. En samling af de konkrete bestemmelser for testområdet (kopieret fra bek. 1007). 2. Præciserende definitioner* 3. Testformulering (se uddybning) 4. Testbemærkninger (se uddybning) 5. Kendte mangler 2. Præciserende definitioner* Der hvor det findes nødvendigt at skabe en forståelse og præcisering for aktuelle begreber (f.eks. primær- og fremmednøgler i testområde 4.A), vil der være udformet en præciserende definition af, hvordan Rigsarkivet fortolker og fastsætter denne problemstilling. Definitionen skal være med til at tydeliggøre, hvordan og hvorfor Rigsarkivet har formuleret testene for de konkrete testområder. 3. Testformulering* De enkelte testformuleringer er optegnet i et skema med følgende felter: Testnr. Fast løbenummer, der refererer til den aktuelle deltest Testnavn. Referencenavn til pågældende deltest Testforløb beskrivelse. Beskrivelse af testforløb for den enkelte deltest Implementeret. Her angives om den aktuelle deltest er blevet implementeret i ADA. Altså en direkte dokumentation af ADAs testfunktionalitet. Hvis der er fejl i dokumentationen, er du velkommen til at kontakte os på: ada-meldinger@sa.dk. Rigsarkivet vurderer løbende de indkomne forslag og problemer, og prioriterer løsningen af dem. Som udgangspunkt rettes i øjeblikket kun fejl og mangler, som betyder, at en arkiveringsversion ikke kan testes. Du er dog som hidtil også velkommen til at indsende ønsker til ny funktionalitet. Bemærk: hvis en række er farvet med grå, betyder det at denne deltest blot er et hint og ikke en hård fejl. 4. Testbemærkninger* I forbindelse med hvert enkelt testnummer, vil der i fornødent omfang være en supplerende beskrivelse og uddybning af testforløbet med en reference til deltestnummeret. 5. Kendte mangler* En opsummering af kendte mangler i testområdet. 8 07-04-2017

Testområde 4.A.1 (Generelle regler om datastruktur) 4.A.1 I en arkiveringsversion skal alle nøgler have en entydig identifikator. Der må ikke forekomme situationer, hvor det er nødvendigt at uddrage dele af nøglefelter for at forstå it-systemets indhold eller funktion. Præciserende definition af begreberne primær- og fremmednøgler: En primærnøgle kan bestå af et eller flere felter, der tilsammen udgør en entydig unik nøgle inden for den pågældende tabel. Dele af en primærnøgle må ikke bestå af enten felter med NULL- værdier eller værdier kun indeholdende forskellige former for blanktegn eks. ASCII hex 09,20 (tabulator, mellemrumstegn). Det er heller ikke acceptabelt, at et eller flere af felterne i en primærnøgle begynder eller afsluttes med et eller flere mellemrumstegn eller andre lignende blanktegn. En fremmednøgle er et eller flere felter i en tabel, der relateres til primærnøglen i en anden eller egen tabel. Der skal være fuld overensstemmelse mellem datatyper og længde i fremmednøglen og den refererede primærnøgle. En fremmednøgle kan ikke referere til dele af en primærnøgle, kun til hele nøglen. Testformulering: Testnr. Testnavn Testforløb beskrivelse Implementeret 4.A_1 Primærnøgletest unik Der testes for, om der findes primærnøgler, der ikke er unikke. Testen foretages ved sammensatte nøgler som enkelt felter, og ikke som en konkatenering af tekststrenge. 4.A_2 Primærnøgletest NULL Der testes for, om der findes felter i primærnøglen, der har en NULL værdi. 4.A_3 Primærnøgletest, blank Der testes for, om primærnøglefelter starter eller afslutter, med en eller anden form for blanktegn. 4.A_5 Fremmednøgletest, uden Der testes for, om der til alle instanser af en fremmednøgle findes en identisk reference i den refererede reference primærnøgle (Dangling tuples). 4.A_6 Fremmednøgletest, del af Der testes for, at primærnøglens felter i referencetabellen, er identisk med fremmednøglens felter, primærnøgle herunder den opmærkede rækkefølge af felter. 4.A_7 Fremmednøgletest, ikke Der testes for, om fremmednøglens reference udgøres af en erklæret og opmærket primærnøgle i primærnøgle referencetabellen. 4.A_8 Fremmednøgletest, datatyper Der testes for, om fremmednøglens og referencetabellens felter er identiske i relation til datatype. 4.A_10 Fremmednøgletest, Der testes for, om fremmednøglefelter starter eller afslutter med en eller anden form for blanktegn. Blank 4.A_11 Fremmednøgletest, tomme fremmednøgler Der laves en optælling af antallet af null-værdier i hver fremmednøgle. Kendte mangler 4.A_10 ikke implementeret. Redundant test da 4.A_3 tester for det i primærnøgler. 9 07-04-2017

Testområde 4.B.1 (Placering af mapper og filer) 4.B.1 I roden af filsystemet på afleveringsmediet, jf. bilag 7, skal der være placeret en mappe navngivet med mediets navn. Mediets navn består af det unikke arkiveringsversionsid med tilføjelse af et suffiks».n«, der angiver rækkefølgen af medierne, hvor n er et fortløbende medieløbenummer begyndende med 1. Testformulering: Testnr. Testnavn (internt referencenavn) Testforløb beskrivelse Implementeret 4.B.1_1 Mappestrukturtest, manglende første medie Der testes for om der findes et medie, som er korrekt navngivet, inklusiv medieløbenummer 4.B.1_2 Mappestrukturtest, samme medieløbenummer Der testes for den fortløbende nummerering af medier. 4.B.1_3 Mappestrukturtest, rækkefølge Der testes for, om rækkefølgen af medier er ubrudt Bemærkninger til test: Det antages implicit, at navngivningen af en arkiveringsversion starter med præfixet AID efterfulgt af en arkivkode på 2-4 bogstaver, samt et arkiveringsversionsløbenummer, afsluttet med et fortløbende medieløbenummer f.eks. (AID.SA.18000.1) 1. Der skal være angivet et medieløbenummer, for at testen kan gennemføres 2. Det er ikke muligt for mappestrukturtest at afsløre, hvis de/t sidste medie/r mangler eller er navngivet forkert. Det må efterfølgende bero på andre test der fejler, som følge af denne problemstilling. Fejl af denne karakter kan opstå, hvis udstrækningen af arkiveringsversionen strækker sig over flere medier. 3. Alle medier skal være navngivet med et fortløbende medieløbenummer startende fra 1. 10 07-04-2017

Testområde 4.B.2 (Placering af mapper og filer) 4.B.2 Arkiveringsversionens indhold fordeles i mapper, som angivet i figur 4.1. 4.B.3 Mapperne skal navngives som angivet i figur 4.1. 4.B.4.a Et arkiveringsversionsid består af præfikset AID, en kode på 2-4 bogstaver, som angiver det modtagende arkiv, samt et arkiveringsversionsløbenummer. Elementerne adskilles med punktum. 4.B.5.a En arkiveringsversion, som ikke kan være på ét medie, jf. bilag 7, kan fordeles over flere medier. 4.B.5.b Mapperne ContextDocumentation, Indices og Schemas skal altid være placeret på afleveringens første medie. 4.B.5.c Mappen i roden på efterfølgende medier skal kun indeholde de mapper, hvis indhold kræver fordeling over flere medier. Disse mapper navngives altid som angivet i figur 4.1 uden brug af suffiks. 4.B.6 Der må kun være én af hver af de i figur 4.1 angivne mapper på hvert medie. Testnr. Testnavn (internt referencenavn) Testforløb beskrivelse Implementeret 4.B.2_1 Mappestruktur, Indices Der testes for, om mappen Indices findes på første medie 4.B.2_2 Mappestruktur, Schemas Der testes for, om mappen Schemas findes på første medie 4.B.2_3 Mappestruktur, ContextDocumentation Der testes for, om mappen ContextDocumentation findes på første medie 4.B.2_4 Mappestruktur, Tables mangler Der testes for, om der i hele arkiveringsversionen findes en mappe, navngivet som Tables 4.B.2_5 Mappestruktur, flere indices Der testes for, om der findes flere Indicesmapper, end den der skal ligge på første medie 4.B.2_6 Mappestruktur, flere Schemas Der testes for, om der findes flere Schemamapper, end den der skal ligge på første medie 4.B.2_7 Mappestruktur, flere Der testes for, om der findes flere ContextDocumentationmapper, end den der skal ligge på første ContextDocumentation medie 4.B.2_8 Mappestruktur, Documents Der undersøges, om arkiveringsversionen indeholder en eller flere mapper, navngivet som Documents 4.B.2_9 Mappestruktur, Tables Der undersøges, om arkiveringsversionen indeholder en eller flere mapper navngivet som Tables 11 07-04-2017

Testområde 4.C (Mappen Indices) 4.C.1.a Mappen Indices skal indeholde følgende indeksfiler med oplysninger om arkiveringsversionen og dens indhold: fileindex.xml archiveindex.xml contextdocumentationindex.xml tableindex.xml 4.C.1.b Hvis arkiveringsversionen indeholder digitale dokumenter, lyd, video eller geodata, skal mappen Indices endvidere indeholde følgende indeksfil: docindex.xml Testformulering: Testnr. Testnavn (internt referencenavn) Testforløb beskrivelse Implementeret 4.C.1_1 Indicestest, fileindex Der testes for om mappen Indices indeholder en fileindex.xml 4.C.1_2 Indicestest,archiveIndex Der testes for om mappen Indices indeholder en archiveindex.xml 4.C.1_3 Indicestest,ContextDocumentatationIndex Der testes for om mappen Indices indeholder en ContextDocumentatationIndex.xml 4.C.1_4 Indicestest, tableindex Der testes for om mappen Indices indeholder en tableindex.xml 4.C.1_5 Indicestest, docindex Der testes for om mappen Indices indeholder en docindex.xml 12 07-04-2017

Testområde 4.C.1 (Mappen Indices indeksfiler well-formed og valide) 4.C.1.c Alle indeksfiler skal overholde deres tilhørende skema, jf. bilag 8. Testnr. Testnavn (internt referencenavn) Testforløb beskrivelse Implementeret 4.C.1_1 Skematest, fileindex well-formed. Der testes for, om fileindex.xml er well-formed. 4.C.1_2 Skematest, fileindex valid. Der testes for, om fileindex.xml er valid. 4.C.1_3 Skematest, archiveindex well-formed. Der testes for, om archiveindex.xml er well-formed. 4.C.1_4 Skematest, archiveindex valid. Der testes for, om archiveindex.xml er valid. 4.C.1_5 Skematest, ContextDocumentatation well-formed. Der testes for, om ContextDocumentation.xml er well-formed. 4.C.1_6 Skematest, ContextDocumentation valid. Der testes for, om ContextDocumentation.xml er valid. 4.C.1_7 Skematest, tableindex well-formed. Der testes for, om tableindex.xml er well-formed. 4.C.1_8 Skematest, tableindex valid. Der testes for, om tableindex.xml er valid. 4.C.1_9 Skematest, docindex well-formed. Der testes for, om docindex.xml er well-formed. 4.C.1_10 Skematest, docindex valid. Der testes for, om docindex.xml er valid. 4.C.1_11 Skematest, UTF-8 deklaration Der testes for, om indeksfilerne indeholder angivelse af UTF-8 tegnsæt i XML prolog. 4.C.1_12 Skematest, manglende XML prolog Der testes for, om indeksfilerne indeholder XML prolog 13 07-04-2017

Testområde 4.C.2 (Mappen Indices fileindex.xml) 4.C.2.a fileindex.xml skal indeholde en komplet liste over samtlige filer, der findes i arkiveringsversionen. fileindex.xml er dog undtaget fra denne regel. 4.C.2.b For hver enkelt fil i arkiveringsversionen angives de oplysninger, som fremgår af figur 4.2. Testformulering: Testnr. Testnavn (internt referencenavn) Testforløb beskrivelse 4.C.2_1 fileindex, filindhold Der testes for, om alle de filer der er opmærket i fileindex.xml, findes fysisk i arkiveringsversion. manglende filer 4.C.2_2 fileindex, filindhold Der testes for, om alle de filer der fysisk befinder sig i arkiveringsversionen, er opmærket i fileindex.xml. overskydende filer 4.C.2_3 fileindex, kontrolsum Der testes for, om den enkelte fil i arkiveringsversionen, som er korrekt opmærket i fileindex.xml, har en identisk kontrolsum iflg. den opmærkede værdi. 4.C.2_4 fileindex, AID Der testes for, at arkiveringsversionsid angivet i <fon> er identisk med arkiveringsversionsid. 4.C.2_5 fileindex, dubletter Der testes for om fileindex.xml indeholder dubletopmærkninger for samme fil. Implementeret Bemærkninger til test: Skemadel for 4.C.2: 4.C.2.b bliver der testet for i 4.C.1.c under testområde 4.C.1 i og med, at der valideres op imod Rigsarkivets skemaer. 14 07-04-2017

Testområde 4.C.4 (Mappen Indices contextdocumentationindex.xml) 4.C.4.a contextdocumentationindex.xml skal indeholde et indeks over de dokumenter, som findes i arkiveringsversionens kontekstdokumentation. 4.C.4.b For hvert dokument i kontekstdokumentationen angives de oplysninger, som fremgår af figur 4.3. Testformulering: Testnr. Testnavn (internt referencenavn) Testforløb beskrivelse Implementeret 4.C.4_1 contextdocumentationindex.xml, kategorier Der testes for, at mindst 1 af dokumentkategorierne i <documentcategory> i contextdocumentationindex.xml er markeret som true for hvert dokument Bemærkninger til test: Skemadel for 4.C.4: 4.C.4.b bliver der testet for i 4.C.1.c under testområde 4.C.1 i og med, at der valideres op imod Rigsarkivets skemaer. 15 07-04-2017

Testområde 4.C.5 (Mappen Indices tableindex.xml) 4.C.5.a tableindex.xml skal indeholde en angivelse af en relationel databasestruktur på 1. normalform eller højere. Samtlige tabeller i arkiveringsversionen skal angives. 4.C.5.b»tableIndex.xml«skal overholde det generelle XML-skema»tableIndex.xsd«, jf. 4.F. 4.C.5.c Hvis et felt må have værdien NULL, skal der i»tableindex.xml«være angivet værdien»true«for kolonnens tilhørende element»nullable«. Præciserende definition af begrebet 1. normalform ed første normalform forstås i traditionel databasetradition, at der i felter kun findes en værdi, og at der ikke kan optræde repeterende grupper i tabellen. Der skal altid være opmærket en primærnøgle i tabellen. Rigsarkivet har tradition for at knytte andre databasebegreber til normalformsbegrebet herunder, om der findes relationer mellem alle tabeller i arkiveringsversionen, samt om de kolonner der indgår i en primærnøgle er opmærket som værende NOT NULL. Derudover at alle tabelnavne i en arkiveringsversion er unikke. Testformulering: Testnr. Testnavn (internt referencenavn) Testforløb beskrivelse Implementeret 4.C.5_1 Relationstest, tabeller uden relation Der undersøges, om der findes tabeller uden relation til andre tabeller. Der bringes en liste over samtlige tabeller i arkiveringsversionen, der ikke har relationer til andre tabeller i databasen. Dette er ikke nødvendigvis en fej, men en oplysning. 4.C.5_2 Tabeltest, nullable Der undersøges, om de felter der indgår i en primærnøgle, er opmærket med nullable = true 4.C.5_3 Tabeltest, tabelnavne unikke Der undersøges, om alle tabeller i en arkiveringsversion har et unikt navn i tableindex.xml Bemærkninger til test: Skemadel for 4.C.5: Bekendtgørelsens 4.C.5.b bliver der testet for i 4.C.1.c under testområde 4.C.1 i og med, at der valideres op imod Rigsarkivets skemaer. Kendte mangler: 4.C.5_1 ADA kan på nuværende tidspunkt ikke teste for, om der er tabeller uden relationer til andre tabeller. Der er dog E/R-diagram i tablevieweren. 16 07-04-2017

Testområde 4.C.6 (Mappen Indices docindex.xml) 4.C.6.a docindex.xml skal danne forbindelsen mellem hvert dokument og dets placering.»docindex.xml«skal desuden indeholde oplysninger om dokumenternes oprindelige filnavne, filtype i arkiveringsversionen samt eventuelle overordnede dokumenter.»docindex.xml«skal ikke indeholde oplysninger om dokumenterne i kontekstdokumentationen. 4.C.6.b For hvert enkelt dokument i docindex.xml angives de oplysninger, som fremgår af figur 4.4. Testformulering: Testnr. Testnavn (internt referencenavn) Testforløb beskrivelse Implementeret 4.C.6_1 Dokumenttest, parentid Der testes for, om der findes opmærkninger i docindex.xml i elementet <pid> 4.C.6_2 Dokumenttest, GML Hvis arkiveringsversionen har opmærket ekstension.gml i ofn samt gml i aft testes der for, om opmærkningen i gmlxsd er udført korrekt. 4.C.6_3 Dokumenttest, parentid sammenhæng Der testes for, om en docid opmærket i elementet <pid> har en overordnet reference til en docid opmærket i <did> 4.C.6_4 Dokumenttest, parentid rekursiv Der testes for, om alle led i indlejrede filers filer, har en endelig og afsluttende reference til en sammenhæng <did> 4.C.6_5 Dokumentindekstest, refererer til Der testes for, om alle dokumenter i dokumentindekset refererer til tabeldata opmærket med tabeldata functional description Dokumentidentifikation. 4.C.6_6 Dokumentindekstest, dokumenter Der testes for, om alle dokumenter i tabeldata opmærket med functional description refereret i tabeldata Dokumentidentifikation refererer til dokumenter i dokumentindekset. 17 07-04-2017

Testområde 4.D (Mappen Tables) 4.D.1 Mappen Tables skal indeholde én mappe for hver tabel i arkiveringsversionen. 4.D.2.a Mappen for en tabel navngives»table[fortløbende nummer]«. 4.D.2.b Den fortløbende nummerering begynder med 1. Foranstillede nuller må ikke anvendes. 4.D.3 Mappen for hver tabel skal indeholde to filer: table[fortløbende nummer].xsd table[fortløbende nummer].xml1 4.D.4»table[fortløbende nummer].xsd«er et XML-skema, der kun angiver strukturen for den enkelte pågældende tabel, og skal være i overensstemmelse med XMLinstansen»tableIndex.xml«, jf. 4.C.5.a, der angiver strukturen for hele den pågældende relationelle database, herunder samtlige tabeller. 4.D.5»table[fortløbende nummer].xml«er en XML-instans, der indeholder data for den pågældende tabel, og dens struktur skal være i overensstemmelse med det tilhørende XML-skema,»table[fortløbende nummer].xsd«. 4.D.6 Hvis et felt i en tabel kan have værdien NULL, skal den pågældende kolonne i det tilhørende skema (»table[fortløbende nummer].xsd«) indeholde attributten nillable=»true«. Tilsvarende skal XML-instansens (»table[fortløbende nummer].xml«) element indeholde attributten xsi:nil=»true«jf. W3C standarden for håndtering af NULL værdier i XML. Præciserende definition af skemaer, som anvendes til at teste xml tabelinstanser med Bekendtgørelsesteksten 4.D.4 fastsætter, at skemaer til brug for at teste XML tabelinstanser skal udformes i overensstemmelse med den opmærkning der findes i XMLinstansen tableindex.xml. ADA fremstiller disse skemaer og udskifter evt. medfølgende skemaer i arkiveringsversionen. Der testes således ikke for, om der findes skemaer i arkiveringsversionens tabelmapper jf. bilag 5.A.1.a. Skemaerne udformes således, at de sikrer at tabelinstansernes struktur overholder de opmærkninger, som er anført i tableindex.xml, herunder overensstemmelse med datatyper samt NULL/nil værdier. Derudover skal skemaerne understøtte, at der kan forekomme tabelinstanser uden dataindhold. De test der ville være relevante jf. bilag 5.A og 5.B er indeholdt i de nedenstående testforløb. Testformulering: Testnr Testnavn (internt referencenavn) Testforløb beskrivelse Implementeret 4.D_1 Tabeltest, tabeller ikke opmærket i Der undersøges, om der findes tabeller i arkiveringsversionens tabelmapper, som ikke er opmærket i tableindex.xml tableindex.xml 4.D_2 Tabeltest, tabeller ikke til stede i Der undersøges, om der findes tabeller i arkiveringsversionen, som er opmærket i tableindex.xml, men arkiveringsversion som ikke findes i tabelmapper 4.D_3 Tabeltest, fortløbende nummerering Der undersøges, om tabellerne i tableindex.xml, er opmærket med mappenumre i en fortløbende af mapper ubrudt rækkefølge 4.D_4 Tabeltest, nummerering af mapper Der undersøges, om nummereringen af tabelmapper starter med table + 1 4.D_5 Tabeltest, fortløbende nummerering Der undersøges, om nummereringen af tabelmapper i Tables mapper i afleveringen, er fortløbende 18 07-04-2017

af mapper 4.D_6 Tabeltest, tom tabelmappe Der undersøges, om der findes tomme tabelmapper 4.D_7 Tabeltest, tabelfiler Der undersøges, om de xml filer der ligger i tabelmapperne, er navngivet med table + det aktuelle mappenummer efterfulgt af extension.xml 4.D_8 Tabeltest, parsning well formed Alle tabeller parses med det af ADA generede skema, og der kontrolleres for om den aktuelle tabel er well-formed 4.D_9 Tabeltest, parsning valid Alle tabeller parses med det af ADA generede skema, og der kontrolleres for om den aktuelle tabel er valid jf. de begrænsninger som fremgår af skemaet 4.D_10 Tabeltest, parsing namespace Alle tabeller testes for, om namespaces er opmærket i overensstemmelse med Rigsarkivets retningslinjer 4.D_11 Tabeltest, parsing datoer Hvis tabellens tilhørende skema angiver at et felt er et datofelt/timestamp, opgøres yderdatoer for det pågældende felt. 4.D_12 Tabeltest, foran og efterstillede Der testes for, om tabeldata har opmærket foran- og efterstillede blanktegn. blanktegn 4.D_13 Tabeltest, XML Prolog Der testes for, at tabellerne har opmærket en XML prolog. 4.D_14 Tabeltest, UTF8 deklaration Der testes for, om tabellerne indeholder angivelse af UTF-8 tegnsæt i XML prolog. Bemærkninger til test: 4.D_10. Denne test foretages for at sikre, at der ikke findes uvedkommende prefix i den enkelte xml instans. 4.D_11. Datoer bringes som oplysning til testere, for hvert felt i tabel, der indeholder en dato. Denne oplysning bruges til at vurdere om arkiveringsversionen indeholder data for hele perioden som angivet i afleveringsbestemmelse. 4.D_12. Se https://msdn.microsoft.com/query/dev14.query?appid=dev14idef1&l=en- US&k=k(System.Char.IsWhiteSpace);k(SolutionItemsProject);k(TargetFrameworkMoniker-.NETFramework,ersion%3Dv4.5);k(DevLang-csharp)&rd=true for definition af blanktegn. Kendte mangler: 4.D_6 Der testes ikke for tomme tabelmapper. 4.D_10 I tilfælde af uvedkommende prefix kan ADA ikke detektere dette og heller ikke indlæse tabeller. 4.D_12 ADA kommer ikke med en meddelelse, der er granuleret nok. Det er svært for brugeren at lokalisere de rækker, hvor der er foran- og efterstillede blanktegn. 19 07-04-2017

20 07-04-2017

Testområde 4.E (Mappen ContextDocumentation) 4.E.1 Mappen ContextDocumentation skal indeholde én eller flere dokumentsamlingsmapper med kontekstdokumentation, jf. 6.B. 4.E.2 En dokumentsamlingsmappe med kontekstdokumentation må indeholde op til 10.000 dokumentmapper. 4.E.3 Dokumentsamlingsmapperne navngives»doccollection[fortløbende nummer]«, begyndende med 1. Navnet skal være unikt inden for ContextDocumentation. 4.E.4 Hvert dokument i kontekstdokumentationen skal tildeles et ID på op til 12 cifre. Dokumentets ID skal være unikt inden for ContextDocumentation. 4.E.5 En dokumentmappe skal indeholde ét dokument, som består af én eller flere filer af samme format, og navngives med dokumentets ID. Foranstillede nuller må ikke anvendes. 4.E.6 Et dokuments fil (eller filer) navngives fortløbende med et nummer, begyndende med 1 samt formatets ekstension, jf. 4.G.8 Testformulering: Testnr. Testnavn (internt referencenavn) Testforløb beskrivelse Implementeret 4.E_1 ContextDocumentation test, uvedkommende objekter Der testes for, om der findes andre mapper eller filer i ContextDocumentationmappen, udover dokumentsamlingsmapper 4.E_2 ContextDocumentation, tomme dokument-samlingsmapper Der testes for, om der findes dokumentsamlingsmapper, der er tomme 4.E_3 ContextDocumentation, manglende dokumentsamlingsmapper Der testes for, at ContextDocumentationmappen indeholder mindst en dokumentsamlingsmappe 4.E_4 4.E_6 4.E_7 4.E_9 4.E_10 ContextDocumentation, dokumentsamlings-mapper forkert nummererede ContextDocumentation, manglende dokument ContextDocumentation, manglende opmærkning ContextDocumentation, filtyper ContextDocumentation, 10.000 filer Der testes for, om dokumentsamlingsmapper er korrekt fortløbende nummererede startende fra 1 Der testes for, at der er overensstemmelse mellem dokumenter opmærket i contextdocumentation.xml, og de dokumenter der findes i dokumentmapper i ContextDocumentation Der testes for, at der er overensstemmelse mellem dokumenter opmærket i contextdocumentation.xml og de dokumenter der findes i dokumentmapper i ContextDocumentation. Der testes for, at de dokumenter der findes i dokumentmapperne i ContextDocumentationmappen, er indeholdt i de filtyper, som er beskrevet i bek. 4.G.8. Der testes for, om nogen af dokumentsamlingsmapperne, indeholder mere end 10.000 dokumentmapper 21 07-04-2017

4.E_11 ContextDocumentation, samme filtype Der testes for, om nogen af dokumentmapperne indeholder forskellige filtyper 4.E_12 ContextDocumentation, unik navngivning Der testes for, om dokumentets ID (mappenavn) er unikt inden for contextdocumentation 4.E_13 ContextDocumentation, siderækkefølge filer Der testes for, om et dokuments filer siderækkefølge er navngivet fortløbende, startende fra 1. (extension) n.(extension) 4.E_14 ContextDocumentation, tomme dokumentmapper Der testes for, om der findes dokumentmapper, der er tomme 22 07-04-2017

Testområde 4.F (Mappen Schemas) 4.F.1 4.F.2 4.F.3 4.F.4 Mappen Schemas skal være opdelt i undermapperne standard og localshared. Mappen standard skal indeholde skemaer for arkiveringsversionens indeksfiler, jf. bilag 8, samt W3C standard XML-skema, jf. http://www.w3.org/2001/xmlschema.xsd. For skemaerne fileindex.xsd, archiveindex.xsd, contextdocumentationindex.xsd, tableindex.xsd, docindex.xsd samt W3Cs standard XML-skema gælder, at der altid skal anvendes de skemaer, som Rigsarkivet stiller til rådighed. Skemaerne og deres navngivning må ikke ændres i arkiveringsversionen. Mappen localshared skal indeholde eventuelle GML-skemaer, som ikke er placeret sammen med det pågældende GML-dokument, jf. 4.G.7.a. Testformulering: Testnr. Testnavn (internt referencenavn) Testforløb beskrivelse Implementeret 4.F_1 Skematest, mapper Der testes for, om skemamapper er til stede og er navngivet korrekt 4.F_2 Skematest, overflødige objekter Der testes for, om der findes uvedkommende objekter i mappen Schemas, samt de 2 undermapper 4.F_3 Skematest, archiveindex.xsd ikke intakt Der testes for, om archiveindex.xsd er intakt og identisk med det skema, som Rigsarkivet stiller til rådighed 4.F_4 Skematest, contextdocumentationindex.xsd Der testes for, om contextdocumentationindex.xsd er intakt og identisk med det skema, som ikke intakt Rigsarkivet stiller til rådighed 4.F_5 Skematest, tableindex.xsd ikke intakt Der testes for, om tableindex.xsd er intakt og identisk med det skema, som Rigsarkivet stiller til rådighed 4.F_6 Skematest, fileindex.xsd ikke intakt Der testes for, om fileindex.xsd er intakt og identisk med det skema, som Rigsarkivet stiller til rådighed 4.F_7 Skematest, docindex.xsd ikke intakt Der testes for, om docindex.xsd er intakt og identisk med det skema, som Rigsarkivet stiller til rådighed 4.F_8 Skematest, XMLSchema.xsd ikke intakt Der testes for, om XMLSchema.xsd er intakt og identisk med det skema, som Rigsarkivet stiller til rådighed Kendte mangler: 4.F_2 ADA finder ikke uvedkommende objekter i mappen Schemas, samt de 2 undermapper. Alle filer vil dog fanges ved fejl i fileindex.xml, så reelt er der kun tale om manglende tjek for mapper. 4.F ADAs skematest omkring intakte skemaer ligger under dokumentindextest. 23 07-04-2017

Testområde 4.G (Mappen Documents) 4.G.1 Mappen Documents skal indeholde én eller flere dokumentsamlingsmapper, dog maksimalt 10.000. 4.G.2 Dokumentsamlingsmapperne navngives»doccollection[fortløbende nummer]«, begyndende med 1. Navnet skal være unikt inden for Documents. 4.G.3 En dokumentsamlingsmappe må indeholde op til 10.000 dokumentmapper. 4.G.4 Hvert dokument skal i arkiveringsversionen tildeles et ID på op til 12 cifre. Dokumentets ID skal være unikt inden for Documents. 4.G.5 En dokumentmappe skal indeholde ét dokument, som består af én eller flere filer af samme format, og navngives med dokumentets ID. Foranstillede nuller må ikke anvendes. 4.G.6 Et dokuments fil (eller filer) navngives fortløbende med et nummer, begyndende med 1 samt formatets ekstension. Foranstillede nuller må ikke anvendes. 4.G.7 For GML-filer lagres det relevante skema i samme mappe som GML-filen, og navngives med fortløbende nummer efterfulgt af.xsd, jf. dog 4.G.7.a. Foranstillede nuller må ikke anvendes. 4.G.7.a GML-skemaer kan alternativt lagres i den skema-mappe, som navngives localshared, jf. 4.F. GMLskemaer i mappen localshared navngives»localschema[fortløbende nummer]«, begyndende med 1. 4.G.8.a Dokumenter i formatet TIFF skal have ekstension tif. 4.G.8.b Dokumenter i formatet MP3 skal have ekstension mp3. 4.G.8.c Dokumenter i formatet MPEG-2 og MPEG-4 skal have ekstension mpg. 4.G.8.d Dokumenter i formatet JPEG-2000 skal have ekstension jp2. 4.G.8.e Dokumenter i formatet GML skal have ekstension gml. 4.G.8.f Dokumenter i formatet WAE skal have ekstension wav. Testformulering: Testnr. Testnavn (internt referencenavn) Testforløb beskrivelse Implementeret 4.G_1 Documents, uvedkommende objekter Der testes for om der findes andre mapper eller filer i Documents, udover dokumentsamlingsmapper 4.G_2 Documents, tomme Der testes for, om der findes dokumentsamlingsmapper, der er tomme dokumentsamlingsmapper 4.G_3 Documents, manglende dokument- Der testes for, at Documents indeholder mindst en dokumentsamlingsmappe samlingsmapper 4.G_4 Documents, dokumentsamlingsmapper Der testes for, om dokumentsamlingsmapper er korrekt fortløbende nummererede startende fra 1 forkert nummererede 4.G_5 Documents, dokumentid Der testes for, at ID for et dokument kun består af cifre samt det over holder begrænsningen på højst 12 cifre 4.G_6 Documents, manglende dokument Der testes for, at der er overensstemmelse mellem dokumenter opmærket i docindex.xml, og de dokumenter der findes i dokumentmapper i Documents 24 07-04-2017

4.G_7 Documents, manglende opmærkning Der testes for, at der er overensstemmelse mellem dokumenter opmærket i docindex.xml og de dokumenter der findes i dokumentmapper i Documents 4.G_8 Documents, navngivning dokumenter Der testes for, at navngivning af dokumenter begynder med 1 efterfulgt af en gyldig extension jf. bek. 4.G.8, samt at der ikke er anvendt foranstillede nuller 4.G_9 Documents, Der testes for, at de dokumenter der findes i dokumentmapperne i Documentsmappen, er indeholdt filtyper i de filtyper, som er beskrevet i bek. 4.G.8. 4.G_11 Documents, 10.000 filer Der testes for om nogen af dokumentsamlingsmapperne, indeholder mere end 10.000 dokumentmapper 4.G_12 Documents, samme filtype Der testes for om nogen af dokumentmapperne indeholder forskellige filtyper 4.G_13 Documents, unikke Der testes for om dokumenternes ID er er unikke inden for Documents. 4.G_14 Documents, siderækkefølge filer Der testes for, om et dokuments filer siderækkefølge er navngivet fortløbende, startende fra 1. (extension) n.(extension) 25 07-04-2017

Testområde 5.A (Tabelindhold) 5.A.1.a I overensstemmelse med den tabelstruktur, der er defineret for hver tabel i hvert sit tilhørende XMLskema, navngivet»table[fortløbende nummer].xsd«, jf. 4.D, skal hver tabel findes i en XML-instans navngivet»table[fortløbende nummer].xml«. 5.A.1.b Den fortløbende nummerering begynder med 1. Foranstillede nuller må ikke anvendes. 5.A.2 Indholdet af de enkelte felter skal renses for eventuelle foran- og efterstillede blanktegn. Præciserende definition af kontrol af datatyper I testpunkterne under testområde 4.D parses de relevante xml tabelinstanser med de skemaer, som ADA fremstiller ud fra tableindex.xml. Udformningen af skemaer skal således tage højde for den oversættelse af SQL :1999 datatyper til W3C XML Schema Language 1.0, der er angivet i bekendtgørelsen figur 5.1 side 10. Der udføres således ingen øvrige test af datatyper end ovennævnte parsning af de enkelte xml tabelinstanser. Testområde 5.B (Datatyper) 5.B.1.a De standardiserede datatyper, som skal anvendes for tabelindhold, er angivet i figur 5.1. De er et uddrag af datatyper fra standarden SQL:1999 repræsenteret som datatyper i W3C XML Schema Language 1.0. 5.B.1.b Det er datatypen i W3C XML Schema Language 1.0, som skal anvendes. Oversættelsen fra datatyper i SQL:1999 er angivet for at vise, hvorledes oversættelsen til datatyper i W3C XML Schema Language 1.0 skal foretages. 5.B.2 Datatypen string må kun indeholde ikke-opmærket tekst, som umiddelbart kan fortolkes. 5.B.3 Datatypen boolean kan jf. W3C kun antage værdierne 1; 0 eller true; false. 5.B.4 Datatyperne date, time og datetime kan bruges med eller uden Time Zone. Præciserende definition af kontrol af datatyper I testpunkterne under testområde 4.D parses de relevante xml tabelinstanser med de skemaer, som ADA fremstiller ud fra tableindex.xml. Udformningen af skemaer skal således tage højde for den oversættelse af SQL :1999 datatyper til W3C XML Schema Language 1.0, der er angivet i bekendtgørelsen figur 5.1 side 10. Der udføres således ingen øvrige test af datatyper end ovennævnte parsning af de enkelte xml tabelinstanser. 26 07-04-2017

Testområde 5.D (Tekstformat) 5.D.1.a Data i arkiveringsversionens indeksfiler og tabelindhold skal være indkodet som well-formed UTF-8, som angivet i ISO/IEC 10646:2003 Annex D og som beskrevet i The Unicode Standard 5.1, kapitel 3. 5.D.1.b De indkodede karakterer skal være gyldige Unicode skalarværdier. Surrogater/RC-elementer og Unicode noncharacters må ikke anvendes. 5.D.1.c Ingen karakterer i Private Use Area må indkodes. 5.D.1.d Styrekodetegnene fra og med #x00 til og med #x1f er ikke tilladt med undtagelse af styrekodetegnene tabulator (TAB) #x09, nylinje (LF) #x0a og vognretur (CR) #x0d. 5.D.2.a I henhold til XML-standarden gælder de regler for angivelse af de pågældende tegn, som fremgår af figur 5.2. 5.D.2.b Tegnene fra og med #x7f til og med #x9f skal angives med deres decimale eller hexadecimale tegnreference. 5.D.2.c CDATA sektioner <![CDATA ]]> må ikke anvendes. Testformulering: Testnr. Testnavn (internt referencenavn) Testforløb beskrivelse Implementeret 5.D_1 Tekstformat, UTF8 Det testes for om xml tabelinstanser overholder kravet om UTF8 indkodning 5.D_2 Tekstformat, skalarværdier Der testes for, om xml tabelinstanser indeholder Surrogater/RC-elementer og Unicode noncharacters 5.D_3 Tekstformat, private use area Det testes for, om xml tabelinstanser har indkodet karakterer i private use area 5.D_4 Tekstformat, escaping Der tests for, om xml tabelinstanser overholder krav til escaping som fremgår af bek. Figur 5.2 5.D_5 Tekstformat, tegnreference Der testes for, om opmærkninger i xml tabelinstanser for #x7f til og med #x9f, er angivet med enten decimal eller hexværdi Kendte mangler: 5.D. ADA tester ikke for alle typer fejl i tekstformat. 27 07-04-2017