nyt iff Dataretention - langtidsopbevaring af elektronisk information Nr. 181 November 2010 Course in Process Validation Ph.D-forsvar Ph.

Relaterede dokumenter
I dag viljeg fortælle hvordan man opbevarer sine data i mere end 100 år.. Måske!

Engelsk. Niveau D. De Merkantile Erhvervsuddannelser September Casebaseret eksamen. og


Mission and Vision. ISPE Nordic PAT COP Marts Jesper Wagner, AN GROUP A/S, Mejeribakken 8, 3540 Lynge, Denmark

From innovation to market

Engelsk. Niveau C. De Merkantile Erhvervsuddannelser September Casebaseret eksamen. og

Velkommen til IFF QA erfa møde d. 15. marts Erfaringer med miljømonitorering og tolkning af nyt anneks 1.

Stage One Computing. Forfattet af Christian Stage 2010/06. Public information. Author Christian Stage Template None

PDF/A. PDF/A for AFP-Brugergruppen. den 11. maj 2011 Sørup Herregård

Hvor er mine runde hjørner?

Portal Registration. Check Junk Mail for activation . 1 Click the hyperlink to take you back to the portal to confirm your registration

DSB s egen rejse med ny DSB App. Rubathas Thirumathyam Principal Architect Mobile

extreme Programming Kunders og udvikleres menneskerettigheder

Basic statistics for experimental medical researchers

Design til digitale kommunikationsplatforme-f2013

Subject to terms and conditions. WEEK Type Price EUR WEEK Type Price EUR WEEK Type Price EUR WEEK Type Price EUR

Backup Applikation. Microsoft Dynamics C5 Version Sikkerhedskopiering

Leverandørdialog. R2 Group A/S. R2 Group A/S. Nøglen til at være REACH parat V. Jan Skov Nørby

GUIDE TIL BREVSKRIVNING

Vejledning til Teknisk opsætning

Eksempel på eksamensspørgsmål til caseeksamen

Trolling Master Bornholm 2016 Nyhedsbrev nr. 3

Project Step 7. Behavioral modeling of a dual ported register set. 1/8/ L11 Project Step 5 Copyright Joanne DeGroat, ECE, OSU 1

Torsdag 5. oktober 2017 Hal F DIGITALISERINGSKONFERENCE

Brug af OAIS til udarbejdelse af omkostningsmodel til digital bevaring. Anders Bo Nielsen, Rigsarkivet, Danmark Alex Thirifays, Rigsarkivet, Danmark

Danish Language Course for International University Students Copenhagen, 12 July 1 August Application form

United Nations Secretariat Procurement Division

BANGKOK FASE 2 - VALGFAG INFORMATION, VEJLEDNING OG DOKUMENTER

STUDIEOPHOLD I BANGKOK FASE 2 - INFORMATION, VEJLEDNING OG DOKUMENTER

Vejledning til det digitale eksamenssystem. Heilesen, Simon. Publication date: Document Version Peer-review version

EU GDPR Endnu en Guide

Totally Integrated Automation. Totally Integrated Automation sætter standarden for produktivitet.

BANGKOK FASE 2 -VALGFAG INFORMATION, VEJLEDNING OG DOKUMENTER

Den uddannede har viden om: Den uddannede kan:

SEPA Direct Debit. Mandat Vejledning Nets Lautrupbjerg 10 DK-2750 Ballerup

Vores mange brugere på musskema.dk er rigtig gode til at komme med kvalificerede ønsker og behov.

Behavior Driven Test and Development. ebay Classifieds

Revision af tekniske standarder i OIO-kataloget 2007

Nanna Flindt Kreiner lektor i retorik og engelsk Rysensteen Gymnasium. Indsigt i egen læring og formativ feedback

Sikkerhedsvejledning

Privat-, statslig- eller regional institution m.v. Andet Added Bekaempelsesudfoerende: string No Label: Bekæmpelsesudførende

DET KONGELIGE BIBLIOTEK NATIONALBIBLIOTEK OG KØBENHAVNS UNIVERSITETS- BIBLIOTEK. Index

how to save excel as pdf

Cross-Sectorial Collaboration between the Primary Sector, the Secondary Sector and the Research Communities

Side 1 af 9. SEPA Direct Debit Betalingsaftaler Vejledning

Kriterie for at bestå: Deltagelse i undervisningstiden, udarbejdelse af e-magasin, deltagelse i fælles fremlægning.

Titel: Hungry - Fedtbjerget

4. Oktober 2011 EWIS

PARALLELIZATION OF ATTILA SIMULATOR WITH OPENMP MIGUEL ÁNGEL MARTÍNEZ DEL AMOR MINIPROJECT OF TDT24 NTNU

VPN VEJLEDNING TIL MAC

Lovkrav vs. udvikling af sundhedsapps

Velkommen til webinar om Evaluatorrollen i Horizon Vi starter kl Test venligst lyden på din computer ved at køre Audio Setup Wizard.

Medinddragelse af patienter i forskningsprocessen. Hanne Konradsen Lektor, Karolinska Institutet Stockholm

CLARIN-DK Status. info.clarin.dk. Bente Maegaard. National Coordinator Vice Executive Director

Chengdu FASE 2 - VALGMODUL KINA INFORMATION, VEJLEDNING OG DOKUMENTER

WINDCHILL THE NEXT STEPS

Get Instant Access to ebook Udleveret PDF at Our Huge Library UDLEVERET PDF. ==> Download: UDLEVERET PDF

Danish Language Course for Foreign University Students Copenhagen, 13 July 2 August 2016 Advanced, medium and beginner s level.

ATEX direktivet. Vedligeholdelse af ATEX certifikater mv. Steen Christensen

Novo Nordisk erfaringer med ErhvervsPhD

IBM WebSphere Operational Decision Management

Trolling Master Bornholm 2016 Nyhedsbrev nr. 7

Spørgsmål og svar i forbindelse med udbud af Folketingets intranet, november 2017

Valg af Automationsplatform

Ekstraordinær Generalforsamling Vilvorde Kursuscenter 27. maj 2009

Notat om underleverandører af software til medicinsk udstyr Specielt med fokus på fortolkere, hvor nyt udstyr let kan genereres

BACK-END OG DATA: ADMINISTRATION HVAD ER DE NYE MULIGHEDER MED VERSION 7.1? STEFFEN BILLE RANNES, 4. FEBRUAR 2015

Forventer du at afslutte uddannelsen/har du afsluttet/ denne sommer?

KALK- OG TEGLVÆRKSFORENINGEN. CPR Sustainable Construction

Modtageklasser i Tønder Kommune

IBM Network Station Manager. esuite 1.5 / NSM Integration. IBM Network Computer Division. tdc - 02/08/99 lotusnsm.prz Page 1

Observation Processes:

Trolling Master Bornholm 2016 Nyhedsbrev nr. 8

PROGRAM Erfaring - Inspiration - Network - Idéer - Viden. HP Test Brugergruppe Brugerkonference. 11. november 2010

To the reader: Information regarding this document

Grøn Open Access i Praksis

Dokumentation af produktionsudstyr til fødevarer

Sådan laver du et godt Pitch

Sag: Ekspertudvalget om åbne standarder: Indstilling af 23. marts 2011.

Improving data services by creating a question database. Nanna Floor Clausen Danish Data Archives

Annual Product Review / Product Quality Review Fokus på Active Pharmaceutical Ingredients (API)

RFID teknologien 4 Privacy & Sikkerhed. Henrik B. Granau

DK - Quick Text Translation. HEYYER Net Promoter System Magento extension

Essential Skills for New Managers

Bekendtgørelse af aftale af 18. marts 2011 med Liechtenstein om Schengensamarbejdet

Vina Nguyen HSSP July 13, 2008

Admission criteria for the Danish Section For at blive optaget på Europaskolen skal du have aflagt Folkeskolens Adgangsprøve eller lignende.

Terese B. Thomsen 1.semester Formidling, projektarbejde og webdesign ITU DMD d. 02/

JEG GL DER MIG I DENNE TID PDF

Financial Literacy among 5-7 years old children

Nyhedsbrev 15 Februar 2008

Demensdagene 7. maj Nis Peter Nissen Alzheimerforeningen

Bilag. Resume. Side 1 af 12

Health surveys. Supervision (much more) from the patients perspective. Charlotte Hjort Head of dep., MD, ph.d., MPG

Vind Seminar Fredericia 4. april 2013 JOB2SEA

INTEL INTRODUCTION TO TEACHING AND LEARNING AARHUS UNIVERSITET

Transformering af OIOXML til OIOUBL og OIOUBL til OIOXML

Shared space - mellem vision og realitet. - Lyngby Idrætsby som case

INGEN HASTVÆRK! NO RUSH!

Trin-for-trin: Sådan indsendes en ansøgning til CISU online

Transkript:

Nr. 181 November 2010 iff nyt IndustriFarmaceutForeningen (IFF) er en interesseorganisation for den farmaceutiske industri, hvor medlemmerne kan holde det faglige og sociale netværk ved lige. Dataretention - langtidsopbevaring af elektronisk information Course in Process Validation The course will take place the 1.2.2011 and the 2.2.2011. The course will provide a detailed review of current and draft regulations and guidance regarding a lifecycle approach to process validation. Læs side 8 Ph.D-forsvar Studies of Anorectic -Acylethanolamines in Rats. The defence takes place Monday the 20th of December at 10.00 in the Benzon Auditorium. Ph.D-forsvar Læs side 9 New Discoveries in Isotopic Labelling of Organic Molecules Flow Chemistry A Useful Technique in Organic Synthesis. The PH.D-Defence will take place on Thursday the 9th of Dec. at 14.00 in the Auditorium 3. Læs side 9 Kravene til langtidsopbevaring af data strammes konstant. Derfor er det interessantat se på myndighedernes krav og forventninger, samt de problematikker, det indbefatter at langtidsopbevare elektronisk information. Af Christian Stage Reglerne, der oprindeligt er designet til at omfatte papirbaseret dokumentation, gælder også for elektronisk dokumentation. Holdbarheden af papirbaseret dokumentation er relativt godt kendt, og selvom man igennem tiderne har skiftet teknologi (f.eks. håndskreven kontra maskinskreven, krøllede Gotiske bogstaver modsat de nymodens Latinske etc.) ved man at papirbaseret dokumentation kan opbevares i mere end 100 år. Jyske lov fra 1241 er et glimrende eksempel på, at juridisk gældende skrifter kan holde endog særdeles lang tid uden at henfalde i et omfang, der gør dem ulæselige. Den elektroniske dokumentation har, ud over en stor mængde fordele, desværre også en ulempe, når det kommer til opbevaring. For at kunne læse en given mængde elektroniske bits skal man både kende formatet og have noget, der kan præsentere det givne format for læseren i det FDA (FDA er de amerikanske sundhedsmyndigheder Food and Drug Administration), så smukt formulerer som fortsættes næste side...

IndustriFarmaceutForeningen Fruebjergvej 3, Postboks 87 DK-2100 København Ø Tlf: 7020 7034 Mail: iff@iff.nu Web: www.iff.nu Bestyrelsen Formand: Marianne Schwarz, marianne.schwarz@sandoz.com Næstformand: Schiønning Brønnum Bruun, sbb@alectia.com Kasserer: Jacob Ekstrøm, jacob.ekstroem@leo-pharma.com Bestyrelsesmedlemmer: Gitte Hassan, gitte.hassan@leo-pharma.com Tina Kjøller, tkj@regulatoryplus.dk Suppleanter: Lone Rahbek, lora@lundbeck.com Inger Drengsgaard, idre@aqmmaxval.com EIPG Michiel Ringkjøbing Elema, mel@lundbeck. com Styregrupperne MIKROBIOLOGI Ditte Hougaard, dthu@novonordisk.com Tina Albæk Lorentsen, tina.lorentsen@leo-pharma.com Nina Pringler, tidsler.com@gmail.com QUALITY MANAGEMENT (QM) Brian S. Jensen, bgj@genmab.com Grethe Elmholdt, dkgle@dk.chr-hansen.com Conni Hornuff, connie.hornuff@axellia.com Schiønning Brønnum Bruun, sbb@alectia.com Johan Nielsen, johan.nielsen@ axellia.dk SENIORGRUPPEN Jørgen Jensen, 3967 6012, j.j@private.dk Günther Fedders, 4587 9703 IFF-nyt Bestyrelsen er ansvarshavende redaktion. Indlæg sendes til sekretariatet. Artikler i bladet udtrykker ikke nødvendigvis foreningens mening. DEADLINE 10. januar 2011 14. februar 2011 human readable format. Det betyder i praksis, at det ikke er så ligetil endda at opfylde dette krav. Især i en verden, hvor visse produkter kan have så lang levetid, at kravene til dataopbevaring (og genlæselighed) nærmer sig de 100 år (f.eks. Medical Devices, der indopereres i kroppen hos børn, og skal forblive der til de dør). Nogle vil allerede nu have fundet ud af, at det, at opbevare elektroniske data og kunne genlæse dem efter blot få år kan have sine udfordringer. Jeg vil derfor først forsøge at skitsere nogle af de problematikker, der er i forbindelse med elektronisk dataopbevaring. Opdeling af grundproblemet Basalt set kan man opdele dataopbevaring i 2 forskellige kategorier: Det, at genlæse et bitmønster efter lang tid, og det, at kunne fortolke bitmønsteret så det giver samme mening for et menneske, som det gjorde oprindeligt. Når man flytter disse elementer ind i en medicinalproducerende virksomhed, bliver problemstillingen en anelse mere kompleks, fordi der indgår lidt flere ingredienser/ elementer. Dataopbevaringens grundelementer: Identifikation af data, der skal gemmes Valg og brug af dataformater Opbevaring af elektroniske data, så de kan genfindes i dokumenterbart identisk samme bitmønster efter >100 år. Lokalisering og identifikation af de korrekte data Genlæsning af data på en måde, så mennesker kan forstå dem Genskabelse af andre data ud fra de gemte data Opdatering af data til nye formater Identifikation af hvilke data, der stadig er under retention Fjernelse af data ved retentionsperiodens udløb Planlægning af datas livscyklus Validering af data og dataformater Alle disse elementer indgår i de skabte datas livscyklus og bør være taget under overvejelse allerede på det tidspunkt, data opstår. Dette er et myndighedskrav i flere af de forskellige regulatoriske regelsæt. Identifikation af data, der skal gemmes Den første opgave er at identificere hvilke data, der skal opbevares som følge af myndighedernes krav, og hvilke data der kan være praktisk anvendelige i anden henseende, og sidst men ikke mindst, hvilke data vi blot opbevarer for hyggens skyld. Her, kære læser, vil der for manges vedkommende ligge en overraskelse begravet! Hvis man kigger strengt regulatorisk på det, er det nødvendigt at gemme de informationer, der er en del af produktet dvs. den information man har fået godkendt som gældende sammen med godkendelsen af produktet hos myndighederne samt produktionsdata, der stammer fra produktionen af produktet. Her er oftest tale om batchrapporter, analysedata samt den dokumentation, der er fremkommet ved udvikling og test af produktet, og derefter godkendt ved underskrift. Det er dette og intet andet der skal gemmes. Man kan også vælge en anden strategi, der går ud på at gemme de rådata, der ligger til grund for det godkendte materiale (f.eks. data logget fra computersystemer og transmittere under produktionen), og derudover gemme metoden til at genskabe de regulatoriske data. Denne metode indebærer en del udfordringer, og det er tvivlsomt om det kan godkendes af myndighederne med mindre den følges af skrevne procedurer og en hob af dokumenteret trænede folk. Om end denne mængde af information kan føles fortvivlende stor, vil man ved nærmere analyse finde ud af at disse data udgør ganske få procent af den information, der faktisk er tilgængelig, hvilket igen betyder at der rent regulatorisk kun er behov for opbevaring af en lille del af alle data. Set ud fra et krone og øre-perspektiv er det således en god idé at overveje, om det er 50 små pdf filer man ønsker at gemme eller gigabyte efter gigabyte af produktionsdata. Dataformater Ud over opbevaring af gamle data er det 2

vigtigt at vurdere nytten af de gamle data som historisk basisinformation til brug ved statistiske analyser (man kalder dette fænomen for datamining, fordi man kan grave guld frem af gamle data). Ofte vil gamle data have en væsentligt højere værdi, hvis de er gemt i et dataformat, der kan genbruges til søgning, analyse. Men hvilke dataformater er godkendt, og hvilke er fornuftige? Basalt set kan man opdele dataopbevaring i 2 forskellige kategorier: Det, at genlæse et bitmønster efter lang tid, og det, at kunne fortolke bitmønsteret så det giver samme mening for et menneske, som det gjorde oprindeligt..pdf Hvis vi starter med at kigge på, hvad myndighederne accepterer, så er.pdf formatet en af de anerkendte formater inden for medicinalproduktion. FDA peger f.eks. på.pdf som et gyldigt format til at indsende dokumentation til myndighederne, fordi det er human readable og det ikke er muligt at rette i indholdet (dette er i særdeleshed en sandhed med modifikationer, og man skal være opmærksom på at myndighederne senere muligvis vil kræve brug af låste/ certificerede og beskyttede.pdf formater). Hvis man vælger et statisk dataformat er.pdf ganske udmærket, men det har netop en ulempe i form af at være statisk. Det betyder i praksis at de data, der findes i dokumentet ikke kan benyttes som data, men kun findes som læsbar information, når denne betragtes med en viewer eller printes til papir. Det betyder at den gemte information kun med stor manuel arbejdsindsats kan genbruges senere. Adobes langtidsholdbarhed kendes naturligvis ikke eksakt, og i den relativt korte periode vi har benyttet computere, har få dataformater vist sig at være langtidsholdbare. Ligesom alle andre dataformater udvikler.pdf sig naturligvis også. I dag er.pdf formatet opdateret til den 7. generation, og selvom Adobes browsere endnu er bagudkompatible til det oprindelige dataformat, er der ingen garanti for at dette fortsætter udi al evighed. Endnu en hage ved pdf er, at hvis filen er korrumperet, vil alle data forsvinde. Det vil ikke være muligt at genskabe dele af data uden en stor manuel indsats. Bemærk i øvrigt at pdf formatet ikke p.t. accepteres af statens arkiver, fordi selve validerbarheden af data ikke er tilstrækkelig høj (der findes en mængde artikler omkring dette på statens arkiver, som også er yderst behjælpelige, hvis man kontakter dem). Tekstbehandling og regneark En anden mulighed er tekstbehandlingsformater og regnearksformater, der har den fordel at være en slags rådataformat med mulighed for senere behandling eller brug af informationen. Det kan netop af hensyn til genanvendelighed være fristende at gemme informationen i et kontorformat. Der er dog ulemper forbundet med kontorformater. For det første gennemgår kontorprogrammer en konstant udvikling, og selvom der findes muligheder for at åbne gamle formater, er denne mulighed ofte tidsbegrænset, eller kan ved genåbning af gamle filformater påvirke indholdet ved at konvertere en del af informationen. Endnu værre går det, hvis det er et regneark med behandlede data. Mange er f.eks. ikke er klar over at Excels kodesprog er installationssprogsafhængigt, hvilket betyder at det ikke er muligt at afvikle en Engelsk makro på en Dansk Excel! Moderne kontorformater kan relativt let beskyttes og låses, men der findes utallige metoder til at låse dem op, og de er blot 5 minutters Googlen væk. Sikkerhed? Tekstformat Det gammelkendte ASCII tekstformat er en klassiker. Det er et af de få dataformater, der har været med fra starten (defineret i 1963, revideret i 1967 og senest i 1986) og stadig kan læses. Det kan benyttes til struktureret information vha. så kaldt kommaseparering, således at data derved kan genbruges til analyse og historik. Tekstformatets umiddelbare ulempe er, at det på ingen måde er beskyttet. Det er således altid muligt at ændre data, og der er ikke indbygget automatiske audit trails eller andre indikatorer på at data er ændret, hvilket gør kontrol, låsning og dokumentation af datas originalitet til en del af dataretentionsproblematikken for denne type data. Det er endvidere ikke muligt at indbygge metadata (metadata er data om data f.eks. information om forfatter, ændringer og versioner) i tekstformaterede data, med mindre dette fremgår som en del af den læsbare tekst. En lille ekstra fordel ved tekstformatet er at den næsten altid kan genskabes. Typisk vil datafejl i en fil ikke påvirke alle data i filen (på en harddisk disk vil det f.eks. typisk være en enkelt defekt sektor - ikke alle på en gang), og alle de data, der ikke er indeholdt i den påvirkede defekte del af filen, kan ofte genskabes i det oprindelige brugbare format. Databaseformat Database er ikke et egentligt format, men en teknologi hvori data opbevares. Den primære del af disse data kan betragtes som slet og ret information, dog med den fordel at det er styret og beskyttet af databasens struktur. Den fælles måde at tilgå data i en database er via programmeringssproget SQL (Structured Query Language). Indholdet kan således udgøre både tekstdokumenter, beregninger, tal, tekst, tabeller, billeder, film, lyd og meget andet. På denne måde kombinerer en database typisk mange formater. Typisk vil der ovenpå databasen være et program, brugeren kan benytte til at kombinere information til sine databaseforespørgsler. Programmet er i dag ofte grafisk og leverer fortsættes næste side... 3

et brugerinterface, der kan tolke data på en for mennesker let tilgængelig måde. Billedfiler/grafiskeog lydfils formater En del information er af anden karakter end tal og bogstaver, der kan læses eller udnyttes til matematisk analyse. Dette kan være tekniske tegninger, billedinformation eller endda levende billeder og lyd. Det første man skal være opmærksom på med disse typer af data er, at mange af de filformater man i dag benytter giver kvalitetstab på den ene eller anden måde. Selvom kvalitetstabet ofte er konfigurerbart skal man have taget stilling til om tabet er acceptabelt i forhold til det format data stammer fra. Statens arkiver benytter (kvalitetstabsgivende) mp3 format til langtidsopbevaring af lyd. Til billedinforma-tion accepterer man ud over tif formatet (der ikke er tabsgivende), også jpeg-2000 format (tabsgivende) til langtidsopbevaring af billedinformation. Proprietære formater Proprietære formater er låste dataformater baseret på information (records eller strukturer) helt eller delvis uden kendt format. Det er naturligvis altid muligt at hacke formatet for at finde ud af, hvordan data er strikket sammen, men det kræver en stor arbejdsindsats og specialuddannede folk. Alternativt er man 100 % underlagt leverandørens velvilje til at genlæse data. Til sammenligning med alle de ovennævnte formater er det ikke en god idé at skabe og gemme information i proprietære dataformater! Bemærk at systemer, der gemmer data i en database, uden at man har en beskrivelse af datastrukturen, og således ikke kan udrede data fra databasen uden den originale applikation til at hente data med, også kan betragtes som et proprietært format. Generelt om filformater Nogle gange gør markedskræfter eller nye teknologier at gamle formater eller teknologi i løbet af ultra kort tid udryddes tænk f.eks. tilbage på kassettebånd eller VHS, der begge i dag stort set ikke findes i Man skal under alle omstændigheder planlægge forud, og sikre sig at man ved, hvilke data, der har behov for at blive opgraderet eller skal konverteres til nye dataformater undervejs. hjemmet længere og således må betragtes som udgåede formater. Man skal under alle omstændigheder planlægge forud, og sikre sig at man ved, hvilke data, der har behov for at blive opgraderet eller skal konverteres til nye dataformater undervejs. Opbevaring af data En anden vigtig parameter er, hvor og hvordan data skal opbevares. Selve spørgsmålet om under hvilke forhold man opbevarer data er todelt, nemlig den myndighedsbestemte del og den datatekniske del. Myndighederne kræver at data opbevares under sikre forhold, således at der ikke er uautoriseret adgang til dem, og rådata ikke degenererer over tid. Rent datateknisk kræver langtidsopbevaring af data typisk konstant luftfugtighed og temperatur netop for at undgå datatab. Opbevarer man sine data på f.eks. bånd eller CD skal man være opmærksom på at disse henfalder over tid, uanset hvor grundig man har været med at opbevare dem. En hjemmebrændt CD s officielle henfaldstid er typisk under 10 år! Myndighedernes krav betyder, at der skal være adgangskontrol og logbøger/ audit trail for adgang til langtidsgemte data. Hvis de genopfriskes f.eks. ved kopiering fra en gammel CD til en ny, har myndighederne desuden en klar forventning om at genopfriskningsprocessen er beskrevet i en procedure samt at det kontrolleres at data er de samme før og efter. Der skal desuden tages stilling til, hvordan de gamle medier bortfjernes på sikker vis. Hvem skal opbevare data? Hvem skal opbevare data? Heri ligger et spørgsmål om tilgængelighed. Hvis man skal have readily available adgang til data SKAL de ligge hos en selv. Det er fint at en underleverandør, som en del af en servicekontrakt, tilbyder at opbevare data, og dette er fuldt ud tilladt af myndighederne. Men hvad sker der, hvis underleverandøren har en anden retentionsperiode end en selv eller ændrer på de procedurer, der sikrer langtidsopbevaring af data? En anden risiko er, at underleverandøren fusionerer eller forsvinder. Denne risiko findes konstant, og i princippet kan det betyde at ens dokumentation pludselig skifter ejermand, og derfor ikke længere er under ens egen kontrol. Lokalisering og identifikation af de korrekte data Over tid vil man typisk opnå at opbevare en ganske betragtelig mængde af data. Langt hen ad vejen vil almindelige gode datastrukturer gøre det muligt at identificere de korrekte data, men når man opnår store datamængder, og hvis det ikke er de samme folk, der skal finde data som dem, der har lavet data, er det nødvendigt at tilknytte metadata til de oprindelige data. Metadata (data om data) er blandt andet den information, der gør de oprindelige data søgbare. Hvis det er dokumentbaseret information kræver det, at dokumenterne opbevares i en styret struktur, f.eks. et dokumentstyringssystem eller lignende. For data, der opbevares som data f.eks. i en database, er metadata den ekstra information, der enten opbevares i databasen, eller udgøres af bl.a. datafiltre SQL querries, der benyttes til at fremskaffe og identificere den korrekte information. Genlæsning af data Genindlæsning af gamle data er ofte et større problem end det lyder. Næsten 100 4

% har kontrolleret proceduren for backup, men mindre end 10 % har kontrolleret proceduren for restore. I praksis betyder det, at der findes mange backupbånd uden indhold, fordi en restore test aldrig har eftervist, at der er data på backupmedierne. En anden lille sag er de mekaniske komponenter, herunder f.eks. båndstationen og det computersystem, den er tilsluttet. De skal have samme retentionsperiode, som de bånd man opbevarer. Det går normalt også godt de første år, men det er nødvendigt at have en procedure for kontrol/test (opstart) og vedligehold af det gamle computerudstyr. Ofte er læse/skrive enhederne til gamle medier følsomme over for lang tids hengemsel, og det kan desuden være svært at genlæse et medie, der er skrevet på en anden skriveenhed. Bemærk at mange medietyper udgår helt prøv f.eks. at genlæse en gammel diskette! Ud over at man skal kunne læse bittene fra mediet, er det vigtigt, at man kan tolke indholdet. Det betyder, at hvis man har gemt data i f.eks. Interactive Unix version 4 filformater, skal man typisk have et Interactive Unix version 4 operativsystem til at genindlæse data. Hvis det format man har gemt data i ikke eksisterer i virksomheden længere, skal man kunne sende det over til et nyere system, der kender det gamle format, og sikre sig at der er en validering eller en valideret metode for overførslen. Hvis data kun er gemt i de mest basale ASCII tekstformater, vil det typisk være nødvendigt også at have en kørende instans af den applikation, der gemte data. Først herefter vil det være muligt at flytte data fra det gamle system over til et andet sted, hvor data så kan bruges. Genskabelse af afledte data Ofte har rådata været benyttet som basis for datamanipulation til at skabe afledte data. Det kan være, at man laver en gennemsnitsberegning på en udvalgt mængde af data eller at man lægger nogle data sammen og dividerer med et tal for at få en procentsats, som man sammenligner med nogle andre data. Hvis disse afledte data indgår som en del af den information, man er forpligtet til at opbevare, er det essentielt, at man også sørger for at have metode og værktøjer parate til at genskabe disse data. Hvis man ikke har det, er ens data værdiløse. Igen skal man være opmærksom på, at det system man bruger til at generere data ikke vil kunne anvendes i al evig fremtid. Man skal således jævnligt vurdere, om man kan behandle data og anvende de gamle systemer, og samtidig skal man tage stilling til, hvordan man sikrer, at man også i fremtiden kan behandle disse data for at genskabe de afledte data. Denne problematik er man ude over ved at gemme data i et låst og ikke aktivt format, men det giver ikke mulighed for let adgang til senere datamining (analytisk gennemgang af data). Opdatering til nye formater En af de påtvungne opgaver i forbindelse med dataretention er at sikre, at der periodisk tages stilling til dataformaternes holdbarhed og aktuelle teknologiske status. Et eksempel er, at hvis man gemmer data i pdf-format er det muligt at opgradere formatet uden at påvirke indholdet (det som brugeren ser altså data vil under alle omstændigheder være ændret). Denne opgave er noget man bør planlægge at tage stilling til med jævne mellemrum, f.eks. en gang årligt. Ved vurderingen af eksisterende dataformaters gyldighed skal man tage stilling til om d a t a f o r m a t e t, s a m t v e r s i o n e n a f dataformatet, stadig understøttes, og om man har tiltro til at dataformatet holder til næste planlagte teknologivurdering. Planlægningen af hvornår og hvor ofte teknologivurderingen skal udføres bør fremgå af virksomhedens valideringsplan, og det skal kunne dokumenteres, at man har foretaget teknologivurderingen (f.eks. via logbog eller anden dokumentation). En del af de opdateringer man kommer til at foretage over en periode på 100 år eller derover vil være til helt andre teknologier. Det vil sige, at man i stedet for at opgradere fra version 1 til version 2 så skal skifte teknologisk platform. Identifikation af data der er under retention Principielt er det nødvendigt at kunne udspecificere, hvilke data, der er omfattet af dataretention, og hvilke, der blot er nice to have. Med mindre man laver denne definition af vigtige og uvæsentlige data (i relation til GxP) vil det være alle data, der er GxP og derved kan blive gjort til skue for en inspektion. Netop derfor er det vigtigt at kunne identificere, hvilke data der er under retention. Her kommer den valgte teknologi ind som en yderst vigtig parameter. En pdf-fil er enten noget man gemmer eller noget man ikke gemmer, hvorimod en database typisk indeholder en skønsom blanding af data, der er under retention og data, der ikke er under retention. I databasen kan det endvidere være meget kompliceret at fravælge visse data, fordi de typisk er afhængige af andre data i databasen. Et smart trick er, at man fra starten fravælger en del af dokumentationen som ikke GxP-relevant. Hvis er data fra FAT test eller logning af temperaturen på gangarealer ikke er GxP, er det data der fra starten kan/bør fravælges. Fjernelse ved retentionsperiodens udløb Som ISPE s GAMP5 så smukt formulerer det, er der mange alvorlige og komplekse overvejelser, der skal gøres i forbindelse med at fjerne data efter retentionsperiodens udløb. En af udfordringerne her er, at det ikke altid er muligt at adskille data tydeligt ét er, hvis der er tale om dokumentformatteret information, noget helt andet er, hvis informationen er databaseret. Hvis ikke data ved registreringen markeres som hhv. GxP eller Non-GxP vil det i praksis være umuligt at adskille data. Data er ofte er afhængige af hinanden, og GxP-information under retention ikke giver mening uden den Non-GxP information der også findes. Ydermere kan det være fordelagtigt senere at kunne forske i gamle data. Det kan være at bivirkninger af et produkt først opstår efter mange års brug af produktet, eller at bivirkninger ikke er umiddelbart synlige/indlysende efter kort tid. Med fortsættes næste side... 5

et solidt datagrundlag kan man undgå at historien gentager sig, fordi man kan analysere, hvad der skete. De mekanismer, der førte til hændelsen kan i fremtiden identificeres og undgås. Te k n o l o g i s k s k e r d e r k o n s t a n t fremskridt. Det betyder i praksis, at vi hurtigere får mulighed for at opbevare større datamængder end vi kan generere. Den indlysende konklusion er, at man opbevarer alle data, fordi de har en potentiel værdi engang i fremtiden. Ulempen er naturligvis, at man så skal sikre at man kan læse og forstå de data, der er gemt. Valideringsaspekter Eftersom vi i denne artikel specielt tager udgangspunkt i medicinalproduktion, er der naturligvis valideringsaspektet for data, metadata, opbevaring af data, dekommisionering af data og system o.s.v.. Den kontinuerte validering af opbevarede data og de metoder, der benyttes til at vedligeholde data udgør nok den største hurdle for opgaven at langtidsopbevare data. Hovedpunkterne, for at være i compliance, er at man fra starten lægger en plan som man slavisk følger hele vejen igennem. Gentagende revidering af planen er nødvendig, når tidshorisonten er så lang som den vi behandler i dette skrift. Det er endvidere nødvendigt kontinuert at evaluere eksisterende teknologisk niveau, samt nye teknologier. Dokumentation for det aktuelle stade skal kontinuert opdateres efterhånden som nye teknologier benyttes, og der skal konstant være et trænet beredskab af folk, der kan betjene nye hhv. gamle teknologier, der findes i virksomheden. Ved overførsel fra en teknologi til en anden er man nødsaget til at validere korrektheden af overførslen, samt dataformatet som data er overført i. Ved bibeholdelse af eksisterende teknologi er det nødvendigt kontinuert at opretholde det validerede stade, ved at sikre træning (gentræning af gamle folk og nytræning, når gamle folk forsvinder), samt at data stadig er brugbare. Ved opbevaring af store datamængder vil det være klogt at benytte statistik, stikprøvekontrol og risikoanalyser som værktøjer til at minimere indsatsen. Hvis en leverandør af et bånddatamedie selv angiver f.eks. > 50 års opbevaringstid og man har 10.000 bånd eller mere, vil det måske være klogt ved genopfriskning af dataindholdet efter 50 år også at monitorere, hvor meget ens bit er forvitret i den forløbne periode, således at man kan vurdere om genopfriskning faktisk er nødvendigt (forudsat naturligvis at man har en teknologisk alarmgrænse for degeneration af information). Ud over at dataopbevaring over en langvarig tidsperiode må forventes at være endog meget bekosteligt, må man forvente at den billigste måde, er at lægge en strategi og en plan fra starten, og følge den så slavisk, som det er muligt. Krav til retentionsperioder - Eksempler Der er naturligvis forskellige krav til, hvor længe man skal opbevare data. Her kan man finde et par eksempler, men det skal understreges at det er nødvendigt at vurdere ud fra de regulativer man er underlagt. (Se skema på modstående side) Henvisninger Det Kongelige Bibliotek er en af de institutioner, der på et professionelt plan kigger på samme problemstillinger. Ud over at være rigtigt flinke er dataopbevaring i >100 år, et emne de forsker intensivt i. Et andet godt sted at søge information er inden for rumfart, hvor man ligeledes ønsker at kunne opbevare data i lang tid. Der findes en komite, der hedder Consultative Committee for Space Data Systems [CCSDS], der har udarbejdet en referencemodel for et åbent arkivsystem for langtidslagring af data (OAIS). Det skal dog lige nævnes at CCSDS går relativt akademisk til sagen. Opsummering/Konklusion Det er en spændende tid vi lever i. Dataformater er ved at modnes, og databranchen som helhed er begyndt at betragte livscyklus for information, bl.a. fordi datamining er begyndt at vise som vor tids guldgrube. Det betyder, at man kigger på data som noget, der er mere blivende end man gjorde tidligere. Samtidig er online dataopbevaringsmedier (f.eks. harddiske) ved at nå størrelser og priser, der gør det mindre vigtigt at slette information end det var tidligere. Man har simpelthen råd til at opbevare data direkte tilgængeligt. Konklusionen er derfor egentlig ret simpel, og kan sammenfattes med disse få huskeregler for langtidsopbevaring af data : Der skal være en skriftlig plan for langtidsopbevaring af information. Data skal gemmes online. Data uden for retentionsperioden kan senere have stor analytisk værdi og bør også gemmes online. Benyttede dataformater skal være kendt, veldefinerede, standardiserede og åbne. Datastrukturen skal være logisk, helst således at det er muligt at genfinde data uden adgang til metadata. Data, der ikke er tekst, bør opbevares i databaser, og databaserne skal holdes opdateret over tid via opgradering og hvor/ når nødvendigt - datamigrering. Selvom reglerne er lette, kan de være svære at implementere i virkeligheden. Hvis man sidder med opgaven, kan vi kun anbefale at man angriber den metodisk fra en ende af, og løser problemerne hen ad vejen. Husk aldrig at være for overoptimistisk med hensyn til kontrolintervaller, men tænk samtidig på at det er en tidskrævende opgave, der skal løses. Skrækeksemplet er fra en medicinalproducerende virksomhed, hvor proceduren for genopfriskning af databånd krævede næsten det dobbelte antal ansatte i vedligeholdelsesafdelingen. Jeg kan varmt anbefale den plan som AGIT [5] har lavet afsnit 7.3 i deres dokument om arkivering af rådata : Der skal være procedurer for kopiering af data konvertering af data til andre formater migrering af data til nyere teknologier retrieval sletning af data 6

Hvis software systemer ændres, nedlægges eller erstattes af andre systemer, skal der være en beskrevet metode til risikovurdering og behandling ad de deraf følgende ændringersager. På 21CFRPart11.com har de følgende Q&A vedrørende samme problematik, der ligeledes opsummerer vores konklusion for denne artikel: How can you make sure that e-records are still readable throughout the retention period (with focus on the formats)? Currently mostly proprietary formats are in use (e.g. in the lab area) and the possibility to read these formats in a few years is difficult (especially if the vendor is changed). Printing or converting into PDF or similar is only a partly solution. What would/could be a long-term solution here? There are several possible solutions being considered for long-term data reprocessability. They include data migration, data emulation and system Time Capsules. As of today, there are no set standards, or widely accepted procedures to ensure longterm data viability. Regulativ FDA 21 CFR Part 820 180(b) Version 2004.03.10 FDA 21 CFR Part 211 170 Version 1978.09.29 Krav Record retention period. All records required by this part shall be retained for a period of time equivalent to the design and expected life of the device, but in no case less than 2 years from the date of release for commercial distribution by the manufacturer. Tolkning (på den sikre side) Mindst indtil produktet ikke benyttes længere + minimum 2 år Eksempler Hvis produktet er en pacemaker hvis batteri udløber efter 5 år, vil det typisk være 7 år. Hvis produktet er kunstige bryster der teoretisk kan blive indopereret i 10 års alderen og kan blive i kroppen indtil patienten dør i 115 års alderen vil retentionsperioden være 107 år. (1) For an active ingredient in a drug product other than those described in paragraphs (a) (2) and (3) of this section, the reserve sample shall be retained for 1 year after the expiration date of the last lot of the drug product containing the active ingredient. (2) For an active ingredient in a radioactive drug product, except for nonradioactive reagent kits, the reserve sample shall be retained for: (i) Three months after the expiration date of the last lot of the drug product containing the active ingredient if the expiration dating period of the drug product is 30 days or less; or (ii) Six months after the expiration date of the last lot of the drug product containing the active ingredient if the expiration dating period of the drug product is more than 30 days. (3) For an active ingredient in an OTC drug product that is exempt from bearing an expiration date under 211.137, the reserve sample shall be retained for 3 years after distribution of the last lot of the drug product containing the active ingredient. Tolkning (på den sikre side) Mindst 3 år efter salget af det sidste produkt lot eller 6 måneder efter sidste udløbsdato. 7

Ordliste UTF-8 UTF-8 (8-bit UCS/Unicode Transformation Format) er variabel længde kodede karakterformat for Unicode. Man kan med UTF-8 repræsentere enhver karakter i Unicode standarden, men er alligevel bagudkompatibel med ASCII OAIS Et Åbent Arkiv Informations System (Open Archival Information System eller OAIS) er et arkiv der består af mennesker og systemer der har accepteret ansvaret for at gemme information og stille informationen til rådighed for udvalgte brugere. Unicode Unicode standarden (ISO/IEC 10646) er en kodning af data der unikt identificerer karakterer, uafhængigt af sprog, region eller kodevalg. mp3 MPEG-1 Audio Layer 3, der også omtales som MP3, er et patenteret kodeformat fra 1987 for digital lyd, der benytter en tabsgivende kompressionsalgoritme der kan komprimere data med op til 1:12. tif Tagged Image File Format (forkortet TIFF) er et kodeformat for billedinformation, der benytter en ikke tabsgivende kompressionsalgoritme. Fylder meget. Ejes/styres siden 2009 af Adobe Systems. jpeg-2000 JPEG 2000 er et kodeformat for billedinformation, der benytter en lettere tabsgivende kompressionsalgoritme. Udviklet af Joint Photographic Experts Group committee i 2000 med det formål at erstatte det oprindelige JPEG format fra 1992. Reference 1. Ny site dedikeret digital opbevaring. Site åbner 10/2010 www.digitalbevaring.dk 2. Det Kongelige Bibliotek, digital bevaring www.kb.dk/da/kb/nb/db/index.html 3. Dansk Data Arkiv www.dda.dk 4. Data-archiving and security by Dr. Heinz Speck; BASF AG, Germany. Only paper based versions exist ;o) 5. A G I T G u i d e l i n e s f o r t h e Archiving of Electronic Raw Data. N/A 6. Artikel vedr. langtidsopbevaring af data 7. Artikel vedr. priser på opbevaring af dataformater http://www.version2.dk/ http://www.version2.dk/artikel/16048- xml-jpeg-2000-og-utf-8-bliver-standard-istatens-arkiver-pdfa-stadig-ude-i-kulden artikel/7516-arkivering-forslugent-filformatkoster-kommuner-dyrt Process Validation What The Future Holds Objective: Provide a detailed review of current and draft regulations and guidance regarding a lifecycle approach to process validation. Attendees will understand what the future holds with respect to validation activities in their companies. The lifecycle approach from development through tech transfer and commercial start-up through product phase-out will be described in terms of a Validation Master Plan as a measure to ensure regulatory compliance Benefits: Participants will come away from this course with an understanding of how the process validation paradigm is changing and with tools to implement a broader, scientifically sound approach to the topic. Content: FDA s draft process validation guide was due for finalization in 2009 and then in 2010 it will be finalized by early 2011 (possibly by the date of this course)! No more magic three batches and I m done the lifecycle approach is here to stay. This course takes a look at the implications of the new guidance including where the Europeans are heading and what you can expect the regulators to be looking for in future when they inspect process validation programs at your company. By examining warning letters this course will provide tips as to how adherence to the new guidance could prevent regulatory citations: This course is suitable for: Research and Development, persons working in technology transfer, production managers, Quality Assurance / Quality Control and operations personnel working in pharmaceutical Active substance and finished product manufacture as well as QPs and company statisticians who will be involved in designing protocols and setting acceptance criteria in the future. Course Instructor This course will be presented Karen Ginsbury, CEO of PCI Pharmaceutical Consulting Israel Ltd. Karen has more than 20 years experience in the pharmaceutical industry and has worked closely with wholesalers, distributors and importers on their GDP / GMP compliant quality systems. Karen has helped companies pass customer audits and upgrade their GDP quality systems. In this course she will bring you her experience and case studies to help understand the significance of the regulations as they relate to your day to day job function. Time and place The course will take place the 1.2.2011 and the 2.2.2011 at 8.30 to 16.00 at Symbion, Fruebjergvej 3, 2100 Copenhagen Ø. The price is dkr. 950 for members of IFF, for non-members its dkr. 2000. iff.nu. Read more about the course on www. 8

DET FARMACEUTISKE FAKULTET KØBENHAVNS UNIVERSITET PH.D-forsvar Studies of Anorectic N-Acylethanolamines in Rats To complete the PhD study programme MSc Thi Ai Diep presents her PhD thesis at a public lecture followed by a defence. The topic is: Studies of Anorectic N-Acylethanolamines in Rats. The defence takes place Monday the 20th of December at 10.00 in the Benzon Auditorium. Thi Ai Diep is enrolled as a PhD student at the Department of Pharmacology and Pharmacotherapy. The experimental work of the PhD study took place at the Department of Pharmacology and Pharmacotherapy and Pharmacotherapy. The main supervisor of the PhD project is Professor Harald S. Hansen from The Faculty of Pharmaceutical Sciences. Professor Steen Honoré Hansen from The Faculty of Pharmaceutical Sciences is cosupervisor. The assessment committee consists of Associate Professor Anne Marie Heegaard, The Faculty of Pharmaceutical Sciences, University of Copenhagen Vice President Mads Tang- Christensen, Novo Nordisk A/S R e s e a r c h S c i e n t i s t G i t t e Konradsen, Novo Nordisk A/S The lecture lasts about 45 minutes. After the lecture there is a short break. The whole defence lasts for maximum 3 hours. The summary of the defence is accessible at the web site of the Faculty www.farma.ku.dk/phd/defences, and the thesis itself can be seen at the library of the Faculty. The title of the thesis is Studies of Anorectic N-Acylethanolamines in Rats. PH.D-Defence New Discoveries in Isotopic Labelling of Organic Molecules Flow Chemistry A Useful Technique in Organic Synthesis To c o m p l e t e t h e P h D s t u d y programme MSc Søren Christian Schou presents his PhD thesis at a public lecture followed by a defence. The topic is: New Discoveries in Isotopic Labelling of Organic Molecules Flow Chemistry A Useful Technique in Organic Synthesis. The PH.D-Defence will take place on Thursday the 9th of December at 14.00 in the Auditorium 3. Søren Christian Schou is enrolled as a PhD student at the Department of Me-dicinal Chemistry. The experimental work of the PhD study took place at the Department of Medicinal Chemistry, LEO Pharma A/S and University of Cambridge in United Kingdom. The main supervisor of the PhD project is Pro-fessor Mikael Begtrup from The Faculty of Pharmaceutical Sciences. Associate Professor Jesper Langgaard Kristensen from The Faculty of Pharmaceutical Sciences and Principal Research Scientist Gunnar Grue-Sørensen from LEO Pharma A/S are co-supervisors. The assessment committee consists of Associate Professor Ulf Madsen, The Faculty of Pharmaceutical Sciences, University of Copenhagen Professor William Lockley, University of Surrey, United Kingdom Vice President Lars Martiny, DTU Risø The lecture lasts about 45 minutes. After the lecture there is a short break. The whole defence lasts for maximum 3 hours. The summary of the defence is accessible at the web site of the Faculty www.farma.ku.dk/phd/defences, and the thesis itself can be seen at the library of the Faculty. The title of the thesis is New Discoveries in Isotopic Label-ling of Organic Molecules Flow Chemistry A Useful Technique in Or-ganic Synthesis. 9