Indhold Bilag 1: Astronomi og deling af forskningsdata... 3 Bilag 2: Biologi og deling af forskningsdata... 4 Bilag 3: Humaniora og deling af



Relaterede dokumenter
Larm Case Data Management Plan

Open Science, open access, open data - Rigsarkivet som aktør indenfor e-science

Som forskningsinstitution forsker Statsbiblioteket i information og medier.

Data Management i praksis

Open access. Open Access på Aarhus Universitet. Gør dine publikationer mere synlige og tilgængelige på nettet

Anvendelse af digitale ressourcer i dansk forskning!

Hvor sporene krydses. Børge Obel. Formand for Forskningsnettets Styregruppe

DeIC strategi

Skema til høringssvar anmeldelse af forskningsdata

29. juli 2014 Vedr. afrapportering af projektet Fremfinding og tildeling af PID er fra Netarkivet til statslige digitale udgivelser.

Styregruppen*for*National*Data*Management*

Bilag om dansk forskeruddannelse 1

Forsknings- og Innovationsstyrelsen Bredgade København K Att.: Grete M. Kladakis D Høring over Open Access

Larm Case Data Management Plan

UBVA s anbefalinger vedr. data management-politikkers regulering af forskerrettigheder

Annette Balle Sørensen Seniorrådgiver, cand.scient., ph.d., Annette Balle Sørensen

Aktiviteter og resultater

Nationalmuseets arktiske og nordatlantiske strategi for perioden

Statsbibliotekets. Politik for digital bevaring

Brug af OAIS til udarbejdelse af omkostningsmodel til digital bevaring. Anders Bo Nielsen, Rigsarkivet, Danmark Alex Thirifays, Rigsarkivet, Danmark

National strategi for Datamanagement

Definitioner på publikationstyper i PURE

To kurser i analyse og kodning af kvalitative data

Politik for opbevaring af primære materialer og data

Forskningsbaseret undervisning på MMS Hvad, hvorfor og hvordan?

Forskning og udviklingsarbejde i Danmark

Skema til høringssvar anmeldelse af forskningsdata

Streaming video på højere uddannelsesinstitutioner

Politik for adgang til de digitale samlinger

Hvad er DEFF og hvordan kan DEFF og DeIC samarbejde om Datamanagement?

Dansk Open Access Netværk

Publikationskategorier og definitioner

DANMARKS FORSKNINGSUDGIFTER I INTERNATIONAL SAMMENLIGNING

PROTOTYPE MATEMATIKFORLØB 8. KLASSE: LÆRINGSMÅL OG MEDBESTEMMELSE

Nordisk publiceringsnævn for humanistiske og samfundsvidenskabelige tidsskrifter Nordic Board for Periodicals in the Humanities and Social Sciences

Forskers behov for Data Services

Positiv effekt af omstridt pointsystem på dansk forskningsproduktion Ingwersen, Peter; Larsen, Birger

CCS Formål Produktblad December 2015

2. Det Samfundsvidenskabelige Fakultetsbibliotek

DeIC strategi

Bilag 6.1 SYDDANSK UNIVERSITET / ONLINE STRATEGI. Vision: Scenarier

Koncern-IT. KU Digital. Københavns Universitets digitaliseringsstrategi. Westergaard IT-strategi Dias 1

Analyse af PISA data fra 2006.

Forskning med brug af audiovisuelt materiale især radio

Strategi for Digital Arts Initiative

Rigsarkivets rolle for forskningsdata

Fremtidens forskning og forskningsbiblioteket Resumé

Horsens Kunstmuseum er et statsanerkendt kunstmuseum, der er forpligtiget til gennem indsamling, registrering, bevaring, forskning og formidling

Styregruppen for National Data Management Diskussionsoplæg vedr. strategiske indsatsområder

STRATEGI #meretilflere

Den gode Proces for forskningsbaseret rådgivning

ANSØGNING OM STATSANERKENDELSE BILAG 11 KRAV OG ANBEFALINGER. Arbejdsgrundlag, organisation og ledelse

Anbefaling om sikring og overdragelse af analoge og supplerende digitale data på miljøområdet

Vurderingskriterier i forbindelse med valg af læremidler til distributionssamlingerne på Centre for undervisningsmidler

Idræt i skolen, på eliteniveau og i historisk perspektiv

Referat fra møde i ULA tirsdag d. 10. juni 2014

Velkommen som DIS-Danmark medlem

Workshop: Anvendelse af samfundsøkonomisk metode i transportsektoren. Tidspunkt: Tirsdag den 27. august 2002, kl

Digital Kommuneplan. Kravsspecifikation gennem brugerinvolvering

Invitation til at søge Læselystprogrammet Vejledning fra Styrelsen for Bibliotek og Medier

28. januar 2019 BORGERINDDRAGELSE I FORSKNING 2.0

Open source-licens fra Den Europæiske Union v.1.1

DANSK IT S ANBEFALINGER TIL STYRKELSE AF DANSKERNES DIGITALE KOMPETENCER. Udarbejdet af DANSK IT s udvalg for Digitale kompetencer

Vidensbegreber vidensproduktion dokumentation, der er målrettet mod at frembringer viden

Samarbejde mellem forskningsinstitutioner og Københavns Kommune - 3 scenarier

Regler for speciale. Den Sundhedsfaglige Kandidatuddannelse afsluttes med et speciale på 4. semester. Kandidatspecialet

Studieplan 2013/14 HH3I. IBC Handelsgymnasiet

Hvem sagde variabelkontrol?

Fremstilling af digitalt undervisningsmateriale

Visioner og strategier for forskning i klinisk sygepleje i Hjertecentret mod 2020

DIGITALE BILLEDER HVAD GØR VI MED DEM? LFF seminar 16. april 2008

KU benchmark med udvalgte institutioner FORSKNING OG INNOVATION

Etiske retningslinjer

Studieretningsprojektet i 3.g 2007

KAPITEL 5. De ti virksomheder

Hvilke problemstillinger har det videnskabelige råd været inde på?

FORSKNINGSSTRATEGI FOR NATIONALMUSEET (Vedtaget af direktionen i februar 2007)

Elevvejledning HF Større skriftlige opgaver Århus Akademi 2006

Vidensmedier på nettet

Børne- og Undervisningsudvalget BUU alm. del Bilag 202 Offentligt. Fælles ambitioner for folkeskolen. læring i centrum

Oplæg på temadag om e-bøger. Gentofte Centralbibliotek d. 2. december Piet Dahlstrøm-Nielsen, Hovedbiblioteket i København

Grund- og nærhedsnotat

Deltagerinformation om deltagelse i et videnskabeligt forsøg

Tal og tabeller Facts and Figures. University of Southern Denmark

Indstilling. Til Århus Byråd via Magistraten. Borgmesterens Afdeling. Den 2. januar Århus Kommune

fotografisk kommunikation

Et oplæg til dokumentation og evaluering

Referat af møde afholdt 18. december 2015

Afslag, og hvad så? Det er detaljen, der tæller Budget og bilag Budget Budgetposter Bilag Eksempel på CV...

BESTEMMELSE FOR FAK FORSKNINGSPUBLIKATION. Revideret maj 2016.

Sprogbrug og sprogfunktioner i to kontekster

Hvordan måler vi vores indsats?

1. Formidlingspuljerne Puljerne er en del af Kulturministeriets bevilling til at styrke museernes formidling. Bevillingen løber i

Studenterportalen. Registrering og upload af bacheloropgaver og andre afgangsprojekter. Professionshøjskolen Metropol, marts 2011

Forskning med brug af tekster og tekstværktøjer

Forskningspolitisk sammenfatningsnotat

Spil i undervisningen

Att: Katrine Tarp 13. januar 2003

Faglig detailplan og -budget for aktivitet 6 'Nyindustrialisering'

Transkript:

Bilag til rapport: Forvaltning af forskningsdata i Danmark En undersøgelse af danske universiteters og forskningsråds praksisser, politik og visioner for lagring, langtidsbevaring, tilgængeliggørelse og deling af forskningsdata. Udarbejdet af: Jesper B. Thestrup, Filip Kruse, Lars Nondal, Bertil F. Dorch, Mikkel Andersen, Niels Jørgen Blaabjerg, Thea Drachen, Jeannette Ekstrøm, Mikael Elbæk, Ole Ellegaard, Karsten Kryger, Asger V. Larsen, Diba Markus, Anna Mette Morthorst, Erik Sonne, Sacha Zurcher og Ellen V. Knudsen

Indhold Bilag 1: Astronomi og deling af forskningsdata... 3 Bilag 2: Biologi og deling af forskningsdata... 4 Bilag 3: Humaniora og deling af forskningsdata... 5 Bilag 4: Forskningsdata og Open-Access, ophavsret, tilgængeliggørelse og deling... 6 Bilag 5: Hvad er forskningsdata? Om forskningsprocessen, forskningsdata, objekter, metadata, data life-cycle model og data management planning.... 9 Bilag 6: Interviewdeltagerne... 17 Bilag 7: Adspurgte forskningsråd, institutioner og fonde... 18 Bilag 8: Spørgerammen til universiteter... 19 Bilag 9: Uddrag af spørgeskema til forskningsråd og fonde... 22 Bilag 10: Program for workshoppen 31/10... 24 Bilag 11: Det Frie Forskningsråds svar:... 25 Bilag 12: Datamanagement i Skandinavien: Finland, Norge, Sverige... 29 Bilag 13: Holland... 31 Bilag 14: Tyskland... 33 Bilag 15: Et europæisk perspektiv på forskningsdatamanagement: OECD og EU... 34 Bilag 16: USA... 37 Bilag 17: Canada... 38 Bilag 18: Australien... 40 Bilag 19: Eksempel på beskrivelse af en datamanagementplan indenfor Samfundsvidenskab... 42 Bilag 20: Eksempel på beskrivelse af en DMP indenfor Miljøbiologi... 43 Bilag 21: Eksempel på beskrivelse af en DMP indenfor Biomedicin... 46 2

Bilag 1: Astronomi og deling af forskningsdata Inden for den astronomiske forskning har man en lang tradition for deling af såvel litteratur, software, udstyr som data. Samtidig er de økonomiske omkostninger, i forbindelse med indsamling af astronomiske data, så høje, at international organisering og samarbejde er uomgængeligt. Dette gælder i særdeleshed for observationelle data (dvs. data fra teleskopfaciliteter, satellitter m.v.), men i nogen grad også for beregnede data (for eksempel fra supercomputerfaciliteter). De astronomiske organisationer og det omsiggribende samarbejde har bidraget til den åbenhed omkring forskningsmaterialer, der generelt eksisterer inden for forskningen på områderne astronomi og astrofysik. Denne åbenhed kan eksemplificeres ved arxiv.org 1, der er et fagligt arkiv for preprints med videre det første eksempel og en prototype på et international Open Access-repository. Derudover kan fx nævnes NASA s database Astrophysics Data System Abstract Service (ADS) 2, der er en gratis litteraturdatabase, med blandt andet brugerproduceret indhold, citations- og analyseværktøj. Inden for astronomien, og tilgrænsende videnskaber, er arxiv.org og ADS generelt vigtigere værktøjer end de kommercielle konkurrenter. ADS indeholder udover fx citationsinformationer også en mulighed for at dele datasæt i og med, at der kan linkes til data fra publikationsposter. De datasæt, der linkes til fra publikationer i ADS, er typisk satellit- eller instrumentdata fra store internationale datacentre, for eksempel NASA s Planetary Data System (PDS) 3. Som eksempel på et datacenter, er PDS et distribueret datasystem, som NASA bruger til at arkivere data indsamlet om solsystemet af satellitter og jordbaserede instrumenter. PDS ledes fra NASAs hovedkvarter Planetary Sciences Division, der stiller veldokumenterede, fagfællebedømte data til rådighed for forskersamfundet. Arkivet og data skal overholde datakvalitetsstandarder fastsat af PDS. Undersøgelser tyder på, at publikationer indenfor astronomi kan være omfattet af en såkaldt citationsfordel, i forhold til links til data, jævnfør Dorch 2012 4. Det vil sige på linje med den debatterede såkaldte Open Access-citationsfordel. 1 http://arxiv.org/ 2 http://www.adsabs.harvard.edu/ 3 http://pds.nasa.gov/ 4 Bertil Dorch: On the Citation Advantage of linking to data, 2012, http://hprints.org/hprints-00714715 3

Bilag 2: Biologi og deling af forskningsdata Siden 1980 erne har molekylærbiologer og genetikere delt data om DNA. I takt med, at stadigt mere DNA analyseres - sekventeres - har forskerne delt deres viden i online databaser. De tre største databaser er GenBank (National Institute of Health i USA) 5, EMBL-bank (European Molecular Biology Laboratory i Tyskland) 6 og DNA Data Bank of Japan (National Institute of Genetics i Japan) 7. Baserne indgik midt i 1990 erne et tæt samarbejde i The International Nucleotide Sequence Databases (INSD) 8. Systemet synkroniserer dagligt data fra de tre baser, for at sikre, at baserne er fuldt opdaterede. Baserne drives via offentlige midler og er ikke-kommercielle. Kun data, der kan deles, frit accepteres (Gasbjerg et al, 2011, s. 142) 9. Databaserne indeholder ikke kun DNA-sekvenser, der er blevet publiceret artikler om. Også data, der ikke er publiceret artikler om, uploades. Forskeren bestemmer selv, hvilke data, der skal offentliggøres og hvornår i forskningsprocessen. Databaserne skaber mulighed for, at andre forskere kan bidrage til forståelsen af en given sekvens og skaber løbende nye samarbejdsrelationer blandt forskere 10. Systemet viser fordelene ved at dele forskningsdata, ud fra faglige præmisser internationalt. 5 http://www.ncbi.nlm.nih.gov/genbank/ 6 http://www.embl.de/ 7 http://www.ddbj.nig.ac.jp/ 8 http://www.ddbj.nig.ac.jp/ 9 Peder K. Gasbjerg, Gunnar S. Jensen og Annette B. Sørensen: Bioteknologi - en basisbog; Aarhus: Systime, 2011. 10 Jævnfør samtale med Annette B. Sørensen, en af forfatterne til Bioteknologi - en basisbog. 4

Bilag 3: Humaniora og deling af forskningsdata Digitale forskningsdata er et centralt element i humanistisk forskning. Dette gælder både lagring, langtidsopbevaring og deling af forskningsdata. Som indenfor andre forskningsområder er der et stigende behov for at lagre og dele forskningsdata. Ikke kun resultatet af forskningsprocessen deles, men også de objekter, som forskeren bruger, det være sig i form af samlinger film, lyd, andet grafisk materiale, databaser med videre. En intern opgørelse på Statsbiblioteket viser at opgaver, der berører film og radio per 31/12 2011 har generet 736.872 Gigabyte data (0,7 Terabyte) (Statsbiblioteket, 2011) 11. Dekan Mette Thunø (AU) fremhævede i sit oplæg på DeIC-konferencen 2012 nationalbibliotekernes digitalisering af kulturarven som vigtig for humanistisk forskning 12. Digitaliseringen af kulturarven foregår på tværs af to sektorer, nemlig forskningssektoren og arkiver, museer og biblioteket (ABM-området). Denne digitalisering forgår ikke kun i Danmark, men er international. Se eksempelvis Europeana 13. Denne deling af arbejdet medfører, at processen sjældent er et anliggende for den humanistiske forsker selv. Dette skaber, jævnfør Mette Thunøs oplæg, nogle centrale udfordringer for humaniora, når det handler om forskningsdata. - a) Forskerne har brug for værktøjer for at tilgå samlingerne og arbejde med dem (research tools) - b) Forskerne har brug for Juridisk rådgivning omkring databevaring og dataadgang Der er ikke kun tale om et behov, der øges i takt med digitaliseringen af kulturarven. Moderne teknologi som visualisering og scanninger bruges i stigende omfang af humanistiske forskere. Dekan Mette Thunø nævnte eksempelvis på DeIC s konference 2012 14, at arkæologer i Storbritannien 15 bruger 3D-scanninger af fund i deres arbejde og at amerikanske arkæologer er ved at have en 3D-model af det antikke Rom 16. Samlet set må behovet for digital håndtering af forskningsdata og dermed behovet for datamanagementplanlægning indenfor dette fagområde forvente at sige kraftigt. 11 Statsbiblioteket: Statistik BJA 2011, Statsbiblioteket, 2011. Upubliceret Intern opgørelse 12 http://www.deic.dk/drupal/sites/default/files/uploads/konf2012/praesentationer/deic_mette_thunoe.pdf 13 http://www.europeana.eu/portal/ 14 http://www.deic.dk/drupal/sites/default/files/uploads/konf2012/praesentationer/deic_mette_thunoe.pdf 15 http://www.liverpoolmuseums.org.uk/conservation/technologies/3drecording/index.aspx 16 http://www.romereborn.virginia.edu 5

Bilag 4: Forskningsdata og Open-Access, ophavsret, tilgængeliggørelse og deling I forbindelse med deling af forskningsdata opstår der en række juridiske problemer. Nedenstående tekst giver en oversigtlig udredning af de juridiske problemstillinger, der er forbundet med Open Access og andre former for tilgængeliggørelse af forskningsdata og som må overvejes af forskeren og forskningsinstitutionen. Open Access Open Access indebærer fri og gratis adgang til at tilegne sig indholdet af offentligt finansieret forskning. Adgangen er således uafhængig af abonnementer på tidsskrifter o.l. Materiale, hvortil der er Open Access, er beskyttet af ophavsretten og ophavsmændene beholder alle ophavsrettigheder, som ikke udtrykkeligt er overdraget til andre. På danske universiteter og andre forskningsinstitutioner anbefales forskerne at publicere med Open Access. Det kræver forskerens samtykke at lægge videnskabelige publikationer (som post- eller preprints) i Open Access arkiver - repositories. Dette er hovedtrækkene af de vejledninger om Open Access, som er tilgængelige på danske universiteters hjemmesider. Da publikationerne kan indeholde samlinger af data - eller disse kan udgøre selve publikationen - skal vi i det følgende nærmere overveje mulige sammenhænge mellem Open Access og tilgængeliggørelse af forskningsdata som element i data management. Ophavsret Ophavsretten er beskrevet i Lov om ophavsret 17 og er i udgangspunktet en personlig ret, som ophavsmanden til et værk har til at råde over værket. For at få ophavsret til en frembringelse kræves, at frembringelsen har værkshøjde dvs., at den er et resultat af en selvstændig, skabende indsats (originalitetskravet). Ophavsretten består af økonomiske rettigheder, som udløber 70 år efter ophavsmandens død, og som kan overdrages, og af ideelle rettigheder, som ikke forældes, og som ikke kan overdrages. Men hvad forstås ophavsretligt ved data og database? Databaser Som udgangspunkt handler ophavsretten om værker. En publiceret rapport om et arkæologisk fund, en beskrivelse af en virus eller en undersøgelse af vælgervandringer vil være ophavsretligt beskyttet, men ikke selve det konkrete fund, undersøgelsesresultatet, målingen eller for den sags skyld, den abstrakte tanke eller ide herom. 17 Bekendtgørelse af lov om ophavsret. Retsinformation, https://www.retsinformation.dk/forms/r0710.aspx?id=129901 6

Ved database kan indholdsmæssigt forstås en systematisk organisering af data, hvor selve databasen kan have digital- eller papirform 18. Data kan forstås som registreringer af kendsgerninger, for eksempel måleresultater, som ikke i sig selv har værkshøjde, eller af værker, f.eks. tidsskriftsartikler og lignende, som har værkshøjde. Ved forskningsdata kan forstås data, der er resultater af en proces, der har et videnskabeligt sigte (jævnfør bilag 3). Spørgsmålet om den ophavsretlige beskyttelse af en database må adskilles fra den ophavsretlige beskyttelse af databasens indhold. Databaser kan være beskyttet efter to forskellige bestemmelser i ophavsretsloven, nemlig enten efter ophavsretslovens 5 om samleværker eller 71 om kataloger. Samleværker 5 Den, som ved at sammenstille værker eller dele af værker frembringer et litterært eller kunstnerisk samleværk, har ophavsret til dette, men retten gør ingen indskrænkning i ophavsretten til de enkelte værker. For at en database kan være ophavsretsligt beskyttet som samleværk efter 5 skal der ved sammenstillingen af værkerne være ydet en sådan selvstændig skabende indsats, at sammenstillingen som sådan har værkshøjde 19. Sammenstillingen må være udført efter en vis plan eller idé 20. Beskyttelsen efter 5 gælder ophavsmanden til et samleværk (værkshøjdekravet). Normalt vil et samleværk bestå af en samling, hvis enkelte dele også har værkshøjde. Men det er ikke nødvendigt. En database kan også være beskyttet som samleværk, selv om indholdet består af data, der ikke selv har værkshøjde. Det betyder, at en database, hvor data er sammenstillet ud fra en bestemt teori, kan være ophavsretligt beskyttet. Kataloger Sammenstillinger, der ikke opfylder originalitetskravet, som altså ikke har værkshøjde, vil være beskyttet som kataloger: 71 Den, som fremstiller et katalog, en tabel, en database eller lignende, hvori et større antal oplysninger er sammenstillet, eller som er resultatet af en væsentlig investering, har eneret til at råde over det pågældende arbejde som helhed eller en væsentlig del deraf Beskyttelsen efter 71 gælder producenten af sådanne sammenstillinger. Denne beskyttelse varer kun i 15 år efter fremstillingen eller offentliggørelsen, hvis offentliggørelsen sker inden 15 år er forløbet efter fremstillingen. 18 Rosenmeier, M. (2010): Ophavsret for begyndere. En bog for ikke-jurister, 2. udgave. København. Jurist- og Økonomforbundets Forlag, side 201. 19 Schønning, P. (2011): Ophavsretsloven med kommentarer. 5. udgave. København. Karnov Group, side 199. 20 Schønning, P. (2011): Ophavsretsloven med kommentarer. 5. udgave. København. Karnov Group, side 199. 7

For såvel samleværker som kataloger gælder 22, som tillader citater fra et offentliggjort værk i overensstemmelse med god skik og i det omfang, som betinges af formålet. En database kan således være beskyttet efter 5 eller 71 og forskeren kan i begge tilfælde have ophavsretten til denne. Såfremt forskeren har indsamlet data og etableret databasen som led i sit arbejde kan ophavsretten være overgået til forskerens arbejdsgiver, i det omfang det er nødvendigt for dennes sædvanlige virksomhed. Men selv om dette ikke måtte være tilfældet i det konkrete tilfælde, så vil arbejdsgiveren normalt vil have ejendomsretten til det it-system hvor databasen og forskningsdata rent fysisk befinder sig. Råderetten følger ejendomsretten, og forskeren kan komme i den situation, ikke at kunne få adgang til den database, han har ophavsret til. Dette problem kan især opstå i forbindelse med stillingsskift. For at forebygge sådanne problemer, bør der indgås aftaler om ret til adgang og (videre)udnyttelse af indsamlede forskningsdata. Opsamling Ved Open Access publicering af forskningsresultater sker der ikke ændringer i de økonomiske eller ideelle rettigheder, der er knyttet til ophavsretten. Ophavsrettens økonomiske side kan efter aftale overdrages til andre. Forskningsresultater i form af forskningsdata kan være forskerens publicerede egne data eller sammenstillinger af data. Forskningsdata kan indgå i en publikation eller være offentliggjort selvstændigt. De må i disse former antages at være beskyttet. Ophavsretten til forskningsdata kan overgå til forskerens arbejdsgiver Anvendelse af andres data i forskningsmæssig sammenhæng hindres ikke af ophavsretten, men må ske i overensstemmelse med de i ophavsretsloven beskrevne indskrænkninger i ophavsmandens eller rettighedshaverens eneret til at råde over publikationen eller databasen 8

Bilag 5: Hvad er forskningsdata? Om forskningsprocessen, forskningsdata, objekter, metadata, data life-cycle model og data management planning. I dette bilag vil vi kort give en oversigt over nogle grundlæggende begreber og definitioner vedr. forskningsdata, primært fra den engelske litteratur og fra Digital Curation Centre (DCC). De centrale begreber vi behandler er, udover forskningsdata i sig selv, hhv. videnskabelige kilder, objekter, databaser, metadata, data-life cycle og Data Management Plans (DMP) A) Forskningsprocessens faser: Men inden vi tager hul på hvad forskningsdata er for noget, er det måske nødvendigt med et billede af hvordan disse forskningsdata hænger sammen med hele den overordnede forskningsproces, som de er en integreret del af? En version af forskningsprocessens faser, der ligger stor vægt på data, findes hos Higgins 21, s. 18. Se figur 1. Figur 1: datacentric phases of the research life cycle Higgins 2011, side 18 21 Sara Higgens (2012); The lifecycle of data management; I Graham Pryor (Red.): Managing Research Data: London: Facet Publishing, 2012, side 17-46. 9

Den samlede forskningsproces beskrives som bestående af 6 sekventielle faser, hvor data er et element i alle faser, men navnlig 3 af faserne berører data/forskningsdata. Det er henholdsvis research phase, hvor man i forskningsprojektet collects or creates the raw data on which the research is founded. Senere en synthesize phase, hvor der bruges modelling or statistical techniques to make sense of the data, leading to new data sets. Derefter hele processen omkring publicering der ender med en re-use phase, hvor new data sets are used as foundations for new hyptheses. Man finder lignende fasemodeller for forskningen inden for det tilstødende område, videnskabelig kommunikation og publicering eksempelvis Garvey & Griffith (1963) 22, Garvey (1979) 23, Griffith (1990) 24, Borgman (2007) 25 med flere, samt Microsoft's Scholarly Communication Model 26. Når det gælder faglige beskrivelser af forskningsprocesser, er faseinddelinger også almindelige. Eksempelvis inden for kliniske studier, hvor der typisk opereres med fire forskningsfaser. I almenhed gælder, at man taler om minimum fire faser: planlægning, udførelse, indsamling af resultater, samt evaluering. Inden for samfundsvidenskaberne tales undertiden om timeglas-modellen, der indeholder syv faser. Dog må det bemærkes, at der også findes videnskabsteoretikere, der argumenterer mod opdeling af forskningsprocessen i generelle faser (for eksempel Feyerabend 1975 27 og 1987 28 ). En model som ovenstående er meget skematisk, og vi vil ikke gå dybere ind i en diskussion af denne eller andre modellers faseinddelinger. Den konkrete model vil givet skulle tilpasses og vi har ikke mulighed for at foretage en grundig kortlægning/karakteristik af de forskellige videnskabers specifikke forhold til - og arbejde med - deres forskningsdata. Vi nøjes med at konstatere, at forskellige grene af videnskaberne har forskellige forhold til og afhængigheder af data. For eksempel kan det i mange sammenhænge være essentielt at skelne mellem egentligt indsamlede forskningsdata på den ene side, og så materiale, der bør indgå i en bredere definition, der kan sammenfattes under overskriften videnskabelige kilder på den anden side. Kilder er her materialer, der kan gøres til genstand for forskning og videnskabelig analyse, men som sådan ikke er direkte genereret /observeret/indsamlet i forbindelse med forskningsprocessen, i modsætning til egentlige rå forskningsdata. Forstået på denne måde, er maleriet af Mona Lisa i sig selv ikke forskningsdata, men en kilde, der kan anvendes til forskning. Derimod er et digitalt foto af Mona Lisa i UV-lys forskningsdata, hvis det er tilvejebragt med henblik på en videnskabelig analyse. 22 Garvey, W. D., and Griffith, B. C. (1963); An overview of the structure, objectives, and findings of the American Psychological Association s project on scientific information exchange in psychology. Washington, DC: American Psychological Association. 23 Garvey, W.D. (1979); Communication: the essence of science. Oxford: Pergamon Press 24 Griffith, B. C. (1990); Understanding science: Studies of communication and information. I C. L. Borgman (ed.), Scholarly Communication and Bibliometrics (31-45). Newbury Park, CA: Sage. 25 Borgman, C. L. (2007); Scholarship in the digital age: information, infrastructure, and the Internet. Cambridge, MA: MIT Press. 26 http://www.microsoft.com/mscorp/tc/scholarly_communication.mspx 27 Feyerabend, P. (1975); Against Method: Outline of an Anarchistic Theory of Knowledge Minneapolis: University of Minnesota Press 28 Feyerabend, P. (1987) Farewell to Reason, London ; New York : Verso, 1987. 10

Sondringen mellem kilder og forskningsdata er måske mest relevant for humaniora, hvor forskerne oftere arbejder med digitalt materiale (som eksempel kan nævnes den digitaliserede kulturarv), der ikke direkte er blevet genereret i forbindelse med selve det konkrete forskningsprojekt og måske mindst relevant for naturvidenskaberne (eksempelvis astrofysikken), der er kendetegnet ved massiv indsamling eller generering af primære forskningsdata i selve forskningsprojekterne. Heroverfor er samfundsvidenskaberne måske karakteriseret ved både at bruge data, og i et vist omfang kilder i forskningsprocessen, men til forskel fra naturvidenskaberne, er der som hovedregel oftere nok tale om sekundære data end primære data (det vil sige mere genbrug af andres data end egen dataindsamling). Vi vil ikke gå dybere ned i forskellene på de forskellige videnskabers arbejde med data her, men henvise til Bilag 1, Bilag 2 og Bilag 3, hvor der gives en kort karakteristik af henholdsvis Astronomi, Biologi og Humanioras holdninger til spørgsmålet om deling af data. Og så bare påpege, at disse forskelle gør det meget svært at arbejde med generelle modeller for videnskabernes håndtering af forskningsdata, og ikke mindst gør det svært at arbejde med meget generelle skabeloner for Data Management Plans. Enhver form for konkrete retningslinjer for institutionernes og forskningsprojekternes håndtering af forskningsdata må tage højde for den specifikke videnskabs særlige karakteristika. B) Forskningsdata som begreb Det helt centrale begreb er forskningsdata, og hvis vi opretholder den ovennævnte skelnen mellem forskningsdata og videnskabelige kilder, så kan vi som udgangspunkt for en definition af begrebet forskningsdata tage at forskningsdata er materiale, der er tilvejebragt specifikt med henblik på videnskabelig anvendelse: Forskningsdata kan defineres som data, der er et resultat af en forskningsmæssig indsamling, observation, eller en styret proces, der netop har til formål, at tilvejebringe data, der kan gøres til genstand for en videnskabelig analyse og resultere i originale forskningsresultater Data Information Specialist Committe UK 29 En anden definition af forskningsdata findes hos Higgens 2012 30 : Research data constitutes the record of the research activity: data or information in a fixed form that is created or received in the course of individual or institutional activity and set aside (preserved) as evidence of that activity for future reference (s. 20) På et lidt mere konkret niveau karakteriserer Higgins, 2012 31 forskningsdata som Data produced throughout the research lifecycle includes any information in binary digital form that is created, accessed and rendered with the use of computer technology (s. 19). 29 http://www.disc-uk.org/qanda.html. Projektgruppens oversættelse. 30 Sara Higgens (2012); The lifecycle of data management; I Graham Pryor (Red.): Managing Research Data: London: Facet Publishing, 2012, side 17-46. 31 Sara Higgens (2012); The lifecycle of data management; I Graham Pryor (Red.): Managing Research Data: London: Facet Publishing, 2012, side 17-46. 11

Her omfatter begrebet data enhver form for information i binær, digital form. Så data er ikke bare data. På et overordnet plan kan data (eller information i binær form ) opdeles i henholdsvis objekter, databaser og metadata. C) Objekter og databaser Higgens 32 skelner mellem simple digital objects og complex digital objects. Den enkelte, individuelle fil (tekst, billede el. lydfil) i et bestemt fil-format, hvortil der kun kræves et enkelt software-program for at kunne arbejde med eller åbne filen, er et eksempel på simple digital objects. Herover for er complex digital objects kombinationen af et antal separate digitale objekter - hvor til der måske kræves flere forskellige slags software for at arbejde med, eller åbne objektet. De enkelte dele i objektet skal hænge konceptuelt sammen. Eksempler kunne være en digital bog (bestående af en tekstfil med flere embedded billeder) eller en webside (med filer i flere forskellige formater: html, jpeg, css mm.) Databaser er en samling strukturerede informationer typisk organiseret i en felt-struktur, der konstituerer en post eller en record. Opdelingen i simple eller komplekse digitale objekter og databaser vil ikke blive forfulgt længere her. Bortset fra den simple konstatering at, der vil være en række teknologiske og organisatoriske udfordringer med f.eks. langtidsbevaringen af forskningsdata, når det ikke bare drejer sig om den fysiske bevarelse af en række separate filer i et bestemt fil-format, men måske bevarelse af komplekse digitale objekter og databaser, der for at kunne bruges på et senere tidspunkt, ligeledes kræver bevarelse af diverse softwareprogrammer, database software etc. D) Metadata: Men ingen data uden metadata. Higgins 33 karakteriserer metadata som the backbone of digital curation. Metadata muliggør overhovedet eksistensen af en data-life cycle, muligheden for at arbejdet med data kan skride frem fra start til slut, komme fra en fase til den næste. Og dermed overhovedet muligheden for at selve forskningsprocessen kan bevæge sig fremad. Så hensigtsmæssig håndtering af forskningsdata, handler i lige så høj grad om håndteringen af de nødvendige former for metadata, som om hensigtsmæssig håndtering af forskningens digitale objekter (simple eller komplekse), databaser og for den sags skyld også kilder. Metadata er nødvendig for at opnå en komplet beskrivelse af data, men selve metadata-objektet kan, afhængigt af videnskabsgrenen, enten være en indlejret del af rådata, for eksempel qua den måde data er indsamlet eller genereret på (metadata kan eksempelvis genereres automatisk af det instrument, der indsamler data). Eller metadata-objektet kan være separat fra selve dataobjektet. I det sidste tilfælde, vil der typisk være en beskrivelse eller nøgle i metadata, der refererer til det relevante dataobjekt. Metadata kan være mange ting. Vi vil ikke her gå i detaljer med hvilke specifikke former for meta-data, der kan eller vil være nyttige på bestemte tidspunkter i forskningsprocessen, men henvise til behandlingen af DCC s data life-cycle model nedenfor. På helt overordnet plan opdeler Higgins 2012 metadata i de kategorier, der fremgår af tabel 1. 32 Sara Higgens (2012); The lifecycle of data management; I Graham Pryor (Red.): Managing Research Data: London: Facet Publishing, 2012, side 17-46. 33 Sara Higgens (2012); The lifecycle of data management; I Graham Pryor (Red.): Managing Research Data: London: Facet Publishing, 2012, side 17-46. 12

Tabel 1: Higgins opdeling af Metadata Typer metadata Descriptive metadata Technical metadata Administrative metadata Use metadata Preservation metadata Indhold Identifikation: eksempelvis persistent identifiers, placering, klassifikation og lignende Filformat, software brugt til datafangst, software nødvendigt for senere bearbejdning laboratorieindstillinger/kalibrering af udstyr og lignende Ophavsret/IP issues, administratorrettigheder og lingende Adgangsstyring, benyttelsesstatistik Beslutning om lagring eller ej, migration til datalager Higgins 2012, side 38 34. Andre eksempler på kategorier af meta-data vedrørende forskningsdata kunne f.eks. være eksperimentelle meta-data og discovery eller collections - metadata: De sidste eksempler stammer fra Australian National Data Service (ANDS), og er udtryk for dels den vægt der i det australske arbejde med forskningsdata lægges på data capture, dvs. den automatiske indfangning af centrale meta-data i selve observations-, eksperiment- eller forsøgssituationen. Dels for den vægt der lægges på at få etableret genfindings- og søgemuligheder for forskningsdata på et højt niveau. E) Data Life Cycle model Udover en faseinddeling (livsforløb) af selve forskningsprocessen giver det mening at tale om et tilsvarende livsforløb for forskningsdata. DCC har introduceret en samlet Data Life Cycle model for forskningsdata, som vil blive genstand for en lidt grundigere gennemgang (se DCCs Curation Lifecycle Model 35 ; DCC s hjemmeside 36 samt Graham Pryor 2012 37 og Higgins 2012 38 ). Denne model har dannet udgangspunkt for mange af de konkrete data management planer, der er udarbejdet eller er ved at blive udarbejdet ved britiske universiteter og højere læreanstalter på baggrund af krav fra forskningsrådene (Se hovedrapport kapitel 3). Det er ligeledes den model, der er udgangspunktet for det af DCC udviklede værktøj DMP Online 39, som institutioner og forskningsprojekter kan bruge til at tilpasse deres egne, relevante skabeloner for deres DMPs. Modellen kan siges at rumme et samlet katalog over emner som maximalt kan indgå i et konkret forskningsprojekts arbejde med forskningsdata. Og den nødvendige, lokale tilpasning består så i at udvælge de spørgsmål/emner, som er relevante i det konkrete tilfælde. 34 Sara Higgens (2012); The lifecycle of data management; I Graham Pryor (Red.): Managing Research Data: London: Facet Publishing, 2012, side 17-46. 35 DCC; The DDC Curation Lifecycle Model; DCC: http://www.dcc.ac.uk/sites/default/files/documents/publications/dcclifecycle.pdf 36 http://www.dcc.ac.uk/resources/curation-lifecycle-model 37 Graham Pryor (2012); Why manage research data; I Graham Pryor (Red.): Managing Research Data: London: Facet Publishing, 2012, side 1-17. 38 Sara Higgens (2012); The lifecycle of data management; I Graham Pryor (Red.): Managing Research Data: London: Facet Publishing, 2012, side 17-46. 39 https://dmponline.dcc.ac.uk/ 13

Figur 2: DCCs Curation Lifecycle Model Kilde: DCC 40 Modellen er overordnet og generisk og skal som sagt tilpasses eller justeres efter de forskellige videnskabers særlige former for datahåndtering. Med lifecycle eller livsforløb menes der hele tidsforløbet fra forskerens begyndende forestillinger og hypoteser om næste forskningsprojekt, til den konkrete langtidsbevaring af udvalgte data-sets fra det gennemførte forskningsprojekt. Centralt i modellen er de basale forskningsdata-filer, i form af digitale objekter eller databaser (orange centrum). DCC s model indeholder dels en række såkaldte full lifecycle actions, det vil sige aktiviteter, der bør og kan foretages på relevante tidspunkter i hele livsforløbet: description and representation information, preservation planning, community watch and participation og curate and preserve. Derudover opereres der med en række occasional actions, altså aktiviteter, der om nødvendigt skal udføres på et givent tidspunkt: dispose, reappraise og migrate. 40 http://www.dcc.ac.uk/sites/default/files/documents/publications/dcclifecycle.pdf 14

Vi vil ikke her gå nærmere ind i bestemmelsen af disse begreber, men kort give nogle stikord vedrørende de såkaldte sekventielle handlinger i forskningsdata s livsforløb: conceptualize, create or receive, appraise and select, ingest, preservation action, store, access, use and reuse og transform. Svarende til den yderste, røde ring i cirklen. Her vil vi have specielt fokus på metadata s betydning på forskellige tidspunkter i processen. Formålet med denne korte gennemgang, er at vise hvor mange overvejelser om metadata forskeren børgøre sig forbindelse med lagring, langtidsopbevaring og deling af forskningsdata. 1: Conceptualize - svarende til the hypothesize stage of the research life-cycle, hvor forskeren overvejer hvilke data, der er nødvendige for at be-/afkræfte den udviklede hypotese. - overvejelser om og planlægning af projektets tekniske udførelse og workflow, herunder hvordan data skal fanges ( data capture ) - undersøgelse af IP issues - ophavsret/ejendomsret til data - overvejelser om interoperabilitet for eksempel semantic interoperabilitet, der i givet fald skal understøttes af scientific specific structured metadata (ontologier/klassifikationsskemaer) 2: Create or receive - indebærer detaljerede specifikationer for brugen af teknologier, herunder tools til at indfange data. Disse specifikationer skal dokumenteres som tekniske metadata, som f.eks: calibrations, file formats - bestemmelse af data management workflows, tildeling af persistent identifiers, overvejelser af hvordan man får fat i meta-data (ved datafangst eller senere: attaching or linking the metadata to data) 3: Appraise and select - collection development - hvad vil de trusted repositories/datacentrene senere modtage - og hvordan - beslutning om hvilke data der skal gemmes long-term og hvilke der ikke skal. Absolut ikke alle data skal gemmes/langtidsbevares 41 4: Ingest - termen stammer fra OAIS Reference Model for an Open Archival Information System - handler om hvordan data inkl. metadata og nødvendige støtte-programmer/software overføres til trusted repository, et dataarkiv. - administrative metadata her meget vigtige - og meget omfangsrige - kontrol, quality assurance, hvem er ansvarlige med mere - det skal sikres en klar forbindelse mellem data og metadata 5: Preservation action - tilføjelse af persistent identifiers (hvis ikke allerede gjort), overvejelse om filformater - medieformater - specifikation af både hardware og software nødvendigt for at accesse/tilgå og køre/anvende data (open and read overvejelser) 6: Store - Kan ske på centralt drev, harddisk, datalager, i skyen - Indebærer back-up policies, disaster recovery plans - Overvejelser om mediers (f.eks. cd s) kortvarige holdbarhed - Hvem har status som trusted repositories? 41 http://www.dcc.ac.uk/resources/curation-reference-manual/completed-chapters/appraisal-and-selection 15

7: Access, use and reuse - formålet med det hele - indebærer politik for hvem der skal have adgang til/ret til at se, editere (bearbejde), downloade, uploade og genbruge data - herunder search and discovery tools 8: Transform - data sets indgår igen I en konkret forskningsproces - synthesize, analyze - oprindelige data sets bliver til nye data sets-transformerede data sets kan bruges til at verificere tidligere resultater, danne basis for nye eksperimenter, eller danne udgangspunkt for nye hypoteser F) Data Management Plans Som det fremgår af Data Life Cycle-model er der et omfattende styrings- og planlægningsbehov i forbindelse med den hensigtsmæssige håndtering af forskningsdata fra vugge til grav/ genopstandelse. Og meget af styringen forudsætter eksistensen af relevante meta-data. Forskellige aktører er relevante - eller ansvarlige - på forskellige tidspunkter. Men den mest centrale aktør i hele livsforløbet er det aktive forskningsprojekt, der arbejder aktivt med forskningsdata. Som samlet begreb for den del af processen, der handler om hvordan de enkelte forskningsprojekter, ude på institutionerne, bedst muligt kan håndtere deres forskningsdata introduceres begrebet Data Management Plans. 16

Bilag 6: Interviewdeltagerne - Aalborg Universitet: Overbibliotekar Niels Henrik Gylstorf, - Aarhus Universitet: Chefkonsulent Carsten Riis, - Copenhagen Business School: Professor Jan Damsgaard - Copenhagen Business School: University Director Hakon Iversen - Danmarks Tekniske Universitet: Underdirektør Steen Pedersen - Danmarks Tekniske Universitet: Direktør DTU Bibliotek Mogens Sandfær - Danmarks Tekniske Universitet: Prorektor Henrik Caspar Wegener - IT-Universitet: Head of the Research Department Jens Christian Godskesen - Københavns Universitet: Prorektor Thomas Bjørnholm - Københavns Universitet: Gruppeleder Rektorsekretariatet Torben Rytter Kristensen - Roskilde Universitet: IT- sikkerhedskonsulent Henrik Jensen - Roskilde Universitet: Overbibliotekar Claus Vesterager Pedersen - Syddansk Universitet: Institutleder Kirsten Kyvik 17

Bilag 7: Adspurgte forskningsråd, institutioner og fonde - Carlsbergfondet - Danmarks Grundforskningsfond - Danmarks Meteorologiske Institut - Danmarks Statistik - Forsknings- og Innovationsstyrelsen - Det Frie Forskningsråd - De Nationale Geologiske Undersøgelser for Danmark og Grønland (GEUS). - Højteknologifonden - Kræftens Bekæmpelse - Novo Nordisk Fonden - Rockwool Fonden - TrygFonden - Villum Fonden/Velux Fonden 18

Bilag 8: Spørgerammen til universiteter På de næste to sider er det brev, der blev sendt ud til universiteterne og spørgerammen, gengivet. 19

Aarhus 19. april 2012 Til Universitetsledelsen. Jeg henvender mig på vegne af projektet Forvaltning af forskningsdata, der udføres af forskningsbibliotekerne ved de otte universiteter og støttes af Danmarks Elektroniske Fag- og Forskningsbibliotek, DEFF. Projektets formål er at belyse, hvordan der i såvel dansk som international kontekst arbejdes med at bevare og tilgængeliggøre forskningsdata. I udlandet ses en voksende tendens til direkte krav fra forskningsråd og fonde om at forskningsdata tilgængeliggøres i et offentligt arkiv. Med tilsvarende øget opmærksomhed på disse krav fra Ministeriet for Forskning, Innovation og Videregående Uddannelser er de hjemlige universiteters strategi for forvaltning af forskningsdata af væsentlig betydning. Med henblik på at afdække universitetets indsats på dette område vil projektet gerne gennemføre et interview med en ledelsesrepræsentant. Interviewet vil være af maksimalt en times varighed, og resultaterne herfra vil sammen med resultaterne fra tilsvarende interviews på de øvrige universiteter indgå i en rapport, der offentliggøres via DEFF senere på året. Baggrunden for interviewet er, at der i biblioteks- og universitetsverdenen gennem de seneste år er kommet øget fokus på, hvorledes forskere kan gemme data undervejs i forskningsprocessen ( data storage ) og bevare disse data permanent ( data preservation ) og i det omfang det er relevant også tilgængeliggøre dem for andre forskermiljøer og offentligheden. Det har hidtil ikke været muligt at finde dokumenter, der belyser universitetets politik og praksis på dette område. Findes der dokumenter, der kunne være væsentlige som baggrund for interviewet, hører vi derfor gerne nærmere. Det kan f.eks. være dokumenter om eksisterende/kommende forskningsinfrastrukturer (her tænkes især på dataarkiver og strategier for databevaring) eller universitetets planer for eller overvejelser vedrørende forvaltning af forskningsdata ( dataforvaltningsplaner, data management plans ). Projektleder Diba Markus, Statsbiblioteket, vil stå for den praktiske gennemførelse af interviewet bistået af en repræsentant fra det lokale forskningsbibliotek. Universitetsledelsen bedes derfor senest d. 9. maj 2012 svare Diba Markus (dma@statsbiblioteket.dk) vedrørende deltagelse i undersøgelsen. Interviewspørgsmålene er vedhæftet. Jeg håber at høre fra dig. Med venlig hilsen Bo Öhrström Kontorchef DEFF Kulturstyrelsen H.C. Andersens Boulevard 2 1553 København V Danmark Telefon +45 3373 3373 E-post deff@kulturstyrelsen.dk www.deff.dk 20

Spørgsmål til universitetsledelsen vedr. forvaltning af forskningsdata. Projektet, der refereres til i nedenstående spørgeguide, er projektet Forvaltning af forskningsdata, som støttes af Danmarks Elektroniske Fag- og Forskningsbibliotek, DEFF. 1. Understøtter universitetet forskningsprocessen mhp. at opbevare forskningsdata (data storage)? Hvis ja: Hvordan/er der konkrete eksempler? Hvad er motivationen? Krav udefra eller indefra? Hvis nej: Hvorfor ikke? Alternativt: Har universitetet formuleret en politik på området? Er der i givet fald noget på skrift om den, som dette projekt må få adgang til? 2. Understøtter universitetet forskningsprocessen mhp. at sikre forskernes data for fremtiden (data preservation)? Hvis ja: Hvordan/er der konkrete eksempler? Hvad er motivationen? Krav udefra eller indefra? Hvis nej: Hvorfor ikke? Alternativt: Har universitetet en politik på området? Er der i givet fald noget på skrift om den, som dette projekt må få adgang til? 3. Har universitetet, på linje med initiativer fra andre universiteter i bl.a. Europa, USA og Australien, gjort sig nogle overvejelser mht. at etablere eget dataarkiv eller indgå i et samarbejde omkring et? Hvis ja: Er det institutionelt eller fagspecifikt? Nationalt eller internationalt? Er der noget på skrift om disse overvejelser, som dette projekt må få adgang til? Hvis nej: Hvorfor ikke? 4. Har universitetet tiltag i forhold til at sikre forskernes opmærksomhed på spørgsmålet om bevaring, synliggørelse og evt. tilgængeliggørelse af forskningsdata? Tiltag kunne f.eks.omfatte informationskampagner, kurser (f.eks. som en del af forskeruddannelsen) eller konsulentbistand. Hvis ja: Hvordan er dette organiseret? Er der noget på skrift eller anden dokumentation omkring sådanne tiltag, som projektet må få adgang til? Hvis nej: Hvorfor ikke? 5. Indgår eksponering af forskningsdata som en del af universitets strategi? Det kan være på hovedområdeniveau eller som en del af en brandingstrategi etc. Hvis ja: På hvilken måde bistår universitetet den enkelte forsker eller forskningsgrupper med at synliggøre deres forskningsdata? Er der noget på skrift om dette strategiske element, som dette projekt må få adgang til? Hvis nej: Hvorfor ikke? 21

Bilag 9: Uddrag af spørgeskema til forskningsråd og fonde Universitetsledelserne blev stillet 5 spørgsmål. Vi vil bede jer kommentere på 4 af disse spørgsmål. Det sidste spørgsmål drejede sig om de enkelte universiteters informationspolitik overfor forskerne, hvilket kan være svært for andre at vurdere. Som kommentar til spørgsmål 1 og 2, vil vi gerne vide i hvor høj grad opbevaring og sikring af forskningsdata indgår i rådets vurdering af om et givent projekt bør modtage støtte. Vi vil også gerne vide om I mener, at det vil spille en større rolle for rådets støttetilsagn fremover. Hvis rådet har formuleret en specifik politik vil vi gerne have mulighed for at se denne. Spørgsmål 1 til universitetsledelserne: Understøtter universitetet forskningsprocessen mhp. at opbevare forskningsdata (data storage)? Hvis ja: Hvordan/er der konkrete eksempler? Hvad er motivationen? Krav udefra eller indefra? Hvis nej: Hvorfor ikke? Alternativt: Har universitetet formuleret en politik på området? Er der i givet fald noget på skrift om den, som dette projekt må få adgang til? Spørgsmål 2 til universitetsledelserne: Understøtter universitetet forskningsprocessen mhp. at sikre forskernes data for fremtiden (data preservation)? Hvis ja: Hvordan/er der konkrete eksempler? Hvad er motivationen? Krav udefra eller indefra? Hvis nej: Hvorfor ikke? Alternativt: Har universitetet en politik på området? Er der i givet fald noget på skrift om den, som dette projekt må få adgang til? Til kommentarer 22

I forhold til det 3. spørgsmål vi stillede vil vi gerne vide om rådet har en holdning til hvorvidt der bør etableres et nationalt dataarkiv eller om dataarkiver børe være forankrede på de enkelte universiteter eller forskningsinstitutioner. Spørgsmål 3 til universitetsledelserne: Har universitetet, på linje med initiativer fra andre universiteter i bl.a. Europa, USA og Australien, gjort sig overvejelser mht. at etablere eget dataarkiv eller indgå i et samarbejde omkring et? Hvis ja: Er det institutionelt eller fagspecifikt? Nationalt eller internationalt? Er der noget på skrift om disse overvejelser, som dette projekt må få adgang til? Hvis nej: Hvorfor ikke? Til kommentarer I forhold til det sidste spørgsmål vi stillede vil vi gerne vide om rådet mener, at forskningsdata bør eksponeres af universiteterne? Spørgsmål 5 til universitetsledelserne: Indgår eksponering af forskningsdata som en del af universitets strategi? Det kan være på hovedområdeniveau eller som en del af en brandingstrategi etc. Hvis ja: På hvilken måde bistår universitetet den enkelte forsker eller forskningsgrupper med at synliggøre deres forskningsdata? Er der noget på skrift om dette strategiske element, som dette projekt må få adgang til? Hvis nej: Hvorfor ikke? Til kommentarer 23

Bilag 10: Program for workshoppen 31/10 Data management Workshop på Statsbiblioteket Den 31/10 2012 9.30 til 15.00 Program: 9.30 til 10.00: Registrering 10.00 til 12.00: Oplæg - Velkommen ved Sektionsleder Erik Hofmeister, Studie- og Forskningsservice, Statsbiblioteket - Charlotte Autzen, Københavns Universitet, ordstyrer - 10.00 til10.30: Martin Donnelly, Digital Curation Center (UK): Oplæg om data management planer i et internationalt perspektiv - 10.30 til 11.00: Anne Sofie Fink Kjeldgaard, Dansk Data Arkiv (DDA): Oplæg om DDA og forvaltning af forskningsdata - 11.00 til 11.30: Niels Ole Finnemann, Aarhus Universitet: Oplæg om humanistisk erfaring med forvaltning af forskningsdata - 11.30 til 12.00: Åke Nordlund, Københavns Universitet: Oplæg om naturvidenskabelig erfaring med forvaltning af forskningsdata 12.00 til 13.00: Frokost 13.00 til 14.00: Oplæg: - 13.00 til 13.30: Børge Obel, DeIC/Aarhus Universitet. DeIC og forvaltning af forskningsdata - 13.30 til 14.00: Jesper B. Thestrup, Statsbiblioteket. Fremlæggelse af projektets konklusioner og anbefalinger 14.00-14.15: Kaffe 14.15 til 15.00: Opsamling og diskussion Oplæggene er ret korte. Spørgsmål gives til ordstyreren og besvares/diskuteres i fællesskab mellem 14.00 og 15.00. Oplæg og diskussion foregår på engelsk. 24

Bilag 11: Det Frie Forskningsråds svar: På de næste tre sider gengiver vi det Frie Forskningsråds svar på vores henvendelse. 25

26

27

28

Bilag 12: Datamanagement i Skandinavien: Finland, Norge, Sverige Et fælles træk for de tre lande - og Danmark - er, at de har veletablerede nationale dataarkiver, hvis opgaver er koncentreret om bevaring, formidling og tilgængeliggørelse af forskningsdata, som del af datamanagement. Repræsentationen af samfundsvidenskabelige data i arkiverne er særligt stærk, men også sundhedsvidenskabelige og humanistiske data forefindes. For alle arkiverne gælder, at der er stor opmærksomhed på beskyttelse af personfølsomme data. Brugerne af de arkiverede data er forskere og studerende, som udover dataadgang tilbydes forskellige andre tjenester, såsom vejledning og adgang til forskellige analyseredskaber. Som del af formidlingsaktiviteterne indgår vejledning og undervisning i forskningsetik, juridiske problemstillinger, herunder f.eks. beskyttelse af persondata, men der findes ifølge det oplyste ikke formaliserede uddannelses- eller undervisningstilbud i datamanagement. I nogle tilfælde kædes støtte fra forskningsråd sammen med krav om lagring af data i og formidling af disse via nationale dataarkiver. Et andet fælles træk er, at formidling ofte ses i sammenhæng med Open Access til forskningspublikationer. Finland Finlands Akademi (den nationale forskningsfond) anbefaler for de projekter, som finansieres heraf, at samfundsvidenskabelige data deponeres i FSD (Finnish Social Science Data Archive) til videre anvendelse i forskning og undervisning. En privat fond (Kone Foundation) anbefaler arkivering med Open Access til forskningsdata. Der er således ingen generel forpligtelse for forskere - som del af betingelse for bevilling eller lignende - til at tilgængeliggøre forskningsdata. I Undervisnings - och Kulturministeriets Information för användning. Vägledning till utnyttjande av elektroniska datamaterial för forskning (2011) præsenteres en politisk vision, som sammenkæder finansiering, lovgivning og teknologi: Datamaterial som uppkommit med stöd från offentlig finansiering styrs av lagstiftning och tydliga gemensamma användningsvillkor som särskilt beaktar dataskydd. Dessa material är enkla och i regel kostnadsfritt tillgängliga för forskningsändamål. Långsiktig utveckling och finansiering av en driftskompatibel informationsinfrastruktur garanterar att existerande och kommande datamaterial beskrivs och tillgängliggörs med hjälp av lättanvända tjänster i datanätet 42. I Finland kræves en datamanagement plan ( materialhanteringsplan ) for projekter finansieret af Finlands Akademi. Planen skal omfatte redegørelse for indsamling, anvendelse, bevaring og beskyttelse, tilgængeliggørelse og rettigheder til materialet 43. Der stilles ikke generelt krav om Open Access til 42 http://www.minedu.fi/opm/julkaisut/2011/tiekartta_tutkimuksen_sahkoisten_tietoaineistojen_hyodyntamiseksi.ht ml?lang=sv&extra_locale=sv 43 http://www.aka.fi/tiedostot/hakuilmoitukset/hakuilmoitus_syyskuu_2012_en.pdf 29

forskningsartikler, men forskerne opfordres til at sørge for dette. Dog kræver Helsinki universitet forskernes deponering af artikler i et åbent arkiv. Norge Forskningsrådet (Norges forskningsråd) kræver for projekter inden for samfundsvidenskab, humaniora, sundhed og miljø, at forskningsdata overføres til Norsk Samfunnsvitenskaplig Datatjeneste (NSD), som bevarer og forvalter - herunder tilgængeliggør - disse data. Data inden for sundhedsområdet findes også i andre registre og er generelt mindre tilgængelige end andre -. Videnskabelige artikler, der udspringer af forskningsrådsfinansierede projekter, skal arkiveres med Open Access. Forskningsrådet stiller ikke krav om en decideret datamanagement plan som del af ansøgning om bevillinger 44. I Stortingsmelding nr. 30 (2008-2009) fra Kunnskapsdepartementet fremhæves det, at Åpen tilgang til forskningsdata og forskningsresultater er nødvendig for å øke tilgangen til eksisterende kunnskap og sikre samfunnet en uavhengig kunnskapsbase. Tilsvarende fremhæves, at alle vitenskapelige artikler som er resultat av offentlig finansiert forskning, skal være åpent tilgjengelige. Regjeringen forventer at andelen offentlig finansierte vitenskapelige artikler som er åpent tilgjengelig, skal øke betydelig 45. Dette ses som liggende i forlængelse af OECD s principper for adgang til forskningsdata (2007), der er produceret med offentlig finansiering 46. NorStore er Norges nationale datainfrastruktur, der skal sikre større kapacitet og sikkerhed i langtidsbevaring af forskningsdata. Dette må antages at spille en vigtig rolle fremover 47. Sverige Forskere opfordres til at arkivere og tilgængeliggøre forskningsdata i Svensk Nationell Datatjänst (SND) i overensstemmelse med OECD s principper. De arkiverede data kan med forskerens samtykke stilles til rådighed for forskning og undervisning, selve adgangen til data kan gradueres. Tjenesten Open data muliggør direkte downlod af visse data og onlineanalyser. Det svenske Vetenskapsrådet (VR) kræver fra 2012 en datapubliceringsplan for alle støttede projekter, hvor denne bl.a. skal omfatte indsamling af data og beskrivelse af disse (metadata) samt plan for bevaring og publicering. Formålet er her at sikre bevaring og genanvendelse af forskningsresultater. I datapubliceringsplanen forudsættes, at forskningsdata gøres tilgængelige via deponering hos SND eller i fagspecifikt arkiv, men regler derom findes ikke. Det er oplyst (personlig forespørgsel), at datapubliceringsplanen forventes erstattet af en egentlig data management plan 48. Forskningsresultater fra projekter støtte af VR skal publiceres med Open Access. 44 http://www.forskningsradet.no/no/artikkel/forskningsradets+prinsipper+for+apen+tilgang+til+vitenskapelig+publiser ing/1238627853241 45 http://www.regjeringen.no/nb/dep/kd/dok/regpubl/stmeld/2008-2009/stmeld-nr-30-2008-2009- /12.html?id=556675 46 http://www.oecd.org/dataoecd/9/61/38500813.pdf 47 http://www.norstore.no/ 48 http://www.vr.se/download/18.5906c28513617edd69ecc/1332149614956/datapubliceringsplan_mall.pdf 30