Vedr. infrastruktur for analyse af registre og store datamængder KOR

Relaterede dokumenter
e-infrastruktur for registerforskning

Preben Bo Mortensen, professor, PI ipsych Jeppe Klok Due, specialkonsulent, KOR

Preben Bo Mortensen, professor, ipsych Jeppe Klok Due, specialkonsulent, KOR

Dansk registerforskning

> Danmarks nationale supercomputere: Abacus2.0, Computerome og Kulturarvscluster

Specialkonsulent Jeppe Klok Due, KOR

DeIC strategi

DeIC strategi

Registerforskning

FORSKERSERVICE PÅ STATENS SERUM INSTITUT. Marianne Gjerstorff

Afrapportering af KORs undersøgelse af datavarehuse

DeIC Danish e-infrastructure Cooperation. DeIC escience Komite 22. november 2017

DANSKE UNIVERSITETERS HOLDNING TIL INFRASTRUKTUR OG REGISTERFORSKNING

Projektdatabaser på Forskermaskinen

Vejledning. Tværinstitutionelt samarbejde mellem regioner og universiteter vedrørende sundhedsdata. September 2018

Vejledning til at ansøge om autorisation til Forskermaskinen

OPENs retningslinjer for hjemsendelse af analyseresultater fra Sundhedsdatastyrelsens forskermaskine & Danmarks Statistiks forskerordning

Sundheds- og Ældreudvalget L 184 endeligt svar på spørgsmål 36 Offentligt

Å rsrapport Rigsarkivet som leverandør af data, service og vejledning til den sundheds - og samfundsvidenskabelige forskning

MGR-lite Kvalitetsdeklaration

Centrale registre relateret til Sundhed i Danmarks Statistik. Jørn K. Petersen Forskningsservice

Kobling af survey og registerdata

Sundheds- og Ældreudvalget SUU Alm.del endeligt svar på spørgsmål 562 Offentligt

Forskerservice - Brugerundersøgelse

Følge udviklingen inden for de enkelte forskningsområder, herunder særligt de prioriterede forskningsområder

DATASIKKERHED. på TrygFondens Børneforskningscenter

Diabetes Impact Study

Vedtægter. for forskerskolen. Danish Cardiovascular Research Academy. (DaCRA) ved. Københavns Universitet. Det Sundhedsvidenskabelige Fakultet

Perspektiver og ønsker for de private firmaers anvendelse af datasamlingen. v/jakob Bjerg Larsen, chefkonsulent, Lif LVS årsmøde 23.

DES i STARS. Reimar W. Thomsen Bestyrelsen, Dansk Epidemiologisk Selskab

CENTER FOR KLINISKE RETNINGSLINJER

Aktiviteter og resultater

Vedtægter for DANBIO Dansk Reumatologisk Database

Referat DeiC bestyrelsesmøde

Open Science, open access, open data - Rigsarkivet som aktør indenfor e-science

Anvendelse af digitale ressourcer i dansk forskning!

Hvad kan OPEN hjælpe med?

Psykiatrisk Dialogforum

DeIC Danish e-infrastructure Cooperation

Introduktion til Danmarks Statistiks Forskningsservice med fokus på datasikkerhed. Leif Jensen Forskningsservice

DNKK 29. AUGUST 2013 POUL ERIK HANSEN

Esben N. Flindt, platformskoordinator Danske Regioner Personlig Medicin 10. december Danske Regioner - Personlig Medicin 10/

Kombination af surveys og registre: Muligheder og begrænsninger. Charlotte Nielsen Forskningsservice

Visioner og strategier for forskning i klinisk sygepleje i Hjertecentret mod 2020

Adgang til mikrodata i Danmarks Statistik - Datasikkerhed. Forskningsservice

Hvordan håndterer Danske Regioner registerdata og Big Data?

Det bliver lettere at se forskel på syge og raske gener i Danmark

DATASIKKERHED PÅ IFS VERSION

Godkendelse af ny uddannelse

Sundheds- og Ældreudvalget SUU Alm.del Bilag 116 Offentligt

Kvantitative evidensbaserede metoder, hvordan?

2. møde i bestyrelsen for den nationale strategi for Personlig Medicin

2. Formål 3. Ansvarsfordeling 4. Parter 5. Ledelsesstruktur

KOM INDENFOR I DANMARKS NATIONALE BIOBANK

Udvidet forskeradgang til projektdatabaser under Danmarks Statistiks forskerordninger.

DST SIKKERHED OG ANVENDELSE

Forskerservice. Vilkår under Persondataforordningen v/ Ane Dahl Jørgensen 24. maj 2018

Farmakoepidemiologi Den grimme ælling

Referat Bestyrelsesmøde 8. september 2017

NYT. Indholdsfortegnelse. Opdateringer af registre i Forskningsservice FRA FORSKNINGSSERVICE

Retningslinjer for hjemsendelse af analyseresultater fra Danmarks Statistiks forskerordning

Guide til registerforskning

I 2017 indkom der i alt 728 ansøgninger, fordelt på hhv. 485 ansøgninger om levering af data og 243 godkendelser og andet.

Adgang til Mikrodata i Danmarks Statistik. Jørn K. Petersen Forskningsservice

Steno Diabetes Centre i Danmark: Hvad er visionen og hvilken rolle har sygeplejerskerne i fremtidens diabetesbehandling?

Adgang til registerdata hos Sundhedsdatastyrelsens

Telemedicin Udfordringer og muligheder. Ole Skøtt, Dekan, professor, dr. med. Det sundhedsvidenskabelige Fakultet

DST SIKKERHED OG ANVENDELSE

Redegørelse om fejlaflevering af anbefalet brev indeholdende personoplysninger.

Strategi 2020 Helhed - Sammenhæng - Tryghed

VEJLEDNING I ANSØGNING

Vejledning til udfyldelse af anmeldelsesskemaet for Sundhedsvidenskabelig

Inddragelse af forskning i sygeplejerskesuddannelsen og fastholdelse af praksisfokus

Registerforskning. Registerforskning. Rapport fra udvalget vedrørende reorganisering og styrkelse af registerforskningen

Introduktion til Forskningsservice i Danmarks Statistik

Et medlemskab af SNU koster: 200,- kr. for ordinære medlemmer 100,- kr. for studerende 500,- kr. for virksomheder

Bliv sponsor! DeIC konference 2016

Beskrivelse af stillingen som institutleder ved Institut for Psykologi, Det Sundhedsvidenskabelige Fakultet ved Syddansk Universitet.

Spørgsmål og svar om Personlig Medicin og Nationalt Genom Center

Nationalt Center for Cancer Immunterapi CCIT-Denmark

Institut for Regional Sundhedsforskning. Sundhedsfaglig Forskning og Uddannelse i Region Syddanmark NØGLETAL

FRA KAMPEN OM SUNDHEDSDATA TIL DIALOGEN OM SUNDHEDSDATA. Helle Ulrichsen. Formand for STARS* - Strategisk Alliance for Register- og Sundhedsdata

Sygehus Lillebælts forskningsstrategi Forskning for og med patienterne

Lægeforeningen 2008 Trondhjemsgade 9, 2100 København Ø Tlf.:

Sundhedsdataforskning Etiske udfordringer. Søren Holm University of Manchester & Universitetet i Oslo & Aalborg Universitet

FORSKNINGSPROGRAM Forskning inden for MVU-professionerne

Amager og Hvidovre Hospital. Hvordan går det med forskningen på Amager og Hvidovre Hospital

Adgang til registerdata hos Sundhedsdatastyrelsens

Aftale mellem regeringen (Venstre, Liberal Alliance og Det Konservative Folkeparti), Dansk Folkeparti og Radikale Venstre om

Personlig medicin: Styr på teknologien og de kloge hoveder

Forskningsstrategi OUH Svendborg Sygehus

ER DIT ØKONOMITEAM MED PÅ DEN DIGITALE BØLGE?

OPENs rolle i registerforskning ved OUH: Aktuelt og fremadrettet

Den danske infrastruktur for sundhedsdata - merværdi og fremtidige planer

Center for Sygeplejeforskning - Viborg

Guide til registerforskning

Nyhedsbrev fra dchi. s. 6 kommende arrangementer.

Hvordan fremmer vi Danmark som escience nation? Lene Krøl Andersen DeIC escience Kompetencecenter

Visioner og strategier for forskning i klinisk sygepleje i Hjertecentret mod 2020

Adgang til mikrodata i Danmarks Statistik. Charlotte Leolnar Reif Forskningsservice

Transkript:

DeiC Asmussens Allé, bygning 305 2800 Lyngby Dato: 1. september 2017 Vedr. infrastruktur for analyse af registre og store datamængder KOR Rigsarkivet Indstilling Det Koordinerende Organ for Registerforskning (KOR) vil anmode DeiC om at iindgå i et projekt, hvor KOR i samarbejde med Danmarks Statistik (DST), Computerome og forskningsprojektet ipsych vil lave analysemiljø, der giver mulighed for at analysere socioøkomomiske data fra DST koblet med big data. Årsagen, til at der er brug for dette projekt, er at det ikke kan lade sig gøre at analysere registerdata i kombinantion med big data i den eksisterende infrastruktur for registerforskning. For det første er der ikke tilstrækkelig beregnigns- og lagerkapacitet, for det andet giver DST af sikkerhedsgrunde kun adgang til data på individniveau på servere placeret fysisk i DST, men DST har hverken beregnings- eller lagerkapacitet til at behandle big data. Rigsdagsgården 9 1218 København K Telefon: 4171 7211 Mail: jkd@sa.dk Web: registerforskning.dk Sagsnr.: 16/15368 Formålet med projektet er, at lave et Proof of Concept (PoC), der giver mulighed for at koble meget store datamængder med regisiterdata fra DST på HPC anlægget Computerome samtidig med, at DST har fuld kontrol med koblingen af data samt hvem, der har adgang til DSTs data. ipsych, der er et af de højest profilerede genetiske forsknignsprojekter pt., leverer use case til projektet. ipsych har et akut behov for at kunne analysere biomarkører fra en meget stor population med sociale data om polulationen fra DST, men det er umuligt i det nuværende setup. Desuden har de alle de relevante tilladelser til at behandle data, og deres datasæt er placeret på Computerome. Det indstilles at anmodningen behandles hurtigt, da vi står i en særlig situation, hvor DST med initieringen af dette projekt, har åbnet op for at give forskerne muligheder, som DST ikke tidligere har været modne til. Hvis dette realiseres, vil det kunne understøtte forskning i verdensklasse, og give mulighed for at gennemføre forskningsprojekter, der ikke kan udføres i andre lande.

Impact Projektet vil være det største fremskridt for infrastruktur for registerforskning, siden forskerne fik online adgang til statsitikregistrene i år 2000. Projektet skal dokumentere, at det er muligt analysere registerdata sammen med store data mængder, samtidig med at dataansvarlige organisationers behov for datasikkerhed og kontrol bliver tilgodeset. Projektet vil kunne overføres til andre dataansvarlige organisationer, der har tilsvarende behov herunder Sundhedsdatastyrelsen (SDS), Rigsarkivet, Patientsikkerhedsstyrelsen, Regionernes Kliniske Kvalitetsdatabaser m.fl. Der er mange forskningsmiljøer, der efterspørger de muligheder, som dette PoC forventes at give, konkret har KOR været i kontakt med følgende større projekter: ipsych forsknikngsprojektet er baseret på BSS og det Sundhedsvidenskabelige fakultet AU, vores samarbejdspart er Professor Preben Bo Mortensen. Målet med projektet er at identificere årsager til de almindeligste psykiske lidelser ved at studere genetiske og miljømæssige påvirkninger. Dette forventes at kunen give bedre behandligsmuligheder. Roadmapprojektet Danish Research Data from the Social Sciences (DRDS), der er et samartbejde mellem bl.a. alle universiteterne under ledelse af professor Peter Ove Christensen fra CBS. De ønsker bl.a. at analysere enorme mængder transaktionsdata fra f.eks. Nets med registerdata fra DST. CPR ved det Sundshedsvidenskabelige fakultet på KU under ledelse af Professor Søren Brunak ønsker at korellere data om multimorbiditet fra sundhedsregistre og patientjournaler med patienternes socioøkonomiske fremtidsudsigter fra DSTs registre, hvilket potentielt kan give en bedre stratificering af patienterne, og skabe grundlag for behandling med personlig medicin. Metabolose centeret ved KU under ledelse af Tune Pers ønsker at træne algoritmer til at finde de diabetes 2 patienter, der har størst risiko for slagtilfælde, datagrundlaget består ideelt set af sygdomsregistre, genomiske data og socioøkomomiske data fra DST. Endelig vil f.eks. KOR selv få brug for et sådant setup, hvis der findes finansiering til at etablere multigenerationsregistret, der skal danne familierelationer tilbage i tiden før CPR-registret. Det setup, der bliver afprøvet med PoC, vil kunne anvendes i relation til Tryggve2, hvor en use case skal undersøge muligheden for at etablere og 2

analysere virtuelle datasæt, hvor data rent fysisk befinder sig i forskellige lande. Denne løsning vil kunne danne forbillede for, hvordan der kan etableres en infrastruktur, der er baseret på federerede beregningsfaciliteter. For det første bliver data i et og samme miljø, hvorfor risikoen for læk af data minimeres. For det andet kan anvendelse og fiansiering deles mellem brugerne af beregningsfaciliteten. Projektet DST får en virtuel, dedikeret-cloud på Computerome, herunder kan der oprettes hvad der svarer til det, som DST kalder hostede servere til brugerne af løsningen. Brugernes eksisterende datasæt på Computerome skal linkes til DST-registre af en DST-medarbejder på DST-cloud, hvorefter de deidentificeres og overføres til forskernes hostede maskine. Data bliver på Computerome men DST har kontrol over adgang og kobling. Kommunikation mellem DST og Computerome foregår via en dedikeret forbindelse på forskningsnettet. Opgaven KOR anmoder om, at DeiC bidrager med finansiering og ekspertise, således at: Computerome leverer infrastruktur og specialiseret teknisk kompetencer vedr.: - Opsætning af cloudmiljø - Drift af cloudmiljø i ca. 6 månder - Vejledning af Danmarks Statistik vedr. cloudmiljø Samt at DeiC foranlediger: - Opkobling af DST på forskningsnettet - Vejledning og review i forbinbdelse med projektet KOR bidrager selv med finansiering af DSTs del af projektet samt overordnet projektkoordinering. Omfang KOR har faciliteret workshops med Danmarks Statistik, Computerome, ipsych og DeiC, på disse workshops er deltagerne kommet frem til flere mulige scenarier, der vil der giver forskerne de muligheder, de har behov for, 3

samtidig med at det tilfredsstiller DSTs behov for sikkerhed og kontrol med forskernes analysebehov. Der er et konkret finansieringsbehov, for at få projektet sat i gang, nu da alle relevante parter er samlet om at lave et PoC. Men da det er en agil proces, at finde den rette løsning, er det vanskeligt at opstille et konkret budget på nuværende tidspunkt. Hvis DeiC er indstillet på at bidrage til projektet, så de indledende undersøgelser kan blive sat i gang, vil vi femsende budget i efteråret 2018. Baggrund Det Kordinernede Organ for Registerforskning KOR er et rådgivende organ under Uddannelses- og Forskningsministeriet. KOR består af 10 aktive forskere fra ledende forskningsmiljøer fra alle landets universiteter. Formålet med KOR er at stimulere og styrke dansk registerforskning. KOR medvirker til at skabe større sammenhæng og koordination omkring både danske og internationalt relaterede forskningsaktiviteter vedrørende registre, databaser og surveydata. KOR arbejder for at forbedre dialogen mellem de dataansvarlige og forskerne og medvirker til, at forskningsressourcerne inden for registerforskningen anvendes så effektivt som muligt, og at uhensigtsmæssige barrierer undgås. Infrastruktur Infrastrukturen for registerforskning udgøres i hovedsagen af forskerserviceenheder hos hhv, Danmarks Statistik og Sundhedsdatastyrelsen, der er dataansvarlige for de vigtigste regsitre i Danmark. Forskerne kan analysere data på offentlige forskermaskiner hos en af de to organisationer. Forskningsmiljøer, der har behov for beregnings- eller lagerkapacitet ud over de fælles forskermaskiner, kan købe deres egen hostede server, der placeres fysisk i og driftes af en af de to organisationer. Dataadgang Danmarks Statistik leverer af principå ikke individdata ud af huset, det betyder, at forskere, der skal anvende data fra DST i kombination med andre datasæt, skal uploade deres egne data til DST, som vil forestå koblingen af de eksterne datasæt med DSTs statsitikregistre. 4

Sundhedsdatastyrelsen udleverer individdata til forskerne efter anmodning. Men de vil indskrænke denne mulighed meget i 2018, hvor de vil have så mange forskere som muligt over på deres egen forskermaskine. Udfordringen KOR har konstateret, at flere forskere, har behov for at kombinere variable fra registrene med store datamængder eller at anvende analysemetoder, som ikke kan tilfredsstilles indenfor rammerne af den nuværende infrastruktur for registerforskning. Problematikken består i, at DST (og snart SDS) ikke udleverer data til beregningsfaciliteter uden for deres egen organisation, og ikke selv råder over tilstrækkelig beregningskapacitet til at analysere f.eks. biologiske data. I praksis laver forskerne derfor nogle meget smalle datasæt med et meget begrænset antal biomarkører, som de kobler til socioøkonomiske markører i DST, hvilket kun giver mulighed for relativt simple analyser af samvariation mellem f.eks. arv og miljø. I de sundhedsfaglige miljøer iagttager KOR en voksende interesse for at undersøge om årsager til sygdomsbilleder kan tilskrives arv eller miljø. En systematisk undersøgelse af sådanne spørgsmål er blevet muligt, fordi det er blevet praktisk og økonomisk muligt at kortlægge den menneskelige arvemasse for mange individer. Dette kan give afgørende informationer til brug for forebyggelse og mere lighed i sundhed og livsvilkår. Denne type forskning kræver, at de biologiske markører for f.eks. sygdomseksponering kan kombineres med hændelser om f.eks. patientforløb, uddannelse og indkomst, som kendes fra registrene. Der er også en voksende interesse i de samfundsfaglige forskningsmiljøer for at kombinere socioøkonomiske variabler med Big Data såsom konteringsoplysninger, selvrapporterede sundhedsdata, virksomhedernes ERP-systemer, hvilket der heller ikke er kapacitet til i den nuværende forskningsinfrastruktur for registerforskning. Ligeledes ses en forøget interesse for epidemiologi indenfor de bioinformatiske forskningsmiljøer, hvor de ved anvendelse af machine learning metoder på registerdata træner algoritmer til at undersøge sammenhænge i meget store datasæt, eventuelt i kombination med biologiske data. Disse metoder kan ikke anvendes i tilstrækkelig skala i den nuværende infrastruktur for registerforskning. 5