Databehandling pa Forskermaskinen

Relaterede dokumenter
Databehandling pa Forskermaskinen

Projektdatabaser på Forskermaskinen

FORSKERSERVICE Sikkerhed på Forskermaskinen

Guide til registerforskning

Guide til registerforskning

OPENs retningslinjer for hjemsendelse af analyseresultater fra Sundhedsdatastyrelsens forskermaskine & Danmarks Statistiks forskerordning

Arbejde på forskerserverne

Arbejde på forskerserverne

DST SIKKERHED OG ANVENDELSE

FORSKERSERVICE PÅ STATENS SERUM INSTITUT. Marianne Gjerstorff

Vejledning i adgang til registerdata hos Sundhedsdatastyrelsens Forskerservice

DST SIKKERHED OG ANVENDELSE

Sundheds- og Ældreudvalget SUU Alm.del endeligt svar på spørgsmål 562 Offentligt

HOFTEALLOPLASTIK - DATAUDTRÆK OG IMPORT TIL EXCEL

Vejledning til at ansøge om autorisation til Forskermaskinen

Vejledning. Tværinstitutionelt samarbejde mellem regioner og universiteter vedrørende sundhedsdata. September 2018

Rapport generator til Microsoft C5

Vejledning til registrering som bruger til EudraCT results

Danmarks Statistik. Retningslinjerne for brug af Forskermaskiner Institut for Folkesundhed Aarhus Universitet

Adgang til mikrodata i Danmarks Statistik - Datasikkerhed. Forskningsservice

REGISTRE OG SUNDHEDSDATA I DANMARK DATA TILBAGE TIL SUNDHEDSVÆSNET OG DATA TIL GAVN FOR PATIENTEN POUL ERIK HANSEN

SAS formater i Danmarks Statistik

Vejledning om videregivelse. af personoplysninger til brug for forskning og statistik

Vejledning til udfyldelse af anmeldelsesskemaet for Sundhedsvidenskabelig

VEJLEDNING TIL ANVENDELSE AF DATALEVERANCER

DANSK SKOLEDATA APS. Tlf DSA-Ventelisten

Dokumentation af sikkerhed i forbindelse med databehandling

NYT. Indholdsfortegnelse. Opdateringer af registre i Forskningsservice FRA FORSKNINGSSERVICE

Hvad er SkyDrive Pro og hvordan bruges det?

Vejledning i udtræk fra Sundhedsstyrelsens registre

Vejledning til hjemsendelse af filer

Call Recorder Apresa Brugermanual

Adgang til registerdata hos Sundhedsdatastyrelsens

Vejledning til udfyldelse af ansøgningsskema vedrørende Kvalitetsudviklings- og forskningsprojekter

Skriftlig opgave. Designtanker i database-nære systemer

Samspillet mellem databaser og kort styres af GeoCAD programmet GeoDB.

Vejledning til udfyldelse af anmeldelsesskema til Datatilsynet

Retningslinjer for ansøgning om adgang til lægemiddeldata hos Danmarks Statistik og Sundhedsdatastyrelsen

Registre. Øjvind Lidegaard Gynækologisk klinik Rigshospitalet

Retningslinjer for hjemsendelse af analyseresultater fra Danmarks Statistiks forskerordning

Centrale registre relateret til Sundhed i Danmarks Statistik. Jørn K. Petersen Forskningsservice

ITSprint. Sådan printer du vha. print.supportcenter.dk ITS

Projekt DATA step view

09/ Version 1.4 Side 1 af 37

Bestilling af register i NSP stamdataservicen. - Tilskudsansøgnings stamdata. Dato: Version: 0.1 Udarbejdet af: NSI. National Sundheds-IT

Pralemappen.dk Din online portfolio Brugerhåndbog til elever Brugerhåndbog til elever

Sådan logger du ind... 2 Hvilke mapper kan du tilgå... 3 Visning af eksempel af en fil... 5 Sådan deler du en fil... 7 Se hvad du deler med andre...

Redegørelse om fejlaflevering af anbefalet brev indeholdende personoplysninger.

Vejledning og ansøgningsskema vedr. forskningsadgang til data fra HNPCC-registret

Vejledning til Teknisk opsætning

Vejledning til udfyldelse af ansøgningsskema vedrørende Kvalitetsudviklings- og forskningsprojekter (Regioner)

Document Capture til Microsoft Dynamics NAV. Quick Guide til RTC version 3.50

Vejledning til udfyldelse af ansøgningsskema vedrørende Kvalitetsudviklings og forskningsprojekter (Regioner)

Buildvejledning (Release, patch og testversion)

Installation og Drift. Aplanner for Windows Systemer Version

TILLÆG TIL MANUAL Excel-indlæsning i Vvskatalogets administrationssystem

Næsgaard Markkort/AgroSat

Sådan afleverer du forskningsdata til arkivering

Retningslinjer for hjemsendelse af analyseresultater fra Danmarks Statistiks forskerordning

AuthorizationCodeService

VDI OG CRYPTSHARES VERSION 2.0

SAS Scalable Performance Data Server

Introduktion til Oracle, Datalogi, RUC Af: Jens Lauterbach 2002

Vejledning: Fakturablanketten på Virk.dk

TeamShare 2.1 Versionsnoter Oktober 2009

UPLOAD, DOWNLOAD OG AFLEVER OPGAVER

Statistikudtræk. 1 Introduktion

Opsætning af Ikketilstedeassistent, Opbevaringspolitik og omdirigering af post fra Windows Live til alternativ konto.

RETNINGSLINJERNE FOR PERSONFØLSOMME

Transkript:

Databehandling pa Forskermaskinen Indhold Grundregistre... 2 Opdatering af grundregistre... 2 Dataplacering og dataadgang på Forskermaskinen... 3 Views og populationer... 3 Adgang til data via SAS... 4 Adgang til data via Stata... 4 Fastfrysning af data... 4 Projektmappen... 4 Den personlige brugermappe... 5 Transfermappen... 5 Workmappen... 5 Hjemsendelse af filer... 5 Eksterne data til projektet... 6 Udtræk fra Forskermaskinen... 7 Lukning af projekt og adgange... 7 God programmeringsskik i SAS... 8 Views og datasæt... 8 Begrænsning af variable... 8 Gode råd til udvikling af programmer... 9 Begrebsliste... 11 Side 1 af 11

Grundregistre Forskerservice indgår aftaler med de lokale registeransvarlige i Sundhedsdatastyrelsen om, hvilke registre der kan overføres til Forskermaskinen. Det sker ud fra følgende principper: Der skal foreligge hjemmel til at registeret må udstilles til forsknings- og statistikformål Indholdet i registeret skal være dokumenteret Brugernes efterspørgsel og behov Data skal være rådata med koblingsvariable som cpr-nummer, yder-nummer m.v. Opdatering af grundregistre Forskerservice indlæser registre hver måned på Forskermaskinens SQL-server (databasen), hvis de er opdateret i Sundhedsdatastyrelsens datavarehus I overførslen af registrene krypteres identificerende kolonner, som fx CPR-numre og Ydernumre. Registrene overføres i samme form som de ligger i Sundhedsdatastyrelsen datavarehus. Det betyder for en del af de større registre, at de er opdelt i flere tabeller (typisk opdelt efter år). Tabel over registre på Forskermaskinen. Navn Forkortelse Opdateringsdato Forskermaskinen Opdateringsfrekvens DWH Abortregistret ABR 25. * Børnedatabasen BDB 26. Månedligt Cancerregistret CAR 26. Årligt CPR-registret CPR3 1.+11.+21. Hverdage Dødsårsagsregistret DAR 25. Årligt DRG-afregningsdata DRG 27. Månedligt DUSAS DUSAS2_MDL 20. Månedligt Elektroniske omsorgsjournaler DRG_EOJ 28. Månedligt Fællesgrundlaget FGR 26. * IVF-registeret IVF 25. * Lægemiddelregistret LMS Ikke fast dato Månedligt Landspatientregistret (1977-2004) LPR 20. Statisk Landspatientregistret (2005-) LPR2_MDL 20. Månedligt Landspatientregistret uafsluttet (2005-) LPR2_MDL_UAF 20. Månedligt Medicinsk Fødselsregister MFR 22. Månedligt Minipas (2002-) MINIPAS 20. Månedligt Nationale diabetes register NDR 25. Opdateres ikke Omkostningsdatabasen ODB 3. Årligt Landsregistre ODB_LREG 2. Månedligt Patologiregistret PAT 8.+24. Ugenligt Sessionsregistret SER 26. Månedligt Sygesikringsregistret SSR 23. Månedligt Tvang i psykiatrien TIP 26. Månedligt Yderregistret YDR 25. Månedligt * Det er endnu ikke fastlagt, hvor hyppigt opdateringen vil finde sted. I SQL-skemaet hvor register-viewene ligger, findes også et view med titlen OpdateringsOversigt, som fortæller, hvornår hver enkelt tabel, som er tilgængeligt for projektet, senest er blevet indlæst.

Dataplacering og dataadgang på Forskermaskinen Registrene på Forskermaskinen er lagret i Forskerdatabasen. Herfra er det muligt at tilgå data med programmerne SAS og Stata fra applikationsserverne. På hvert projekt opretter Forskerservice dataadgang ved at danne projektspecifikke views i databasen, som forskeren får adgang til. Dette betyder, at alle projekter har adgang til samme version af registerdata som er overført fra datavarehuset. Fordelen ved at bruge views frem for faste tabeller er, at projektet automatisk vil have adgang til den seneste version af data. Figur 1 Forskermaskinen View View Register Register Fjernadgang Applikationsservere View Forskerdatabase Sundhedsstyrelsens datavarehus Views og populationer Når Forskerservice giver dataadgang foretages forskellige afgrænsninger jf. den dataspecifikation, som hører til projektet. Hvis et projekt for eksempel ønsker at forske i en bestemt populations registreringer i LPR, uploades populationen og der dannes views til de relevante tabeller, således at det kun er data på de udvalgte CPR-numre, der vil være tilgængelige for projektets brugere. Et projekts population kan afgrænses på forskellige måder: 1. Forskeren indsender en population af CPR-numre hvor der gives adgang til dennes populations oplysninger i udvalgte registre/variable. 2. Forskerservice danner en population på baggrund af de i dataspecifikationen angivne betingelser og der gives adgang til dennes populations oplysninger i udvalgte registre/variable. Når der gives adgang til registeroplysninger på en defineret population, vil populationen ikke ændre sig ved opdatering af grunddata, mens registreringerne på populationen, vil løbende ændre sig, når data i databasen opdateres. Eksempel Hvis en dataadgang fx består af samtlige data fra LPR på en population bestående af brystkræftramte kvinder, vil der ved hver registeropdatering automatisk komme flere oplysninger om populationen, men populationen vil ikke automatisk blive udvidet med de kvinder, som er blevet registreret med brystkræft siden sidste opdatering.

Ud over afgrænsningen på populationen, kan Forskerservice også afgrænse hvilke rækker, der medtages fra de enkelte registre, samt hvilke variable der medtages. Således kan Forskerservice give adgang til enkelte records i udvalgte registre for den givne population. I LPR kunne dette for eksempel være ved at udvælge kontakter med bestemte diagnosekoder tilknyttet. Adgang til data via SAS Når en bruger starter SAS, vil der automatisk blive dannet SAS-libnames, der peger på de skemaer i databasen, som man har adgang til. Figur 2 Navnet på det pågældende libname starter med IN og efterfølges af projektets nummer (fx IN01444). I libnamet vil brugeren se de definerede views, der fremstår som SAS-tabeller. Man kan ikke skrive til IN-libnamet, da dette er views i databasen. Der vil også blive dannet et output libname til den tilknyttede projektmappe på F-drevet (fx OUT01444). Se eksempel på figur 2. Adgang til data via Stata Fra Stata er det ikke muligt automatisk at se de tilgængelige views. For at trække en liste over de views et projekt har adgang til, kan man køre følgende kommando i Stata i én linje, hvor <ProjektID> sættes til det FSE-id som projektet har, fx FSEID00001444: ODBC load, exec("select name from sys.objects where schema_id=schema_id('<projektid>')") dsn("forskerdatabase") For at loade enkelte datasæt fra listen over tabeller bruges følgende linje, hvor <Tabelnavn> og <ProjektID> rettes til: ODBC load, exec("select * from <ProjektID>.<Tabelnavn>") dsn("forskerdatabase") Fastfrysning af data Udtræk af data sker mod views og ikke fysiske tabeller. Det betyder, at datagrundlaget ændres, når de bagvedliggende registre opdateres. Det kan derfor have den konsekvens, at en reproduktion af resultater ikke er muligt, medmindre data er fastfrossent. Brugere på projektet skal derfor selv sørge for at gemme en kopi af de nødvendige data. Dette kan i praksis gøres ved at gemme et udtræk af de udvalgte data i projektmappen på F-drevet. Projektmappen Projektmappen har stien: F:\Projekter\<ProjektID>. Projektmappen kan tilgås af alle brugere, som er tilknyttet projektet. Endelige datasæt skal placeres heri.

Der dannes som tidligere beskrevet automatisk et libname i SAS til mappen OUT<ProjektID>, f.eks. OUT01444. Der vil som standard være dannet to undermapper i projektmappen: \InputData eksterne data overført til projektet. Mappen er skrivebeskyttet. \OutputData kan anvendes hvis projektet skal have data leveret som klassisk. Der er fastsat en begrænsning af lagerpladsen (allokeret pladsforbrug) i projektmappen med udgangspunkt i abonnementstypen. Dette fremgår af dataspecifikationen. Det er ikke muligt at overskride den allokeret plads. Man vil få en fejlmeddelelse om at det ikke er muligt at gemme, hvis man overskrider den allokerede plads. Pladsallokering kan ændres undervejs i projektets levetid. Dette aftales med den abonnementsansvarlige for projekterne, der retter henvendelse til Forskerservice om ændringsønsker. Den personlige brugermappe Den personlige mappe har stien F:\Brugere\<brugernavn> På hver applikationsserver findes brugerens personlige mappe, hvori man har mulighed for at lagre programmer, der kan genanvendes på flere projekter. Andre brugere på Forskermaskinen (inkl. forskere på samme projekt) har ikke adgang til denne mappe. Den personlige mappe har en pladsbegrænsning på 100 MB og skal derfor ikke anvendes til at gemme data i. Det er ikke tilladt at flytte rådata mellem projekter på Forskermaskinen, hverken gennem den personlige brugermappe eller gennem transfermappen. Transfermappen Transfermappen har stien H:\ Transfermappen er tilgængelig fra alle Windows servere på Forskermaskinen og kan benyttes af brugeren, hvis der skal overføres data på tværs af applikationsservere, f.eks. fra SasForsker2 til StataForsker1. Det kan kun tilgås af brugeren selv. Transfermappen vil i SAS være mappet til libnamet Transfer. Data på transfer-drevet slettes automatisk efter syv dage. Workmappen Workmappen har stien W:\<brugernavn> Workmappen benyttes til temporære filer fx i SAS og Stata. Workmappen kan kun tilgås af den enkelte bruger. Data bliver automatisk slettet en gang om ugen. Hjemsendelse af filer Det er muligt for brugeren at hjemsende de færdige analyser og resultater fra Forskermaskinen. Dette forudsætter, at alle resultater er anonymiseret, så enkeltpersoner ikke kan genkendes i data. Dette gælder uanset datatypen, der hjemsendes (programmer, logs, tabeller og analyser). Brugeren skal altid foretage en manuel kontrol af alle filer inden de hjemsendes. Først herefter kan de flyttes til mailmappen, hvor de automatisk sendes fra. Brugeren må aldrig skrive direkte til mailmappen, da det således ikke er muligt at foretage en kontrol af filerne inden hjemsendelsen.

Mailmappen har stien F:\Brugere\<brugernavn>\mail. Med ti-minutters intervaller køres der et bagvedliggende script på serverne, der skanner indholdet mailmapperne og sender e-mails af sted til den af brugeren oplyste e-mailadresse med de relevante filer vedhæftet. Outputs kan kun sendes, hvis filen, F:\Brugere\<brugernavn>\Email.txt, indeholder en e- mailadresse. Når Forskerservice opretter en bruger, vil Email.txt blive oprettet og brugerens e-mailadresse vil placeres heri. Ønsker forskeren at ændre e-mailadressen, skal den rettes i tekstfilen. Der er begrænsninger på hvilke filer, der bliver sendt fra mailmappen. For billedfiler med filtyperne *.gph, *.pdf, *.png, *.wmf, *.tif, *.eps er der en størrelsesbegrænsning på 5 MB. For alle andre filtyper er der en størrelsesbegrænsning på 1 MB. Behandlede filer fra mappen \mail bliver gemt i en af disse mapper: Afsendte mails F:\Brugere\<brugernavn>\Sendte mails Ikke afsendte mails F:\Brugere\<brugernavn>\Ikke sendte mails. Det er vigtigt at være opmærksom på, at begrænsningerne på mailfunktionen er oprettet for at sikre, at personfølsomme oplysninger ikke bliver sendt ud fra Forskermaskinen. Forskerservice tager sikkerhedskopi af alle filer, der forsøges sendt ud fra maskinen. Vi laver løbende stikprøvekontrol af de filer, som er afsendt. Overtrædelser af reglerne kan betyde lukning af data- og brugeradgange for projekt og autoriseret institution. Er du i tvivl om du må hjemsende en fil, så henvend dig til Forskerservice. Det samme gælder i tilfælde, hvor du mener at reglerne kan være overtrådt. Eksterne data til projektet På Forskermaskinen er det muligt at koble registerdata fra en ekstern kilde eller egne indsamlede data til projektet. Dette betegnes som eksterne data. Ønsker du at få tilføjet eksterne data til projektet, som indeholder personidentificérbare oplysninger med henblik på, at de skal kobles med registerdata fra Sundhedsdatastyrelsen, forudsætter det, at du har en godkendt anmeldelser til behandling af data fra Datatilsynet. Af anmeldelsen skal det fremgå, at projektansvarlige er dataansvarlig og Forskerservice er databehandler. Er der alene tale om cpr-numre til en population, så er det ikke nødvendigt med en godkendt anmeldelse. Forskerservice kræver, at der vedhæftes en variabeloversigt inkl. beskrivelse for samtlige tabeller, der skal indlæses på Forskermaskinen. Vær opmærksom på, at det er et brud på Persondataloven at sende personfølsomme oplysninger over (ikke-sikret) e-mail. Data skal derfor sendes på usb-nøgle, cd-rom/dvd med post eller afleveres personligt efter aftale. Vi anbefaler, at data krypteres med en nøgle, der sendes separat på mail til Forskerservice. Når Forskerservice modtager data, så foretager vi først en test for at godkende indholdet inden det overføres til Forskermaskinen. I denne test bliver CPR-nummer og løbenumre krypteret. I data må der ikke være: Identificerbare oplysninger fx navne og adresser.

Fritekstfelter uanset indholdet af disse. Datetime variable. De skal leveres som date. Forskerservice tager timebetaling for at fjerne disse oplysninger. Det godkendte datasæt gemmes i projektmappen. Forskerservice gemmer den rå kopi af de indkomne data i 30 dage efter indlæsningstidspunktet. Har du filer med kode, der ikke indeholder personidentificérbare oplysninger, som du gerne vil have lagt i projektmappen, skal du sende dem til forskerservice@ssi.dk. Det er vigtigt, at filerne er gemt i et fladt filformat (fx filtyperne *.sas, *.do, *.txt), således at Forskerservice kan teste og indlæse dem. Alle overførsler af eksterne data afregnes til gældende timetakst medmindre andet er aftalt. Udtræk fra Forskermaskinen Ønsker du at få udtræk af rådata med CPR-nummer fra et projekt ud fra Forskermaskinen, kan dette ske ved en særskilt ansøgning via vores ansøgningsskema. Dette behandles som en Forskerservice klassisk ansøgning, hvilket kan betyde begrænsninger på hvad og hvor meget data der kan udleveres. Data skal placeres undermappen \OutputData i projektmappen. Data leveres enten på USB-nøgle eller kan overføres til Danmarks Statistik via FTP. Forskerservice gemmer den afkrypterede kopi af data i 30 dage efter leveringstidspunktet. Lukning af projekt og adgange En bruger kan sættes til inaktiv af Forskerservice. Dette kan ske i følgende tilfælde: Forskerservice beslutter at ophører adgang ved overtrædelse af brugeraftale Forskerservice beslutter at ophører adgang ved inaktivitet i mere end 12 måneder Forskerservice beslutter at ophører adgang for nye brugere, der ikke har logget på 3 måneder efter oprettelsen Når en bruger sættes til inaktiv, så det ikke længere er muligt at logge på Forskermaskinen. En brugeradgang til et projekt på Forskermaskinen kan lukkes. Dette kan ske i følgende situationer: Brugeren ønsker selv at ophører adgang Abonnementsansvarlig beslutter at ophører adgang Autoriseret institutionsansvarlig beslutter at ophører adgang Når en brugeradgang til et projekt lukkes, så vil brugeren ikke længere have adgang til projektmappe for det pågældende projekt. Et projekt på Forskermaskinen kan lukkes. Dette kan ske i følgende situationer: Den dataansvarlige beslutter at ophører adgang Datatilsynsgodkendelse for projekt udløber Autoriseret institution ophører Forskerservice beslutter at lukke adgang ved overtrædelse af regler for brug af Forskermaskinen Når en dataadgang ophører, slettes alle views til projektet i databasen og brugeradgange til projektmappe fjernes.

God programmeringsskik i SAS Denne guide skitserer nogle programmeringstekniske metoder, som kan hjælpe dig til at spare tid og serverplads ved at udnytte din allokerede plads på forskermaskinen. Vi gør opmærksom på at det er ikke tilladt at koble data på tværs af projekter. Overtrædelse af ovenstående er brud på Persondataloven. Views og datasæt Et view indeholder definitionen på en tabel. Derfor bliver data først indlæst i SAS, når der bliver forespurgt på indholdet i tabellen. Det betyder, at et view kun fylder ca. 30 KB, mens datasæt kan fylde mange GB. Views kan være gode at anvende ved forespørgsler op mod SQL-databasen. Her har du mulighed for at sammensætte data fra flere tabeller. Sådan kan du f.eks. definere et view i et proc sql-statement: proc sql; create view OUT999.ViDannerViews as select a.k_recnum, a.c_sgh, a.c_afd, b.* from IN999.LPR2_MDL_T_ADM2012 as a inner join IN999.LPR2_MDL_T_DIAG2012 as b on a.k_recnum = b.v_recnum; quit; Du kan også danne views i et datastep ved at specificere denne option i data-linien. Sådan kan du f.eks. danne et view i et datastep: data OUT999.DatastepView /view=out999.datastepview; set IN999.LPR2_MDL_T_ADM2012; run; Begrænsning af variable De fleste af grundregistre er organiseret i en enkelt tabel med mange variable. Det gælder f.eks. for Dødsårsagsregisteret og Cancerregisteret. I modsætning til disse registre er data i Landspatientregisteret normaliseret, så data er spredt ud over flere tabeller. Når data ikke er normaliseret, arbejder man med et datasæt med mange variable. Hvis du ikke har brug for alle variable, kan du spare plads og øge performance, ved at begrænse dig til de variable, du reelt behøver tidligt i din databearbejdning.

Sådan kan du f.eks. begrænse din databearbejdning ved at bruge keep-statements i et datastep og undlade at bruge Select * i proc sql: /* Her udvælges 5 variable fra tabellen T_ADM i LPR */ proc sql; create view VariabelBegr as select C_SGH, C_AFD, C_ADIAG, D_UDDTO, V_ALDER from IN999.LPR2_MDL_T_ADM2012; quit; /* Bemærk, at keep-statementet kan placeres efter in- og output datasættet, samt i en linje for sig selv. Programmet eksekveres hurtigst, hvis man indsætter keep-statementet efter input datasættet*/ Data VariabelBegr; set IN999.LPR2_MDL_T_ADM2012 (keep=(c_sgh C_AFD C_ADIAG D_UDDTO V_AL- DER)); run; Gode råd til udvikling af programmer Når du skal arbejde med store datasæt, er det smart at begrænse antallet af observationer i udviklingsfasen. Du kan begrænse antallet af observationer på to måder. Du kan enten gøre det generelt eller ved at begrænse dig til et enkelt programmeringsstep. Sådan kan du f.eks. bruge den generelle løsning ved at definere begrænsningen i dine options: /* Her sættes antallet af observationer, der indlæses til 1000 */ option obs=1000; /* Her indlæses alle observationer. */ option obs=max; Vær opmærksom på at ovenstående options kan give problemer, når du laver joins på baggrund af store datamængder, da du muligvis ikke får udtrukket nogle rækker. For at undgå disse problemer kan du sætte en begrænsning for det enkelte programmeringsstep. Da det er muligt at overse denne option, når man har færdigudviklet sit program, er det en god idé at tilføje lidt information om begrænsningen. På denne måde du kan fjerne begrænsningen igen, når du ønsker at arbejde med den fulde datamængde.

Sådan kan du f.eks. begrænse antallet af observationer under udvikling af programmet: /******************************************/ /* KUN 1000 OBSERVATIONER */ /******************************************/ proc sql outobs=1000; create view OBS1000 as select a.k_recnum, a.c_sgh, a.c_afd, b.* from from IN999.LPR2_MDL_T_ADM2012 as a inner join IN999.LPR2_MDL_T_DIAG2012 as b on a.k_recnum = b.v_recnum; quit;

Begrebsliste Allokeret pladsforbrug Tildelt pladskapacitet på server til projekt og bruger Bruger En bruger er en databehandler på et projekt. (fsk)brugernavnet består af 9 tegn fskxxxyyy. Brugeren oprettes i SEB-systemet og som Windows-bruger på Forskermaskinen. Brugeradgang En bruger tildeles adgang til projektmappe og brugermappe på applikationsserverne og dataadgang til views på Forskerdatabasen Dataadgang Er en tildelt adgang til alle views på projektet. Dataspecifikation En beskrivelse af hvilke registre, tabeller og variable der findes på projektet samt serverplacering, allokeret pladsforbrug og hvilke bruger- og dataadgange, der skal tildeles. Forskermaskinen Det miljø, hvor man som bruger får adgang til Forskerdatabasen (omtales som databasen), som indeholder grundregistre og applikationsservere med analysesoftware som SAS og Stata. Grundregistre De rå registerdata overført fra Sundhedsdatastyrelsens datavarehus. De omfatter en række sundhedsregistre samt CPR- og sessionsregister. Projekt En ansøgning behandlet af Forskerservice, hvor der findes en godkendt dataspecifikation. Hvert projekt har et unikt ProjektID som er 13 karakterer langt, hvoraf de første fem karakterer består af FSEID og herefter følger projektnummeret med foranstillede nuller f.eks. FSEID00000421. Projektdatabase En overordnet projektansøgning med et selvstændigt FSEID, der oprettes som et projekt hvor der er adgang til et bredere dataudsnit, som kan danne udgangspunkt for udtræk til konkrete projekter. Projektdatabaser er omtalt i en særlig vejledning. View Er en virtuel tabel, som giver brugeren mulighed for at læse opdateret data fra en grunddatatabel på Forskermaskinen. Forskerservice danner views til alle projektdatabaser, der afgrænser hvilke variable og hvilke rækker, som kan læses fra tabellen på det enkelte projekt. Forskellen på et view og en tabel er, at et view indeholder en definition af en tabel, og at indholdet først dannes, når der laves en forespørgsel mod view et. Views har den fordel, at data i view et automatisk bliver opdateret, når grundregistrene opdateres. Samtidig så undgår man at have mange kopier af de samme data i databasen (redundans), hvilket ville kræve en meget større kapacitet.