Adgang til Mikrodata i Danmarks Statistik Jørn K. Petersen Forskningsservice
Danmarks Statistiks forskerordning Danmarks Statistik råder over helt unikke registerdata af høj kvalitet Forskerordningen giver forskere fra et autoriseret miljø adgang til registerdata efter konkret behov need to know - i forbindelse med et konkret projekt On-line adgang til mikrodata fra egne arbejdspladser Gælder særlige sikkerhedsregler for dataadgang som man skal sætte sig godt ind i
Centrale registeroplysninger Demografi Familiedannelse Henvisninger mellem børn og forældre Sundhed Lægemiddeldatabasen, Landspatientregistret, Sygesikringsregistret mv. Baggrundsoplysninger Indkomstdata Uddannelsesdata Sociale data (overførselsindkomster mv.)
Periode med oplysninger Sundhedsoplysninger Indlæggelser på hospital 1977 Dødsårsager 1970 Sygesikringsoplysninger 1987 Lægemiddeloplysninger 1995 Demografiske og Socioøkonomiske oplysninger Vandringer 1973 Statusbefolkning pr. 1. januar 1976 Familiedannelse 1980 Indkomster 1980 Uddannelse (status) 1981 Boligforhold 1981 Sociale ydelser 1984 Kriminalitet 1980
Demografiske data Longitudinel demografisk information for hele den danske befolkning Fx. indvandringer og udvandringer flytninger vielser og skilsmisser fødte og døde (dødsårsager) Herfra kan udtages fx stikprøver og kontrolpopulationer til en ny undersøgelse
Demografiske data Familiedannelse Familie 2 2V Familie 1 2V 2B
Demografiske data Familiedannelse Årlige oplysninger pr. 1. januar C-familie udgået (1980 2007) Ny E-familie fra 1986 og frem E-familie omfatter hjemmeboende børn til og med 24 år. Familier / Husstande Familie: personer på samme adresse der i registrene har henvisninger til hinanden fx ægtefæller, børn/forældre mv. Husstande: Familier på samme adresse» Ex. Plejehjem
Demografiske data Fertilitetsdatabase Henvisninger mellem børn og forældre Stort set komplette henvisninger for børn født fra 1960 og frem Kan fx finde søskende til børn med feberkramper
Sundhedsdata Landspatientregister Indlæggelser og diagnoser (hoved- og bidiagnoser) mv. fra 1977 og frem Uafsluttede forløb fra 2008 Psykiatridata skal bestilles i Sundhedsstyrelsen
Sundhedsdata Lægemiddeldatabase Data fra 1995 2011 Receptpligtig medicin Indgår ikke medicin udleveret på hospital Adgang kræver en godkendelse af Lægemiddelstyrelsen
Sundhedsdata Sygesikring Lægebesøg mv. 1987-2010 Data stammer fra Sundhedsstyrelsen.
Indkomstdata Indkomstregister, årets indkomst 1980-2010» fx. personlig indkomst Lønstatistik, alle ansættelser 1997-2010» detaljerede oplysninger om løn og arbejdstid kun over 10 ansatte i den private sektor E-indkomst, månedlige beskæftigelsestal» løn, arbejdstid mv. arbejdsgivernes indberetning» Overførsler for ikke lønmodtagere» 1. januar 2008 og frem
Indkomstdata klassifikationer Socio Socioøkonomiske klassifikation 1995 - Dannes ud fra personens væsentlige indkomstkilde fx Selvstændig eller lønmodtager Branche branche for væsentligste beskæftigelse Branche for det arbejdssted hvor man har den største indkomst Disco fagklassifikation 1995- fx. Lægearbejde, skibsmalerarbejde - 2008 mest i løn 2009- flest timer
Uddannelse Elevregistret detaljerede uddannelsesforløb inkl. afbrudte forløb data fra 1. oktober 1973 til 1. oktober 2010 opdateres årligt med indberetninger fra uddannelsesinstitutionerne Højst fuldførte uddannelse (status pr. 1. januar) 1. oktober 1980 1. oktober 2011 dannes ud fra elevregistret suppleres med andre kilder fx kvalifikationsregister, Folke- og boligtællingen fra 1970, sprogcenter (indvandrere, der har taget uddannelsen i udlandet) Variablen HF_kilde angiver kilden til oplysningen
Uddannelse Øvrige registre Karakterer Folkeskole Gymnasier Uddannelsesvariabler og forspaltekoder Uddannelsesvariabel 4-cifret kode. Gives ved oprettelse af ny uddannelse. Er entydige Ikke systematisk og derfor ikke velegnet til statistik Forspaltekoden angiver uddannelsens placering i uddannelelsesklassifikationen. Forspaltekoderne ændres, hvis en uddannelse skifter status
Sociale data Sammenhængende Socialstatistik Modtagere af indkomsterstattende ydelser fx arbejdsløshedsdagpenge, sygedagpenge, folkepension mv. Beløb og varigheder 1984 2007 OF - Offentligt forsørgede population 16-64 årige 2007- samler alle varigheder af overførselsindkomster pr. person Ledighed, indgår i OF fra 2007 Dagpenge / Sygedagpenge Arbejdsmarkedspolitiske foranstaltninger mv., indgår i OF fra 2007 Pensioner indgår ikke i OF
Sociale data Pensionsregister Modtagere af folkepension og førtidspension 1994-2010 Oplysningerne findes i den Sammenhængende Socialstatistik fra 1984 Sygedagpengestatistik (1994 2010) Kontanthjælpsstatistik (1987 2010) findes i den sammenhængende socialstatistik og OF
Sociale data Anbragte børn og unge (0 18 år) 1977 2010 Indberetninger fra kommunerne. Fra 2006 fra Ankestyrelsen
Sociale data Kriminalitet 1980-2010 Anmeldelser Sigtelser Afgørelser (hovedforhold) Konfererede sager (bi-sigtelser) Indsættelser Ofre Kriminalstatikken dannes på baggrund af indberetninger fra det Centrale anmeldelsesregister, Rigspolitiets centrale kriminalregister, samt fra rigspolitiets POLSAS-system (Politiets-sags-analysesystem).
Øvrige registre og forskernes egne data Øvrige oplysninger IDA (Til brug for arbejdsmarkedsforskning) Kobler personer - arbejdssteder BBR og ejendomsregistre (boligforhold) Erhvervsregister (firmaer og regnskaber)
Forskernes egne data Fx egne surveys eller registre fra Sundhedsstyrelsen Kan kombineres med registeroplysninger fra Danmarks Statistik Skal indeholde en koblingsvariabel fx personnummeret
Det samlede statistiske system Overførsler Indkomst CPR Person id: Personnummer Uddannelse Beskæftigelse Spørge skema Interview Sundhed Bolig id: Adressekode Virksomhed id: CVR-nr etc BBR CVR
Hvordan kommer man i gang med et projekt? Henvendelse til forskerserviceenheden i forbindelse med et konkret projekt, indsendelse af en projektbeskrivelse/protokol (www.dst.dk/forskning) Find en medarbejder så er processen sat i gang
Typisk projektforløb Modtagelse af projektbeskrivelse Beskrivelse af formål, studiepopulation, variabler eller registre, antal år Planlægning af registerudtræk Der beregnes en pris 1187 kr. pr. time for udtræk af data (januar 2012) Vi sender en kontrakt, med pris og forventet leveringstid Hvis der er eksterne data, kræves godkendelse fra Datatilsynet (forskerens eget ansvar)
Typisk projektforløb Forsker får adgang til forskermaskinen - password mv. Forskeren underskriver en særlig forskeraftale Data leveres på forskermaskinen og checkes af forskeren Kørsler på forskermaskinen er gratis hvis man er fra en offentlig autoriseret institution
Regler for adgang til data Al mikrodata inkl. forskernes data bliver i Danmarks Statistik Al arbejde med mikrodata skal ske på forskermaskinen Forskerne må ikke printe individuelle records og må ikke downloade mikrodata Kun output med statistiske resultater (estimationer tabeller mv.) må hjemtages grundregel er at hjemsendt materiale skal være på statistikniveau, dvs. at det ikke er muligt at identificere enkelt personer eller virksomheder Spørg os hvis i er i tvivl! Output bliver (på stikprøvebasis) manuelt checket af Forskningsservice Alle identifikationer (CPR-nr, CVR mv.) afidentificeres med en projektspecifik nøgle inden data lægges på forskermaskinen
Dokumentation - højkvalitetsdokumentation Systematisk historisk dokumentation af ca. 500 udvalgte variabler: Dokumentationen bliver systematisk: Detaljeret beskrivelse, herunder databrud Gyldighed/population/emnegrupper Tabeller og grafer Værdisæt med gyldighedsperioder Bilag af særlig interesse Link: http://www.dst.dk/da/tilsalg/forskningsservice/dokume ntation.aspx
Formater link på forskermaskinen Som en hjælp til gruppering af variabler findes på forskermaskinerne og hostede maskiner et stort fælles formatbibliotek Link til format oversigt
LINKET fører til denne side 29 7/4/2012
Vejledning i brug af formater findes på hjemmesiden Vejledning i brug af formater findes på Forskningsservices hjemmeside under linket: http://www.dst.dk/da/tilsalg/forskningsservice/data. aspx 30 7/4/2012
Gode links til selvhjælp Varedeklarationer generel beskrivelse af registrene (personkreds mv.) http://www.dst.dk/da/statistik/dokumentation/varede klarationer.aspx Forskningsservices hjemmeside http://www.dst.dk/forskning