Kombination af surveys og registre: Muligheder og begrænsninger Charlotte Nielsen og Ivan Thaulow, Forskningsservice >>
>> Disposition Hvorfor kombinere surveys og registerdata? Registerstruktur og indsamling af data i Danmarks Statistik Præsentation af udvalgte registre Dokumentation af registre og variable Forskerordningen på DST Datasikkerhed og diskretionering Spørgsmål 2
Survey >> Hvorfor kombinere surveys og registre? Historik Opfølgning Tid Relationer til familie, klassekammerater, kolleger etc. 3
>> Eksempel Forklarende variable: Køn, alder, familie Uddannelse Arbejde: stilling og erhverv og arbejdsplads Indkomst og formue Sociale forhold Boligforhold, nærmiljø Arvelige forhold Helbredsforhold Konsekvenser: Sygelighed og dødelighed Forbrug af offentlige ydelser 4
>> Registerstruktur og indsamling af data Overførsler Indkomst Personer Det Centrale Personregister (CPR) Uddannelse Beskæftigelse Sundhed Boliger/ bygninger Bygnings- og Boligregistret (BBR) Det Centrale Virksomhedsregister (CVR) Omsætning Virksomheder Lange tidsserier af høj kvalitet 5
>> Typer af data Fraskilt Gift Papirløs Ugift 1. Status opgørelse t1 t2 t3 t4 Fraskilt Gift Papirløs Ugift Fraskilt Gift Papirløs Ugift 2. Panel t1 t2 t3 t4 3. Events/spells/periode t1 t2 t3 t4 6
>> Emneområder Demografi Uddannelse Arbejdsmarked og økonomi Sociale registre Sundhedsregistre Erhvervsregistre Data fra andre styrelser 7
>> Demografiske data Information fra sidst i 70 erne og frem Medfødte eller biologiske egenskaber Fødsels- og dødsdatoer Køn Fødested Biologiske forældre Dynamiske egenskaber Bopæl og flytninger Vielser og skilsmisser Indvandringer og udvandringer Statsborgerskab Børn Social familie Data stammer fra CPR-registret og Sundhedsstyrelsen 8
>> Demografiske data - Fertilitetsdatabase Henvisninger mellem børn og forældre Stort set komplette henvisninger for børn født fra 1960 og frem. 9
>> Demografi - familier C-familier (1980-2007) / E-familier (1986-2013) omfatter hjemmeboende børn til og med 18/24 år Hovedperson Fælle Ægtefælle Registreret partner Samlever Sambo Barn 1 Barn 2 10
>> Uddannelse - forløbsdata Elevregistret Detaljerede uddannelsesforløb (3.915 uddannelser) Inkl. afbrudte forløb Data fra 1. oktober 1973-2012 Opdateres årligt med indberetninger fra uddannelsesinstitutionerne Karakterer Folkeskole Studentereksamen 11
>> Uddannelse - statusopgørelse Højst fuldførte uddannelse (pr. 1. januar) Start i 1981. Data til og med 2012 Dannes ud fra elevregistret Suppleres med data fra Kvalifikationsregister Folke- og boligtællingen fra 1970 Indvandrernes medbragte uddannelse Styrelsen for International Uddannelse Uddannelsesoplysninger fra Grønland Variablen HF_kilde angiver kilden 12
>> Uddannelse 12 Gruppering 10 Grundskole 15 Forberedende uddannelser 20 Almene gymnasiale uddannelser 25 Erhvervsgymnasiale uddannelser 30 Erhvervsfaglige grundforløb 35 Erhvervsfaglige praktik og hovedforløb 39 Efteruddannelse af specialarbejdere/faglærte 40 Korte videregående uddannelser 50 Mellemlange videregående uddannelser 60 Bachelor / 65 Lange videregående uddannelser 70 Forskeruddannelser 13
>> Arbejdsmarked og økonomi 1. Beskæftigede Selvstændige Medarbejdende ægtefæller Lønmodtagere 2. Arbejdsløse 3. Personer uden for arbejdsstyrken 14
>> Arbejdsmarked og økonomi Socioøkonomisk status Status (ultimo november) Registerbaseret arbejdsstyrkestatistik (RAS) - ARBSTIL/NYARB/SOCSTILKODE Årsbetragtning (dominerende tilstand) AKM (fra Indkomster) - (NYSTGR/SOCIO/SOCIO02) 15
>> Arbejdsmarked og økonomi - Indkomster Personindkomster 1980-2011 Familieindkomster 1990-2011 16
>> Sundhedsdata Sygesikringsdata Lægebesøg 1980-2011 Landspatientregistret Indlæggelser og diagnoser 1977-2011 Lægemiddeldatabasen Receptpligtig medicin 1995-2012 (undtaget udlevering fra sygehuse) 17
>> Sociale registre Sammenhængende socialstatistik Modtagere af indkomsterstattende ydelser (1984-2007) Offentlig forsørgelse Indeholder personer der er ledige, aktiverede eller er modtagere af en passiv forsørgelsesydelse (2007-2012) Sygedagpenge Stammer fra indberetninger fra KMD (1994-2012) Kontanthjælpsstatistik Registret dannes på baggrund af indberetninger fra landets kommuner (1987-2011) 18
>> Sociale registre Anbragte børn og unge Registret dannes på baggrund af årlige indberetninger om forebyggende foranstaltninger fra landets 98 kommuner samt fra 2006 årlige oplysninger fra Ankestyrelsen om anbringelser (1977-2010) Kriminalstatistikken Anmeldelser Sigtelser Indsættelser Afgørelser Ofre Dannes på baggrund af indberetninger fra det Centrale anmeldelsesregister og Rigspolitiets registre (1980-2011) 19
>> Erhvervsdata IDA-databasen Enheder (kan forbindes) 1980-2011 Personer Virksomheder Arbejdssteder Brancher Erhvervserfaring 20
>> Eksempler på erhvervsdata Registre: - generel firmastatistik - regnskabsstatistik - industriens køb og salg af varer - udenrigshandel med varer Surveys: - forskning, udvikling & innovation - virksomhedernes outsourcing 21
>> Erhvervsdata Hovedbranche Årets resultat Investeringer Eksport /Import Køb af varer og tjenester i alt Værditilvækst Omsætning Virksomhedsform Antal ansatte (i årsværk og november ansatte).og mange mange flere 22
>> Data fra andre styrelser DREAM databasen Psykiatriske centralregister LPR Cancerregistret Misbrugsregisteret og mange flere 23
>> Dokumentation på Danmarks Statistik 24
>> Højkvalitets-dokumentation En særlig dokumentation, specielt hvad angår databrud og tidsserier Detaljeret beskrivelse, herunder databrud Gyldighed/population/emnegrupper Tabeller og grafer Værdisæt med gyldighedsperioder Bilag af særlig interesse Der er i dag ca. 600 HKD variable http://www.dst.dk/da/tilsalg/forskningsservice/dokumentation.aspx 25
>> Antal dagpengedage i året (ANTDAGE) 26
>> Eksempel: Antal dagpengedage i året 27
>> Antal dagpengedage i året 28
>> Adgang til (mikro)data Du skal være tilknyttet en institution, der er autoriseret til at analysere på Danmarks Statistiks data Du kan få adgang til de data, som du reelt har behov for i dit forskningsprojekt el. lign. Databehovet skal begrundes i en projektbeskrivelse der forhåndsgodkendes af Danmarks Statistik 29
>> Adgang til (mikro)data Alle data placeres på Danmarks Statistiks forskningsmaskiner Alle identifikationer (CPR, CVR mv.) er fjernet Alt arbejde med data sker på forskermaskinerne Du får online adgang til projektets data direkte fra din egen arbejdsplads Online adgang kræver strengt personlige og fortrolige ident er og passwords 30
>> Output fra dine analyser Output fra analyser sendes til dig elektronisk via en mail-server på Danmarks Statistik Kun output med statistiske resultater (estimationer, tabeller mv.) må hjemtages Du må altså ikke printe individuelle records eller downloade sådanne data Output bliver på stikprøvebasis checket af os i Forskning og metode 31
>> Udtræk af stikprøver til nye surveys Det er muligt fra Danmarks Statistiks registre at udtrække specifikke stikprøver til nye surveyundersøgelser I så fald skal dataindsamlingen foretages af Danmarks Statistik Udtræk kan umiddelbart foretages ud fra oplysninger, der ikke opfattes som følsomme (fx køn, alder, indkomst, uddannelse) Hvis der bruges følsomme oplysninger, kræver det, at man i stikprøven medtager mindst lige så mange personer, der ikke opfylder udvalgskriteriet, som personer der opfylder dem 32
>> Hvordan kommer du i gang? Indsend en projektbeskrivelse til en medarbejder i Forskning og metode Eller endnu nemmere: Ring og tal med en medarbejder i Forskning og metode på telefon: 39 17 31 30 Læs mere på vores hjemmeside: http://www.dst.dk/forskning 33