Kombination af surveys og registre: Muligheder og begrænsninger Leif Jensen Forskningsservice >>
Disposition Surveys- vs registerdata Hvorfor kombinere surveys og registerdata Nye forskningsmuligheder Hvad kan forskningsservice hjælpe med Eksempler 2
Survey- vs registerdata Surveys Surveys er i mange lande eneste kilde til viden om personer eller virksomheder I DK dækker registre mange af de oplysninger, som tidligere blev indsamlet vha. surveys. Surveys og registerdata kan supplere hinanden 3
Survey- vs registerdata Surveys Indsamlet til: Forskning eller evaluering Register Indsamlet til: Administrative formål Hukommelse Begrænset hukommelse Indhold: Facts, Værdier, holdninger, præferencer, testscores Indkomst Uddannelse Selvvurderet helbred Sort arbejde Frivilligt arbejde Trivsel Holdninger Præferencer Testscore Sample: Stikprøve med frafald Effektanalyse: Hvorfor virker foranstaltningen Hukommelse Perfekt hukommelse Indhold: Facts Indkomst Uddannelse Diagnosekoder Beskæftigelse/ledighed Antal Børn Civilstand Indvandringsdato Sample: Total uden frafald Effektanalyse: Virker foranstaltningen 4
Hvorfor kombinere surveys og registerdata? Anvendelser Repræsentativitets- og frafaldsanalyser Erstatning for spørgsmål i spørgeskema Billigere Problematisk med meget lange spørgeskemaer Kvalitet => 5
Hvorfor kombinere surveys og registerdata Åbner nye forskningsmuligheder Historik - CPR nummer fra 1968. Mange registre fra 1980-> Adgang til andre typer oplysninger - 270 registre ligger fast i forskningsservice - Registre facts < > Surveys blødere oplysninger - > Eksempel Netværk og relationer - Registrene giver fantastiske muligheder for at indhente oplysningerne ikke kun om respondenterne i en survey, men også om familie og netværk - Datastruktur + eksempler Adgang til at lave kontrolgrupper Udtræk af stikprøver til nye surveys 6
Birth Weight and Social Trust in Adulthood: Evidence for Early Calibration of Social Cognition Michael Bang Petersen and Lene Aarøe, Statskundskab, AU Er der en sammenhæng mellem fødselsvægt og sociale holdninger i voksenlivet? Registerdata Surveydata Fødselsvægt -Alder -Køn -Mors indkomst og udd -Søskendes fødselsvægt Social holdninger 7
Hvorfor kombinere surveys og registerdata Åbner nye forskningsmuligheder Historik - CPR nummer fra 1968. Mange registre fra 1980-> Adgang til andre typer oplysninger - 270 registre ligger fast i forskningsservice - Registre facts < > Surveys blødere oplysninger - > Eksempel Netværk og relationer - Registrene giver fantastiske muligheder for at indhente oplysningerne ikke kun om respondenterne i en survey, men også om familie og netværk - -> Datastruktur + eksempler Adgang til at lave kontrolgrupper. 8
Registerstruktur og indsamling af data Overførsler Indkomst Personer Det Centrale Personregister (CPR) Uddannelse Beskæftigelse Sundhed Boliger/ bygninger Bygnings- og Boligregistret (BBR) Det Centrale Virksomhedsregister (CVR) Omsætning Virksomheder Lange tidsserier af høj kvalitet 9
Registerstruktur/netværk Danne relationer og netværk Forældre - børn Husstande Familier Netværk 10
Registerstruktur/netværk Henvisninger mellem børn og forældre Stort set komplette henvisninger for børn født fra 1960 og frem. 11
Registerstruktur/netværk Hustande Ser man også på adresse kan vi danne husstande og familier Husstande: Personer der bor på samme adresse E-familie: Et statistisk familiebegreb 12
Registerstruktur/netværk C-familier (1980-2007) / E-familier (1986-2016) Omfatter hjemmeboende børn til og med 18/24 år Hovedperson Fælle Ægtefælle Registreret partner Samlever Sambo Barn 1 Barn 2 13
Registerstruktur/netværk Brugen af de forskellige identifikationsnumre gør det muligt at lave netværk Kolleger på arbejdspladsen Skole, Klassetrin på skole, specifik klasse (9. a på specifik skole) Geografisk område (GIS, Det danske kvadratnet) Boligområder (ghettoeffekter) TITEL 17-05-2017 14
Registerstruktur/netværk Eksempler Educational Peer Effects Quantile Regression Evidence from Denmark with PISA2000 data by Beatrice Schindler Rangvid, AKF/KORA Peer kvalifikationer Måles med klassekammeraternes mødres uddannelsesniveau BEF/FTDB registrene + UDDA Positiv effekt på gennemsnittet. Ved quantile regression finder hun, at det især har betydning for de fagligt dårligste elever. For de fagligt bedste har det ingen betydning 15
Registerstruktur/netværk Eksempler Etnisk mangfoldighed på arbejdspladsen og opbygningen af social kapital Frederik Thuesen, SFI Hvilken betydning har den etniske sammensætning af kolleger på arbejdspladsen for den enkelte medarbejderes tillid og holdning til etniske minoriteter. Deltagere i EVS (European Values Study) og ESS (european social survey) Konstruktion af population: EVS (Cpr ) Arbejdssteder (LBNR) Cpr på alle kolleger, også historisk 16
Kontrolgrupper Tilfældig stikprøve af en specifik gruppe. - 5% udtræk af alle gymnasieelever i 2015-10% udtræk af alle 20-40 årige indvandrere/efterkommere i perioden 2000-2017 Matching (Case <-> kontrol) - Ex: For hver person i casepopulationen/surveyen udtrækkes 5 personer med samme; Alder, køn, kommune 17
Udtræk af stikprøver til nye surveys Det er muligt fra Danmarks Statistiks registre at udtrække specifikke stikprøver til nye surveyundersøgelser I så fald skal dataindsamlingen foretages af Danmarks Statistik Udtræk kan umiddelbart foretages ud fra oplysninger, der i henhold til persondataloven ikke opfattes som følsomme (fx køn, alder, indkomst, uddannelse) Hvis der bruges følsomme oplysninger, kræver det, at man i stikprøven medtager personer der ikke opfylder udvalgskriterierne (1000 personer eller 25% af stikprøven) 18
Udtræk af stikprøver til nye surveys Specifikke grupper Personer i en bestemt livssituation Survey opfølgning på registeranalyser Hvorfor er disse institutioner gode? Hvorfor virker denne foranstaltning bedre end andre? 19
Hvordan kommer du i gang? Indsend en projektbeskrivelse til en medarbejder i Forskningsservice Eller endnu nemmere: Ring og tal med en medarbejder i Forskningsservice på telefon: 39 17 31 30 Læs mere på vores hjemmeside: http://www.dst.dk/forskning 20