IDA-DATABASEN. 1 of :27 0 ADMINISTRATIVE OPLYSNINGER OM STATISTIKPRODUKTET SENESTE OPDATERING INDHOLDSFORTEGNELSE KONTAKTINFO

Relaterede dokumenter
Kvalitetsdeklaration: Iværksætterdatabasen - Danmarks Statistik. Seneste opdatering. 08. maj Indholdsfortegnelse

Skatteorienteret indkomststatistik

Boliginvesteringer og reparation

Statistikdokumentation for Erhvervsbeskæftigelsen 2012

REGISTERBASERET ARBEJDSSTYRKESTATISTIK (RAS).

Erhvervsbeskæftigelsen

Statistiske informationer

NYT. Indholdsfortegnelse. Opdateringer af registre i Forskningsservice FRA FORSKNINGSSERVICE

Statistiske informationer

Statistiske informationer

Danmarks Statistiks eindkomst Register (eir) Det Rådgivende Forskningsudvalg 21. juni 2010

Statistiske informationer

3. Arbejdsmarkedsstatistikken i Danmark

Statistikdokumentation for Vielser og skilsmisser 2016

Statistiske informationer

Adgang til mikrodata i Danmarks Statistik. Charlotte Leolnar Reif Forskningsservice

Statistiske informationer

Databrud i ATR ved overgang til eindkomst

Beskæftigede ved bygge og anlæg (indtil 2003)

Arbejdsmarkedsstatistik

ARBEJDSMARKED. 2002:7 21. februar 2002

af Forskningschef Mikkel Baadsgaard 12. december 2011

Statistiske informationer

Statistikdokumentation for Kirkestatistik 2017

Statistikdokumentation for Flytninger til og fra udlandet 2015

Tilbagetrækningsalder fra arbejdsmarkedet

Varedeklaration for Sammenhængende socialstatistik

Data om beskæftigelse, arbejdsløshed og ledige stillinger

Kombination af surveys og registre: Muligheder og begrænsninger. Charlotte Nielsen Forskningsservice

1. Introduktion Metode Udviklingen i antal beskæftigede med journalistuddannelse... 3

Landbrugsfamiliers husstandsindkomst

Databrud i RAS Danmarks Statistik

Varedeklaration for De danske skove og deres sundhedstilstand

Statistikdokumentation for Fra grundskole til fortsat uddannelse 2013

Supplerende analyser om arbejdsmarkedstilknytning

Ud- og indlån i penge- og realkreditinstitutter

Statistiske informationer

Databaser og registre

Statistiske informationer

MGR-lite Kvalitetsdeklaration

Dokumentation af serviceopgave

Det årlige Arbejdstidsregnskab før 2012-revision

Statistikdokumentation for Flytninger til og fra udlandet 2013

Statistiske informationer

Statistikdokumentation for Lønmodtagerorganisationers medlemstal 2014

Hjemmeservice - En analyse af de beskæftigede

Adgang til Mikrodata i Danmarks Statistik. Jørn K. Petersen Forskningsservice

Forskel i beskæftigelsesudvikling mellem RAS, ATR og NR fra referenceåret 2008 til 2009

ERHVERVSSTRUKTUREN I ÅRHUS KOMMUNE 2001

Varedeklaration for Radio og tv: Virksomheder

Ændringer i AKU-opregningen 2019

ET BILLEDE AF DE IKKE-FORSIKREDE

Status på København januar

ERHVERVSSTRUKTUREN I ÅRHUS KOMMUNE 2002

Databrud i ATR ved overgang til AMR

BEFOLKNINGENS UDDANNELSESMÆSSIGE BAGGRUND I ÅRHUS

Centrale registre relateret til Sundhed i Danmarks Statistik. Jørn K. Petersen Forskningsservice

30 pct. af jobbene på arbejdsmarkedet går til studerende

>> Arbejdstidsregnskabet Revision ultimo 2012

Statistikdokumentation for akvakultur, struktur og produktion

Statistikdokumentation for Arbejdsmarkedsregnskab 2013

Beskæftigelsen blandt unge faldet med på 2 år

Statistikdokumentation for Fra grundskole og gymnasium til fortsat uddannelse 2014

Børn og unge i kommunens institutioner

Varedeklaration for Vildtudbyttet

Statistikdokumentation for Indkomststatistik (A-indkomst) 2016

Revisioner af ATR i offentliggørelser siden 2009

Beskæftigelsesindikator på grundlag af ATP-indbetalinger

BEFOLKNINGENS UDDANNELSESMÆSSIGE BAGGRUND I ÅRHUS

Forslag. Lov om skattenedslag for seniorer

Stort beskæftigelsesfald i ghettoområder under krisen

Statistiske informationer

BEFOLKNINGENS UDDANNELSESMÆSSIGE BAGGRUND I ÅRHUS

Overgang til efterløn. Thomas Michael Nielsen

Statistikdokumentation for Asylansøgninger og opholdstilladelser 2015

Statistikdokumentation for Arkiver 2014

Oversigt over databaser

Statistiske informationer


Tabeller fra Kulturstatistik 2014

6 Lønindeks for den offentlige sektor

IDA-databasen. af forskningsdatabaser i Danmarks Statistik. IDA-databasen en forskningsdatabase i Danmarks Statistik

Statistiske informationer

Introduktion til Danmarks Statistiks Forskningsservice med fokus på datasikkerhed. Leif Jensen Forskningsservice

Orientering til Økonomiudvalget vedr. Status på København januar 2017

Personstatistik. Årsværkene og deres forventede finansiering i 2005

Integrationen af indvandrere på arbejdsmarkedet sat flere år tilbage

Tabeller fra Kulturstatistik 2013

Per Vejrup Hansen, cand.polit., lektor ved Handelshøjskolen i København.

Teknisk dokumentation af data til lønanalyser

Personalegoder og bruttotrækordninger

Notat. Sammenfatning.

Statistiske informationer

Indholdsfortegnelse. Opdateringer af registre i Forskningsservice FRA FORSKNINGSSERVICE

BEFOLKNINGENS UDDANNELSESMÆSSIGE BAGGRUND I ÅRHUS

Statistikdokumentation for Langtidsledighed kvartal

Socialstatistik. Modtagere af offentlige Pensioner 2014

Statistikdokumentation for Erhvervsdemografi 2014

BESKÆFTIGELSE OG ARBEJDSLØSHED OPDELT PÅ HERKOMST 1. JAN. 2002

3. DATA OG METODE. arbejdsmarkedet er forløbet afhængig af den enkeltes uddannelsesbaggrund.

Transkript:

1 of 5 11-03-2012 10:27 IDA-DATABASEN 0 ADMINISTRATIVE OPLYSNINGER OM STATISTIKPRODUKTET 0.1 Navn IDA-databasen 0.2 Emnegruppe Tværgående produkter 0.3 Ansvarlig myndighed, kontor, person m.v. Forskning og Metode Charlotte Leolnar Reif, tlf. 39 17 32 32, e-post: clr@dst.dk Søren Leth-Sørensen, tlf. 89 42 68 10, e-post: sls@dst.dk 0.4 Formål og historie Formålet med den Integrerede Database for Arbejdsmarkedsforskning (IDA-databasen) er at stille et datamateriale om personer og arbejdssteder til rådighed på individniveau. Oplysningerne i databasen kan anvendes til at belyse en lang række problemstillinger vedrørende arbejdsmarkedet (fx personers mobilitet, virksomheders jobskabelse samt samspillet mellem person og virksomhed). SENESTE OPDATERING 01. oktober 2010 INDHOLDSFORTEGNELSE 0 Administrative oplysninger om statistikproduktet 1 Indhold 2 Tid 3 Pålidelighed og usikkerhed 4 Sammenlignelighed 5 Tilgængelighed KONTAKTINFO Forskning og Metode Charlotte Leolnar Reif 39 17 32 32 clr@dst.dk Søren Leth-Sørensen 89 42 68 10 sls@dst.dk IDA-databasen blev udviklet i årene 1988-90. Udviklingen blev finansieret af Statens Samfundsvidenskabelige Forskningsråd (SSF) og Danmarks Statistik. IDA-databasen har primært et forskningsmæssigt sigte, men kan også benyttes til andre formål. IDA-projektet blev udført af en projektgruppe bestående af: Ruth Emerek, cand.stat., lektor ved Aalborg Universitet Per Vejrup-Hansen, cand.polit., lektor ved Handelshøjskolen i København Søren Leth-Sørensen, mag.scient.soc., specialkonsulent i Danmarks Statistik. 0.5 Brugere og anvendelsesområder Databasen er oprindeligt opbygget med specielt henblik på at betjene forskere, men offentlige myndigheder (ministerier) og interesseorganisationer anvender også hyppigt databasen. Det særlige ved databasen er, at man kan koble personer og virksomheder sammen. Derfor kan personer karakteriseres på grundlag af oplysninger om den virksomhed, de er ansat i og tilsvarende kan man beskrive virksomhederne på grundlag af oplysninger om de ansatte. Der findes mere end 200 variabler i databasen, herunder en lang række baggrundsvariabler om personer. Desuden er det muligt at følge både personer og virksomheder over tid. Databasen indeholder oplysninger om samtlige personer i befolkningen og alle virksomheder med ansatte, hvilket gør den velegnet til at belyse problemstillinger, der vedrører udsnit af forholdsvis små grupper. 0.6 Kilder 0.6 Kilder Datagrundlaget for IDA er en række statistikregistre i Danmarks Statistik. I IDA2008 udgøres datagrundlaget af oplysninger fra den Registerbaserede arbejdsstyrkestatistik (RAS), Erhvervsbeskæftigelsen (EBS), Personer uden ordinær beskæftigelse (PUOB) og Indkomststatistikregistret. I 2008 er der et brud i IDA-databasen idet en del af datagrundlaget for udarbejdelsen af den Registerbaserede arbejdsstyrkestatistik er ændret ved opgørelsen af denne for 2008. Bruddet er forårsaget af en ændring i de data der ligger til grund for udarbejdelsen af lønmodtagerbeskæftigelsen. Data har hidtil været oplysninger fra det centrale oplysningsseddelregister, som var dannet på baggrund af årlige indberetninger fra arbejdsgiverne til SKAT. Fra 2008 er eindkomstregistret datagrundlag for lønmodtagerbeskæftigelsen. EIndkomstregistret baserer sig på månedlige indberetninger fra arbejdsgiveren. Det betyder, at oplysningen om, hvornår et ansættelsesforhold rent faktisk er gældende, har fået en større grad af sikkerhed. I 2008 er der anvendt en årsversion af eindkomstregistret, der er dannet af SKAT ved en summation af de månedlige indberetninger over året. Det er denne årsversion der ligger til grund for de data fra RAS der er anvendt i IDA2008. For yderligere oplysning om ændring i datagrundlag i RAS henvises til varedeklarationen for denne; http://www.dst.dk/vejviser/dokumentation/varedeklarationer/emnegruppe/emne.aspx?sysrid=848 samt TIMES på www.dst.dk og Højkvalitetsdokumentationen på følgende link; http://www.dst.dk/tilsalg/forskningsservice/hkt4forsker /hkt4_variabel_liste_forsker.aspx?population=26375 I 2008 udgør statistikken Personer uden ordinær beskæftigelse grundlaget for oplysninger om ledighed og erstatter derved arbejdsløshedsstatistikken som hidtil har udgjort datagrundlaget for disse oplysninger. I statistikken Personer uden ordinær beskæftigelse er der indeholdt oplysninger om personer uden for arbejdsstyrken og denne samler således en del af de statistikregistre der tidligere belyste personer uden for arbejdsstyrken. Inden for rammerne af dette statistiksystem foregår der en tværgående databehandling, hvilket betyder, at kvaliteten af disse oplysninger er bedre end hidtil. Statistikken Personer uden ordinær beskæftigelse introducerer et nyt ledighedsbegreb. Dette forårsager et brud i de variabler der vedrører ledighed i IDA2008. Enkelte variabler udgår og/eller sammenlægges og få nye dannes. For dokumentationen af disse henvises til højkvalitetsdokumentationen på følgende link; http://www.dst.dk/tilsalg/forskningsservice/hkt4forsker /hkt4_variabel_liste_forsker.aspx?population=26392 For yderligere oplysninger om Personer uden ordinær beskæftigelse henvises til følgende link; http://www.dst.dk/vejviser/portal/arbejdsmarked/puob.aspx Nedenstående registre indgår alle i udarbejdelsen af IDA i perioden 1980-2003. Fra og med 2004 indgår oplysninger fra Udannelsesstatistikregistret (UKM) ikke i IDA længere. Enkelte uddannelsesvariable ophører dog tidligere end dette. Oplysninger fra Danmarks Statistiks Arbejdsklassifikationsmodul (AKM) indgår ligeledes ikke fra og med 2004. Der henvises til Times og Højkvalitetsdokumentation for oplysninger om de enkelte variable. Det Centrale Oplysningsseddelregister (COR) fra Told- og Skattestyrelsen Danmarks Statistiks Befolkningsstatistikregister

2 of 5 11-03-2012 10:27 Udannelsesstatistikregistret (UKM) Danmarks Statistiks Arbejdsklassifikationsmodul (AKM) Indkomststatistikregistret Erhvervsbeskæftigelsen (EBS) Registerbaseret arbejdsstyrkestatistik (RAS) Danmarks Statistiks Arbejdsløshedsstatistikregister Det Centrale Oplysningsseddelregister (COR) fra Told- og Skattestyrelsen Oplysningsseddelregisteret bygger på de oplysninger, der skal indsende es til skattemyndighederne af arbejdsgivere og andre, der udbetaler løn, vederlag, pension eller lignende. Oplysningssedlerne indeholder for hvert enkelt ansættelsesforhold oplysninger om bl.a. størrelsen og arten af indkomsten, størrelsen af ATP-bidraget og om hvilket beløb, der indeholdes i A-skat. Oplysningsseddelregisteret giver således mulighed for, at opdele A-indkomsten på forskellige indkomstarter, fx. løn, arbejdsløshedsdagpenge og sociale pensioner. Oplysningssedlerne giver koblingen mellem den enkelte arbejdstager og arbejdsstedet. Danmarks Statistiks Befolkningsstatistikregister Befolkningsstatistikregisteret indeholder grundlæggende demografiske oplysninger om hele landets befolkning. Registerets grundlag er det Centrale Personregister (CPR). Udannelsesstatistikregistret (UKM) UKM indeholder oplysninger om befolkningens uddannelsesmæssige baggrund. Registret klassificerer personer efter igangværende uddannelse, senest afsluttede almenuddannelse og højeste afsluttede erhvervsrettede uddannelse. Danmarks Statistiks Arbejdsklassifikationsmodul (AKM) AKM indeholder oplysninger om erhvervs- og beskæftigelsesforhold for den skattepligtige del af befolkningen. I registeret tildeles hver enkelt person erhvervs- og stillingskoder for den væsentligste beskæftigelse i løbet af et kalenderår på grundlag af oplysninger fra en lang række registre. Indkomststatistikregistret Registret indeholder oplysninger om befolkningens indkomst-, fradrags-, formue- og skatteforhold. Erhvervsbeskæftigelsen Registret indeholder oplysninger om antal arbejdssteder og antal beskæftigelsesforhold ultimo november med branchemæssige og regionale fordelinger. Registerbaseret arbejdsstyrkestatistik (RAS) Registeret indeholder oplysninger om befolkningens tilknytning til arbejdsmarkedet på et bestemt tidspunkt, nemlig ultimo november måned. For de beskæftigede er der tilknyttet oplysninger om bopælsog arbejdsstedskommune som anvendes i pendlingsstatistikken. Danmarks Statistiks Arbejdsløshedsstatistikregister Registeret indeholder oplysninger om personer, der er eller har været medlem af en statsanerkendt arbejdsløshedskasse samt andre personer, der er eller har været tilmeldt et offentligt arbejdsformidlingskontor som arbejdssøgende. I registeret findes der bl.a. oplysninger om ledighedsgrad på ugebasis. Arbejdsløsheden opgøres på grundlag af Arbejdsmarkedsstyrelsens Centrale Register for Arbejdsmarkedsstatistik, CRAM. Læs evt. mere om registrene i andre varedeklarationer og i udgivelsen: Poulsen, Marius E. m.fl. (red). Personstatistik i Danmark - Et personbaseret statistiksystem. Kbh.: Danmarks Statistik, 1994. 0.7 Indsamlingshjemmel Lov om Danmarks Statistik 0.8 Indberetningsbyrde Ingen 0.9 EU-regulering Ingen 1 INDHOLD 1.1 Indholdsbeskrivelse IDA-databasen indeholder oplysninger om befolkningens tilknytning til arbejdsmarkedet samt om arbejdssteder og firmaer. I IDA kobles personer og virksomheder sammen. Personer kan derfor karakteriseres via oplysninger om den virksomhed, de er ansat i, og tilsvarende kan man beskrive virksomhederne via oplysninger om de ansatte. Der findes godt 100 variable i databasen. Det er muligt at følge både personer og virksomheder over tid, således at databasen kan anvendes til at belyse problemstillinger, der kræver data for en række år. Variablene er, så vidt det har været muligt, kodet på samme måde alle år, så oplysningerne kan sammenlignes. IDA indeholder oplysninger om samtlige personer i befolkningen(5,3 mio) og alle virksomheder med ansatte (ca. 230.000). IDA er baseret på registeroplysninger. Der anvendes data fra en række registre, herunder fra ét som indeholder oplysninger om ansættelser i løbet af året, og som derved giver koblingen mellem personer og arbejdssteder. Arbejdsstederne kan skifte identifikationsnummer ved ejerskifte eller blot af interne administrative årsager. Hvis man ikke korrigerer for dette, vil der ske et for stort antal nedlæggelser og oprettelser af arbejdssteder. Dette identitetsproblem er i IDA løst ved at opstille en række krav for, hvornår der er tale om det samme arbejdssted fra et år til det næste. Samme arbejdssted foreligger, hvis én af følgende regler er opfyldt: Samme ejer og samme branche Samme ejer og samme arbejdsstyrke Samme arbejdsstyrke og samme adresse eller branche Både personer og arbejdssteder kan følges årligt fra 1980 og fremefter. Oplysningerne er på individniveau. 1.2 Statistiske begreber Databasen er opbygget som en relationsdatabase. I perioden 1980-2003 består den af 12 datasæt med 12 forskellige populationer: Populationer og enheder i de 12 datasæt. 1A Persondatasættet. Populationen er hele befolkningen opgjort pr. 1.januar. Enheden er personer. 1B Personændringer. Populationen er foreningsmængden af befolkningen pr. 1.januar i to på hinanden følgende år. Det vil sige at populationen i et givet år er befolkningen pr. 1. januar samt personer, der er døde eller udvandrede i det

forløbne år. Enheden er personer. 2A Hovedbeskæftigede lønmodtagere. Populationen er de hovedbeskæftigede lønmodtagere, hvis vigtigste tilknytning til arbejdsmarkedet pr. ultimo november er som lønmodtagere. Enheden er ansættelsen. 2B Bibeskæftigede lønmodtagere. Populationen er personer, hvis næstvigtigste tilknytning til arbejdsmarkedet pr. ultimo november er som lønmodtagere. Der er altså tale om et bijob ved siden af en vigtigste tilknytning som enten lønmodtager, arbejdsgiver, selvstændig eller medhjælpende ægtefælle (dvs. at personen tillige findes i et af de øvrige datasæt vedrørende ansættelser/beskæftigede, 2A, 2C, 2F eller 2G). Populationen omfatter også personer, hvis vigtigste tilknytning til arbejdsmarkedet er som efterlønsmodtagere og personer på overgangsydelse med (begrænset) erhvervsmæssig beskæftigelse. Enheden er ansættelsen. 2C Arbejdsgivere. Populationen er personer, der er ejere (eller medejere) af en virksomhed, hvor der er mindst én lønmodtager ansat (som hoved- eller bibeskæftiget) pr. ultimo november. Denne placering som arbejdsgiver betragtes som personens vigtigste tilknytning til arbejdsmarkedet. Enheden er "ansættelsen". 2C Tilgangspersoner. Populationen er den del af de hovedbeskæftigede lønmodtagere og arbejdsgivere, der er "nyansatte" på et arbejdssted pr. ultimo november i det pågældende år, dvs. som ikke var ansat på arbejdsstedet ultimo november året før. Populationen er således en delpopulation af populationerne i datasættene 2A og 2C. Enheden er ansættelsen. 2E Afgangspersoner. Populationen er den del af de hovedbeskæftigede lønmodtagere og arbejdsgivere, der i løbet af den følgende årsperiode afgår fra det arbejdssted, hvor de er ansat pr. ultimo november i det pågældende år - dvs. at de ikke genfindes på arbejdsstedet ultimo november året efter. Populationen er således en delpopulation af populationerne i datasættene 2A og 2C. Enheden er ansættelsen. 2F Selvstændige. Populationen er personer med selvstændig virksomhed, som ikke har ansatte pr. ultimo november i det pågældende år, og hvor der er tale om personens vigtigste tilknytning til arbejdsmarkedet. Der kan forekomme beskæftigelse af lønnet personale i løbet af året uden for registreringsugen i november. Enheden er "ansættelsen". 2G Medarbejdende ægtefæller. Populationen er personer, der har deres væsentligste indkomst i løbet af året som medarbejdende ægtefælle, og som er gift med en person, der er arbejdsgiver eller selvstændig. Enheden er ansættelsen. 3A Arbejdssteder. Datasættet omfatter de erhvervsenheder, der i årets løb har haft lønnet personale beskæftiget, og for hvilke der er indbetalt kildeskat. Arbejdsstedet er den enkelte (lokale) erhvervsenhed, som organisatorisk, geografisk og branchemæssigt er sammenhængende. Der er tale om en "bruttopopulation" af arbejdssteder for et helt kalenderår, som også omfatter arbejdssteder, der ikke har ansatte pr. ultimo november - fx på grund af sæsonpræget beskæftigelse, eller fordi arbejdsstedet kun eksisterer i en del af året (dvs. at det nedlægges før, eller oprettes efter, ultimo november). En relevant delpopulation er således arbejdssteder med ansatte pr. ultimo november. En anden relevant delpopulation kan være arbejdsste eder med hovedbeskæftigede pr. ultimo november - idet det kan forekomme, at der alene er tale om bibeskæftigede på arbejdsstedet. Endelig kan man anvende forskellige delpopulationer af bevarede, nedlagte eller oprettede arbejdssteder. Enheden er arbejdsstedet. 3B Firmaer. Ved et firma - en arbejdsgiverenhed - forstås i den private sektor den enhed, der indeholder og afregner kildeskat for de ansatte (SE-enheden). Et firma kan være en del af en "koncern", bestående af flere firmaer. I den statslige sektor er firmaenheden identisk med en styrelse, defineret ved hovedkonto i finansloven. I den kommunale sektor udgør hvert fysisk adskilt arbejdssted et firma. Et firma består af ét eller flere arbejdssteder. I tilfælde af, at et firma kun omfatter ét arbejdssted, er firmaenheden identisk med den tilsvarende arbejdsstedsenhed (i datasæt 3A vedrørende arbejdssteder). Enheden er firmaet. 3C Nedlagte arbejdssteder. Datasættet omfatter "endeligt" nedlagte arbejdssteder i perioden efter 1980 og indtil ultimo det seneste år i databasen. Der er således tale om en kumulering af samtlige "endeligt" nedlagte arbejdssteder i hele perioden siden 1980. Datasættet indeholder eksempelvis ikke enheder, der overgår fra arbejdssteder med ansatte pr. november til arbejdssteder uden ansatte pr. november. Enheden er arbejdsstedet. Variabler Da databasen indeholder mere end 200 variabler, er de ikke listet her. Overskrifterne for variabler i de tre vigtigste datasæt er: Personer Køn, alder mv. Familie og husstand Uddannelse Beskæftigelse og erhvervserfaring Arbejdsløshed Indkomst Ansættelser Stilling, heltid/deltid Timeløn Anciennitet Ændring i ansættelse: Tilgang/afgang Arbejdssteder og firmaer Oprettelsesår Branche, beliggenhed mv. Ansatte og lønniveau Identitet over tid (bevaret, nedlagt, oprettet) Fra og med 2004 udfases databasen til at bestå af 4 datasæt istedet for de ovenfor beskrevne 12 3 of 5 11-03-2012 10:27

datasæt. Disse hedder: Populationer og enheder i de 4 datasæt. 1 Personer Populationen er hele befolkningen opgjort pr. 1.januar. Enheden er personer. I dette datasæt er de tidligere populationer 1A og 1B indeholdt. 2. Ansættelser Populationen er alle personer der har en ansættelse og derved en tilknytning til arbejdsmarkedet. Ansættelsesdatasættet indeholder alle typer af ansættelser såsom hovedbeskæftigede, bibeskæftigede lønmodtagere, arbejdsgivere, selvstændige og medarbejdende ægtefæller, øvrige novemberansættelser, ej-november og vigtigste november ansættelser. Enheden er ansættelsen. I dette datasæt er de tidligere populationer 2A, 2B, 2C, 2D, 2E, 2F og 2G indeholdt. 3. Arbejdssteder Populationen er det tidligere arbejdsstedsdatasæt inklusiv de nedlagte arbejdssteder. Enheden er arbejdsstedet. I dette datasæt er de tidligere populationer 3A og 3C indeholdt. 4. Firmaer Firmadatasættet er identisk med det tidligere firmadatasæt. Enhenden er firmaet. I dette datasæt er de tidligere populationer 3B indeholdt. Variabler I forbindelse med udfasningen af IDA blev der skåret drastisk ned på antallet af variable. IDA indeholder således idag godt 100 variabler og kan fortsat grupperes ud fra de tre vigtigste datasæt: Personer Køn, alder mv. Beskæftigelse og erhvervserfaring Arbejdsløshed Indkomst Ansættelser Stilling, heltid/deltid Timeløn Anciennitet Ændring i ansættelse: Tilgang/afgang Arbejdssteder og firmaer Oprettelsesår Bran nche, beliggenhed mv. Ansatte og lønniveau Identitet over tid (bevaret, nedlagt, oprettet) For yderligere information om IDA henvises til Højkvalitetsdokumentation. Heri findes en beskrivelse af de fire datasæt samt dokumentation af alle variablerne i IDA. 2 TID 2.1 Referencetid Hovedparten af oplysningerne i IDA refererer til et bestemt tidspunkt i året - der er med andre ord primært tale om årlige statusoplysninger. Sammenkædningen af personer og arbejdssteder i det enkelte år via Det Centrale Oplysningsseddelregister refererer til ultimo november måned. Dette tidspunkt er valgt således, at det ligger tæt på slutningen af året, samtidig med, at registreringen ikke bliver forstyrret af sæsonmæssige forhold (lukning af virksomheder omkring julen). Det betyder, at opgørelser af ansættelser i den enkelte virksomhed refererer til situationen pr. ultimo november. Baggrundsoplysninger vedrørende de enkelte personer refererer derimod hovedsageligt til ultimo året. En undtagelse herfra er oplysninger om personers uddannelsesmæssige status, der refererer til oktober måned. Befolkningen er opgjort pr. 31.12. Befolkningen i IDA er i et givet år identisk med den CPR-baserede opgørelse af den samlede befolkning pr. 1. januar det følgende år - fx er oplysninger i 1980 således baseret på befolkningen pr. 31.12.1980/01.01.1981. 2.2 Udgivelsestid Databasen opdateres hvert år. Målet er, at IDA er opdateret 3 måneder efter at RAS er færdigopdateret. Den er nu (marts 2009) opdateret til og med 2006. 2.3 Punktlighed I 1998 og 1999 var opdateringen færdig primo juli. I 2000 var opdateringen færdig medio maj. I 2008 var opdateringen færdig i september. Punktligheden afhænger af hvor mange og hvilke ændringer, der er lavet i de registre, der indgår i databasen. 2.4 Hyppighed Databasen opdateres hvert år. 3 PÅLIDELIGHED OG USIKKERHED 3.1 Samlet pålidelighed Pålideligheden afhænger af pålideligheden af de enkelte donorregistre - se derfor i beskrivelsen af disse registre. Pålideligheden er høj på en meget stor del af databasen. 3.2 Usikkerhedskilder Usikkerheden afhænger af usikkerheden af de enkelte donorregistre - se derfor i beskrivelsen af disse registre. 3.3 Tal for usikkerhed Usikkerheden afhænger af usikkerheden af de enkelte donorregistre - se derfor i beskrivelsen af disse 4 of 5 11-03-2012 10:27

5 of 5 11-03-2012 10:27 registre. 4 SAMMENLIGNELIGHED 4.1 Sammenlignelighed over tid Databasen er longitudinal - det vil sige at enhederne kan følges over tid. Det er derfor meget vigtigt at variablerne er sammenlignelige over tid. Efter indførelsen af DISCO 88 er der sammenligningsproblemer med hensyn til stillingsbetegnelser over tid. Der er således et brud i 1996 (1991). 4.2 Sammenlignelighed med anden statistik Databasen er sammelignelig med den Registerbaserede arbejdsstyrkestatistik (RAS), Erhvervsbeskæftigelsen, Indkomststatistikregistret, Arbejdsløshedsstatistikregistret og Befolkningsstatistikregistret. I Erhvervsbeskæftigelsen er antallet af arbejdssteder opgjort på en anden måde. Erhvervsbeskæftigelsen er udarbejdet siden 1990, hvor den erstattede den registerbaserede arbejdsstedsstatistik, der blev udarbejdet for årene 1980-1990. Arbejdsstedsstatistikken medregnede alene arbejdssteder med lønmodtager beskæftigelse. Omlægningen til Erhvervsbeskæftigelsen indebar, at oplysninger om selvstændige og medarbejdende ægtefæller blev inddraget, således at også arbejdssteder uden lønmodtagerbeskæftiglse fra 1990 indgik i materialet. Endvidere opgøres i Erhvervsbeskæftigelsen kun antallet af arbejdssteder pr. ultimo november. Endelig indgår der i Erhversbeskæftigelsen en nedre aktivitetsgrænse. I IDA indgår ikke arbejdssteder, hvor der kun er beskæftiget selvstændige og medhjælpende ægtefæller. Desuden opgøres antallet af arbejdssteder som de erhvervsenheder, der i årets løb har haft lønnet personale beskæftiget, og for hvilke der er indbetalt kildeskat. I IDA indgår således også arbejdssteder, der IKKE har beskæftigede pr. ultimo november men som har ansatte i løbet af året, som følge af sæsonpræget beskæftigelse eller fordi arbejdsstedet kun eksisterer i en del af året (dvs. at det nedlægges før, eller oprettes efter ultimo november). 4.3 Forhold mellem foreløbige og endelige tal Der er kun endelige tal i databasen. 5 TILGÆNGELIGHED 5.1 Distributionskanaler Dataudtræk fra IDA kan mod betaling stilles til rådighed for forskere i forskerplaceringsordningen. Data vil være anonymiseret (dvs. personnummer, adresse, arbejdsgivernummer, mv. er erstattet af et neutralt løbenummer på en sådan måde, at det stadig er muligt at følge personer og arbejdssteder over tid). Til trods for anonymiseringen vil datudtræk fra IDA stadig være omfattet af Danmarks Statistiks regler vedrørende diskretion og datasikkerhed - der er fortsat tale om individoplysninger. Det betyder bl.a., at udtrækket ikke må anvendes udenfor Danmarks Statistik. Danmarks Statistik har udgivet en særlig publikation, som gennemgår, hvordan forskere får adgang til data i Danmarks Statistik. Publikationen: Data til forskningsprojekter - en vejledning for forskere kan rekvireres fra Danmarks Statistiks kontor for Forskning og Metode. Publikationen kan desuden findes på Internettet under adressen www.dst.dk. Såfremt en forsker udelukkende har brug for specialfremstillede tabeller eller beregninger på basis af IDA-databasen, kan opgaven løses af Danmarks Statistik efter tilbud til en fast pris. 5.2 Grundmateriale: Lagring og anvendelsesmuligheder Grundmaterialet (som jo er selve databasen) opbevares i registerform på individniveau. 5.3 Dokumentation Fuld dokumentation foreligger i TIMES 3. På Danmarks Statistiks hjemmeside under Forskningsservice ligger endvidere et link til Højkvaltietsdokuemntation som er en dybdegående dokumentation af udvalgte vairable. Her forefindes i løbet af 2009 alle de variable der indgår i den offentliggjorte IDA fra og med 2004. 5.4 Øvrige oplysninger En udførlig beskrivelse af databasen findes i "IDA- en integreret database for arbejdsmarkedsforskning" (Danmarks Statistik, 1991). Der findes desuden 5 arbejdsnotater udarbejdet i forbindelse med opbygningen af IDA.