Klargøring af data til aflevering til DDA. Instruks



Relaterede dokumenter
Sådan afleverer du forskningsdata til arkivering

Data management Vejledning til ph.d. studerende og andre v/ Willy Karlslund

Introduktion til SPSS

De præmisser vi arbejdede under, har haft betydning for det endelige valg af format.

Vejledning til prototypen af RaConverter

SPSS introduktion Om at komme igang 1

Brugerundersøgelse i Odense 1995: Modtagere af hjemmehjælp

Undersøgelsen blev oprindelig gennemført af

Brugerundersøgelse i Odense 1995: Beboere på plejehjem

Introduktion til webanalyser.dk

Jacob Hviid Hornnes, Anne Christensen og Ulrik Hesse. Arbejdsnotat. Metode- og materialeafsnit til Sundhedsprofil for Gribskov Kommune

Folketingsvalget 2001: Enghave Skole og Hellerup Skole

SAS formater i Danmarks Statistik

Undersøgelse af arbejdsliv og overarbejde i Danmark,

Patienttilfredshedsundersøgelse, Fyns Amt 1996: Patienter fra andre amter

Arbejdsmiljø og forplantning , VI Undersøgelsen blev oprindelig gennemført af

DDA Datamateriale

Undersøgelse af de studerendes boligforhold i Odense,

Program dag 2 (11. april 2011)

Nyhedsbrev fra Forskningsservice, 1. kvartal 2010

DDA Datamateriale

DDA Datamateriale

KORTLÆGNING AF DIGITIALISERINGS- BEHOV I DANMARK HUMANOMICS RESEARCH CENTER

Kom godt igang. med webanalyser.dk. Hvis du udskriver og følger denne guide, vil du få et godt overblik over systemet på ca. 20 minutter.

Konsekvenser ved virksomhedslukning, B&W Skibsværft

DDA Datamateriale

Arbejdsmiljø og forplantning , V Undersøgelsen blev oprindelig gennemført af

Undersøgelsen blev oprindelig gennemført af

Hospitalsindlæggelser i Storstrøms amtskommune

Patienttilfredshedsundersøgelse, Fyns Amt

Undersøgelsen blev oprindelig gennemført af. Lars Peter Jennergren, Bjarne G. Sørensen & Peter Toft-Nielsen.

Undersøgelsen blev oprindelig gennemført af

Undersøgelsen blev oprindelig gennemført af

DDA Datamateriale Indeklima og psykosociale forhold,

Frivilligt og ulønnet arbejde i idrætsforeninger, : Foreninger

DDA Datamateriale

Holdningen til flygtninges adgang til Danmark, september

Regressionsanalyse i SurveyBanken

Indledning. På de følgende sider vises, primært i tegneserieform, lidt om mulighederne i PC-AXIS for Windows.

Bedriftssundhedstjenesten (BST), 1982: organisation Undersøgelsen blev oprindelig gennemført af

OPBYGNING AF INSTRUMENTER. Online Designeren Record ID Felttyper Validering og variabelnavne

DDA Datamateriale

Undersøgelsen blev oprindelig gennemført af

Børn og unges fritid i Høje Taastrup Kommune, Undersøgelsen blev oprindelig gennemført af

Udarbejdet af: Frontal Lobe teamet, Jonathan Lawaetz og Joachim Skovbo Dato for opdatering: 27/05/18. Indholdsfortegnelse

Kønsaspekter i lægers karriereforløb, Undersøgelsen blev oprindelig gennemført af

Nyt i Analyseportalen og Web Report Studio. Analyseportalen

Plastikkirurgisk afdeling Roskilde Sygehus, Sygehus Nord

DDA Datamateriale Børnepasning i Odense kommune

Arbejdsmiljø og forplantning , II Undersøgelsen blev oprindelig gennemført af

Behandlingsafsnit (indlagte) Ciconia, Århus Privathospital

Behandlingsafsnit (indlagte) OPA Ortopædisk Privathospital Aarhus

BILAG 2: Klargøring af data og manuel upload

Gravide lønmodtageres trivsel på arbejde efter fødsel og orlov,

Undersøgelsen blev oprindelig gennemført af

Onkologisk afdeling Herlev Hospital

Kongevejsklinikken Kongevejsklinikken

Brystkirurgisk ambulatorium Herlev Hospital

Betalingsvilje for forebyggelse af trafikulykker , opfølgning

Behandlingsafsnit (indlagte) Bodylift Center v. Plastikkirurg Andreas Printzlau

DDA Datamateriale

DDA Datamateriale Rygning på arbejdspladsen, Ledernes Hovedorganisation

Øre-Næse-Halskirurgisk afdeling Aalborg Sygehus

Hæmatologisk afdeling Herlev Hospital

Skema til høringssvar anmeldelse af forskningsdata

Plastikkirurgisk ambulatorium Roskilde Sygehus, Sygehus Nord

Evaluering af forebyggelse af hjertekarsygdomme i Slangerup,

Medicinsk Hepato-gastroenterologisk Afdeling V (361 på Nørrebrogade) Aarhus Universitetshospital

DDA Datamateriale

Undersøgelsen blev oprindelig gennemført af

DDA Datamateriale

Behandlingsafsnit (ambulante) OPA Ortopædisk Privathospital Aarhus

Undersøgelsen blev oprindelig gennemført af

Brugervejledning til Højkvalitetsdokumentationen og Dialogforummet på Danmarks Statistiks hjemmeside

- Panelundersøgelse, Folkeskolen, september 2014

Undersøgelse af de studerendes boligforhold i Odense,

Metodenotat SUNDHEDSSTYRELSEN DANSKERNES RYGEVANER 2011 DECEMBER 2011 EPINION SAIGON EPINION AARHUS EPINION KØBENHAVN

Arbejdsmiljøundersøgelse for de fynske typografer

DDA Datamateriale Transportvaner, Undersøgelsen blev oprindelig gennemført af

DDA Datamateriale

Bilag 4 Kvantitativ databehandling

DDA Datamateriale

Undersøgelsen blev oprindelig gennemført af. Jørgen Goul Andersen og Mette Tobiasen

Klinik for Plastikkirurgi, Brystkirurgi og Brandsårsbehandling, ambulatorium Rigshospitalet

DDA Datamateriale

Mammakirurgisk ambulatorium Ringsted Sygehus, Sygehus Syd

Hæmatologisk afsnit A120H (Vejle) Sygehus Lillebælt

DDA Datamateriale Alderdommens aktive kvinder og mænd,

DDA Datamateriale Voksen-, efter- og videreuddannelse (VEU) 2005, II

Følgende oplysninger foreslås medtaget, idet parentesernes indhold tilpasses.

Arbejdsmedicinsk ambulatorium (Esbjerg) Sydvestjysk Sygehus

Hæmatologisk afdeling (Odense) OUH Odense Universitetshospital og Svendborg Sygehus

Øre-Næse-Halskirurgisk afdeling (Odense) OUH Odense Universitetshospital og Svendborg Sygehus

Velkommen til Stifikseren!

Undersøgelsen blev oprindelig gennemført af

DDA Datamateriale Erfarne arbejdere og ny teknologi,

Kirurgisk afdeling (Esbjerg) Sydvestjysk Sygehus

Øre-Næse-Halskirurgisk ambulatorium (Odense) OUH Odense Universitetshospital og Svendborg Sygehus

Arbejdsmiljø og forplantning , VII Undersøgelsen blev oprindelig gennemført af

DDA Datamateriale Sonar telefoninterviews 1992, september

Transkript:

v Klargøring af data til aflevering til DDA Instruks Denne instruks gennemgår datadokumentationsformater m.v. for datasystemfiler, som skal afleveres til Dansk Data Arkiv efter indgået aftale om ekstern oparbejdning. Formateringen er nødvendig for at sikre langtidsbevaring af den fulde dokumentation. Hensynet til langtidsbevaringen af fuldt dokumenterede data indebærer bl.a., at der er ganske detaljerede krav til angivelse af manglende data. Formateringskravene omfatter alle former for kvantitative datasystemfiler. Eksemplerne tager for enkelthedens skyld udgangspunkt i spørgeskemadata. Filformater Datafilen afleveres i et af følgende formater: o SPSS (.sav) o STATA (.dta) o SAS (.sas7bdat med tilknyttet formatbibliotek: formats.sas7bcat) Filen skal kunne læses fejlfrit i eller konverteres til SPSS version 19.0 for Windows. Filen kan eventuelt produceres i et konverteringsprogram. Den institution eller forsker, der afleverer data (donor), har ansvaret for, at filen har det korrekte format. Forklaringerne nedenfor baserer sig på SPSS-syntaks. Syntaksen svarer i udgangspunktet til syntaksen i andre statistikprogrammer. Variabeltyper Variable skal være af typerne numeric eller string. Eventuelle variable i andre formater skal rekodes.

Eksempel Variablen Dato ligger i formatet date. Variablen rekodes til tre numeriske variable: Dag, Måned og År, eller den omkodes til string. Kodeværdier for År angives med fire cifre. Variable i numerisk format skal være i heltal eller med maksimalt ni decimaler. Variable, som har kodeværdilabels, skal være heltal. Bemærk: Parameteren Decimals i vinduet Variable View i SPSS regulerer kun fremvisningen af variablen; den faktiske præcision af variablen forbliver skjult. Kodning af uoplyst I de tilfælde, hvor respondenten har undladt at besvare et spørgsmål, kodes værdien som uoplyst. Det gøres ved at indsætte det mindste antal 9-taller, der overstiger den største i øvrigt anvendte kodeværdi. Eksempel Variablen har kodeværdierne 1, 2 og 3 Uoplyst kodes som 9 Variablen har 273 som højeste kodeværdi Uoplyst kodes som 999 Filtercheck Der skal foretages filtercheck, hvis datamaterialet indeholder filtreringer. En filtrering optræder, når en variabel eller en gruppe af variable ikke skal have værdier for visse respondenter. Et spørgsmål, der anvendes som filter, således at ikke alle skal besvare et eller flere efterfølgende spørgsmål, betegnes efterfølgende en filtrerende variabel. Variablen for et spørgsmål, som efterfølgende ikke skal besvares af alle, kaldes en filtreret variabel. 2

Filterbetingelsen siges at være opfyldt for de respondenter, der som følge af deres besvarelse skal springe over et eller flere efterfølgende spørgsmål i spørgeskemaet. Eksempel. Spm. 6 Hvad er dit køn? 1 Mand 2 Kvinde Hvis du har svaret 1: gå nu til spørgsmål 9! Spm. 7 Er din menstruation regelmæssig? 1 Ja 2 Nej 3 Ved ikke/ vil ikke svare. Spørgsmål 7 (og spørgsmål 8) skal kun besvares af respondenter, der ikke har svaret, at de er af mandligt køn. Variablen for spørgsmål 7 er dermed filtreret af spørgsmål 6. For respondenter, der har svaret 1 Mand til spørgsmål 6, er filterbetingelsen opfyldt. I eksemplet er variablen for spørgsmål 7 filtreret af variablen for spørgsmål 6. Det giver følgende mulige udfald for variablen til spørgsmål 7: Spm. 7 Er din menstruation regelmæssig? (filtreret variabel) Spm. 6 Hvad er dit køn? (filtrerende variabel) Svar: Mand (filterbetingelse opfyldt) Svar: Kvinde (filterbetingelse ikke opfyldt) Ubesvaret Besvaret Fejl type 1 Valid værdi Fejl type 2 Ikke besvaret Irrelevant Uoplyst Uoplyst 3

Filtreringerne checkes således: Irrelevant Omkod kodeværdien for den filtrerede variabel til irrelevant for de respondenter, hvor filterbetingelsen er opfyldt, og hvor den filtrerede variabel er kodet som uoplyst (dvs. respondenten har rettelig ikke besvaret spørgsmålet). Kodeværdien for irrelevant er kodeværdien for uoplyst + 1. Dvs. kodeværdien for irrelevant bliver 100, hvis kodeværdien for uoplyst er 99. Eksempel (eksemplet side 3 forts.): Rekodning af besvarelse til filtreret spørgsmål pga. (korrekt) manglende værdi: spm. 6 Hvad er dit køn? : 1 ( Mand ) spm. 7 Er din menstruation regelmæssig? : blank er kodet som 9 ( Uoplyst ) kodes som 10 ( Irrelevant ) Fejl type 1 Konstater antallet af fejl af type 1 i filtrerede spørgsmål (dvs. respondenten har besvaret spørgsmålet, men det skulle ikke have været besvaret pga. filtret). Eksempel (eksemplet side 3 forts.): spm. 6 Hvad er dit køn? : 1 ( Mand ) spm. 7 Er din menstruation regelmæssig? : 2( Nej ) Undersøg om der er fejl ved data eller ved dokumentationen, hvis fejlen optræder hos mange respondenter. Korriger så vidt muligt fejlen og dokumenter, at den er korrigeret. Der kan eksempelvis optræde mange fejl af type 1, hvis den anvendte interviewerinstruktion adskiller sig fra den, der anvendes under klargøringen af data, eller hvis der forekommer systematiske indtastningsfejl. Fejl type 2 Konstater antallet af fejl af type 2 (dvs. respondenten har besvaret det filtrerede spørgsmål, men ikke besvaret det filtrerende spørgsmål). Eksempel (eksemplet side 3 forts.): spm. 6 Hvad er dit køn? : blank spm. 7 Er din menstruation regelmæssig? : 2 ( Nej ) 4

Undersøg om der er fejl ved data eller ved dokumentationen, hvis fejlen optræder hos mange respondenter. Korriger så vidt muligt fejlen og dokumenter, at den er korrigeret. Som ved den anden fejltype kan der f.eks. optræde mange fejl af type 2, hvis den anvendte interviewerinstruktion adskiller sig fra den, der anvendes under klargøringen af data, eller hvis der forekommer systematiske indtastningsfejl. Kodning af designbetingede manglende data I dataindsamlinger med komplekse undersøgelsesdesigns er det ofte givet på forhånd, at ikke alle respondenter skal deltage i alle dataindsamlingsrunder. Hvis en respondent på forhånd har været udelukket fra en del af dataindsamlingen, kodes værdien som deltog ikke. Kodeværdien for deltog ikke er uoplyst + 2. Dvs. kodeværdien bliver 101, hvis kodeværdien for uoplyst er 99. Eksempel Spørgeskema 1 Spørgeskema 2 -spørgeskema til patienter i medicinsk behandling - spørgeskema til patienter i kontrolgruppen Ved efterfølgende fletning af data for de to grupper af respondenter kodes variablene på basis af spørgeskema 1 som deltog ikke for alle, der ikke var udtaget til denne del af undersøgelsen (de var i kontrolgruppen og modtog spørgeskema 2). Tilsvarende kodes variablene på basis af spørgeskema 2 som deltog ikke for de respondenter, der ikke udtaget til denne del (de var i medicinsk behandling og modtog spørgeskema 1). Bemærk: Kodekategorien deltog ikke ligner i princippet kodekategorien irrelevant. Forskellen er, at deltog ikke anvendes, når besvarelserne mangler som følge af undersøgelsens design, mens irrelevant anvendes, når besvarelsen mangler pga. et filter i det aktuelle spørgeskema. 5

Check af kodeværdier Kør frekvenstabeller for alle numeriske variable. Check at dokumentationen til datafilen indeholder information om alle faktisk forekommende kodeværdier. Tilkobling af datadokumentationen Den tilhørende datadokumentation skal kobles til systemfilen (og for SAS s vedkommende: formatbilioteket). Følgende skal angives: 1) Variable Name Der er intet særligt krav til variablens navn. Indholdet vil blive bevaret af DDA, men vil ikke blive anvendt til noget specifikt formål. 2) Variable Type Check at alle variable i filen er enten numeric eller string. 3) Variable Width Angiv herigennem det største antal karakterer, som kodeværdierne for variablen kan antage. 4) Decimals Angiv herigennem det største antal decimaler, som anvendes i kodeværdierne for den pågældende variabel. Det er nødvendigt at gennemgå dette for alle variable, da statistikprogrammerne sjældent anvender korrekt decimalangivelse. Brug frekvenstabeller til at konstatere det faktiske antal anvendte decimaler. Der kan maksimalt angives ni decimaler. 5) Variable Label Sæt label på variablen. Label en skal indeholde en henvisning til spørgsmålsnummeret i spørgeskemaet efterfulgt af den samlede relevante spørgsmålstekst fra spørgeskemaet. Alle variable skal have en label. 6

Eksempel Spm. 3: Hvor ofte tager du smertestillende medicin (hovedpinepiller o.lign.), som ikke er udstedt på recept? 6) Value Labels Sæt kodeværdilabels på numeriske, heltallige kodeværdier, herunder også på kodeværdierne for uoplyst ( Uoplyst ), irrelevant ( Irrelevant ) og deltog ikke ( Deltog ikke ), men kun hvis der faktisk forefindes uoplyste, irrelevante eller deltager ikke. Hvis kodeværdierne repræsenterer angivne svarmuligheder i spørgeskemaet, skal hver kodeværdilabel gengive den komplette og ordrette tekst fra spørgeskemaet til den pågældende kategori. Alle heltallige numeriske variable, med op til 25 betydende kodeværdier, skal have value labels. 7) Missing Der kan forekomme tre kategorier af ikke-valide kodeværdier (missing): uoplyst, irrelevant og deltog ikke. For datasæt, der afleveres i SPSS-format: alle ikke-valide kodeværdier sættes som discrete values. For datasæt, der afleveres i STATA-format: undlad at bruge missing-funktionen i STATA. Den er inkompatibel med det endelige arkiveringsformat. Kod i stedet alle ikke-valide kodeværdier som betydende kodeværdier Personhenførbare data Hvis materialet indeholder personhenførbare data, skal disse afleveres i en separat nøglefil. 7

Anden relevant tekst o Medsend undersøgelsens spørgeskema (registreringsskema) i pdf-format. Hvis spørgeskemaet oprindeligt er udarbejdet i et tekstbehandlingsprogram (f.eks. Word), kan det alternativt medsendes i tekstbehandlingsformatet (.doc). o Udfyld og medsend det metodiske spørgeskema på DDA Sundheds hjemmeside (sundhed.dda.dk). Skemaet findes under Bevaring af data / Ekstern oparbejdning. o Eventuelle kommentarer til særlige forhold for enkeltvariable, f.eks. uforholdsmæssigt mange fejl af type 1 eller 2, medsendes som yderligere dokumentation i en tekstbehandlingsfil (.doc) eller som tekstfil (.txt). Vers. 5 (070312) 8