Data management Vejledning til ph.d. studerende og andre v/ Willy Karlslund
|
|
|
- Augusta Dahl
- 10 år siden
- Visninger:
Transkript
1 Data management Vejledning til ph.d. studerende og andre v/ Willy Karlslund Denne korte vejledning om data management gennemgår hvordan data i et projekt håndteres, og hvordan datagangen kan styres i et program. Desuden beskrives hvordan man anonymiserer data, foretager fejlsøgninger, retter fundne fejl, håndterer manglende værdier og genererer ekstra variable. Endelig gennemgås det, hvordan et datasæt oparbejdes til analysebrug. - Da data management ofte ender med, at data overgives til Dansk Data Arkiv er dette også beskrevet. Operationalisering. Noget af det første man skal gøre, når man har bestemt sig for at undersøge en problemstilling ved hjælp af data fra registre eller fra spørgeskemaer er at operationalisere. Hvad er det man skal undersøge? Med andre ord, hvilke enheder skal i spil: Patienter, læger, lægepraksis, laboratorieprøver, sygdomsepisoder. - Hvad er det der skal tælles? Hvilke spørgeskemaer og registre man skal bruge, kan man fx komme frem til ved forestille sig de tabeller, der bedst kan illustrere ens pointer i en tænkt fremtidig artikel. Det kan give en idé ikke kun om enhed(er), men også om stikprøven. Hvem skal med? - og hvor mange? Det kan forekomme, at man både skal bruge patient og lægeoplysninger - og eventuelt også på forskellige tidspunkter i et forløb. Hvordan skal den endelige datastruktur så være for at sige noget om det problem der er fokus på? Det er en god idé at have diskuteret dette, og eventuelt teste det i et pilotprojekt inden det fastlægges, hvilke data der skal hentes hjem. Fra rådata til analysedatasæt. Hvordan data håndteres er vigtigt for ikke at fare vild i analyserne, for den senere dokumentation af hvad der er sket og for den endelige arkivering af projektet. Det mest hensigtsmæssige er så vidt muligt at skrive det hele i ét langt program, som i den ene ende tager rådata ind, og i den anden skriver de analysedatasæt ud, der skal bruges til den egentlige analyse. Man kan udføre meget i fx SPSS, uden at programmere, - men i så fald bliver det svært at bevare overblikket endsige at reproducere processen. Programmet kan være skrevet i fx SAS, i STATA eller måske i SPSS-syntaks. Hvilken applikation (SAS etc.) man bruger, må man overveje ud fra en række faktorer. Hvad man har til rådighed, naturligvis. Men også om applikationen har alle de nødvendige funktioner, og har tilstrækkelig kompatibilitet. Kan applikationen importere de aktuelle data? Vil de resulterende analysedatasæt kunne anvendes af de aktuelle statistikprogrammer? - Det vigtigste er imidlertid, at der programmeres. Resten af dette skrift er en beskrivelse af et sådant program og dets elementer.
2 Hvordan får man data ind? Data kan komme fra udfyldte spørgeskemaer eller registreringsark på papir, - fra spørgeskemaer, som er udfyldt på nettet eller fra diverse mere eller mindre offentlige registre og databaser. Data fra et andet datamedie leveres almindeligvis i en kompatibel form, fx som regneark, database-tabeller eller lignende. Af og til kan de også leveres direkte som SPSS, eller SAS-datasæt. Spørgeskemaer på papir skal enten scannes ind eller tastes. For at skemaerne kan scannes forudsættes det normalt at de er konstrueret, med layout og alt, af det samme program som skal scanne de udfyldte skemaer. Det er ikke alle institutioner, som kan tilbyde den metode. Det er ret dyrt, og kan kun betale sig ved et ret stort flow af spørgeskemaundersøgelser. Skal skemaerne derimod tastes bør det ske ved dobbelttastning. Dvs. at der tastes to gange, uafhængigt af hinanden, og at de resulterende data derefter sammenlignes. Eventuelt kan man vælge kun at taste én gang, men med en efterfølgende korrekturlæsning. Erfaringsmæssigt vil man, hvis man ikke dobbelttaster eller korrekturlæser, få en eller flere fejl i hvert eneste skema, selv ved ret lille antal spørgsmål. De data der føres ind havner i et datasæt, som er den form for fil der normalt anvendes til statistisk analyse. Dvs. en rektangulær datafil (datamatrix), hvor hver linje er en observation, fx et spørgeskema på en patient, - og hver søjle er en variabel (se nedenstående figur). Hver celle repræsenterer således et svar, eller rettere en svarmulighed. Et spørgsmål med mulighed for flere samtidige svar skal fx have en variabel for hvert afkrydsningsfelt. Det er formålstjenligt men ikke absolut nødvendigt, at hver observation har en identifikationsvariabel, altså en variabel som entydigt identificerer observationen.
3 Af datasættet fås den allermest elementære og grundlæggende tabel, en kontingenstabel, se nedenstående figur: Anonymisering. Rådata skal eventuelt anonymiseres inden de tages ind i det overordnede program. Det kan ske i et eget lille program, normalt skrevet i samme programsprog som hovedprogrammet. Navne og personnumre fjernes og erstattes af løbenumre. Der skal eventuelt også dannes et nøgle datasæt, som indeholder løbenumre og fx et CPR-nummer. Nøgle datasættet kan leveres tilbage til dataleverandøren, fx en almen praksis, således at det kun er her anonymiteten kan brydes. Hvis patienterne oprindeligt er identificeret ved hjælp af et CPR-nummer kan det også være formålstjenligt i samme program at trække køn og fødselsdata ud. Disse data, inklusive ovennævnte løbenummer lægges i et specielt datasæt, som tages ind i hovedprogrammet sammen med de anonymiserede rådata.
4 Fejlsøgning. Det første element i det overordnede program består således i import af rådata. Derefter følger arbejdsmæssigt: Fejlsøgningen! Hvis data er dobbelttastet skal de to indtastninger sammenlignes. Først for uoverensstemmelser på værdierne, og derefter på observationerne. Det kan ske at samme skema ved et uheld er tastet to gange, eller at der ved den ene indtastning mangler et skema. Det skal programmet rapportere. Hvis der er en fejl i identifikationsvariablen vil det fremstå ved, at der i begge indtastninger er en observation, som ikke findes i den anden indtastning. Når sammenligningen er gjort og fejlene er skrevet ud gøres denne del af programmet, dvs. sammenligningen mellem de to indtastninger til en kommentar. Dvs. at man kan se hvordan sammenligningen er udført, men at denne del af hovedprogrammet ikke længere er i brug. Herefter kan man lede efter såkaldte vilde koder eller værdier. Dvs. koder der ikke bør forekomme. En variabel som beskriver patientens køn bør fx normalt ikke indeholde mere end to værdier: en for mand og en for kvinde. Den slags fejl er lette at opdage. Lige så snart man har læst data ind kan man fortage en udskrift af kontingenstabeller på samtlige variable, også kaldet en randfordeling. Gå alle variable igennem, og du ser de vilde koder. De vilde koder kan man helt undgå ved at anvende en indtastningdatabase, hvor der er sat regler op for hvilke koder der er tilladt i de enkelte variable Hvis der forekommer filtre i et spørgeskema skal der søges efter inkonsekvent udfyldelse af skemaet. Visse spørgsmål skal måske ikke bevares af alle respondenter. Typisk når man betjener sig af en hvis ja -klausul. Hvis sådanne spørgsmål alligevel er besvaret på trods af det indledende filter kan der enten være tale om en tastefejl, som ikke er fanget af dobbelttastningen eller om udfyldelsesfejl, dvs. at respondenten formodentlig har svaret på noget andet end det der er spurgt om. Endelig kan man søge efter umuligheder eller usandsynligheder: etbenede patienter med kondital eller gynækologiske undersøgelser på mænd, for eksempel. Disse skemaer skrives ud for eventuelt at opdage flere fejltastninger eller udfyldelsesfejl. Er her kun tale om usandsynligheder skal den del af søgningen siden hen udkommenteres. Som supplement til dette kan man vælge at skrive en tilfældig stikprøve af skemaer ud for en ekstra korrekturlæsning. Fejlrettelse. Nu følger fejlrettelsen. Eller mere korrekt: Rettelserne skal skrives ind sekventielt før fejlsøgningerne i hovedprogrammet. Derved vil fejlene ikke længere blive skrevet ud, forudsat rettelserne er udført korrekt. Hvis der er udført en dobbelttastning bruger man naturligvis kun den mest korrekte rådatafil, og foretager rettelserne ud fra den. Tastefejl rettes ved, for hver observation med fejl at indføre de korrekte værdier i de fejlbehæftede variable. Man kan fx skrive, at for løbenummer 26 skal en specifik variabel være lig 5. Hvis der i rådata stod noget andet er det hermed rettet i det kommende analysedatasæt, samtidigt med at rettelsen er dokumenteret.
5 Er der ved en dobbelttastning rod i identifikationen af observationerne kan det kun rettes ved at søge tilbage til rådata. Hvis der ved den ene tasteoperation er glemt en eller flere observationer kan disse tilføjes i programmet. Hvis en observation er tastet to gange i rådatafilen kan den ene fjernes, men det må ikke gøres i rådatafilen. Hvis der er en tastefejl i identifikationsvariablen kan man forsøge at sammenligne de øvrige variable for at få afklaret, hvad den rigtige værdi af identifikationsvariablen i den aktuelle indtastning skal være. Rettelserne skrives i programmet, når man har identificeret de fejlbehæftede observationer, eventuelt ved hjælp af nogle af de øvrige variable. Inkonsekvent udfyldelse eller åbenbart umulige besvarelser rettes ved, at alle de modstridende oplysninger fjernes. Dvs. at alle de relevante variable gøres ubesvarede for den aktuelle observation. Eventuelt kan man, hvis meningen kan ses af sammenhængen, nøjes med at ændre en af variablene til ubesvaret, så modstriden fjernes. I øvrigt udføres rettelsen og dokumentationen på samme måde som ovenfor. Så danne rettelse bør desuden rapporteres skriftligt. Det er altid en god idé før man har data i hus at diskutere hvilke kodemæssige forholdsregler man vil tage i brug, når der er inkonsekvent besvarelse, eller der er givet flere svar til en variabel, hvor man kun forventer ét svar. Det anbefales at søge information om håndtering af dette i litteraturen om spørgeskemaer. Manglende værdier. Der kan være mange grunde til at en variabel er blank. Dvs. at der i den aktuelle celle ikke er anført nogen værdi. I daglig tale kaldes det ofte for missing data, men det begreb omfatter også manglende observationer. Altså observationer der burde være med i stikprøven, men ikke har svaret på henvendelsen eller ikke deltager i projektet. Det kaldes almindeligvis for bortfald. Der skelnes klassisk mellem to former for manglende besvarelse (missing value): ukorrekt uoplyst og korrekt uoplyst. Korrektheden henviser her til validiteten. Korrekt betyder, at den manglende besvarelse er planlagt, og altså valid. Ukorrekt uoplyst kaldes ofte bare uoplyst og korrekt uoplyst kaldes irrelevant, sidstnævnte er ofte repræsenteret med bogstavet R. Det kan desuden være på sin plads at skelne mellem flere former for uoplyst (ukorrekt uoplyst), fx ubesvaret og utolkelig, jvf. afsnittet om fejlrettelse ovenfor. Hvor om alting er det vigtigt at skelne mellem de forskellige former for manglende værdi. I modsat fald kan tabellerne siden hen være svære at tolke. De større statistikprogrammer har en række specialværdier til rådighed for manglende værdier, hvor man kan bestemme om disse skal tages med i analyser og tabeller eller ej. Manglende værdier repræsenteres almindeligvis af et bogstav i variable, som ellers er numeriske. I alfanumeriske variable, dvs. variable hvor de egentlige værdier kan være et bogstav eller et ord, giver begrebet manglende værdi ingen mening. Et tomt felt (celle) er ligeværdigt med et udfyldt. Alfanumeriske variable skal bruges med forsigtighed, fordi de er svære at håndtere i statistiske analyser. Normalt skal alle besvarelser repræsenteres af tal (læs om værdietiketter i næste afsnit). I hovedprogrammet skrives definitionerne af manglende værdier ind sammen med fejlrettelserne. Fx: Hvis der er svaret nej i en ja-klausul, og de efterfølgende variable er blanke, så skal den manglende værdi i alle de relevante variable sættes til irrelevant, som fx er repræsenteret med bogstavet R. På den måde kan man i tabellerne se forskel på uoplyste og irrelevante.
6 Oparbejdning af datasæt. Et datasæt karakteriseres af hvad og hvilke vi tæller. Altså enhed og stikprøve. Derfor skal etiketten på datasættet beskrive dette. Fx at et datasæt indeholder patienter fra en bestemt praksis, eller konsultationer i et bestemt år. Til hver variabel skal der skrives en etikette. Hvis variablen fx repræsenterer et spørgsmål er det bedst at formulere spørgsmålet i en kort version, med et efterfølgende spørgsmålstegn. Er variablen en størrelse, fx vægt eller blodtryk, kan etiketten skrives som et navn eller en betegnelse med efterfølgende kolon. Værdietiketter er som navnet siger en etikette som sættes på en variabels værdier (koder). Fx at 1 betyder mand og 2 betyder kvinde. I nogle programmer skal man skrive disse etiketter for én variabel af gangen. Medens man i andre kan anvende formater. Ofte har man en række variable hvor svaret er ja/nej eller positiv/negativ. Her er det behændigt at bruge et format. Et format er helt enkelt et sæt værdietiketter, der kan bruges af flere variable. Formatet skal så have et navn man kan referere til. Programmet skal desuden give mulighed for i en sætning at skrive hvilke variable, der skal bruge et aktuelt format, fx formatet janej, som sætter ja i stedet for 1 og nej i stedet for 2. Formater kan også bruges til at klassedele en variabel. Man kan fx have flere formater til en variabel som alder. Et hvor man for alle værdier mellem 0 og 18 skriver børn, og for alle mellem 19 og 29 skriver unge osv. Et andet hvor man fx deler op i yngre end 65 og 65+ årige. At anvende formater på den måde kan imidlertid kun bruges i kontingenstabeller og lignende. Det giver ikke megen mening at klassedele med et format når det gælder mere komplicerede statistiske beregninger. I så fald skal man generere en variabel til formålet (se nedenfor). Ved kombinationen af variabel-etiketter og formater skal man tænke på, at det i tabellerne kommer til at fremstå som en helhed. Formuler det derfor som et spørgsmål eller en betegnelse med et efterfølgende svar eller resultat. Hvis man desuden i sin titel på analysen eller tabellen er omhyggelig med at skrive hvilken enhed og hvilken stikprøve beregningerne foretages på, bliver tabellerne umiddelbart læselige og mange misforståelser kan undgås. Formatdefinitionerne og deres tilknytning til variablene skrives ind hovedprogrammet. I SAS indlæses formaterne ikke i datasættet, men i en ekstern fil kaldet et format-katalog. Dette katalog skal siden hen altid benyttes sammen med datasættet. Man kan betragte format-kataloget som en slags hjælpefil til analysedatasættet (se senere). Genererede variable. Et eksempel på en variable defineret på grundlag af en eller flere variable fra rådata kan fx være en aldersvariabel. Man kan beregne alderen på en bestemt dato ud fra fødselsdatoen. Datoer kan man imidlertid kun regne på, hvis de er genereret som egentlige datovariable. En datovariabel har en værdi som udtrykker et antal dage fra et nulpunkt. En datovariabel med værdien: , er dagen dage før 1. januar 1960, hvis den dato nu er nulpunktet i den anvendte applikation. Med datovariable kan man beregne alderen ved en bestemt undersøgelse ved at trække fødselsdatoen fra datoen for undersøgelsen. Resultatet bliver alderen i dage, men det kan let omregnes til år
7 ved hjælp af en funktion. I SAS hedder funktionen YRDIF og hele udtrykket bliver: YRDIF(undersøgelsesdato, fødselsdato). For nu at gøre det lidt mere konkret. Hvis datovariable skal skrives ud fx i tabeller bliver det helt uforståeligt med variablens egentlige værdier (fx: for 15. august 1932). Imidlertid stiller applikationen normalt et færdigt format til rådighed, som oversætter værdierne til læsbare datoer. Man skal bare tilknytte det rette format til variablen (se ovenfor). Man kan også generere en variabel, der klassedeler en oprindelig variabel, som så kan bruges i en statistisk model. Hvis der fx er tale om en oprindeligt ordinal variabel kan man tildele alle værdier over en vis størrelse én kode og de øvrige en anden. Vær opmærksom på, at der allerede ved operationaliseringen af et projekt skal tages stilling til hvilke koder (værdier) man anvender til sine svarkategorier. Det har betydning for mange statistiske modeller. Det vil spare en for en del ekstra arbejde, hvis man bruger de mest hensigtsmæssige kode i første omgang (overvej fx om alle dårlige svar skal tildeles den laveste værdi eller den højeste). Genererede variable til brug i analysedatasættene skrives ind i hovedprogrammet efter fejlrettelse og fejlsøgning. Man kan også definere nye variable i de senere analyseprogrammer, men i så fald bliver dokumentationen mindre overskuelig.
8 Sammensætning af flere datasæt. Datasæt kan i princippet sættes sammen på to måder. De kan sammenkædes eller de kan flettes. Hvis man fx har hentet de samme data i flere lægepraksis. Dvs. de samme oplysninger, men på forskellige patienter. I så fald står man med flere rådatafiler, som man gerne vil sætte sammen til et datasæt over patienter fra et bestemt område. I så fald sammenkæder man datasæt. Hvis man derimod henter oplysninger om de samme patienter fra flere kilder, så fletter man datasæt, fx ved hjælp af et patientnummer. Sammenkædning af rådata indføjes i hovedprogrammet før fejlsøgning og fejlrettelse. Eventuelle sammenfletninger af datasæt udføres i forbindelse med udskrivning af analysedatasæt. Se nedenfor. Analysedatasæt. Analysedatasættene skal være så få som mulige for at forenkle analysearbejdet. Hvis man kan nøjes med et datasæt per enhed vil det være det bedste. Altså et datasæt for patienter, ét for lægepraksis, ét for konsultationer, ét for ydelser osv. Det kan også være formålstjenligt med et datasæt over alle udtrukne (fx patienter) med eventuelle oplysninger om ikke-deltagere. Man kan samle data ind for konsultationer ved hjælp af sygesikringsregninger eller lignende, og derefter tælle dem op for hver patient til eksempelvis et kumuleret patient-datasæt. Modsat kan man generere et ydelses-datasæt fx ud fra patientdata med tilhørende oplysninger om ydelser.
9 Der er mange muligheder. Men hvilke analysedatasæt man vil have skal som sagt først og fremmest være styret af hvordan data skal analyseres. Det handler om operationalisering. Det er et spørgsmål om hvilke data, hvor mange data og på hvilken form. Sammenfletning af datasæt. Generering af analysedatasæt skrives sidst i hovedprogrammet. Arkivering af projektet. Et projekt arkiveres normalt hos Dansk Data Arkiv ( ). Foruden de overordnede oplysninger om undersøgelsen, spørgeskemaer og eventuelle registreringsskemaer skal data indleveres: Analyse datasættene: Det kan ske i SPSS, SAS eller STATA. Input filerne, som leveret fra registre og/eller ind-scannede eller indtastede spørgeskemafiler. Desuden et eventuelt formatkatalog, og selvfølgelig hovedprogrammet. Har man gjort det, er projektet endeligt dokumenteret, og kan gendannes.
Sådan afleverer du forskningsdata til arkivering
Sådan afleverer du forskningsdata til arkivering For at kunne arkivere data på en meningsfuld måde skal Rigsarkivet bede om: 1. Et udfyldt afleveringsskema 2. Projektbeskrivelse i både en dansk og engelsk
Klargøring af data til aflevering til DDA. Instruks
v Klargøring af data til aflevering til DDA Instruks Denne instruks gennemgår datadokumentationsformater m.v. for datasystemfiler, som skal afleveres til Dansk Data Arkiv efter indgået aftale om ekstern
Introduktion til SPSS
Introduktion til SPSS Øvelserne på dette statistikkursus skal gennemføres ved hjælp af det såkaldte SPSS program. Det er erfaringsmæssigt sådan, at man i forbindelse af øvelserne på statistikkurser bruger
Jacob Hviid Hornnes, Anne Christensen og Ulrik Hesse. Arbejdsnotat. Metode- og materialeafsnit til Sundhedsprofil for Gribskov Kommune
16. august 2006 Jacob Hviid Hornnes, Anne Christensen og Ulrik Hesse Arbejdsnotat Metode- og materialeafsnit til Sundhedsprofil for Gribskov Kommune 1. Materiale og metode 1.1 Indsamling af data Data er
OPBYGNING AF INSTRUMENTER. Online Designeren Record ID Felttyper Validering og variabelnavne
OPBYGNING AF INSTRUMENTER Online Designeren Record ID Felttyper Validering og variabelnavne Online Designer Online designeren er det primære værktøj til at opbygge skemaet til dataindsamling. I REDCap
At lave dit eget spørgeskema
At lave dit eget spørgeskema 1 Lectio... 2 2. Spørgeskemaer i Google Docs... 2 3. Anvendelighed af din undersøgelse - målbare variable... 4 Repræsentativitet... 4 Fejlkilder: Målefejl - Systematiske fejl-
KORTLÆGNING AF DIGITIALISERINGS- BEHOV I DANMARK HUMANOMICS RESEARCH CENTER
ANALYSERAPPORT KORTLÆGNING AF DIGITIALISERINGS- BEHOV I DANMARK HUMANOMICS RESEARCH CENTER Denne rapport samt bilag indeholder den endelige database af spørgeskemaet Anvendelsen af digitale ressourcer
Identifikation af planer der ikke findes i PlansystemDK vha. datasættet... 9
Vejledning i brug af Tingbogsudtrækket Version 1.0 af 1. juli 2009 Indhold Indledning... 1 Planer i Tingbogen... 2 Planer i PlansystemDK... 3 Sammenhæng mellem Tingbogen og PlansystemDK... 3 Datastruktur...
HOFTEALLOPLASTIK - DATAUDTRÆK OG IMPORT TIL EXCEL
HOFTEALLOPLASTIK - DATAUDTRÆK OG IMPORT TIL EXCEL Når man er logget på KMS systemet, vælges Dataudtræk under punktet Vælg modul, hvorefter der klikkes på Gå til: På næste side klikkes på knappen Opret:
Binært LAS-format Denne indstilling import Laser scan datafiler, i LAS format.
Kvadratnetsmodel - Import af Laser Scan Datafiler Funktionen til at oprette kvadratnetsmodeller er nu blevet udvidet og omfatter nu også en funktion til at importere laser scanning datafiler. Metoden bag
Spørgeskemaundersøgelser og databehandling
DASG. Nye veje i statistik og sandsynlighedsregning. side 1 af 12 Spørgeskemaundersøgelser og databehandling Disse noter er udarbejdet i forbindelse med et tværfagligt samarbejde mellem matematik og samfundsfag
Statistik II 1. Lektion. Analyse af kontingenstabeller
Statistik II 1. Lektion Analyse af kontingenstabeller Kursusbeskrivelse Omfang 5 kursusgange (forelæsning + opgaveregning) 5 kursusgange (mini-projekt) Emner Analyse af kontingenstabeller Logistisk regression
Program dag 2 (11. april 2011)
Program dag 2 (11. april 2011) Dag 2: 1) Hvordan kan man bearbejde data; 2) Undersøgelse af datamaterialet; 3) Forskellige typer statistik; 4) Indledende dataundersøgelser; 5) Hvad kan man sige om sammenhænge;
Husk Nummerering af afsnit. Navn og gruppe mv. skal fremgå af header på alle sider.
Metode projekt tips Husk Nummerering af afsnit. Navn og gruppe mv. skal fremgå af header på alle sider. Husk, at et metodeafsnit ikke er retrospektivt (hvad vi har gjort) men skal være prospektivt (hvad
SARA. Kvik Guide 2. udgave. Denne vejledning vil på mindre end en time vise dig, hvordan du kommer i gang med at bruge SARA.
SARA Kvik Guide 2. udgave Denne vejledning vil på mindre end en time vise dig, hvordan du kommer i gang med at bruge SARA. Du vil lære at: Søge poster; Fremvise poster; Redigere en eksisterende post; Oprette
Kort vejledning i anvendelse af NFA s spørgeskema om social kapital på arbejdspladsen
Kort vejledning i anvendelse af NFA s spørgeskema om social kapital på arbejdspladsen Seniorforsker Vilhelm Borg Det Nationale Forskningscenter for Arbejdsmiljø November 2014, 1.udgave I denne vejledning
Eksempel på besvarelse af spørgeordet Hvad kan udledes (beregn) inkl. retteark.
Eksempel på besvarelse af spørgeordet Hvad kan udledes (beregn) inkl. retteark. Denne opgavetype kan tage sig ud på forskellig vis, da det udleverede materiale enten kan være en tabel eller en figur. Nedenfor
SAS formater i Danmarks Statistik
Danmarks Statistik, Forskningsservice og Kundecenter 9. januar 2012 SAS formater i Danmarks Statistik 1. Indledning... 1 2. Hvor findes formater og øvrige datafiler?... 2 3. Hvordan bruges formater i SAS-programmet?...
OPENs retningslinjer for hjemsendelse af analyseresultater fra Sundhedsdatastyrelsens forskermaskine & Danmarks Statistiks forskerordning
hjemsendelse af analyseresultater fra Sundhedsdatastyrelsens forskermaskine & Danmarks Statistiks forskerordning Indhold Retningslinjer gældende for alle, som har adgang til data ved Sundhedsdatastyrelsen
EVALUERING I SURVEYXACT TRIN FOR TRIN
EVALUERING I SURVEYXACT TRIN FOR TRIN LÆR AT TACKLE 2015 KOMITEEN FOR SUNDHEDSOPLYSNING 1 INDLEDNING Komiteen for Sundhedsoplysning stiller SurveyXact et internetbaseret redskab til kvalitetssikring til
Ungeanalyse. En analyse af ungegruppen i Roskilde Jobcenter. Udarbejdet af Henriette Roth og Frederik Düring
Ungeanalyse En analyse af ungegruppen i Roskilde Jobcenter Udarbejdet af Henriette Roth og Frederik Düring Indledning Målet med målgruppeanalysen har været at få et overblik over ungegruppen i Roskilde
Harald Michalsen og Lasse Storr-Hansen. Log på med administrator rettigheder, så du ser ovenstående hovedmenu
Importér skemadata fra Lectio 1 af 16 Log på med administrator rettigheder, så du ser ovenstående hovedmenu Vælg Konverter skemadata Klik på Eksporter skemadata Importér skemadata fra Lectio 2 af 16 Vælg
Udarbejdet af: Frontal Lobe teamet, Jonathan Lawaetz og Joachim Skovbo Dato for opdatering: 27/05/18. Indholdsfortegnelse
The Basics REDCap Indholdsfortegnelse Basale trin i REDCap 3 Oversigt over projekter 3 Projekt setup 3 Online designer 4 Instrument og Record ID 4 Field Label, identifier, required og field note. 5 Variable
EVALUERING I SURVEYXACT TRIN FOR TRIN
EVALUERING I SURVEYXACT TRIN FOR TRIN LÆR AT TACKLE 2015 KOMITEEN FOR SUNDHEDSOPLYSNING 1 INDLEDNING Komiteen for Sundhedsoplysning stiller SurveyXact et internetbaseret redskab til kvalitetssikring til
Finanstilsynets indberetningssystem. Vejledning til Regnearksskabelonerne
Finanstilsynets indberetningssystem Vejledning til Regnearksskabelonerne Finanstilsynet - 2. udgave oktober 2009 Indholdsfortegnelse 1 INDLEDNING... 2 2 FORUDSÆTNINGER... 3 3 TRIN FOR TRIN... 4 3.1 Hent
ectrl Skabelonkonvertering
ectrl Skabelonkonvertering Indholdsfortegnelse 1. Indledning 3 2. Import ved hjælp af standardskabeloner 4 Kolonneopsætning og feltdefinition 6 3. Opsætning af konverteringsdefinitioner 8 4. Udvidede muligheder
Pensioneringsprocessen/Statens Administration
PENSAB Pensioneringsprocessen/Statens Administration Indhold 1. Overblik over den samlede proces... 2 2. Tildel pensionssag... 3 2.1 Søg i listen [Pensionssager]... 5 2.2 Tildel sag... 5 2.3 Afgiv sag...
Danmarks Statistik. Retningslinjerne for brug af Forskermaskiner Institut for Folkesundhed Aarhus Universitet
Danmarks Statistik Retningslinjerne for brug af Forskermaskiner Institut for Folkesundhed Aarhus Universitet Institut for Folkesundhed Datamanagement, nsb Version 1.0 2014 1 1 Indholdsfortegnelse 2 Introduktion...
Anvendt Statistik Lektion 6. Kontingenstabeller χ 2- test [ki-i-anden-test]
Anvendt Statistik Lektion 6 Kontingenstabeller χ 2- test [ki-i-anden-test] Kontingenstabel Formål: Illustrere/finde sammenhænge mellem to kategoriske variable Opbygning: En celle for hver kombination af
Øvelse 7: Aktuar-tabeller, Kaplan-Meier kurver og log-rank test
Øvelse 7: Aktuar-tabeller, Kaplan-Meier kurver og log-rank test Formålet med øvelsen er at analysere risikoen for død forbundet med forskelligt alkoholforbrug. I denne øvelse skal analyserne foretages
Bliv opdaget på Internettet! - 10 gode råd til at optimere din hjemmeside til søgemaskiner
Bliv opdaget på Internettet! - 10 gode råd til at optimere din hjemmeside til søgemaskiner Af Henrik Bro og Martin T. Hansen I har måske allerede en flot, og informativ hjemmeside. Og alle jeres kursister
Brystkirurgisk ambulatorium Herlev Hospital
Brystkirurgisk ambulatorium Herlev Hospital Undersøgelsen er blandt 400 patienter, der har besøgt ambulatoriet i perioden 20. august til 30. september 2012. 65 % af disse svarede på spørgeskemaet. På landsplan
Vejledning til udtræk fra UNIK (Version: UNIK Bolig 4)
Vejledning til udtræk fra UNIK (Version: UNIK Bolig 4) Udtræk af data fra UNIK skal ske ved at danne rapporter. I UNIK er der mulighed for at danne tre forskellige slags rapporter: 1) Fastprogrammerede
Faggruppernes troværdighed 2015
Faggruppernes troværdighed 2015 Radius Kommunikation November 2015 Troværdighedsanalysen 2015 Radius Kommunikation har undersøgt den danske befolknings holdning til forskellige faggruppers troværdighed.
GECKO Booking Vejledning til spørgeskema-modul. Læsevejledning. Indholdsfortegnelse
GECKO Booking Vejledning til spørgeskema-modul Er der behov for at få et indgående kendskab til kunden, når de bruger bookingsystemet? Hvad siger brugerne efterfølgende om den service, de har fået? Ved
- Panelundersøgelse, Folkeskolen, september 2014
Svar på spørgsmål om understøttende undervisning og bevægelse, der indgik i Scharling-undersøgelse i Folkeskolens lærerpanel september 2014 Spm. 1: Har du fået mere bevægelse ind i din undervisning i fagene,
Seminaropgave: Præsentation af idé
Seminaropgave: Præsentation af idé Erik Gahner Larsen Kausalanalyse i offentlig politik Dagsorden Opsamling på kausalmodeller Seminaropgaven: Praktisk info Præsentation Seminaropgaven: Ideer og råd Kausalmodeller
PUT og INPUT funktionerne
PUT og INPUT funktionerne Af: Peter Kellberg Danmarks Statistik Sejrøgade 11 DK-2100 København Ø [email protected] PUT og INPUT-funktionerne Denne artikel er foranlediget af en henvendelse til vores interne SAS
Arbejdsmedicinsk ambulatorium (Esbjerg) Sydvestjysk Sygehus
Arbejdsmedicinsk ambulatorium (Esbjerg) Sydvestjysk Sygehus Undersøgelsen er blandt 53 patienter, der har besøgt ambulatoriet i perioden 20. august til 30. september 2012. 51 % af disse svarede på spørgeskemaet.
Øre-Næse-Halskirurgisk afdeling Aalborg Sygehus
Øre-Næse-Halskirurgisk afdeling Aalborg Sygehus Spørgeskemaet er udsendt til 215 patienter udskrevet fra afdelingen i perioden 8. august til 31. oktober 2012. 60 % af disse svarede på spørgeskemaet. På
Øre-Næse-Halskirurgisk ambulatorium (Odense) OUH Odense Universitetshospital og Svendborg Sygehus
Øre-Næse-Halskirurgisk ambulatorium (Odense) OUH Odense Universitetshospital og Svendborg Sygehus Undersøgelsen er blandt 398 patienter, der har besøgt ambulatoriet i perioden 20. august til 30. september
Kongevejsklinikken Kongevejsklinikken
LUP 2012 Ambulante Kongevejsklinikken Kongevejsklinikken Undersøgelsen er blandt 30 patienter, der har besøgt ambulatoriet i perioden 20. august til 30. september 2012. 67 % af disse svarede på spørgeskemaet.
Undersøgelse af den nordiske befolknings kendskab og holdning til Nordisk Råd og Nordisk Ministerråd og et særligt forstærket nordisk samarbejde
Undersøgelse af den nordiske befolknings kendskab og holdning til Nordisk Råd og Nordisk Ministerråd og et særligt forstærket nordisk samarbejde Oxford Research, oktober 2010 Opsummering Undersøgelsen
Statistik for Biokemikere Projekt
Statistik for Biokemikere Projekt Institut for Matematiske Fag Inge Henningsen og Helle Sørensen Københavns Universitet November 2008 Formalia Dette projekt udgør en del af evalueringen i kurset Statistik
KURSUS I ANALYSEPORTALEN (AP) DANSK PALLIATIV DATABASE 3 1. ÅBNING AF ANALYSEPORTALEN 3 2. OPRETTELSE AF EN RAPPORT DVS. START AF DATAANALYSE 4
KURSUS I ANALYSEPORTALEN (AP) DANSK PALLIATIV DATABASE 3 1. ÅBNING AF ANALYSEPORTALEN 3 2. OPRETTELSE AF EN RAPPORT DVS. START AF DATAANALYSE 4 3. VALG AF DATA 5 4. BEHANDLING OG VISNING AF DATA 7 1 Liste
Nyt i SkoleIntra 5.9. Sidst ændret den 25 05 2015. Adgang til at redigere elevplaner for elever med sekundær klassetilknytning
Nyt i SkoleIntra 5.9 Sidst ændret den 25 05 2015 Adgang til at redigere elevplaner for elever med sekundær klassetilknytning I SkoleIntra kan man tilknytte en elev til en anden klasse end normalklassen.
Organkirurgisk ambulatorium (Vejle) Sygehus Lillebælt
Organkirurgisk ambulatorium (Vejle) Sygehus Lillebælt Undersøgelsen er blandt 398 patienter, der har besøgt ambulatoriet i perioden 20. august til 30. september 2012. 61 % af disse svarede på spørgeskemaet.
Simpsons Paradoks. Et emnearbejde om årsag og sammenhæng i kvantitative undersøgelser. Inge Henningsen
Simpsons Paradoks Et emnearbejde om årsag og sammenhæng i kvantitative undersøgelser Afdeling for Anvendt Matematik og Statistik Københavns Universitet 1 Simpsons Paradoks -Et emnearbejde om årsag og sammenhæng
Et oplæg til dokumentation og evaluering
Et oplæg til dokumentation og evaluering Grundlæggende teori Side 1 af 11 Teoretisk grundlag for metode og dokumentation: )...3 Indsamling af data:...4 Forskellige måder at angribe undersøgelsen på:...6
Plastikkirurgisk ambulatorium Roskilde Sygehus, Sygehus Nord
Plastikkirurgisk ambulatorium Roskilde Sygehus, Sygehus Nord Undersøgelsen er blandt 397 patienter, der har besøgt ambulatoriet i perioden 20. august til 30. september 2012. 65 % af disse svarede på spørgeskemaet.
Mobning på arbejdspladsen. En undersøgelse af oplevelser med mobning blandt STEM-ansatte
Mobning på arbejdspladsen En undersøgelse af oplevelser med mobning blandt STEM-ansatte September 2018 Mobning på arbejdspladsen Resumé Inden for STEM (Science, Technology, Engineering & Math) var der
Onkologisk afdeling Herlev Hospital
Onkologisk afdeling Herlev Hospital Spørgeskemaet er udsendt til 246 patienter udskrevet fra afdelingen i perioden 8. august til 31. oktober 2012. 57 % af disse svarede på spørgeskemaet. På landsplan svarede
Organkirurgisk ambulatorium (Aabenraa) Sygehus Sønderjylland
Organkirurgisk ambulatorium (Aabenraa) Sygehus Sønderjylland Undersøgelsen er blandt 998 patienter, der har besøgt ambulatoriet i perioden 20. august til 30. september 2012. 64 % af disse svarede på spørgeskemaet.
Hæmatologisk afdeling (Odense) OUH Odense Universitetshospital og Svendborg Sygehus
Hæmatologisk afdeling (Odense) OUH Odense Universitetshospital og Svendborg Sygehus Spørgeskemaet er udsendt til 117 patienter udskrevet fra afdelingen i perioden 8. august til 31. oktober 2012. 61 % af
Nyt i Analyseportalen og Web Report Studio. Analyseportalen
Nyt i Analyseportalen og Web Report Studio Analyseportalen Den nye Analyseportal er ikke meget anderledes end den gamle. Der er dog enkelte funktioner, der er blevet meget anderledes. De er omtalt i denne
Øre-Næse-Halskirurgisk afdeling (Odense) OUH Odense Universitetshospital og Svendborg Sygehus
Øre-Næse-Halskirurgisk afdeling (Odense) OUH Odense Universitetshospital og Svendborg Sygehus Spørgeskemaet er udsendt til 242 patienter udskrevet fra afdelingen i perioden 8. august til 31. oktober 2012.
Start Excel Du skal starte med at åbne Excel. I Excel åbner du herefter en tom projektmappe.
Lineær programmering i Excel Version for PC I lærebogens kapitel 29 afsnit 4 er det med 2 eksempler blevet vist, hvordan kapacitetsstyringen kan optimeres, når der er 2 produktionsmuligheder og flere knappe
R E D C A P M A N U A L. Importér data til REDCap fra CSV-fil. Opbyg din eksisterende database i REDCap Version 1.0
R E D C A P M A N U A L Importér data til REDCap fra CSV-fil Opbyg din eksisterende database i REDCap Version 1.0 Introduktion Der opstår ofte et ønske om at importere data fra andre databaser til REDCap,
Plastikkirurgisk afdeling Roskilde Sygehus, Sygehus Nord
Plastikkirurgisk afdeling Roskilde Sygehus, Sygehus Nord Spørgeskemaet er udsendt til 116 patienter udskrevet fra afdelingen i perioden 8. august til 31. oktober 2012. 66 % af disse svarede på spørgeskemaet.
Surveys. processer, muligheder og faldgruber
Surveys processer, muligheder og faldgruber >> >> Indhold 1. Undersøgelsestyper og metoder for dataindsamling 2. Kontakten med respondenten 3. Konsekvenser af valg af dataindsamlingstype og kontaktstrategi
Kirurgisk afdeling (Esbjerg) Sydvestjysk Sygehus
Kirurgisk afdeling (Esbjerg) Sydvestjysk Sygehus Spørgeskemaet er udsendt til 401 patienter udskrevet fra afdelingen i perioden 8. august til 31. oktober 2012. 52 % af disse svarede på spørgeskemaet. På
Skolevægring. Resultater fra en spørgeskemaundersøgelse blandt skoleledere på danske folkeskoler og specialskoler
Skolevægring Resultater fra en spørgeskemaundersøgelse blandt skoleledere på danske folkeskoler og specialskoler Udarbejdet af Analyse & Tal for Institut for Menneskerettigheder juli 017 Indledning Udsendelse
Lineære sammenhænge, residualplot og regression
Lineære sammenhænge, residualplot og regression Opgave 1: Er der en bagvedliggende lineær sammenhæng? I mange sammenhænge indsamler man data som man ønsker at undersøge og afdække eventuelle sammenhænge
Behandlingsafsnit (indlagte) Ciconia, Århus Privathospital
LUP 2012 Indlagte Behandlingsafsnit (indlagte) Ciconia, Århus Privathospital Spørgeskemaet er udsendt til 26 patienter udskrevet fra afdelingen i perioden 8. august til 31. oktober 2012. 77 % af disse
Vejledning til brug af Persondataformular
Vejledning til brug af Persondataformular Om Persondataformular Persondataformularen skal anvendes til at registrere persondata omkring ansatte og gæster. I nogle tilfælde skal forskningsstuderende og
Vejledning til Excel-ark til Kappaberegning
Vejledning til Excel-ark til Kappaberegning Jan Ivanouw 16. december 2008 Om interraterreliabilitet og Kappaberegning Formålet med Kappaberegning er at vurdere hvor god overensstemmelse der er mellem to
Ringkjøbing Amt Kvalitetsafdelingen for Sundhedsvæsenet. Rapport. Ubenyttede høreapparater blandt førstegangsbrugere i Ringkøbing Amt
Ringkjøbing Amt Kvalitetsafdelingen for Sundhedsvæsenet Rapport Ubenyttede høreapparater blandt førstegangsbrugere i Ringkøbing Amt Eva N.G. Pedersen Juni 2006 Indholdsfortegnelse Sammenfatning 3 Baggrund
Deskriptiv statistik for matc i stx og hf
Deskriptiv statistik for matc i stx og hf 75 50 25 2019 Karsten Juul Deskriptiv statistik for matc i stx og hf Hvad er deskriptiv statistik? 1.1 Hvad er deskriptiv statistik?... 1 1.2 Hvad er grupperede
Monitorering af danskernes rygevaner. Metodebeskrivelse m.m. Januar 2004
Monitorering af danskernes rygevaner 2003 Metodebeskrivelse m.m. Januar 2004 Monitorering af danskernes rygevaner 2003 Metodebeskrivelse m.m. Januar 2004 Indhold Side 1.1. Indledning... 1 1.2. Baggrund
Dokumentation af brugen af psykolog i Sygesikringsregisteret
Dokumentation af brugen af psykolog i Sygesikringsregisteret Generelt Det er ikke sjældent, at man ønsker at udføre et studie, hvor man tæller kontakthyppigheden til f.eks. psykologer eller almen praksis
WinDCCD Brugervejledning. Indhold. Adgangskontrol...2
Indhold Adgangskontrol...2 WinDCCD Hovedmenu...3 Information på tværs...3 Opret generel information...3 Slet generel information...3 Patienter...4 Patienter...4 Sådan filtrerer du data...4 Sådan redigerer
Klinik for Plastikkirurgi, Brystkirurgi og Brandsårsbehandling, ambulatorium Rigshospitalet
Klinik for Plastikkirurgi, Brystkirurgi og Brandsårsbehandling, ambulatorium Rigshospitalet Undersøgelsen er blandt 698 patienter, der har besøgt ambulatoriet i perioden 20. august til 30. september 2012.
Plastikkirurgisk Ambulatorium Z (237 og 239) Aarhus Universitetshospital
Plastikkirurgisk Ambulatorium Z (237 og 239) Aarhus Universitetshospital Undersøgelsen er blandt 399 patienter, der har besøgt ambulatoriet i perioden 20. august til 30. september 2012. 72 % af disse svarede
for gymnasiet og hf 2017 Karsten Juul
for gymnasiet og hf 75 50 5 017 Karsten Juul Statistik for gymnasiet og hf 017 Karsten Juul 5/11-017 Nyeste version af dette hæfte kan downloades fra http://mat1.dk/noter.htm Hæftet må benyttes i undervisningen
Plastikkirurgisk Afdeling Z (231 på Nørrebrogade) Aarhus Universitetshospital
Plastikkirurgisk Afdeling Z (231 på Nørrebrogade) Aarhus Universitetshospital Spørgeskemaet er udsendt til 163 patienter udskrevet fra afdelingen i perioden 8. august til 30. oktober 2011. 79 % af disse
Eksaminanderne på hf tilvalg forventes ikke at kunne udnytte grafregnerens muligheder for regression.
Bilag 3: Uddrag af Matematik 1999. Skriftlig eksamen og større skriftlig opgave ved studentereksamen og hf. Kommentarer på baggrund af censorernes tilbagemeldinger HF-tilvalgsfag (opgavesæt HF 99-8-1)
Dansk Palliativ Database (DPD): Hvordan kan vi bruge den til at finde ud af
Dansk Palliativ Database (DPD): Hvordan kan vi bruge den til at finde ud af noget om selv? v/ Mogens Grønvold, overlæge, dr.med., formand for dansk palliativ database og Mathilde Rasmussen, cand.scient.san.publ.,
GIS indlæsning af kreditorer og betalingsform. Brugervejledning 1.0
GIS indlæsning af kreditorer og betalingsform Brugervejledning 1.0 Indhold 1 Indledning... 5 2 Opsætning af GIS grænseflade til kreditor indlæsning... 5 2.1 Oprettelse af en datastrøm... 7 2.2 Filsystem...
Indvandrere og efterkommere i foreninger er frivillige i samme grad som danskere
Indvandrere og efterkommere i foreninger er frivillige i samme grad som danskere Bilag I afrapportering af signifikanstest i tabeller i artikel er der benyttet følgende illustration af signifikans: * p
