Dataintegration best practice vejen til et godt data warehouse

Relaterede dokumenter
Best practice. Forudsætninger for et godt data warehouse SAS Data Integration Studio

Workshoppens indhold. 1. Hvad kommer vi fra? Og hvor skal vi hen?

SAS Indkøbsanalyse. Lasse Olsen, konsulent Jesper Krogsgaard, seniorkonsulent Professional Services Division

SAS Forum 2012 Den virtuelle operatør

Moderne SAS-programmering på webben med SAS Studio. Georg Morsing SAS Institute

Den fælles strategi for rehabilitering skal bidrage til at skabe et fælles basisfundament for tilgangen til rehabilitering i Ældre og Handicap.

BILAG A SPØRGESKEMA. I denne At-vejledning præsenteres et kort spørgeskema med i alt 44 spørgsmål fordelt på otte skalaer.

Vejledning til AT-eksamen 2016

Opgaveproduktion og kvalitetssikring af opgaver til de nationale test

Implementering af specialiseringsniveauer hvordan? v/ledende terapeut Mette Schrøder. Regionshospitalet Hammel Neurocenter

Kundeværdi og værdistrømme

Lederuddannelsen Den Bevidste Leder

Excel formler og funktioner. Underviser: Nina Kirkegaard Schou Mobil:

Skriv en kommunikationskontrakt


PreviaSundhed PowerPoint præsentation. - template til præsentationer

Vejledning til ledelsestilsyn

EKSEMPEL PÅ INTERVIEWGUIDE

Ny Nordisk Skole. Arbejdshæfte til forandringsteori

NEXTWORK er for virksomheder primært i Nordjylland, der ønsker at dele viden og erfaringer, inspirere og udvikle hinanden og egen virksomhed.

Rapport om kvalitetssikring af patientuddannelse Kommentarer fra Komiteen for Sundhedsoplysning

SDB. MySQL Installation Guide

Direkte adgang til cachede Jupiter data

Spørgeskema på HVAL.DK

ADGANG TIL EGEN SAG ADGANG TIL EGEN SAG. Integration til Borger.dk baseret på fælleskommunal infrastruktur

Hvis du har den i mappen i forvejen skal du ikke hente den en gang til. Nu skal baggrundsbilledet laves, så tryk på NY på ikonen foroven.

Konsekvenser af direkte adgang til fysioterapeut

Resultater af test og evaluering af Stress Graph i Psykiatriens hverdagstestere. Testperiode: 25. januar 30. marts 2016

Dokumentation. Udbyder : sms1919.dk Service : sms-dialog Version : v1.01

bepeaked BEPEAKED - GØR DET ENKELT AT LYKKES

Vejledning til skabelon for resultatlønskontrakt

Eksempler på skabeloner til situationsbeskrivelser.

Virksomhedsservice Inspirationsdag om strategier og tiltag. 29. april 2014

UANMODEDE HENVENDELSER (SPAM)

A-KASSE. Supplerende dagpenge. Information til dig, der arbejder på nedsat tid

principper for TILLID i Socialforvaltningen

Overgangen til RejsUd fra andet rejseafregningssystem

Notat om håndtering af aktualitet i matrikulære sager

Arbejdsmiljøgruppens problemløsning

Den Danske Kvalitetsmodel hvor skal vi hen? Dansk Selskab for Kvalitet i Sundhedssektoren om ønsker til Den Danske Kvalitetsmodel.

Lederadfærdsanalyse II egen opfattelse af ledelsesstil

UDKAST til Værdighedspolitik. (Orange silhuetter kommer)

FEEDBACK INFORMED TREATMENT (FIT) HELLE HANSEN, SFI

WEBINAR OM DREAM WEBINAR OM DREAM

SEO Basic-guide - Optimering af din hjemmeside ved DanaWeb

Vis industrien frem! Flere unge skal have en uddannelse inden for industrien.

Om besvarelse af skemaet

SORØ KOMMUNE POLITIK FOR MØDET MED BORGEREN. Sorø Kommune Byrådet

Løsningsbeskrivelse og visuelle guidelines Dokumentet er en del af NemID tjenesteudbyderpakken.

Retningslinje om Frivilligt arbejde

Unge med særlige behov og seksualitet. v. Kim Steimle Rasmussen, SUMH Mette Gundersen, Sex & Samfund

Forslag til løsning af Opgaver til ligningsløsning (side172)

Direktionens strategiplan

Hvidovregade tilsyn 16.november 2015 Afgørelse: Godkendt Samlet vurdering

Til underviseren. I slutningen af hver skrivelse er der plads til, at du selv kan udfylde med konkrete eksempler fra undervisningen.

Brugertilfredshedsundersøgelse 2014 Hjemmeplejen Del 2 Specifikke Horsens Kommune spørgsmål

Samarbejde om arbejdsmiljø på midlertidige eller skiftende arbejdssteder på bygge- og anlægsområdet

Netbaseret Akademiuddannelse

Spørgsmål og svar om håndtering af udenlandsk udbytteskat marts 2016

Identitet og autenticitet

ledelsesgrundlag Københavns Kommunes Ungdomsskole Københavns Kommunes Ungdomsskole

Variabel- sammenhænge

XXXXX. SUNDHEDS- POLITIK i Faaborg-Midtfyn Kommune

Fredagseffekt en analyse af udskrivningstidspunktets betydning for patientens genindlæggelse

Vejledning om kvalitetssikring i it-systemer

Manual til de lokale webredaktører

Retningslinjer for Rebild Kommunes Talentudviklingspulje

Trivsel og fravær i folkeskolen

Strategi for Natur- og Kulturhistorisk formidling i Jammerbugt Kommune Indhold

Introduktion til forældre og andre voksne, der gerne vil være en del af vores verden

Opdateret vejledning - kønsmæssige sammensætning af ledelsen og afrapportering herom

Nationale kliniske retningslinjer

Ved aktivt medborgerskab kan vi gøre Silkeborg Kommune til en attraktiv kommune med plads til alle. Silkeborg Kommunes Socialpolitik

Det Fælleskommunale Kvalitetsprojekt. God kvalitet og høj faglighed i dagtilbud

Vejledning om ikke erhvervsmæssig jernbanedrift Veteranbanebekendtgørelsen

Årsafslutning i SummaSummarum 4

Vejledning til Photofiltre nr.129 Side 1

Transkript:

Dataintegration best practice vejen til et godt data warehouse Niels-Kenneth Nielsen, seniorkonsulent Professional Services Division

Dataintegration best practice Vejen til et godt data warehouse Agenda Best practice hvorfor er det nødvendigt? Organisering af data warehouse Navngivningsstandarder Dokumentationspraksis Udviklingsstandarder

Best practice hvorfor er det nødvendigt? Fælles referenceramme Design og arkitektur Standarder for udvikling Dokumentation Uden fælles referenceramme Afhængighed af enkeltpersoner Man opfinder den dybe tallerken flere gange Ustruktureret miljø Man risikerer at opfinde flere versioner af sandheden

Best practice hvorfor er det nødvendigt? Få udarbejdet et best practice dokument Hvad skal dokumentet omhandle? Formål og målgruppe Teknisk setup Organisering af data Niveauer i data warehouse Logisk og fysisk folderstruktur Navngivningsstandarder Dokumentationspraksis Udviklingsstandarder Håndtering af sikkerhed Idriftsættelse og schedulering

Organisering af data warehouse Niveauer i et data warehouse Fødekilde Fødekilde Fødekilde Extract Extract Extract Operational data store (ODS) 1:1 kopi af de operationelle data Kildeopdelt Transform Datarens Opsamling af historik Transform Transform Transform Data staging area (DSA) Kildeopdelt Masterdata Centrale tværgående dimensioner Transform Transform Datawarehouse (DWH) Samlet lager af rensede validerede og aftestede data Håndtering af global forretningslogik Kildeopdelt Load Datamart Load Load Applikation data Håndtering af områdespecifikke forretningsregler på tværs af forretningsområder Forretningsopdelt Forretningsopdelt MyBIsystem (optional) Access Access Stored process rapporter, java applikationer BI klienter (EG, WRS, AMO) Back room Front room

Organisering af data warehouse Fra model til folderstruktur Logisk folderstruktur I SAS Data Integration Studio oprettes en rootfolder Organisering af jobs, tabeller, libraries, formater mv. Fysisk folderstruktur Organisering og placering af alle fysiske filer

Organisering af data warehouse Anbefalet logisk folderstruktur Den fysiske folderstruktur bør stemme overens med den logiske fra EnvRoot niveauet Tips: Brug environment variable der peger på roden af den fysiske folderstruktur i stedet for fysiske referencer

Dataintegration best practice Vejen til et godt datawarehouse Best practice: Hvad skal man overveje? Formål og målgruppe Teknisk setup Organisering af data Niveauer i datawarehouse Logisk og fysisk folderstruktur Navngivningsstandarder Dokumentationspraksis Udviklingsstandarder Håndtering af sikkerhed Idriftsættelse og schedulering

Navngivningsstandarder Navngivningsstandarder i SAS Data Integration Studio er vigtige for at sikre overskuelighed og struktur, der illustrerer sammenhænge og gør det lettere at finde jobs samt tabeller. Fastlæg navngivningsstandarder for Jobs Tabeller Kolonner (også på tværs af fødesystemer) Libraries Makroer User-written code/transformations Undgå specialkarakterer i navngivning

Navngivningsstandarder Eksempler Tabeller <niveau>_<systemnavn>_<beskrivelse af tabellen>_<(fysisk tabelnavn)> ods_oes_strukturkontoplan_(ods_oes_strukturkontoplan) Job <niveau>_<systemnavn>_<løbenummer>_<beskrivelse af job>. dsa_ oes_ 202_udtraek_de_relevante_budgetposter. Libraries <niveau>_<system/emne>_<evt. beskrivelse>_<(libname)> dsa_patientdata_(dsa_pas).

Data integration best practice Vejen til et godt data warehouse Best practice: Hvad skal man overveje? Formål og målgruppe Teknisk setup Organisering af data Niveauer i data warehouse Logisk og fysisk folderstruktur Navngivningsstandarder Dokumentationspraksis Udviklingsstandarder Håndtering af sikkerhed Idriftsættelse og schedulering

Dokumentationspraksis Eksempel

Dokumentationspraksis Eksempel

Dataintegration best practice Vejen til et godt data warehouse Best practice: Hvad skal man overveje? Formål og målgruppe Teknisk setup Organisering af data Niveauer i data warehouse Logisk og fysisk folderstruktur Navngivningsstandarder Dokumentationspraksis Udviklingsstandarder Håndtering af sikkerhed Idriftsættelse og schedulering

Udviklingsstandarder Brug af Data Integration Studio Anvend som udgangspunkt standardtransforms Dette princip kan fraviges, hvis: der opnås bedre performance ved user-written kode/transformation der ikke findes en standard transformation til løsning af opgaven substitut for user-written kode/transform kræver brug af en hel række standardtransformationer. Kun én outputtabel per job Tænk performance, når du udvikler

Udviklingsstandarder Performance Hvordan optimerer man sit jobflow med hensyn til performance i SAS Data Integration Studio? Svært at opstille håndfaste regler afhænger af situationen Tommelfingerregel: Brug views hver 2. gang, dvs. undgå at et view refererer til et andet view Medtag kun nødvendige kolonner Minimér længde på tekstkolonner Ved SQL-transformationer sæt alle numeriske kolonner først i select statement Mange tricks, se fx http://support.sas.com/resources/papers/etlperformance07.pdf

Best practice vigtige pointer Få gennemtænkt organisering, navngivningsstandarder mv. for dit data warehouse Denne proces er næsten lige så vigtig som det færdige produkt Få udfærdiget et dataintegrationsdesigndokument! Få udpeget en ansvarlig for, at retningslinjerne overholdes en såkaldt data integration-sherif! Få dokumentet gjort tilgængeligt Husk også, at det er et levende dokument vigtigt at dokumentet opdateres!

Spørgsmål?

Niels-Kenneth Nielsen niels-kenneth.nielsen@sdk.sas.com