Best practice. Forudsætninger for et godt data warehouse SAS Data Integration Studio



Relaterede dokumenter
Dataintegration best practice vejen til et godt data warehouse

SAS Forum 2012 Den virtuelle operatør

SAS Indkøbsanalyse. Lasse Olsen, konsulent Jesper Krogsgaard, seniorkonsulent Professional Services Division

SAS Education Services

Social network analysis

Data warehouse-arkitektur / standarder

Moderne SAS-programmering på webben med SAS Studio. Georg Morsing SAS Institute

Kursuskalender Savner du et kursus på listen, er du meget velkommen til at kontakte os på mail:

Google Maps og SAS/GRAPH software

Egenudviklet promotion tool mellem forskellige SAS Visual Analytics miljøer.

WEBINAR OM DREAM WEBINAR OM DREAM

Metadata og dokumentation af ETL-processen

Data Warehouse Knowledge is Power - Sir Francis Bacon -

Hvorledes kan Business Intelligence påvirke organisationen. København d. 20. november 2013 TDC

Praktisk information Tilmelding Du tilmelder dig telefonisk på eller på:

1:1 Kampagne-evaluering i Danske Bank

Workshoppens indhold. 1. Hvad kommer vi fra? Og hvor skal vi hen?

Velkommen SAS Forum 2010

Autoload i Visual Analytics. Torben Skov, Chefkonsulent, SAS Institute

Modernisering af BI miljø i Codan v.h.a. SAS V9

Data warehouse End-to-end (mission impossible)

Data mining er ikke længere nice to have men need to have

Demonstration af SAS Activity-Based Management v7.1

PROC TRANSPOSE. SAS-tabellen - hensigtsmæssig lagring af data. Copyright 2011 SAS Institute Inc. All rights reserved.

Dynamics AX 2012 (og AX 7) v. Benny Jepsen, Chief Solution Architect, EG A/S

SAS USER FORUM DENMARK 2017 USER FORUM. Rune Nordtorp

MapBasic &.NET interaktion. MapBasic.NET. Jakob Lanstorp IT konsulent COWI. Odense 23. Juni jun 2011 MapBasic &.

SAS Promotion og migrering til 9.4 Johannes Jørgensen & Rune Nordtorp

Jesper Runge Public Division Copyright 2005, SAS Institute Inc. All rights reserved.

Hvordan bekæmper Alm. Brand forsikringssvindel med SAS Fraud Framework for Insurance?

Hassansalem.dk/delpin User: admin Pass: admin BACKEND

Hvordan sikres investeringen i eksisterende systemer, når skyen tages i brug. Carsten Rasmussen, CTO, Capgemini Danmark A/S IDC Cloud Computing 2011

Region Nordjylland. Hvordan skaber et datavarehus værdi i en regional forvaltning? Juni 2015

Udgiftsopfølgning i SBS for institutioner

Måling og analyse af likviditetsrisiko ved anvendelse af SAS Risk Dimensions

Agenda. Kort præsentation Introduktion til Robotic Process Automation (RPA) Demo Hvordan understøtter det forretningen? Hvordan kommer man i gang?

PandaConnect A/S: Adm. direktør Christian J. G. Herold Projektansvarlig Birgitte Jensen-Dahm

SESAM Energi & Forsyning 27. februar Business Intelligence analyser og intelligent rapportering - skræddersyet til branchen!

Guide til opsætning af Google Analytics Eksisterende kunder Visiolab introduction

Guide til opsætning af Google Analytics Eksisterende kunder Visiolab introduktion

Gennemførelse af informationsprojekter. Michael Hyldgaard, projektleder

Guide til opsætning af Google Analytics Nye kunder Visiolab introduktion

Kursusoversigt for juli 2007 januar 2008

SAS Asset Management. Mikal Netteberg Marianne Hansen Søren Johansen SAS Institute A/S. Copyright 2006, SAS Institute Inc. All rights reserved.

Guide til opsætning af Google Analytics Nye kunder Visiolab introduktion

Møde med leverandører om vejledning til anvendelse af kommende fælleskommunale støttesystemer. KL-huset, tirsdag d. 4. juni 2013

KLASSIFIKATION ET AF DE OTTE STØTTESYSTEMER. Version 2.0

make connections share ideas be inspired

SAS9 Platform Netværksmøde 13. november 2008

TESTAUTOMATISERING. Præsentation af: BPT anvendt til automatiseret test. HP test brugerkonference november 2008

DEN GODE MODEL: OPSAMLING PÅ MODELLERINGSOPGAVER OG INTRO TIL MODELLERINGSALTERNATIVER

SAS Forum Danmark 2008 Afslutning

Installationsguide. Integration af erhvervsdata fra NN Markedsdata til Microsoft Dynamics NAV 2015

VÆR EFFEKTIV SOM SAS PROGRAMMØR MED SAS ENTERPRISE GUIDE 7.12 GEORG MORSING

System & Metode ApS præsenterer. En effektiv dokumentportal

Installationsguide. Integration af erhvervsdata fra NN Markedsdata til Microsoft Dynamics NAV 2013

Microsoft Dynamics AX 360º Health Check

Matas digitale kunderejse DELL Technologies forum Thomas Grane Direktør for Teknologi og Organisation Matas A/S

Numeric Data Platform

Opmærksomhedspunkter i udviklingsprocessen

EDI. Microsoft Dynamics NAV 2009 SP1 Klassisk. Side 1. Copyright: Naddon version

Optimér din forretning med Master Data Management til Microsoft Dynamics AX

Hvor tjenes pengene? Farum Park, den 4. november 2014

Find det relevante dokument på rekordtid med A104 Dokumenthåndtering Gunnar Friborg, bips

Støttesystemet Klassifikation. Klassifikation. Et af de otte Støttesystemer

SOL - et Statistik Og Ledelsesrapporteringssystem til TDC Mobil Analyse og Økonomi

Appendiks - Speciale ITU 2002 Offline XML Datavarehus. Figuroversigt. Afsnit 1 Figur 1.1 Fiktiva s nuværende datastruktur

Data repository løsningsbeskrivelse

En introduktion til SAS Risk Dimensions 5.2

U D D A N N E L S E S O V E R S I G T

Dan dine egne SAS - funktioner med PROC FCMP

COWI taksonomier. Informationer i sammenhæng - Forretningstaksonomier i praksis Ensight seminar København 19 oktober 2004

Intelligent kontrol med SAS

HVAD ER VÆRDIEN AF ANALYTICS FOR DIN VIRKSOMHED

Machine Learning til forudsigelser af central KPI

Canon Business Services

Tietgenskolen - Nørrehus. Data warehouse. Database for udviklere. Thor Harloff Lynggaard DM08125

OS2MO 2.0 Fugl Fønix

High-Performance Data Mining med SAS Enterprise Miner 14.1

SPD server som Storage Medie. Michael Rosairus. Fra DB2 til SPD server

Introduktion til Microsoft R. Steen Dybboe, Pragmatic BI MsBIP 2017 Aarhus

28 August Data privacy i SAP Lyngby 27/8 2015

OBJECT IDENTIFICERES OID PHMR

Kursus: Ledelse af it- sikkerhed

BILAG 5.D DOKUMENTATION

TIPS & TRICKS MED KMD - PERSPEKTIV - KMD S EKSPERTER RÅDGIVER I EN EFFEKTIV LØNPROCES

PLATON BUSINESS BRIEFINGS EFTERÅR/VINTER 2010 TION MANAGEMENT BUSINESS ACTIVITY MONITORING MA GÅ LIDT FØR, OG FÅ NOGET MED HJEM...

Produktspecifikationer Cloud Connect Version 1.1. Cloud Connect. Side 1 af 7

GUIDELINE TIL ANVENDELSE AF UNSPSC-REGNEARK

Georg Ørnskov Rønsch Fra BIG DATA til information Datakilder, Transformation, Visualisering og modellering

Business Intelligence

Program for møde fredag d. 22/2-2002

Problemstilling ved DBK integration i BIM Software Hvad skal der til. Nicolai Karved, Betech Data A/S

BACK-END OG DATA: ADMINISTRATION HVAD ER DE NYE MULIGHEDER MED VERSION 7.1? STEFFEN BILLE RANNES, 4. FEBRUAR 2015

en fælles opsætning af SAS som grundlag for samarbejde. Jesper Michelsen, Risikostyring Modeller

EffectMakers Business Management System - supporterer profitabel vækst

Datavarehus for uddannelsessektoren. Delrapport 2 - Best practice og cases

Den Danske Esri Brugerkonference 2019 What's new in ArcGIS Enterprise og Administration af ArcGIS Enterprise

Introduktion til versionsstyring

Transkript:

Best practice Forudsætninger for et godt data warehouse SAS Data Integration Studio Anne Boilesen, konsulent Jacob Høy Berthelsen, konsulent SAS Institute A/S

Best practice Forudsætninger for et godt data warehouse Agenda Indledning Rammerne i et data warehouse (dwh) Data Integration Design-dokument Indholdet i et dwh (Under-)prioriterede opgaver Pointer!! Spørgsmål

Hvem er vi? Professional Services, Skanderborg Civilingeniører i sundhedsteknologi Fokus: Data Integration

Best practice Forudsætninger for et godt data warehouse Agenda Indledning Rammerne i et data warehouse (dwh) Data Integration Design-dokument Indholdet i et dwh (Under-)prioriterede opgaver Pointer!! Spørgsmål

Data Integration Design-dokument Fælles referenceramme Design og arkitektur Standarder for udvikling Dokumentation Målgruppe Alle projektdeltagere Data warehouse-designere ETL-udviklere Projektledere Forvaltningen (drift og overvågning) Ikke tiltænkt forretningsbrugere!

Omkostninger/tid Data Integration Design-dokument Hvorfor skal vi have et Data Integration Design-dokument? Udnytte DI-værktøjet (SAS Data Integration Studio) DI-værktøj DI-standard DI-værktøj DI-standard DI-værktøj DI-standard Tid

Data Integration Design-dokument Indhold Formål og målgruppe Teknisk setup Organisering af data Niveauer i data warehouse Logisk og fysisk folderstruktur Dokumentationspraksis Navngivningsstandarder Udviklingsstandarder Håndtering af sikkerhed Idriftsættelse og schedulering

Data Integration Design-dokument Organisering af data - niveauer i et data warehouse Niveauerne afspejler den process, data gennemgår fra kilde til applikation

Data Integration Design-dokument Organisering af data - niveauer i et data warehouse MASTERDATA Centrale tværgående dimensioner Operational data definition/ storage area Data staging area Data warehouse area Datamart area Source Source Extract Extract 1:1 kopi af de operationelle data Trans form Trans form Datarens Opsamling af historik Trans form Trans form Kildeopdelt Load/ Transform Håndtering af forretningsregler på tværs af systemer Load Aggregerede data Håndtering af forretningsregler BIapplication BIapplication Source Extract Kildeopdelt Trans form Kildeopdelt Trans form Samlet lager af rensede, validerede og aftestede data Sikre entydige definitioner Forretningsopdelt BIapplication Back Room Front Room

Data Integration Design-dokument Organisering af data - niveauer i SAS Data Integration Studio Fra teori til praksis... Logisk folderstruktur I SAS Data Integration Studio Custom Tree (SAS 9.1.3) En hensigtsmæssig organisering af metadata om jobs, tabeller, osv. Fysisk folderstruktur Organisering og placering af alle fysiske filer Ensret den logiske og fysiske folderstruktur!

Data Integration Design-dokument Logisk folderstruktur i SAS Data Integration Studio - eksempel Back Room MASTERDATA ODD/ODS DSA DWH DATA MART Front Room Back Room Front Room

Data Integration Design-dokument Udviklingsstandarder En samling kogebøger til udviklingsarbejdet Tilføjet som afsnit i Data Integration Designdokument

Data Integration Design-dokument Udviklingsstandarder eksempel Hvornår/hvordan anvender vi UserWritten Code? Kun hvis det forbedrer overskuelighed og performance Husk stadig mappings (impact analysis kan derved anvendes) Dokumentér din kode!!!

Data Integration Design-dokument Udviklingsstandarder eksempel Hvornår anvender vi User Generated Transforms? Hvis koden kan generaliseres Placeres i speciel folder i både Custom Tree og Process Library Lad koden kalde en makro

Data Integration Design-dokument Dokumentationspraksis Hvad skal dokumenteres, og hvordan? Bestem et minimumsniveau for dokumentation, fx. Brug descriptions-feltet for transformations og jobs Dokumenter UserWritten Code og transformations Forretningslogik

Data Integration Design-dokument Dokumentationspraksis - eksempel Jobflows Brug Job Description Giv sigende navne til temporære tabeller og transformations Kommer med i koden (samt i loggen) Gør jobbet nemmere at overskue/gennemskue

Data Integration Design-dokument Dokumentationspraksis - eksempel Jobflows

Data Integration Design-dokument Navngivningsstandarder Fastlæg en navngivningsstandard for såvel logiske som fysiske objekter, såsom: Jobs Tabeller Kolonner Libraries m.m. Undgå (specielt i jobs) special-karakterer, inklusive æ,ø,å!!

Data Integration Design-dokument Navngivningsstandarder - eksempel

Best practice Forudsætninger for et godt data warehouse Agenda Indledning Rammerne i et data warehouse (dwh) Data Integration Design dokument Indholdet i et dwh (Under-)prioriterede opgaver Pointer!! Spørgsmål

Data warehouse - indhold - Fokus på (under-)prioriterede opgaver Masterdata/centrale tværgående dimensioner Nødvendighed for at skabe en gennemgående rød tråd i et data warehouse Datarensning Nødvendigt for at skabe autencitet omkring et data warehouse Modellering (datamart) Nødvendigt for at bringe fagligheden inde i et data warehouse

Masterdata/centrale tværgående dimensioner Den røde tråd Opbygningen Hierarkisk eller tekstning af koder Historikhåndtering Hvilke krav stilles fra forretningen, og hvad der er muligt i henhold til data? Vedligehold Automatiseret eller manuelt Afhænger af opbygningen, historikhåndteringen og data

Masterdata/centrale tværgående dimensioner Eksempel - Sundhedsvæsenets KlassifikationsSystem (SKS) Opbygning Gengivelse af SKS til brug i sygehusafdelings-, diagnose- og proceduredimensioner Hierarkisk opbygning http://medinfo.dk/sks/brows.php Historikhåndtering Der ønskes kun gengivelse af nyeste hierarki og tekstning (type 1 dimensioner) Vedligehold Delvis automatiseret - ellers manuel via applikation

Masterdata/centrale tværgående dimensioner Eksempel - Sundhedsvæsenets KlassifikationsSystem (SKS)

Eksempel - SKS Historikhåndtering Det kræver stor indsigt i forretning og data, for at beslutte hvordan historikken skal håndteres

Eksempel - SKS Vedligehold

Eksempel - SKS Vedligehold

Datarensning Autensitet Mål med datarensning Overordnet system til at håndtere datakvalitet Registrere datakvalitet Udfør nødvendige korrektioner til data Publicere datakvaliteten, helst med link tilbage til de faktiske data Niveauer for datarensning Kolonne-screening Struktur-screening Screening af forretningsregler

Modellering (datamart) Fagligheden Forretnings-proces-orienteret Departmentiel-orienteret Rapport-orienteret (ingen modellering) Ideelt set består data warehouse-teamet eksplicit af flere roller: Arkitekter/designere ETL-udviklere BI-udviklere Dataansvarlige M.m.

Pointer Lav et Data Integration Design-dokument! Prioriter det! Gør det tilgængeligt! Prioriter opbygning og vedligehold af masterdata! Tænk datarensning ind i udviklingen! Tag stilling til modellering af datamarter! Hyr gerne SAS til sparring/udarbejdelse af DI-dokument

Referencer Kunder Region Syddanmark, Region Midtjylland, Bankdata, Århus Kommune, Vejle Kommune, Odense Kommune, m.fl. Litteratur Wiley 2004: Ralph Kimball & Joe Caserta: The Data Warehouse ETL Toolkit Practical Techniques for Extracting, Cleaning, Conforming, and Delivering Data Wiley 2004: Ralph Kimball et al: "The Data Warehouse Lifecycle Toolkit, 2nd Edition: Practical Techniques for Building Data Warehouse and Business Intelligence Systems SAS Institute Inc. 2007. Cary, NC: SAS Institute Inc. "ETL Performance Tuning Tips." support.sas.com/documentation/whitepaper/technical/etlperformance07.pdf SAS Global Forum 2007 - Paper 108-2007:Nancy A. Rausch and Nancy J. Wills, SAS Institute Inc., Cary, NC: Super Size It!!! Maximize the Performance of Your ETL Processes http://www2.sas.com/proceedings/forum2007/108-2007.pdf SAS Institute Inc. 2007. SAS Data Integration Studio 3.4: User's Guide. http://support.sas.com/documentation/onlinedoc/etls/usage34.pdf

Spørgsmål?

anne.boilesen@sdk.sas.com jacob.hoey.berthelsen@sdk.sas.com