Metadata og dokumentation af ETL-processen



Relaterede dokumenter
Manual for installering og brug af IE-spyad af Anette B. Overgaard

Opgavestyring, op og download af mange filer

SAS Forum 2012 Den virtuelle operatør

Sektornet VPN Installationsvejledning Windows Vista/7

>>fronter start med fronter.. ver. 002

Brugervejledning Digital Post for administratorer

WebGIS. Adresseopslag, og andre opslag (MR Stationer, stik m.m.) er ikke ændret. Dog kan du ikke

Ved første log ind kan det være nødvendigt, at opgradere din Citrix Receiver. Dette fremgår af nedenstående vejledning.

Sådan bruger du Google Drev

Kom godt i gang med I-bogen

Vejledning til Photofiltre nr. 120 Side 1

Best practice. Forudsætninger for et godt data warehouse SAS Data Integration Studio

Brugervejledning til databrowseren

Modernisering af BI miljø i Codan v.h.a. SAS V9

Annemette Søgaard Hansen/

Hvad Hvorfor Hvordan Overvåg sites via egne feeds

Vejledning i brug af Kommunen på kort

SÅDAN BRUGER DU REGNEARK INTRODUKTION

Sådan redigerer du en hjemmeside i Umbraco

Indhold. Jennie Mathiasen. Google Drev

Manual for Synkron hjemmesider

KirPACS undervisning Marts

Analyse af fakturadata

Byg web sider. Introduktion:

Vejledning til Arbejdsmiljø-databasen. Side 1 af 19

Netkatalog upload. Forord: Formål:

At indsætte ord og billeder og brug af hjælpefunktionen.

Denne vejledning beskriver integration mellem miljø- og byggesagssystemet GeoEnviron (GE) og ESDH-systemet edoc, der er udviklet af Fujitsu.

Workshoppens indhold. 1. Hvad kommer vi fra? Og hvor skal vi hen?

INDHOLDSFORTEGNELSE. Windows KAPITEL ET... Den nye brugergrænseflade. KAPITEL TO Internet, , kontakter og kalender

Gratis Office 365 til ansatte og studerende

Opsætning (GIS udbyder)

GENEREL FUNKTIONALITET I KMD OPUS ROLLEBASERET INDGANG

IKT TEKNISK KOMMUNIKATIONS- SPECIFIKATION

Vejledning til e-conomic integration (v1.1) Via Skyhost

Vejledning i brug af Kommunen på kort

Hvem er målgruppen for disse dokumenter. Hvilke forudsætninger skal læseren have?

SAS Education Services

Tilpas: Hurtig adgang

Dan Rolsted PIT. Side 1

Opsætning (GIS udbyder)

Download og print af geodatastyrelsens kort (vejledningen er meget detaljeret og skrevet med tanke på en ikke rutineret PC bruger)

IT-Brugerkursus. Modul 1 - Introduktion til skolens netværk og FC. Modul 1 - Introduktion til FC og Lectio. Printvenligt format. Indholdsfortegnelse

Google Apps. Lær at oprette, organisere, dele og slette dokumenter. Udarbejdet af PLC, version 2013!!!!!!! Side 1 af 9

Kom godt i gang med. Gadstrup Fodbolds Hjemmeside. Udarbejdet af:

Opsætning (GIS udbyder)

Guide til Virtuel Forflytning login.

Uddannelsesplaner i MinUddannelse

Guide til up- og download af brugerprogrammer (apps) på

MANUAL TIL PROJECTWEB UDBUDSPORTAL FOR TILBUDSGIVERE

HVAD ER WORDPRESS 2 HVORDAN LOGGES IND 3 HVORDAN NAVIGERES DER 4 HVORDAN SKRIVES EN SIMPEL NYHED 5 AVANCEREDE NYHEDER 6 HVORDAN RETTES EN NYHED 7

Vejledning til Photofiltre nr.192 Side 1 Maske af og kopiere det over på et andet billede, eller lægge ny baggrund på

Region Nordjylland. Hvordan skaber et datavarehus værdi i en regional forvaltning? Juni 2015

Bootstrap Tutorial LAV EN SIMPEL RESPONSIVE SIDE MED BOOTSTRAP MATHIAS HERSKIND GROTRIAN

Opsætning (GIS udbyder)

Konvertering af DADAS data til Dansk Supermarked VI-skema

I forbindelse med ny fælles KP mail vil alle studerende og medarbejdere have to forskellige

Modul 1 Skolens netværk og FirstClass (FC)

Jobliste overblik

Opsætningsvejledning efter opdatering (ghostning) af hybriderne

Indhold Gratis Office 365 til ansatte og studerende... 1

EasyIQ Opdatering > 5.4.0

Redaktørvejledning for Skriv en artikel

Norddjurs hjemmefra. Vejledning. Få adgang til Citrix hjemmefra på en privat PC IT-AFDELINGEN

ISOWARE release note

ADIS, WS og Meta Service

Vejledning Uniconta. 1 Indhold. 7. oktober finsit Vejledning

Indhold Gratis Office 365 til ansatte og studerende... 1

Vejledning til RKSK s VDI konsulent login løsning juni 2015.

Gem dine dokumenter i BON s Content Management System (CMS)

Brugerguide til FlexCMS

1c. Udfyld felterne for Opret en gratis konto det er meget vigtigt at skrive mailadresse samt adgangskoden KORREKT Klik på den blå knap (Opret.

Norddjurs hjemmefra. Vejledning. Få adgang til Citrix hjemmefra på en Norddjurs Kommune PC IT-AFDELINGEN

XML Difftool brugervejledning

Moderne SAS-programmering på webben med SAS Studio. Georg Morsing SAS Institute

Lav din egen forside i webtrees

LARA PERSONALE ELEVFRAVÆR

Søgning af varekoder i IDEP.web

VDI Manual v. 5 Indhold

Kursus i EkspresLøn. De syv menupunkter, vi skal bruge i dette kursus, er markeret med rød ring. Tryk..virksomheder i øverste højre hjørne.

Dygtig.NET / C# udvikler med stor erfaring fra både offentlige organisationer og private virksomheder.

Digital Eksamen Når du er logget ind i Digital Eksamen, bliver du mødt med en oversigt som vist nedenfor:

Rapport generator til Microsoft C5

VUC IT Niveau G. Drev Mapper Filer

Vejledning i brug af GMAIL (Google)

Annemette Søgaard Hansen/

Danhost Webshop. Skriv gode produktbeskrivelser

Dansk Ride Forbund Stævnesystem 2 Installationsvejledning

ISOWARE release note

Opdatering af kamerafirmware

Indhold VDI... 1 Installer fra UCL programmer... 2 Installer fra web... 7 Kør fra browser... 16

Udforske kommandoer på båndet De enkelte faner på båndet indeholder grupper, og hver gruppe indeholder et sæt relaterede kommandoer.

Sådan får du Salmebogen på CD-ROM til at fungere i Internet Explorer 7 både under Windows XP og Windows Vista

Vejledning til DTU DOC & RSS Feeds

GB-HD3172RCL-W. Kom godt i gang

Seniorklubben TDC Jylland Cloud Computing Kursus 2011_5: Rev

Vejledning til brug af digitale kort på Ringsted Kommunes hjemmeside

Transkript:

Dataintegrationsseminar Metadata og dokumentation af ETL-processen v/ Bjørn Lange SDC Udvikling A/S Borupvang 1A 2750 Ballerup

Dataintegrationsseminar Hvem er SDC? SDC er serviceleverandør for en lang række danske og norske pengeinstitutter. Der er p.t. 155 pengeinstitutter tilknyttet. SDC Udvikling A/S er udviklingspartner for SDC s kundegruppe. SDC Udvikling A/S udvikler betalingssystemer og administrative banksystemer for SDCs kunder. Der er p.t. ansat ca. 350 personer i SDC Udvikling A/S. Lidt økonomi: 2004 mio kr. Omsætning Egenkapital SDC Holding (Koncernen) 576,3 472,4 SDC Udvikling 487,2 SDC Drift 311,5

Dataintegrationsseminar SAS 9: Dokumentation og ETL Studio 1. Roller og metadata i applikationsudviklingsprocessen 2. Metadatatyper: Tekniske (hårde) og procesorienterede (bløde) 3. Tekniske detaljer og noter i metadata 4. Integration med datamodelleringsværktøj 5. Impact og lineage analyser

Dataintegrationsseminar Applikationsudvikling: Processen Analyse Arkitektur Programmering Hvorfor? Identificerer forretningsmæssige mål og bindinger Udtænker løsningsmodel og relaterer denne til teknisk praksis Hvordan? Koder system efter gældende praksis, arkitektur/design og analysens krav/mål Hvordan? Primært informationsflow Primært Feedbackflow Rolleindehaverne dokumenterer tanker og anvisninger i forskellige værktøjer til tekstbehandling, flowchart-optegning, datamodellering og programmering

Dataintegrationsseminar Informationsflow i traditionel applikationsudvikling Analyse Arkitektur Programmering SAS-kode, datadefinitioner jobflow og driftsdokumentation Programmer og driftsinstruktioner Design og modeller ERwin-modeller, flowdiagrammer og mails Forretningsmæssige informationer Afviklingsplatform Mails, regneark og tekstdokumenter SAS-kode og jobscripts Metadata Metadata skal skabe sammenhæng mellem tekniske og procesrettede informationer

Dataintegrationsseminar Hvad bruger SDC SAS ETL Studio til? SDC anvender SAS ETL Studio til opdatering af et altomfattende stærkt normaliseret datavarehus (et EDW ) og opdatering af forretningsrettede datamarter (stjernemodeller). SDC s EDW baserer sig på Banking Datawarehouse Model fra IBM SDC er i disse dage ved at lægge sidste hånd på Proof of Concept, for BDW som model med SAS 9 som ETL-værktøj (og SAS 9 klienter som brugeradgang) Vi mangler stadig konkrete erfaringer med SAS 9 som stabil driftsplatform for et EDW og datamarter. Vi har dog erfaringer med SAS 9 som udviklingsplatform, og derigennem med SAS 9s Metadata Repository som container af såvel tekniske som procesrettede metadata.

Tekniske metadata SAS ETL Studio indeholder gode metoder til dokumentation af tekniske metadata. I eksemplet til højre ses beskrivelse af recordlayout på en ekstern fil. Man kan også dokumentere tekniske informationer, som hvor data befinder sig, indlæsningsparametre, recordlængde og andet. Desuden kan man gennem noter skabe adgang til procesdokumentationen.

Eksempler på noter Noter kan være ren tekst, som her, hvor udvikleren har kopieret ordlyden fra et mødereferat.

Eksempler på noter Noter i SAS 9 kan knyttes til multiple strukturerer (filer, tabeller, kolonner processer), fordi noter er defineret som selvstændige entiteter. Det betyder, at den samme note kan knyttes til forskellige tekniske metadata, men kun skrives 1 gang, og evt. senere ændringer slår igennem alle steder. Jeg har endnu ikke fundet en oversigt over, i hvilke strukturer den enkelte note findes. (måske har jeg blot ikke ledt ihærdigt nok)

Eksempler på noter Vi kan f.eks. knytte noter til en specifik kolonne i filen DW05071 Noten åbnes ved højreklik på papir+pensymbolet. Noten indeholder her et link til et Worddokument. Dokumentet kan åbnes ved (dobbelt)klik på linket

Her kigger vi nærmere på en note til en af DB2 - tabellerne i SDC s datavarehus. Bemærk, at noten både kan indeholde tekst (som den mail der er kopieret ind) og link til andre metadata. SDC s procesorienterede og tekniske metadata er bundet sammen, ved at indlejre link til en HTML-version af vores datamodel (ERwin). MEN Fysisk afhængighed sker gennem import af datamodellen til SAS ETL studio. Notelink kan kun binde dokumentation sammen!

Når man dobbeltklikker på linket i ETL-noten, vil man åbne det linkede dokument i et vindue, som vist her: Vi har valgt at lægge ERwin datamodellerne ud på nettet, så alle udviklere altid har adgang til datamodellen.

Her ses datamodellen som ER-diagram Man skal kende datamodellering på udviklerniveau, for at kunne høste et fornuftigt fra HTML-versionerne af de modeller som vi p.t. har adgang til. Man kan også klikke videre ind på den enkelte tabel

Her har vi klikket os ind på BDW_IDV tabellen, og ser en oversigt over kolonner. Denne oversigt skulle gerne matche den fysiske repræsentation og den dokumentation vi har i vores metadata repository. Koblingen er dog administrativ, og ikke fysisk, så det er op til den ansvarlige person i forvaltningsgruppen at dette også fremover holder stik.

Der findes også en browser-baseret indgang til, SAS 9 s metadata Denne indgang kan benyttes af enhver som har adgang til SDC s metadata (altså også ansatte ude i vores pengeinstitutter) Adgangen leveres som del af SAS 9-pakken og hedder Metadata Explorer. Bemærk dog, at man altid skal logge sig ind til metadataserveren, uanset om man benytter SAS ETL Studio eller Metadata Explorer.

I dette eksempel har vi åbnet en søgefacilitet, søgt efter metadataelementer som indeholder teksten BDW_IDV, og klikket videre til metadata for tabellen BDW_IDV.... BDW_IDV er et meget centralt element i SDC s datavarehus.

Her foretager vi en kombineret impact- og lineage- analyse. Vi ønsker at se hvilke elementer som henter information fra BDW_IDV, og hvor informationer i BDW_IDV stammer fra. For centrale elementer (som BDW_IDV) kan resultatet i browservinduet blive ganske overvældene. Tegningen er så altomfattende, at den reelt er ubrugelig! Der savnes mulighed for at zoome på tegningen eller for at pakke stierne sammen til f.eks. joboversigter. Anbefaling: Benyt SAS ETL Studio til impact- og lineage - analyser.

SAS klienten ETL Studio giver os en anden (og enklere) måde at se afhængighederne til centrale elementer. SAS ETL Studio organiserer afhængighederne i jobs, og brugeren kan selv pakke jobbene for at skabe overblik. I eksemplet her har vi kun et enkelt job udpakket, og inde i dette job er det kun en tråd vi har pakket helt ud, frem til den resulterende tabel (BDW_IP_ID).

Dataintegrationsseminar Det har SAS 9 givet os: 1. Vi kan binde tekniske og procesorienterede metadata sammen 2. Koblingen til procesorienterede metadata kan genbruges 3. Alle brugere af metadata kan se disse via en Internet Browser 4. Vi kan se afhængighederne til såvel data som processer Det savner vi i SAS 9: 1. En fælles (logisk og fysisk) binding til datamodeller (ERwin) 2. Oversigt over alle elementer som har en note tilknyttet 3. Metadata Explorer (browser) skal håndtere afhængigheder bedre 4. Versionsstyring der sammenknytter metadata data og programmer

Dataintegrationsseminar Bjørn Lange SDC Udvikling A/S Borupvang 1A 2750 Ballerup