SAS Scalable Performance Data Server Charlotte Pedersen, seniorkonsulent Claus Ørskov, konsulent PS Banking
SPD Server Skalerbar Hastighed 2
Hastighed og skalerbarhed Mindre fil I/O og parallel processing Datasæt opdeles i filer: metadata, kolonneindeks, træstrukturindeks og datapartitioner. Alle disse filer kan placeres på forskellige enheder partitioner, diske og servere. Direkte eller over netværk Herved kan forespørgsler via indeks på data lagres separat på de forskellige partitioner og diske Anvender kerner og tråde på serveren Mulighed for at anvende RAID (Redundant Array of Independent Disks) og disk stripes 3
SPD Server serverne SPD Server Name Server er en ultratynd klient, som varetager bindeleddet mellem de definerede libname domains og SPD Server Data Server SPD Server Name Server SAS Client Data Server Snet Server ODBC Non-SAS Client 4
Klientforespørgsler på serveren Pass-through SQL eller almindelig SAS-kode Et libname i Base SAS kan se således ud til SPD Server: libname test SASSPDS prv host= kocloxp2 serv= 5400 user= sdkclo passwd= SAS91pw ; Og til SPD Engine: libname mitlib SPDE c:\temp\' ; Herefter SAS-kode direkte eller via SAS Data Integration Studio Alternativt til SPD Server kan SAS Scalable Performance Data Engine anvendes, hvor teknologien anvendes lokalt på en klient i Base SAS. Det kræver ikke særskilt licens. Data kan så kun tilgås med direkte adgang til disken 5
Eksempel med dynamisk cluster Et cluster fremstår som en tabel, når der forespørges, men udgøres af en række tabeller Muligt at flytte tidsvindue Meget begrænset nedetid Læsehastighed øges, hvis der forespørges på tværs af clusterets medlemmer, ligesom det enkelte medlem er partitioneret Eksempel Jan Elever jan-apr Feb Mar Apr 6
Håndtering af data Metoder Præ-sorteret data rettet mod by-sortering Optimering efter delmængdeforespørgsler (fx WHERE) Stjerneskema Teknologier Parallel sortering/gruppering Index Dynamisk cluster 7
Egenskaber Parallel processing i multible tråde (symmetric multiprocessing) Organiserer data i partitioner Udnytter indeks med store hastighedsfordele Kan tilgås direkte af andre produkter (end SAS) Reducerer netværkstrafik, da en del af databehandlingen som f.eks. summering og udvælgelse af delmængder ligger hos SPD Serveren Er ikke underlagt eventuelle begrænsninger af filstørrelser i operativsystemet Understøtter specifik adgangskontrol på tabel- og kolonneniveau 8
Henvisninger Dokumentation: http://support.sas.com/documentation/onlinedoc/spds/index.html The SAS Scalable Performance Data Server Controlling the Beast! (hardware og config): http://support.sas.com/resources/papers/sgf09/312-2009.pdf Managing large Data with SAS SPD Server : http://support.sas.com/resources/papers/sgf2008/spds.pdf Scalability Solution for SAS Dynamic Cluster Tables: http://support.sas.com/rnd/scalability/papers/tw9593.pdf Parallel Join with Enhanced GROUP BY Processing (undertitel): http://support.sas.com/rnd/papers/sugi31/spdsjoin.pdf 9
Charlotte Pedersen og Claus Ørskov charlotte.pedersen@sdk.sas.com claus.oerskov@sdk.sas.com 10