Agenda Typiske udfordringer Begreber omkring recovery Forretningens krav Metoder/muligheder Recovery med TSM Nye teknologier Afrunding - spørgsmål
Typiske udfordringer Ingen SLA fra forretningen på systemer og applikationer Uvished om alle relevante data er sikret Komplet og delvis genetablering mangelfuldt testet Lange genetableringstider pga. store datamængder Forventninger fra forretningen og tekniske muligheder ikke afstemt Alle systemer håndteres ens Vanskeligt at foretage restore til anden hardware end original Recoveryprocedurer vedligeholdes ikke periodisk Nødvendig specialist kompetence ikke til stede Risikoanalyse for systemer og applikationer ikke foretaget Manglende kendskab til recovery procedurer
Typiske udfordringer Restore af filer Restore af databaser Mange små filer Store datamængder Store datamængder Bringe applikation i luften Stor inaktiv datamængde
Begreber omkring recovery Disaster recovery Evnen til at kunne genskabe en virksomheds kritiske [IT-] forretningsfunktioner og data, hvis et helt site fejler/forsvinder. Foretages typisk fra et sekundært site BMR Disciplinen at genetablere et system fra bunden på ny/ren hardware ud fra backup
Begreber omkring recovery Recoverypoint objective (RPO) Det tidspunkt, man skal tilbage til for at kunne genskabe et fungerende miljø ved et nedbrud Recoverytime objective (RTO) Den tid, det tager at bringe applikationer og data til et operationelt niveau
Begreber omkring recovery Business Continuity Den overordnede plan for at videreføre forretningen i tilfælde af en hel eller delvis disaster situation. Indbefatter meget andet end IT, men IT er i mange virksomheder en stor, stigende og kritisk del
Forretningens krav 4 lags model for IT og Infrastruktur Analysér oppefra og ned, og få kortlagt kritiske systemer
Forretningens krav Hvad betyder egentlig oppetid/nedetid? SLA 98,000% 99,000% 99,900% 99,990% 99,999% Nedetid/år 1 uge 3,5 dage 8 timer 1 time 5 minutter Jo højere oppetid, jo dyrere og mere komplekse løsninger kræves
Forretningens krav Foretag risikoanalyse på de enkelte systemer Tag stilling til: RTO RPO Risiko for nedbrud Konsekvens af nedbrud
Forretningens krav RPO RTO 1 uge 24 timer 4 timer 1 time 0 1 time 4 timer 24 timer 1 uge Testsystem Sandkasse Telefonsrv Filsrv Mail ERP Lager Prodstyring Lager Telefonsrv ERP Mail Filsrv Testsystem Sandkasse 0 betyder ubrudt drift
Forretningens krav 7 6 Høj 8 3 Sandsynlighed 1 5 31 Lav 21 4 20 15 19 Konsekvens 4 2 29 23 22 30 3 9 1 Høj 13 2 Lav 32 14 27 24
Forretningens krav Sørg for at der er taget stilling til de enkelte systemer og serveres vigtighed ud fra et forretningsmæssigt perspektiv Placér serverne i forskellige kategorier, f.eks. Tier 1, 2 og 3 Hav gerne flere niveauer af planer for genetablering i hver Tier
Metoder/muligheder Hardware nedbrud/fejl Menneskelige fejl bevidst, ubevidst Hvilke scenarier ønsker vi at beskytte os mod? Site failure/ katastrofe Logiske fejl/virus
Metoder/muligheder Tilgængelighed af services Sikres på hardwaresiden med Redundans Virtualisering Clustering Procedurer Serviceaftaler
Metoder/muligheder - hw 99,999% 99,990% 99,900% 99,000% 98,000% Cost High end/mainframe Hardware Failover til sek. site Clustering Virtualisering Hardware redundans Tid
Metoder/muligheder Tilgængelighed af data Sikres med: Backup, traditionel eller image Snapshots CDP Spejling Replikering Procedurer Kopi af VMDK filer fra VMware
Metoder/muligheder - data 99,999% 99,990% 99,900% 99,000% 98,000% Cost CDP Datatilgængelighed Software Snapshot Replikering Lokale kopier, bl.a. vmdk Image backup Traditionel backup Tid
Tivoli Storage Manager TSM er et af de mest anvendte Enterprise værktøjer til databeskyttelse worldwide Specielt kendt for sin evne til at håndtere data hierakisk at lagre data baseret på politikker den brede platform understøttelse incremental forever
Komplet recovery af TSM Recovery af TSM server Genetablering af hardware, disk + tapesystemer Genetablering af OS og TSM server applikation TSM database restore Restore af primær pool fra copy Restore af vigtigste produktions servere
Server restore med TSM Restore af server Forudsætninger for succesfuld restore Der er taget stilling til BMR metode Restore på anden hardware kan håndteres Backuppen er gennemført korrekt De rigtige data er med i backuppen Applikationsdata er beskyttet konsistent Procedurerne er testet og beskrevet De nødvendige kompetencer er til rådighed Data er placeret optimalt ift. SLA
Dataplacering Er der taget stilling til dataplacering ift. serverens vigtighed? Er data placeret optimalt ift. den pågældende restore, disk, tape, collocation?
Dataplacering Fildata Små filer på disk Store filer på tape Database data Store fulde database backups på tape Små transaktions logs på disk Reduceret krav til restore tid Alle data placeres på tape Evt. differentieret på collocation niveau
Nye teknologier Nyt i TSM 6.1 Bedre integration med VCB AD item level restore Mail item level restore for Exchange Forbedret restore logik Omlægning af database til db2 Deduplikering på disk storage
Nye teknologier
Spørgsmål Enten tager man risikoen og gør ingenting eller Analysér, Planlæg, Test og Dokumentér!