Udarbejdet af: Service Management Proces for Major Incident Management Version: 0.1.0 Igangsat den: 18/08 2011 Indledning Major Incident Management er den proces (arbejdsgang), som behandler alle Major Incidents, dvs. hændelser, som har en meget stor effekt på Region Syddanmark, og som ikke kan løses umiddelbart. Der er således tale om ekstraordinære situationer, som kræver ekstraordinære handlinger. Denne proces er udviklet med udgangspunkt i konkrete hændelser og de erfaringer, som blev gjort i den forbindelse. Major Incidents har bl.a. følgende karakteristika: Har en meget stor negativ effekt på forretningen Har stor ledelsesfokus Hænder ikke med faste intervaller Hænder relativt sjældent Der er ofte flere organisatoriske enheder, som er berørte Er længerevarende Major Incidents kan enten identificeres øjeblikkeligt (eksempelvis brand i eller oversvømmelse af et serverrum), eller være et Incident som over tid udvikler sig og senere bliver kategoriseret som et Major Incident. Major Incident Management er en sub-proces til Incident Management, hvilket i praksis betyder, at procesejeren for Incident Management også er procesejer for Major Incident Management. et med Major Incident Management er 3-delt: 1. Kommunikation At kommunikere med interessenter for at minimere den forvirring og usikkerhed, som der typisk hersker omkring et Major Incident, og øge forretningens muligheder for at planlægge og dermed minimere den negative effekt. 2. Løsning At genoprette delvis og normal service hurtigst muligt og dermed reducere den negative effekt på forretningen. 3. Hindre gentagelse At sikre at en lignende hændelse ikke gentager sig, og hvis det ikke er muligt, så minimere den negative effekt ved en gentagelse. Dette indbefatter overdragelse til Problem Management og efterfølgende aktiv medvirken til review af det enkelte Major Incident.
Definitioner Ord el. forkortelse Incident Major Incident Definition En ikke planlagt afbrydelse af en it-service eller reduktion i kvaliteten af it-servicen. Fejl i et Configuration Item, der endnu ikke har haft konsekvenser for servicen er også et Incident. Som eksempel kan nævnes fejl på én enkelt spejlet disk. Et Incident, som har en meget stor negativ effekt på forretningen, og som ikke umiddelbart kan løses. (med meget stor negativ effekt menes, at der er risiko for tab af menneskeliv, store økonomiske tab, dårlig omtale i pressen, brud på informationssikkerheden etc.). Se i øvrigt yderligere beskrivelse i afsnittet Indledning ovenfor. r og Ledelsen Major Incident Manager Procesejer Service Desk (funktion) Forklaring lig for: Kvaliteten i den daglige udførsel af Incident Management processen. Følge op på Incidents, agere proaktivt og sikre, at der foretages en korrekt behandling heraf. Vurdere Incidents mhp. at overdrage et for specifikke og specielt kritiske Incidents til Major. Omfatter både it- og forretningsledelsen. Major inddrages i tilfælde af et Major Incident og vurderer sammen med, hvorvidt et prioritet 1 Incident skal behandles som et Major Incident. Ved Major Incident er Major lig for den videre koordinering af genetablering af service og den efterfølgende opsamling for det konkrete Major Incident. Procesejeren er ejer af processen, hvilket indebærer for processens leverancer iht. aftalte procesmål. Procesejeren er lig for en kontinuerlig procesforbedring uanset om målene er opfyldt eller ej. Procesejeren koordinerer procesforbedringsaktiviteter, herunder værktøj og uddannelse med proces Managere fra de øvrige organisationer. Service Desken er brugerens indgang til IT organisationen. Det er Service Deskens opgave at håndtere alle brugerhenvendelser i henhold til de aftalte serviceniveauer. Service Desk ejer alle henvendelser gennem hele deres livscyklus og sørger for at holde brugere og kunder orienterede om fremdrift, status og kommende ændringer. Endvidere har Service Desk for at gennemføre Side 2 af 13
(ledelses)rapportering, foretage brugerundersøgelser, samt at eskalere Incidents og Service Requests, der ikke håndteres inden for de aftalte serviceniveauer. SPOC Single Point Of Contact som oprettes I It-staben, eller på et sygehus, og som anvendes som kontaktpunkt for IT-staben og øvrige it organisationer ved et Major Incident. SPOC skal koordinere al kommunikation vedr. Major Incident og fjerne belastning på Service Desk. SPOC kan benyttes 24x7. MI arbejdsgruppe En gruppe der sammensættes med henblik på at løse et specifikt Major Incident. MI arbejdsgruppe Manager Leder af MI arbejdsgruppe og dermed lig for løsning af et specifikt Major Incident. Policy Der skal gennemføres Root Cause Analysis på alle Major Incidents. Der skal udarbejdes en rapport indeholdende et hændelsesforløb efter alle Major Incidents, som beskriver hvilke tiltag der er implementeret eller anbefales implementeret for at undgå eller minimere den negative effekt på forretningen ved en lignende hændelse. Major Incident Incident Management (trigger) Kommunikation Brugerne og genoprettet service Kommunikation Forretnings- og it-ledelsen og rapporter Problem Problem Management (hvor en sådan proces eksisterer) Emergency Changes Change Management Procesdok umentation Side 3 af 13
Diagram Procesaktiviteter Aktivitet Beskrivelse 1 Vurdering af Incident 2 Udpegning af Major 3 Planlægning og iværksættelse af kommunikationsplan 4 Oprettelse af SPOC 5 Etablering af MI arbejdsgruppe 6 Løsning af Major Incident 7 Major Incident review Procesmål Mål lig Målefrekvens TBD. KPI er Beskrivelse Metrik Måle frekvens 100 % af alle Major Incident Løbende skal have udarbejdet en rapport inden 7 dage. Bem. Side 4 af 13
1. Retningslinje for vurdering af Incident At vurdere om Incident skal hånderes som et Regionalt Major Incident. r og (It-staben) At vurdere om It-staben er involveret og i givet fald om Incident et skal håndteres som et Major Incident hos It-staben. Beskrivelse af Lokal Major hændelsen Major Incident Aktivitet: Udpeg Major Incident Incident Management ation 1 Vurder om om It-staben er involveret og i givet fald om Incident et skal håndteres som et Major Incident hos It-staben. Side 5 af 13
2. Retningslinje for udpegning af Major At udpege en person, som skal have et for at håndtere det specifikke Major Incident. r og (It-staben) At udpege Major. Major Incident Aktiviteten: Vurder Incident Udpeget Major Aktivitet: Initiel kommunikation Udpeget Major Aktivitet: Etabler MI arbejdsgruppe ation 1 Udpeg og informer den Major, som skal koordinere løsningen af det specifikke Major Incident. Side 6 af 13
3. Retningslinje for planlægning og iværksættelse af kommunikationsplan At planlægge og iværksætte en kommunikationsplan der kommunikerer med interessenter for at minimere den forvirring og usikkerhed, som der typisk hersker omkring et Major Incident, og øger forretningens muligheder for at planlægge og dermed minimere den negative effekt. r og Major Incident Manager At planlægge og iværksætte kommunikation. Information MI arbejdsgruppe Manager Information It-staben Information Service Desk Information Brugere Information og Ledelse kommunikationsplan Rapporter Ledelse ation 1 Udarbejd en liste over interessenter (It personale, brugere, ledelse, It-drift vagter (også på sygehuse!) etc.). 2 Prioriter interessenter (Er nogle interessentgrupper vigtigere at informere end andre? Superbrugere contra alm brugere?). 3 Beslut hvem som har behov for information. 4 Beslut med hvilken frekvens informationen skal udsendes. 5 Beslut hvilke medier, som skal anvendes (driftsstatus, telefon, sms, e-mail, osv. ). 6 Hvilken information skal distribueres: Berørte service Need to know overblik Teknisk kontra ikke-teknisk beskrivelse Er informationen følsom? Side 7 af 13
Se i øvrigt punkt 14 (Retningslinje for kommunikation ved prioritet 1 sager og major incidents) i Incident processen. 7 Udarbejd og fremsend evt. indledende rapport når Major Incident er løst. 4. Retningslinje for oprettelse af SPOC At koordinere al kommunikation vedr. Major Incident og reducere belastningen på Service Desk. r og Major At oprette og drive SPOC. Initiel Aktivitet: Initiel kommunikation Kommunikation Kommunikationsplan Aktivitet: Planlæg og iværksæt kommunikationsplan. Planlæg og iværksæt kommunikationsplan Koordineret Brugerne, ledelse og MI arbejdsgruppe kommunikation Information Øvrige Service Desks ation 1 Etabler kontaktpunkt: Telefon: Akutte henvendelser fra andre Service Deske og MI arbejdsgrupper om incidents modtages, såfremt der forefindes en oprettet sag. Sager skal oprettes i respektive Servicedesks og oprettes ikke ved telefonhenvendelse til / Major, da denne reserveres som linje ind og ud ved akutte henvendelser og til sparrings- og opfølgningsbrug. Email: Side 8 af 13
Sager kan ikke oprettes på baggrund af mailkorrespondance. Sager bør oprettes i Service Desk systemet og tildeles den vej. Fælles postkasser kan anvendes til løbende statusmeddelelser i forbindelse med løsning af incident. Generelt bør email kun anvendes som kommunikationsmedie efter forudgående aftale mellem 1 eller flere parter, og der bør altid anvendes en fælles postkasse. Service Desk systemet: Servicedesks opgave er som normalt at oprette sager på indkomne henvendelser. Sager som formodes at være relateret til et Major Incident oprettes som barnesager på eventuelle forældresager og tildeles til de respektive grupper som menes at skulle løse sagen. Major, vil hjælpe med at undersøge om sagerne er relateret eller ikke relateret. Konstateres det at relateringen ikke er korrekt, afrelateres sagen igen og alle oplysninger (sagstype, klassifikation, prioritering) gennemgås og kvalitetssikres. Hvis tildelingen til teamet var korrekt bliver sagen liggende hos det pågældende team, men tildeles retur til respektiv Servicedesk hvis tildelingen var forkert, så de kan blive tildelt til korrekt håndtering andet sted. Husk at begrunde afrelateringen i arbejdsloggen. 2 Udsend retningslinier for kontakt til SPOC med info mail, tlf, m.v. til Forretningen, så al information til/udgår herfra. 3 Udover løbende indsamling af information, skal information fra Service Desk og den initiale udmelding anvendes til kommunikation til IT og forretningen. 4 Når der ikke længere er behov for SPOC, så nedlægges funktionen, men inden da informeres samtlige interessenter om dette. Side 9 af 13
5. Retningslinje for etablering af MI arbejdsgruppe At etablere en gruppe med de nødvendige kompetencer til at genoprette delvis og normal service hurtigst muligt og dermed reducere den negative effekt på forretningen. r og Major Incident Manager Etablere MI arbejdsgruppe Udpeget Major Aktiviteten: Udpeg Major Information Aktiviteten: Planlæg og iværksæt kommunikationsplan Etableret MI arbejdsgruppe Aktiviteten: Løs Major Incident ation 1 Sammensæt MI arbejdsgruppe. Såfremt et sygehus har behov for at etablere en lokal MI arbejdsgruppe, så kan dette gøre efter samme retningslinjer. 2 Udpeg MI arbejdsgruppe Manager 3 MI arbejdsgruppe Manager udarbejder MI arbejdsgruppe plan vha. følgende aktiviteter: Identificerer og udpeger nøglekompetencer til MI arbejdsgruppe. Skaffer ledelsesopbakning til MI arbejdsgruppe Indkalder til MI arbejdsgruppe møde Laver udkast til aktiviteter og tidsplan Aftaler mødefrekvens Aftaler kommunikationsflow med Major Incident Management Som udgangspunkt skal al kommunikation følge nedenstående rute: MI arbejdsgruppe -> SPOC -> Service Desk -> Sygehus Side 10 af 13
ledelse og brugere 6. Retningslinje for løsning af Major Incident At genoprette delvis og normal service hurtigst muligt og dermed reducere den negative effekt på forretningen. r og MI arbejdsgruppe Manager MI arbejdsgruppe Leder og fordeler arbejdet i MI arbejdsgruppe. Holder løbende Major informeret om fremdrift. Løser Major Incident hurtigst muligt. Major Incident Incident Management Etableret MI arbejdsgruppe Aktiviteten: Etabler MI arbejdsgruppe Genoprettet Brugerne og forretningen service Emergency Change Management Change Problem Problem Management ation 1 Se Incident Management, Retningslinje for løsning / udførelse. 2 Opret Emergency Change, såfremt dette er nødvendigt. 3 Opret FAQ og workarounds efter behov. 4 Opret Problem. 5 Oprydning i sager: Dubletter skal relateres til modersag Sager som er relateret til modersagen, men som vurderes ikke at have noget med den at gøre, skal af-relateres. Side 11 af 13
7. Retningslinje for Major Incident review At udarbejde den endelige rapport over hændelsen, inkl. årsager, implementerede løsninger og anbefalinger, samt at reviewe forløbet m.h.p. at identificere procesmæssige forbedringstiltag. r og Major Incident Manager MI arbejdsgruppe og Andre Service Desk At gennemføre review. Bidrage aktivt til review af major Incident. Information Service Desk, MI arbejdsgruppe,, Major (It-staben), Problem Management (It-staben) Endelig rapport Ledelsen Procesmæssige forbedringstiltag Procesejeren ation 1 Udarbejd endelig rapport over hændelsen, se overskrifterne fra rapporten herunder. Beskrivelse af hændelser: Løsning: Årsag: Tiltag for at forhindre gentagelse: Udestående opgaver: Berørte Services: Berørte brugere/afdelinger: Indvirkning på SLA: Kommunikation med interessenter: Process Review: Side 12 af 13
Bemærk, at den udpegede Major er lig for at udarbejde den endelige rapport. 2 Identificer som minimum følgende i relation til håndteringen af det konkrete Major Incident og implementer forbedringstiltag: Hvad gjorde vi rigtigt? Hvad gjorde vi forkert? Hvad kan gøres bedre næste gang? Side 13 af 13