5 cele mai bune practici pentru automatizarea gestionării incidentelor majore

Autor: Roger Morrison
Data Creației: 27 Septembrie 2021
Data Actualizării: 21 Iunie 2024
Anonim
5 best practices to improve your Incident Management abilities
Video: 5 best practices to improve your Incident Management abilities

Conţinut



Sursa: Pixtum / iStockphoto

La pachet:

Cu o strategie inteligentă de automatizare, puteți face răspunsul la incident mai rapid și mai ușor decât oricând - minimizând timpul de întrerupere și posibilele încălcări ale securității.

În fiecare zi au loc incidente IT majore în cadrul companiilor. În timp ce doar o mână face titlurile, evenimentele precum întreruperile și încălcările de securitate pot strică serios productivitatea angajaților, influențează negativ percepțiile clienților și, cel mai important, pot avea venituri pierdute.

Deci, atunci când este vorba de gestionarea incidentelor IT majore, cel mai bine este să ne concentrăm asupra impactului asupra afacerii și a liniei de bază. Potrivit Institutului Ponemon, costul mediu al perioadei de oprire în 2016 a fost de 8.851 de dolari pe minut - adică peste 500.000 de dolari pe oră, iar perioadele de oprire obișnuite în medie mai mult de 90 de minute. Și acesta este doar costul imediat! Impactul pe termen lung, cum ar fi daunele de reputație și atitudinea clienților, sunt imprevizibile și potențial catastrofale.


În timp ce nu puteți evita în totalitate toate incidentele majore, puteți organiza organizația dvs. pentru a fi cât mai pregătită pentru a le aborda atunci când apar. Iar o componentă majoră a strategiei dvs. ar trebui să fie încorporarea automatizării. Organizațiile care maximizează utilizarea automatizării în procesele lor majore de rezolvare a incidentelor realizează restaurarea mai rapidă a serviciului și mult mai puține greșeli din cauza erorii umane. Acest lucru se datorează faptului că automatizarea vă afectează direct capacitatea de a reduce durata ferestrei de impact asupra afacerii - sau acea perioadă costisitoare în care utilizatorii și operațiunile dvs. de afaceri simt efectiv impactul unui incident. (Pentru a afla mai multe despre automatizare, consultați Automatizarea: Viitorul științei datelor și învățarea mașinilor?)

Pentru a maximiza beneficiile automatizării, ar trebui să examinați ce activități trebuie să se desfășoare pe parcursul ferestrei de impact și să vă dați seama cum să mutați toate celelalte activități fie înainte de începerea incidentului, fie după revenirea activității normale. Iată cinci moduri utile de a începe.


1. Dezvoltați și definiți un proces

Definirea unui proces de gestionare a incidentelor majore constă în identificarea a ceea ce poate fi planificat, coordonat sau executat în timpul unui incident. Aceasta poate însemna identificarea membrilor cheie ai echipei de asistență în funcție de abilități și programare, de exemplu, astfel încât biroul dvs. de serviciu să îi poată angaja cât mai rapid și eficient. Înseamnă, de asemenea, să aflați modul în care veți transmite informațiile relevante echipei dvs., astfel încât acestea să poată începe soluționarea imediată a problemei, precum și păstrarea și actualizarea părților interesate potrivite.

Automatizarea este esențială pentru aspectele cheie ale acestui proces. De exemplu, puteți automatiza includerea informațiilor relevante din instrumentele dvs. de monitorizare în biletele biroului de serviciu sau puteți include informații de la biroul de service în notificările către soluționatorii de incidente. De asemenea, puteți documenta întregul incident într-o singură sursă de adevăr cuprinzător, accesibilă de toți. Nu uitați că puteți practica acest proces pentru a-l rezolva corect - nu trebuie să așteptați un incident din lumea reală pentru a vă testa abordarea.

2. Obțineți-vă dreptul la infrastructură

În această zi și în vârstă de oboseală alertă, este esențial să nu continuați să vă bombardați echipele cu notificări și informații irelevante care nu li se aplică. Aplicarea filtrelor la alertele dvs. de monitorizare vă va oferi echipelor să acționeze mai ușor cu acul în fagul zgomotului de rutină. Acest lucru este esențial pentru ca toate informațiile și datele dvs. să fie cu adevărat acționabile, mai degrabă decât să adăugați la supraîncărcarea informațiilor.

O modalitate bună de a automatiza include utilizarea unei soluții APM pentru a trage toate aplicațiile și sistemele dvs. pentru a identifica proactiv cauzele rădăcină la punctul de degradare a performanței, înainte de a provoca întreruperi majore de servicii. Puteți, de asemenea, să vă integrați monitorizarea, biroul de service, aplicațiile de colaborare și instrumentele de chat pentru a partaja informații simultane în timp real.

Fără bug-uri, fără stres - Ghidul dvs. pas cu pas pentru crearea de programe care schimbă viața fără a vă distruge viața

Nu îți poți îmbunătăți abilitățile de programare atunci când nimeni nu îi pasă de calitatea software-ului.

3. Măsurați cu exactitate MTTR

Cum măsurați timpul mediu de reparație (MTTR)? Îl bazați pe timpul total în care echipele IT sunt angajate sau pe timpul total în care afacerea este efectiv afectată? Dacă răspunsul dvs. este primul, ar trebui să vă reconsiderați măsurarea ferestrei de impact utilizând perspectiva business. Acesta este un cont mult mai precis pentru eforturile dvs. de optimizare, deoarece obiectivul dvs. este de a reduce impactul incidentelor și nu pur și simplu să prezentați rapoarte de răspuns mai bune consiliului dumneavoastră. (Pentru a afla mai multe despre timpul de întrerupere și modul în care este gestionat, consultați ce înseamnă timpul dintre defecțiuni cu adevărat.)

Puteți automatiza oferind vizibilitate completă în aplicații pentru a „începe cu ceas” retroactiv dacă este necesar și păstrați o înregistrare completă a activităților dvs. de rezoluție și comunicații pentru analiză și audit pentru a vă îmbunătăți procesele.

4. Mențineți părțile interesate - dar fără a întrerupe rezoluția

Părțile interesate se așteaptă la o comunicare eficientă și în timp util, în timp ce, de asemenea, se așteaptă ca experții în materie să rămână concentrați laser pe rezolvarea problemelor. În timp ce puteți desemna un punct de contact de comunicare pentru a monitoriza și angaja utilizatorii de afaceri, o strategie mai eficientă ar fi crearea unei pagini web cu autoservire cu actualizări de stare. Acest lucru permite părților interesate să își verifice singur, fără a-ți bombarda echipa cu apeluri și sume suplimentare. Amintiți-vă doar să vă actualizați părțile interesate la intervale regulate, astfel încât acestea să primească întotdeauna și să știe să se aștepte, cel mai recent raport de stare. Nu uitați că comunicarea nu ar trebui să se oprească pur și simplu pentru că serviciul este restaurat! Partenerii importanți obțin un rezumat al celor întâmplate, a celor învățate și a modului în care poate fi prevenită situația în viitor.

Automatizarea în acest caz poate fi implementată pentru a crea o pagină de stare automată, în timp real pentru părțile interesate, precum și pentru a construi comenzi slash în instrumentul de chat pentru a actualiza pagina respectivă.

5. Colectați date pentru a sprijini gestionarea problemelor

Restaurarea serviciului nu reprezintă sfârșitul gestionării incidentelor! De fapt, unele dintre cele mai valoroase activități apar în urma rezoluției. Prin colectarea datelor de diagnostic și de impact și efectuarea analizei cauzelor principale, puteți efectua un audit complet al unui incident major care include punerea în aplicare a unor măsuri preventive pentru a evita incidente similare în viitor. În plus, chiar dacă un incident recognoscibil are loc din nou, puteți crea o procedură definită pentru ce tipuri de date trebuie să colectați și pașii care trebuie să apară pentru rezolvarea unității. În acest fel, echipa dvs. trebuie să se refere pur și simplu la o listă de verificare și să se concentreze pe obiectivul lor principal de restaurare a serviciului, mai degrabă decât să vă îngrijoreze de ce au nevoie și când.

Automatizarea de aici poate capta și păstra activitățile de rezoluție, inclusiv lucruri precum transcrierile de chat, într-un singur sistem de înregistrare pentru analiză. În plus, vă va ajuta să construiți un catalog de incidente sau probleme familiare, să solidificați cele mai bune practici pentru fiecare și, prin urmare, să creșteți viteza de rezolvare în viitor.

În concluzie: automatizarea mai inteligentă, nu mai mult

Fiți atenți că mai multă automatizare nu este neapărat o abordare mai bună! Este mai important să înțelegeți când, unde și cum să conectați sistemele IT împreună pentru a sprijini gestionarea incidentelor. Nu doriți să adăugați nicio complexitate inutilă, din cauza creșterii proceselor automatizate. Rețineți că obiectivul este să simplificați și să consolidați operațiunile pe cât posibil, pentru a face echipele dvs. să se simtă abilitate să rezolve eficient problemele. Este vorba despre implementarea inteligentă a automatizării, pentru a facilita un set bine coordonat de procese, personal cu cunoștințe și comunicări efective cu părțile interesate, astfel încât să se minimizeze impactul general asupra afacerilor la incidentele majore.