Che cos'è un piano di Disaster Recovery (DR)?
Sviluppa un piano di disaster recovery in grado di aumentare resilienza informatica e capacità di ripristino
Sviluppa un piano di disaster recovery in grado di aumentare resilienza informatica e capacità di ripristino
Un piano di disaster recovery (DR) è un documento formale creato da un'organizzazione che contiene istruzioni dettagliate su come rispondere a incidenti non pianificati ad esempio, disastri naturali, interruzioni di corrente, attacchi informatici e altre interruzioni. Il piano comprende le strategie per ridurre al minimo gli effetti di un incidente, in modo che un'organizzazione continui ad operare - o riprenda rapidamente le operazioni principali.
Le interruzioni possono causare perdite di guadagni, danni all'immagine del brand e clienti insoddisfatti. E chiaramente, più lungo è il tempo di ripristino, maggiore è l'impatto negativo sul business. Pertanto, un buon piano di disaster recovery dovrebbe consentire un rapido ripristino dalle interruzioni, indipendentemente dalla causa delle stesse.
Supporta la continuità aziendale con disaster recovery su cloud entro pochi minuti da un'interruzione grazie a Disaster recovery as a service (DRaaS).
Un piano di DR è più preciso di un piano di business continuity e non copre necessariamente tutte le contingenze per i processi aziendali, gli asset, le risorse umane e i partner aziendali.
Una soluzione DR di successo affronta tipicamente tutti i tipi di interruzione delle operazioni e non solo i grandi eventi naturali o causati dall'uomo che rendono inagibile una determinata ubicazione. Le interruzioni possono comprendere interruzioni di corrente, interruzioni del sistema telefonico, perdita temporanea di accesso a una struttura a causa di minacce di bombe, un "possibile incendio" oppure un incendio non distruttivo a basso impatto, un'inondazione o un altro evento. Un piano di DR dovrebbe essere strutturato a seconda del tipo di incidente e della posizione. Deve contenere istruzioni (script) che possano essere implementate da chiunque.
Prima degli anni '70, la maggior parte delle organizzazioni doveva preoccuparsi solo di produrre copie dei propri documenti cartacei. La pianificazione del disaster recovery ha acquisito importanza durante gli anni '70, quando le aziende hanno iniziato a fare maggiormente affidamento sulle operazioni basate sui computer. A quel tempo, la maggior parte dei sistemi erano mainframe batch-oriented. In attesa di ripristinare il sito primario, un altro mainframe offsite poteva essere messo in funzione con i nastri di backup.
Nel 1983 il governo degli Stati Uniti ha imposto alle banche nazionali di disporre di un piano di riserva verificabile. Molti altri settori d'industria hanno seguito l'esempio, nel momento in cui hanno capito le significative perdite finanziarie associate alle interruzioni di lunga durata.
A partire dal 2000 le imprese sono diventate sempre più dipendenti dai servizi digitali online. Con l'introduzione di big data, cloud, mobile e social media, le aziende hanno dovuto far fronte all'acquisizione e all'archiviazione di enormi quantità di dati a un ritmo esponenziale. I piani di DR sono dovuti diventare molto più complessi per gestire una quantità di dati sempre maggiore provenienti da una miriade di dispositivi. L'avvento del cloud computing intorno al 2010 ha contribuito a ridurre la complessità del disaster recovery, permettendo alle organizzazioni di dare in outsource i loro piani e soluzioni di disaster recovery, il cosiddetto disaster recovery as a service (DRaaS).
Un'altra tendenza attuale che sottolinea l'importanza di un piano di disaster recovery dettagliato è la crescente complessità degli attacchi informatici. Le statistiche del settore indicano che molti attacchi non vengono rilevati per più di 200 giorni. Con così tanto tempo a disposizione nascosti nella rete, gli aggressori possono insediare dei malware che riescono ad infiltrarsi anche nei set di backup - infettando così anche i dati di ripristino. Gli attacchi possono restare inattivi per settimane o mesi, consentendo ai malware di propagarsi in tutto il sistema. Anche dopo aver rilevato un attacco, può essere estremamente difficile rimuovere un malware così diffuso nell'organizzazione.
Ogni secondo conta: il ripristino rapido per la consegna dei pacchi
L'interruzione di business a causa di un attacco informatico può avere un impatto devastante su un'organizzazione. Ad esempio, l'interruzione informatica in un'azienda che consegna pacchi può interrompere le operazioni sulla sua catena di approvvigionamento, portando così a perdite finanziarie e di reputazione. Nel mondo di oggi, in cui tutto è collegato alle tecnologie digitali, ogni secondo di interruzione fa la differenza.
La necessità impellente di garantire un'esperienza cliente e dei risultati di business superiori sta favorendo la tendenza in aumento, da parte delle imprese, di adottare un multicloud ibrido. Un multicloud ibrido, tuttavia, crea una complessità dell'infrastruttura e dei rischi potenziali la cui gestione richiede competenze e strumenti specializzati. A causa di questa complessità, le organizzazioni stanno subendo frequenti interruzioni e guasti al sistema, associati ad attacchi informatici, mancanza di competenze e problemi con i fornitori. L'impatto aziendale dovuto a interruzioni o tempi di inattività non pianificati è estremamente alto, soprattutto in un ambiente multicloud ibrido. Fornire resilienza in un multicloud ibrido richiede un piano di disaster recovery che include delle competenze specializzate, una strategia integrata e delle tecnologie avanzate, compresa l'orchestrazione per la protezione e il ripristino dei dati. Le organizzazioni devono disporre di una resilienza aziendale di ampio respiro con una tecnologia di orchestrazione per aiutare a ridurre i rischi di business continuity nel multicloud ibrido, consentendo alle aziende di raggiungere i loro obiettivi di trasformazione digitale.
Altre ragioni importanti per cui un'azienda potrebbe volere un piano di disaster recovery dettagliato e collaudato sono:
Per soddisfare l'aspettativa odierna di operazioni commerciali continue, le organizzazioni devono essere in grado di ripristinare i sistemi critici a seguito di un'interruzione entro pochi minuti, se non secondi.
Molte organizzazioni hanno difficoltà a far evolvere le proprie strategie di disaster recovery plan abbastanza rapidamente in modo da poter affrontare gli ambienti informatici ibridi e le complesse operazioni di business odierne. In un mondo sempre attivo, 24/7, un'organizzazione può ottenere un vantaggio competitivo - o perdere quote di mercato - a seconda di quanto velocemente sia in grado di riprendersi da un incidente e ripristinare i servizi di core business.
Alcune organizzazioni utilizzano servizi esterni di consulenza per il disaster recovery e la business continuity per rispondere alle esigenze di un'azienda in materia di valutazione, pianificazione e progettazione, implementazione, test e gestione completa del programma di resilienza.
Esistono servizi proattivi, come IT Infrastructure Recovery Services di Kyndryl, per aiutare le aziende a superare le interruzioni con soluzioni di DR IT flessibili ed economiche.
Con l'aumento degli attacchi informatici, le aziende stanno passando da un approccio di ripristino tradizionale o manuale a un approccio di resilienza automatizzato e software-defined. I Cyber Resilience Services di Kyndryl utilizzano tecnologie avanzate e best practice per aiutare a valutare i rischi, assegnare priorità e proteggere applicazioni e dati fondamentali per il business. Queste soluzioni di DR possono aiutare l'azienda a eseguire il ripristino rapido dell'IT durante e dopo un attacco informatico.
Altre aziende si affidano a servizi di backup basati su cloud, come Disaster Recovery as a Service (DRaaS) di Kyndryl, per ottenere una replica continua di applicazioni, infrastrutture, dati e sistemi fondamentali per un ripristino rapido a seguito di un'interruzione dell'IT. Esistono anche soluzioni di server virtuali, come Cloud Virtualized Server Recovery di Kyndryl per proteggere i server critici in tempo reale. Esso permette il ripristino rapido delle tue applicazioni in un Resiliency Center di Kyndryl per mantenere le attività operative durante i periodi di manutenzione o i periodi di inattività inaspettati.
Per un numero crescente di organizzazioni, la soluzione consiste, insieme all'orchestrazione di resilienza, in un approccio basato sul cloud che utilizza l'automazione del disaster recovery e una suite di strumenti di gestione della continuità, progettati specificamente per ambienti IT ibridi. Ad esempio, Resiliency Orchestration di Kyndryl aiuta a proteggere le dipendenze dei processi aziendali tra applicazioni, dati e componenti dell'infrastruttura. Esso aumenta la disponibilità delle applicazioni aziendali in modo che le aziende possano accedere all'intelligenza di alto livello o approfondita, necessaria per il Recovery Point Objective (RPO), il Recovery Time Objective (RTO) e il complessivo stato di integrità dell'IT da un dashboard centralizzato.
Al giorno d'oggi in cui si è sempre connessi, la tua azienda non può permettersi tempi di inattività che possono causare perdite economiche, danni alla reputazione e/o sanzioni normative. Scopri come Cloud Resiliency Orchestration di Kyndryl può aiutarti a trasformare la gestione del ripristino IT attraverso l'automazione per semplificare il processo di disaster recovery, aumentare l'efficienza del flusso di lavoro e ridurre i rischi, i costi e i tempi di test del sistema.
Hyundai Heavy Industries (HHI) si è trovata ad affrontare questa dura realtà nel 2016, durante un terremoto di magnitudo 5,8. Dal momento che il centro di backup aziendale si trovava vicino la sede centrale di Ulsan City, in Corea, il terremoto ha spinto HHI a esaminare i propri sistemi di disaster recovery e determinare la preparazione per una serie completa di potenziali interruzioni.
Un disastro naturale come il sisma del ha mostrato quanto possa essere facile danneggiare l'infrastruttura IT mission critical di Hyundai. La leadership IT ha risposto in modo rapido, collaborando con i Business Resiliency Services di Kyndryl per implementare una soluzione efficace di disaster recovery con un data center remoto.
L'obiettivo di un piano di DR è garantire che un'organizzazione sia in grado di rispondere a un evento dannoso o a un'altra emergenza che colpisce i sistemi informativi e ridurre al minimo le conseguenze sulle operazioni di business.Kyndryl ha creato un modello per creare un piano di disaster recovery di base. Di seguito sono riportate tutte le fasi suggerite in tale modello di DR. Una volta ottenute le informazioni, si raccomanda di conservare il documento in un luogo sicuro e accessibile fuori sede.
Fase 1: Obiettivi principali: il primo passo consiste nel delineare a grandi linee gli obiettivi principali di un piano di disaster recovery.
Fase 2: Personale: annotare il personale addetto al trattamento dei dati. Includere una copia dell'organigramma nel piano.
Fase 3: Profilo dell'applicazione: elencare le applicazioni e se sono fondamentali e se sono un cespite.
Fase 4: Profilo dell'inventario: elencare il produttore, il modello, il numero di serie, il costo e se ogni articolo è di proprietà o in leasing.
Fase 5: Procedure di backup dei servizi di informazione: includere informazioni come: "I journal receiver vengono cambiati alle ________ e alle ________". E: "Gli oggetti modificati nelle seguenti librerie e directory sono salvati su ____".
Fase 6: Procedure di disaster recovery: per qualsiasi piano di DR, è necessario considerare questi tre elementi:
Fase 7: Piano DR per sito mobile: il piano deve includere un piano della configurazione del sito mobile, un piano di comunicazione in caso di evento dannoso (compresi gli schemi di collegamento) e uno schema elettrico del servizio.
Fase 8: Piano DR per hot site: un piano hot site alternativo dovrebbe offrire un sito (di backup) alternativo. Il sito alternativo ha un sistema di backup da utilizzare temporaneamente fintanto che il sito principale viene ripristinato.
Fase 9: Ripristino dell'intero sistema: per riportare il sistema allo stato in cui si trovava prima dell'evento dannoso, utilizzare le procedure sul ripristino dopo una perdita completa del sistema che si trovano in Gestione del sistema: backup e ripristino.
Fase 10: Processo di ricostruzione: il team di gestione deve valutare il danno e iniziare la ricostruzione di un nuovo data center.
Fase 11: Test del piano di disaster recovery e di cyber recovery: per una pianificazione di emergenza di successo, è importante testare e valutare regolarmente il piano di DR. Le operazioni di elaborazione dati sono volatili per natura, con conseguenti frequenti cambiamenti di attrezzature, programmi e documentazione. Queste azioni rendono fondamentale considerare il piano come un documento in evoluzione.
Fase 12: Ricostruzione del sito danneggiato: questo passaggio deve includere una planimetria del centro dati, le attuali esigenze hardware e le possibili alternative, così come la metratura, i requisiti di alimentazione e i requisiti di sicurezza del centro dati.
Fase 13: Registrazione delle modifiche al piano: mantieni aggiornato il tuo piano di DR. Conservare lo storico delle modifiche delle tue configurazioni, applicazioni e delle pianificazioni e procedure di backup.