Spiegazione dell'obiettivo di tempo di recupero (RTO)

Ripristino di emergenza e continuità delle operazioni

Interruzione di corrente. Furto. Server e hard disk corrotti. Attacchi informatici e ransomware. Tornado, terremoti e uragani. Ci sono molti tipi diversi di incidenti che possono creare problemi al tuo business se non sei preparato. Dato che questi eventi sono spesso inevitabili, avere un'infrastruttura IT forte e stabilire tempi di recupero regolari e obiettivi puntuali è essenziale per favorire il processo di recupero. Il tuo dipartimento IT può fare il failover di un'applicazione e replicare i dati per una perdita vicina allo zero, ma questo richiede risorse significative. Il tuo dipartimento IT deve stabilire un obiettivo di tempo di recupero (RTO) basato sulla priorità delle applicazioni e sul budget e le risorse ad esse assegnatee.

Qual è la differenza tra un obiettivo di punto di ripristino e un obiettivo di tempo di ripristino?

Gli obiettivo di tempo di ripristino (OTR) sono in linea con gli obiettivo di punto di ripristino (OPR), una misura del tempo perso causato da un guasto, un incidente o un qualsiasi evento avverso che causi una perdita. Gli OPR si calcolano a posteriori tenendo conto di quando i dati sono stati utilizzabili per l'ultima volta, probabilmente in corrispondenza del backup più recente. OPR e OTR sono concetti cruciali per la continuità del business e sono metriche di business necessarie per determinare quanto spesso la tua azienda dovrebbe programmare il backup dei suoi dati.

Cos'è un obiettivo di tempo di recupero?

Un obiettivo di tempo di recupero indica quanto tempo un'applicazione può restare inattiva senza provocare danni significativi a un'azienda, incluso il tempo necessario al sistema per recuperare e ripartire. Questo processo di recupero comprende i passi che l'IT deve intraprendere per riportare l'applicazione e i suoi dati nello stato in cui si trovavano prima che si verificasse l'incidente. Per applicazioni ad alta priorità, un OTR può essere tranquillamente espresso in secondi, a patto che il dipartimento IT abbia investito nei servizi di failover. Per determinare gli OTR è necessario innanzitutto che il tuo dipartimento IT classifichi le applicazioni in base alla loro priorità e alla valutazione di danni per il business. L'IT assegna a queste applicazioni la quantità adeguata di risorse aziendali, vale a dire tempo, denaro e infrastruttura IT.

Determinazione di un obiettivo di tempo di recupero

Gli OTR sono usati per valutare il tempo necessario al dipartimento IT per ripristinare i dati dopo che si è verificato l'evento dannoso. Per la valutazione di base, gli OTR rappresentano i bisogni complessivi del tuo business e determinano per quanto tempo il tuo business può rimanere senza l'infrastruttura e i servizi IT. Gli OTR devono prima essere allineati con quello che il tuo reparto IT è in grado di fare. Gli amministratori IT hanno bisogno di capire bene i diversi tempi di ripristino per calcolare un OTR che soddisfi le esigenze dell'azienda. Ad esempio, non è possibile soddisfare un OTR di un'ora se il tempo di ripristino minimo realizzabile è di due ore.

Dato che il processo coinvolge il ripristino di tutte le operazioni IT, spesso è complicato determinare gli OTR. Il tuo dipartimento IT può velocizzare parte del processo di recupero automatizzando il più possibile. L'OTR può avere costi maggiori di un OPR granulare; inoltre un OTR impegnativo coinvolge non solo i dati ma l'intera infrastruttura aziendale. Il costo per raggiungere un OTR o un OPR è legato alla prioritizzazione delle applicazioni e dei dati da parte del tuo dipartimento IT. L'IT fornisce la priorità alle applicazioni e ai dati in base ai ricavi e ai rischi ad essi correlati. Ad esempio, se i dati di un'applicazione sono sottoposti a specifiche normative, la perdita di dati da quell'applicazione potrebbe comportare sanzioni pesanti, indipendentemente dalla frequenza d'uso di quell'applicazione.

Come ottenere un obiettivo di punto di recupero o di tempo di recupero prossimo allo zero?

Mentre gli OPR e gli OTR variano in relazione alla priorità delle applicazioni e dei dati, è estremamente costoso per qualsiasi impresa fornire un OTR o OPR vicino allo zero per tutte le proprie applicazioni. Un uptime del 100% per l'OTR e zero dati persi per l'OPR possono essere raggiunti solo investendo nella replica continua dei dati e negli ambienti virtuali.

Esempio di un obiettivo di tempo di recupero

Il recupero granulare degli elementi è un esempio di OTR. In questo esempio, un utente di un'azienda molto attiva cancella un'e-mail importante e svuota la cartella del cestino. Questa azienda usa Microsoft Exchange come applicazione business-critical e il suo dipartimento IT esegue continuamente il backup incrementale delle modifiche in Exchange con un'applicazione di backup che offre backup e recovery granulari. Questa funzionalità permette al dipartimento IT di recuperare rapidamente l'e-mail importante in circa cinque minuti, invece di dover ripristinare un'intera macchina virtuale per una sola e-mail.

Orchestrazione della resilienza e ripristino di emergenza

Ci sono molte sfide per una strategia di disaster recovery, specie nel caso di un disaster recovery in un ambiente IT ibrido. Queste sfide includono principalmente:

Carichi di lavoro distribuiti su ambienti diversi
Interdipendenze tra l'infrastruttura IT e le applicazioni
Riportare tutti i dispositivi, i componenti e le applicazioni all'OPR e ripristinare la piena operatività del business
Il ripristino del sistema potrebbe essere ulteriormente ritardato dal ripristino di sistemi e applicazioni nell'ordine non corretto.

Cosa si può fare per sviluppare e fornire una strategia di disaster recovery di successo indipendentemente dal tipo di ostacolo o imprevisto? Recuperare alcune applicazioni critiche in poche ore è generalmente possibile con il giusto team IT, ma richiede parecchie risorse preziose. Oggi sono richiesti OTR e OPR maggiori e sistemi di recovery in cui più applicazioni mission-critical vengano ripristinate rapidamente. Ora è possibile minimizzare l'impatto delle interruzioni ed eseguire un ripristino entro pochi minuti da un fermo. L'automazione è cruciale, permettendo ai programmi di disaster recovery di scalare automatizzando i flussi di lavoro tra le diverse applicazioni in modo rapido e affidabile con una transizione verso ambienti ibridi.

L'odierna tecnologia di orchestrazione della resilienza ti aiuta a implementare con successo la strategia di disaster recovery e a ridurre sia le richieste di downtime della produzione che l'esposizione aziendale conseguente a interruzioni. In termini di preparazione, l'orchestrazione della resilienza aiuta le organizzazioni a eseguire con successo i test di disaster recovery con uno staff ridotto. L'orchestrazione della resilienza aiuta anche le organizzazioni a ridurre il tempo necessario per la preparazione e la convalida delle esercitazioni di disaster recovery. Uno dei principali vantaggi della tecnologia di orchestrazione della resilienza è la sua capacità di funzionare attraverso ambienti fisici, virtuali e cloud mantenendo la conoscenza delle applicazioni Dato che la logica self-service e i bassi parametri degli accordi sui livelli di servizio rappresentano sempre più le aspettative degli utenti finali dei servizi cloud, le strategie di resilienza basate sull'orchestrazione stanno diventando sempre più cruciali per le imprese di oggi che desiderano adottare ambienti cloud.