Passa al contenuto principale

Spiegazione dell'Recovery Time Objective (RTO)


Ripristino di emergenza e continuità delle operazioni  

Interruzione di corrente. Furto. Server e hard disk corrotti. Attacchi informatici e ransomware. Tornado, terremoti e uragani. Ci sono molti tipi diversi di incidenti che possono creare problemi al tuo business se non sei preparato. Dato che questi eventi sono spesso inevitabili, avere un'infrastruttura IT forte e stabilire tempi di recupero regolari e obiettivi puntuali è essenziale per favorire il processo di recupero. Il tuo dipartimento IT può fare il failover di un'applicazione e replicare i dati per una perdita vicina allo zero, ma questo richiede risorse significative. Il tuo dipartimento IT deve stabilire un RTO basato sulla priorità delle applicazioni e sul budget e le risorse ad esse assegnatee.  

Cos'è un RPO e quali sono le differenze con gli RTO?

Gli RTO sono in linea con gli RPO, una misura del tempo perso causato da un guasto, un incidente o un qualsiasi evento avverso che causi una perdita. Gli RPO si calcolano a posteriori tenendo conto di quando i dati sono stati utilizzabili per l'ultima volta, probabilmente in corrispondenza del backup più recente. RPO e RTO sono concetti cruciali per la continuità del business e sono metriche di business necessarie per determinare quanto spesso la tua azienda dovrebbe programmare il backup dei suoi dati.   

Cos'è un RTO?

L'RTO indica quanto tempo un'applicazione può restare inattiva senza provocare danni significativi a un'azienda, incluso il tempo necessario al sistema per recuperare e ripartire. Questo processo di recupero comprende i passi che l'IT deve intraprendere per riportare l'applicazione e i suoi dati nello stato in cui si trovavano prima che si verificasse l'incidente. Per applicazioni ad alta priorità, un RTO può essere tranquillamente espresso in secondi, a patto che il dipartimento IT abbia investito nei servizi di failover.   Per determinare gli RTO è necessario innanzitutto che il tuo dipartimento IT classifichi le applicazioni in base alla loro priorità e alla valutazione di danni per il business. L'IT assegna a queste applicazioni la quantità adeguata di risorse aziendali, vale a dire tempo, denaro e infrastruttura IT.

Determinazione di un RTO

Gli RTO sono usati per valutare il tempo necessario al dipartimento IT per ripristinare i dati dopo che si è verificato l'evento dannoso. Per la valutazione di base, gli RTO rappresentano i bisogni complessivi del tuo business e determinano per quanto tempo il tuo business può rimanere senza l'infrastruttura e i servizi IT. Gli RTO devono prima essere allineati con quello che il tuo reparto IT è in grado di fare. Gli amministratori IT hanno bisogno di capire bene i diversi tempi di ripristino per calcolare un RTO che soddisfi le esigenze dell'azienda. Ad esempio, non è possibile soddisfare un RTO di un'ora se il tempo di ripristino minimo realizzabile è di due ore.   

Dato che il processo coinvolge il ripristino di tutte le operazioni IT, spesso è complicato determinare gli RTO. Il tuo dipartimento IT può velocizzare parte del processo di recupero automatizzando il più possibile.  L'RTO può avere costi maggiori di un RPO (Recovery Point Objective) granulare; inoltre un RTO impegnativo coinvolge non solo i dati ma l'intera infrastruttura aziendale. Il costo per raggiungere un RTO o un RPO è legato alla prioritizzazione delle applicazioni e dei dati da parte del tuo dipartimento IT. L'IT fornisce la priorità alle applicazioni e ai dati in base ai ricavi e ai rischi ad essi correlati.  Ad esempio, se i dati di un'applicazione sono sottoposti a specifiche normative, la perdita di dati da quell'applicazione potrebbe comportare sanzioni pesanti, indipendentemente dalla frequenza d'uso di quell'applicazione.   

Come ottenere un RTO o un RPO vicino allo zero

Mentre gli RTO e gli RPO variano in relazione alla priorità delle applicazioni e dei dati, è estremamente costoso per qualsiasi impresa fornire un RTO o RPO vicino allo zero per tutte le proprie applicazioni. Un uptime del 100% per l'RTO e zero dati persi per l'RPO possono essere raggiunti solo investendo nella replica continua dei dati e negli ambienti virtuali.

Esempio di un RTO

Il recupero granulare degli elementi è un esempio di RTO. In questo esempio, un utente di un'azienda molto attiva cancella un'e-mail importante e svuota la cartella del cestino. Questa azienda usa Microsoft Exchange come applicazione business-critical e il suo dipartimento IT esegue continuamente il backup incrementale delle modifiche in Exchange con un'applicazione di backup che offre backup e recovery granulari. Questa funzionalità permette al dipartimento IT di recuperare rapidamente l'e-mail importante in circa cinque minuti, invece di dover ripristinare un'intera macchina virtuale per una sola e-mail.

Orchestrazione della resilienza e disaster recovery

Ci sono molte sfide per una strategia di disaster recovery, specie nel caso di un disaster recovery in un ambiente IT ibrido. Queste sfide includono principalmente:

  • Carichi di lavoro distribuiti su ambienti diversi
  • Interdipendenze tra l'infrastruttura IT e le applicazioni
  • Riportare tutti i dispositivi, i componenti e le applicazioni all'RPO e ripristinare la piena operatività del business
  • Il ripristino del sistema potrebbe essere ulteriormente ritardato dal ripristino di sistemi e applicazioni nell'ordine non corretto.

Cosa si può fare per sviluppare e fornire una strategia di disaster recovery di successo indipendentemente dal tipo di ostacolo o imprevisto? Recuperare alcune applicazioni critiche in poche ore è generalmente possibile con il giusto team IT, ma richiede parecchie risorse preziose. Oggi sono richiesti RTO e RPO maggiori e sistemi di recovery in cui più applicazioni mission-critical vengano ripristinate rapidamente. Ora è possibile minimizzare l'impatto delle interruzioni ed eseguire un ripristino entro pochi minuti da un fermo. L'automazione è cruciale, permettendo ai programmi di disaster recovery di scalare automatizzando i flussi di lavoro tra le diverse applicazioni in modo rapido e affidabile con una transizione verso ambienti ibridi. 

L'odierna tecnologia di orchestrazione della resilienza ti aiuta a implementare con successo la strategia di disaster recovery e a ridurre sia le richieste di downtime della produzione che l'esposizione aziendale conseguente a interruzioni. In termini di preparazione, l'orchestrazione della resilienza aiuta le organizzazioni a eseguire con successo i test di disaster recovery con uno staff ridotto. L'orchestrazione della resilienza aiuta anche le organizzazioni a ridurre il tempo necessario per la preparazione e la convalida delle esercitazioni di disaster recovery. Uno dei principali vantaggi della tecnologia di orchestrazione della resilienza è la sua capacità di funzionare attraverso ambienti fisici, virtuali e cloud mantenendo la conoscenza delle applicazioni Dato che la logica self-service e i bassi parametri degli accordi sui livelli di servizio rappresentano sempre più le aspettative degli utenti finali dei servizi cloud, le strategie di resilienza basate sull'orchestrazione stanno diventando sempre più cruciali per le imprese di oggi che desiderano adottare ambienti cloud.