Explicação do objetivo de tempo de recuperação

Recuperações após desastres e operações continuadas

Quedas de energia. Roubo. Servidores corrompidos e discos rígidos. Ciberataques e ransomware. Tornados, terremotos e furacões. Existem muitos tipos diferentes de desastres que podem causar danos em seu negócio se você não estiver preparado para eles. Como esses desastres são muitas vezes inevitáveis, ter uma infraestrutura de TI forte e estabelecer tempos e objetivos de pontos de recuperação regulares é essencial para fortalecer seu esquema de recuperação. Alguns departamentos de TI poderiam fazer o failover de um aplicativo, replicando seus dados. Com isso, seria possível obter um nível de perda quase nulo, mas isso também exigiria muitos recursos da empresa. Cabe ao departamento de TI, portanto, estabelecer um objetivos de tempo de recuperação? com base na prioridade das aplicações e na quantidade de recursos disponíveis para tal fim.

O que é um objetivos de ponto de recuperação? O que o diferencia dos objetivos de tempo de recuperação?

Os OTRs são muito semelhantes aos objetivos de ponto de recuperação (OPRs), sendo uma medida de tempo desde a falha, desastre ou evento causador da perda. Os OPRs calculam um ponto no tempo quando seus dados foram utilizáveis pela última vez, provavelmente o backup mais recente. Os OPRs e OTRs são conceitos fundamentais para a continuidade dos negócios e são métricas de negócios necessárias para determinar com que frequência sua empresa deve planejar seus backups de dados.

O que é um objetivo de tempo de recuperação?

O OTR representa o intervalo de tempo que uma aplicação pode ficar inativa e sem resultar em danos significativos a um negócio e o tempo que leva para o sistema sair do estado de perda para a recuperação. Este processo de recuperação inclui as etapas que a TI deve adotar para devolver a aplicação e seus dados ao seu estado pré-desastre. Para aplicações de alta prioridade, um OTR pode certamente levar alguns segundos, desde que o departamento de TI tenha investido em serviços de failover. Os OTRs exigem que seu departamento de TI primeiro classifique as aplicações com base em sua prioridade e no risco de causar perdas para os negócios. Em seguida, aloca a quantia adequada de recursos de sua empresa para estas aplicações, como tempo, dinheiro e infraestrutura de TI.

Determinação de um objetivo de tempo de recuperação

Os OTRs são usados para medir o tempo necessário para o departamento de TI recuperar seus dados após um desastre. Para fins de avaliação, os OTRs representam as necessidades gerais de sua empresa e determinam quanto tempo ela consegue sobreviver sem a infraestrutura e os serviços de TI estarem disponíveis. Antes de mais nada, os OTRs precisam estar bem alinhados com os recursos ao alcance do seu departamento de TI. Para calcular um OTR que realmente atende às necessidades da empresa, os seus administradores de TI precisam compreender muito bem os diferentes tipos de velocidades de restauração. Um OTR de uma hora, por exemplo, é incabível se a restauração não puder ser feita em menos de duas horas.

Como o processo envolve a restauração de todas as operações de TI, os OTRs muitas se tornam difíceis de serem obtidos. Seu departamento de TI pode agilizar parte do processo de recuperação, automatizando o máximo possível. O OTR pode apresentar custos maiores do que o de um OPR granular, e um OTR de alta demanda envolve toda a sua infraestrutura de negócios e não apenas os dados. O custo de obtenção de um OTR ou OPR deve estar alinhado com a priorização do seu departamento de TI em relação a aplicações e dados. A área de TI prioriza aplicações e dados com base em receita e risco. Se os dados de uma aplicação cumprem com as regulamentações, então a perda de dados dessa aplicação poderá resultar em multas altas independentemente de quantas vezes essa aplicação for usada.

Atingir um objetivo de tempo de recuperação ou objetivo de ponto de recuperação quase nulo

Enquanto os OTRs e OPRs variam em relação à prioridade de aplicações e dados, é altamente custoso para qualquer empresa entregar um OTR ou RPO quase nulo para todas as suas aplicações. Um tempo de atividade de 100% para o OTR e nenhuma perda de dados para OPR podem ser alcançados somente investindo em replicação de dados contínuos e ambientes virtuais.

Exemplo de um objetivo de tempo de recuperação

A recuperação de item granular é um exemplo de OTR. Tomemos por exemplo uma empresa com elevado número de workloads. Um de seus usuários exclui um e-mail importante e esvazia a pasta de lixo. O Microsoft Exchange é um aplicativo de suma importância para as atividades dessa empresa, e seu departamento de TI oferece suporte contínuo para trocas de nível delta nesse aplicativo. Para tanto, utiliza um programa que apresenta recursos granulares de backup e restauração. Dessa forma, o referido departamento de TI recuperaria um e-mail importante em apenas cinco minutos, sem ter que restaurar uma máquina virtual inteira para isso.

Orquestração de resiliência e recuperação de desastres

Há muitos desafios para uma estratégia de recuperação de desastres, especialmente para uma recuperação de desastres de ambiente de TI híbrida. Estes desafios, entre outros, incluem:

Workloads implementados em diferentes ambientes
Interdependências entre infraestrutura de TI e aplicações
Reconectar todos os dispositivos, componentes e aplicações de volta para o OPR e restaurar a capacidade total da operação da empresa
A restauração do sistema pode ser prolongada por meio da recuperação de sistemas e aplicações na ordem incorreta.

O que pode ser feito para desenvolver e entregar uma estratégia bem-sucedida de recuperação de desastres apesar de cada obstáculo? A recuperação de algumas aplicações críticos em poucas horas é normalmente possível com a equipe de TI certa, mas requer muitos recursos valiosos. As demandas de hoje são para maiores OPRs e OTRs e para uma recuperação de sistema onde diversas aplicações de missão crítica são rapidamente restaurados. Agora é possível minimizar o impacto da disrupção e realizar uma recuperação de uma indisponibilidade dentro de minutos. A automação é fundamental, pois cria programas de recuperação de desastres em escala automatizando os fluxos de trabalho entre diferentes aplicações de forma rápida e confiável através de uma transição para ambientes híbridos.

A tecnologia atual de orquestração de resiliência permite implementar com sucesso sua estratégia de recuperação de desastres e reduzir a demanda por redução do tempo de inatividade da produção e a vulnerabilidade dos negócios como resultado de interrupções. Em termos de orquestração de resiliência e preparação, ajuda as organizações a realizar testes de recuperação de desastres com sucesso e equipes reduzidas. A orquestração de resiliência também contribui para essas empresas precisarem de ainda menos validação e preparação para simularem uma recuperação pós-desastre. Uma das principais vantagens da tecnologia da orquestração de resiliência é sua capacidade de funcionar em ambientes físicos, virtuais e em nuvem, sem prejudicar o reconhecimento do aplicativo. Como o autoatendimento e os contratos de assistência mínima estão cada vez mais próximos de se tornarem a norma entre os usuários finais da nuvem, as estratégias de resiliência orquestrada estão adquirindo cada vez mais importância entre as empresas que empregam ambientes em nuvem.