Connect with Kyndryl

Follow Kyndryl

Explicando o RTO (Recovery Time Objective)

O que é um RTO?

O RTO representa o intervalo de tempo que um aplicativo pode ficar inativo sem resultar em danos significativos para um negócio e o tempo que o sistema leva para sair do estado de perda para a recuperação. Este processo de recuperação inclui as etapas que a TI deve adotar para devolver o aplicativo e seus dados ao seu estado normal. Para aplicativos de alta prioridade, um RTO leva alguns segundos, desde que o departamento de TI tenha investido em serviços de failover. Os RTOs exigem que seu departamento de TI classifique os aplicativos com base em sua prioridade e no risco de perdas para os negócios. Em seguida, aloca a quantia adequada de recursos da sua empresa para estes aplicativos, como tempo, dinheiro e infraestrutura de TI.

Determinando um RTO

O RTOs são usados para medir o tempo necessário para o TI recuperar os dados após o desastre. Para a avaliação do TI, os RTOs representam as necessidades gerais do seu negócio e determinam quanto tempo seu negócio consegue sobreviver sem a infraestrutura e os serviços de TI. Os RTOs precisam estar alinhados com os recursos disponíveis do seu departamento de TI. Os administradores de TI precisam ter um amplo conhecimento sobre as diferentes velocidades de restauração para calcular um RTO que atende às necessidades do negócio. Por exemplo, não é possível obter um RTO de uma hora se o tempo mínimo de restauração é de duas horas.

Como o processo envolve a restauração de todas as operações de TI, os RTOs geralmente são complicados. Seu departamento de TI pode agilizar parte do processo de recuperação automatizando o máximo possível. O RTO pode apresentar custos maiores do que o de um RPO granular, e um RTO de alta demanda envolve toda a sua infraestrutura de negócios e não apenas os dados. O custo de obtenção de um RTO ou RPO deve estar alinhado com a priorização do seu departamento de TI em relação a aplicativos e dados. A TI prioriza aplicativos e dados com base em receita e risco. Se os dados de um aplicativo cumprem com as regulamentações, então a perda de dados desse aplicativo podem resultar em multas altas independentemente de quantas vezes esse aplicativo for usado.

Obtendo um RTO ou RPO quase zero

Enquanto os RTOs e RPOs variam em relação à prioridade de aplicativos e dados, é extremamente caro para qualquer empresa entregar um RTO ou RPO quase nulo para os seus aplicativos. Um tempo de atividade de 100% para o RTO e nenhuma perda de dados para RPO podem ser alcançados somente investindo em replicação de dados contínuos e ambientes virtuais.

Exemplo de um RTO

Um exemplo de RTO é a a recuperação de item granular. Neste exemplo, um usuário em uma empresa exclui um e-mail importante e esvazia a lixeira. Esta empresa usa o Microsoft Exchange como um aplicativo crítico de negócios e seu departamento de TI oferece suporte contínuo para trocas delta-level no Exchange com um aplicativo de backup que oferece recursos de backup e recuperação granular. Este recurso permite que o departamento de TI recupere rapidamente um e-mail importante em cerca de cinco minutos em vez de restaurar uma máquina virtual completa para obter apenas um e-mail.

O que é um objetivo de tempo de recuperação (RTO) e como ele afeta a recuperação de desastres da sua empresa?

Recuperação de desastres e um RTO

Quedas de energia, roubos, servidores e discos rígidos corrompidos, ataques cibernéticos, ransomware e desastres naturais. Existem vários tipos de desastres que podem causar danos no seu negócio caso você não esteja preparado para eles. Como esses desastres são muitas vezes inevitáveis, ter uma infraestrutura de TI forte e estabelecer tempos e objetivos de pontos de recuperação regulares é essencial para fortalecer sua recuperação. É possível que seu departamento de TI faça um failover de um aplicativo e replique seus dados para obter uma perda quase zerada, no entanto, fazê-lo requer recursos substanciais. Seu departamento de TI precisa estabelecer um RTO com base na sua prioridade de aplicativos e no orçamento e recursos alocados para eles.

O que é um RPO e quão diferente é um RTO?

Os RTOs são semelhantes aos objetivos de ponto de recuperação (RPOs), pois fazem uma medição de tempo a partir da falha, desastre ou evento causador de perda. Os RPOs calculam um ponto no tempo quando seus dados foram utilizáveis pela última vez, provavelmente o backup mais recente. Os RPOs e RTOs são conceitos fundamentais para a continuidade dos negócios e são necessárias para determinar métricas de frequência que sua empresa deve planejar seus backups de dados.

Orquestração de resiliência e recuperação de desastres

Há muitos desafios para uma estratégia de recuperação de desastres, especialmente para uma recuperação de desastres de ambiente de TI híbrida. Estes desafios, entre outros, incluem:

  • Cargas de trabalho implementadas em diferentes ambientes
  • Interdependências entre infraestrutura de TI e aplicativos
  • Reconectar todos os dispositivos, componentes e aplicativos de volta para o RPO e restaurar totalmente a operação da empresa
  • A restauração do sistema pode ser prolongada na recuperação de sistemas e aplicativos se estiver ordem incorreta.

O que pode ser feito para desenvolver e entregar uma estratégia bem-sucedida de recuperação de desastres apesar de cada obstáculo? A recuperação de alguns aplicativos críticos em poucas horas é normalmente possível com a equipe de TI certa, mas requer muitos recursos valiosos. As grandes demandas atuais são para RTOs e RPOs e para uma recuperação de sistema onde diversos aplicativos de missões críticas são rapidamente restaurados. Agora é possível minimizar o impacto da disrupção e realizar uma recuperação de uma indisponibilidade em um curto período de tempo. A automação é fundamental, pois cria programas de recuperação de desastres em escala automatizando os fluxos de trabalho entre diferentes aplicativos de forma rápida e confiável, através de uma transição para ambientes híbridos.

A tecnologia atual de orquestração de resiliência permite implementar com sucesso sua estratégia de recuperação de desastres e reduzir a demanda por redução do tempo de inatividade da produção e a vulnerabilidade dos negócios como resultado de interrupções. Em termos de preparação para orquestração de resiliência, auxilia as organizações a realizar testes de recuperação de desastres com sucesso e equipes reduzidas. A orquestração de resiliência também ajuda as organizações a reduzir a necessidade de validação e preparação de simulações para recuperação de desastres. Uma das principais vantagens da tecnologia de orquestração de resiliência é sua capacidade de funcionar em ambientes físicos, virtuais e na nuvem, além de apoiar o reconhecimento dos aplicativos.

Como o autoatendimento e os baixos parâmetros de acordos de serviços cada vez mais aumentam pelas expectativas dos usuários finais para os serviços de nuvem, as estratégias de resiliência com base em orquestração estão se tornando mais importantes para as empresas modernas que buscam adotar ambientes na nuvem.