Ir para o conteúdo principal

Como a IA e o aprendizado de máquina podem melhorar as operações do data center?

A IA e o aprendizado de máquina nos data centers atuais

A AI e o aprendizado de máquina têm sua gênese na ficção científica e uma história reverenciada e colorida que remonta à antiguidade e avança até os dias atuais. Eles são usados em inúmeras áreas para melhorar o nosso dia a dia. Para muitas empresas, a IA e o aprendizado de máquina estão preenchendo rapidamente seus data centers como ferramentas que ajudam a resolver problemas complexos, incluindo previsão e otimização.

O que é deep learning?

A Techopedia define o deep learning como “uma coleção de algoritmos [que são] usados para modelar abstrações de alto nível em dados [por meio de] arquiteturas de modelo [compostas] de várias transformações não lineares”. O deep learning é utilizado pelo aprendizado de máquina e faz parte de um grupo de métodos que se baseiam em representações de aprendizado de dados.

É uma abordagem específica para construir e treinar redes neurais: nós de tomada de decisão com um grande potencial.

Os algoritmos são considerados “profundos” se os dados de entrada forem desviados por uma série de não linearidades ou transformações não lineares antes de se tornarem dados de saída. Inversamente, a maioria dos algoritmos de aprendizado de máquina de hoje pode ser considerada “superficial”, pois sua entrada só pode atingir os primeiros níveis de chamada de sub-rotina.

O deep learning elimina a identificação manual de recursos nos dados e conta com seu processo de treinamento para descobrir os padrões úteis do exemplo de entrada. Esse recurso torna o processo de treinamento de redes neurais mais fácil e rápido e ajuda a produzir melhores resultados, produzindo avanços no campo da IA.1

Como as empresas usam deep learning, IA e aprendizado de máquina para aumentar a eficiência e reduzir custos?

Deep learning, IA e aprendizado de máquina são ferramentas que podem analisar uma grande quantidade de dados, localizar padrões nesses dados e determinar quando esses padrões podem se repetir no futuro. A IA e o aprendizado de máquina podem modelar configurações alternativas, aumentando o tempo de atividade e a resiliência, localizando oportunidades para manutenção preventiva e visando possíveis riscos de segurança cibernética.

Os data centers geralmente apresentam uma riqueza de recursos e instrumentos sensoriais, fornecendo às suas operações dados históricos e em tempo real sobre o desempenho geral e o ambiente. Otimizar recursos, prever e prevenir o tempo de inatividade são funções importantes para IA e aprendizado de máquina em data centers. Ao monitorar dados de desempenho em tempo real que regulam o gerenciamento de energia e o resfriamento do sistema, a IA e o aprendizado de máquina podem não apenas conservar e otimizar seus recursos, mas também prever onde pode ocorrer uma falha no data center. Se eles puderem localizar onde uma falha provavelmente ocorrerá, a manutenção preventiva poderá ser executada e o tempo de inatividade do sistema ou uma interrupção do sistema poderão ser evitados.

Como o Google usou o DeepMind para otimizar a capacidade de resfriamento dos seus data centers

No artigo Ficando inteligente: como a IA e o aprendizado de máquina podem ajudar os data centers, Peter Judge observa que, a partir de 2014, o engenheiro de data center do Google, Jim Gao, começou a usar a tecnologia DeepMind como mecanismo de recomendação. Em 2016, algumas redes neurais aprenderam a prever temperaturas futuras e dar sugestões sobre como responder proativamente. Esse uso de IA permitiu que o Google otimizasse a refrigeração de suas instalações em Cingapura, reduzindo o custo de refrigeração do local em 40% e economizando 15% da eficiência de utilização de energia da instalação (PUE).2

Durante 2018, o Google aplicou a mesma abordagem usada em seu data center de instalações em Cingapura e criou um sistema de refrigeração de data center autônomo, onde a IA supervisionava as configurações operacionais do data center juntamente com a supervisão humana. Com a segurança em mente, a barra foi definida para o sistema automático para reduzir o custo de refrigeração em 30%.  Por fim, o data center teve uma “queda de 40% na quantidade de energia necessária para resfriar a unidade e alcançou a pontuação (PUE) mais baixa em seu histórico, de 1,06”.3

Para prever como as ações afetariam o consumo de energia e determinar a melhor escolha para o futuro, o sistema de IA usou milhares de sensores e gravou instantâneos do sistema de refrigeração do data center a cada cinco minutos. O sistema de IA, então, alimentou essas informações para um sistema de IA baseado em nuvem e selecionou o que acreditava ser a melhor opção de ação. Essa ação foi encaminhada para o data center onde foi verificada pelos operadores humanos desse centro e, se a ação fosse considerada segura, seria executada.

Eventualmente, a IA aprendeu a prever mudanças ambientais e a tirar proveito delas. Por exemplo, a IA usou condições frias de inverno para criar água mais fria, que reduziu a energia necessária para resfriar o data center.

Como a IA e o aprendizado de máquina ajudam as empresas a entender seus clientes

As empresas estão usando IA e aprendizado de máquina para analisar as grandes quantidades de informações do cliente encontradas em todos os data centers de seus negócios. Se o software de IA ou aprendizado de máquina estiver conectado a um sistema de gerenciamento de relacionamento com o cliente (CRM), eles poderão localizar e recuperar dados do cliente que, de outra forma, não são usados pelo sistema de CRM. Em última análise, as empresas podem usar IA e aprendizado de máquina para criar estratégias para geração de oportunidades para clientes, aumentando o sucesso do cliente e reduzindo a rotatividade de clientes.

Como a IA e o aprendizado de máquina ajudam as empresas a usar a previsão

Quando há uma grande mudança no ambiente, as pessoas podem reagir exageradamente ou simplesmente tomar decisões erradas. Nesta área de resposta, a IA pode ter um desempenho melhor do que as pessoas, mantendo a estabilidade com abordagens preditivas baseadas em lógica para escolher as melhores ações. 

As flutuações de temperatura entre os servidores em data centers podem desperdiçar muitos recursos tentando recuperar o controle de um servidor que está muito quente. Se um servidor for temporariamente colocado off-line, isso reduzirá drasticamente a produtividade do data center. As empresas de gerenciamento de infraestrutura de data center (DCIM) estão trabalhando para remediar esse dilema integrando análises preditivas com IA e aprendizado de máquina.

Os dados brutos de sensores são processados e alimentados em mecanismos de modelagem preditiva. A IA e o aprendizado de máquina usam a correspondência de padrões para regular a temperatura e localizar sinais de vazamentos da refrigeração. Alguns sistemas analisam e identificam áreas de melhoria em um sistema de IA.

Como a Nlyte usa o IBM Watson® para ir além da previsão

Peter Judge observa que em 2018 o fornecedor DCIM Nlyte integrou suas ferramentas com o IBM Watson. Os objetivos dessa colaboração eram melhorar a manutenção preventiva baseada em IA e aprendizado de máquina e ir “além das atividades preditivas e passar para os workloads e gerenciamento dos workloads”.

Judge afirma que a IA pode ajudar a reduzir o tamanho do workload e o risco de falha do workload. Ele cita a líder de marketing norte-americana da IBM Watson IoT, Amy Bennett, que diz que a IA é “um membro da equipe do data center que nunca tira férias”.

O futuro da IA e o aprendizado de máquina

O desafio final com o uso de IA e aprendizado de máquina para melhorar a potência e a eficiência dos servidores de resfriamento de data centers é que a IA e o aprendizado de máquina um dia começarão a gerar retornos decrescentes. Quando isso ocorrer, a IA e o aprendizado de máquina podem começar a usar o balanceamento de carga inteligente e a orquestração de contêineres, mover as próprias cargas de TI e reduzir o custo de energia de TI. 

Judge faz referência a Suvojit Ghosh, diretor do Centro de Pesquisa de Infraestrutura Computacional (CIRC), que está usando IA para analisar os sons de um data center e sua correlação com o consumo de energia. Ghosh está trabalhando para criar uma IA que possa prever quando algo precisa ser reparado ou substituído. Isso pode ser combinado com operadores e engenheiros humanos que podem receber os relatórios de condição do data center da IA e responder adequadamente com reparos ou solução de problemas.

No artigo Como o aprendizado de máquina em data centers otimiza as operações, Julia Borgini argumenta que o software de aprendizado de máquina está prevendo problemas e resolvendo-os mais rápido do que nunca.  O aprendizado de máquina é uma extensão do ambiente de data center híbrido e uma área crescente da infraestrutura de data center. Borgini afirma que “a IDC prevê que 50% dos ativos de TI em data centers serão executados de forma autônoma usando a funcionalidade de IA incorporada até 2022”.4

A IA e o aprendizado de máquina podem eventualmente chegar ao ponto em que o sistema executa ações digitais de forma autônoma e designa robôs para realizar ações físicas, como a manutenção física diária e as operações do data center. Essa capacidade futurista da IA de executar um data center sem a necessidade de interação humana criaria um modelo para data centers autossustentáveis.

Fontes

  1. Equipe da Techopedia, Deep Learning, Techopedia, 13 de novembro de 2017.
  2. Peter Judge, Ficando inteligente: como a IA e o aprendizado de máquina podem ajudar os data centers (em inglês), DCD Magazine, 31 de julho de 2019.
  3. Caroline Donnelly, Google Deepmind dobra os esforços liderados por IA para melhorar a eficiência energética do datacenter (em inglês), ComputerWeekly.com, 20 de agosto de 2018.
  4. Julia Borgini, Como o aprendizado de máquina em data centers otimiza as operações (em inglês), TechTarget, 22 de julho de 2019.