Zum Hauptinhalt wechseln

Wie können KI und maschinelles Lernen den Betrieb von Rechenzentren verbessern?

KI und maschinelles Lernen (ML) in heutigen Rechenzentren

KI und maschinelles Lernen haben ihren Ursprung in Science-Fiction und eine faszinierende Geschichte, die von der Antike bis in die heutige Zeit reicht. Sie werden in unzähligen Bereichen eingesetzt, um unser tägliches Leben zu verbessern. Viele Unternehmen nutzen KI und maschinelles Lernen in ihren Rechenzentren als Tools für die Lösung komplexer Probleme wie Prediction und Optimierung. 

Was ist Deep Learning?

Techopedia definiert Deep Learning als „eine Sammlung von Algorithmen [die] zur Modellierung von High-Level-Abstraktionen in Daten [durch] Modellarchitekturen aus mehreren nichtlinearen Transformationen [bestehen]“. Deep Learning wird im Rahmen des maschinellen Lernens eingesetzt und gehört zu einer Gruppe von Methoden, die auf dem Lernen von Datendarstellungen beruhen.

Es handelt sich dabei um einen spezifischen Ansatz für den Aufbau und das Training neuraler Netzwerke: Entscheidungsknoten mit einem enormen Potenzial.

Algorithmen gelten als „deep“, wenn die Eingabedaten durch eine Reihe von Nichtlinearitäten oder nichtlinearen Transformationen geschleust werden, bevor sie als Ergebnis vorliegen. Auf der anderen Seite können die meisten der heutigen Algorithmen für maschinelles Lernen als „oberflächlich“ bezeichnet werden, da ihre Eingaben nur die ersten wenigen Stufen der Subroutine-Aufrufe erreichen können.

Deep Learning eliminiert die manuelle Identifikation von Merkmalen in Daten und verlässt sich auf seinen Trainingsprozess, um die nützlichen Muster des Eingabebeispiels zu entdecken. Diese Feature gestaltet den Trainingsprozess für neurale Netzwerke einfacher und schneller und trägt zu besseren Ergebnissen bei, was den Bereich der KI fördert.1

Wie nutzen Unternehmen Deep Learning, KI und maschinelles Lernen zur Steigerung der Effizienz und zur Kostensenkung?

Deep Learning, KI und maschinelles Lernen sind Tools, die große Datenmengen analysieren. Sie sind anschließend in der Lage, Muster in diesen Daten zu erkennen und festzustellen, wann sich diese Muster in Zukunft wiederholen könnten. KI und maschinelles Lernen können alternative Konfigurationen modellieren, die Betriebszeit und Ausfallsicherheit erhöhen, Möglichkeiten zur vorbeugenden Wartung aufzeigen und potenzielle Cybersicherheitsrisiken aufdecken.

Rechenzentren verfügen in der Regel über eine Fülle von Ressourcen und sensorischen Instrumenten, die ihren Betrieb mit Echtzeit- und historischen Daten über ihre Gesamtleistung und ihre Umgebung versorgen. Die Optimierung von Ressourcen sowie die Vorhersage und Vermeidung von Ausfallzeiten sind wichtige Funktionen für die KI und das maschinelle Lernen in Rechenzentren. Durch die Überwachung von Leistungsdaten in Echtzeit, die das Energiemanagement und die Systemkühlung regeln, können KI und maschinelles Lernen nicht nur ihre Ressourcen schonen und optimieren, sondern auch vorhersagen, wo im Rechenzentrum Störungen auftreten könnten. Wenn festgestellt werden kann, wo eine Störung auftreten könnte, kann eine vorbeugende Wartung durchgeführt und ein Systemstillstand oder ein -ausfall verhindert werden.

Wie Google DeepMind nutzte, um die Kühlung seiner Rechenzentren zu optimieren

Im Artikel „Smartening up: How AI and machine learning can help data centers“ erwähnt Peter Judge, dass Jim Gao, ein Ingenieur für Rechenzentren bei Google, seit 2014 die DeepMind-Technologie als Empfehlungsmaschine einsetzt. In 2016 hatten einige neurale Netze bereits gelernt, zukünftige Temperaturen vorherzusagen und Vorschläge zu machen, wie proaktiv darauf reagiert werden kann. Durch den Einsatz von KI konnte Google die Kühlung seines Standorts in Singapur optimieren. Dadurch wurden die Kosten für die Kühlung des Standorts um 40 % gesenkt und 15 % der sogenannten PUE-Werte (Power Usage Effectiveness) der Anlage eingespart.2

Im Jahr 2018 wandte Google den gleichen Ansatz wie in seinem Rechenzentrum in Singapur an und entwickelte ein selbststeuerndes Kühlsystem für das Rechenzentrum, bei dem die KI die Betriebseinstellungen des Rechenzentrums gemeinsam mit der physischen Aufsicht überwacht. Mit Blick auf die Sicherheit wurde die Messlatte für das automatische System so hoch gelegt, dass die Kosten für die Kühlung nur um 30 Prozent gesenkt werden konnten.  Letztendlich konnte das Rechenzentrum „den Energiebedarf für die Kühlung der Anlage um 40 % senken [und erreichte] mit 1,06 den niedrigsten [PUE]-Wert in seiner Geschichte“.3

Um vorherzusagen, wie sich Maßnahmen auf den Energieverbrauch auswirken und um die beste Wahl für die Zukunft zu treffen, nutzte das KI-System Tausende von Sensoren und zeichnete alle fünf Minuten Snapshots des Kühlsystems des Rechenzentrums auf. Das KI-System speiste diese Informationen dann in ein cloudbasiertes KI-System ein und wählte die nach seiner Einschätzung beste Option der Maßnahmen aus. Diese Maßnahme wurde dann an das Rechenzentrum weitergeleitet, wo sie von den Bedienern überprüft wurde. Nachdem sie als sicher eingestuft war, wurde sie umgesetzt.

Im Laufe der Zeit lernte die KI, Umweltveränderungen vorherzusagen und sich diese zunutze zu machen. Beispielsweise nutzte die KI kalte Winterbedingungen, um kälteres Wasser zu erzeugen, was den Energiebedarf für die Kühlung des Rechenzentrums senkte.

Wie KI und maschinelles Lernen Unternehmen helfen, ihre Kunden zu verstehen

Unternehmen nutzen KI und maschinelles Lernen, um die enormen Mengen an Kundendaten zu analysieren, die sich in den Rechenzentren ihrer Unternehmen befinden. Wenn KI- oder maschinelle Lernsoftware mit einem CRM-System (Customer-Relationship-Management-System) verbunden ist, kann sie Kundendaten ausfindig machen und abrufen, die sonst vom CRM-System nicht genutzt werden. Darüber hinaus können Unternehmen mithilfe von KI und maschinellem Lernen Strategien für die Generierung von Kundenkontakten entwickeln, den Kundenerfolg steigern und die Abwanderung von Kunden verringern.

Wie KI und maschinelles Lernen Unternehmen helfen, Vorhersagen zu nutzen

Bei großen Umweltveränderungen können Menschen überreagieren oder einfach falsche Entscheidungen treffen. In diesem Bereich der Reaktion kann KI bessere Leistungen erbringen als der Mensch, da sie mit logikbasierten prädiktiven Ansätzen für die Wahl der besten Maßnahmen die Stabilität aufrechterhält. 

Temperaturschwankungen zwischen Servern in Rechenzentren können viele Ressourcen verschwenden, wenn versucht wird, einen Server, der zu warm lief, wieder unter Kontrolle zu bringen. Wenn ein Server vorübergehend vom Netz getrennt wird, verringert sich die Produktivität des Rechenzentrums drastisch. DCIM-Firmen (Data Center Infrastructure Management) arbeiten daran, dieses Dilemma durch die Integration von Vorhersageanalyse mit Anwendung von KI und maschinellem Lernen zu lösen.

Rohdaten von Sensoren werden verarbeitet und in Systeme für die Vorhersagemodellierung eingespeist. KI und maschinelles Lernen nutzen Pattern Matching (Mustererkennung), um die Temperatur zu regulieren und Anzeichen für Kältemittellecks zu erkennen. Einige Systeme analysieren und erkennen verbesserungswürdige Bereiche innerhalb eines KI-Systems.

Wie Nlyte IBM Watson® nutzt, um über einfache Vorhersagen hinauszugehen

Peter Judge merkt an, dass der DCIM-Anbieter Nlyte im Jahr 2018 seine Tools mit IBM Watson integriert hat. Ziel dieser Zusammenarbeit war es, die auf KI und maschinellem Lernen basierende vorbeugende Wartung zu verbessern und „über die Vorhersage hinaus in die Workloads und das Management der Workloads vorzudringen“.

Judge führt weiter aus, dass die KI dazu beitragen kann, die Größe der Workloads und das Risiko eines Workload-Ausfalls zu verringern. Er zitiert die nordamerikanische Marketingleiterin von IBM Watson IoT, Amy Bennet, die betont, dass KI „ein Mitglied des Data Center Teams [ist], das nie Urlaub macht“.

Die Zukunft von KI und maschinellem Lernen

Die ultimative Herausforderung beim Einsatz von KI und maschinellem Lernen zur Verbesserung der Leistung und Effizienz der Serverkühlung in Rechenzentren besteht darin, dass die KI und das maschinelle Lernen eines Tages beginnen werden, weniger Erträge zu erzielen. An diesem Punkt könnten KI und maschinelles Lernen mit intelligenter Lastenverteilung und Containerorchestrierung beginnen, die IT-Lasten selbst bewegen und die IT-Energiekosten senken. 

Judge verweist auf Suvojit Ghosh, dem Leiter des CIRC (Computing Infrastructure Research Center), der mithilfe von KI die Geräusche in Rechenzentren und deren Zusammenhang mit dem Stromverbrauch analysiert. Ghosh arbeitet an der Entwicklung einer KI, die vorhersagen kann, wann etwas repariert oder ersetzt werden muss. Dies kann mit den Betreibern und Ingenieuren kombiniert werden, die die Zustandsberichte des Rechenzentrums von der KI erhalten und entsprechend mit Reparaturen oder der Lösung von Problemen reagieren können.

Im Artikel How machine learning in data centers optimizes operations, argmentiert Julia Borgini, dass Software für maschinelles Lernen Probleme vorhersagen und schneller als je zuvor lösen kann.  Das maschinelle Lernen ist eine Erweiterung der hybriden Rechenzentrumsumgebung und ein aufstrebender Zweig der Infrastruktur des Rechenzentrums. Borgini erklärt: „IDC prognostiziert, dass bis 2022 50 % der IT-Ressourcen in Rechenzentren durch eingebettete KI-Funktionen autonom betrieben werden".4

KI und maschinelles Lernen könnten in der Zukunft eine Stufe erreichen, an dem das System selbstständig digitale Handlungen ausführt und Roboter mit der Durchführung physischer Handlungen beauftragt, wie beispielsweise mit der täglichen physischen Wartung und dem Betrieb des Rechenzentrums. Diese futuristische Fähigkeit der KI, ein Rechenzentrum ohne die Notwendigkeit menschlicher Interaktion zu betreiben, würde ein Modell für sich selbst tragende Rechenzentren schaffen.

Ressourcen

  1. Techopedia Staff, Deep Learning, Techopedia, 13. November 2017

  2. Peter Judge, Smartening up: How AI and machine learning can help data centers [Wie KI und maschinelles Lernen Rechenzentren unterstützen können], DCD Magazine, 31. Juli 2019 

  3. Caroline Donnelly, Google Deepmind doubles down on AI-led efforts to improve datacentre energy efficiency [Google Deepmind verdoppelt seine KI-gestützten Bemühungen zur Verbesserung der Energieeffizienz von Rechenzentren], ComputerWeekly.com, 20. August, 2018.

  4. Julia Borgini, How machine learning in data centers optimizes operations [Wie maschinelles Lernen in Rechenzentren den Betrieb optimiert], TechZiel, 22. Juli 2019