Vielleicht hat Ihr Unternehmen kürzlich beschlossen, Rechenknoten anzuschaffen und mit künstlicher Intelligenz (KI) zu beginnen. Bei der Vorbereitung auf KI-Workloads gibt es viele Aspekte Ihrer IT-Infrastruktur und Technologie-Geschäftswelt zu überprüfen, darunter insbesondere Ihre Speichersysteme. KI wird von Daten angetrieben, und die Art und Weise, wie Ihre Daten gespeichert werden, kann den Erfolg Ihres KI-Projekts erheblich beeinflussen. Darüber hinaus haben die vier verschiedenen Phasen von KI (Aufnehmen, Vorbereitung, Training und Inferenz) jeweils unterschiedliche Speicherbedürfnisse und -anforderungen.
Leider konzentrieren sich einige Unternehmen auf die Rechenseite der KI und übersehen die Speicherseite. Diese einseitige Fokussierung kann, und tut es manchmal auch, zur Störung oder zum kompletten Scheitern von KI-Projekten führen. Für die KI-Trainingsphase werden enorme Datenmengen benötigt. Diese Daten müssen aufgenommen, gespeichert und aufbereitet werden, damit sie in die Trainingsphase „eingespeist“ werden können. Ohne die Möglichkeit, die für das Training erforderlichen Daten aufzunehmen, zu speichern und zu nutzen, ist das Projekt zum Scheitern verurteilt.
KI-Projekte erfordern eine Speicherinfrastruktur mit hervorragender Leistung, Skalierbarkeit und Flexibilität. Die gute Nachricht ist, dass die heutigen Speichersysteme speziell auf die Anforderungen von KI-Projekten zugeschnitten werden können. Zwei hervorragende Beispiele hierfür sind einige der leistungsstärksten Supercomputer der Welt, Sierra und Summit.
Sehen wir uns nun einige Anforderungen an.
Die Anforderungen für jede Phase der KI-Pipeline müssen im Hinblick auf die erwartete Workload Ihrer KI-Anwendung überprüft werden. Die Workloads variieren, aber einige Unternehmen, die große Datensätze verwenden, können über lange Zeiträume trainieren oder schulen. Sobald das Training abgeschlossen ist, werden diese Daten oft von kritischen Speicherplattformen verschoben, um sich auf eine neue Workload vorzubereiten. Die manuelle Verwaltung von Daten kann eine Herausforderung sein. Daher ist es ratsam, im Voraus zu überlegen, wie Daten gespeichert werden und wohin sie nach Abschluss des Trainings verschoben werden sollen. Die Suche nach einer Plattform, die Daten automatisch für Sie verschiebt, bringt Sie einer effizienten und leistungsfähigen Speicherverwaltung für KI einen Schritt näher.
Nachdem Sie Ihre eigenen Workload-Anforderungen geprüft haben, können Sie sich für die Speichertechnologien entscheiden, die sich am besten für Ihre KI-Recheninfrastruktur und Ihr Projekt eignen.
Datenaufnahme. Die Rohdaten für KI-Workloads können aus einer Vielzahl von strukturierten und unstrukturierten Datenquellen stammen, und Sie benötigen einen sehr zuverlässigen Ort zum Speichern der Daten. Das Speichermedium könnte ein Data Lake oder eine schnelle Schicht wie Flash-Speicher sein, insbesondere für Echtzeitanalyse.
Datenaufbereitung. Da die Daten nach dem Speichern im „Rohdatenformat“ vorliegen, müssen sie aufbereitet werden. Die Daten müssen verarbeitet und für die Nutzung durch die verbleibenden Phasen formatiert werden. Die Datei-I/O-Leistung ist in diesem Stadium sehr wichtig, da Sie nun eine Mischung aus zufälligen Lese- und Schreibvorgängen haben. Nehmen Sie sich Zeit, um herauszufinden, welche Leistungsanforderungen für Ihre KI-Pipeline gelten. Sobald die Daten formatiert sind, werden sie in die Neural Networks zum Training eingespeist.
Training und Inferenz. Diese Phasen sind sehr rechenintensiv und erfordern im Allgemeinen das Streamen von Daten in die Trainingsmodelle. Das Training ist ein iterativer Prozess, der ein Festlegen und Zurücksetzen erfordert und zur Erstellung der Modelle dient. Inferenz kann als Summe aus Daten und Training betrachtet werden. Die GPUs in den Servern und Ihre Speicherinfrastruktur spielen hier eine sehr wichtige Rolle, da geringe Latenz, hoher Durchsatz und schnelle Reaktionszeiten erforderlich sind. Ihre Speichernetzwerke müssen darauf ausgelegt sein, diese Anforderungen sowie die Datenaufnahme und -vorbereitung zu bewältigen. In großem Maßstab wird dadurch die Leistung vieler Speichersysteme stark beansprucht, insbesondere solcher, die nicht für KI-Workloads ausgelegt sind. Daher ist es wichtig, genau zu prüfen, ob Ihre Speicherplattform die Workload-Anforderungen im Einklang mit Ihren Geschäftszielen erfüllen kann.
Bedenken Sie außerdem: Lässt sich Ihre Speicherinfrastruktur problemlos skalieren? Lässt sich das Speichersystem erweitern, wenn Ihr Datenbedarf wächst? Das sind sehr wichtige Fragen, die sich direkt auf Ihre Anforderungen an die KI-Infrastruktur auswirken.
Stellen Sie sicher, dass Sie Ihre Speicherinfrastruktur mit minimaler bis gar keiner Unterbrechung Ihrer Produktionsabläufe hoch- und herunterskalieren können, um mit dem Datenwachstum in Ihrem Unternehmen Schritt zu halten. Seien Sie flexibel genug, um verschiedene Speicherkonfigurationen für die unterschiedlichen Anforderungen der KI-Infrastruktur zu berücksichtigen.
Eine sorgfältige Planung, die Ihre KI-Server- und Modellierungsanforderungen mit der Speicherinfrastruktur abgleicht, wird Ihnen helfen, das Beste aus Ihren Investitionen herauszuholen und Ihre KI-Projekte zum Erfolg zu führen.
Diese Empfehlungen sind nur ein Ausgangspunkt. Denken Sie immer daran, dass Sie, wenn Sie in Ihrem Unternehmen nicht über das erforderliche Fachwissen zur Entwicklung und Implementierung der richtigen KI-Speicherinfrastruktur verfügen, mit Ihrem Anbieter zusammenarbeiten sollten, um Ihre Speichersysteme für KI vorzubereiten.
