Was ist Analytics Engine?
Die IBM Analytics Engine stellt eine Architektur für Hadoop -Cluster bereit, durch die Rechen- und Speicherschichten voneinander abgekoppelt werden. Statt eines permanenten Clusters, der aus Dual-Purpose-Knoten besteht, ermöglicht die IBM Analytics Engine Benutzern die Speicherung von Daten in einer Objektspeicherschicht wie IBM Cloud Object Storage und aktiviert bei Bedarf die Cluster von Rechenknoten. Die Trennung der Rechen- von der Speicherschicht hilft, Flexibilität, Skalierbarkeit und Wartbarkeit von Big Data Analytics -Plattformen zu transformieren.
Features von Analytics Engine
Potenzial von Open Source-Lösungen nutzen
Entwickeln Sie Lösungen auf der Grundlage ODPi-konformer Produkte mithilfe neuartiger Data Science-Tools zusammen mit dem erweiterten Apache Hadoop- und Apache Spark-Netzwerk.
Bereitstellung und Skalierung ganz nach Bedarf
Richten Sie Cluster basierend auf den Anforderungen Ihrer Anwendung ein. Wählen Sie das geeignete Softwarepaket, die Version und die Größe des Clusters aus. Sie können es so lange wie nötig verwenden und löschen, sobald die Anwendung Jobs abgeschlossen hat.
Umgebung konfigurieren
Konfigurieren Sie Cluste mit Analysebibliotheken und -lösungen anderer Anbieter. Implementieren Sie Workloads aus IBM Cloud-Services, z. B. maschinelles Lernen.
Vorteile der IBM Analytics Engine
Berechnung und Speicherung sind nicht mehr aneinander gebunden
Rechencluster können auf Anforderung individuell aktiviert werden. Da keine Daten im Cluster gespeichert sind, müssen Cluster nie aktualisiert werden.
Mehr Kosteneffizienz bei Clustern mit effizienter Verarbeitung von großen E/A-Volumen
Stellen Sie mehr IBM Cloud Object Storage (oder andere Datenspeicher) bedarfsgesteuert ohne zusätzliche Kosten für nicht genutzte Rechenzyklen bereit.
Cluster sind elastischer
Datenknoten können je nach aktuellem Bedarf über REST-APIs hinzugefügt oder entfernt werden. Außerdem bleiben die Gemeinkosten niedrig, da keine Daten im Rechencluster gespeichert sind.
Sicherheit ist kosteneffizienter
Die Verwendung eines mehrschichtigen Ansatzes vereinfacht die Implementierung der einzelnen Clustersicherheitsfunktionen erheblich, während das Zugriffsmanagement auf einer differenzierteren Ebene ermöglicht wird.
Keine Abhängigkeit von einem Anbieter
Cluster werden aktiviert, um den Anforderungen von Prozessen gerecht zu werden und die Prozesse sozusagen zu zwingen, sich an ein einzelnes Softwarepaket/eine einzelne Version anzupassen. Mehrere verschiedene Softwareversionen können in verschiedenen Clustern ausgeführt werden.
Analytics Engine – Versionen
IBM Analytics Engine
Flexibles Framework für die Entwicklung von Hadoop- und Spark-Analyseanwendungen