Daten auflösen und neue geschäftliche Einblicke gewinnen

Da Unternehmen den digitalen Transformationsprozess beschleunigen wollen, müssen sie enorme Mengen an Daten analysieren und nutzen, die für eine effektive Entscheidungsfindung zur Verfügung stehen. Mithilfe cloudbasierter Analysen und skalierbarem, persistentem Cloudspeicher können Unternehmen ihre Daten auflösen und daraus neue geschäftliche Einblicke gewinnen. Mit IBM Cloud™ Object Storage können Unternehmen ein zentrales Datenrepository erstellen und hierfür leistungsfähigeren und skalierbareren Speicher nutzen. So können nahezu unbegrenzte Mengen an Daten eines beliebigen Typs aus verschiedenen Quellen erfasst und gespeichert werden. Die Daten verbleiben dabei in ihrem nativen Format und müssen nicht in und aus IBM Cloud Object Storage verschoben werden. Vielmehr ist der IBM Cloud Object Storage-basierte Data Lake der persistente Datenspeicher für die Analyse. IBM Cloud Object Storage ist in IBM Analytics Engine, IBM Watson® Studio, IBM Cloud SQL Query und andere IBM Cloud-Services integriert. Somit stehen Self-Service-Datenanalyse- und Business-Intelligence-Lösungen bereit, die weit über die Skalierbarkeit, Sicherheit und Kosteneffizienz traditioneller Lösungen hinausgehen.

Gängige Anwendungsfälle

Daten aus HDFS-Clustern in IBM Cloud Object Storage verschieben

Geben Sie mehr Speicherplatz auf teuren Hadoop-Clustern frei, indem Sie große Datenmengen auf effiziente Weise von Hadoop auf IBM Cloud Object Storage migrieren.

Abfrage der vorhandenen Daten

Nutzen Sie diesen Speicherbereich als aktiven Arbeitsbereich für verschiedene Big-Data-Analysen mit Query-in-Place-Funktionalität. So können Sie Analysen direkt für Ihre Daten ausführen.

Ausführung von Apache Spark Analytics direkt mit Daten aus dem Objektspeicher

Verwenden Sie diese Option als kostengünstige, skalierbare, persistente Speicherschicht für Analysezwecke mit optimaler Verbindung zu Apache Spark.

Daten für KI-Trainingsmodelle speichern

Beschleunigen Sie die für die KI-Einbindung in Ihr Unternehmen erforderlichen Machine-Learning- und Deep-Learning-Abläufe. Erstellen und trainieren Sie KI-Modelle und erstellen und analysieren Sie Daten in einer einzigen, integrierten Umgebung.

IoT-Pipelines erstellen und analysieren

Speichern Sie enorme Mengen an IoT-Daten zu niedrigen Kosten. Analyseframeworks können dabei direkt auf die Daten zugreifen. Datenpipelines können ohne großen Aufwand konfiguriert und verwaltet werden, um für die Analyse bereite Daten zu generieren.

Schlüsselfunktionen

Einfaches Verschieben von Daten aus HDFS-Clustern in IBM Cloud Object Storage

Geben Sie mehr Speicherplatz auf teuren Hadoop-Clustern frei, indem Sie mit IBM Big Replicate große Datenmengen auf effiziente Weise von Hadoop-Datenclustern auf IBM Cloud Object Storage verschieben. Somit stellen Sie eine kontinuierliche Replizierung mit garantierter Datenkonsistenz sicher. Sie können auch IBM Cloud Object Storage Distributed Copy (DistCp) verwenden, ein Open-Source-Tool für die Migration großer Datenmengen von Hadoop zu IBM Cloud Object Storage.

Abfrage der vorhandenen Daten

IBM Cloud SQL Query ist ein vollständig verwalteter Service, mit dem Entwickler Daten aus mehreren Dateien in mehreren Formaten mithilfe von ANSI-SQL-Anweisungen analysieren und transformieren können. Der Service kann Abfragen in CSV-, Parquet-, JSON- und ORC-Dateien ausführen, die in IBM Cloud Object Storage gespeichert sind, ohne dass Daten zuvor verschoben oder umgewandelt werden müssen. IBM Cloud SQL Query verwendet Apache Spark, eine schnelle, erweiterbare, speicherinterne Datenverarbeitungsengine, die für niedrige Latenzzeiten und die Ad-hoc-Analyse von Daten optimiert ist.

Apache Spark-Analysen ausführen

IBM Cloud Object Storage bietet optimierte Konnektivität zu Apache Spark-Services, um Daten aus mehreren Quellen zu speichern und daraus schnell Erkenntnisse zu gewinnen. Durch die Verwendung von IBM Cloud Object Storage mit Spark Analytics können die Berechnungs- und Speicherschichten vollständig entkoppelt werden. So können Benutzer Daten in einer Objektspeicherschicht speichern und Rechenknotencluster je nach Benutzeranforderung in Betrieb nehmen. Mit diesem Modell können Berechnungs- und Speicherschichten unabhängig voneinander skaliert (und gekauft) werden. So können die Kosten für die Berechnungsschicht nahezu vollständig eingespart werden, wenn keine Jobs ausgeführt werden. Gewonnene Erkenntnisse bleiben in IBM Cloud Object Storage bestehen. So können die Daten für zukünftige Analysen erneut eingepflegt werden.

Speichern von Daten für Watson-basierte Machine-Learning- und Deep-Learning-Workflows

Watson Studio ist eine Hybrid-Cloud-Plattform, die auf den besten Open-Source- und IBM Tools basiert, um Daten zu analysieren und sie zum Erstellen und Implementieren von KI-Modellen zu verwenden. IBM Cloud Object Storage ist in Watson Studio on IBM Cloud integriert. Wenn ein Machine-Learning-Projekt in Watson Studio erstellt wird, wird automatisch auch eine Instanz von IBM Cloud Object Storage erstellt, um die Verarbeitung der Daten zu beschleunigen, die für das Training und die Implementierung von Machine-Learning- und Deep-Learning-Modellen erforderlich sind.

Intelligente Datenerkennung und -governance ausführen

Sobald Ihre Daten in IBM Cloud Object Storage vorliegen, können sie mit Watson Knowledge Catalog verwaltet werden. Dabei werden Datenprofiler verwendet, um Daten zu segmentieren und zu schützen, sodass Daten wie personenbezogene Daten oder andere private Daten besser verwaltet werden können. Durch die Implementierung eines Metadatenkatalogs verfügt Watson Knowledge Catalog über ein grundlegendes Verständnis der Daten und der anwendbaren Datenrichtlinien. Anschließend werden diese Richtlinien implementiert. Watson Knowledge Catalog verfügt über eine intelligente Datenerkennung und ist in Watson Studio integriert. So wird ein nahtloser Übergang vom Auffinden (Finding) bis zum Verwenden (Using) der Informationen in Ihrem Unternehmen ermöglicht.

Einfaches Erstellen und Analysieren von IoT-Datenpipelines

Objektspeicher eignet sich perfekt für die kostengünstige Speicherung großer IoT-Datenmengen. Zudem können Analyseframeworks direkt auf die Daten zugreifen. IBM Cloud stellt Services auf Basis von Apache Kafka und Apache Spark bereit. Hierzu gehören auch IBM Events Streams bzw. Spark as a Service. Datenpipelines von IBM Event Streams zum Objektspeicher können ohne großen Aufwand konfiguriert und verwaltet werden, um für die Analyse bereite Daten zu generieren. Diese können dann direkt von Watson mithilfe von Spark as a Service analysiert werden. Darüber hinaus können über Watson IoT Platform IoT-Gerätedaten erfasst und an IBM Event Streams gesendet werden.

Kundenreferenzen

Kosteneffektive, sichere und stets verfügbare Daten

Einfache Datenerfassung und -aufnahme

IBM bietet verschiedene Möglichkeiten, um Ihre Daten in IBM Cloud Object Storage einzupflegen. Hierzu gehören nativ integrierte Aspera-Hochgeschwindigkeitsübertragungsfunktionen für die schnelle Datenübertragung über das Netzwerk. Darüber hinaus erleichtern Services wie IBM Event Streams die Aufnahme von Daten in Echtzeit. Mit IBM Big Replicate können Daten effizient zwischen Hadoop-Datenclustern in IBM Cloud Object Storage verschoben werden. Somit ist eine kontinuierliche Replizierung sichergestellt. IBM Cloud Object Storage Distributed Copy (DistCp), ein Open-Source-Tool, kann für die Migration großer Datenmengen von Hadoop zu IBM Cloud Object Storage verwendet werden.

Kosteneffektiv und flexibel

Mit IBM Cloud Object Storage können Unternehmen ein zentrales Datenrepository erstellen und hierfür leistungsfähigeren und skalierbareren Speicher nutzen. So können nahezu unbegrenzte Mengen an Daten eines beliebigen Typs aus verschiedenen Quellen erfasst und gespeichert werden. Daten werden in ihrem nativen Format gespeichert und erfordern im Vorfeld keine Transformationen.

Immer verfügbar

IBM Cloud Object Storage ist so aufgebaut, dass Data-Scientists, Geschäftsanalysten und Anwendungsentwickler unternehmensübergreifend ohne großen Aufwand und mit unerreicht hoher Verfügbarkeit auf Daten zugreifen können. Die Lösung wurde so konzipiert, dass sie eine Dauerhaftigkeit von 99,999999999 % bietet. Die hohe Verfügbarkeit wird durch eine patentierte Technologie gewährleistet, bei der Daten über mehrere Geräte in mehreren IBM Rechenzentrumeinrichtungen verschlüsselt und verteilt werden.

Hohes
Maß an Sicherheit

IBM Cloud Object Storage sichert Daten mithilfe der automatischen serverseitigen Verschlüsselung und bietet zudem Verschlüsselungsoptionen mit Schlüsseln, die von IBM Key Protect (Schlüsselverwaltungssystem) verwaltet werden. Es ist auch eine Verschlüsselung mit Schlüsseln möglich, die Sie verwalten. Die Integration in IBM Identity und Access Management stellt differenzierte Zugriffskontrollen bis hin zur Datenbucketebene und je nach Benutzerrolle sicher.