Daten optimal nutzen und neue geschäftliche Einblicke gewinnen

IBM Cloud® Object Storage ermöglicht es Unternehmen, ein zentrales Datenrepository zu erstellen, um kosteneffiziente und skalierbare Speicher zu nutzen, welche die Erfassung und Speicherung nahezu unbegrenzte Mengen von Daten aller Art, aus beliebigen Quellen gestatten. Daten bleiben in ihrem nativen Format und müssen nicht in und aus IBM Cloud Object Storage verschoben werden. Vielmehr bildet der IBM Cloud Object Storage-basierte Data-Lake den persistenten Datenspeicher für die Analyse.

IBM Cloud Object Storage ist in IBM Analytics Engine, IBM Watson® Studio, IBM Cloud SQL Query und andere IBM Cloud-Services integriert. Somit stehen Self-Service-Datenanalyse- und Business-Intelligence-Lösungen bereit, die weit über die Skalierbarkeit, Sicherheit und Kosteneffizienz traditioneller Lösungen hinausgehen.

Gängige Anwendungsfälle

Daten aus HDFS-Clustern in IBM Cloud Object Storage verschieben

Geben Sie mehr Speicherplatz auf teuren Hadoop-Clustern frei, indem Sie große Datenmengen auf effiziente Weise von Hadoop auf IBM Cloud Object Storage migrieren.

Abfrage der vorhandenen Daten

Nutzen Sie diesen Speicherbereich als aktiven Arbeitsbereich für verschiedene Big-Data-Analysen mit Query-in-Place-Funktionalität. So können Sie Analysen direkt für Ihre ruhenden Daten ausführen.

Ausführung von Apache Spark Analytics direkt mit Daten aus dem Objektspeicher

Verwenden Sie diese Option als kostengünstige, skalierbare, persistente Speicherschicht für Analysezwecke mit optimaler Verbindung zu Apache Spark.

Daten für KI-Trainingsmodelle speichern

Beschleunigen Sie die für die KI-Einbindung in Ihr Unternehmen erforderlichen Machine-Learning- und Deep-Learning-Abläufe. Erstellen und trainieren Sie KI-Modelle und erstellen und analysieren Sie Daten in einer einzigen, integrierten Umgebung.

IoT-Pipelines erstellen und analysieren

Speichern Sie große Mengen an IoT-Daten zu niedrigen Kosten und ermöglichen Sie Analyse-Frameworks den direkten Zugriff auf die Daten. Datenpipelines können ohne großen Aufwand konfiguriert und verwaltet werden, um für die Analyse bereite Daten zu generieren.

Wichtige Leistungsmerkmale

Einfaches Verschieben von Daten aus HDFS-Clustern in IBM Cloud Object Storage

Geben Sie Speicherplatz auf teuren Hadoop-Clustern frei, indem Sie IBM Big Replicate verwenden, um Daten effizient zwischen Hadoop-Daten-Clustern auf IBM Cloud Object Storage zu verschieben und so eine kontinuierliche Replikation mit garantierter Datenkonsistenz sicherzustellen. Sie können auch IBM Cloud Object Storage Distributed Copy (DistCp) verwenden, ein Open-Source-Tool für die Migration großer Datenmengen von Hadoop zu IBM Cloud Object Storage.

Abfrage der vorhandenen Daten

IBM Cloud SQL Query ist ein vollständig verwalteter Dienst, mit dem Entwickler Daten, die über mehrere Dateien in unterschiedlichen Formaten gespeichert sind, mithilfe von ANSI SQL-Anweisungen analysieren und transformieren können. Der Service kann Abfragen über CSV-, Parquet-, JSON- und ORC-Dateien durchführen, die in IBM Cloud Object Storage gespeichert sind, ohne dass Daten zuvor verschoben oder umgewandelt werden müssen. IBM Cloud SQL Query verwendet Apache Spark, eine schnelle, erweiterbare, speicherinterne Open-Source-Datenverarbeitungs-Engine, die für die Ad-hoc-Analyse von Daten mit geringer Latenz optimiert ist.

Apache Spark-Analysen ausführen

IBM Cloud Object Storage bietet optimierte Konnektivität zu Apache Spark-Services, um Daten aus verschiedenen Quellen zu speichern und schnell Einblicke zu gewinnen. Durch die Verwendung von IBM Cloud Object Storage mit Spark-Analysen können die Rechen- und Speicherebenen vollständig entkoppelt werden, sodass Benutzer Daten in einer Objektspeicherschicht speichern und Cluster von Rechenknoten genau dann hochfahren können, wenn Bedarf besteht. Mit diesem Modell können Berechnung und Speicherung unabhängig voneinander skaliert und gekauft werden, sodass die Berechnungskosten auf Null sinken, wenn keine Jobs laufen. Die Erkenntnisse bleiben in IBM Cloud Object Storage erhalten, und die Daten können für zukünftige Analysen erneut eingespeist werden.

Speichern von Daten für Watson-basierte Machine-Learning- und Deep-Learning-Workflows

IBM Watson Studio ist eine hybride Cloud-Plattform, die auf leistungsfähigen Open-Source- und IBM Tools aufbaut, um Daten zu analysieren und zur Erstellung und Bereitstellung von KI-Modellen zu nutzen. IBM Cloud Object Storage ist in IBM Watson Studio in IBM Cloud integriert. Beim Erstellen eines Projekts für maschinelles Lernen in IBM Watson Studio wird automatisch eine Instanz von IBM Cloud Object Storage erstellt, um die Handhabung der Daten zu beschleunigen, die für das Training und die Bereitstellung von Modellen erforderlich sind.

Intelligente Datenerkennung und -governance ausführen

Sobald sich Ihre Daten im IBM Cloud Object Storage befinden, können sie mit dem IBM Watson Knowledge Catalog verwaltet werden. Dabei werden Daten-Profiler verwendet, die Daten segmentieren und schützen und so eine bessere Verwaltung ermöglichen. Durch die Implementierung eines Metadatenkatalogs verfügt IBM Watson Knowledge Catalog über ein grundlegendes Verständnis dessen, was die Daten sind und welche Richtlinien zur Anwendung kommen, und setzt diese dann um. IBM Watson Knowledge Catalog umfasst eine intelligente Datenermittlung und ist in IBM Watson Studio integriert, um einen nahtlosen Übergang vom „Auffinden“ zur „Nutzung“ der Informationen in Ihrem Unternehmen zu ermöglichen.

Einfaches Erstellen und Analysieren von IoT-Datenpipelines

Object Storage ist für die Speicherung großer Mengen von IoT-Daten zu niedrigen Kosten konzipiert und ermöglicht Analyseframeworks den direkten Zugriff auf diese Daten. IBM Cloud stellt Services auf Basis von Apache Kafka und Apache Spark bereit. Hierzu gehören auch IBM Event Streams bzw. Spark as a Service. Datenpipelines von IBM Event Streams zum Objektspeicher können leicht eingerichtet und verwaltet werden, um analysebereite Daten zu generieren, die dann unmittelbar von IBM Watson mithilfe von Spark als Service analysiert werden können. Darüber hinaus kann die IBM Watson IoT-Plattform verwendet werden, um IoT-Gerätedaten zu erfassen und an IBM Event Streams zu senden.

Kundenreferenzen

Kosteneffektive, sichere und stets verfügbare Daten

Einfache Datenerfassung und -aufnahme

IBM bietet eine Vielzahl von Möglichkeiten, Ihre Daten in IBM Cloud Object Storage zu übertragen, einschließlich nativ integrierter Aspera®-Funktionen für die Hochgeschwindigkeitsdatenübertragung für den schnellen Datentransfer über das Netzwerk. Darüber hinaus erleichtern Services wie IBM Event Streams die Aufnahme von Daten in Echtzeit. Mit IBM Big Replicate können Daten effizient zwischen Hadoop-Datenclustern in IBM Cloud Object Storage verschoben werden. Somit ist eine kontinuierliche Replizierung sichergestellt. IBM Cloud Object Storage Distributed Copy (DistCp), ein Open-Source-Tool, kann für die Migration großer Datenmengen von Hadoop zu IBM Cloud Object Storage verwendet werden.

Kosteneffektiv und flexibel

IBM Cloud® Object Storage ermöglicht es Unternehmen, ein zentrales Datenrepository zu erstellen, um kosteneffiziente und skalierbare Speicher zu nutzen, welche die Erfassung und Speicherung nahezu unbegrenzte Mengen von Daten aller Art aus beliebigen Quellen gestatten. Daten werden in ihrem nativen Format gespeichert und erfordern im Vorfeld keine Transformationen.

Immer verfügbar

Mit IBM Cloud Object Storage können Datenwissenschaftler, Geschäftsanalysten und Anwendungsentwickler in Ihrem Unternehmen problemlos auf Daten zugreifen, deren Verfügbarkeit unübertroffen ist. Er ist auf eine Permanenz von 99,999999999%* ausgelegt, und die Verfügbarkeit wird durch eine patentierte Technologie gewährleistet, bei der die Daten verschlüsselt und auf mehrere Geräte in mehreren IBM Rechenzentren verteilt werden.

*Basiert auf IBM interner Analyse von Kundendaten. Einzelne Kundenergebnisse können davon abweichen.

Hohes
Maß an Sicherheit

IBM Cloud Object Storage sichert Daten mit automatischer serverseitiger Verschlüsselung und bietet Verschlüsselungsoptionen mit Schlüsseln, die vom IBM Key Protect Schlüsselverwaltungssystem verwaltet werden, oder Verschlüsselung mit Schlüsseln, die Sie selbst verwalten. Die Integration in IBM Identity und Access Management stellt differenzierte Zugriffskontrollen bis hin zur Datenbucketebene und je nach Benutzerrolle sicher.