データの活用と、新しいビジネス上の洞察の展開

デジタル・トランスフォーメーションを目指す企業は、効果的な意思決定に向け、膨大な量のデータを分析して活用する必要があります。拡張性の高い永続クラウド・ストレージにデータを移行し分析して、ビジネスに関する新たな洞察を入手しましょう。

IBM Cloud Object Storageはコスト効率と拡張性の高いストレージです。IBM Cloud Object Storageを使用すると、組織は一元化されたデータ・リポジトリーを構築でき、あらゆるソースからあらゆるタイプのデータをほぼ無制限に収集・保管できます。データはネイティブ・フォーマットのままで保管され、IBM Cloud Object Storageから出し入れする必要はありません。IBM Cloud Object Storageを活用したデータレイクは分析用の永続データ・ストアです。
IBM Cloud Object Storageは、IBM Analytics Engine、IBM Watson Studio、IBM Cloud SQL Queryおよびその他のIBM Cloudサービスと統合され、セルフサービスのデータ分析とビジネス・インテリジェンスのソリューションを提供します。

一般的なユース・ケース

HDFSクラスターからIBM Cloud Object Storageへのデータの移行

HadoopからIBM Cloud Object Storageに大量のデータを効率的に移行することにより、高価なHadoopクラスターのスペースを解放します。

データを移動せずに分析可能

Query-in-place機能を備え、保存中のデータ上で直接分析が可能です。さまざまなビッグデータ分析を行うためのワークスペースとして使用できます。

オブジェクト・ストレージに保管されているデータに対して直接Apache Spark分析を実行

Apache Sparkへの接続が最適化された、分析のための低コストで拡張性の高い永続ストレージ層として使用します。

AIトレーニング・モデル用データの保管

お客様のビジネスにAIを取り入れるために必要な機械学習とディープ・ラーニングのワークフローの実現を支援します。AIモデルの構築とトレーニング、データの準備と分析を、1つの統合環境で行います。

IoTパイプラインの構築と分析

膨大な量のIoTデータを低コストで保管し、そのデータに直接アクセスして分析することができます。データ・パイプラインを簡単にセットアップして管理し、分析に対応したデータを生成できます。

主な機能

HDFSクラスターからIBM Cloud Object Storageへのデータの容易な移行

IBM Big Replicateを使用してHadoopデータ・クラスターからIBM Cloud Object Storageにデータを移行することで、高価なHadoopクラスターのスペースを解放し、データの一貫性が保証された継続的な複製を提供します。HadoopからIBM Cloud Object Storageへデータを移行するためのオープン・ソース・ツールであるIBM Cloud Object Storage Distributed Copy(DistCp)を使用することもできます。

データを移動せずに分析

IBM Cloud SQL Queryは、ANSI SQLステートメントを使用して、複数のフォーマットで複数のファイルにわたって保管されたデータを分析できるフル・マネージド・サービスです。このサービスは、事前にデータを移動したり変換したりする必要がなく、IBM Cloud Object Storageに保管されているCSV、Parquet、JSON、およびORCの各ファイルを照会することができます。IBM Cloud SQL Queryは、データの低遅延のアドホック分析用に最適化された、高速で拡張可能なオープン・ソースのメモリー内データ処理エンジンであるApache Sparkを使用します。

Apache Spark分析の実行

IBM Cloud Object StorageとSpark分析を使用することで、コンピュート層とストレージ層を完全に分離することができ、ユーザーはデータをオブジェクト・ストレージ層に保管して、必要な時にコンピュート・ノードのクラスターを展開することができます。このモデルを使用すると、コンピュートとストレージを独立して拡張(および購入)できるため、実行中のジョブがない場合にはコンピュートのコストをゼロにすることができます。引き出された結果はIBM Cloud Object Storageに保存され、将来の分析のためにデータを再取り込みすることができます。

Watson機械学習およびディープ・ラーニングのワークフロー用データの保管

Watson Studioは、オープン・ソースとIBMのツール上に構築されたハイブリッド・クラウド・プラットフォームであり、データを分析し、それを使用してAIモデルを構築して展開します。IBM Cloud Object Storageは、IBM Cloud上のWatson Studioと統合されます。Watson Studioで機械学習プロジェクトが作成されると、IBM Cloud Object Storageのインスタンスが自動的に作成され、機械学習およびディープ・ラーニングのモデルのトレーニングおよびデプロイに必要なデータの処理を実行します。

インテリジェントなデータ・ディスカバリーとデータ・ガバナンスの実行

データがIBM Cloud Object Storageにある場合、このデータをWatson Knowledge Catalogで管理できます。これにより、個人情報やその他のプライベート・データなどのデータをより適切に管理できるようになります。Watson Knowledge Catalogは、メタデータ・カタログを実装することにより、データの内容とそれに適用されるデータ・ポリシーを根本的に理解した上で、それらのポリシーを適用します。Watson Knowledge Catalogにはインテリジェントなデータ・ディスカバリーが組み込まれており、Watson Studioと統合されることで、ビジネス全体での情報の「検索」から「使用」へのシームレスな移行を実現します。

IoTデータ・パイプラインの容易な構築と分析

オブジェクト・ストレージは、大量のIoTデータを低コストで保管し、分析フレームワークがデータに直接アクセスできるようにするのに最適です。IBM Cloudは、Apache KafkaとApache Sparkに基づくサービスであるIBM Events StreamsおよびSpark as a Serviceを提供します。IBM Event Streamsからオブジェクト・ストレージへのデータ・パイプラインを簡単にセットアップして管理し、分析に対応したデータを生成することができます。生成されたデータはWatsonがSpark as a Serviceを使用して直接分析することができます。さらに、Watson IoT Platformを使用してIoTデバイスのデータを収集し、それをIBM Event Streamsに送信することができます。

導入事例

コスト効率の高い、安全で常に使用可能なデータ

容易なデータの取り込み

IBMは、データをIBM Cloud Object Storageに取り込むためのさまざまな方法を提供しています。例えば、ネットワークを介した高速データ転送のためのAspera高速データ転送機能がネイティブに統合されています。さらに、IBM Event Streamsなどのサービスが、リアルタイムでのデータの取り込みを容易にします。IBM Big Replicateは、Hadoopデータ・クラスターからIBM Cloud Object Storageに効率的にデータを移行し、継続的に複製を実行します。また、HadoopからIBM Cloud Object Storageに膨大な量のデータを移行するためには、オープン・ソース・ツールであるIBM Cloud Object Storage Distributed Copy(DistCp)を使用できます。

コスト効率と柔軟性

IBM Cloud Object Storageは拡張性が高く、組織は一元化されたデータ・リポジトリーを構築し、あらゆる場所からあらゆるタイプのデータをほぼ無限に収集、保管できます。データはネイティブ・フォーマットで保管され、事前に変換する必要はありません。

常に利用可能

IBM Cloud Object Storageは、99.999999999%(イレブン・ナイン)の耐久性を実現するように設計されています。データが暗号化されて複数のIBMデータセンター施設内の複数のデバイスに分散される特許取得済みのテクノロジーによって、可用性が確保されます。

高い安全性

IBM Cloud Object Storageは、サーバー側の自動暗号化を使用してデータを保護し、IBM Key Protect(鍵管理システム)が管理する鍵を使用した暗号化オプション、またはユーザーが管理する鍵を使用した暗号化を提供します。IBM Identity and Access Managementとの統合により、データ・バケット・レベルまで掘り下げ、ユーザーの役割に従って細分化されたアクセス制御を実現します。