データの解放と、新しいビジネス上の洞察の展開
IBM Cloud Object Storageはコスト効率と拡張性の高いストレージです。IBM Cloud Object Storageを使用すると、組織は一元化されたデータ・リポジトリーを構築でき、あらゆるソースからあらゆるタイプのデータをほぼ無制限に収集・保管できます。データはネイティブ・フォーマットのままで保管されます。IBM Cloud Object Storageを活用したデータレイクは分析用の永続データ・ストアです。
IBM Cloud Object Storageは、IBM Analytics Engine、IBM Watson Studio、IBM Cloud SQL Queryおよびその他のIBM Cloudサービスと統合され、セルフサービスのデータ分析とビジネス・インテリジェンスのソリューションを提供します。
一般的なユースケース
HDFSクラスターからIBM Cloud Object Storageへのデータの移行
HadoopからIBM Cloud Object Storageに大量のデータを効率的に移行することにより、高価なHadoopクラスターのスペースを解放します。
データを移動せずに照会
保存中のデータ上で直接分析を実行することを可能にするクエリー・インプレース機能を備えたさまざまなビッグデータ分析ユース・ケースのアクティブ・ワークスペースとして使用します。
オブジェクト・ストレージに保管されているデータに対して直接Apache Spark分析を実行
Apache Sparkへの接続が最適化された、分析のための低コストで拡張性の高い永続ストレージ層として使用します。
AIトレーニング・モデル用データの保管
お客様のビジネスにAIを取り入れるために必要な機械学習とディープ・ラーニングのワークフローを加速します。AIモデルの構築とトレーニングやデータの準備と分析を、1つの統合環境で行います。
IoTパイプラインの構築と分析
膨大な量のIoTデータを低コストで保管し、分析フレームワークがデータに直接アクセスできるようにします。データ・パイプラインを簡単にセットアップして管理し、分析に対応したデータを生成することができます。
主な機能
HDFSクラスターからIBM Cloud Object Storageへのデータの容易な移行
IBM Big Replicateを使用してHadoopデータ・クラスターからIBM Cloud Object Storageに効率的にデータを移行することで、高価なHadoopクラスターのスペースを解放し、データの一貫性が保証された継続的な複製を提供します。HadoopからIBM Cloud Object Storageへ膨大な量のデータを移行するためのオープンソース・ツールであるIBM Cloud Object Storage Distributed Copy(DistCp)を使用することもできます。
データを移動せずに照会
IBM Cloud SQL Queryは、ANSI SQLステートメントを使用して各種フォーマットの複数のファイルにわたって保管されたデータを開発者が分析および変換できる、フル・マネージド・サービスです。このサービスは、事前にデータを移動したり変換したりする必要がなく、IBM Cloud Object Storageに保管されているCSV、Parquet、JSON、およびORCの各ファイルを照会することができます。IBM Cloud SQL Queryは、データの低遅延のアドホック分析用に最適化された、高速で拡張可能なオープンソースのメモリー内データ処理エンジンであるApache Sparkを使用します。
Apache Spark分析の実行
IBM Cloud Object Storageは、Apache Sparkサービスへの最適化された接続を提供して、複数のソースからのデータを保管し、素早く洞察を獲得します。IBM Cloud Object StorageとSpark分析を使用することで、コンピュート層とストレージ層を完全に分離することができ、ユーザーはデータをオブジェクト・ストレージ層に保管して、必要な時にコンピュート・ノードのクラスターを展開することができます。このモデルを使用すると、コンピュートとストレージを独立して拡張したり購入したりできるため、実行中のジョブがない場合にはコンピュートのコストをゼロにすることができます。引き出された結果はIBM Cloud Object Storageに保持され、将来の分析のためにデータを再取り込みすることができます。
Watson機械学習およびディープ・ラーニングのワークフロー用データの保管
IBM Watson Studioは、オープンソースとIBMツールの長所を基盤に構築されたハイブリッドクラウド・プラットフォームであり、データを分析し、それを使用してAIモデルを構築して展開します。IBM Cloud Object Storageは、IBM Cloud上のIBM Watson Studioと統合されます。IBM Watson Studioで機械学習プロジェクトが作成されると、IBM Cloud Object Storageのインスタンスが自動的に作成され、機械学習およびディープ・ラーニングのモデルのトレーニングおよびデプロイに必要なデータの処理が加速されます。
インテリジェントなデータ・ディスカバリーとデータ・ガバナンスの実行
データがIBM Cloud Object Storageに置かれると、ガバナンスを向上するためにデータを分割して保護するデータ・プロファイラーを利用して、IBM Watson Knowledge Catalogでこのデータを管理できます。IBM Watson Knowledge Catalogは、メタデータ・カタログを実装することにより、データの内容とそれに適用されるポリシーを根本的に理解した上で、それらを適用します。IBM Watson Knowledge Catalogにはインテリジェントなデータ・ディスカバリーが組み込まれており、IBM Watson Studioと統合されることで、企業全体での情報の「検索」から「使用」へのシームレスな移行が実現します。
IoTデータ・パイプラインの容易な構築と分析
オブジェクト・ストレージは、大量のIoTデータを低コストで保管し、分析フレームワークがそれに直接アクセスできるようにするために設計されています。IBM Cloudは、Apache KafkaとApache Sparkに基づくサービスを提供しており、それぞれIBM Events StreamsおよびSpark as a Serviceなどがあります。IBM Event Streamsからオブジェクト・ストレージへのデータ・パイプラインを簡単にセットアップして管理し、分析に対応したデータを生成することができます。生成されたデータはIBM WatsonがSpark as a Serviceを使用して直接分析することができます。さらに、IBM Watson IoT Platformを使用してIoTデバイスのデータを収集し、IBM Event Streamsに送信することができます。
コスト効率の高い、安全で常に使用可能なデータ
容易なデータの収集と取り込み
IBMは、データをIBM Cloud Object Storageに取り込むためのさまざまな方法を提供しています。例えば、ネットワークを介した高速データ転送のためのAspera®高速データ転送機能がネイティブに統合されています。さらに、IBM Event Streamsなどのサービスが、リアルタイムでデータの取り込みを容易にします。IBM Big Replicateは、Hadoopデータ・クラスターからIBM Cloud Object Storageに効率的に移行し、継続的な複製を提供します。また、HadoopからIBM Cloud Object Storageに膨大な量のデータを移行するためには、オープンソース・ツールであるIBM Cloud Object Storage Distributed Copy(DistCp)を使用できます。
コスト効率と柔軟性
IBM Cloud Object Storageを使用すると、組織は一元化されたデータ・リポジトリーを構築し、あらゆるソースからあらゆるタイプのデータをほぼ無制限に収集・保管することを可能にするコスト効率と拡張性の高いストレージを活用できます。データはネイティブ・フォーマットで保管され、事前に変換する必要はありません。
常に利用可能
IBM Cloud Object Storageにより、組織全体のデータサイエンティスト、ビジネス・アナリスト、およびアプリケーション開発者は、事実上比類ない可用性で容易にデータにアクセスできます。99.999999999%の耐久性を実現するように設計されています*。データが暗号化されて複数のIBMデータセンター施設内の複数のデバイスに分散される特許取得済みのテクノロジーによって、可用性が確保されます。
*お客様データのIBM社内分析に基づきます。個々のお客様の結果は異なります。
高い安全性
IBM Cloud Object Storageは、サーバー側の自動暗号化を使用してデータを保護し、IBM Key Protect鍵管理システムが管理する鍵を使用した暗号化オプション、またはユーザーが管理する鍵を使用した暗号化を提供します。IBM Identity and Access Managementとの統合により、データ・バケット・レベルまで掘り下げ、ユーザーの役割に従って細分化されたアクセス制御が実現します。