IBM Analytics Engine は、コストを管理し、大規模な分析を実現するために、コンピューティング層とストレージ層を分離するサービスを Apache Spark 環境に提供します。IBM Analytics Engine を使用すると、二重目的ノードで形成された永続クラスターの代わりに、ユーザーが IBM Cloud Object Storage などのオブジェクト・ストレージ層にデータを保管し、必要に応じてコンピューティング・ノートのクラスターをスピンアップできるようになります。柔軟性とコストの予測可能性を高めるために、Apache Spark 環境では使用量ベースの消費を利用できます。
ジョブの実行中にのみインスタンスを使用する
使用した分だけ支払い
コンピューティングとストレージの分離によるリソースの最適化
より広範な Apache Spark エコシステムを備えた先駆的なデータ・サイエンス・ツールを備えた ODPi 準拠のスタック上に構築します。
アプリケーションの要件に基づいてクラスターを定義します。適切なソフトウェア・パック、バージョン、クラスターのサイズを選択します。必要な限り使用し、アプリケーションがジョブを終了したらすぐに削除します。
サードパーティーの分析ライブラリとパッケージ、および IBM 独自の機能拡張を使用してクラスターを構成します。機械学習などの IBM Cloud サービスからワークロードをデプロイします。
コンピューティング専用クラスターをオンデマンドでスピンアップします。クラスターにはデータが保存されないため、クラスターをアップグレードする必要はありません。
使用されていないコンピューティング・サイクルに対して追加コストを発生させることなく、オンデマンドでさらに多くの IBM Cloud Object Storage (またはその他のデータ・ストア) をプロビジョニングします。
ライブ需要に基づいてデータ・ノードを追加および削除することは、REST API を介して可能です。また、コンピューティング・クラスターにはデータが保存されないため、オーバーヘッド・コストは低いままです。
多層アプローチを使用すると、個々のクラスターのセキュリティ実装が大幅に簡素化され、より詳細なレベルでのアクセス管理が可能になります。
ジョブを単一のソフトウェア・パッケージ/バージョンに強制的に準拠させるのではなく、ジョブのニーズを満たすためにクラスターがスピンアップされます。複数の異なるバージョンのソフトウェアを異なるクラスターで実行できます。
Apache Spark を使用しているが、必要なリソースの量がわからない場合は、アプリの実行時にのみコンピューティング・リソースを消費するサーバーレス Spark インスタンスをプロビジョニングします。お支払いいただくのは使用した分のみです。
オープンなマルチクラウド・データとAIプラットフォームでデータを収集、整理、分析する。
AI アプリを促進するインテリジェントなデータと分析資産の検出、カタログ化、ガバナンス
高度なアナリティクス・アプリケーションを開発・展開するための環境を提供する複合サービスをご利用ください。