Analytics Engineとは
IBM Analytics Engineは、計算層とストレージ層を分離するHadoopクラスターのアーキテクチャーを提供します。Analytics Engineを使用すると、2 重の目的を持つノードで形成される永続クラスターの代わりに、ユーザーはIBM Cloud Object Storageなどのオブジェクト・ストレージ層にデータを保管して、必要な時に計算ノードのクラスターを展開することができます。ストレージから計算を分離することで、ビッグデータ分析プラットフォームの柔軟性、拡張性、保守性を変革できます。 ホワイト・ペーパーを読む(英語, PDF, 280KB)
Analytics Engineの機能
オープンソースの機能を活用
幅広いApache HadoopおよびApache Sparkのエコシステムを備えた、先駆的なデータサイエンスのツールを使用して、ODPi準拠のスタックを構築します。
オンデマンドの展開と拡張
アプリケーションの要件に基づいてクラスターを定義できます。クラスターの適切なソフトウェア・パック、バージョン、サイズを選択できます。必要な期間だけご利用いただけますので、アプリケーションがジョブを完了し次第すぐに削除できます。
環境の構成
サード・パーティーの分析ライブラリーとパッケージを使用してクラスターを構成します。機械学習などのワークロードをIBM Cloudサービスから導入できます。
Analytics Engineの利点
計算とストレージがバインドされることがなくなる
計算のみを行うクラスターをオンデマンドで展開します。クラスターにはデータが保管されていないため、クラスターをアップグレードする必要はありません。
費用対効果に優れた入出力中心のクラスター
使用していない計算サイクルに余分なコストをかけることなく、追加のIBM Cloud Object Storage(またはその他のデータ・ストア)をオンデマンドでプロビジョンします。
クラスターがより柔軟である
REST APIを使用した実際の要求に基づくデータ・ノードの追加および削除が可能です。さらに、計算クラスターにデータを保管しないことで、オーバーヘッド・コストを低く抑えます。
セキュリティーが費用対効果に優れている
多層的なアプローチによって、より細かいレベルでアクセス管理ができるようになると同時に、個々のクラスターへのセキュリティー実装が大幅に簡素化されます。
ベンダー・ロックインが回避される
クラスターは、ジョブを1つのソフトウェアのパッケージやバージョンに強制的に適合させるのではなく、ジョブのニーズに応じて複数展開されます。複数の異なるバージョンのソフトウェアを別々のクラスターで実行できます。
Analytics Engineのバージョン
IBM Analytics Engine
HadoopおよびSparkの分析アプリケーションを開発するための柔軟な枠組みです。