概要

高性能なデータウェアハウス・ソリューションを提供

ビジネス・インテリジェンス・イニシアチブをサポートし、意思決定を加速するためには、さまざまな種類のソースから大量のデータを収集し分析するために最適化された柔軟な基盤が必要です。

IBMのデータウェアハウス・ソリューションは、オンプレミスとクラウドで、または統合アプライアンスとしてご利用いただけます。 より詳細で高速な分析のために機械学習とAIが組み込まれている上に、照会を合理化するための共通SQLエンジンも共有されています。 IBMの データウェアハウスは、ハイブリッドクラウドの導入環境をサポートする、IBM Cloud Pak for Dataプラットフォームでもご利用いただけます。

資料を読む: Forrester社は、Forrester Wave:分析のための データ管理、2020年第1四半期でIBMをリーダーに選出

IBMのデータウェアハウジングを使用する理由

ハイブリッド・マルチクラウド

マルチクラウド・アプローチによりベンダー・ロックインを回避します。 ハイブリッドクラウドのデータ・プラットフォームであるIBM Cloud Pak® for Data上で稼働します。

適応可能なスケーリング

 IBM Cloud®上のデータウェアハウス向けの柔軟な料金体系を使用して、ストレージとコンピュートを独立して拡張できます。 必要な機能のみ購入できます。

洞察の基盤

全社的にAIを運用化することによって、構造化データ、非構造化データ、地理空間データの完全な価値を実現します。

Vektis社

IBM Db2® Warehouse on Cloudがこの医療情報サービス・プロバイダーに、増大する顧客分析の需要に対応するために、必要に応じて拡張を行うための柔軟性と機能をどのように提供したか説明します。

参考情報

AIの力を利用

優れた洞察を得るために、どのように最新のデータとAIプラットフォームにより企業データが統一されるのか、IBMとSirius社のエキスパートが議論します。

ハイブリッド・データウェアハウスを使用して柔軟性を獲得

このレポートでは、トップ企業がハイブリッド・データウェアハウス・アーキテクチャーを使用する可能性が2倍近くである理由について述べます。

データの増大と複雑さをサポート

Aberdeen Group社が、データウェアハウス・ソリューションがデータの複雑さと不均衡に対応する方法について説明しています。

クラウドでNetezzaを利用

Netezzaは、IBM CloudとAWSで提供されます。

リソースのニーズにより的確に対応

IBM Db2 Warehouse Flex Oneは、1テラバイト未満のデータ容量にすぐれたサポートを発揮するクラウド・データベースです。

ベンダー・ロックインのストレスを軽減

フルマネージドの柔軟なIBM Db2 Warehouse on Cloud製品を、AWS上で利用できます。

データウェアハウスの詳細

データウェアハウスとは

データウェアハウスは、さまざまなソースから単一の中央データ・ストアにデータを集約して、分析、データ・マイニング、機械学習、AIをサポートするシステムです。 企業は、そのエンタープライズ・データウェアハウス(EDW)とも呼ばれる機能を利用することで、従来のリレーショナル・データベースでは処理できなかったペタバイト単位のデータに対する高度な分析を実行できます。 分析をさらに強化するために、可視化アプリケーションとビジネス・インテリジェンス・アプリケーションを追加できます。

データウェアハウス・システムは単なるストレージ以上のものです。 データ統合を可能にするデータ・パイプラインが構築されています。 パイプライン・インフラストラクチャーには、ETL(抽出、変換、ロード)または、ELT(抽出、ロード、変換)と呼ばれるプロセスが含まれています。 これらのプロセスでは、複数のソースから取得されるデータが収集、クレンジング、変換されます。 ETLプロセスでは、データは、IBM DataStageのようなデータ統合ソフトウェアを使用して、データウェアハウスにロードされる前に変換されます。 ELTプロセスでは、データはデータウェアハウスの中で変換されます。

データウェアハウス・プラットフォームの選択

今日の複雑な分析ワークロードには、多様なデータ・ソースとデータ・タイプが含まれます。 その範囲は、オンプレミス環境にある構造化トランザクション・データから、モノのインターネット(IoT)センサーやモバイル・デバイスから流入するクラウド内で生成される非構造化データにまで及びます。 最も影響力のある洞察を得るためには、ビジネス・アナリティクス・チームは、このデータをすべて統合する必要があります。 適切なデータウェアハウス・プラットフォームを選択するか、適切なソリューションの組み合わせを選択すると、結果を最適化できます。

クラウド・データウェアハウス
クラウド内で作成されたデータを分析するためには、クラウド・ベースのデータウェアハウスが最適である可能性があります。 データが保管されている場所で分析できるため、結果を迅速に得ることができ、複雑さを軽減できます。 また、クラウド・ソリューションの導入スピード、迅速な拡張、予算編成の柔軟性を利用できるようになります。

オンプレミスのデータウェアハウス

データが既にオンプレミスに存在する場合、または政府の規制によって州や国をまたぐデータの移動が制限される場合は、オンプレミスのデータウェアハウスが最適な選択となり得ます。 ここでも、データの保管場所でデータの分析効率を向上させ、大量のデータを別の環境に移動するコストを回避することができます。 また、分析の待ち時間を最小限に抑えながら、データをしっかりと制御することができます。

統合データウェアハウス・アプライアンス

ハードウェアとソフトウェアを組み合わせた統合アナリティクス・ソリューションは、従来の「ソフトウェア定義」データウェアハウスの運用管理の負担を最小限に抑えながら、高いパフォーマンスを実現できます。 これらのソリューションは、急速に増大するデータ・ボリュームと同様に、さまざまなデータ・ソースとデータ・タイプをサポートします。 最新のデータサイエンス・テクノロジー(機械学習やAIなど)を組み込んで、拡張分析イニシアチブをサポートすることもできます。

ハイブリッド環境

プラットフォームを組み合わせることでメリットを得る企業は少なくありません。 このアプローチを活用するための鍵は、ソリューションに共通基盤となるプラットフォームがあるようにすることです。 それがあれば、共通のSQLエンジン、組み込み分析機能、共通ツール、基礎となるデータ・ソフトウェアを共有することができます。

また、データの収集、編成、分析方法をモダナイズする、IBM Cloud Pak for DataのようなデータとAIの統合プラットフォームも検討の余地があります。 ハイブリッド・マルチクラウド導入環境をサポートするためにRed Hat® OpenShift® のオープンソース・プラットフォームを土台に構築されており、AIを使用してイノベーションを促進する目的で設計されたデータの管理、統合、分析の多数の機能の中にIBM Db2 Warehouseが含まれます。

データベース、データウェアハウス、データレイクの比較

さまざまなデータ・ストレージ・システムが、保管する必要のあるデータのタイプと量、また、データの使用方法に合わせて調整されます。

データベースは構造化データを格納しますが、格納可能なデータ量には制限があります。 これは主に高速照会やトランザクション処理に使用されます。

また、データウェアハウスにも構造化データが格納されますが、データウェアハウスは、複数のソースから取得した現行データと履歴データの両方をより多く格納することができます。 データは、運用データ分析に使用するために、スキーマに編成されます。

最後に、データレイクは大量の未加工データ(構造化データ、半構造化データ、非構造化データ)格納し、以前はアクセスできなかったデータをより詳細に分析できる可能性を提供しています。 データは、保管されるだけでスキーマに編成されません。 必要になるまで変換は行われません。 データレイクは通常、Apache Hadoopのようなビッグデータ分析プラットフォーム上で構築されます。

IBMのテクノロジー・パートナー

sparkflows社のロゴ
aginity社のロゴ
DAISource社のロゴ

使ってみる

データウェアハウス・ソリューションをご検討ください。