データレイクに求められる要件

データレイクは、巨大なデータ・レポジトリーであると考えられがちですが、ただ単にデータを蓄積するだけでは、使えないデータの沼地(データスワンプ)になってしまいます。データを整理・可視化し、いつでも統合・活用できる状態 = 澄み切った湖(データレイク)に整備しておくことで、データをビジネス資源として活用できるようになります。

データレイク概要図

利点

データ・ユーザーの強化
企業内のすべてのデータ・コンシューマーが、信頼性の高い、ビジネスにすぐに使用できるデータにセルフサービスでアクセスできるようにして、スマートなデータ駆動型の意思決定を行えるようにします。

 

増加するデータとコストの管理
データの増加に応じてデータレイクを拡張し、型や構造に関係なくデータをそのデータレイクに取り込めます。従来のストレージから離れることで、コストを節約できます。

データの準備と変換の迅速化
構造化データと非構造化データをデータレイクに移動することで、データの準備と変換に費やす時間とリソースを節約できます。そのため、ITチームが集中してイノベーションに取り組めるようになります。

データのセキュリティーとコンプライアンスの推進
データレイク内のデータをガバナンスすることで、ますます厳しくなる規制やコンプライアンスの要件を満たせるようにします。

俊敏性と価値創出までの時間の向上
確信に満ちた意思決定を迅速に行えるようにします。データ・ユーザーがデータにセルフサービスでアクセスできるようにし、探索的分析を実行して成果を強化します。

 

機能

データの取り込み
企業のデータは、複数のシステムやリポジトリーにまたがって保管されています。企業は、これらのシステムからリアルタイムのデータが継続的にデータレイクに流れ込むようにする必要があります。すべてのデータ・ソースから構造データと非構造データを取り込むことで、データレイク内のデータの鮮度を保ちます。

使ってみる

→ IBM InfoSphere DataStage

→ IBM InfoSphere Data Replication

→ IBM BigInsights BigIntegrate

→ IBM BigInsights BigReplicate

データの取り込みを表すアイコン

カタログ・データ
エンタープライズ・データ・カタログにより、すべての構造化および非構造化されたエンタープライズ情報資産の在庫管理が容易になります。インテリジェントなメタデータ・カタログを使用して、データをビジネス用語で定義し、データのリネージュを追跡し、データを視覚的に探索することで、データレイク内のデータを理解しやすくします。
始める

→ IBM InfoSphere Information Governance Catalog

→ インダストリー・モデル

→ IBM Watson Knowledge Catalog

カタログ・データを表すアイコン

データのガバナンス
ガバナンス・ポリシーにより、データの保全性と信頼性を保護します。クリーンなガバナンスされたデータレイクを構築することで、データのコンプライアンスを維持し、データをいつでも監査できる状態に保ちます。
始める

→ IBM InfoSphere Information Governance Catalog 

→ インダストリー・モデル

データ・ガバナンス機能を表すアイコン

データへのセルフサービス・アクセスの提供
データ・コンシューマーがデータレイクにセルフサービスでアクセスできなければ、データレイクの目的は果たされません。データサイエンティスト、データ・スチュワード、ガバナンス・チームやコンプライアンス・チームに信頼性の高い高品質のデータを提供して、彼らが企業の分析目標を達成できるようにします。IBMアナリティクス・ソリューションを使用することで、データレイク内のガバナンスされたデータをより使いやすくすることができます。
始める

→ IBM Watson Knowledge Catalog

→ IBM Cognos Analytics 

→ IBM Data Science

データへのセルフサービス・アクセスの提供の機能を表すアイコン

データレイク詳細資料

ガバナンスの効いたデータレイクとは

組織全体のデータ活用を促進する、ガバナンスの効いたデータレイクの要件を整理し、お客様のデータレイク構築をサポートします。

Information Server 製品カタログ

データ統合、データ品質、データ・ガバナンスの機能をオールインワンで提供し、データレイクの基礎を支える Information Serverの特長や製品情報をコンパクトにまとめてお届けします。

IBM データレイク・アーキテクチャーの解説

データに基づく意思決定を可能とするためにデータレイクに求められる要件と、それを実現する IBM データレイク・アーキテクチャーを詳細解説。

リソース

業界モデルと統合ガバナンスによるデータレイクのガバナンス
ビジネス用語とメタデータの管理が、ガバナンスされたデータレイクの成功に不可欠である理由について説明します。

 

道のりは続く: データレイクからデータ駆動型企業へ

データレイクからデータ駆動型企業へのINGの道のりについてご覧ください。

お客様向けご相談窓口

お客様ご相談窓口

初期費用やお客様の要件に合わせた構成についてもご相談可能です。
ビジネスでのデータ / AI 活用のご相談がございましたら、お気軽にお問い合わせください。