目次


IBM Db2 Warehouse(旧:IBM dashDB Local) FAQ

提案、導入時に際して、ご質問を頂く内容を項目をまとめました

Comments

はじめに

IBM Db2 Warehouse は、分析用に設計された Docker コンテナで提供される DWH ソフトウェアアプライアンスです。docker コンテナベースの SDE (Software Defined Environment) 環境として提供されるため、プライベートクラウドの物理、仮想環境へ迅速かつ簡易に配置でき、高速性と柔軟性に優れた次世代の分析ソリューションです。IBM Db2 Warehouse についてはこちらの Web サイトと概要資料もあわせて参照ください。本記事では IBM Db2 Warehouse に関してよく質問を受ける項目についての回答をまとめました。

1

Db2 Warehouse Family について教えてください。

Db2 Warehouse は、ワークロード(用途)に特化したデータベースをお届けします。オンライン・トランザクション向けであれ、分析用途向けであれ、お客様のニーズにあった目的別にデザインされた環境を提供します。分析用途向けには、管理不要のフル・マネージドのクラウド・DWH ソリューションだけではなく、プライベート・クラウドなど、ソフトウェア定義環境として最適化されたコンテナ・ベースの DWH ソフトウェアアプライアンス製品がラインナップされています。従来データウェアハウスの構築プロジェクトは、分析に求められるワークロードを適切に処理できるよう、DB ソフトウェア、OS、サーバー、ストレージを一からデザイン、構築することによって実現されてきました。ですが、大規模データの分析を行うデータウェアハウス環境において、システムを一から設計、構築することは難易度が高く、実現に想定以上の時間とコストを費やすといったことがありました。その課題を解決したソリューションがまさにデータウェアハウス・アプライアンスであり、現在も多くのお客様が DWH アプライアンスをデータ分析基盤として活用しています。しかしデータ分析に求められる要求のスピードはさらに加速しており、より簡単かつ短期時間で用意でき、LoB 主体で利用するセルフサービス型のデータ分析環境が求められる時代に直面しています。このような状況から、顧客はデータ分析基盤に求められる要件に応じて、オンプレミス、プライベートクラウド、パブリッククラウドを適切に選択し、自社に最適なデータ分析環境をハイブリッドで構築するようになってきています。そしてプライベートクラウド、パブリッククラウド向けのデータ分析基盤として新たな役割を満たす製品がまさに Db2 Warehouse ファミリーと言えます。

  • IBM Db2 Warehouse on Cloud フルマネージドで提供される管理者不要のデータウェアハウスサービス
  • IBM Db2 Warehouse – データ分析用に設計され Docker コンテナとして提供されるソフトウェア DWH アプライアンス
  • IBM Db2 on Cloud – フルマネージドで提供される管理者不要の OLTP 向けデータベースサービス

IBM Db2 Warehouse on Cloud と IBM Db2 Warehouse は分析系ワークロードをより高速に処理できるように最適化されたデザインを採用しています。この 2 つのソリューションは共通 SQL エンジンにより同一スキルセットで使用でき、SLA や要件に応じて適切な環境を柔軟に選択、連携、移行することが可能なハイブリッドデータウェアハウス環境を実現します。

2

IBM Db2 Warehouse の特長について教えてください。

IBM Db2 Warehouse はデータ分析用途に予め設計されたインメモリカラムナー DB として、エンタプライズデータウェアハウスから、データマートに至るまで幅広い分析ワークロードの要件をサポートします。Docker コンテナベースで提供され、物理、仮想環境のオンプレミス、プライベートクラウド、パブリッククラウド環境へ簡易かつ素早くプロビジョニングできます。SMP(シングルノード)環境から MPP(マルチノード)環境までスケーラビリティを持つと同時にコンテナ技術によって、柔軟に配置場所を移動させることできます。また従来ライセンス提供形態に加えて、月額ライセンス課金体系によりクラウドの柔軟性を持ちながら自社で管理、制御可能なデータ分析基盤をプライベートクラウド環境に構築できます。加えて IBM Db2 Warehouse コンテナには Spark 実行環境が予め構成されており、Db2 Warehouse と Spark 間でのソケット通信を使用した高速なデータ転送が可能です。IBM Db2 Warehouse は従来の RDB ベースでの構造化データ分析に加えて、Spark による強力な分析処理(機械学習、インタラクティブ分析処理、リアルタイム分析処理)を含めた統合データ分析環境として使用することが可能です。

3

Docker って何ですか。

Docker はソフトウェア実行環境をパッケージング化したコンテナ環境を提供します。コンテナ環境はソフトウェアやアプリケーションを実行するために必要なシステムライブラリ、ファイルシステムのセットが提供されます。Docker コンテナはソフトウェア実行環境と OS 環境の依存性を排除、分離させることで、コンテナ環境を柔軟に配布、移動させることを可能としています。

4

Docker と VMware の違いは何ですか。

VMware はハイパーバイザー型の仮想化技術としてハードウェア資源をエミュレーションして仮想マシンに割り当てることで仮想化を実現しています。VMware 上の仮想マシンは物理環境と同様に仮想マシンに対して必要な HW 資源の割当をおこない、OS を導入し、仮想マシン単位での運用管理が必要となります。対して Docker はアプリケーションやソフトウェア実行に必要となるシステムライブラリやプログラムコード、ファイルをパッケージングしたもので、その他のリソースはホスト OS 上で共有されたものを使用します。コンテナを使用するユーザーやアプリケーションからはホスト OS から独立した名前空間と作業スペースを提供することで、ホスト OS 環境とアプリケーション実行環境の分離を実現しています。そのためコンテナは仮想マシンと比較して非常に軽量かつ、ポータビリティに優れるという特長も持っています。

5

Docker を使用することで性能面の劣化はありますか。

Docker コンテナは一般的な仮想環境技術と異なり、名前空間(ネームスペース)と呼ばれる技術を利用し、コンテナと呼ぶ作業空間(ワークスペース)を提供することで、ホスト OS からソフトウェア実行環境の分離、独立性をもたらします。そのため性能面でのインパクトはありません。IBM ラボ環境における検証においてもその妥当性を確認しており、こちらにその内容を記載しています。

6

IBM Db2 Warehouse 評価版はどこから入手することができますか。

IBM Db2 Warehouse 評価版コンテナイメージは、Docker Hub より入手することが可能ですが、事前登録作業が必要となります。事前登録を含め、評価版導入にあたっては IBM Db2 Warehouse Web サイトにある評価版ガイドを参照の上、実施ください。

7

IBM Db2 Warehouse どのプラットフォームをサポートしますか。

IBM Db2 Warehouse は Docker Engine がサポートされる OS プラットフォームでサポートされます。X86 サーバー上の Linux、IBM Power Linux LE 上の Linux OS(2017/2 月時点 Tech Preview Ubuntu OS のみ。今後拡張予定)、Microsoft Windows, Apple Macintosh 上での稼動がサポートされています。IBM Db2 Warehouse 導入要件についてはこちらのマニュアルを参照ください。
Docker Engine がサポートされる Linux OS 種類については Docker 社のマニュアルを参照ください。(Install Docker Engine)

8

IBM Db2 Warehouse は仮想環境に導入できますか?

IBM Db2 Warehouse は VMware,KVM,Xen といった主要な仮想環境への導入をサポートしています。
IBM Db2 Warehouse 導入前提要件についてはこちらのマニュアルを参照ください。

9

IBM Db2 Warehouse をクラウド環境に導入することはサポートされますか。

IBM Db2 Warehouse はあらゆるクラウド環境での稼動がサポートされています。IBM Bluemix Infrastructure、AWS EC2、Microsoft Azure 上の仮想マシンもしくはベアメタルサーバーに導入された Docker Engine がサポートされる Linux OS であればサポートされます。IBM Db2 Warehouse 導入前提要件についてはこちらのマニュアルを参照ください。

10

IBM Db2 Warehouse MPP 環境は何ノードまで拡張できますか。

現在 2017年4月時点は、60ノード構成が最大となります。

11

IBM Db2 Warehouse 導入にどのくらいの時間がかかりますか。

IBM Db2 Warehouse は Docker コンテナ技術をベースにしており、セットアップ、インストールにかかる時間は 30 分もかかりません。導入にあたっては Docker run コマンドのみで全てのコンポーネントの導入とセットアップが完了し、直ぐに使用可能です。より短時間で効率的にセットアップでき、導入後のチューニングも不要のため、すぐに表作成、データロード作業に取り掛かれます。

12

IBM Db2 Warehouse コンテナには何が含まれていますか。

IBM Db2 Warehouse コンテナ中には IBM Db2 Warehouse Analytics DB Engine だけでなく、様々なコンポーネントが予めビルドインされています。DB パフォーマンスやクエリ実行履歴を監視でき、DB オブジェクト管理を行うことが可能な IBM Data Server manager、異種 RDB 間や Hadoop 間でデータフェデレーションを実現する FluidQuery、Netezza や Oracle DB との SQL、インタフェース互換機能、ユーザー管理をおこなうための LDAP サーバー、Apache Spark 実行環境と様々なコンポーネントが含まれており、これらは IBM Db2 Warehouse コンテナセットアップ後全て使用できるようになります。

13

IBM Db2 Warehouse 導入の際の前提条件を教えてください。

IBM Db2 Warehouse 導入前提条件はマニュアルの Db2 Warehouse Knowledge Center の IBM Db2 Warehouse prerequisites ページを参照ください。導入前提としてパッケージとして Docker Engine が必須となっています。その他、ストレージドライバーとして Device Mapper storage driver (device mapper) の導入も必要となります。MPP 構成の場合、POSIX 準拠のクラスターファイルシステムを選択する必要があり、Spectrum Scale (GPFS), GFS2, NFS, VxFS 等が選択できます。詳細については、Shared file systems for IBM Db2 Warehouse のページを参照してください。その他、IBM Db2 Warehouse の各コンポーネントが通信のために使用するポートがありますので、Firewall の設定を調整ください。

14

IBM Db2 Warehouse コンテナイメージを直接入手できますか。

使用される IBM Db2 Warehouse ホストが外部ネットワークに接続できず、Docker Hub へ接続できない場合、IBM Db2 Warehouse コンテナイメージを直接お渡しさせて頂く形を取らせて頂いております。そのような場合、まず IBM もしくは IBM ビジネスパートナー様へ直接ご連絡頂くか、こちらの問い合わせ窓口までご相談ください。

15

IBM Db2 Warehouse 評価版を製品版に変更可能ですか。

可能です。製品ライセンスを購入頂くと永続ライセンスのキーが提供され、適用頂くことでそのまま評価版ライセンスで使用していた環境を正式な製品ライセンスを適用した環境としてご利用頂けます。

16

IBM Db2 Warehouse におけるIBMサポート提供範囲を教えてください。

IBM 及び IBM Db2 Warehouse 提供パートナーは IBM Db2 Warehouse コンテナのサポートを提供します。Docker Engine 自体の保守サポートは含まれていませんので、Docker Engine 自体のサポートが必要な場合は、別途 Docker 社 もしくは他ベンダー様より商用のサポートサブスクリプション購入をご検討ください。

17

IBM Db2 Warehouse に Apache Spark はどのように統合されていますか。

IBM Db2 Warehouse は非常に強力なアナリティクスエンジンである Spark 実行環境が IBM Db2 Warehouse DB エンジンと密接に連携できるようコンテナ内で統合されています。IBM Db2 Warehouse コンテナは単なるリレーショナルなデータを分析する DWH 環境だけでなく、インタラクティブなデータ解析処理、機械学習、リアルタイムなストリーム処理、非構造化データの ETL 処理といった様々な分析処理をも実現できる統合分析プラットフォームとなっています。
IBM Db2 Warehouse コンテナ内に Spark が統合されることのメリットは導入と運用の簡易化と共有メモリを使用した Spark-DB 処理連携の高速化がポイントとして上げられます。
IBM Db2 Warehouse はコンテナをデプロイするだけでセットアップが完了しますが、これは同時に Spark アプリケーション稼動環境もセットアップされます。シングル及びマルチノード環境の Spark 稼動環境セットアップを素早く行うことができます。また IBM Db2 Warehouse コンテナで稼動する Spark アプリケーションは IBM Db2 Warehouse と共有メモリで高速なソケット通信可能なアーキテクチャのため、従来の JDBC 通信処理と比較して大規模データセットのやり取りを行う処理で、より優れたパフォーマンスのメリットを享受することができます。また IBM Db2 Warehouse の DB プロシージャより Spark アプリケーションを呼び出すことで、Spark によるマイニングアルゴリズムを実行でき、非構造化データに対する ETL 処理を Spark で実行させた結果セットを Db2 Warehouse 側に高速に書き出せたりと、様々な種類を単一プラットフォームで実現できるメリットがあります。IBM Db2 Warehouse と Spark 統合におけるメリットについてはこちらの動画で解説されていますので、参照ください。

Apache Sparkを統合したエンタープライズデータウェアハウス。IBM Db2 Warehouse(データウェアハウス)にSpark分析エンジンを統合することで、非構造化データの加工、分析処理と構造化データの分析処理を単一環境で実現
Apache Sparkを統合したエンタープライズデータウェアハウス。IBM Db2 Warehouse(データウェアハウス)にSpark分析エンジンを統合することで、非構造化データの加工、分析処理と構造化データの分析処理を単一環境で実現
18

IBM Db2 Warehouse で Spark を有効化、無効化する方法教えてください。

IBM Db2 Warehouse を初期導入した際には、標準で Spark は有効化されています。Spark で使用するメモリ量はコンテナが使用できるメモリ量に応じて初期メモリ割当量が決まります。IBM Db2 Warehouse コンテナ環境にて Spark を使用しない場合は、docker run コマンドにてコンテナ作成の際に、-e DISABLE_SPARK='YES’ を追加の上、コンテナ作成を実行すれば Spark 用に割当てメモリ領域が開放されます。

19

IBM Db2 Warehouse で Oracle 互換性モードを使用することはできますか。

可能です。Oracle 互換性モードの使用が IBM Db2 Warehouse ではサポートされています。Oracle DB から IBM Db2 Warehouse への移行の際に SQL やプロシージャの書換を最小限にして移行をおこなうことが可能です。Oracle 互換モードは標準では無効になっていますので、有効にする場合は、docker run コマンド実行時に -e ENABLE_ORACLE_COMPATIBILITY='NO' を追記の上、IBM Db2 Warehouse コンテナの作成を実施ください。

20

IBM Db2 Warehouse のバージョンはどこで確認できますか。

IBM Db2 Warehouse の最新バージョンのリリース状況はマニュアルサイトの What’s New サイトで確認することが可能です。自身が使用している IBM Db2 Warehouse のバージョン確認については、docker exec -it dashDB version コマンドにて確認することが可能です。(ホスト root ユーザーで実行が必要です。)


ダウンロード可能なリソース


関連トピック


コメント

コメントを登録するにはサインインあるいは登録してください。

static.content.url=http://www.ibm.com/developerworks/js/artrating/
SITE_ID=60
Zone=Information Management, ビジネス・アナリティクス
ArticleID=1042958
ArticleTitle=IBM Db2 Warehouse(旧:IBM dashDB Local) FAQ
publish-date=04122017