HDFS Parquet データ・ソースへのアクセスの構成

HDFS Parquet ファイルにアクセスするようにフェデレーテッド・サーバーを構成するには、アクセスする Hadoop ファイル・システムと Parquet ファイルの情報をフェデレーテッド・サーバーに提供しなければなりません。 Hadoop ファイル・システムの場合は、Namenode サーバーのアドレスとポートが必要です。

始める前に

  • restservicewrapper.jar ファイルとその従属関係が、フェデレーテッド・サーバーとして動作するサーバーにインストールされ、CLASSPATH に構成されていることを確認してください。 restservicewrapper.jar$INST_DIR/sqllib/federation/restservice/ パスにインストールする必要があります。
  • フェデレーションが、フェデレーテッド・サーバーとして機能するサーバー上にインストールされている必要があります。
  • フェデレーテッド・サーバーのセットアップを確認します。
  • フェデレーテッド・パラメーターをチェックして、フェデレーションが有効になっていることを確認します。
  • db2 構成の「JAVA_HEAP_SZ」を確認し、適切な値を設定します。

プロシージャー

  1. HDFSへのネットワーク接続をテストし HDFSが適切に起動していることを確認します。
  2. NoSQL を登録する。 オプションで、HDFS データ・ソースにアクセスするラッパーを登録します。 フェデレーテッド・サーバーは、ラッパーを使用してデータ・ソースとの通信やデータ・ソースからのデータの取得を行います。 ラッパーは、ライブラリー・ファイルのセットとしてインプリメントされます。
  3. HDFSのサーバー定義を登録します。 アクセスする HDFS データ・ソース・サーバーをフェデレーテッド・データベース内に登録する必要があります。
  4. HDFSのユーザーマッピングを作成します。 HDFS データ・ソースにアクセスしようとすると、フェデレーテッド・サーバーは、そのデータ・ソースにとって有効なユーザー ID とパスワードを使用して、Namenode サーバーへの接続を確立します。
  5. HDFSのニックネームを登録します。 登録する HDFS データ・ソース・サーバー定義ごとに、アクセスする各コレクションのニックネームを登録する必要があります。 HDFS サーバーを照会するときには、 データ・ソース・オブジェクトの名前ではなく、これらのニックネームを使用します。
  6. HDFSからクエリデータをテストします。 Parquet ファイルのニックネームを正常に登録したら、そのファイルのデータの照会をテストできます。