HDFS via Execution Engine for Hadoop 接続

HDFS via Execution Engine for Hadoopの接続アセットを作成できます。

Hadoop クラスタ内の Hadoop 分散ファイル・システム ( HDFS ) のデータにアクセスするには、 HDFS via Execution Engine for Hadoop 接続を使用します。

前提条件

サポートされる暗号

  • SSL 証明書
  • この接続では、Kerberos によって保護されている Hadoop 環境への接続がサポートされます。

Kerberos 認証の前提条件

Kerberos 認証を使用する場合は、以下の要件を満たしてください:

  • Kerberos認証用にデータ・ソースを構成します。 オプション:この接続は、Kerberos SSO with user impersonation をサポートしています。
  • 接続を使用する予定のサービスがKerberosをサポートしていることを確認してください。 詳細はCloud Pak for DataでのKerberos認証を参照。

資格情報

プラット・フォームのログイン認証情報

Hadoop クラスターへの HDFS via Execution Engine for Hadoop 接続を作成します。

  1. あなたのプロジェクトから、資産タブをクリックして新しいアセット > データソースへの接続

  2. HDFS via Execution Engine for Hadoopを選択します。

  3. 名前と説明、接続情報を入力します。

  4. プラットフォームのログイン資格情報を選択します。

    注: 他のユーザーが接続を使用するには、独自の Cloud Pak for Data 資格情報を指定する必要があります。
  5. HDFS へのアクセスには WebHDFS URL を入力する。

    重要: WebHDFSの URLは、ターゲットHadoopシステムのHadoop登録詳細ページにあるURLと同じでなければなりません。 例:<URL>/webhdfs/v1. 管理者は、[Administration] > [Configuration and settings] > [HadoopExecution Engine] からURLを確認できます。
  6. SSL 証明書フィールドに、 管理 > 設定と構成 > Hadoop 実行エンジン の登録詳細にある接続先 URL ( URL と表示されるURL)用の SSL 証明書を入力してください。

  7. 「Create」をクリックします。

連邦情報処理標準 (FIPS) 準拠

この接続は、FIPS対応クラスタ(FIPS耐性)で使用できますが、FIPS準拠ではありません。

制限

SPSS Modeler の場合、データが存在する場合にのみ、この接続または HDFS via Execution Engine for Hadoop に接続されたデータ資産データをエクスポートできます。 新しいデータ資産作成することはできません。

サポートされるファイル・タイプ

HDFS via Execution Engine for Hadoop 接続は、以下のファイル形式をサポートしています: CSV、区切り文字付きテキスト、JSON、Parquet。

詳細情報