HDFS via Execution Engine for Hadoop 接続
HDFS via Execution Engine for Hadoopの接続アセットを作成できます。
Hadoop クラスタ内の Hadoop 分散ファイル・システム ( HDFS ) のデータにアクセスするには、 HDFS via Execution Engine for Hadoop 接続を使用します。
前提条件
- 管理者は、 Hadoop 「実行エンジン」 パネルから Hadoop クラスターを登録する必要があります。 URL を管理者にお尋ねください。
- Hadoop、プロジェクト内に環境ランタイム定義を作成する必要があります。
- SSL URL との接続に関連付けられた証明書
サポートされる暗号
- SSL 証明書
- この接続では、Kerberos によって保護されている Hadoop 環境への接続がサポートされます。
Kerberos 認証の前提条件
Kerberos 認証を使用する場合は、以下の要件を満たしてください:
- Kerberos認証用にデータ・ソースを構成します。 オプション:この接続は、Kerberos SSO with user impersonation をサポートしています。
- 接続を使用する予定のサービスがKerberosをサポートしていることを確認してください。 詳細はCloud Pak for DataでのKerberos認証を参照。
資格情報
プラット・フォームのログイン認証情報
Hadoop クラスターへの HDFS via Execution Engine for Hadoop 接続を作成します。
あなたのプロジェクトから、資産タブをクリックして新しいアセット > データソースへの接続。
HDFS via Execution Engine for Hadoopを選択します。
名前と説明、接続情報を入力します。
プラットフォームのログイン資格情報を選択します。
注: 他のユーザーが接続を使用するには、独自の Cloud Pak for Data 資格情報を指定する必要があります。HDFS へのアクセスには WebHDFS URL を入力する。
重要: WebHDFSの URLは、ターゲットHadoopシステムのHadoop登録詳細ページにあるURLと同じでなければなりません。 例:<URL>/webhdfs/v1. 管理者は、[Administration] > [Configuration and settings] > [HadoopExecution Engine] からURLを確認できます。SSL 証明書フィールドに、 管理 > 設定と構成 > Hadoop 実行エンジン の登録詳細にある接続先 URL ( URL と表示されるURL)用の SSL 証明書を入力してください。
「Create」をクリックします。
連邦情報処理標準 (FIPS) 準拠
この接続は、FIPS対応クラスタ(FIPS耐性)で使用できますが、FIPS準拠ではありません。
制限
SPSS Modeler の場合、データが存在する場合にのみ、この接続または HDFS via Execution Engine for Hadoop に接続されたデータ資産データをエクスポートできます。 新しいデータ資産作成することはできません。
サポートされるファイル・タイプ
HDFS via Execution Engine for Hadoop 接続は、以下のファイル形式をサポートしています: CSV、区切り文字付きテキスト、JSON、Parquet。