用于在 Apache Hadoop 集群上安装服务的模板参数

安装Execution Engine for Apache Hadoop时,您需要创建一个 "/opt/ibm/dsxhi/conf/dsxhi_install.conf文件。 在创建以下模板文件时,您可以使用这些文件作为参考。

通过使用以下模板中的参数作为参考,创建 /opt/ibm/dsxhi/conf/dsxhi_install.conf 文件:

dsxhi_install.conf.template.CDH

属性 示例:
Mandatory 或 Optional
dsxhi_license_acceptance= dsxhi_license_acceptance=A
可选
指定 "A" 或 "a" 以接受许可证。
指定 "R" 或 "r" 以拒绝许可证。
如果该属性为空,那么在安装期间将提示用户。
dsxhi_serviceuser=dsxhi_serviceuser_group=
必需的
指定运行 dsxhi 服务的用户 (dsxhi 服务用户) 的用户名和组。
dsxhi_serviceuser_keytab=dsxhi_spnego_keytab=
如果 CDH 集群已进行内核化,那么必须为 dsxhi 服务用户和 spnego 密钥表指定密钥表的完整路径。
如果 CDH 集群未进行内核化,那么应将这些属性留空。
dsxhi_gateway_port= dsxhi_gateway_port=8443
必需
指定 dsxhi 网关服务的端口号。 应该可以从外部访问此端口。
dsxhi_rest_port= dsxhi_rest_port=8082
必需
指定 dsxhi rest 服务的端口号。
cluster_manager_url=cluster_admin=
cluster_manager_url=cluster_admin=admin(必填)请

http://cdhcluster1:7180
指定 Cloudera Manager 的 URL 以及 CDH 集群的管理员用户名。 安装期间系统会提示用户输入密码。 如果未指定 URL ,在安装 dsxhi 之前将不会执行某些预检查。
集群名称= 可选
指定 CDH 的集群名称 (如果使用单个 Cloudera Manager 配置了多个集群)。
exposed_hadoop_services= exposed_hadoop_services = webhdfs , livyspark 和 jeg
可选
指定 dsxhi 服务应公开的 Hadoop 服务。
is_spark2= is_spark2 = true
可选
将 spark2 设置为 true。 这将需要定制 py37。
existing_livyspark_url= existing
http://cdhcluster:8999
_livyspark_url=可选。如果 CDH 集群已配置了Spark的 Livy ,请指定 URL。
dsxhi_livyspark_port= dsxhi_livyspark_port=8999
必需
指定安装和配置 Livy for Spark 时 dsxhi 服务应使用的端口号。
dsxhi_jeg_port= dsxhi_jeg_port=8888
必需
指定 dsxhi JEG 服务的端口号。
known_dsx_list= known_dsx_list=https://dsxlcluster1.ibm.com,https://dsxlcluster2.ibm.com:31843
可选
指定注册此 dsxhi 服务的 dsx 本地集群的 URL 列表。 URL ()如有必要,应包含端口号。
package_installer_tool= 可选的
指定安装程序工具以安装受支持的软件包是 yum , rpm 和 dnf。 此选项应设置为使用 install_package 脚本。
systemctl_enable= systemctl_enable=False
可选
指定 Truetrue 以启用 systemctl dsxhi。
程序包 = packages=lappack
可选
指定要安装的软件包。 您可以在同一行中提供多个以逗号分隔的软件包,例如 package1,package2。 此选项应设置为使用 install_package 脚本。
集群节点 = 可选
指定要在其上安装软件包的 Hadoop 集群主机。 您可以在同一行上提供多个主机,并以逗号分隔,例如 host1,host2,host3。 如果设置了此选项,那么将在指定的主机上安装软件包,或者将在 Hadoop 集群的所有节点管理器主机上安装软件包。
cluster_ssh_user= 可选
通过使用 ssh 密钥并安装软件包来指定可以 ssh 到 Hadoop 集群的用户。 此选项应设置为使用 install_package 脚本。
cluster_ssh_key_path= 可选
指定用于 ssh 到 Hadoop 集群节点以安装软件包的 ssh 专用密钥或证书的路径。 应将此选项设置为使用 install_package 脚本,例如 /root/.ssh/id_rsa
hive_jdbc_client_url= hive_jdbc_client_url=jdbc:hive2://remotehost:port

(可选)提供客户端的 Hive JDBC URL。
custom_jks= 可选的
用户提供的定制 jks。 它可用于网关, JEG 和 Web Service。 如果提供了此文件,那么 dsxhi 将生成所需的 .crt 文件以添加到 Java 信任库。 如果未提供,那么 dsxhi 会生成 .jks 并连续生成 .crt 以添加到 Java 信任库。
dsxhi_cacert= 可选的
定制 CACERT 由用户提供。 如果未提供,那么 dsxhi 会尝试检测系统上的缺省 CACERT。
add_certs_to_truststore= add_certs_to_truststore=True
可选
允许 dsxhi 向信任库添加 certs 的选项。
True (缺省值): 允许 dsxhi 在检测到的数据节点上针对网关和 Web Service 将主机证书添加到 Java 信任库。
False: 期望用户在生成的 .crt 文件上使用缺省主机别名将主机证书添加到 Java 信任库。
is_hive_on_tez= is_hive_on_tez=false
可选
指定是否将 Hive 或 hive_on_tez 用于 HiveServer2。
False (缺省值): 将 hive 用于 HiverServer2。
True: 使用 hive_on_tez。
is_spectrum_scale= is_spectrum um_scale=false
可选
指定是否使用 Spectrum Scale Storage for HDFS。
False (缺省值): 使用常规 HDFS。
True: 使用 spectrum scale CES HDFS。