IBM Aspera 是一种数据传输工具,用于在高延迟网络中高效,基于策略地使用网络带宽。
关于本任务
Aspera 可用于在数据源和登台区域之间传输数据。 不支持使用 Aspera 在登台区域和执行主机之间传输数据。 在公共配置中,用于连接数据登台区域和执行主机的网络足够快,因此数据传输速度不是性能问题。 数据传输节点 (I/O 节点) 是 Aspera 客户机,用于启动所有文件传输。 外部数据存储库 (数据源和数据目标主机) 是 Aspera 服务器。 Aspera 使用 SSH 公用密钥进行非交互式认证。 有关如何生成和配置 SSH 密钥的信息,请参阅 Aspera 文档。
LSF 数据管理器可以使用任何支持非交互式命令行界面的数据传输工具。 数据传输工具由 lsf.datamanager 文件中的参数 FILE_TRANSFER_CMD 配置。 此参数的自变量必须是单个可执行命令。 不支持通过直接在参数中配置参数来传递命令参数。 使用与作业提交用户相同的用户帐户运行传输命令。
有关更多信息,请参阅 数据传输作业脚本接口。
以下步骤显示如何为使用 IBM Aspera的数据管理器文件传输设置简单集成:
过程
- 编写传输脚本 (LSF_SERVERDIR/ascp_wrap.sh) ,以便 Aspera ascp 命令可以找到 SSH 凭证。 使脚本可执行 (chmod 755 ascp_wrap.sh)。
#!/bin/sh
/usr/bin/ascp -i $HOME/.ssh/id_rsa “$@”
- 配置数据管理器以使用 ascp 命令。
数据管理器不会扩展环境变量或 lsf.datamanager 配置参数,因此您必须显式指定 ascp_wrap.sh的完整路径。 编辑 LSF_ENVDIR/lsf.datamanager 并将参数 FILE_TRANSFER_CMD 添加到 Parameters 部分。
Begin Parameters
ADMINS = lsfadmin
STAGING_AREA = /var/lib/staging
CACHE_INPUT_GRACE_PERIOD = 1440
CACHE_OUTPUT_GRACE_PERIOD = 180
CACHE_PERMISSIONS = user
QUERY_NTHREADS = 4
REMOTE_CACHE_REFRESH_INTERVAL = 15
FILE_TRANSFER_CMD = /usr/share/lsf/9.1/linux2.6-glibc2.3-x86_64/etc/ascp_wrap.sh
End Parameters
- 重新启动数据管理器守护程序。
- 使用 bdata showconf 命令确认配置更改是否生效。
bdata showconf
LSF data management configuration at Tue Feb 3 10:34:09 2015
ADMINS = lsfadmin
CACHE_INPUT_GRACE_PERIOD = 1440 (minutes)
CACHE_OUTPUT_GRACE_PERIOD = 180 (minutes)
CACHE_PERMISSIONS = user
FILE_PROCESSING_NTHREADS = 0
FILE_TRANSFER_CMD = /usr/share/lsf/9.1/linux2.6-glibc2.3-x86_64/etc/ascp_wrap.sh
LSB_TIME_DMD = 0
LSF_DATA_HOSTS = hostA
LSF_DATA_PORT = 61729
LSF_LOGDIR = /usr/share/lsf/log
LSF_LOG_MASK = LOG_WARNING
QUERY_NTHREADS = 4
REMOTE_CACHE_REFRESH_INTERVAL = 15 (seconds)
STAGING_AREA = /var/lib/staging