将 IBM Aspera 配置为数据传输工具

IBM Aspera 是一种数据传输工具,用于在高延迟网络中高效,基于策略地使用网络带宽。

关于本任务

Aspera 可用于在数据源和登台区域之间传输数据。 不支持使用 Aspera 在登台区域和执行主机之间传输数据。 在公共配置中,用于连接数据登台区域和执行主机的网络足够快,因此数据传输速度不是性能问题。 数据传输节点 (I/O 节点) 是 Aspera 客户机,用于启动所有文件传输。 外部数据存储库 (数据源和数据目标主机) 是 Aspera 服务器。 Aspera 使用 SSH 公用密钥进行非交互式认证。 有关如何生成和配置 SSH 密钥的信息,请参阅 Aspera 文档。

LSF 数据管理器可以使用任何支持非交互式命令行界面的数据传输工具。 数据传输工具由 lsf.datamanager 文件中的参数 FILE_TRANSFER_CMD 配置。 此参数的自变量必须是单个可执行命令。 不支持通过直接在参数中配置参数来传递命令参数。 使用与作业提交用户相同的用户帐户运行传输命令。

有关更多信息,请参阅 数据传输作业脚本接口

以下步骤显示如何为使用 IBM Aspera的数据管理器文件传输设置简单集成:

过程

  1. 编写传输脚本 (LSF_SERVERDIR/ascp_wrap.sh) ,以便 Aspera ascp 命令可以找到 SSH 凭证。 使脚本可执行 (chmod 755 ascp_wrap.sh)。
    #!/bin/sh 
    /usr/bin/ascp -i $HOME/.ssh/id_rsa “$@”
  2. 配置数据管理器以使用 ascp 命令。
    数据管理器不会扩展环境变量或 lsf.datamanager 配置参数,因此您必须显式指定 ascp_wrap.sh的完整路径。 编辑 LSF_ENVDIR/lsf.datamanager 并将参数 FILE_TRANSFER_CMD 添加到 Parameters 部分。
    Begin Parameters
    ADMINS = lsfadmin
    STAGING_AREA = /var/lib/staging
    CACHE_INPUT_GRACE_PERIOD = 1440
    CACHE_OUTPUT_GRACE_PERIOD = 180
    CACHE_PERMISSIONS = user
    QUERY_NTHREADS = 4
    REMOTE_CACHE_REFRESH_INTERVAL = 15
    FILE_TRANSFER_CMD = /usr/share/lsf/9.1/linux2.6-glibc2.3-x86_64/etc/ascp_wrap.sh
    End Parameters
    
  3. 重新启动数据管理器守护程序。
    bdata admin reconfig
  4. 使用 bdata showconf 命令确认配置更改是否生效。
    bdata showconf
    LSF data management configuration at Tue Feb  3 10:34:09 2015
            ADMINS = lsfadmin
            CACHE_INPUT_GRACE_PERIOD = 1440 (minutes)
            CACHE_OUTPUT_GRACE_PERIOD = 180 (minutes)
            CACHE_PERMISSIONS = user
            FILE_PROCESSING_NTHREADS = 0
            FILE_TRANSFER_CMD = /usr/share/lsf/9.1/linux2.6-glibc2.3-x86_64/etc/ascp_wrap.sh
            LSB_TIME_DMD = 0
            LSF_DATA_HOSTS = hostA
            LSF_DATA_PORT = 61729
            LSF_LOGDIR = /usr/share/lsf/log
            LSF_LOG_MASK = LOG_WARNING
            QUERY_NTHREADS = 4
            REMOTE_CACHE_REFRESH_INTERVAL = 15 (seconds)
            STAGING_AREA = /var/lib/staging