V1.0.10.0 发行说明(2018 年 7 月)

IIAS V1.0.10.0 中的新增功能包括若干主页窗口小部件上的基线测量、备份和复原操作的改进,以及基于文件系统的新灾难恢复解决方案。

您还可以访问 IBM 产品开发的以下博客,以查看最新发行版详细信息:IBM Integrated Analytics System 1.0.10.0

新增内容

Web 控制台

  • 现在,某些个性化主页窗口小部件上提供了基线。基线显示典型的范围供您比较。它会显示过去 4 周同一时间段内数据样本的一系列 MEAN +/- 1 标准差。请注意,仅当服务器有足够的历史数据来构建基线时,基线才可用。在下列窗口小部件中提供了基线:
    • 数据库吞吐量
    • 数据库争用
    • 数据库响应能力
    有关个性化主页的更多信息,请参阅控制台主页个性化
  • 对于某些警报类型,可以为“回拨”警报设置的操作类型受限。例如,无法针对信息事件来提交 PMR。任何以不受支持的操作更改警报规则的请求都会返回错误消息。
  • 在 Web 控制台上会启用单点登录,可以访问其他应用程序,例如 DSX 和 Spark。您不再需要登录这些应用程序,即可从 IIAS Web 控制台访问它们。

备份、复原和灾难恢复

  • IBM Integrated Analytics System 现在支持使用通过 SAN 连接到所有节点的磁盘池以及插线板设置,在单机架系统上进行 IBM Spectrum Protect 集成,以执行不依赖于 LAN 的备份和复原操作。有关安装和配置的更多信息,请联系支持机构。

    您还可以阅读配置 IBM Spectrum Protect 客户机以执行不依赖于 LAN 的备份配置 IBM Spectrum Protect 服务器以执行不依赖于 LAN 的备份

  • 现在,平台级别的备份支持备份两个新组件的配置:
    • Web控制台容器:
      host_backup --webconsole
    • 系统历史记录文件:
      host_backup --systemhistory
  • 现在,EMC NetWorker 客户可以使用新脚本 emc_client,该脚本允许您在升级前备份配置,然后在升级完成后复原配置。有关此命令的更多信息,请参阅备份和复原 EMC NetWorker 配置
  • 已添加一项检查,以确保在运行备份或复原操作之前,已正确安装并配置所有的 EMC NetWorker 客户机 NMDA RPM。
  • 已添加一项检查,以确保在使用 EMC NetWorker 运行备份或复原之前,正确设置 LOGARCHMETH2 和 LOGARCHOPT2 的 Db2 配置参数。
  • db_backup 现在还支持备份至 /dev/null,以便使数据库从备份暂挂状态恢复为正常状态。
  • 对于 db_backup,已添加下列备份路径验证:
    • 只允许将 /scratch 用于本地/文件系统备份,并且会显示警告以指出 /scratch 的空间有限,建议设置 SAN 或 NFS 以用于备份。
    • 检查给定的备份路径是否在所有节点之间共享。
  • IIAS 现在支持通过集成式“IBM Spectrum Scale 活动文件管理”解决方案进行主动/被动灾难恢复。该解决方案支持按预定时间间隔对活动的主服务器执行基于文件的快照,以传输到被动的辅助服务器,这样发生灾难性事件时就可以进行故障转移。有关更多信息,请参阅基于文件系统的灾难恢复解决方案

存储器

storage_setup 脚本现在有新的参数,支持将 SAN 存储器从一个系统移至另一个系统,以及在多 HA 域中配置 SAN。有关更多信息,请参阅使用 storage_setup 脚本管理外部存储器

平台管理

  • apstop 命令现在会检查 Db2 备份或复原操作是否在进行中。如果在进行中,那么此命令就会退出,并返回错误消息。如果您一定要停止软件并中断备份操作,您可在指定 --ignore-backup 参数的情况下,重新运行 apstop 命令。没有用于忽略复原操作的等同参数。您必须等待复原操作完成,再使用 apstop 命令。
  • 现在,每当 Db2 崩溃时,就会发送原因码为 152 的新事件。在该事件中,将会递送首次发生数据捕获 (FODC) 诊断数据。

安全性

Web 控制台的单点登录
名为 apjwtservice 的新系统服务在 IIAS 的主节点上运行。在内部,此服务用于支持以单点登录方式,登录到 IIAS 中部署的 DSX 和 Spark 服务。

组件

IBM Integrated Analytics System V1.0.10.0 包括下列组件:

已解决的问题

在此发行版中,已解决下列问题:
  • 在连接有分层存储器的设备上,ap fs 命令无法显示有关文件系统装载的信息。此故障与 Platform Manager REST 中处理请求时发生的超时相关。
  • 当 ReadTimeout 导致 Docker 服务通信中断时,Platform Manager 中的 Docker 监视会失败,即使只有一个节点的通信中断也是如此。修正后,仅对于给定的节点,监视才会失败。
  • 由于不正确地处理某些 SMTP 错误,Platform Manager 会不必要地排队并重复失败的请求以便发送警报电子邮件通知。修正 SMTP 服务或网络的 SMTP 错误后,就会交付旧警报,即使在几天之后也是如此。
  • 因为在 Platform Manager 中生成访问令牌时的错误,Web 控制台会失去监视数据访问权。该问题会导致 Web 控制台的某些面板未显示平台管理数据。
  • 已修正在正确装载 GPFS 文件系统之前启动容器的平台管理问题,该问题会导致 Db2 启动失败。
  • 已修正 db_backupdb_restore,以便在运行脱机备份和所有复原之前,阻止所有的远程和本地非管理连接。错误处理机制已得到增强,可以在发生故障时重新启动后备连接。

要获取自发行版 1.0.6.0 以来所有已解决问题的累积自述文件,请参阅已修正的问题的累积自述文件

已知问题

升级可能会引起“关闭”系统状态
在升级期间,启动设备软件栈的 apstart 命令可能会因为瞬时资源问题,引起“关闭”系统状态。
变通方法:
  1. 使用以下命令确认存在问题:grep 'Unmounting file systems' /var/adm/ras/mmfs.log.latest
  2. 要恢复系统,请使用 apstop 停止设备软件栈,接着使用 apstart 重新启动。
完成升级 apupgrade 组件后,升级可能会退出
完成 apupgrade 程序本身的升级之后,尝试重新启动时,过程可能会因未知错误而退出。
变通方法:
如果升级过程退出,并且您在升级日志末尾看到以下消息:
Finished the upgrade of apupgrade component. Restarting the upgrade process using the latest apupgrade
接着立即看到以下消息:
Unhandled error when attempting upgrade
请使用您先前使用的同一 apupgrade 命令重新启动升级,它将继续执行。
由于 Web 控制台容器问题,IIAS 未能从故障转移恢复
可能会发生与 Web 控制台容器相关的问题,这会因为禁用 DSM 连接的尝试失败,导致 IIAS 停留在 RECOVERING 状态的时间超过正常情况。
要确认已发生此问题:
  1. 通过运行 ap node -d,找到当前主节点。
  2. 运行以下命令:
    grep -rn 'Could not enable dsserver blackout' /var/log/appliance/application/ha/current_master_node/log/ha.log
    如果 grep 功能在恢复开始的时间前后返回肯定结果,那么表明您已遇到这个已知问题。
变通方法:
运行以下命令:
ap apps disable webconsole
ap apps enable webconsole
切换到 Active Directory 后无法访问数据库
切换到 Active Directory 后,用户可能无法从 Web 控制台和后端连接到数据库。登录控制台之后,返回以下错误:
无法成功完成数据库连接,因为用于该连接的凭证不正确。如果此问题持久存在,请与 IBM 支持机构联系
变通方法:
要在切换到 Active Directory 之后访问数据库,请运行 apstopapstart 命令。可以从 Web 控制台和后端完成数据库连接。
在多次设置灾难恢复之后,Db2 Warehouse 无法启动
设置灾难恢复时,如果首次运行 apdr setup 命令成功,请不要再次运行该命令。否则,在运行任何数据库操作之前,必须完成下列步骤:
  • 以 root 用户身份登录(请与 IBM 支持机构联系)
  • 通过运行以下命令,检查是否已正确设置文件集:
    /usr/lpp/mmfs/mmfileset head keystone
  • 如果它指向:
    /opt/ibm/appliance/storage/head/home/db2inst1/db2/keystore.orig
    然后,运行以下命令:
    mv /opt/ibm/appliance/storage/head/home/db2inst1/db2/keystore.orig /opt/ibm/appliance/storage/head/home/db2inst1/db2/keystore
在快照作业失败后,Db2 Warehouse 未恢复 WRITE
在灾难恢复环境中,如果在主节点上运行的数据库应用程序长时间暂挂,那么数据库可能会处于 WRITE-SUSPEND 方式,并且永远不会恢复为 WRITE-RESUME 方式。
变通方法:
通过运行 apdr status -primary,检查数据库是否处于 WRITE-SUSPEND 方式。如果处于该方式,请以 root 用户身份登录(请与 IBM 支持机构联系),并运行以下命令:
docker exec -it dashDB write-resume
rm -f /opt/ibm/appliance/storage/platform/afm-dr/config/.db_in_ws_mode
从 1.0.7 和更低版本升级因降级错误而失败
尝试从 V1.0.7 和更低版本升级到 V1.0.10 和更高版本时,升级会退出并返回以下错误:
此软件当前不支持降级。
变通方法:
在实际升级之前,必须手动升级 apupgrade 程序。
  1. 创建用于此发行版的升级目录(例如,/localrepo/1.0.10.0_release)并将发行版捆绑包移入其中之后,请使用 cd 命令切换到该目录,并运行以下命令将该捆绑包解压缩:
    tar -C EXTRACT -xzvf iias-1.0.10.0_release.tar.gz
  2. 通过运行以下命令,安装对应于此发行版的 apupgrade RPM
    rpm -Uvh EXTRACT/bundle/app_img/apupgrade/apupgrade-1.0.10.0-SNAPSHOT-master-noarch.rpm
  3. 继续执行升级过程。