内容


AIX FAQ 第 4 期

PowerHA FAQ

Comments

什么是 PowerHA for AIX?它与 HACMP 有什么区别?

IBM PowerHA 是以前的 IBM High Availability Cluster Multiprocessing (HACMP) 产品的新名称。改名是为了让 HACMP 与新的 IBM Power Systems Software 计划保持一致。PowerHA for AIX V5.5 是 HACMP 5.4 的后续版本。

PowerHA 支持哪些硬件和软件?

由于支持列表过长,在这里不一一列出,请您访问下面的网址来查询 PowerHA 所支持的硬件和软件。

http://www-01.ibm.com/common/ssi/cgi-bin/ssialias?infotype=dd&subtype=sm&appname=pseries&htmlfid=897/ENUS5765-F62#SHeader_9

PowerHA 能够在不同的操作系统上工作吗?

可以。PowerHA与 AIX 操作系统和 System p 服务器紧密地集成,可以提供在其他操作系统和硬件组合上不可用的许多特性。PowerHA V5 支持 Power 服务器上的 Linux 操作系统。PowerHA for Linux 只支持在 AIX 上可用的一部分特性,但是这种多平台支持为整个企业提供一个通用的可用性基础结构,有助于保护您的投资并提供增长路径。Sales Manual 中列出了 PowerHA on Linux支持的所有硬件和软件。

在新的 System POWER6 处理器上支持 PowerHA 吗?

在 System POWER6 服务器上支持 PowerHA。PowerHA for AIX 嵌入了对 POWER6 系统上的动态 LPAR 的支持,但是需要安装额外的 APAR。

在哪些 AIX 级别上支持 PowerHA?

PowerHA 需要以下 AIX 级别之一:

  • AIX V5.2
  • AIX V5.3
  • AIX V6.1

PowerHA 将支持以后的 AIX 版本。PowerHA 和 AIX 可用的最新补丁请参见 TechSupport 网站

哪些应用程序可以使用 PowerHA?

所有流行的应用程序都可以使用 PowerHA,包括 DB2、Oracle、SAP、WebSphere 等等。PowerHA 提供 Smart Assist 代理,让用户能够快速轻松为特定的应用程序配置 PowerHA。PowerHA 包含灵活的配置参数,可以针对任何应用程序轻松地设置。

PowerHA 是否支持动态 LPAR、CUoD、On/Off CoD 或 CBU?

PowerHA 支持动态 Logical Partitioning、Capacity Upgrade on Demand、On/Off Capacity on Demand 和 Capacity Backup Upgrade。请参见公告 204-298105-056

为什么常常在硬件或软件发布之后才提供PowerHA 支持?

在宣布支持之前,要在 PowerHA 环境中测试所有新的硬件和软件。这是因为 PowerHA 以独特的高强度方式测试特性和接口,因此问题在 PowerHA 环境之外可能不会暴露出来。不能简单地假定新的硬件或软件能够正常工作,必须在实验室中安装并通过资格测试运行它们。有时候会发现问题,需要花时间解决问题,因此 PowerHA 无法在硬件发布的同时宣布支持。

PowerHA for Linux 支持可选特性 PowerHA/XD 和 PowerHA Smart Assist 吗?

目前还不支持。

如果已经安装了 PowerHA,现在怎么办?

在 PowerHA 能够管理您的应用程序并保持其高可用性之前,需要把您的集群和应用程序的相关信息告诉 PowerHA。这需要四个步骤:
步骤 1) 定义保持应用程序高可用性所用的节点

假定本地节点(配置 PowerHA 的节点)是集群节点之一,必须把组成集群的其他节点的名称告诉 PowerHA。只需输入每个节点的主机名或 IP 地址。

步骤 2) 定义希望保持高可用性的应用程序

需要告诉 PowerHA 关于应用程序的三项信息:

  • 名称 — 提供一个名称
  • 启动脚本 — 指定 PowerHA 用来启动此应用程序的脚本
  • 停止脚本 — 指定 PowerHA 用来停止此应用程序的脚本

步骤 3) 检查和同步集群

PowerHA 会发现连接到节点的所有网络和磁盘。检查步骤会确认集群配置能够保持应用程序的高可用性。如果成功,将把配置复制到集群中的其他节点。

步骤 4) 管理应用程序

在启动 PowerHA 时,它会开始管理应用程序并保持其高可用性。还可以使用 PowerHA 提供的维护设施在节点之间转移应用程序,从而进行维护。

配置 PowerHA 的具体方法请参见 Installation Guide 的第 11 章 Using the SMIT Assistant请查看 PowerHA 的在线文档。PowerHA for Linux 不包含 AIX 上可用的高级发现和检查特性。在配置 PowerHA for Linux 时,必须手工地定义集群、网络和网络接口。对配置的任何修改都需要在所有节点上重新启动 PowerHA for Linux。

对于 IP 地址接管,PowerHA 为什么需要那么多子网?

PowerHA(使用 RSCT)通过特定的网络接口发送检测信号,从而判断适配器状态;只要能够通过接口发送检测信号,就认为此接口是正常的。在 AIX V5 之前,AIX 不允许多个接口拥有子网路由,但是在 AIX V5.1 中多个接口可以有到同一子网的路由。这有时候称为多路径路由或路由分条;当出现这种情况时,AIX 将把以某一子网为目的地的出站数据包通过具有到此子网的路由的所有接口发送出去。具有 RSCT 功能的接口能够可靠地把检测信号发送到特定的接口。因此,这些地址的安排不会产生重复的子网路由,这是由引导、服务和持久化标签的子网规则决定的。
PowerHA V5 包含一个新特性,可以将 PowerHA 配置为对检测信号使用不同的 IP 别名地址集,从而避免一些子网需求。这个特性提供一个基地址(即启始地址),PowerHA 会计算出正确的子网中的一组地址 —— 当集群服务启用时,PowerHA 把这些地址作为 IP 别名地址添加到接口中,然后只使用这些别名地址发送检测信号。然后,可以在任何子网中分配 “常规的” 引导、服务和持久化标签,但是要小心:尽管这个特性可以避免检测信号使用多路径路由,但是多路径路由可能会严重影响您的应用程序。Concepts and Facilities Guide 的第 2 章和 Administration and Troubleshooting Guide 的第 3 章中讨论了通过 IP 别名发送检测信号。请查看 PowerHA 的在线文档

如何避免名称服务器成为单一故障点?

1) 通过输入以下条目创建一个 /etc/netsvc.conf 文件,让节点先检查 /etc/hosts,再查询名称服务器(DNS):

hosts=local,bind

其中的 local 让节点先检查 /etc/hosts,再查询名称服务器
2) 删除 /etc/resolv.conf(或用别的名称保存它,供以后使用),这样就会先用 /etc/hosts 进行名称解析。
关于更新 /etc/hosts 文件和名称服务器配置的更多信息,请参见 Installation Guide请查看 PowerHA 的在线文档

什么是 config_too_long 事件?

config_too_long 事件是当集群事件的运行时间比预先设置的时间长时 PowerHA 发出的信息性事件。在发生以下情况时会出现此事件:

  • 一个 AIX 命令(例如 fsck)长时间运行或已经挂起了
  • 遇到了不可恢复的错误 —— 在这种情况下,hacmp.out 中会出现“EVENT FAILED”标志

如果遇到 config_too_long 事件,应该检查 hacmp.out 文件,判断原因并决定是否需要手工干预。关于出现事件失败之后的恢复的更多信息,请参见 Administration and Troubleshooting Guide 的第 18 章 Recover from PowerHA Script Failure

所有节点是否需要使用 PowerHA 和 AIX 操作系统的相同版本?

不。但是,在运行混合型集群时有一些限制。
集群节点上 AIX 的级别不一致不会给 PowerHA 造成问题,只要 AIX 的级别足以支持节点上运行的 PowerHA 的级别即可。在这种环境中支持所有集群操作。PowerHA 的安装和更新包将强制执行每个系统上所需的最低级别的 AIX。
同样,对于 Linux on POWER,只要安装了支持的最低级别,操作系统级别不一致应该不会造成问题。不支持在同一集群中混合使用不同的平台,比如 AIX、RedHat 和 SUSE。从实用性的角度来说,建议所有节点尽可能使用相同级别的操作系统和 PowerHA。保持所有节点上的操作系统、PowerHA 和应用程序处于相同级别可以简化集群的管理,减少发生错误的可能性,这会大大减少管理员遇到的麻烦。Planning Guide 对有效地管理不同的安装和迁移场景给出了建议。

为什么需要非 IP 检测网络?

非 IP 检测链路的用途常常被误解。需要非 IP 检测网络是因为 IP 网络上的 PowerHA 检测作为 UDP 数据报发送。这意味着,如果一个节点或网络很拥挤,检测可能被丢弃。如果只有 IP 网络,那么在发生长时间拥挤时,就会认为此节点出现了故障,PowerHA 会启动接管操作。因为此节点实际上仍然是活跃的,PowerHA 接管会造成两个节点具有相同的 IP 地址,还会造成这两个节点同时试图拥有和访问共享磁盘。这种情况有时候被称为“分裂的集群”。在这种情况下,数据损坏是不可避免的。
因此,PowerHA 强烈建议节点通过至少一个非 IP 网络连接到至少一个其他节点。对于超过两个节点的集群,最可靠的配置是在每个节点上包含两个非 IP 网络。非 IP 链路(尤其是 RS-232)上的距离限制常常使这个需求很难得到满足。对于这种集群,应该考虑使用 PowerHA 磁盘检测。磁盘检测能够简便地建立多个非 IP 网络,而不需要额外的硬件或软件。

在同一集群中可以使用不同类型的处理器、通信适配器或磁盘子系统吗?

一般来说可以,只要 PowerHA 支持各个组件即可。注意,某些组合可能是不合理的,或是应该避免的。例如,如果在同一网络上使用运行速度不同的两个以太网适配器,一般会迫使网络上的所有适配器以低速适配器的速度运行。同样,如果以低档处理器作为高档处理器的备用,PowerHA 可能不得不在低档处理器上运行应用程序,这会导致不可接受的性能。(处理此问题的方法请参见关于动态 LPAR 和 CUoD 的问题)。只要 AIX 和硬件支持互连,PowerHA 也会支持它们。

可以用现有的 Enhanced Concurrent Mode 卷组实现磁盘检测吗?还是需要定义新的卷组?

为了在各种故障场景中实现最高的可用性水平,最好的做法是为每个物理磁盘单元(或 LUN)配置一个磁盘检测连接。
检测操作本身要对共享磁盘的非数据区域读写消息。尽管检测信号使用的空间不会减少应用程序可用的空间(它在磁盘的保留区域中),但是磁盘会在保留区域和应用程序数据区域之间来回搜索,这会造成一些开销。


如果让磁盘检测路径使用与应用程序相同的磁盘和卷组,最好的做法是选择包含不会频繁访问或对性能要求不高的应用程序的磁盘:尽管磁盘检测开销很小(每秒 2-4 次寻道),但是它可能影响应用程序性能,过多的应用程序访问也会使磁盘连接看起来时断时续。为检测选用哪个磁盘和卷组取决于共享磁盘环境和管理过程。例如,使用一个单独的卷组实现检测可以把检测与应用程序数据隔离开,但是会增加一个必须维护(升级、修改等)的卷组并占用一个 LUN。如果决定用一个单独的卷组实现检测,并不需要把它包含在 PowerHA 资源组中,但是 CSPOC 实用程序使用一个资源组节点列表作为要执行操作的节点集:把这个卷组包含在一个资源组中,这个资源组只包含与此磁盘连接的节点集,这样就能够使用 CSPOC 功能。也可以定义和使用不属于任何卷组的磁盘,但是这种设置必须手工地配置和维护。


相关主题

  • PowerHA 在线信息中心:在这里,您可以找到 PowerHA 的相关文档,包括安装手册、调优文档等。
  • PowerHA 官方文档:在这里,您可以全面了解和 PowerHA 相关的内容,包括软硬件支持列表等内容。
  • AIX FAQ 第 1 期:作为第 1 期,主要涉及的内容还是一些比较基础的问题,如基础概念,基本操作等。
  • AIX FAQ 第 2 期:本期我们将向您介绍一些 AIX 网络概念和管理方面的常见问题及其解决方法。例如在 AIX 上对网络适配器的定义和操作、AIX 的各种网络接口定义、如何进行域名解析等操作。
  • AIX FAQ 第 3 期:本期我们将继续向您介绍一些和网络管理相关的技巧,其中包括 r 命令的介绍、网络启动以及相关的配置文件、inetd 服务等。
  • HACMP 资源中心:在这里,为您总结了 AIX and UNIX 专区拥有的和 HACMP 相关的内容,让您更方面和快捷地找到您需要的资源。希望能够对您学习 HACMP 有所帮助。
  • AIX 认证专题:在这里,我们会推出一系列的认证文章和教程,帮助您能够更好地准备认证考试。当然,这些内容也是很好的学习 AIX 的资料,可以让您更加系统地了解这个操作系统,从而一步步成为一个合格的管理员。
  • AIX and UNIX 专题汇总:AIX and UNIX 专区已经为您推出了很多的技术专题,为您总结了很多热门的知识点。我们在后面还会继续推出很多相关的热门专题给您,为了方便您的访问,我们在这里为你把本专区的所有专题进行汇总,让您更方便的找到你需要的内容。
  • 系统管理员工具包:“系统管理员工具包”系列文章主要专注于一些方法和技术,可以帮助您最大限度地利用各种 UNIX 环境中可用的工具,简化异构环境下的系统管理任务。
  • AIX and UNIX 专区:developerWorks 的“AIX and UNIX 专区”提供了大量与 AIX 系统管理的所有方面相关的信息,您可以利用它们来扩展自己的 UNIX 技能。
  • AIX and UNIX 新手入门:访问“AIX and UNIX 新手入门”页面可了解更多关于 AIX 和 UNIX 的内容。
  • 按主题搜索“AIX and UNIX”库:
  • IBM 试用软件:从 developerWorks 可直接下载这些试用软件,您可以利用它们开发您的下一个项目。
  • Podcast:收听 Podcast 并与 IBM 技术专家保持同步。

评论

添加或订阅评论,请先登录注册

static.content.url=http://www.ibm.com/developerworks/js/artrating/
SITE_ID=10
Zone=AIX and UNIX
ArticleID=391669
ArticleTitle=AIX FAQ 第 4 期
publish-date=05262009