IBM®
跳转到主要内容
    中国 [选择]    使用条款
 
 
Select a scope: Search for:    
    首页    产品    服务与解决方案     支持与下载    个性化服务    
跳转到主要内容

developerWorks 中国  >  AIX and UNIX  >

HACMP 认证学习系列,第 3 部分:安装和配置(3)

摘自红皮书《IBM eserver pSeries HACMP V5.x Certification Study Guide Update》

developerWorks
文档选项

未显示需要 JavaScript 的文档选项


Dino Quintero, 高级认证 IT 咨询师, IBM

2008 年 4 月 15 日

在本文中,我们将介绍 HACMP 在配置资源组时候需要完成的内容。

您可以通过访问“IBM AIX 认证专题”来了解其它的相关认证文章:

HACMP 提供了下列类型的资源组:

  • 级联资源组
  • 循环资源组
  • 并发访问资源组
  • 自定义访问组

级联资源组

级联资源组定义能够控制该资源组的所有节点的列表,然后通过为每个节点分配接管优先级,从而指定集群节点控制该资源组的优先权。当故障转移发生时,具有最高优先级的活动节点将获取该资源组。如果该节点不可用,则具有下一个最高优先级的节点将获取该资源组,以此类推(请参见图 1、2 和 3)。


图 1 初始配置中的级联资源组


图 2 故障转移条件下的级联资源组


图 3 退回条件下的级联资源组

参与节点的列表建立了该资源组的资源链。当某个拥有该资源组的较高优先级的节点加入或重新集成到集群中时,该节点将取得资源组的控制权,资源组将从具有较低优先级的节点退回到较高优先级的节点。

特殊的级联资源组属性

级联资源组支持下列属性:

  • Cascading without Fallback
  • Inactive Takeover
  • Dynamic Node Priority

Cascading without fallback (CWOF) 是一个允许微调退回行为的级联资源组属性。当将 Cascading Without Fallback 标志设置为 False 时,则表示执行传统的级联资源组行为:当某个节点加入或重新集成到集群中时,如果其优先级比资源组当前所在的节点高,并且有接口可用,则资源组将退回到较高优先级的节点。当将此标志设置为 True 时,资源组不会退回到任何加入或重新集成到集群中的节点,即使该节点是较高优先级的节点。配置了 CWOF 的资源组不需要 IP 地址接管。

Inactive Takeover 是允许微调节点对资源组的初始获取的级联资源组属性。如果 Inactive Takeover 为 True,则资源组中要加入集群的第一个节点将获取资源组,而不管为该节点指定的优先级如何。如果 Inactive Takeover 为 False,则要加入集群的每个节点仅获取被指定为其最高优先级节点的资源组。缺省值为 False。

Dynamic Node Priority 允许使用事件发生时的集群状态来确定接管节点列表的顺序。





回页首


循环资源组

与级联资源组一样,循环资源组定义了能够接管某个资源组控制权的节点的列表,并使用优先级来确定其他节点接管资源控制权的顺序。

与 CWOF 设置为 True 时的级联资源组一样,当具有最高优先级的节点重新集成到集群中时,资源组控制权不会自动归还该节点。为了避免退回所导致的服务中断,或者在资源保持跨多个节点分布变得非常重要时,可以使用循环资源组(请参见图 4 和 图 5 和 6)。


图 4 初始配置中的循环资源组


图 5 故障转移条件下的循环资源组


图 6 故障节点重新集成后的循环资源组

对于循环资源组,除非设置了 Dynamic Node Priority,否则具有某个资源组的最高优先级和可用连接(网络、网络接口和地址)的节点将从故障节点获取该资源组。HACMP 软件假设拥有循环资源组的关联服务地址的节点控制该资源组。

循环资源组与 Cascading without Fallback 资源组具有一些相似性。

然而,还是有一些重要的不同之处。与级联资源组不同,循环资源组彼此之间进行交互。

由于循环资源组需要使用 IP 地址接管,资源链中的所有节点必须共享到该资源组的同一个网络连接。如果多个循环资源组共享一个网络,任何时候只有其中一个资源组能够在给定的节点上激活。因而,循环资源组本身是分布放置的。然而,设置了 Cascading without Fallback 的级联资源组可能聚集在一起——也就是说,多个组最终将驻留在同一个节点上。CWOF 不要求将某个 IP 地址与组相关联。





回页首


并发访问资源组

并发访问资源组可以同时由多个节点共享。并发访问某个资源组的所有节点在加入集群时获取该资源组。节点之间不存在优先级。

支持并发访问资源组的集群的节点数不能超过 32 个。请注意,集群中的所有节点都必须是某个并发资源组的成员。

并发资源组中包括的资源仅仅是是带有原始逻辑卷、原始磁盘和使用那些磁盘的应用程序服务器的卷组。

定义这些逻辑存储实体的设备必须支持并发访问。





回页首


自定义资源组

在 HACMP V5.1 中,除了级联、循环和并发资源组以外,还可以配置自定义资源组。自定义资源组的参数允许您精确描述资源组在启动、故障转移和退回时的行为。

普通的级联、循环和并发资源组具有预定义的启动、故障转移和退回行为。自定义资源组的策略要比 CWOF 或 Inactive Takeover (IT) 属性更容易理解。这些策略没有被限制到普通资源组的预定义策略,并且可以根据需要进行定制。

表 1 显示了“传统”资源组(HACMP 5.1 以前的版本)和自定义资源组之间的资源组行为对比关系。


表 1 自定义资源组行为

自定义资源组属性

可以配置特定于自定义资源组的参数,这些参数定义资源组在启动、故障转移和退回时的行为方式。自定义资源组的配置包括:

  • 缺省节点优先级列表

可承载某个特定资源组的节点列表,这些节点在资源组的“Participating Node Names”中进行定义。

  • 主节点

任何非并发资源组(包括其行为类似于非并发资源组的自定义资源组)的缺省节点列表中列出的第一个节点。

自定义资源组参数

  • Settling time

Settling time 是将当前离线的资源组置于在线所需要的时间。当未配置 settling time 时,资源组将在加入集群的第一个可用的较高优先级节点上启动。可以通过指定 settling time 来配置自定义资源组的启动行为。

Settling Time 用于确保在具有较高优先级的节点被置于在线时,资源组不会在节点之间不断移动。此属性还允许 HACMP 在激活资源组前等待给定的时间长度,然后在可用的最高优先级节点上激活该资源组。

在设置了 Settling Time 的情况下,如果该资源组的最高优先级节点在线,则 HAMP 会立即将该资源组置于在线;

否则,HACMP 会在 Settling Time 间隔期间等待,然后再决定要放置该资源组的节点。

  • Dynamic node priority (DNP)

还可以使用 Dynamic Node Priority来自定义资源组的故障转移行为。

注意:还可以为普通级联和循环资源组配置 Dynamic Node Priority。

  • Delayed Fallback Timer

通过指定并分配一个延迟退回计时器 (Delayed Fallback Timer),可以配置自定义资源组的退回行为,使得退回操作在其中一个预定义的重复间隔中进行:每天、每周、每月和每年,或者按特定的日期和时间。

Delayed Fallback Timer 允许自定义资源组在您指定的时间退回到较高优先级的节点。配置了 Delayed Fllback Timer 并且当前驻留在非主节点上的资源组将在指定的时间退回到较高优先级的节点。

  • Inactive takeover (IT)

可以配置自定义资源组的一种启动行为:如果 RG 处于“离线”状态的情况下,并且某个属于该 RG 节点优先级列表的节点启动 HACMP 服务,则此节点能够获取该资源组。





回页首


使用标准路径配置 HACMP 资源组

使用标准路径,您可以配置使用基本管理策略的资源组。这些策略基于三种预定义类型的启动、故障转移和退回策略:级联、循环或并发。

配置资源组涉及到两个阶段:

  • 配置资源组名称、管理策略和能够拥有该资源组的节点。
  • 向资源组添加资源和附加属性。

使用标准路径创建 HACMP 资源组

要创建资源组,可以执行以下步骤:

1. 输入快速路径 smitty hacmp。

2. 在 HACMP 菜单上,选择 Initialization and Standard Configuration。

3. 选择 Configure HACMP Resource Groups。

4. 选择 Add a Standard Resource Group 并按 Enter 键。

5. 系统将提示您选择资源组管理策略。请选择 Cascading、Rotating、Concurrent 或 Custom,然后按 Enter 键。

取决于前面的选择,您将看到一个标题为 Add a Cascading/Rotating/Concurrent/Custom Resource Group 的屏幕。该屏幕仅显示与所选的资源组类型相关的选项。

注意:如果是配置自定义资源组,请参阅 “自定义资源组”。

6. 按如下方式输入字段值(此屏幕用于级联、循环和并发资源组):

  • Resource group name

输入所需的名称。使用不超过 31 个的字母数字字符或下划线;请不要使用前导数字。

  • Participating node names

输入能够拥有或接管该资源组的节点的名称。首先输入具有最高所有权优先级的节点,然后以所需顺序输入具有较低优先级的节点(请参见示例 1)。

示例 1 使用标准路径的资源组配置

Add a Resource Group with a Cascading Management Policy (standard)
Type or select values in entry fields.
Press Enter AFTER making all desired changes.
[Entry Fields]
* Resource Group Name                                                [rg1]
* Participating Node Names (Default Node Priority)                   [p630n01 p630n02]
F1=Help              F2=Refresh                 F3=Cancel             F4=List
F5=Reset             F6=Command                 F7=Edit               F8=Image
F9=Shell             F10=Exit                   Enter=Do

7. 按 Enter 键。

8. 按 F3 返回到 Add a Standard Resource Group 屏幕,以继续添加为 HACMP 集群计划的所有标准资源组。

将资源分配到资源组

要为资源组分配资源,可以执行以下步骤:

1. 输入快速路径 smitty hacmp。

2. 转到 Initialization and Standard Configuration。

3. 选择 Configure HACMP Resource Groups。

4. 选择 Change/Show Resources for a Standard Resource Group 并按 Enter 键,以显示已定义的资源组的列表。

5. 选择您希望配置的资源组,然后按 Enter 键。SMIT 将返回与所选的资源组类型匹配的屏幕,并填充 Resource Group Name 和 Participating Node Names (Default Node Priority) 字段(请参见示例 2)。

示例 2 将资源分配到资源组

Change/Show Resources for a Cascading Resource Group
Type or select values in entry fields.
Press Enter AFTER making all desired changes.
[Entry Fields]
Resource Group Name                                                  rg01
Participating Node Names (Default Node Priority)                 p630n01 p630n02 p630n>

* Service IP Labels/Addresses                                    [n01a1] +
Volume Groups                                                    [] +
Filesystems (empty is ALL for VGs specified)                     [] +
Application Servers                                              [] +
F1=Help                       F2=Refresh          F3=Cancel             F4=List
F5=Reset                      F6=Command          F7=Edit               F8=Image
F9=Shell                      F10=Exit            Enter=Do

6. 按如下方式输入字段值:

  • Service IP label/IP address

列出要在该资源组被接管时接管的服务 IP 标签。按 F4 可以查看有效 IP 标签的列表。其中包括循环或可被接管的地址。

  • Filesystems (empty is for all specified VGs)

如果将 Filesystems 字段保留为空,并在下面的 Volume Groups 字段中指定共享卷组,则将在该卷组中挂载所有的文件系统。如果将 Filesystems 字段保留为空,并且不在下面的字段中指定卷组,则不会安装任何文件系统。还可以选择要包括在资源组中的各个文件系统。按 F4 可以查看文件系统的列表。在此情况下,在将该资源组置于在线时,将仅挂载指定的文件系统。

只有对于非并发资源组,Filesystems 才是一个有效的选项。

  • Volume groups

确定应该在获取或接管该资源组时启用的共享卷组。从选择列表中选择卷组,或者在此字段中输入所需的卷组名称。

按 F4 将显示该资源组中的所有共享卷组和当前可用于导入到资源组节点上的卷组的列表。

注意:仅当您是在添加非并发或自定义的非并发式资源组时,才应该使用 Service IP Label/IP Addresses、Filesystems 和 Volume group 选项。

  • Concurrent volume groups

确定可由多个节点同时访问的共享卷组。从选择列表中选择卷组,或者在此字段中输入所需的卷组名称。如果您先前已请求 HACMP 收集有关适当卷组的信息,则按 F4 将显示该资源组中当前可用并支持并发的所有现有卷组和可用于导入到该资源组中的节点上并支持并发的卷组的列表。

缺省情况下,Disk Fencing 功能是启用的。

  • Application servers

指示要包括在该资源组中的应用程序服务器。按 F4 可以查看应用程序服务器的列表。

7. 按 Enter 键以将这些值添加到 HACMP ODM。

8. 按 F3,直到返回到 Change/Show Resources for a Standard Resource Group 菜单,或者按 F10 退出 SMIT。





回页首


使用扩展路径配置 HACMP 资源组

要使用扩展路径创建资源组,可以执行以下步骤:

1. 输入快速路径 smitty hacmp。

2. 转到 Extended Configuration。

3. 选择 Extended Resource Configuration。

4. 选择 HACMP Resource Group Configuration。

5. 选择 Add a Resource Group 并按 Enter 键。

6. 在下一个屏幕上,选择资源组管理策略(Cascading、Rotating、Concurrent 或 Custom)并按 Enter 键。

取决于前面的选择,您将看到一个标题为 Add a Cascading/Rotating/Concurrent/Custom Resource Group 的屏幕。该屏幕仅显示与所选的资源组类型相关的选项。

注意:如果是配置自定义资源组,请参阅“配置自定义资源组”。

7. 按如下方式输入字段值(此屏幕用于级联、循环和并发资源组):

  • Resource group name

输入所需的名称。使用不超过 31 个的字母数字字符或下划线;请不要以数字开头。

  • Inter-site management policy

选择下列选项之一:

    • 除非定义了站点,否则应该使用 Ignore(缺省)。如果要定义站点,则必须提供适当的方法或自定义来处理站点操作。设置为除 Ignore 以外的任何内容的站点策略会自动将资源组添加到一个自定义的串行处理列表。
    • 可以分配将由多个站点按优先顺序接管的 Cascading 资源。当站点发生故障时,具有最高优先级的活动站点将获取该资源。当故障站点重新加入时,具有最高优先级的站点将获取该资源。
    • Rotating 资源可由其资源链中的任何站点获取。

当站点发生故障时,该资源将由最高优先级的备用站点获取。当故障站点重新加入时,该资源仍然属于其新的所有者。

    • Concurrent 资源可从任何站点进行访问。如果站点关系是并发的,则管理策略不能是 Rotating。

– Participating node names

输入能够拥有或接管该资源组的节点的名称。首先输入具有最高所有权优先级的节点,然后以所需顺序输入具有较低优先级的节点。

8. 按 Enter 键。

9. 按 F3 返回到 Add a Standard Resource Group 屏幕,以继续添加为 HACMP 集群计划的所有标准资源组(请参见示例 3)。

示例 3 使用扩展路径的资源组配置

Add a Cascading Resource Group (extended)
Type or select values in entry fields.
Press Enter AFTER making all desired changes.
[Entry Fields]
* Resource Group Name                                                [rg1]
* Inter-Site Management Policy                                       [ignore] +
* Participating Node Names (Default Node Priority)                   [p630n01 p630n02] +
F1=Help                    F2=Refresh              F3=Cancel           F4=List
F5=Reset                   F6=Command              F7=Edit             F8=Image
F9=Shell                   F10=Exit                Enter=Do

通过扩展路径向资源组分配资源和属性

要为资源组配置资源和属性,可以执行以下步骤:

1. 输入快速路径 smitty hacmp。

2. 转到 Extended Configuration。

3. 选择 Extended Resource Configuration。

4. 选择 Extended Resource Group Configuration。

5. 选择 Change/Show Resources and Attributes for a Resource Group 并按 Enter 键。SMIT 将显示已定义的资源组的列表。

6. 选择您希望配置的资源组,然后按 Enter 键。SMIT 将返回与所选的资源组类型匹配的屏幕,并填充了 Resource Group Name、Inter-site Management Policy 和 Participating Node Names (Default Node Priority) 字段。

如果参与节点已启动,可以按 F4 列出共享资源。如果还未定义资源组/节点关系,或者如果某个节点未启动,则按 F4 将显示相应的警告(请参见示例 4)。


示例 4 使用扩展路径向资源组分配资源和属性

7. 填写下列字段:

  • Dynamic node priority (Overrides default)

选择动态节点优先级策略。缺省为空(有序的节点列表)。将列出所有已定义的动态节点优先级策略,包括预先配置的策略。

  • Service IP label/IP addresses

此选项与标准配置路径中使用的选项相同。

  • Filesystems (为空的话将为特定 VG 的所有文件系统)

此选项与标准配置路径中使用的选项相同。

  • Volume groups

此选项与标准配置路径中使用的选项相同。

  • Application servers

此选项与标准配置路径中使用的选项相同。

  • Use forced varyon of volume groups, if necessary

缺省值为 False。如果此标志设置为 True,则在该卷组由于缺乏定额而使正常的 Varyon 失败的情况下,并且 HACMP 发现该卷组的每个逻辑卷中的每个逻辑分区至少有一个完整副本可用时,则 HACMP 将使用强制 Varyon 来将属于该资源组的每个卷组置于在线。

此选项应该仅用于其中的每个逻辑卷都实现了镜像的卷组。建议使用非常严格的分配策略;对于其他逻辑卷配置选择,强制 Varyon 不太可能会成功。

  • Filesystems consistency check

确定用于检查文件系统一致性的方法:fsck(缺省)或 logredo(用于快速恢复)。

  • Filesystems recovery method

确定文件系统恢复方法:parallel(并行)(用于快速恢复)或 sequential(串行)(缺省)。如果您有共享的嵌套文件系统,请不要将此字段设置为 parallel。这些文件系统必须按串行方式进行恢复。

注意:集群验证实用程序 clverify 不会报告文件系统和快速恢复的不一致性。

– File systems mounted before IP configured

指定在接管时,HACMP 是在接管故障节点的 IP 地址之前还是之后接管卷组并装入故障节点的文件系统。缺省设置为 False,意味着首先接管 IP 地址。类似地,当某个节点重新集成时,将首选获取 IP 地址,然后才装入文件系统。如果资源组包含要导出的文件系统,则应该将此字段设置为 True。这样设置是为了在服务地址上接收到 NFS 请求时,文件系统将可用。

– Filesystems/Directories to export

确定要进行 NFS 导出的文件系统或目录。这些文件系统应该是上面的 Filesystems 字段中列出的文件系统的子集。目录应该包含在上面列出的其中一个文件系统中。按 F4 可以查看列表。

– Filesystems/Directories to NFS mount

确定要进行 NFS 挂载的文件系统或目录。当所有者节点在集群中处于活动状态时,资源链中的所有节点都将尝试对这些文件系统或目录进行 NFS 挂载。

– Network for NFS mount (Optional)

选择您希望在其中对文件系统进行 NFS 装入的以前定义的 IP 网络。按 F4 可以列出有效的网络。仅当已经填写了 Filesystems/Directories to NFS Mount 字段时,此字段才有意义。Service IP Labels/IP Addresses 字段应该包含一个在所选网络上的服务标签。

– Raw disk PVIDs

按 F4 可以获得 PVID 和关联的 hdisk 设备名称的清单。如果在使用直接访问原始磁盘的应用程序,则应在此处列出那些原始磁盘。

– Tape resources

输入希望在该资源组上启动的磁带资源。

按 F4 可以从以前在 Define Tape Resources 屏幕中定义的资源列表中做出选择。

– Fast connect services

按 F4 可以从该资源组中的所有节点共有的 Fast Connect 资源列表中做出选择,这些资源是在 Fast Connect 的初始配置过程中指定的。如果是在添加 Fast Connect 文件共享,请确保您已在资源组中定义了它们的文件系统。

– Communication links

输入要由 HACMP 启动的通信链路(这是以前在 Configure Communication Adapters and Links SMIT 屏幕中定义的)。按 F4 可以查看已定义的通信链路的列表。如果添加 SNA-over-LAN 链路,请确保同时向该资源组添加了一个服务 IP 标签。

– Miscellaneous

指定您希望放到该拓扑中的文本以及资源组信息。该信息可由脚本访问,例如 Database1。

  • Primary workload manager class

按 F4 并从与指定的 HACMP WLM 配置相关联的工作负载管理器 (Workload Manager) 类选择列表中做出选择。对于级联资源组,如果没有指定辅助 WLM 类,则所有节点都使用主 WLM 类。如果指定了辅助类,则只有主节点才使用主 WLM 类。对于循环和并发资源组,资源组中的所有节点都配置为使用主 WLM 类。

  • Secondary workload manager class

(可选)按 F4 并从与该资源组相关联的工作负载管理器类选择列表中做出选择。只有级联资源组才允许使用辅助 WLM 类。如果没有指定辅助 WLM 类,则该资源组中的所有节点都使用主 WLM 类。如果在这里指定了辅助类,则主节点将使用主 WLM 类,所有其他节点将使用辅助 WLM 类。

  • Automatically import volume groups

指定 HACMP 是否应该自动导入在 Volume Groups 或 Concurrent Volume Groups 字段中定义的卷组。缺省情况下,Automatically Import Volume Groups 标志设置为 False。如果将 Automatically Import Volume Groups 设置为 False,则不会自动导入所选的卷组。在此情况下,当您向该资源组添加卷组时,请确保已经使用 importvg 命令或 C-SPOC 将所选的卷组导入每个节点。如果将 Automatically Import Volume Groups 设置为 True,则在按 Enter 键时,HACMP 将确定是否需要将您在 Volume Groups 或 Concurrent Volume Groups 字段中输入或选择的卷组导入该资源组中的任何节点,并在需要时自动导入卷组。

  • Inactive takeover applied

设置此变量以控制级联资源组的初始获取。此变量不适用于循环或并发资源组。如果 Inactive Takeover 为 True,则资源组中要加入集群的第一个节点将获取资源组,而不管为该节点指定的优先级如何。如果 Inactive Takeover 为 False,则要加入集群的每个节点仅获被指定为其最高优先级节点的资源组。缺省值为 False。

– Cascading without fallback enabled

设置此变量以确定级联资源组的退回行为。当 CWOF 变量为 False 时,级联资源组将在具有较高优先级的节点加入或重新集成到集群中时退回。当 CWOF 为 True 时,级联资源组不会在具有较高优先级的节点加入或重新集成到集群中时退回。仅当所有者节点发生故障时,级联资源组才从其所有者节点迁移。当所有者节点重新集成到集群中时,级联资源组不会退回到该所有者节点。CWOF 的缺省设置为 False。

– Fallback timer policy (为空的话表示立即执行)

仅当这是一个自定义资源组,并且您前面在列表中选择了 Fallback to Higher Priority Node 作为退回策略时,此字段才会显示出来。缺省为空(资源组在较高优先级的节点加入时立即退回)。选择列表中列出了所有已配置的退回计时器策略。

8. 按 Enter 键以将这些值添加到 HACMP ODM。

9. 返回到 Extended Configuration 菜单顶部并同步集群。





回页首


配置自定义资源组

除了基于基本管理策略(级联、循环和并发)的资源组以外,还可以配置自定义资源组。

在使用 Extended Configuration 路径时,您可以指定参数,这些参数精确描述自定义资源组在启动、故障转移和退回时的行为,其中包括延迟退回计时器(这些属性在 Standard Configuration 路径上不可用)。有关自定义 RG 行为,请参见表 1。

请确保您始终能够通过选择与特定预定义资源组的行为相同的策略,从而配置一个其行为与预定义的级联、循环或并发资源组完全相同的自定义资源组。

要配置自定义资源组,必须执行以下步骤:

  • 配置运行时策略。
  • 配置动态节点优先级策略。
  • 配置延迟退回计时器。
  • 配置停留时间 (settling time)。
  • 定义启动行为。
  • 定义故障转移行为。
  • 定义退回行为。
  • 向自定义资源组添加资源。

配置自定义资源组

请执行以下步骤:

1. 输入快速路径 smitty hacmp。

2. 转到 Extended Configuration。

3. 选择 Extended Resource Configuration。

4. 选择 HACMP Resource Group Configuration → Add a Resource Group 并按 Enter 键。一个选择列表将显示您可以配置的所有类型的资源组:Cascading、Rotating、Concurrent 或 Custom。

5. 请从选择列表中选择 Custom 并按 Enter 键。随即出现 Add a Resource Group 屏幕。按如下方式填充字段:

  • Resource group name

输入所需的名称。使用不超过 31 个的字母数字字符或下划线;请不要以数字开头。

  • Inter-site management policy

缺省值为 Ignore。这是用于自定义资源组的唯一有效选项。

  • Participating node names

输入能够拥有或接管该资源组的节点的名称。首先输入具有最高所有权优先级的节点,然后以所需顺序输入具有较低优先级的节点。

  • Startup policy

从定义自定义资源组的启动策略的列表中选择一个值:

    • Online on home node only

该自定义资源组在资源组启动期间应该仅在其主(最高优先级)节点上置于在线。这要求最高优先级的节点可用。

    • Online on first available node

该自定义资源组将在变得可用的第一个参与节点上激活。如果为自定义资源组配置了停留时间,在使用此启动策略选项的情况下,该停留时间仅用于此资源组。

    • Online on all available nodes

该自定义资源组将在所有节点上置于在线。如果对该资源组选择此选项,请确保该组中的资源能够同时在多个节点上置于在线。

– Fallover policy

从定义自定义资源组的故障转移策略的列表中选择一个值:

  • Fallover to next priority node in the list

在故障转移情况下,一次仅在一个节点上在线的资源组遵守该资源组的节点列表中指定的缺省节点优先级顺序。

  • . Fallover using dynamic node priority

在选择此选项之前,应配置一个希望使用的动态优先级策略。或者可以选择三种预定义的动态优先级策略之一。

  • . Bring offline (On error node only)

选择此选项以在错误状态过程中将资源组在某个节点上置于离线。当某个特定的节点发生故障时,如果您希望资源组仅在该节点上置于离线,但是在其他节点上保持在线,则此选项是最合适的。当启动首选项不是 Online On All Available Nodes 时,选择此选项作为故障转移首选项可能会使资源在错误状态过程中变得不可用。如果做此设置,HACMP 将发出警告。

– Fallback policy

从定义自定义资源组的退回策略的列表中选择一个值:

  • Fallback to higher priority node in the list

资源组将在较高优先级的节点加入集群时退回。如果选择此选项,您可以使用前面在 Configure Resource Group Run-time Policies SMIT 菜单中指定的延迟退回计时器。如果不配置延迟退回策略,则资源组将在较高优先级的节点加入集群时立即退回。

  • Never fallback

资源组不会在较高优先级的节点加入集群时退回。

6. 按 Enter 键以将资源组信息添加到 HACMP ODM。

7. 在命令完成后按 F3,直到返回到 Extended Resource configuration 屏幕,或按 F10 退出 SMIT。

配置自定义资源组的停留时间

停留时间指定 HACMP 在等待某个较高优先级节点(加入集群)多长时间以后,才激活某个当前在该节点上处于离线状态的自定义资源组。如果设置了停留时间,则 HACMP 将在该停留时间间隔期间等待,以确定是否有某个更高优先级的节点可能加入集群,而不是简单地在重新集成到集群中的第一个可能节点上激活该资源组。

要配置自定义资源组的停留时间,可以执行以下步骤:

1. 输入快速路径 smitty hacmp。

2. 转到 Extended Configuration。

3. 选择 Extended Resource Configuration。

4. 选择 Configure Resource Group Run-Time Policies。

5. 选择 Configure Settling Time for Resource Group 并按 Enter 键。随即出现 Configure Settling Time 屏幕。

6. 按如下方式输入字段值:

– Settling time (in seconds)

在此字段中输入任何正整数。缺省值为零。在此情况下,该资源组尝试在某个正在加入集群的较高优先级节点上启动之前,将不做等待。在设置了停留时间的情况下,如果重新集成到集群中的当前可用节点不是最高优先级的节点,则资源组将在停留时间间隔过程中等待。

当停留时间结束时,资源组将在停留时间间隔过程中加入集群的节点列表中具有最高优先级的节点上激活。如果该间隔期间没有节点加入集群,则资源组将保持离线。停留时间仅对具有 Online on First Available Node 启动策略的自定义资源组有效。

7. 按 Enter 键提交更改并同步集群。此停留时间将分配给具有 Online on First Available Node 启动策略的所有自定义资源组。

定义延迟退回计时器

延迟退回计时器允许自定义资源组在指定的时间退回到较高优先级的节点。这允许您为与该资源组相关联的维护停机时间做好计划。

您可以指定计划该自定义资源组发生退回的重复时间,或者指定希望计划该自定义资源组发生退回的特定时间和日期。

可以为自定义资源组指定下列类型的延迟退回计时器:

  • Daily
  • Weekly
  • Monthly
  • Yearly
  • On a specific date

配置延迟退回计时器

要配置延迟退回计时器,可以执行以下步骤:

1. 输入 smit hacmp。

2. 选择 Extended Configuration → Extended Resource Configuration → Configure Resource Group Run-Time Policies → Configure Delayed Fallback Timer Policies → Add a Delayed Fallback Timer Policy,然后按 Enter 键。随即将显示一个选择列表 Recurrence for Fallback Timer。其中列出了 Daily、Weekly、Monthly、Yearly 和 Specific Date 策略。

3. 请从选择列表中选择计时器策略并按 Enter 键。取决于所选择的选项,将会显示一个对应的 SMIT 屏幕,该屏幕允许您配置该类型的退回策略。

将延迟退回策略分配给自定义资源组

必须首先定义延迟退回策略,然后才能将它们作为属性分配给自定义资源组。

要将延迟退回策略分配给某个自定义资源组,可以执行以下步骤:

1. 创建一个自定义资源组,或者选择某个现有的自定义资源组。

2. 转到 Extended Configuration → Change/Show Resource and Attributes for a Resource Group 并按 Enter 键。SMIT 将显示一个资源组列表。

3. 选择您希望为其分配延迟退回策略的资源组。(为该资源组显示的所有有效选项基于您为该自定义资源组指定的启动、故障转移和退回首选项。)

4. 按如下方式输入字段值:

  • Resource Group Name

所选资源组的名称显示在此字段中。

  • Inter-site Management Policy

对自定义资源组使用 Ignore (default)。

  • Participating Node Names (缺省节点优先级)

能够拥有或接管该资源组的节点的名称。

最先列出具有最高优先级的节点,然后紧跟具有较低优先级的节点。

  • Dynamic Node Priority (覆盖缺省值)

缺省为空(有序的节点列表)。将列出所有已定义的动态节点优先级策略,包括预先配置的策略。请注意,仅当您在前面选择了 Fallover Using Dynamic Node Priority 作为该资源组的故障转移行为时,才会显示此 SMIT 选项。

  • Fallback Timer Policy

缺省为空(资源组在较高优先级的节点加入时立即退回)。选择列表中列出了所有已配置的退回计时器策略。请注意,仅当您在前面选择了 Fallback to Higher Priority Node in the List 作为该资源组的退回策略时,才会显示此 SMIT 选项。

5. 按 F4 查看 Fallback Timer Policy 字段中的选择列表,并选择您希望用于该资源组的退回计时器策略。

6. 按 Enter 键提交更改。在填充 ODM 前,将会对配置进行检查。可以将相同的退回计时器策略分配给其他自定义资源组。

7. 向其他资源组分配退回计时器策略,并在完成时同步集群。





回页首


验证和同步 HACMP

在配置、重新配置或更新集群之后,应该在一个节点上运行集群验证过程,以检查是否所有节点都已就集群拓扑、网络配置以及 HACMP 资源的所有权和接管达成一致。如果验证成功,则对配置进行同步。

在活动的集群上,同步将会立即生效。

集群验证由针对各种 HACMP 配置执行的一系列检查组成。每个检查尝试检测集群一致性问题或错误。clverify 实用程序的消息输出尽可能遵循了常用的标准格式,并指出了发生错误的节点、设备、命令等等。该实用程序使用详细日志记录将输出写入 /var/hacmp/clverify/clverify.log。

在对集群做出更改之后,可以验证集群配置,或仅验证自从上次成功运行验证以来对集群所做的更改。clverify 实用程序在运行之后,还会在每个节点的 ODM 中存储详细的信息记录。每个节点的子目录包含上次成功验证、倒数第二次成功验证和上次不成功验证的信息。

在运行该实用程序的节点上,/var/hacmp/clverify/pass | pass.prev | fail /nodename/clver_response.xml 文件包含从所有节点接收到的信息。您可以在该文件中看到有关所收集到的数据和所执行的检查的详细信息。您(或服务技术人员)可以查看不成功的验证日志的详细信息,以准确确定错误发生在何处。

注意:/var/hacmp/clverify/clverify.log 文件 (0-9) 通常消耗 1-2 MB 的磁盘空间。例如,对于一个四节点的集群,建议 /var 文件系统至少有 18 MB 的空闲空间。

验证和同步集群配置

取决于您在使用哪一个 SMIT 路径,此过程稍微有所不同。如果是在使用 Initialization and Standard Configuration 路径,当您选择选项 Verify and Synchronize HACMP Configuration 时,该命令将立即执行。检查配置时的消息将发送到控制台。

如果是在使用 Extended Configuration 路径,可以在运行该命令之前设置命令参数。取决于集群是否为活动的,参数稍微有所不同。

请完成以下步骤来验证并同步集群拓扑和资源配置:

1. 输入快速路径 smitty hacmp。

2. 转到 Extended Configuration。

3. 选择 Extended Verification and Synchronization 并按 Enter 键。

该软件将检查集群服务是否正在任何集群节点上运行。如果集群是活动的,则可以选择运行模拟或实际的验证过程。对于活动的集群,Extended Cluster Verification and Synchronization SMIT 屏幕包括下列选项:

– Emulate or Actual

缺省为 Actual。

– Force synchronization if verification fails?

缺省为 No。如果选择 Yes,则集群验证将会运行,但是会忽略验证错误并对集群进行同步。

– Verify changes only?

缺省为 No。(对资源和拓扑配置运行完全检查。)Yes 将指定仅验证自从上次验证集群以来已更改过的资源和拓扑配置。

– Logging

缺省为 Standard。选择 Verbose 将把通常仅记录到 clverify.log 中的输出发送到控制台。当 clverify 从远程节点收集数据时,详细日志记录始终是启用的。

对于非活动的集群,该 SMIT 屏幕包括下列选项:

– Verify, Synchronize, or Both?

缺省为 Both。还可以选择仅验证或仅同步。

– Force synchronization if verification failed?

缺省为 No。如果选择 Yes,则集群验证将会运行,但是会忽略验证错误并对集群进行同步。

– Verify only changed parameters?

缺省为 No。(对资源和拓扑配置运行完全检查。)Yes 将指定仅验证自从上次验证集群以来已更改过的资源和拓扑配置。

– Logging

缺省为 Standard。选择 Verbose 会将通常仅记录到 clverify.log 中的输出发送到控制台。当 clverify 从远程节点收集数据时,详细日志记录始终是启用的。

4. 选择要使用的验证模式:

对所有字段选择缺省值,以运行适用于当前集群配置的所有验证检查。只有在不存在错误的情况下,才会对集群进行同步。

如果希望忽略验证错误并对集群进行同步,请选择 Force。

选择 Verify Changes Only 将仅运行与您更改(并同步)过的 HACMP 配置部分相关的检查。此模式对非活动的集群不起作用。

注意:Verify Changes Only 选项仅与 HACMP 集群 ODMS 相关。如果对集群节点上的 AIX 配置做出了更改,则不应该选择此选项。仅当您没有对 AIX 配置做出任何更改时才应选择此选项。

5. 按 Enter 键。SMIT 将运行 clverify 实用程序。验证产生的输出将显示在 SMIT Command Status 窗口中。

6. 如果接收到错误消息,请做出必要的更改并再次运行验证过程。



参考资料

学习
  • 您可以参阅本文在 IBM Redbooks 网站上的 红皮书原文

  • 您可以访问“IBM AIX 认证专题”了解更多的系列认证文章和教程

  • HACMP 认证系列文章的第 1 部分:本文包含对 IBM High Availability Cluster Multi-Processing (HACMP) for AIX 产品系列的介绍,以及作为 IBM 高可用性产品基础的概念。

  • HACMP 认证系列文章的第 2 部分:本文向您介绍了在计划和设计 HACMP 时候需要涉及的方方面面的内容,比如节点规划、硬件配置、软件配置等。让您全面了解实施 HACMP 前需要进行的各项准备工作。

  • HACMP 认证系列文章的第 3 部分 (1):在本文中,我们将向您介绍一些基本的 HACMP 安装问题和各种安装过程。

  • HACMP 认证系列文章的第 3 部分 (2):本文将继续 HACMP 安装和配置过程的介绍,着重介绍了 HACMP 在定义、配置节点以及配置节点之间连接的内容。

  • IBM System p5 服务器 HACMP 方案安装指南 :本教程向您详细地描述了 HACMP 在 IBM System p5 系列服务器上的安装过程,一步一步地通过示例向您演示了整个安装步骤,包括系统的准备,关键软件包的安装,安装过程中的各项参数的选择等重要步骤。

  • 使用 HACMP/XD + GLVM 实现高可用性集群 :本教程向您详细地描述了 HACMP/XD+GLVM 在 IBM System p5 系列服务器上的安装过程,一步一步地通过示例向您演示了整个安装步骤,包括系统的准备,关键软件包的安装,安装过程中的各项参数的选择等重要步骤。

  • 使用 SSA Target 模式配置 HACMP :HACMP 在客户环境下有着广泛的应用,如果客户环境中使用 7133 做共享存储,可以直接利用 SSA 做心跳。本文主要描述 SSA 卡做心跳的规划、配置、检测过程,读者可以根据文章的描述在自己的环境中学习配置。

  • AIX and UNIX 专区:developerWorks 的“AIX and UNIX 专区”提供了大量与 AIX 系统管理的所有方面相关的信息,您可以利用它们来扩展自己的 UNIX 技能。

  • AIX and UNIX 新手入门:访问“AIX and UNIX 新手入门”页面可了解更多关于 AIX 和 UNIX 的内容。

  • AIX Wiki:发现 AIX 相关技术信息的协作环境。

  • 按主题搜索“AIX and UNIX”库:
  • Safari 书店:访问此电子参考资料库可查找特定的技术资源。

  • developerWorks 技术事件和网络广播:了解最新的 developerWorks 技术事件和网络广播。

  • Podcasts:收听 Podcast 并与 IBM 技术专家保持同步。

获得产品和技术
  • IBM 试用软件:从 developerWorks 可直接下载这些试用软件,您可以利用它们开发您的下一个项目。


讨论


关于作者

Dino Quintero 是一个高级认证 IT 咨询师,在纽约的 ITSO 工作。在进入 ITSO 之前,他是 Enterprise Systems Group 的一名性能分析师,同时也是 IBM 全球服务部的一名灾难恢复架构师。他的专业覆盖灾难恢复和 p 系列主机的集群解决方案。目前,他正带领一个团队负责提供全球的 p 系列集群解决方案服务以及相关的授课工作。




对本文的评价










回页首


IBM 公司保留在 developerWorks 网站上发表的内容的著作权。未经IBM公司或原始作者的书面明确许可,请勿转载。如果您希望转载,请通过 提交转载请求表单 联系我们的编辑团队。
    关于 IBM 隐私条约 联系 IBM 使用条款