在用户日常的系统使用和维护中,经常面临以下两个问题:一,系统硬件升级时的宕机时间较长;二,系统资源无法均衡利用,造成资源浪费。针对以上问题,IBM Power7 系统提供了挂起和恢复功能,挂起是指 LPAR 处于待机 / 休眠的状态,它占用的资源可以被其他 LPAR 使用,而恢复意味着分区可以从休眠恢复到挂起时的状态,整个过程中 LPAR 的状态信息存放在存储设备的页交换空间里,因而它可以有效地减少宕机时间,合理分配和使用系统资源。本文详细介绍了挂起和恢复的基本原理、系统状态机转换、并图解介绍了系统挂起恢复的基本流程,希望能给系统实施人员和系统管理员的日常工作提供参考。
名词解释
RSDP: Reserved Storage Device Pool(存储设备池)
VIOS: 虚拟 IO 服务器
LPAR: Power 系统的逻辑分区
LPM: Logical Partition Mobile(逻辑分区迁移)
在 IBM POWER7 系统中,VIOS 支持 AIX 或者 Linux LPAR 的挂起和恢复,当一个 LPAR 挂起的时候,其上运行的操作系统和应用都被挂起,整个 LPAR 的运行状态被保存下来。当恢复 LPAR 的时候,所有挂起时运行的进程都被复原。
一旦一个 LPAR 处于挂起状态,它占用的所有 CPU 和内存资源都可以被其他 LPAR 利用,与 VIOS 相关的虚拟适配器的配置信息暂时被移除,被保存在存储设备中,留做恢复时使用。这时 HMC 中该 LPAR 显示的状态为挂起,在挂起状态下,任何计划中或意外的断电都不会影响该 LPAR。
- 均衡利用资源,可以按照应用系统的需求,更加合理地安排资源的使用,当资源紧张时,通过挂起部分 LPAR,释放出资源满足其他紧急的业务需求,待资源宽裕时,再恢复挂起的 LPAR。
- 方便硬件的维护和升级,当需要升级时挂起系统,升级完毕,恢复系统即可。
- 由于该处理方法只涉及一个 server 服务器,且只需 PowerVM 标准版,所以相比迁移(LPM)的方式要简单省时经济。
- 对于应用的开启关闭需要较长时间的系统,传统的方式是通过关机进行系统维护,采用挂起和恢复功能,可以有效减少系统维护的宕机时间。
为方便读者理解挂起和恢复的功能,下面介绍两个基本概念:RSDP 和系统状态机转换,其中 RSDP( 保留存储池 ) 用于给 LPAR 分配存储空间,状态机转换主要是讨论在挂起和恢复中系统处于的运行状态。
-
RSDP 的含义
当 LPAR 处于挂起状态时,其状态信息存放在一个保留的存储设备中,这个存储设备是通过 HMC,在 RSDP( 保留存储池 ) 中进行分配的,其容量大约是该 LPAR 最大内存的 110%。RSDP 包含许多保留存储设备,也叫做换页空间,每一个要挂起的 LPAR 都必须拥有自己的换页空间。通常我们将一个 VIOS 分区与 RSDP 关联,提供换页服务,当然为了提供冗余路径,保证高可用的换页空间设备,我们也可以将另外一个 VIOS 也与 RSDP 关联起来。
当系统满足挂起条件时,RSDP 可以在 HMC 中设置,既可以通过 HMC CLI, 也可以通过图形界面。当执行挂起操作时,HMC 从 RSDP 中分配存储空间给相应 LPAR,通常它会自动挑选一块没有被使用而且大小合适的空间用做存储 LPAR 挂起时的数据,当然必须保证 RSDP 的该部分存储在系统挂起时是可用的。
举例说明 RSDP 中页空间的分配,在本实例中,采用实施中最典型的双 VIOS 分区,划分了 4 个 LPAR,RSDP 的设计既包含外部存储也包含内部存储,既有双路径连接也有单路径连接,基本覆盖了 RSDP 中涉及的所有情况。
其中 LPAR1,LPAR2,LPAR3 使用 SAN 磁盘作为换页空间设备,LPAR4 使用本地磁盘作为换页空间设备,并关联在 VIOS 分区 2 上,两个 VIOS 分区如图所示和 SAN 连接,绿线代表换页空间设备映射给 VIOS 分区 1,蓝线代表换页空间设备映射给 VIOS 分区 2,其中换页空间设备 2(Paging space device2) 和换页空间设备 3(Paging space device3) 拥有双路径。
图 1.RSDP 中换页空间的分配(查看大图)
在 PowerVM 的标准版中,我们可以在 RSDP 中管理换页空间,比如以下的操作:
- 创建和删除 RSDP
- 从 RSDP 中添加或删除 VIOS
- 在 RSDP 中添加或删除换页空间设备
-
挂起恢复中系统状态机转换
以下是 LPAR 在运行中基本的状态机转换,本文侧重于挂起恢复部分的介绍。
图2.LPAR 状态机转换
-
挂起
LPAR 的状态信息存放在存储设备中,任何计划中或意外的断电都不会影响该 LPAR。
在 HMC 界面里,挂起操作通常要经过以下流程:
- 启动挂起操作。
- 挂起操作的环境验证,包括挂起功能是否使能,RSDP 是否存在等。
- 保存 HMC 数据,也就是 LPAR 的系统配置信息。
- 保存 LPAR 的数据,也就是操作系统的运行状态信息。
- 完成挂起操作。
-
恢复
使 LPAR 恢复到挂起时的运行状态。
在 HMC 界面里,恢复操作通常要经过以下流程:
- 启动恢复操作。
- 恢复操作的环境验证,系统硬件是否符合 LPAR 配置要求,RSDP 是否存在等。
- 恢复 LPAR 配置。
- 恢复 LPAR 的数据,也就是操作系统的运行状态。
- 完成恢复操作。
-
关闭
将 LPAR 由挂起状态置为停机,通常换页空间会被释放,所有虚拟适配器的配置信息都会保存起来,也包括一些操作系统运行信息,以保证 LPAR 以后可以被正常激活。
如果是强制停机,部分运行时的配置、数据信息可能会丢失,使得 LPAR 处于不一致的系统状态,从而导致 LPAR 再次激活时出错,所以不推荐这种状态转换。
-
LPM
LPAR 的迁移,分为动态迁移和静态迁移,具体参考 IBM 其他文档介绍。
- 迁移
将挂起的 LPAR 迁移到另外一台主机上,该技术基于 LPM,在迁移过程中,LPAR 的配置文件,操作系统运行时状态信息都会迁移到目标主机,从而可以在新的主机上被恢复。
-
挂起
-
配置需求
为支持挂起 / 恢复功能,LPAR 需满足以下需求:
-
软硬件最低版本
- POWER 7 Firmware 7.2.0 SP1
- HMC v7 r7.2.0
- VIOS 2.2 0.11-FP24 SP01
- AIX 7.1 TL0 SP2 or AIX 6.1 TL6 SP3
-
LPAR 配置要求
- 用于存放 LPAR 状态的存储设备 (RSDP) 必须永久地与 LPAR 连接。
- 确保 RSDP 中至少存在一个可用的 VIOS 活动分区
- 该 LPAR 不能挂载物理的 IO 设备。
- 该 LPAR 不能是全分区,IBM i 分区,VIOS 分区或者服务分区。
- 该 LPAR 不能是一个 alternative error logging 分区 .
- 该 LPAR 不能有 Barrier Synchronization Register (BSR)
- 该 LPAR 不能有 huge memory pages
- 当执行挂起或恢复操作时,系统监控必须关闭。
- 该 LPAR 不能有基于逻辑卷的 rootvg 卷组或者包含任何外置的光学设备。
- NPIV 必须包含两个 WWPNs, 并且在交换机中被划分到同一个 zone.
- 挂起 LPAR 前,必须将 VIOS 中的虚拟光学库手动删除。
-
软硬件最低版本
-
创建 RSDP
要使用挂起和恢复功能,必须创建 RSDP,
图 3.RSDP 的管理配置入口(查看大图)
- 创建支持挂起和恢复的分区
- 验证分区是否支持挂起和恢复功能
-
挂起分区
图 4.启动 LPAR 的挂起操作
-
恢复分区
图 5.启动 LPAR 的恢复操作
挂起和恢复功能操作简单,实践中减少了系统维护过程中的宕机时间,使资源得到合理分配和利用,从而有效地简化了 IT 人员的系统维护工作,今后会在工程中得到广泛的应用
学习
-
PowerVM Virtualization on IBM System p: Introduction and Configuration Fourth Edition:介绍 IBM Power 服务器上的 PowerVM 虚拟化技术。
-
IBM PowerVM Live Partition Mobility:讨论 Live Partition Mobility 如何帮助技术人员、企业架构师和系统管理员。
-
IBM PowerVM Virtualization Managing and Monitoring:介绍了 Power 服务器上的虚拟化管理技术。
-
Hardware Management Console V7 Handbook:介绍了 Power 系统的管理平台 HMC。
- AIX and UNIX 专区:developerWorks 的“AIX and UNIX 专区”提供了大量与 AIX 系统管理的所有方面相关的信息,您可以利用它们来扩展自己的 UNIX 技能。
- AIX and UNIX 新手入门:访问“AIX and UNIX 新手入门”页面可了解更多关于 AIX 和 UNIX 的内容。
- AIX and UNIX 专题汇总:AIX and UNIX 专区已经为您推出了很多的技术专题,为您总结了很多热门的知识点。我们在后面还会继续推出很多相关的热门专题给您,为了方便您的访问,我们在这里为您把本专区的所有专题进行汇总,让您更方便的找到您需要的内容。
-
AIX and UNIX 下载中心:在这里你可以下载到可以运行在 AIX 或者是 UNIX 系统上的 IBM 服务器软件以及工具,让您可以提前免费试用他们的强大功能。
- IBM Systems Magazine for AIX 中文版:本杂志的内容更加关注于趋势和企业级架构应用方面的内容,同时对于新兴的技术、产品、应用方式等也有很深入的探讨。IBM Systems Magazine 的内容都是由十分资深的业内人士撰写的,包括 IBM 的合作伙伴、IBM 的主机工程师以及高级管理人员。所以,从这些内容中,您可以了解到更高层次的应用理念,让您在选择和应用 IBM 系统时有一个更好的认识。
讨论
- 加入 developerWorks 中文社区。查看开发人员推动的博客、论坛、组和维基,并与其他 developerWorks 用户交流。