内容


避开 AIX LPAR 迁移中的陷阱

Comments

在计算机世界中常常会出现这样的情况:在过去一年中运行良好的系统忽然有一天硬件系统无法满足它的需求,因此需要更多的资源。所幸的是,采用最新的 AIX LPAR 技术,可以更加轻松地将一台服务器从一部分硬件迁移到另一部分硬件中,并且宕机时间非常短暂。IBM pSeries® 和 System p® 硬件固有的虚拟化、可移植性和管理功能为系统管理和支持提供了灵活性。但是,在 AIX LPAR 迁移过程中总会出现一些拦路虎。本文关注如何绕开这些影响 AIX LPAR 迁移过程的常见 “陷阱”。

陷阱 1:资源短缺

在迁移到最新 LPAR 的过程中,首要的事情就是确保拥有足够的可用资源。最常见的迁移原因就是原始硬件上的资源无法继续支持服务器的运行。然而,最坏的情况莫过于花了很长的时间进行迁移后才发现新硬件功能不全。

尽管本文并不打算成为有关 LPAR 设计的分类分档,但是新的 LPAR 具有所有必需功能这一点非常重要。您需要多少个以及什么类型的处理器?处理器是专用的,还是来自一个共享池?内存够不够用?I/O 适配器如何?是否应该设置一个虚拟 I/O(VIO)服务器来管理资源?是否存在空间、机架或制冷限制?

为了回答这些以及其他一些问题,IBM 提供了 Systems Workload Estimator(见 参考资料)。该工具可以提供关于您所需的新设备的大致分类信息,以及关于所需设备的类型的信息。您随后可以结合该工具提供的信息和第三方提供的信息来正确地判断满足 LPAR 需求所需的资源。

陷阱 2:建立根卷组

现在看看 LPAR 迁移中的技术方面,首先必须关注根卷组(rootvg)。就好象房屋需要坚固的地基一样,rootvg 必须足够可靠才能保证成功完成迁移。可以通过三种方法来建立 rootvg,每种方法都有其优点和缺点。

策略 1:刷新操作系统安装

在这个策略中,操作系统从 CD、DVD 或 Network Installation Manager (NIM) 安装到磁盘上,从而创建 rootvg。

  • 优点:这种安装最为彻底并且是加载操作系统的最原始的方法。多年来,我发现对于经历了从 4.3.2 到 5.3 的每一个版本和发行版迁移的服务器,即使 AIX 操作系统迁移过程是最健壮的升级路径之一,软件问题和第三方应用程序仍然都会成为操作系统迭代过程中的绊脚石。在最好的情况下,这些因素会使服务器变得混乱,至于最坏的情况,服务器可能变得复杂并且难以升级和管理。但是,通过使用最基本的安装介质,可以保证操作系统恢复到它出厂时的状态。
  • 缺点:不幸的是,对于这种非常彻底的安装,需要将新的 LPAR 恢复到旧服务器的状态,这将耗费大量时间。您不得不重新创建用户 ID、组、文件系统、环境变量,以及所有定义服务器的特性。如果服务器比较简单,那么这样做也是可行的。但是如果服务器是一个拥有数百名用户的复杂环境,那么最好选择另一种方法。

策略 2:物理磁盘迁移

在这个策略中,将从原始服务器上移除物理磁盘,并将它们插入到新的硬件中,然后分配给 LPAR。

  • 优点:通过将根磁盘移出旧服务器并移入到新服务器,可以确保新服务器拥有与旧服务器相同的身份。rootvg 中的几乎所有内容都被保留,并且所有内容在第一次启动后变得可用。
  • 缺点:这个策略并不是最佳选择,原因有四:第一,在实际迁移磁盘时,您可能会摔落或损坏磁盘。第二,原始服务器可能不具备使新硬件发挥功能所需的设备驱动程序,因而需要搜索并安装额外的软件。第三,很可能需要删除或重新配置设备才能使新 LPAR 生效(稍后将详细讨论这点)。最后一点是,磁盘的尺寸可能与新硬件不匹配,因此完全排除了这一选项。

策略 3:系统备份和恢复

在这个策略中,将把原始服务器备份到一个 mksysb 映像,然后放到新硬件中。

  • 优点:我倾向于选择这个策略,因为它保留了原始硬件,允许新的 LPAR 自动获得设备驱动程序(当使用补充的基本介质或 NIM 服务器时),并且带来了所有用户 ID、组、rootvg 文件系统和环境变量。在所有选项中,这种方法对原始服务器和新 LPAR 的影响最小。
  • 缺点:这种方法的主要缺点是原始服务器上的 rootvg 需要不断修改。在对原始服务器的修改引起显著内容变化之前,mksysb 映像只有在经过很长时间之后才会被 “刷新”。但是,如果在防止将经常修改的数据放入根卷组内部时采取最佳实践,那么这种方法就可以提供充足的时间进行测试和部署。需要获取临时 IP 地址或网络适配器来实现构建,然后再修正它们。

同样,需要确定将用于 rootvg 磁盘的磁盘类型。服务器是否使用内部 SCSI 磁盘或 Storage Area Network (SAN) 启动技术?如果使用 SCSI 磁盘,那么可以很容易找到 SAN 驱动程序,但是出现硬件故障的风险也会更高。如果使用 SAN 启动技术,重启和 I/O 性能将会非常快,但是磁盘无法轻松地在不同 LPAR 之间移植,因为 Fibre Channel 适配器的全局名称(WWN)被集成到磁盘属性中。

陷阱 3:管理外部卷组

在选择操作系统策略时,需要计划如何包含外部/非根卷组。对于 rootvg,有多种方法可以将数据迁移到新的 LPAR,包括执行备份和恢复操作,使用 SAN 技术(比如 IBM SAN Volume Controllers (SVC) 上的 Flash Copy 特性),或者仅使用新硬件上的原装数据线、适配器和磁盘。但是不管使用哪种技术,都需要考虑一些问题。

首先,保存一个副本或从原始服务器上备份 /etc/filesystems 文件。尽管 importvg 等命令将检测外部卷组中的内容,但是可能无法有序地将内容导入到磁盘,从而致使文件系统按照错误的顺序挂载。当客户拥有多个外部卷组并且文件系统按照分层结构连接,那么就很容易出现上述情况。

例如,考虑一个 Oracle 数据库服务器,它包含三个卷组和相关的文件系统:

  • datavg1:/opt/app
  • datavg3:/opt/app/oracle
  • datavg2:/opt/app/oracle/product

如果按照数字顺序导入这些卷组,那么系统将尝试挂载 /opt/app/oracle/product,随后使用 /opt/app/oracle 再次挂载。但是,通过备份原始 /etc/filesystems 文件,可以为在新 LPAR 上组织相同的文件提供一个参考。

其次,保存磁盘信息的副本,尤其是磁盘将从原始服务器直接移动到新 LPAR 时。确保归档 Physical Volume Identification (PVID) 编号、卷组名称、健康检查时间间隔以及任何其他调整参数。通过这种方式,就可以准确地识别、配置和导入磁盘。

第三,考虑在迁移期间可以执行的其他磁盘维护工作。利用目前不可用的服务器来修改磁盘体系结构。可以将外部卷组修改给大型或可伸缩的卷组。可以使用单个大逻辑单元号(LUN)来替代许多小磁盘。可以回收空闲的文件系统或磁盘空间以节省资源。

陷阱 4:设置和配置设备

完成 LPAR 迁移的最后一个挑战是正确地设置所有设备。根据您此前使用的策略,设备管理可以非常麻烦,也可以非常轻松。

在迁移到新服务器之前,花些时间从现有设备获得所有配置参数。lsdev –C 命令将展示旧服务器上的所有设备;随后可以针对输出运行 lsattrlscfg 命令来获得所有定制的设置和属性。由于硬件不同,因此有些参数不需要按照与旧服务器相同的方式应用到新 LPAR,但是有些参数应当保留下来,比如 IP 别名、内存配置参数和 Fibre Channel 速度。

如果根磁盘从原始介质或 NIM 安装获得映像,那么在服务器启动时将需要设置和配置所有设备(NIM 使用的网络适配器除外)。这是设备配置中最耗费时间的一个过程,因此需要获得最多的关注。如果您使用 NIM,那么在进行接入(cutover)时可能需要修改 IP 地址和/或主机名。

如果根磁盘将被实际移动到新的 LPAR,或者如果在 NIM 中选择重新创建设备,那么需要对大量新旧设备进行归类。例如,如果原始服务器有一个 Ethernet 适配器(ent0),而新服务器有一个 Ethernet 适配器(ent1),那么新服务器将有一个已定义的适配器(ent0),一个可用的适配器(ent1),并且任何活动接口都不具备有效的 IP 地址。因此,您不得不使用 rmdev –dl <interface> -R 命令删除所有接口,使用 cfgmgr 重新检测正确的设备,然后设置一个 IP 地址。该步骤适用于其他已定义的适配器和磁盘。

同时,我发现一个问题再次出现,那就是设备定义没有与物理硬件直接关联 — 特别是数据库服务器上的异步 I/O 设备(AIO)。对于这些设备,首先运行 mkdev 操作以使设备可用,然后运行 chdev 将设备设置为重启后可用。否则,激活新的 LPAR 后,DBA 将遇到麻烦。

结束语

根据多年的迁移经验,我成功迁移过许多 LPAR。有一条建议再怎么强调也不过分:一定要做好充分的计划!收集大量有关原始服务器的信息看似简单,并且检查硬件的每个部分似乎是浪费时间,然而正是 PVID、Maximum Transmission Unit (MTU) 大小或超时值等抽象的东西多次帮助我完成了迁移。通过避免这些常见的陷阱,您将能够在 LPAR 迁移中获得成功!


相关主题

  • UNIX on Power systems:了解有关 AIX Power 系统软件的更多信息。
  • HMC attached system setup:了解如何使用 Hardware Management Console 设置您的系统。
  • AIX wiki:从这个协作站点获得所需的技术信息。
  • AIX and UNIX 专区:developerWorks 的“AIX and UNIX 专区”提供了大量与 AIX 系统管理的所有方面相关的信息,您可以利用它们来扩展自己的 UNIX 技能。
  • AIX and UNIX 专题汇总:AIX and UNIX 专区已经为您推出了很多的技术专题,为您总结了很多热门的知识点。我们在后面还会继续推出很多相关的热门专题给您,为了方便您的访问,我们在这里为您把本专区的所有专题进行汇总,让您更方便的找到您需要的内容。
  • Systems Workload Estimator:下载 Systems Workload Estimator 并在您的服务器硬件上使用。
  • developerWorks 技术活动网络广播:随时关注 developerWorks 技术活动和网络广播。

评论

添加或订阅评论,请先登录注册

static.content.url=http://www.ibm.com/developerworks/js/artrating/
SITE_ID=10
Zone=AIX and UNIX
ArticleID=416525
ArticleTitle=避开 AIX LPAR 迁移中的陷阱
publish-date=07272009