内容


AIX 和 System p 上的云计算

Comments

简介

近一段时间,云计算已经成为高级 IT 和业务负责人非常关注的概念。不幸的是,关于云计算及其与网格计算的关系存在许多误解。显然,如果不能正确地定义一个概念,就不可能设计和部署它。

在云计算环境中,大量系统被链接在一起,提供企业所需的 IT 服务。这样就可以从(云中的)远程系统和网络提供服务,让任何地方的任何设备能够共享这些资源(包括网络带宽)。这个可伸缩的计算模型把物理网络和服务器抽象为虚拟形式。然后,以对客户尽可能透明的方式供应和管理这些虚拟资源。Web 2.0 应用程序的出现,以及通过 Internet 进行协作和连网的需求,都使云计算越来越必要了。

云计算技术如何通过提供服务降低总拥有成本 (TCO) 并提高投资回报 (ROI)?IBM® 在云计算方面提供了什么技术,POWER 系统如何参与云计算环境?云计算与客户有什么关系,云与 AIX® 和 System p® 有什么关系?本文回答这些问题。本文讨论数据中心,以及通过 POWER 系统实现云计算如何帮助数据中心的运行方式更像 Internet,从而在其中部署云计算环境中固有的向服务架构 (SOA)。

云与网格

首先,必须清楚地理解云计算。在云计算定义的模型中,把特定的服务分配给系统,通过网络访问这些系统。这些系统组合在一起向用户提供所需的 IT 服务。在使用云计算时,客户常常并不拥有基础设施,而是租用基础设施。这一点对于 TCO 非常重要,因为它可以避免巨额投资。云与网格有什么区别呢?网格计算是一种分布式计算,它用网络集群组成一个集中的计算机。它的主要目的是提供一个高性能的基础设施,以便支持某个特定的用途(通常是某个应用程序)。

云与网格的相似之处在于,它们都需要通过软件访问其他网络上的外部组件。可以根据需要打开和关闭网格提供的基础设施。用户只为自己需要的东西付费。网格提供基础设施,而云实际上提供应用程序和服务。云是随需应变和面向服务的。云实际上是从网格发展出来的,公司主要对提供服务感兴趣,因此需要透明地提供应用程序,这种透明性是云计算的固有特性,而网格技术实际上没有这个特性。

云计算的价值

云计算为什么如此重要?这是因为它可以通过降低 TCO 和提高 ROI 给客户带来价值。它可以降低系统管理的复杂性,更高效地处理工作负载(通过跨多个应用程序共享资源),提高应用程序的部署灵活性,从而提高总体效率和灵活性。它使客户能够开发、部署和运行具有高可靠性、可伸缩性和极其出色的性能的系统。同时,它使客户不必考虑实际基础设施位于什么地方。

云计算的特点包括自我修复、虚拟化和支持绿色计算。云计算使客户能够只使用需要的资源,从而支持绿色计算。“绿色计算” 这个概念是指提高能源效率,主要是数据中心的能源效率。典型的数据中心支持运行公司应用程序所需的所有基础设施。而云计算是随需应变的,客户只使用需要的资源;云计算还是面向服务的,只在需要服务时使用它。因此可以实现绿色计算。

从高层架构来看,云可以使用网格(底层基础设施),但是反过来不行。传统的数据中心会一直运行,等待下一次处理或批量处理。无论数据中心系统是否正在运行,都要为所有系统供电,因此一直需要冷却。绿色的数据中心通常通过虚拟化软件尽可能充分地利用数据中心资源。能源消耗由管理软件控制。云计算能够解决这些问题。

IBM 通过新的 Enterprise Data Center 战略充分支持云、绿色计算和网格技术。它使用云模型向客户提供服务,而不考虑可用的计算资源。另外,它根据实际需要提供服务,这会进一步降低成本。计算现在分布在全球的资源结构中,而不是集中在运行本地服务器群的本地数据中心,这使公司数据中心的运行方式更具 Internet 风格。还应该注意,当今的许多公司已经在使用云计算了,包括 Google、Yahoo、Amazon 和 eBay。云计算绝对不是幻想。它是非常真实的,目前已经成功地实现了。

Enterprise Data Center

IBM 的新战略 Enterprise Data Center 提供对服务和信息的无缝访问,从而支持使用 Web 2.0 和云计算等新技术。采用这种新方法的数据中心具有以下特性:

  • 虚拟化的资源
  • 充分利用电力和冷却资源
  • 业务驱动的服务管理
  • 业务灵活性和安全性
  • 信息基础设施

通过使用虚拟资源,可以更快地供应资源,提高灵活性,提高处理工作负载的效率,在服务器、网络、应用程序和存储等物理资源之间实现更紧密的集成。这使 IT 部门能够更快地对业务变化做出反应,同时不影响性能或可靠性。绿色的基础设施使我们能够根据实际业务需求调整电力和冷却需求。这会减少运行应用程序所需的系统和网络数量。因此,这会降低成本和提高效率。这个服务模型能够帮助 IT 部门简化基础设施,同时尽可能提高可用性、可伸缩性和性能。这还可以提高总体运营效率。业务灵活性和安全性能够提供更安全的系统,确保系统符合 “最佳实践” 模型。基于信息系统的基础设施有助于消除孤立的系统和网络。它还会提高向客户提供信息的能力,同时提高可靠性和性能。IBM 发布的研究报告表明,通过利用这种模型,客户的系统能够减少最多 60% 的热量,减少 80% 的空间,减少最多 40% 的电力消耗,减少停机时间 58%(见 参考资料)。IBM 当前在世界各地建立了 13 个云计算中心。

IBM 和云计算

下面是 IBM 云计算的一些计划和投资方向:

  • IBM 于 2007 年 11 月宣布了 Blue Cloud™ 计划,这宣告 IBM 云计算计划进入了高速发展阶段。Blue Cloud 实际上是从 IBM Technology Adaption 发展出来的,IBM 开发人员通过 IBM Technology Adaption 系统请求计算资源以测试创新成果。这个计划基于由 IBM 技术和服务支持的开放标准和开放源码软件。云本身基于 IBM Almaden Research Center Cloud 基础设施,其中包含 IBM PowerVM™ 虚拟化。Blue Cloud 还提供基于 POWER 的系统,这对于 AIX 客户尤其有意义。
  • 在 2009 年 1 月 26 日,IBM 宣布与六所大学合作,帮助他们利用 Blue Cloud 加快科研项目,解决期限、有限的资源和负载过重的系统给项目造成的困难。同时宣布了卡塔尔 Computing Initiative,这个计划将向本地企业和行业开放 IBM 的云基础设施。例如,它将帮助石油行业勘探石油和天然气。
  • 在 2008 年 6 月,IBM 宣布启动非洲的第一个云计算中心。IBM 为此投资 1.2 亿美元,帮助构建和改造基础设施,支持政府服务、银行和电信公司。这个中心提供 Web 2.0 技术、新一代银行系统和一个面向服务架构 (SOA)。
  • 在 2008 年 7月,IBM 宣布计划在它的研究机构建立一个新的数据中心 North Carolina Data Center,使用它向客户销售云计算服务。这个计划的投资为 3.6 亿美元,最初的场地面积为 60,000 平方英尺。这个机构在相同的服务器上运行多个应用程序,使用虚拟化技术降低电力消耗。
  • 在 2008 年 2 月,IBM 宣布计划在中国无锡建立第一个云计算中心 China Cloud。这是 IBM 与无锡当地政府机构和业务伙伴的合作项目。这个项目将提供云计算环境,替代传统的数据中心,使每家公司不必拥有和管理自己的系统、硬件和软件。

云计算:POWER 和 AIX

本节讨论 Power Systems™ 和 AIX 本身如何适应云计算。首先谈谈 AIX V6.1。

  • 工作负载分区 (WPAR)。这个新特性只在 AIX 6.1 中可用,它可以减少 POWER 服务器上的操作系统映像(内核)数量。与 Sun 容器(container)相似,它允许在一个内核或操作系统分区中驻留多个应用程序或工作负载环境。可以把 WPAR 看做虚拟的操作系统分区。这项创新实际上非常适合在云中使用,因为它允许以更快的速度部署应用程序和服务,常常只需要几分钟。尽管基于系统管理程序的逻辑分区有助于对机器中的硬件进行整合和虚拟化,但是操作系统分区能够提供粒度更细、更灵活的系统和工作负载管理方法。最终结果是大大提高了使用资源的效率。同时,它使 IT 能够快速部署新的工作负载分区,更快地应对业务需求的变化。
  • 动态应用程序可移动性。这是 AIX V6.1 中另一个重要的新特性,它允许客户机在不停止应用程序或 WPAR 的情况下重新定位整个工作负载分区。其他主流硬件厂商都不提供这个特性,这项创新也非常适合在云中使用。它让云管理员能够把工作负载从利用率高的服务器转移到利用率低的服务器,从而提高性能。另外,它还让管理员能够在非高峰时间段(比如夜间或周末)转移工作负载,这样就可以实际关闭在这些时间段不需要的硬件,从而节省电力。与 POWER6™ 中的动态分区可移动性不同,动态应用程序可移动性只在 AIX 6.1 中可用。它还可以用于更老的 POWER 硬件。
  • 安全性改进。安全性是云计算的另一个重要方面。AIX V6.1 对安全性做了许多改进,包括基于角色的访问控制 (RBAC)、加密的文件系统、可信的执行以及对 AIX Security Expert、Trusted AIX 和 Long Pass Phrase Support 的改进。RBAC 让非根系统管理员能够执行系统管理任务,这对于总体数据中心/安全透明性很重要,这是云计算的另一个重要特性。

PowerVM

在 POWER 服务器上支持云计算的最重要的技术因素是适用于 AIX 的虚拟化特性,即 IBM 虚拟化引擎 PowerVM。下面的特性和功能对于云环境尤其重要:

  • 硬件虚拟化。这允许对硬件组件进行虚拟化。对于 CPU,它能够从共享的处理器池跨多个操作系统共享资源。实际上,可以把空闲计算机的处理器能力 “借给” 单一托管服务器上工作负载大的其他分区。这通过 uncapping 分区实现。
  • 微分区。这个特性让一个 CPU 能够支持最多 10 个主机分区,每个分区可以只使用一个 CPU 的 1/10。这有助于向云中的系统供应数量几乎不受限制的资源。它还支持快速供应资源,满足紧迫的业务需求,提高 IT 的敏捷性。
  • 虚拟 I/O 服务器 (VIO)。这种特殊的分区向使用 VIO 服务器的客户机提供 VIO 资源。这包括存储(虚拟 SCSI)和连网(共享以太网)。
  • LX86。这个新特性支持把 x86 编译的 Linux® 应用程序转移到 POWER 系统上,而不需要把应用程序迁移、编译或移植到 POWER 上。这个特性的重要性在于,它允许垂直扩展 Linux on Power (LoP) 系统,避免使用包含大量 x86 系统的水平服务器群。通过使用这个特性,以前的 x86 Linux 客户机可以利用 POWER 的 RAS、性能和可靠性,这使它们更适合云计算环境。
  • 分区可移动性。这个特性只在 POWER 6 服务器上可用,它允许在物理服务器之间转移 AIX(或 Linux)分区,而不需要停止应用程序。这可以提高系统的可用性,帮助减少计划内停机。

Capacity on Demand

POWER 能够为云计算提供的一个重要益处(有时候会被忽视)是 Capacity on Demand (CoD),这适用于 POWER 服务器上运行的 AIX 和 Linux 分区。这个特性提供对于云计算非常重要的灵活性和随需应变功能。CoD 支持根据需要启用 CPU 和 RAM。传统的 Capacity Upgrade on Demand (CuoD) 系统支持永久地启用已经购买的 CPU 或 RAM。试用 Capacity on-demand 允许免费试用未启用的处理器或 RAM。

CoD 中最近增加的新特性和功能使它更适合云计算。它允许客户临时启用和禁用 CPU 或 RAM,从而应对工作负载的高峰和低谷。实际上,客户随时可以开始和停止请求,只需在每季度末根据使用量付费。这使用 POWER 系统中最近添加的 On/Off Capacity on-demand 特性。另一个新特性是 Utility Capacity on Demand,这借用了效用计算的概念。这支持从共享的处理器池提供计算能力。计算能力备用有助于提高可用性,允许只启用最少量的处理资源,可以在发生紧急事件时启用更多的处理资源。这个特性与下面讨论的 PowerHA™ 集成。

PowerHA (HACMP)

在当今的许多环境中,停机是完全不可接受的,PowerHA 为客户提供这种环境中需要的可用性。同样,云计算也必须有强大的可用性机制。PowerHA 能够应对计划内和计划外停机,能够在发生硬件故障时从一台服务器向另一台服务器进行故障转移。它还有一个可选特性 PowerHA/XD,这为客户提供发生重大灾难时的业务连续性。如果在您系统所在的地区发生重大灾难,您该怎么办呢?这个产品可以为云提供重要的灾难恢复安全保障。

RAS:可靠性、可用性和可伸缩性

当今的 POWER 服务器不仅更像大型机(例如 IBM 595p),而且逐渐增强了本身的稳定性。改进的一种方式是借鉴了大型机 IBM System z® 的 RAS 特性(可靠性、可用性和可伸缩性)。RAS 特性对于云计算是必需的,因为云的资源必须一直运行。下面是最近在新的 POWER6 架构上实现的一些 RAS 特性:

  • 处理器重试。IBM POWER6 中的 CPU 现在允许继续尝试执行失败的指令。它把所有数据存储在芯片中,可以在发生错误时恢复以前的状态。通过使用 CoD,它可以搜索空闲的处理器,或把指令转移到未使用的处理器。
  • First Failure Data Capture (FFDF)。这个特性让服务处理器 (SP) 能够隔离错误,并在日志中记录在实际故障点之前发生的事件。对于至少有两个核的系统,在发生处理器故障时,会动态地分配处理器。这种自我修复特性是云中的系统必需的特性。
  • 热节点添加和替换。这个新特性只能在最高级的 IBM 595p 上使用。它支持在不需要重新引导的情况下添加、禁用和修复整个 CPU。这种灵活性对于云计算很重要,它使数据中心能够灵活地动态添加和修复资源。

其他 RAS 特性包括动态固件维护以及用于服务器和 I/O drawer 的可热交换磁盘托架。这些特性也可以增强数据中心的灵活性。

结束语

尽管云计算可能不是许多人认为的万灵药,但是与网格相比,它确实更有优势。主要原因在于,云计算提供业务服务,而不是像网格那样只提供基础设施组件。另外,IBM 和其他公司已经在云计算方面投入了大量资源和精力,这说明对云的需求是确实存在的,实现云计算的功能是实际可用的。本文讨论了云计算的相关概念以及 AIX 和 Power 系统为什么适合云计算环境。一些因素包括:虚拟化(PowerVM)、RAS、可用性特性以及 AIX 和 POWER 服务器的新特性/功能。云计算的前途非常光明,而运行 AIX(和 Linux)的 POWER 服务器能够在促进云计算发展方面发挥很大的作用。


相关主题


评论

添加或订阅评论,请先登录注册

static.content.url=http://www.ibm.com/developerworks/js/artrating/
SITE_ID=10
Zone=AIX and UNIX
ArticleID=395198
ArticleTitle=AIX 和 System p 上的云计算
publish-date=06082009