IBM®
跳转到主要内容
    中国 [选择]    使用条款
 
 
Select a scope:Search for:    
    首页    产品    服务与解决方案     支持与下载    个性化服务    
跳转到主要内容

developerWorks 中国  >  Grid computing  >

管理网格,第 1 部分: 网络和基础设施

developerWorks
文档选项

未显示需要 JavaScript 的文档选项


级别: 中级

Martin C. Brown (questions@mcslp.com), 自由撰稿人和咨询顾问

2006 年 11 月 16 日

管理网格涉及很多元素,从部署网格使用的网络和硬件到安全、作业管理以及在网格执行过程中所生成的统计信息,这可以让我们更有效地对作业进行管理。在这个 4 部分的 “管理网格” 系列文章中,我们将来了解一下网格管理过程的一些关键因素,例如确定硬件和网络基础,以及如何使用这些信息作为调度、预测和扩展工具。此处,我们将介绍网格计算的核心元素,以及网格的硬件架构,以及它是如何影响网格管理的其他方面的。

简介

选择正确的网络硬件和网格硬件在管理网格时会造成很大的区别。如果我们对网格基础设施进行一些简化,它将很容易进行部署。但随着网格需求和资源的不断增加,长期发展之后,网格将变得很难进行扩充。在这两个元素之间达到平衡是有效管理网格的关键。

这个共分 4 部分的 “管理网格” 系列文章的第 1 部分将介绍在我们更进一步详细介绍网格管理背后的管理过程之前需要考虑的一些关键元素。我们将讨论如何处理更新和硬件失效问题,如何实现并应用安全性,以及如何监视并测量网络。





回页首


网格管理概述

网格的使用和开发有很多方面都需要考虑 —— 从安全基础、应用程序、架构以及用来部署和分发任务所使用的方法。一旦网格和应用程序都就绪之后,就需要在解决其他一些关注的问题了。

例如,我们可能会使用某种监视系统来监视网格(请参看 参考资料)。从这些信息中,我们可以决定有关任务的负载以及任务在网格上的分发的问题,从而最好地利用可用资源。

记住网格管理从安装和设置网格环境时就开始了。因此开始管理过程的地方就是构成格其余部分的框架的网络和硬件。





回页首


网络结构和拓扑

网格使用的网络结构和拓扑对于网格的效能、网络性能(这对于网格应用程序来说可能至关重要,也可能并不重要)、对网格环境将来的管理、支持和扩展都有重大的影响。

最开始,我们需要确认要部署的网格类型:专用网格、非专用网格或分布式网格。

  • 专用网格 是由专用的网络硬件和网格专用的资源构成的。专用网格对网格架构提供了最佳的控制能力和灵活性,因此我们可以选择进行所有的操作。
  • 非专用网格 是使用现有计算基础设施的资源和环境的网格。例如,一个网格在公司的桌面或服务器计算机大量空闲时而使用这些计算资源时的网格就是非专用网格。我们对于环境和网络结构的控制权很少,因为当及其不被网格使用时,我们就无法改变用来支持这些机器的核心结构。不过我们可以使用网格需求来帮助驱动当前基础设施中的变化,从而让网格的效率更高。
  • 分布式网格 是由无处不在的机器构成的,这些机器可能是内部的,也可能是外部的;可能分布在 WAN 上,也可能分布在 Internet 上。使用分布式网格,我们实际上无法控制网络结构,但是可以控制(也有责任)确保分布式组件能够彼此有效地进行通信。

网络拓扑和硬件首先受到部署的网格类型的影响。专用的网格为选择希望使用的拓扑和网络硬件提供了最大的自由。

对于非专用网格来说,我们更倾向于依赖现有的网络和基础设施,因此我们对网络决策的控制更少。

在分布式网格中,对网络硬件和结构的任何控制或管理都简化成在网格机器通过公共网络或基于 WAN 的解决方案相互进行通信的方法。管理所关注的内容将着眼于提供访问、安全性(包括防火墙和认证)以及在发生失效的情况下仍然提供连通性的备份解决方案。

常用网络硬件

不管网格网络结构的类型如何,我们需要制定的关键网络选择是硬件。如果使用了常用的网络硬件 —— 例如使用标准交换机和线缆的以太网 —— 那么网络就很容易进行部署,并且很容易与现有的环境和硬件进行集成。

采用常用网络硬件,网络结构通常都是一个精简的总线,如图 1 所示。


图 1. 常用网络拓扑
常用网络拓扑

常用网络硬件有很多优点和缺点。主要的考虑是系统的可用性和简单性。缺点与网格硬件的速度和效率有关。常用网格的特点如下:

  • 易于部署 —— 以太网交换机的购买、安装和连接都很容易。以太网卡驱动程序对于所有的平台和操作系统基本上都可以使用。
  • 价格便宜 —— 常用硬件的价格比较便宜,因此可以使网格的成本最低。
  • 易于扩展 —— 使用以太网,我们可以根据需要添加并扩展可用网络部分。使用适当的交换机和路由器,理论上来说就没有什么限制,不过在大型网络中速度可能会有所限制。
  • 速度快 —— 常用硬件的速度很快(千兆以太网甚至 10-GB 以太网),不过通常来说,随着节点数目的增加,网络的总体速度可能会降低,这可能会限制网络的扩展能力。
  • 高延时 —— 即使使用千兆以太网,发起连接和准备发送数据的延时也会很高。在高性能网格中,这可能是一个问题。

专用网络硬件

比较而言,专用硬件,例如 InfiniBand 或 Myrinet,都使用了一个完全不同的拓扑结构,它们是专门为实现很高的速度而设计的,通常采用网状结构(请参看图 2)。网状结构可以在节点之间实现快速连接,并可以对吞吐量(数据传输)或延时(连接间的延时)进行优化。


图 2. 专用网格硬件所使用的网状网络
专用网格硬件所使用的网状网络

这种采用网状结构工作的专用网络系统有很多优点和缺点,包括:

  • 速度 —— 在高性能的网格中,网络的速度和延时可能都非常关键。网状网络通常都可以消除这种问题。
  • 价格 —— 由于这些网络系统都是专用的,因此销售的价格都比较高。
  • 有限的扩展能力 —— 尽管我们通常都会使用数百、数千个节点来构建大型网络,通常都不会对性能或延时造成影响,但是网络中的节点数目的确存在一个上限。
  • 有限的支持 —— 专用网络所支持的平台和操作系统可能很少,这可能会影响希望为网格环境而安装的系统。我们通常还需要支持专用的桥或硬件来为用户提供网格连接能力。

网络持续发展的管理需求会影响对网络进行扩展和更新的方法。它们会改变对网格中任务执行的监视方式、对网格的性能和能力的测量手段,因此我们可以有效地对将来的任务和作业进行调度。

网络结构和网络选择为我们的网格建立了核心的环境。因此我们必须要确保部署的网络环境在速度、灵活性和可扩展能力之间达到合理的平衡,并且所提供的网络环境能够支持我们所选择的部署平台。





回页首


网格硬件

网格中使用的硬件从网络和计算组件的角度来看非常重要,这对于操作系统、应用程序部署、扩展计划以及成本来说都有很重大的影响。单个来说,这些只是相当微小的考虑。不过合在一起来看,它们可以对部署网格、应用更新或使用新硬件、资源或功能来扩展并增强网格时所使用的方法和模型造成很大的不同。

通常来说,网格部署有两个核心的硬件模型:

  • 定制硬件 —— 如果我们选择使用一组定制的硬件(特殊的计算环境构造/模型和平台),在部署和升级时就可以获得某些杰出的优点。采用一致的硬件环境,我们可以对操作系统、应用程序以及网格应用程序进行克隆,并可以在网格上所有的计算机之间来使用这些克隆的磁盘。
  • 常用硬件 —— 使用标准的现有组件通常成本较低,并可以简化硬件的部署,但是操作系统和软件安装就会更加复杂,因为每台机器都必须要单独进行处理。这会增加管理的负载,但是却会使故障设备的替换变得比较简单。

我们对网格部署所使用的硬件及其影响的主要关注内容包括:

  • 平台 —— 平台的核心硬件会影响操作系统,还会影响软件和部署环境。根据决策的不同,它会影响长期的管理问题,例如更新以及如何应付宕机和维护的问题。此处有两个主要选择:常用硬件,这可以提供简单易用的硬件,但是会增加兼容性和稳定性的问题);或定制硬件,这可以提供更好的稳定性,但是可能更难以更新和扩展。
  • 操作系统 —— 不同的硬件可能对使用的操作系统有所限制,因此又可能会影响到所支持的软件、安全问题以及更新和改进的可用性。
  • 设置和部署 —— 定制硬件易于设置和部署,这是因为标准化的环境可以简化部署包。采用常用硬件,我们可能会需要逐个设置机器,从而在安装所选择的网格环境之前确保已经安装了正确的驱动程序。
  • 更新 —— 尽管更新可能会需要进行调度(在本系列后续部分中将会更详细地介绍这个问题),但是我们还需要考虑对硬件进行更新的影响。在定制硬件上操作系统和驱动程序的更新都很容易部署和安装。
  • 硬件故障 —— 网格中的故障是无法避免的,我们需要能够利用网络外部的一个节点或一组节点来应付这种问题。如果出现了非常严重的硬件故障,那么我们就需要替换相应的设备。采用常用硬件,这种替换应该会很容易入手,但是设置和以后的支持则可能会耗费更多时间。
  • 扩展能力 —— 如果网格进行了扩展,我们就需要寻找合适的硬件了。选择定制或专用模型可能会将我们长期锁定到单个供应商上,并且不能有效地对网格进行扩展。常用硬件很容易获得,但是正如前面介绍的一样,这可能会对这个环境带来额外的负载。另外,使用常用硬件,新机器的速度可能比现有设备的速度更快,因此在调度和作业分发时可能需要额外的管理来最有效地使用可用资源。

网格的长期管理可能会涉及跟踪上面的问题来确保网格可以很容易地进行管理(在进行扩展或出现故障时)、修复、更新和定位。总之,我们的选择有两类:

  1. 专用的定制硬件 —— 这提供了简化的部署和管理,但是可能存在扩展和硬件故障的问题
  2. 常用硬件 —— 这需要增加管理/设置的负载,但是显然可以更容易进行扩展,寿命也长,因为常用网格会不断进行更新

随着 Web 服务和面向服务的基础设施(SOA)的发展,我们可以使用常用硬件对现有网格进行扩展,而不会对管理过程造成很大的影响。但是在学习统计信息时要记得考虑硬件之间的区别,因为网格中单个资源能力的差异会对任务的管理和分发方式造成影响。

从硬件需求的角度来看,SOA 和 Web 服务是一个伟大的里程碑。如果我们有效地使用 SOA 和 Web 服务,底层的硬件对网格应用程序的部署和开发就不再是主要问题了。然而,正如我们会在本系列后续文章中看到的一样,我们必须要能够从网格环境中获取合理的统计信息,这样才能够有效地制定作业管理决策,此处硬件和资源能力的差异就是一个问题了。

设计一个让我们可以确定甚至划分网格组件的有效逻辑结构,这会很有帮助。





回页首


逻辑结构

网格及其组织的逻辑结构与物理结构和组织一样重要。不管网格是内部的还是基于 WAN/Internet 的,我们都需要考虑有关网络的逻辑结构的问题:如何引用各个节点,如何对各个节点进行寻址,如何通过网格应用程序来使用这些信息,从而在网格之间分发任务。

从管理的角度来看,可以确定网格中的各个节点非常重要,这样我们才可以监视网格的统计信息,从而管理应用程序的配置和部署,并对各个节点开展工作。

有很多方法都可以实现有效的逻辑网络结构,包括简单的命名规则。对于完全内部的网格来说,我们可能希望使用唯一的 IP 子网来标识网格中的所有机器。如果我们选择了这种方法,就请对扩展做好规划,从而确保所选择的子网很大,因此今后扩展时不需要进行改变。使用一个单独的子网在发生路由、防火墙和隔离问题时,很容易对网络进行管理。

当我们对网络具有更多控制权时,这两种情况都更容易进行处理 —— 在专用或非专用网格中都是如此。在分布式网格中,我们要考虑使用别名机制,这让我们可以方便地标识与实际 IP 或远程节点的联系细节有关的各个节点。这样可以简化对网格的监视,而不会在使用大量主机之间的汇报机制变得复杂。





回页首


网络安全性

不管我们正在使用专用内部网络、使用公司现有资源,还是使用分布在更广泛的 Intranet 上的网格,网格的安全性都一样相当重要。

安全性包括很多方面的内容,从对使用网格个人的认证、授权,到确保网格内部资源不会暴露给非授权用户使用。在后一种情况中,非授权的访问可能会导致对存储在网格中的信息造成威胁。或者 —— 通常也是我们更关注的内容 —— 所影响的计算机可能会分配给不与网格相关的任务。这可以极大地减少网格可用的资源,从而会降低所部署的网格的性能和效用。

对于专用网格来说,网络应该使用防火墙进行隔离,如图 3 所示。


图 3. 使用防火墙来保护网格
使用防火墙来保护网格

对于资源是内部但却与现有机器共享的网格来说,我们需要通过使用加密数据交换或诸如 IPSec(Internet Protocol Security,这会在核心 IP 协议层对数据进行加密) 之类的机制确保所交换的数据是安全的。

对于 WAN 或 Internet 网格来说,使用诸如 VPN 之类的加密或认证解决方案可以确保我们可以在网络层安全地交换信息。





回页首


结束语

我们在本文中介绍了网格的一些核心问题 —— 网络和基础设施的选择,这会影响到我们对网格进行管理的方式。使用常用硬件是最简单的解决方案,这提供了最好的生存期和可扩展能力,因为我们不需要担心硬件的变化和可用性的问题。

然而,常用方法意味着管理可能也更加复杂,因为保持持续一组不同硬件和操作系统的需要会对管理过程造成更大的负载。

网络的逻辑结构也非常关键,因为这会改变我们审视网络以及如何与之进行工作的方法。最后,网格中使用的逻辑和硬件方法会影响应用安全性的方法。这个过程的安全性和管理法则在第 2 部分中介绍。



参考资料



关于作者

Martin C. Brown,马丁.布朗,是Studio B 工作室的作者,一个早期的IT主管,在跨平台集成方面经验丰富。作为一名热心的开发工程师,他曾经为一些特殊用户制作了动态站点,包括HP和Oracle,并且现在是Foodware.net的技术主管。目前他是一名自由撰稿人和咨询顾问,马丁是比较知名的,作为SME时与微软有过工作协作,他是LinuxWorld杂志的LAMP技术编辑,AnswerSquad.com团队的核心成员,并已经撰写了大量的不同主题的书籍,如微软认证,iMacs以及开放源码编程。除了这些努力外,马丁在很多平台和众多环境中依然保持是一名普通并且喜爱编程的程序员。通过 questions@mcslp.com 可以联系马丁,或者访问Web站点:http://www.mcslp.com




对本文的评价

太差! (1)
需提高 (2)
一般;尚可 (3)
好文章 (4)
真棒!(5)

建议?




回页首


IBM 公司保留在 developerWorks 网站上发表的内容的著作权。未经IBM公司或原始作者的书面明确许可,请勿转载。如果您希望转载,请通过 提交转载请求表单 联系我们的编辑团队。
    关于 IBM 隐私条约 联系 IBM 使用条款