什么是集群?

简单的说,集群(cluster)就是一组计算机,它们作为一个整体向用户提供一组网络资源。这些单个的计算机系统就是集群的节点(node)。一个理想的集群是,用户从来不会意识到集群系统底层的节点,在他/她们看来,集群是一个系统,而非多个计算机系统。并且集群系统的管理员可以随意增加和删改集群系统的节点。

集群并不是一个全新的概念,其实早在七十年代计算机厂商和研究机构就开始了对集群系统的研究和开发。由于主要用于科学工程计算,所以这些系统并不为大家所熟知。直到Linux集群的出现,集群的概念才得以广为传播。集群系统主要分为高可用(High Availability)集群,简称 HA 集群,和高性能计算(High Perfermance Computing)集群,简称 HPC 集群。

通过下面这篇文章我们可以方方面面了解 Linux 集群涉及的硬件和软件。

基于 Linux 的集群

在 Linux 出现前,集群系统采用的操作系统主要有 VMS、UNIX 和 WindowsNT。到九十年代末期,Linux 操作系统不断走向成熟,它的健壮性不断增强,并且提供了 GNU 软件和标准化的 PVM、MPI 消息传递机制,最重要的是 Linux 在普通 PC 机上提供了对高性能网络的支持,这样就大大推动了基于 Linux 的集群系统的普及和发展。

Linux 服务器集群系统

Linux Virtual Server 项目针对高可伸缩、高可用网络服务的需求,给出了基于 IP 层和基于内容请求分发的负载平衡调度解决方法,并在 Linux 内核中实现了这些方法,将一组服务器构成一个实现可伸缩的、高可用网络服务的虚拟服务器。

我们可以通过 Linux 集群项目--LVS(Linux Virtual Server) 的创始人和主要开发人员章文嵩博士来了解这一集群系统。

Linux 高性能计算集群

高性能计算(High-Performance Computing)是计算机科学的一个分支,它致力于开发超级计算机,研究并行算法和开发相关软件。高性能计算主要研究如下两类问题:1) 大规模科学问题,象天气预报、地形分析和生物制药等; 2) 存储和处理海量数据,象数据挖掘、图象处理和基因测序;

当论及 Linux 高性能集群时,许多人的第一反映就是 Beowulf。起初,Beowulf 只是一个著名的科学计算集群系统。以后的很多集群都采用 Beowulf 类似的架构,所以,实际上,现在 Beowulf 已经成为一类广为接受的高性能集群的类型。下面这系列文章就是围绕 Beowulf 展开的讨论。

IBM 研发的 Linux 集群 Cluster1350 是定位于高性能计算的一套解决方案,集成了众多 IBM 与非 IBM 的先进的软硬件技术,有其特有的技术优势与强大的服务支持。

集群系统 MOSIX

MOSIX 是由 Jerusalem 的 Hebrew 大学开发的,它是一个软件管理层, 为 Linux 内核扩充了高性能集群计算支持能力。它采用单一系统映像模式 SSI(Single System Image),支持所有的UNIX接口和机制,它最大特点是易使用性和透明性。

MOSIX 是一种特殊的透明形式的集群,它很容易建立并且只需投入最少的时间和精力就可产生积极结果。下面这篇教程可以指导您建立自己的 MOSIX 群集。

构建 Linux 集群

如何搭建自己的 Linux 集群呢? 这可能是大多数读者非常希望知道的。“安装大型 Linux 集群”系列文章介绍了如何构建基于 IBM® System x®(TM)和 IBM® TotalStorage® systems 的 Linux® 集群。

此外,我们可以选择许多开源软件来构建自己的集群系统。

IBM 与 Linux 集群