网格计算是一种分布式计算,它将位于不同地点的各种计算资源汇集起来以完成共同任务。
两种计算类型都依赖共享计算基础设施,但网格计算更侧重于解决大规模科学或工程问题,而分布式计算则专注于更简单的任务。
网格计算常与被称为“重大挑战”的计算类型相关联——这类计算问题植根于科学或工程领域,并具有广泛的应用范围。网格计算助力解决的最著名重大挑战或许当属 CERN 的大型强子对撞机,它是全球最强大的粒子加速器。
除应对重大挑战外,网格计算还用于各类更实际的商业用途,包括大数据管理、高速数据分析、洞察生成、科学研究、复杂的气象与金融模拟,以及高性能计算 (HPC)。
网格计算环境由不同的节点组成,这些节点是被编程执行特定任务的计算机、设备和资源。网格计算的这一特性使其比集群计算(另一种通过网络共享计算资源的计算类型)更具多样性。 虽然计算机集群具有固定的硬件和任务,但网格计算拥有灵活得多的资源共享环境。
典型的网格计算网络包含两种组件:节点和中间件。
网格计算架构依赖三类网格节点来完成网格计算任务:
典型的网格计算架构由四个层次组成,包括应用层、中间件层、资源层以及使各节点能够连接到网络的底层:
根据用途不同,网格计算通常可划分为五种基本类型。
资源清扫网格(也称为 CPU 资源清扫网格或清扫循环)在布局和用途上与计算网格类似,但存在一个关键差异。在资源清扫网格中,节点和计算机仅向更大的网格贡献可用资源。此处的资源清扫一词指在连接的计算资源网格中搜寻可用资源的过程。
在资源清扫网格中,部分节点执行与网格宏观目标相关的任务,而其他节点则被用于不相关的其他用途。若网络用户需要为非网格相关目的访问计算机,网格软件会自动识别可用空闲节点与计算资源并进行分配。
协作网格(或称协作网格计算框架)使团队能够利用计算网格更便捷地访问共享工作与资源。
协作网格让分布广泛的团队在追求共同目标时,能实时共享专业知识并协同贡献工作成果。例如,通过整合全球不同大学和机构提供的共享数据与计算资源,协作网格助力众多气候科学家和物理学家协同开展研究工作。
模块化网格专注于将特定系统内的计算资源分离为独立模块,以提升应用程序性能。在模块化网格中,GPU、存储器和内存等常用共享资源会被分解并重新组合,从而更高效地运行特定应用程序和服务。
这种模块化方法使 IT 团队在定制计算环境以适应需求时能获得更大灵活性。例如,在模块化网格中,可根据单个应用程序或服务的具体资源需求进行针对性配置。
相比传统架构,网格计算能让企业更快速高效地处理海量数据。通过利用网格计算将资源用于多种商业目的,企业获得了更高的灵活性、可扩展性和成本效益。以下是各组织从网格计算中获得的常见优势。
网格计算让大型组织能够通过将庞大复杂的任务分解为更小的子任务来实现高效处理。被拆分为独立的较小问题后,网格计算利用连接节点的计算资源并行解决问题,从而节省时间与能耗。
在网格计算环境中,计算资源可以按需增减,从而降低成本并优化计算资源利用率。这对于工作负载需求波动较大、企业需要根据实际需求动态扩展的场景尤为有用。
网格计算能通过最大限度利用现有硬件来帮助组织节省成本。网格计算框架使企业能够重用现有计算机,优化内存、存储器、GPU 等原本可能处于闲置状态的资源。
网格计算环境具有高度灵活性,因为它们运行在由互连节点组成的网格计算网络上,这些节点不必处于同一物理位置。全球各大学的科学家和研究人员利用网格计算环境,通过共享超级计算资源来应对气候变化和气象模式等数据密集型的复杂问题。
大型企业常拥有处于闲置或未充分利用状态的计算资源,这些资源仍需维护并消耗能源。网格计算使这些企业能够将工作负载分布到未充分利用的资源上,从而提升基础设施优化程度。与其他类型的计算环境不同,网格计算框架不需要最新、最先进的技术工具,而是可以在现有硬件上运行。
网格计算已被各行各业的大型组织广泛采用。高校通过部署网格来解决需要超级计算机并与全球同事协作的大型复杂问题。依托网格计算框架构建的强大虚拟超级计算机,已成功应对了与气候变化、天体物理学等相关的复杂科学与工程任务。以下是网格计算最常见的用例。
IBM Spectrum LSF Suites 是面向分布式高性能计算 (HPC) 的工作负载管理平台和作业调度程序。
IBM 的混合云 HPC 解决方案可助力应对大规模计算密集型挑战,并加快获取洞察分析的速度。
查找适合企业的业务需求的云基础设施解决方案,并按需扩展资源。
1. 网格计算市场规模及未来增长预测报告(至 2031 年),Straits Research,2023 年 10 月