クラスター・コンピューティングとは

駐車場に停車しているトラックの空撮

クラスター・コンピューティングとは

クラスター・コンピューティングとは、複数のコンピューターを接続し、単一のシステムとして動作させるコンピューティングの一種です。「クラスター」という用語は、同じタスクを実行するようにプログラムされた、リンクされたコンピューター・システムのネットワークを指します。

コンピューティング・クラスターは通常、ローカル・エリア・ネットワーク(LAN)やワイド・エリア・ネットワーク(WAN)を介して通信するサーバー、ワークステーション、パーソナル・コンピューター(PC)で構成されます。

クラスター・コンピューティングは分散コンピューティングの一種であり、ネットワーク上で複数のコンピューターをリンクして計算タスクを実行し、計算力を高めて単一のコンピューターとして機能するコンピューティングのタイプです。コンピューター・ネットワーク内の各コンピューター、つまり「ノード」には、オペレーティング システム (OS) と、ソフトウェアが適切に実行するために必要なタスクを処理する中央処理装置 (CPU)コアがあります。

クラスター・コンピューティングは、その高性能と高可用性により、クラウド・コンピューティング人工知能(AI)、科学研究、ビッグデータ分析など、多くの用途があります。

The DX Leaders

AI活用のグローバル・トレンドや日本の市場動向を踏まえたDX、生成AIの最新情報を毎月お届けします。登録の際はIBMプライバシー・ステートメントをご覧ください。

ご登録いただきありがとうございます。

ニュースレターは日本語で配信されます。すべてのニュースレターに登録解除リンクがあります。サブスクリプションの管理や解除はこちらから。詳しくはIBMプライバシー・ステートメントをご覧ください。

クラスター・コンピューティングの仕組み

最も基本的なレベルでは、クラスター・コンピューティングはLANを使用して、ネットワーク内の複数の独立したコンピューターを接続します。クラスターのアーキテクチャでは、ネットワーク上の各コンピューターは「ノード」と呼ばれ、各マシン間の通信を可能にするソフトウェアであるミドルウェアによって制御されています。クラスターのユーザーは、LAN経由で接続された個々のマシンではなく、あたかも単一のマシンであるかのように、各コンピューターのリソースを使用できます。

コンピューティング・クラスターは、最小2個のノードから最大数千個のノードまで接続できます。たとえば、Beowulfクラスターは通常、LAN経由で接続された商用グレードのPCを使用し、特定のタスクに関してはスーパーコンピューターの比較的手頃な代替手段となります。1

一方、Kubernetes(クラウド・コンピューティングに不可欠なコンテナ関連のクラスター隣接テクノロジー)は、最大5,000個の個別で接続されたノードのクラスターをサポートします。Kubernetesは、ハイブリッドクラウドマルチクラウドアーキテクチャ、DevOpsアプリケーションのモダナイゼーションなど、さまざまな種類のクラウド・デプロイメントで使用されています。

クラスター・コンピューティング・アーキテクチャ

クラスター・コンピューティング・アーキテクチャは、相互接続された個々のコンピューターのグループで構成され、それらが 1 台のマシンとして連携して動作します。各コンピューティング・リソースは、LANなどの高速接続で結ばれており、システムのアーキテクチャでは単一ノードと呼ばれます。各ノードにはOS、メモリ、インプットとアウトプット(I/O)機能があります。

クラスター・アーキテクチャには、オープンとクローズドの2種類があります。オープン・クラスターでは、各コンピューターは独自のIPアドレスを持ちます。クローズド・クラスターでは、各ノードはゲートウェイノードの後ろに隠されます。ゲートウェイノードが他のノードへのアクセスを制御し、IPアドレスはインターネット上で見つけることができるため、クローズドクラスターはオープンクラスターよりもセキュリティリスクが低くなります。

その他の分散コンピューティング

クラスター・コンピューティングに加えて、コンピューターのネットワークに接続された主要な機能を備えた分散コンピューティングで一般的に使用されているものは2種類あります。それは、グリッド・コンピューティングとピアツーピア・コンピューティングです。

グリッド・コンピューティング: コンピューターサイエンスでは、物理的に異なる場所にあるリソースを結合するために、グリッド・コンピューティング・インフラストラクチャが設定されます。さまざまなマシンから利用可能なコンピューティング・リソースが結合され、問題を解決するために一緒に使用されます。クラスタリングと同様、グリッド・コンピューティングは相互接続された複数のコンピューターのリソースを使用します。

しかし、クラスタリングとは異なり、グリッド・アーキテクチャで接続されたコンピューターの未使用参考情報のみが利用される。SETI(地球外知的生命体探査)はグリッド・コンピューティングの有名な例で、多くのコンピューターの未使用のコンピューティング・リソースが、深宇宙からの電波信号を解析して地球外生命体の兆候を探すために使用されました。2

ピアツーピア・コンピューティング:ピアツーピア(P2P)・コンピューティングまたはネットワーキングでは、2台以上のコンピューターをネットワーク上の「ピア」として接続する必要があります。つまり、複数のコンピューターが同等の権限を持つことを意味します。クラスター・コンピューティングとは異なり、P2Pアーキテクチャでは集中管理アプローチは必要ありません。

P2Pネットワークでは、各ノードがクライアントマシン(サービスへのアクセスを必要とするコンピューター)とサーバー(サービスを提供するコンピューター)の両方の役割を果たします。すべてのピア・ノードは、ストレージ、メモリ、帯域幅などを含むリソースをネットワーク上の他のノードに提供します。

隣接テクノロジー

クラスター・コンピューティングは、計算タスクとデータ・ストレージを複数のコンピューターに分散する方法として、1960年代に発明されました。1980年代には、PC、汎用プロセッサ、LANなど、いくつかの隣接テクノロジーの開発がクラスター・コンピューティングに重大な影響を与えました。

おそらく最も大きなものは、高性能コンピューティング (HPC)におけるマルチプロセッサ・コンピューティング・ノードの使用です。HPCのユースケースが増加するにつれ、クラスター・コンピューティングのユースケースも増加しました。現在、その用途には、自動車や航空産業、衛生、望遠鏡からのデータ分析、危険な病気の診断などが含まれます。

現在、クラスター・コンピューティングは、人工知能(AI)、機械学習(ML)、クラウド・コンピューティングなど、世界を前進させる多くの最先端テクノロジーで使用されています。世界最大手の企業はクラスター・コンピューティングを使用してワークロードをクラウドに移行し、処理速度やデータの整合性を向上させています。エンタープライズ・レベルでは、コンピューター・クラスターには、ロード・バランシング、高可用性、データセンター内のデータの大規模処理など、特定のタスクが与えられることがよくあります。

ハイパフォーマンス・コンピューティング

IBM Cloud上の第4世代Intel Xeonスケーラブル・プロセッサー

クラウド業界向けの次世代マイクロアーキテクチャーに対するIntelとIBMの取り組みについてご覧ください。

クラスター・コンピューティングが企業にもたらすメリット

コンピューティング・クラスターは主に、他の種類のコンピューティング・アーキテクチャよりも高いパフォーマンスと信頼性を実現するように設計されており、現代の企業にとって不可欠なものとなっています。たとえば、最新のクラスターにはフォールト・トレランスが組み込まれています。これは、ネットワーク内の1つのノードに障害が発生した場合でも、次に進む能力を指す用語です。

また、大規模なコンピュータ・クラスターは、分散ファイル・システム(DFS)と独立ディスクの冗長アレイ(RAID)に依存しており、同じデータを複数のハードディスクドライブ上の異なる場所に保管することができます。クラスター・コンピューティングは、現代の企業にさまざまなメリットをもたらします。以下に例をいくつか示します。

パフォーマンス

並列処理に依存しているため、コンピューター・クラスターは高性能とみなされ、通常は単一のコンピューターよりも高速にデータを処理し、より大きなワークロードを処理できます。

信頼性

クラスター・コンピューティングには、DFSとRAIDテクノロジーが組み込まれているため、信頼性が高いと考えられています。コンピューター・クラスターでは、単一のノードに障害が発生した場合でも、ネットワークは機能し続け、DFSとRAIDによってデータが複数の場所にバックアップされることが保証されます。

可用性

クラスター・コンピューティングは、信頼性が高いだけでなく、単一のノードの障害から迅速に復旧できることから、可用性も高いと考えられています。クラスターが正常に動作していれば、1つのノードに障害が発生してもサービスが中断されることなく、その作業はクラスター内の別のノードにシームレスに転送されます。

拡張性

クラスター・コンピューティングは、クラスター・ノードをいつでも追加してパフォーマンスを向上できるため、非常にスケーラブルです。クラスター内でリソースを動的に調整できるということは、需要に応じてクラスターをスケールアップまたはスケールダウンできることを意味します。

コスト

クラスター・コンピューティングは、他の種類のコンピューティングよりもコスト効率に優れています。多くの現代企業は、手頃な価格でITインフラストラクチャのパフォーマンス、拡張性、可用性を向上させるために、クラスター・コンピューティングに依存しています。

クラスターの種類

コンピューティング・クラスターは、複雑さと目的の両方において大きく異なります。例えば、比較的シンプルなデュアルノード・クラスターでは数台のコンピューターしか接続されませんが、Auroraスーパーコンピューターでは10,000台以上のコンピューターが接続されます。3

クラスターは高い性能、拡張性、柔軟性を備えているため多くのビジネスユースケースがありますが、大学や医科大学での研究にも使用されています。コンピューティング・クラスターは、それぞれの特性に基づいて、高可用性、ロード・バランシング、ハイパフォーマンスの3つのタイプに分類されます。

高可用性クラスター

高可用性クラスターは、予期せず障害が発生したノードから、まだ機能しているネットワーク上の別のノードにタスクを自動的に転送します。1つのノードに障害が発生した場合に迅速かつ簡単に適応できるこの機能は、サービスの中断を回避することが重要なワークロードに最適です。

ロード・バランシング・クラスター

ロード・バランシング・クラスター(ロード・バランサーとも呼ばれる)は、クラスター内のノード間で作業が公平に分散されるようにします。ロード・バランシングがなければ、ノードは割り当てられたタスクに圧倒され、より頻繁に障害が発生してしまいます。目的ごとに、様々な種類のロード・バランシングがあります。最も有名なものの1つであるLinux Virtual Serversは、無料のオープンソースで、クラスタリングテクノロジーに基づいた高性能で可用性の高いサーバーの開発に使用されています。

ハイパフォーマンス・コンピューティング・クラスター

ハイパフォーマンス・コンピューティング・クラスター(HPC)は、ビッグデータとしても知られる大規模な多次元データセットを極めて高速に処理できる強力なプロセッサのネットワークです。ノード間でファイルを移動させるには、高出力のネットワークと超低レイテンシーが必要です。

ロード・バランシングや高可用性クラスターとは異なり、HPCクラスターは処理能力が高く、病気の診断、膨大な財務データの分析、ゲノムの配列決定など、データ分析用に特別に設計されています。また、HPCクラスターは、ノード間の通信を可能にする並列コンピューティングアーキテクチャのプロトコルであるMPI(Message Passing Interface)を使用します。

人工知能クラスター

AIクラスターは、顔認識や音声認識、自然言語処理(NLP)、自動運転など、AIおよびMLワークロード専用に構築されたコンピューティング・クラスターです。AIクラスターは、 AIモデルのトレーニングに使用されるアルゴリズム用に特別に設計されています。

クラスター・コンピューティングのユースケース

コンピューティング・クラスターには幅広い用途があります。クラウド・コンピューティングやデータ分析のような企業向けアプリケーションから、映画用の目を見張るような3D特殊効果の作成に役立つソフトウェアまで、いくつかの例を次に示します。

ビッグデータ分析

クラスター・コンピューティングは、大量のデータを迅速かつ効率的に処理できるため、ビッグデータ分析に理想的なツールです。Googleの強力な検索エンジンから、株式市場を分析するソフトウェア、ソーシャル・メディアのセンチメント分析まで、データ分析分野におけるクラスター・コンピューティングの用途は多岐にわたります。

3Dグラフィック

クラスター・コンピューティングの並列処理機能は、ビデオゲームや映画における最先端のグラフィックを実現します。クラスター・コンピューティング・レンダリング(またはクラスター・レンダリング)は、それぞれ独自のグラフィック処理装置(GPU)を備えた独立したノードのクラスターを使用することで、複数の画面にわたって調整された単一の画像を生成します。このプロセスにより、高品質の3D画像を構築するのにかかる時間が大幅に短縮されます。

人工知能と機械学習

AIとMLのワークロードでは、クラスター・コンピューティングは、膨大なデータセットを迅速かつ正確に処理、分析するのに役立ちます。これは、ChatGPTなどのアプリケーションを支える強力なAIモデルをトレーニングするために不可欠な要素です。

リスク分析

保険会社や金融取引会社は、クラスター・コンピューティングを使ってデータを分析し、特定の株を購入したり、特定の顧客に保険を提供したりすることによるリスクを定量化しています。クラスター・コンピューティングは、ビッグデータ・セットを分析し、より多くの情報に基づいたビジネス上の意思決定に使用できる有意義な洞察を抽出するために使用されます。

関連ソリューション
IBM Spectrum LSF Suites

IBM Spectrum LSF Suites は、分散型ハイパフォーマンス・コンピューティング(HPC)用のワークロード・マネジメント・プラットフォームおよびジョブ・スケジューラーです。

Spectrum LSFスイートの詳細はこちら
ハイパフォーマンス・コンピューティング(HPC)サーバーとストレージ・ソリューション | IBM

IBMのハイブリッド・クラウドHPCソリューションは、大規模で計算集約的な課題に取り組み、インサイト獲得までの時間を短縮するのに役立ちます。

HPCソリューションの詳細はこちら
クラウド・インフラストラクチャー・ソリューション

ビジネスニーズに合ったクラウド・インフラストラクチャー・ソリューションを見つけ、必要に応じてリソースを柔軟に拡張します。

クラウド・ソリューション
次のステップ

IBMのHPCソリューションを使用して、最も要求の厳しいAIと計算負荷の高いワークロードを強化します。ハイブリッドクラウドの柔軟性と最先端のインフラストラクチャーを活用して、イノベーションへの道を加速させます。

HPCソリューションはこちら