ホーム
Topics
ハイパースケール
公開日:2024年3月12日
寄稿者:Phill Powell、Ian Smalley
ハイパースケールとは、きわめて大規模なワークロードに対応できる並外れた拡張性を備えた設計の分散コンピューティング環境でありアーキテクチャーです。関連用語の"ハイパースケーラー"は、従来のオンプレミス・データセンターに比べて格段に大規模なハイパースケール・データセンターを指します。
IT業界に携わる人はご存じのとおり、標準的なジョブもあれば、通常のニーズをはるかに上回る大規模なプロジェクトもあります。こうした巨大なプロジェクトには特別な対応と大局的なバランス感覚が必要です。つまり、ハイパースケール・コンピューティングで得られる特別な処理能力が必要になります。
ハイパースケール・コンピューティングは、標準的なエンタープライズ・データセンターを利用する処理の代わりとなるものです。ハイパースケール・コンピューティングでは、企業はほぼ無限にスケーラブルな大規模データベースを構築するか、構築を支援します。
IBM zSystemsとハイブリッドクラウドを使用してメインフレーム・アプリケーションのモダナイゼーションを加速する、IBMの戦略の概要をお読みください。
ハイパースケール・テクノロジーは、企業が生成するデータの日常のフローや量に対処する方法を一変させる技術です。
忘却の彼方にある話かもしれませんが、かつては企業のデータセンター全体を、オフィスのキャビネットに収めた1台のサーバーで運用していた時代がありました。
その後登場したのがハイパーバイザーです。ハイパーバイザーを抽象化レイヤーとして使用することで、仮想マシン(VM)内のアプリケーションを別の物理ハードウェアに再配置できるようになりました。このことは、ハイパースケール・データセンターの発展における重要な契機となりました。
現在生成される膨大な量のデータ、特にハイパースケール・アプリケーションが生成するデータは、当初の古いオンプレミス・データセンターで処理することはまず不可能です。
従来のオンプレミス・データセンターは10,000平方フィート程度の規模が多いのに対し、ハイパースケール・データセンター(ハイパースケーラーともいう)はかなり大きな物理スペースを使用します。
IDCのハイパースケーラーの定義、によると、企業のデータセンターを真のハイパースケーラーと呼べるのは、5,000台以上のサーバーを収容し、少なくとも10,000平方フィートの面積をデータセンターとして稼働させている場合です。
ハイパースケール施設の規模はその数倍になることも多く、建物は60,000平方フィート近くに達することも珍しくありません。これはアメリカン・フットボールのフィールドの規定サイズとほぼ同じです。
これがハイパースケールの一般的な規模ですが、最大のストレージの事例は、これとは比べものにならないほど巨大です。世界最大のデータセンターとして他と一線を画しているのは、中国の内モンゴル自治区フフホト市ホリンゴルにあるChina Telecom社の巨大データセンター、です。この施設の建設費は30億米ドル、面積は驚異の1,070万平方フィート、消費電力は150メガワットです。(この施設の巨大さは、アメリカン・フットボールのフィールドを165面ほど並べた様子を想像していただければわかります)。
ハイパースケール・コンピューティングから派生物したハイパースケーラーは、主に巨大なアプリケーションの提供と管理に使用されるハイパースケール・データセンターです。
ハイパースケーラーは基本的には従来のデータセンターと似ていますが、一般的なオンプレミス・データセンターよりもはるかに大規模な運用に照準を合わせています。そこでハイパースケーラーの施設では、ハードウェアとソフトウェアの巨大なインフラストラクチャーが構築され、稼働しています。多数のデータセンターに分散された数百万台のサーバーが、無尽蔵に思えるほどのストレージとコンピューティング・リソースを提供します。
データ・トラフィックは大きく変動することがあります。特に巨大なアプリケーションを実行する場合にはそれが顕著です。ハイパースケーラーはこうしたトラフィックに対応し、コンピューティング環境でニーズの増加が見られる場合に、ハイパースケールで安定した運用ができるようにします。そのためにハイパースケーラーは、実質的にロード・バランサーの一種としての役割を果たし、タスクの配分やコンピューティング・リソースのリダイレクトを必要に応じて実行します。
企業によっては、導入コストやその他の関連コストのために、ハイパースケール・テクノロジーを活用する態勢が整っていない場合もあります。しかしほとんどの企業では、そのコストをはるかに上回るメリットが得られます。
仮想化によってクラウド・コンピューティングが可能になりました。CSPはハイパースケール・データセンターを運営して、クラウド・コンピューティングのさまざまな用途と、そこから生成されるデータに対応します。一方ユーザーは、オンサイトでのデータセンターの稼働に伴う細かな要素の数々や、時々発生する運用上の問題から解放され、代わりにアプリケーション・プログラミング・インターフェース(API)を通じて、必要なクラウド・リソースを扱うことができます。
ハイパースケール・コンピューティングの基盤となるハイパースケール・インフラストラクチャーは、高いパフォーマンスと冗長性の両方を支えます。そのため、クラウド・コンピューティングの動作やビッグデータ処理にとって、ハイパースケール・プロジェクトは最善の選択肢です。
ハイパースケール・インフラストラクチャーは、ハイパースケールの用途に効率的に対処することを狙いとして構築されているため、巨大なワークロードを処理する場合であっても、運用の費用対効果を高めることができます。
サーバー・ファームにあたるものを構築しても、それが効果を発揮するためには、各サーバーが超高速(かつ低遅延)の強力な接続性を備え、サーバー同士が効果的に通信できなくてはなりません。ハイパースケーラーはそれを可能にします。
現在のハイパースケール市場では、パブリッククラウド・プロバイダーの「ビッグ5」が勢力を誇っています。これらのクラウド・サービス・プロバイダー(CSP)には、それぞれ独自の強みがあります。
2023年第1四半期時点で、AWSは32%の市場シェアを獲得しており、ハイパースケール・クラウド・サービスの最大のプロバイダーとなっています。クラウドを軸とする同社の製品は、ストレージの選択肢、コンピューティング能力、オートメーション、データベース、データ分析などの面を重視しています。
多くの企業がMicrosoft社の製品を既に利用しています。企業によっては、同社とその製品に対して一定レベルの安心感を抱いているでしょう。Microsoft社のエンタープライズ・ソフトウェアもその対象に含まれており、同社のハイパースケール製品であるMicrosoft Azureとうまく統合します。(市場シェア:23%)
Google社はデータ処理に強みがあることで勢力を拡大し、存在感を高めました。特に、高度なアナリティクスや人工知能(AI)の導入を強く望んでいる企業は、引き続きGCPを選択しています(市場シェアは約10%)。
IBM Cloudは、長い歴史をもつ本物のテクノロジーに支えられ、AIやエンタープライズ・データセンターへの対応など、さまざまな分野でIBMが有する専門知識を活用しています。IBM Cloudは、Infrastructure-as-a-Service(IaaS)、Platform-as-a-Service(PaaS)、Software-as-a-Service(SaaS)向けの包括的なサービスを提供しています。
OCIのメリットは、重要なエンタープライズ・ワークロードを容易に移行できることや、クラウドネイティブ・アプリケーションを構築できることなどです。また、意欲的な低価格の料金体系もOCIのセールス・ポイントの1つです。AWSと同じ基本サービスを格段に低コストで提供するとOracleはうたっています。
ここまでの簡単な概要からわかるように、AWSはグローバルなアクセスと高度な拡張性の点で優れています。GCPは、トップ・クラスのデータ管理や機械学習などの機能の導入を必要としている企業にとって魅力的です。Microsoft Azureは、製品のスムーズな統合が可能で、高度なセキュリティーを備えています。
IBM Cloudは、このトップ3の競合を差し置き、AIを利用した現在の取り組みで非常に大きな関心を集めており、ハイパースケール製品にもこの取り組みが反映されています。またOracleはOCIを、コストの節約とクラウドネイティブ・アプリケーションの運用向けに構築したプラットフォームとして打ち出しています。
これらのプロバイダーは、アプローチや得意分野がそれぞれ大きく異なることは明らかですが、一方で共通点もあります。例えば、上位3社のプロバイダーは現在、ゼロトラスト・ネットワーク・アクセス(ZTNA)プロトコルをサポートするクラウドネイティブ・サービスを提供しています。このプロトコルは、セキュリティーの脆弱性が生じる可能性のあるVPNの代替手段となるように設計されています。
ハイパースケールのニーズにどのように対処していくかは、企業ごとに戦略が異なります。
企業によっては、緻密なハイパースケーラーの構築に必要な巨額の投資を行う余裕がない場合や、そのような財務的コミットメントを望まない場合もあります。ここでいう投資とは建設費だけではありません。大量の設備の購入についても考える必要があります。
また、場合により、ハイパースケール施設の消費電力は小規模な都市を上回ることが確認されています。したがって、ハイパースケーラーの利用に関する企業の戦略では、通常は電力コストや環境問題も考慮する必要があります。
設備を購入するのではなく、サーバーやその他のコンピューティング装置をレンタルするコロケーションを引き続き利用する企業もあります。
ハイパースケーラーは、モノのインターネット(IoT)のデバイスやその管理方法に対しても影響をもたらしています。ハイパースケール・クラウドは(多くの場合)既存の設備と組み合わせて使用するため、IoTエコシステムのためのインフラストラクチャー投資額の抑制につながり、企業が得られる価値が高まります。
1 ノードから 1000 ノード以上に拡張できるパフォーマンスと容量を備えた IBM Storage Scale をデプロイする最も簡単な方法をご覧ください。
IBMのb-typeとc-typeのSANスイッチでストレージ・インフラストラクチャーを刷新し、総所有コストを削減します。
さまざまなアプリケーションやランディング・ゾーンをサポートするAcceleratorを活用して、IBM Cloudプラットフォームの導入を加速させます。
IBMソフトウェア(IBM FlashSystemなど)とIBMハードウェア・ソリューションを利用して、データ・ストレージの構成要素の両面のバランスをとることができます。
ストレージ・エリア・ネットワーク(SAN)は、特定の環境に合わせて調整された専用ネットワークであり、サーバー、ストレージ・システム、ネットワーキング・スイッチ、ソフトウェア、サービスを組み合わせたものです。
データセンターとは、アプリケーションやサービスを構築、実行、提供するためのITインフラストラクチャーや、そのアプリケーションやサービスに関連するデータを保管、管理するためのITインフラストラクチャーを収容する、物理的な部屋、建物、または施設です。
オブジェクト・ストレージは、大量の静的な非構造化データを手頃なコストで確実かつ効率的に保管、アーカイブ、バックアップ、管理するのに最適なデータ・ストレージ・アーキテクチャーです。
データ・ストレージとは、進行中または将来のオペレーションのためにデジタル情報を記録および保存する磁気、光学、または機械メディアのことを指します。
ITインフラストラクチャーとは、企業のITサービスやIT環境の運用と管理に必要な構成要素を組み合わせたものを指します。
遅延とは、システムで生じる遅れの測定値です。 データがネットワーク上のあるポイントから別のポイントに移動する際にかかる時間を、ネットワーク遅延といいます。