データセンターを構築・保守運用する際に利用できるIBMのソリューションと将来のビジョンを紹介します。日本国内に立地するデータセンターの重要性はますます高まっています。IBMは、柔軟かつ堅牢なデータセンターを、ユーザー企業としてのお客様が安心して効率よく活用いただけるよう、また、データセンター事業者が構築・運用いただけるよう、保守運用の効率化や環境対応などに有用なソリューションを提供します。
国内データセンターの需要が高まっている背景には、AI利用やDXの進展に加えて経済安全保障上のソブリンの要求が強くなっている状況もあります。加えて、インターネットが急成長した2000年前後に構築したデータセンターの老朽化が進み、対応が急務になっているという背景もあります。データセンターの形態は、パブリック・クラウドから、ホスティング・サービス、ハウジング・サービス、そして自社持ちのデータセンターまでさまざまですが、データセンター全般の利点としては、リソースを集約することで電力効率、システム運用や管理の効率化、常に最新の設備を利用しやすいこと、などが挙げられます。
データセンターが満たすべき条件として、物理的な品質、施設の位置の地理的な優位性、セキュリティー品質などがあり、それらを高い水準で満たすことがデータセンター事業者の従来の課題でした。近年、それらに加えて、高いサステナビリティー水準が求められるようになってきています。また、ITシステムが複雑化して保守運用作業はより難しくなってきていることに加え、人手不足の問題もますます深刻化しています。これらの課題に対処するために、先進技術を活用し、保守運用の生産性を継続的に改善したり、環境負荷を削減したりする行動がデータセンターに求められています。
IBMは、省電力・低発熱量のサーバーをご提供することで、データセンターの消費電力削減や設置スペースの削減および空調の最適化に貢献してきました。IBMのメインフレーム製品系列IBM Zの最新機種であるz16では最大構成時の消費電力あたりシステム能力が、前モデルz15と比較して18%、前々モデルz14と比較して54%向上しています[1]。
同規模構成のz16とz14を比較した場合には、電力消費量18%、重量31%、設置面積50%以上の削減が可能でデータセンターのサステナビリティー向上に直接的に貢献することができます。実際に、ヨーロッパのお客様の事例では、Oracleデータベースの処理を従来のx86環境では16サーバーで計149コアを用いていたところを、1台の10コアIBM LinuxONEサーバーに集約することができました。LinuxONEはIBM Zのハードウェアを用いたエンタープライズ・グレードのLinuxサーバーです。このサーバー統合によりCO2e(温室効果ガスのCO2換算量)で70%の削減が実現しました。消費電力削減に効果を発揮しているもう一つの技術は、この最新のz16/LinuxONEに搭載されているAIチップです。z16ではプロセッサー(IBM Telum)に統合AIアクセラレーター(AIU)が標準搭載されました。昨今、メインフレーム上で行われる基幹業務においてもAIを活用するタスクが増えてきています。従来はその処理のためにGPUを備えたサーバーをメインフレームとは別に用意し、メインフレームからそちらにデータを送ってAI推論を行わせることもありましたが、このTelumプロセッサー上に通常のCPUと共にオンチップで搭載されたAI推論アクセラレーターを使うことで、別にAI推論サーバーを用意する必要もなくなるのに加えて、呼び出しも含めたAI推論全体にかかる時間の削減も実現します[2]。クレジット・カードの不正検知モデルを使用したテストでは約1ミリ秒のレイテンシーを保ちながら、1日に3,000億回(1秒間に約350万回)の推論を実行できるという結果が得られています。
そして、もう一つのサーバー系列であるIBM Power製品でも、IBMはパフォーマンスとエネルギー効率を向上し続けています。現在最新モデルで使われているPower10プロセッサーでは、7nmの半導体チップを採用することにより、14nmチップを用いた前モデルであるPower9プロセッサーと比較して1.3倍の処理能力と50%の省電力を実現しています。同じ仕事量でのエネルギー消費は、2世代前のPower8プロセッサーと比べて52%、Power9と比べて33%の削減を実現しています。たとえば、あるお客様のユースケースについて、このPower10とRed Hat OpenShiftを利用すれば、既存の125台のx86サーバーを1台のPowerサーバーに集約し、エネルギー消費を79%、ソフトウェアのコストを92%削減できると試算されています。
IBM ZとIBM Powerは、コストの点でも効率的で無駄のない運用が可能です。これらのサーバーには、Capacity-on-demandやDynamic Capacityと呼ばれるソリューションが用意されており、これを利用することによってオンプレミス環境でも、クラウドと同じような分単位の従量課金が適用されます。すなわち、余裕のある容量をプロセッサーおよびメモリに物理的には確保しておきながら、利用していない従量課金部分のリソースについてはコストが発生しません。ひとたび災害対策で待機マシンの使用が必要になった時や、繁忙期のピーク負荷などにおいて需要が一時的に伸びた時だけ、自動的に対応してリソースの配分が行われ、使用したリソースが課金対象となります。こうすることによって、緊急時にもシステムの安定稼働が保たれる一方で、通常時や初期の投資コストの抑制が実現できます。
IBMは将来にわたってもこれらのサーバーへの投資を継続していきます。IBMはサーバー製品開発の中長期的なロードマップを持っており、メインフレーム(IBM Z)についてはすでに3世代のメインフレームのリリースを計画しています。前述したAIチップについては将来的にさらに大幅に省電力化するためにアナログAIチップの研究を進めています。アナログAIチップは、メモリーとプロセッサーを分けた従来のフォン・ノイマン型アーキテクチャーとは全く異なる構造で、ニューラル・ネットワークの計算を行い、例えば約14倍というエネルギー効率の改善を実現できます。また、IBMはこれらのロードマップにおいて、さらに微細化した半導体の採用を予定しています。現行のPower10プロセッサーおよびz16プロセッサーは7nmの半導体を利用していますが、将来のIBMサーバーをひとつの実用先とした技術として、IBMは2021年にナノシート構造を利用して2nmスケール半導体技術を開発した事を発表しました[3]。この技術を利用すれば、Power10やz16で利用している7nmの半導体チップに対してさらに45%高い計算能力、あるいは75%の消費電力削減が実現されることが予想されています。そして、この2nmすらもまだ微細化・高集積化の終着点ではありません。IBMは2nmを超えるサブナノ・レベルの微細化も数年で実現することをすでに見込んでいます[4]。そのような将来に続く技術のためにIBMは継続的な投資とパートナーシップ拡大を進めています。
言うまでもなく、データセンターの実現と効率的な運用の上で、仮想化技術は欠かすことができません。仮想化にもさまざまなレベルがありますが、共通して言えることは、仮想化技術を用いることでセットアップの簡単化、柔軟で動的なリソース確保とリソースの有効活用、障害復旧の迅速化などの効果が実現しているということです。仮想化技術のひとつであるアプリケーション・コンテナを、大規模分散環境で管理するためのオープンソース・プラットフォームである Kubernetesは、今やクラウド・ネイティブ環境のデファクト・スタンダードとなっています。Red Hat OpenShiftは、Kubernetesに対して継続的インテグレーション/継続的デリバリー(CI/CD)の機能や、企業向けセキュリティー機能、その他のさまざまな管理機能の自動化、サポートを加えて提供している製品です。企業ITにおいてオンプレミスやパブリック・クラウドを含め、複数のIT拠点を連携させるハイブリッドクラウド環境はもはや必然であるという認識が共有されています。
次に、仮想化技術のひとつの応用例として、クラウド・ネイティブなAIスーパーコンピューターであるIBM Velaを紹介します。これは、基盤モデル、すなわち大規模なAIモデルを学習するために、GPUを備えたスーパーコンピューターです。従来、スーパーコンピューターには、ハイパフォーマンス・コンピューティング(HPC)のための高性能ネットワーク・ハードウェアや並列ファイルシステムなど、クラウドのデータセンターとはまったく違う仕組みを用いたHPC独特のアーキテクチャーが使われるのが通常でした。それに対し、IBMはクラウドの持つ柔軟性や可搬性、そしてユーザーにとっての使いやすさ(生産性)をAI開発用スーパーコンピューターにも導入するために、クラウド・データセンターで用いられる一般的なハードウェアやソフトウェア・スタックの上にスーパーコンピューターで必要とされる機能を実装し、チューニングを行いました。これにより、AIクラスターを柔軟かつダイナミックに拡張し、さまざまな種類のワークロード間でリソースを数分の間にシフトすることが容易になりました。VelaはまだIBM社内での利用にとどめており、お客様にご提供しているものではありませんが、このアーキテクチャーは世界中のどのデータセンターでもどんな規模でも展開できるように設計されており、オンプレミスのAI開発環境の設計に採用することも可能になっています。IBMはこのアーキテクチャーの横展開や、お客様への詳しいご紹介を計画しています。
近年、ITシステムの保守運用作業が難しくなる傾向にあります。これは背景に、ITシステムの多様性や、データのやりとりを行う接続先やその種類が増えたこと、扱うデータ量やトランザクション数が膨大になっていることがあります。人手不足もあいまって、障害が起きた範囲や原因の特定、復旧作業に以前よりも時間がかかるだけでなく、障害が起きていることの検知にも、これまで以上の効率化・自動化を実現するような新しい仕組みの活用が必須となっています。そこで、重要度を増しているのが、IT運用に各種AI技術を利用する、AIOpsと呼ばれる一連の技術です。その一つとして、IBM Instana Observabilityが提供する可観測性(オブザーバビリティー)向上は、人が指定した対象を監視する従来のモニタリングを超えて、動的に変化する環境で自動的にデータを収集し、複雑に関係するサービス間の依存関係を自動的に把握し、人がとらえきれないシステム挙動を可視化します。IBM Cloud Pak for AIOps with Instanaでは、そうして収集されたデータをAIを用いて自動解析し、早期に異常を発見、迅速に根本原因を特定して障害時間と影響を削減することができます。これによりインシデントの数を50%に削減できたり、誤アラートを調査するのに浪費される時間を80%削減したりといった効果が事例で報告されています[5]。加えて、IBM TurbonomicによるAIを利用したアプリケーション・リソースの自動的な最適化は、コストの削減だけでなく、アプリケーション・パフォーマンスを確保することによって障害の未然防止にも有効です[6]。
今後さらに、生成AIを活用することによって、手作業が必要だった環境のセットアップや運用管理の半自動化・効率化が進んでいきます。Red Hat Ansibleは、大規模で異種混在なサーバー群を扱う組織全体のITプロセスを対象にした構成管理・自動化ツールであり、他の多くの自動化ツールや構成管理ツールと組み合わせ、それらをも活用する自動的なシステム管理を行うことができます[7]。Ansibleを利用するには、基本的にはシステム管理者がYAML形式のAnsible Playbookにその挙動を記述する必要がありますが、2023年5月にIBM watsonxとともに発表し2023年後半に利用可能になることが予定されているRed Hat Ansible Lightspeed with watsonx Code Assistantは、生成AIを使うことでそのPlaybookの作成を支援します[8]。IBM watsonxは、基盤モデルや生成AIを企業が安心して活用するためのAIとデータのプラットフォームであり、IBM watsonx Code Assistantはプログラミング言語を対象とした生成AIの製品群です。Red Hat Ansible Lightspeed with watsonx Code Assistantを用いると、システム管理者が自然言語(英語)で命令を記述すれば、YAML形式のPlaybookのコードが自動的に生成されます。これによってAnsibleユーザーがタスクを作成する負担が軽減されます。
IBMは製品だけでなく、データセンターの設計から、設備工事、移設、保守運用まで含めたサービスも、IBMの製品だけでなく多くのマルチベンダー製品(HWとSW)を含めた環境を対象に提供しています。サービスの詳細は以下のページををご覧ください。
この記事では、省電力化や運用の高度化のために今すぐデータセンターに利用可能なIBMのソリューションを、実際の事例での効果や将来的なビジョンを交えながら紹介しました。さらに先の技術に関して、2022年11月にIBMは米国ニューヨーク州ハドソンバレー地域での、半導体やメインフレーム、AI、量子コンピューターなどの研究開発や製造に今後10年で200億ドルを投資することを発表しました[9]。日本への投資についても2023年5月に、シカゴ大学と東京大学に量子コンピューターの研究の加速のために10年で1億ドルを拠出することを発表しました[10]。IBMは従来型のコンピューターと、AIチップを用いるようなAI、そして量子コンピューターがひとつに統合された、新しいコンピューター・アーキテクチャーの実現も将来に描いています[11]。長期的には、そのようなアーキテクチャーを、Velaにも利用された仮想化技術やAIOpsによる運用自動化とともにデータセンターにも導入し、システム管理者の負担を軽減しつつ、ユーザーに特殊なスキルがなくても使えるようにするという未来を実現していきます。