Power Systems

高速化された計算能力によってAI時代を担うサーバー

記事をシェアする:

2017年12月6日、IBMはPOWER9プロセッサーを搭載した次世代のPower Systemsサーバーを発表しました。プレスリリース : 『人工知能(AI)向けに設計された業界最先端のサーバーを発表』

AIやディープラーニングに最適なIT基盤を構築できるサーバーとは

AIやディープラーニングには、大量のデータを高速に処理するITインフラストラクチャーが必須です。さらに、ディープラーニングで大量の学習用データを処理する局面においては、行列演算が得意なGPUの活用は不可欠です。

では、GPUを搭載しているサーバーが用意できれば、AIやディープラーニングのための基盤として万全なのでしょうか。

1台のサーバーに搭載できるGPUの数には上限があるため、ディープラーニングの学習時間を短縮するためには、GPUを搭載する複数のサーバーを接続して大規模化を図る必要があります。また、PCIeによってGPUとCPUが接続されている場合は、GPUを使いこなすためにCPUとの間での転送オーバーヘッドを考慮する必要もあります。必ずしもGPUを搭載してさえいれば良いというわけではないのです。

IBMが2016年9月に発表したIBM Power System S822LC for HPC(通称:IBM Minsky)は、GPUとCPUの高速連携を実現するNVIDIAのNVLinkを搭載することで、オーバーヘッドを気にせずにGPUを利用可能としました。さらに、TensorFlow、Caffee、Chainerといった主要なオープンソースのフレームワークの利用が可能なディープラーニング高速化技術「Distributed Deep Learning」を活用して、数十台のサーバーに搭載された数百基のGPUを駆使してスケーリングすることで、学習時間の大幅な短縮が可能であることを実証しました。具体的には、TensorFlowやCaffeを256 GPUでスケーリングすることで、16日から7時間へとトレーニングの所用時間の短縮を実現しています。

つまり、IBM Power System S822LC for HPCは、AIやディープラーニングのために最適なIT基盤を構築できるサーバーであり、多くのお客様に採用いただいております。

IBM Power Systemsが最新のプロセッサーと次世代の入出力アーキテクチャーを搭載

本日、IBMは、AI時代を担うために進化を遂げた新たなサーバーを発表しました。それが、Accelerated Compute(加速された計算能力)という言葉を冠したIBM Power System AC922です。

IBM Power System AC922は、最新のプロセッサーであるIBM POWER9プロセッサー、NVIDIA Tesla V100 GPU、次世代の入出力アーキテクチャーであるPCIe 4.0、CAPI 2.0、NVLink 2.0などが搭載される超高速サーバーです。

PCIe 3.0でGPUとCPUが接続されるx86プロセッサー・ベースのサーバーとの比較において、IBM Power System AC922は上述した次世代の入出力アーキテクチャーの先進性と優位性により、約5.6倍のデータ転送が行えます。これは、まさに、データセントリック・コンピューティングを具現化したものであり、システム全体の性能を高める上で最大のボトルネックになっている「データの移動」を最小化します。

高速のデータ転送によって、高いデータ・スループットが実現できるため、IBM Power System AC922はパフォーマンス要求が厳しいデータ集約型のワークロードに対応して、優れた性能を発揮します。

また、第二世代となったNVLinkは、CPUメモリーとGPUメモリーをコヒーレンシーを保って接続します。簡単に言い換えれば、NVLink 2.0を介してCPUとGPU間で統一されたメモリーが提供されます。これは、搭載するメモリーがCPUより少ないGPUにとって大きな意味を持ちます。何故ならば、メモリーが不足した場合、GPUは計算が行えなくなるからです。そのため、これまでは、GPUにデータを送る際はバッチサイズの調整が必要でした。しかし、NVLink 2.0を搭載するIBM Power System AC922であれば、CPUメモリーをGPUメモリーとして利用できるため、GPUが搭載するメモリー容量の課題が解消できます。NVLink 2.0によってヘテロジニアス・コンピューティングを実現してAI時代を担うサーバー、それが、IBM Power System AC922なのです。

スーパーコンピューターのビルディング・ブロック

ところで、皆様は、2018年に完成が予定されているスーパーコンピューターである、SummitとSierraをご存知でしょうか?

200ペタフロップスの目標能力を目指すSummitと、125ペタフロップスの目標能力を目指すSierraは、このIBM Power System AC922を用いて構築されます。つまり、IBM Power System AC922は、スーパーコンピューターを構築できる汎用の商用サーバーなのです。

IBM Power System AC922を用いたAIのデプロイメントは効率的かつ容易に行えます。選別され、テストされ、コンパイル済みのディープラーニングのためのバイナリー・ソフトウェアとライブラリーをパッケージ化したディストリビューションであるIBM PowerAIを利用することで、ディープラーニング開発環境の構築が迅速かつ容易となるからです。企業や組織におけるAI活用への取り組みに理想的なサーバーの選択肢として、IBM Power System AC922の採用をご検討いただければ幸いです。

*Bob PiccianoがTHINK Blogに寄稿した『AIを活用した組織変革加速のすすめ』も、ご一読ください。

*製品画像は、以下のTweetにてご確認ください。


IBM Power System AC922(8335-GTG)

マイクロプロセッサー
POWER9プロセッサー(with NVLink) 16コア × 2
POWER9プロセッサー(with NVLink) 20コア × 2
レベル2(L2)キャッシュ
コアあたり 256KB
レベル3(L3)キャッシュ
コアあたり 5MB
メモリー
最大 1TB (16GB DDR4 RDIMM)
内蔵ストレージ
Small Form Factor(SFF) ドライブ・ベイ × 2
(オプションでNVMe SSDをPCIeスロットでサポート)
内蔵SCSIディスク・ベイ
なし
メディア・ベイ
なし
アダプター・スロット
NVLink対応 NVIDIA Tesla V100 GPUアクセラレーター用 SXM 2.0ソケット × 4
PCIe x16 G4 LPスロット(CAPI使用可能) × 2
PCIe x8 G4 LPスロット(CAPI使用可能) × 1
PCIe x4 G4 LPスロット(CAPI使用不可) × 1
I/Oポート
USB 3.0 × 2
1GB イーサネット × 2
可用性(RAS)機能
プロセッサー命令再試行
オペレーティング・システム
Red Hat Enterprise Linux
電源要件
200V〜240V
サイズ
444.5mm(W) × 88.9mm(H) × 850.9mm(D)
保証
3年間、翌営業日対応 CRU(交換部品の送付)保証サービス (9×5/CRU)
保証サービスのアップグレード、メンテナンスを利用可能
エネルギー消費効率
掲載対象外
エネルギー消費効率とは、エネルギーの使用の合理化に関する法律 (昭和 54 年法律第 49 号、以下「省エネルギー法」という) で定める測定方法により測定された消費電力を、省エネルギー法で定める複合理論性能で除したものです。ただし、複合理論性能が 200,000MTOPS 以上のものについては省エネルギー法対象外装置であり、掲載のエネルギー消費効率は参考値となります。


コメントを追加する
コメントなし

コメントを残す

Your email address will not be published.* が付いている部分は入力必須フィールドです

さらに詳しく Power Systems 記事

POWERプロセッサーが広げるハイパーコンバージド・システムの領域

ハイパーコンバージド・インフラが、日本のIT業界に浸透し始めてから数年が経過しました。当初はVDI(Virtu […]

さらに読む

Summitへの道程:HPCのための次なるマイルストーン

ハイ・パフォーマンス・コンピューティング(HPC)を取り巻く環境は激しいペースで進化を続けています。そして、パ […]

さらに読む