AIのインフラストラクチャー:ストレージが重要である理由

青い服を着て2台のノートPCを使いながら話し合う2人の同僚

著者

Donald Mathisen

Don Mathisen

Kevin D.

Kevin Johnson

貴社が最近、コンピューティング・ノードを購入して人工知能(AI)を試すことを決定したと想像してみてください。AIワークロードの準備を進める際には、特にストレージ システムなど、IT インフラストラクチャとテクノロジー ランドスケープの多くの側面を精査する必要があります。AIはデータによって駆動されるため、データがどのように保管されるかはAIプロジェクトの結果に大きな影響を与える可能性があります。それだけでなく、AIの 4 つの異なる段階 (取り込み、準備、トレーニング、推論) にはそれぞれ異なるストレージのニーズと要件があります。

残念ながら、一部の組織は AI のコンピューティング側に重点を置いており、ストレージ側を無視しています。このように焦点が絞られていると、AI プロジェクトの中断や完全な失敗につながる場合があります。AI のトレーニング段階を進めるには、膨大な量のデータが必要です。このデータは、トレーニング段階に「フィード」できるように、取り込み、保管、準備が必要です。トレーニングに必要なデータを取り込み、保管し、利用する機能がなければ、プロジェクトは失敗のリスクにさらされます。

AIプロジェクトには、優れた性能、拡張性、柔軟性を備えたストレージ インフラストラクチャが必要です。幸いなことに、今日のストレージ システムは AI プロジェクトのニーズに合わせて特別に構築できます。その良い例として、世界で最も強力なスーパーコンピューターの双璧である Sierra と Summit が挙げられます。

それでは、いくつかの要件を見てみましょう。

ニュースレターを表示しているスマホの画面

The DX Leaders

「The DX Leaders」は日本語でお届けするニュースレターです。AI活用のグローバル・トレンドや日本の市場動向を踏まえたDX、生成AIの最新情報を毎月お届けします。

ワークロードの仕様とデータの移動

AIパイプラインの各段階の要件を、AIアプリケーションの予想されるワークロードについてレビューする必要があります。ワークロードはさまざまですが、大規模なデータセットを使用する企業の中には、長期間にわたってトレーニングできるところもあります。トレーニングが完了すると、そのデータは多くの場合、新しいワークロードの準備のためにクリティカルなストレージ プラットフォームから移動されます。データを手作業で管理するのは困難な場合があるため、ストレージ上のデータを配置する場所と、トレーニングが完了した後に移動する場所を検討しておくことが賢明です。データを自動的に移動できるプラットフォームを見つけられれば、AIの効率的で有能なストレージ管理に一歩近づきます。

自社のワークロードのニーズが及ぼす影響を確認したら、AI コンピューティングインフラストラクチャとプロジェクトに最適なストレージテクノロジーを決定できます。

さまざまなAI段階におけるストレージニーズ

データ取り込み。AIワークロードの未加工データは、さまざまな構造化データおよび非構造化データ ソースから得られるため、データを保管するには非常に信頼性の高い場所が必要です。ストレージ媒体は、大容量のデータレイクや、特にリアルタイム分析用のフラッシュストレージのような高速ティアが考えられます。

データ準備処理。保管後は、データが「生」の形式になっているため、準備処理が必要です。残りのフェーズで使用するには、データを処理してフォーマットする必要があります。この時点ではランダム読み取りと書き込みが混在するため、ファイル I/O パフォーマンスは非常に重要です。時間をかけて、AIパイプラインのパフォーマンス要件を把握しましょう。データがフォーマットされると、トレーニングのためにニューラル・ネットワークにフィードされます。

図1:取り込み、データ準備処理、トレーニング

トレーニングと推論。これらの段階では計算量が非常に多く、通常はトレーニング・モデルへのストリーミング・データが必要になります。トレーニングは、モデルを作成するために使用される設定とリセットを必要とする反復的なプロセスです。推論は、データとトレーニングの合計と考えることができます。ここでは、低遅延、高スループット、迅速な応答時間の必要性があるため、サーバーの GPU とストレージ インフラストラクチャが非常に重要になります。ストレージ ネットワークは、データの取り込みと準備処理だけでなく、これらの要件も処理できるように設計する必要があります。大規模になると、多くのストレージシステム、特にAIワークロードに対応していないストレージシステムにストレスがかかるため、ストレージプラットフォームがビジネス目標に沿ったワークロードのニーズに対応できるかどうかを具体的に検討することが重要です。

IBMとのSmart Talks

インフラストラクチャはAI時代をどのように支えているのか

ハードウェアの機能がが大規模言語モデルの実行に必要なマトリックス計算を可能にする仕組みを解説し、銀行から地域のカフェまで、AIを業務に利用するためのクリエイティブな事例をご紹介します。

容量と柔軟性も重要

次の点も考慮してください。ストレージ・インフラストラクチャーは簡単に拡張できますか。データ・ニーズの増大に応じてストレージ・システムを拡張できますか。これらは、AIインフラストラクチャー要件に直接影響を与える非常に重要な質問です。

ビジネスにおけるデータの増加に合わせて、業務の中断を最小限に、または完全に抑えながら、ストレージ インフラストラクチャをスケールアップおよびスケールアウトできることを確認しましょう。AI インフラストラクチャのさまざまなニーズに合わせて、さまざまなストレージ構成を検討できる柔軟性が必要です。

専門家にアドバイスを求める

慎重に計画を立て、AI サーバーとモデリングの要件をストレージインフラストラクチャに合わせることで、投資を最大限に活用し、AI プロジェクトを成功に導くことができます。

これらの推奨事項は出発点にすぎません。組織内に適切なAIストレージ インフラストラクチャを設計および実装する専門知識を持つ人材がいない場合は、ベンダーと協力してAI用のストレージ システムの準備を支援する必要があることを常に念頭に置いてください。

また、IBM Storageを使用したAIプロジェクトの計画と準備に関してご質問がある場合やサポートが必要な場合は、お気軽にIBM Systems Lab Servicesにお問い合わせください。

 
関連ソリューション
データ分析とAI分析

オープンソースのフレームワークとツールを使用して、IBM® zSystemsメインフレーム上の最も貴重な企業データにAIと機械学習を適用します。

IBM Zについて
AIインフラストラクチャー・ソリューション

IBMは、ハイブリッド・バイ・デザイン戦略により、企業全体への影響を加速するAIインフラストラクチャー・ソリューションを提供しています。

AIインフラストラクチャー・ソリューションはこちら
AIコンサルティングとサービス

IBMコンサルティングと連携することで、企業データの価値を引き出し、ビジネス上の優位性をもたらす洞察を活用した組織を構築できます。

AIサービスの詳細はこちら
次のステップ

実際の企業の要求に合わせて構築され、パフォーマンス、信頼性、ハイブリッドクラウド統合向けに最適化されたインフラストラクチャーで、AIワークロードを強化します。

AIインフラストラクチャー・ソリューションの詳細はこちら 詳細を取得する