これは、最新のコンピューター・ネットワーキングにおいて重要な構成要素であり、相互に接続されたコンピューティング・リソースのシームレスな通信を可能にし、日常的なネットワーク管理タスクを自動化し、最適化されたAIモデルのトレーニングと推論を促進します。AI駆動型の戦略は、今日のIT環境の規模、複雑さ、高度さに対して不十分なことが多い従来のネットワーク手法の限界を克服するよう開発チームを支援できます。
従来のネットワークは手動プロセス、静的構成、定期保守に依存しているため、単純なデバイスの操作が可能な小規模なネットワークでは問題にはなりません。しかし、最新のネットワークは単純でも小規模でもありません。これらは、多様で動的なグローバル環境と、相互接続された何千ものデバイスと依存関係のあるハイブリッドクラウド・インフラ・ストラクチャーにまたがっています。平均的なマルチクラウド環境は12の異なるサービスとプラットフォームにまたがります。
AIツールとMLツールを使用して既存のネットワーク・インフラストラクチャーを拡張すると、企業はネットワーク管理の実践を簡素化し、ネットワーク・インテリジェンスを向上させ、自動化機能を拡張できるようになります。AIネットワーキング・ソリューションにより、次のことが可能になります。
場合によっては、AI駆動型ネットワークは自己修復メカニズムやワークフローを構築することさえできます。
AIネットワーキングは、大規模なAIモデルの導入や、高度に自律的でデータ駆動型の企業ネットワークの構築に不可欠です。これにより、人間が管理する静的なネットワークから、最新のテクノロジー( 5G、IoT(モノのインターネット)、エッジコンピューティング、AIワークロード、クラウドネイティブ・サービス)の膨大な需要をサポートできる動的な自律型ITインフラストラクチャーへとパラダイムシフトします。
その結果、よりスマートで高速、かつ回復力に優れたエンタープライズ・ネットワークが実現し、エンドユーザーにスムーズな操作性を提供できるようになります。
AIネットワーキングはテレメトリー収集によって駆動します。ネットワーク全体のすべてのネットワークおよびコンピューティング要素(ルーター、スイッチ、アプリケーション・プログラミング・インターフェース(API)エンドポイントを含む)は、大量のリアルタイムのデータ・ストリーム(性能、トラフィック・フロー、異常信号)を集中型または分散型のデータレイクに送ります。
クラウドネイティブのAIとMLモデルが継続的にデータを分析し、イベントを相関させ、正常な挙動と異常な挙動を構成するものを学習し、データ駆動型の知見を生み出します。これらは、教師なし学習(異常検知用)、教師あり学習(予測分析用)、強化学習を使用して、ネットワーク・プロセスと相互作用を動的に最適化します。AIツールからの知見は、自動応答に変換されます。
AI駆動型ネットワーク監視ツールが輻輳や障害を感知すると、修復ワークフローをトリガーして、トラフィックの再ルーティング、ワークロードのバランス調整、ネットワーク・ポリシーの更新、またはセキュリティー脅威の隔離を行うため、IT担当者による手動介入の必要性が軽減されます。
AIネットワーキングは、水平方向に拡張できるように設計されています。ネットワークの需要とデバイスのエコシステムが拡大するにつれて、ネットワーク上のAIシステムは、より多くのコンピューティング・ノード、スイッチ、リンクを自動的に追加します。AIネットワークは、マルチパス接続と迅速なフェールオーバー・メカニズムを使用して冗長性を構築し、ネットワークの高可用性を確保します。
IBMニュースレター
AI活用のグローバル・トレンドや日本の市場動向を踏まえたDX、生成AIの最新情報を毎月お届けします。登録の際はIBMプライバシー・ステートメントをご覧ください。
ニュースレターは日本語で配信されます。すべてのニュースレターに登録解除リンクがあります。サブスクリプションの管理や解除はこちらから。詳しくはIBMプライバシー・ステートメントをご覧ください。
AIネットワークは、一連の主要コンポーネントを利用して機能します。次のようなものがあります。
AIネットワークは、高度なハードウェア(800Gおよび400GイーサネットやInfiniBandなど)と最適化されたコントローラーを使用して、コンピューティング・ノード、データ・ストレージ、オーケストレーター・プラットフォーム間で超高速かつ低レイテンシーのデータ交換を実現します。スイッチは多くの場合、AIトラフィックの急増に対応し、パケット損失を防ぐために、特殊なパケット・プロセッサーとディープ・パケット・バッファを備えています。
ルーターとスイッチはソフトウェア定義型ネットワーク(SDN)およびネットワーク機能仮想化(NFV)ツールと統合して、ネットワークの柔軟性と拡張性を向上させることもできます。
AIネットワークは、グラフィックス・プロセッシング・ユニット(GPU)やデータ・プロセッシング・ユニット(DPU)などの何千ものコンピューティング・アクセラレーターを、高速で損失のないデータ処理用に最適化された銅リンクまたは光リンク、ケーブル、トランシーバーを使用して接続します。相互接続は、デジタル通信のバックボーンを形成し、異種のシステム、データセンター、クラウド、境界を越えてデータとサービスをリンクします。
AIネットワークは、相互接続された大規模なクラスターに編成された強力なプロセッサー(DPU、GPU、その他のAI専用プロセッサー)を利用して並列処理を実装し、 AIモデルのトレーニングと推論を加速します。
ネットワーク・ファブリックは多くの場合、多数のサーバーとスイッチ間のマルチパス通信を可能にするノンブロッキング・トポロジー(分散されたモジュール式アーキテクチャー)として設計され、ネットワークを小さな独立した(しかし相互接続された)モジュールに分割して、一貫性のあるシステムを形成します。
AIネットワークでは、一般的に多層戦略が使用されます。たとえば、ネットワークでは、長期アーカイブにはデータレイクとデータウェアハウスを使用し、非構造化データにはオブジェクト・ストレージを使用し、AIワークロードの高速な類似性検索を可能にするベクトル・データベースを使用します。
自動化および AIOpsソフトウェアは、AIネットワークがリソースの展開、スケーリング、継続的な監視、CI/CDパイプラインを自動化できるよう支援します。これらのツールは大抵、機械学習アルゴリズムを使用して予測分析を実行し、閉ループ・ネットワーク管理 (ネットワーク・システムがリアルタイムの動的なフィードバック・ループを使用して是正措置を自動化する自己是正アプローチ)を促進します。
また、ソフトウェア開発、コンテナ化、バージョン管理プロセスの効率化を支援するAI対応のオペレーティング・システムと仮想環境も提供しています。
AIネットワークは、ゼロトラスト・セキュリティー構成、ロールベースのアクセス制御(RBAC)、暗号化プロトコル、コンプライアンス・フレームワーク、データ処理ルールを適用して、ネットワーク・データとAIアプリケーションを侵害やサイバー攻撃から保護します。
AIネットワーキングは、AIによる自動化と、インテリジェントで応答性の高いインフラストラクチャーの統合を表したものです。これは、企業が動的で安全なスケーラブルなネットワーキング環境を構築するのに役立ちます。AIネットワークは以下をもたらします。
MLシステムは、日次、週次、季節的なパターンを考慮して、時間の経過に伴う「通常の」ネットワーク動作の動的モデルを構築します。このアプローチにより、無害な変動によってアラートがトリガーされることが防止され、システムはネットワーク・ベースラインから大きく逸脱する実際の異常に集中できるようになります。
AIシステムは複数のデータ・ソースを統合し、高度なアルゴリズム(教師なし学習を含む)を用いて、ルールベースのシステムが見落としてしまうようなネットワークの性能の問題の微妙な指標を関連付けます。AIツールは、たとえば、組織的なマルチベクトル攻撃や、徐々に進行する低速の悪意あるトラフィックを検知できます。
AIネットワークは、MLモデルを使用して、ネットワーク・トラフィック、デバイス・ログ、データ・パターンを継続的に監視し、大量のデータをリアルタイムで分析します。これらの機能は、AIツールがセキュリティーの脆弱性、異常な挙動(たとえば、急激なトラフィック・フロー)、不正アクセスの試み、サイバー攻撃の初期兆候を検知するのに役立ちます。
従来の静的なしきい値ベースの異常検知方法とは異なり、AIモデルはコンテキスト・データと履歴データを使用して適応型ベースラインを実装して検知の精度を高め、ITチームの注意をそらす可能性のある誤報を減らします。
AIツールは、高度な分析、自然言語クエリー、データの可視化などの機能を提供し、ネットワーク・オペレーターがインシデントをより迅速かつ効果的に調査できるようにします。これらの機能により、複雑なネットワーク・データへのアクセスが民主化され、データ処理と分析に多くのリソースが投入されます。また、AIネットワークが共同での問題解決をサポートし、根本原因分析を加速できるよう支援します。
異常を検知すると、AIネットワークは自動化されたワークフローをトリガーし、問題を即座に解決します。たとえば、混雑したエリアを避けてトラフィックを再ルーティングしたり、不審なアドレスをブロックしたり、追加のネットワーク容量をプロビジョニングしたりできます。
AIツールは、現在の異常を検知するだけでなく、テレメトリー・データの傾向や信号を分析することで、将来の障害や混雑点を予測するのに役立ちます。予測機能は、ネットワーク・エンジニアと管理者がネットワーク管理に先見的なアプローチを取ることができ、ダウンタイムやシステム停止を未然に防ぐことができます。
AIネットワーキングは、従来のネットワーク・アーキテクチャーとは根本的に異なります。リアルタイム・データ、ML、自動化を活用して、コンピューティング・ネットワークを動的に改善し、保護します。
従来のネットワークは通常、手動で設定された静的ルール、事前設定されたしきい値、および事後対応管理の手法に頼っています。また、従来のネットワーキングでは階層アーキテクチャーを使用しており、効率的なデータ転送のためにネットワーク・デバイスの層を作成します。分散制御では、予測可能で安定したネットワーク環境が実現しますが、拡張性も制限されます(多くの場合、容量を追加するには、新しいハードウェアへの投資が必要)。
従来のモデルの場合、各ネットワーク・デバイスは独自の制御およびデータ・プレーンの機能を独立して実行します。ネットワーク・オペレーターは、デバイスごとにルーティング・テーブル、スイッチング・ルール、セキュリティー・ポリシーを手動で構成することで、データ・トラフィックを管理します。監視は基本的なメトリクスに限定され、アラートは(ネットワークの問題が発生した後 )固定条件によってトリガーされることが多く、トラブルシューティングは個々のデバイスに分離される傾向があり、これらすべてが インシデント対応ネットワークの適応を遅らせます。
対照的に、AIネットワークはハイブリッドクラウドとマルチクラウド環境にまたがり、オンプレミスのデータ・センター、複数のクラウド環境、エッジ・サーバーが組み込まれることがよくあります。ネットワーク全体からテレメトリー・データを継続的に収集し、AIアルゴリズムを使用してリアルタイムのデータ・セットを分析し、複雑なトラフィック・フローを理解し、ユーザーの振る舞いを解釈します。
AIネットワークは、より優れた最適化ツールをサポートし、ネットワークの拡張性を高めることもできます。AI駆動型ネットワークは、静的な構成に依存するのではなく、実際の使用パターンに基づいて帯域幅の割り当てとルーティングを動的に調整し、需要の急増に合わせて自動的にスケーリングします。
さらに、AI駆動型のネットワークは、より信頼性の高い包括的なセキュリティーを提供します。従来のネットワークは一般に、シグネチャベースのセキュリティー・モデルを使用しており、マルウェアや悪意のある活動に関連した独自のパターン(「シグネチャ」)を識別することで、既知の脅威を検知して防止します。AIネットワーキングは、シグネチャベースのセキュリティー・モデルをAIベースの脅威検知で拡張(または置き換え)し、包括的な行動分析を使用して高度な攻撃を特定し、ネットワーク・セキュリティーを侵害する前にサイバー脅威にAIで対処します。
AIネットワークの構築、管理、セキュリティー保護の方法には、複数の重要な傾向が影響しています。
イーサネットは、AIワークロードのネットワーク・ファブリックとしてますます人気が高まっています。多用途でコスト効率に優れた低遅延のネットワーキング・ソリューションを実現し、その速度はすでに400Gおよび800Gに達しています(そして1.6Tイーサネットの実現が近づいています)。
イーサネットベースのAIネットワークは、AIモデルのトレーニング、リアルタイム推論、大規模なAIデータ処理に必要な膨大なデータ・スループットを処理できる大規模な帯域幅を備えています。また、イーサネットの導入プロセスは簡素化されており、オンプレミスとクラウドのAIリソース間でロスレス通信を実現できるため、多様で分散したAIインフラストラクチャーを接続する優れた選択肢となります。
生成AIの進歩により、AIネットワークの運用はよりスマートになって自動化されています。生成AIは、理想的なネットワーク・トポロジーとデバイス設定をシミュレーションして生成することで、ネットワーク・エンジニアのネットワーク設計を支援します。
生成AIツールは、AIネットワークとキャパシティー・プランニングの予測モデルを作成できます。大規模な履歴データセットとリアルタイムのデータセットを使用して、将来のネットワーク負荷を予測するモデルを構築します。これらのモデルにより、ネットワーク運用担当者は、今後の需要の急増を予測し、インフラストラクチャーを先見的に調整して、ボトルネックやサービスの中断を防ぐことができます。
生成AIベースのネットワーク・ツールは、複数の無線アクセス。テクノロジー(Wi-Fi、Bluetooth、4G LTE、5Gなど)にわたる負荷分散も可能にし、高密度ネットワーク環境でのデータ干渉の軽減にも役立ちます。
エージェント型AIにより、企業はより自律的で適応性の高いエージェント型AIネットワークを構築できるようになります。エージェント型AIは「限られた監督の下で特定の目標を達成できるAIシステム」です。AIエージェントは、大規模言語モデル(LLM)、自然言語処理(NLP)、MLを使用して、ワークフローを設計し、タスクを実行し、ユーザーや他のシステムに代わってプロセスを実行します。
従来の静的システムとは異なり、エージェント型AIネットワークは分散型アーキテクチャーを使用しており、 AIシステムとエンドポイント間を移動し、データを迅速に交換して超高速の意思決定をサポートします。エージェントは環境を認識し、ネットワーク接続を最適化し、セキュリティー・プロトコルを強化し、ユーザー体験を向上させるためのアクションを独自に実行できます。
たとえば、条件の変化に応じてネットワーク・パラメーター(リソースの割り当てやデータ・ルーティングなど)を動的に調整できます。また、エージェントが不審なネットワーク・アクティビティーを検知した場合、侵害されたデバイスを隔離し、サイバー攻撃を阻止するための対策をリアルタイムで実行できます。
ネットワーキングにおけるAIの進歩に伴い、スイッチ、GPU、AIワークロード専用の最適化された高帯域幅で低遅延のファブリックなど、AI対応インフラストラクチャーの構築に重点が置かれています。
サービス型AIネットワーク・インフラストラクチャー(NIaaS)もこうした開発の1つです。AINIaaSは、AIネットワーク・インフラストラクチャーをオンデマンドで仮想化および調整することで、ネットワーク管理を簡素化し、導入時間を数か月から数分に短縮します。これはクラウドベースのモデルであるため、企業は物理的なハードウェアを導入または保守することなく、仮想ルーター、ファイアウォール、ロード・バランサー、AIコンポーネントなどのネットワークおよびセキュリティー機能一式にアクセスできます。
AI NIaaSサービス・プロバイダーは、クラウドのような柔軟な消費モデル(従量課金やサブスクリプション・ベースの料金体系など)を提供し、リソースは特定のAIプロジェクトのコンピューティング・ニーズに応じてプロビジョニングされます。
統合されたAIクラスターによるハイパースケール・ネットワーキングは、AIネットワーキングの新たなトレンドです。AIクラスター統合は、AIコンピューティング・リソースを複数のAI「アイランド」に整理および統合して、データ・ファブリックを作成するプロセスです。ワークロードをより少ない強力なクラスターに集中させることで、ネットワーク内の十分に活用されていないサーバーやノードの数が減ります。
また、ハイパースケール環境(巨大なワークロードを処理するように設計された非常に大規模なコンピューティング環境)は、エンタープライズ・ネットワーク規模でのクラスター統合をサポートするために必要な容量、冷却、データ・ストレージを提供します。クラスターの統合とハイパースケール・ネットワーキングを組み合わせることで、AIモデルのトレーニングと導入が簡素化され、より高速で効率的な AIネットワークが実現します。
IBM Institute for Business Value(IBM IBV)によると、「AI対応ワークフロー(その多くはエージェント型AIによって駆動)は、2024年は3%だったのが2026年までに25%に拡大する見込み」で、AI導入が8 倍に増加することになります。AIベースのネットワーキング・アプローチを採用すると、企業は次のような数多くのメリットを得ることができます。
AIツールは、状況の変化に応じてネットワーク構成を動的に調整し、トラフィック・フローを最適化することで、パフォーマンスのボトルネックを軽減し、企業が高性能でダウンタイムの少ないネットワークを維持できるようにします。
AIネットワークにより、より優れたリソース管理が可能になり、分散環境全体で効率的な帯域幅の使用が可能になります。
AI駆動型の自動化ワークフローは日常的なタスクを処理できるため、ITスタッフはより高レベルな戦略的イニシアチブに専念できます。
AIツールは、ネットワーク・トラフィックとパターンを継続的に分析し、異常な動作や不規則なネットワーク運用を発生時に特定します。
AIネットワーク・ツールは、人間の介入なしで大量のデータを迅速に処理できます。また、AIモデルは、ネットワークの規模と複雑さの増大に応じて容易に拡張できます。
AIシステムは、ネットワーク・トラフィックを分析し、潜在的な問題とサイバー脅威をリアルタイムで、重大なインシデントに発展する前に特定します。これらのツールは、即時の封じ込めアクション(侵害を受けたデバイスの隔離や疑わしいアクティビティーのブロックなど)やセキュリティー・アップグレードを推奨し、多くの場合、それらを開始することで、攻撃の滞留期間を短縮し、サイバー攻撃によって生じかねない損害を軽減します。