マイクロサービスからAIエージェントまで:アプリケーション・アーキテクチャーの進化

モダンなオフィスでアイデアを共有する同僚たち

アプリケーションアーキテクチャは再び転換点に達しました。AIエージェントは、最新のシステムの強力な構成要素として台頭しており、従来のマイクロサービスを補完、拡張、さらには置き換えることさえできます。

このアーキテクチャの転換は、組み立て可能なコンポーネントの基本的なパターンを維持しつつ、開発速度、適応性、統合能力において大幅な向上をもたらします。エージェント型フレームワークを用いて新たなアプリケーションを構築する組織は、急速に進化する技術環境において競争優位性を確立する立場に立つことができます。

ニュースレターを表示しているスマホの画面

The DX Leaders

「The DX Leaders」は日本語でお届けするニュースレターです。AI活用のグローバル・トレンドや日本の市場動向を踏まえたDX、生成AIの最新情報を毎月お届けします。

アーキテクチャーの進化の道のり

アプリケーション アーキテクチャの歴史を振り返ると、よりインテリジェントなコンポーネントに分解されるという一貫したパターンが見られます。

1990年代: モノリシックアプリケーション
単一コードベース システムがエンタープライズ コンピューティングを支配し、重大な運用上の課題を生み出しました。

  • デプロイメントには広範なテスト サイクルが必要
  • スケーリングにはシステム全体の複製が必要
  • ある領域の変更により、無関係な機能が損なわれるリスクがあった
  • 開発サイクルが数か月から数年に及ぶ

2000年代初頭: サービス指向アーキテクチャ (SOA)
SOA は、アプリケーションをビジネスに合わせたサービスに分解することで、モノリシックな制限に対処しました。

  • 新しいアーキテクチャにより再利用性と統合機能が向上
  • サービスは比較的重厚な状態を維持
  • オーケストレーションの複雑さにより脆弱なシステムが生まれる
  • 開発サイクルは数ヶ月単位で測定された

2010年代:マイクロサービス
マイクロサービスアーキテクチャは、アプリケーションをより小さく、独立してデプロイ可能なユニットに分割しました。

  • 各マイクロサービスは自律的に動作する
  • サービスは明確に定義されたアプリケーションプログラミングインターフェース(API)を通じて提供された
  • コンポーネントは個別に拡張
  • コンテナ化テクノロジーによるデプロイメントの簡素化
  • 開発サイクルは数週間に短縮
オフィスでミーティングをするビジネスチーム

IBMお客様事例

お客様のビジネス課題(顧客満足度の向上、営業力強化、コスト削減、業務改善、セキュリティー強化、システム運用管理の改善、グローバル展開、社会貢献など)を解決した多岐にわたる事例のご紹介です。

AIエージェント:新しいアーキテクチャー・パラダイム

今日の建築分野の最先端技術はAIエージェントを特徴としています。従来のマイクロサービス機能を強化する、知能的で自律的な構成要素です。主な違いは次のとおりです。

特性

マイクロサービス
 

AIエージェント
 

プログラミングモデル

明確なルールとロジックを義務付け

ハイブリッドモデルを提供: コンパイルされたコアと推論層

適応性

コード変更が必要

最適化と動的推論を組み合わせる

統合

APIコントラクトの使用

デュアルモードを使用: セマンティック理解によるAPIコントラクト

エラー処理

応答が事前にプログラムされている

適応的なフォールバックを備えた最適化されたパス

開発労力

高いレベルの労力が必要(単一目的のコード)

より戦略的(クリティカルパスと推論インターフェース)

 

従来の決済処理マイクロサービスでは、検証、処理、エラー状態、統合を処理するために何千行ものコードが必要です。対照的に、高性能AIエージェントは、クリティカルパス用にプリコンパイルされたコンポーネントと、複雑な意思決定のための機能を組み合わせます。このハイブリッドアプローチは、性能の信頼性と適応型インテリジェンスの両方を確保するのに役立ちます。

たとえば、Ahead-of-Time (AOT) コンパイルを使用したC#でのセマンティック カーネル エージェントの実装は、実稼働エージェント システムが、価値のある推論機能を追加しながら、パフォーマンスにおいて従来のマイクロサービスと同等またはそれを超えることができることを示しています。

エージェント型フレームワーク:最新のオーケストレーション

マイクロサービスに基盤となるオーケストレーション・プラットフォームが必要なのと同様に、AIエージェントにも特殊なエージェントフレームワークが必要です。Semantic KernelやLangChain Enterpriseなどの最新ソリューションは、エンタープライズ・グレードの性能でエージェント調整に必要なインフラストラクチャーを提供します。

これらのフレームワークは、期待されるエンタープライズ・グレードの性能標準を維持しながら、従来のサービス・オーケストレーションを超えた機能を提供します。

  • ハイパフォーマンス基盤: エージェント型フレームワークは、予測可能な低遅延実行を実現するAOTコンパイルを備えたコンパイル言語で構築されています。
  • メモリ効率の高い設計: エージェント型フレームワークは、リソースの消費を最小限に抑えるため、高スループットのシステム向けに最適化されています。
  • セマンティックプロセッシング: エージェントはタスクの複雑さに基づいて計算リソースを割り当てます。
  • エンタープライズ統合:エージェント型フレームワークは、強力な契約強制機能を備えた既存システムへの型安全なコネクタを提供します。
  • ハイブリッドプランニング:エージェント型フレームワークのクリティカルパスはコンパイルされた論理を用い、複雑なシナリオでは推論にAIが使われます。

ビジネス上の実際的なメリット

エージェント型アーキテクチャーへの移行により、次のような目に見えるメリットがもたらされます。

  • インテリジェンスを備えたパフォーマンス: 適切に設計されたAIエージェントが優れたパフォーマンスを提供します。コンパイルされたエージェントは、従来のマイクロサービスよりも高いスループットを達成し、複雑な不正アクセス検知のための推論を追加することができます。
  • エンタープライズ・グレードの信頼性:エージェント型フレームワークにより、堅牢な統合が可能になります。サプライチェーン・システムは、何千ものトランザクションを処理し、データの不整合をスムーズに処理できます。
  • 優れたエラー処理: AIエージェントは、復旧パスと推論を組み合わせます。注文処理システムは、最適化されたエラー処理パスと新たな障害の推論を通じて高可用性を維持します。
  • 将来を見据えたアーキテクチャ: 組織は今日メリットを得ながら、将来に向けた準備を整えることができます。推論レイヤーを備えたコンパイルされたエージェントは現在のパフォーマンスを最適化し、将来のAI進歩への道を開きます。

実装戦略: パフォーマンス優先のアプローチ

組織は、企業基準を維持しつつAIの利点を活用する実践的な実装戦略を必要としています。

  • パフォーマンスプロファイリング: パフォーマンス上重要な処理経路と、推論機能の恩恵を受ける可能性のある複雑な意思決定ポイントの両方を有するマイクロサービスを特定します。
  • アーキテクチャ設計:エッジケースを処理する推論コンポーネントからクリティカルなパス(コンパイルコードで実装)を分離するエージェント設計を作成します。
  • フレームワークの選択: パフォーマンス ベンチマーク、既存システムとの言語互換性、コンパイル オプションに基づいてエージェント フレームワークを評価します。
  • チームの強化:従来のソフトウェア開発の専門知識とAIエンジニアリングスキルを組み合わせたエンジニアリングチームを構築します。
  • 体系的なデプロイメント: 推論機能と並行して厳密なパフォーマンス ベンチマークを実装およびテストします。

パフォーマンスを優先したアプローチを実施することで、組織は戦略的なAI機能を構築しながら、運用上のメリットを達成することができます。

評価および評価主導の開発

AIエージェントの品質エンジニアリングには、従来のソフトウェア・テストとは根本的に異なるアプローチが必要です。エージェント型アーキテクチャーをリードする企業は、エージェントが機能要件と推論基準の両方を確実に満たすようにする方法論である評価駆動型開発の先駆者となっています。

評価フレームワーク

評価は、次のような複数の側面にわたってエージェントの行動を評価するために設計された特殊なテスト・スイートです。

  • 機能評価:入出力アサーションを通じてコアビジネス能力を検証します。
  • 推論評価: 意思決定の質と問題解決のアプローチを評価します。
  • 行動評価: 組織のガイドラインおよび倫理基準との整合性をテストします。
  • パフォーマンス評価: 応答時間、スループット、および参考情報の使用量を測定します。
  • 敵対的評価: エッジケースと潜在的な障害モードでエージェントを試します。

一部のクラウド、データ、AIプロバイダーの内部データでは、エージェント・システムの多次元評価を実装した後、運用インシデントが大幅に減少したことが示されています。

評価主導型開発の実装

成熟した評価主導型開発プロセスには、次の主要な要素が含まれます。

1. 評価定義プロトコル

まず、あらゆる側面にわたって期待を定義することから始めます。各エージェントに対して、以下を実施してください。

  • 期待される主要な機能を明確な成功基準とともに文書化する
  • エージェントが示すべき推論パターンを具体的に示す
  • 境界とガードレールを確立する
  • ビジネス要件に基づいてパフォーマンスしきい値を設定する

2. 継続的評価パイプライン

開発ライフサイクル全体を通じて評価を実行する自動化されたパイプラインを構築します。

  • コミット前の評価により、コード統合前に問題を特定
  • 統合評価でエージェント間の相互作用を検証
  • 実稼働データを使用したステージング評価テスト
  • 生産監視でデプロイしたエージェントを継続的に検証

3. 動的テスト生成

静的なテストケースを超え、動的に生成されるシナリオを活用しましょう:

  • 大規模言語モデル(LLM)を使用して、エージェントの推論を強調する多様なテストケースを作成する
  • 既知のエッジケースのバリエーションを生成する
  • 生産パターンに基づいた新規インプットのシミュレーション

4. 人間とAIの協調評価

自動化テストと人間の専門知識を組み合わせます:

  • 専門家のレビュー担当者が複雑なシナリオにおけるエージェントの推論を評価する
  • UX研究者は人間とエージェントのインタラクションの質を評価する
  • ドメインスペシャリストがビジネスロジックの正確性を検証する

5. 回帰防止

以下により、機能の回帰を防ぎます:

  • 発見された問題ごとに拡張される包括的な評価スイート
  • エージェントバージョン間のA/B比較
  • 主要性能指標の継続的なモニタリング

スタンフォード人間中心AI研究所(HAI)による2024年の研究により、包括的な評価フレームワーク エクスペリエンスを利用している企業は、開発サイクルが 65% 短縮され、本番ロールバックが 42% 減少していることがわかりました。

お客様事例:金融サービスにおける導入

上位10に入る世界的な銀行は、カスタマー・サービス・エージェント向けに評価主導の開発を導入し、素晴らしい成果を上げました。

彼らのアプローチは、機能検証のための自動テストスイート、複雑な意思決定シナリオに対するアセスメント、重要なやり取りに対する専門家のレビューという3層の評価フレームワークを中心としていました。

このフレームワークによって、従来のテストでは見逃してしまう微妙な問題が明らかになりました。たとえば、エージェントはポリシーに従ってローン申請を正しく承認しましたが、境界線上のケースで意図せずバイアスを強化する推論を使用しました。これは、デプロイメント前の推論評価によって特定された問題です。

エージェント・アーキテクチャーのコスト最適化ストラテジー

エージェント・アーキテクチャーの経済的な実行可能性は、効果的なコスト管理ストラテジーによって異なります。AIエージェントは大きなビジネス価値をもたらしますが、運用コストの管理は依然として重要な成功要因です。

経済的課題

コストに関して、組織は主に2つの考慮事項に直面しています。

トークンコスト:基盤モデルとの各やり取りには、トークンごとの料金が大規模に蓄積されます。多段階推論を持つ複雑なエージェントネットワークは、同様の直接API呼び出しよりも10〜15倍多くのトークンを生成できます。

計算コスト:特に高度な推論を行う推論は、多大な計算リソースを必要とします。推論用のオンプレミスGPUクラスターには、通常、多額の初期投資が必要です。クラウドベースの推論では、小規模から中規模のデプロイメントの場合、月額 10,000 米ドルから 50,000 米ドルの範囲のコストが発生する可能性があります。

効果的な最適化アプローチ

先進的な組織では、これらのコストを管理するための体系的なアプローチを開発しています。

1.アーキテクチャの最適化

  • 複雑な決定を基盤モデルにルーティングするハイブリッドエージェント設計
  • 本番デプロイメントのためのモデルの量子化
  • 一般的なクエリに対する応答の戦略的なキャッシュ

JPMorgan Chaseは、 トランザクションの 89% を確定的パスで処理するハイブリッドアーキテクチャにより、推論コストを 67% 削減しました。これにより、LLM のリソースは複雑なシナリオに充てることができました。

2. 効率化のためのプロンプトエンジニアリングのチューニング

  • トークンの使用を最小限に抑えるための命令設計の精度
  • 不要な情報を排除するコンテキストプルーニング
  • トークン生成を削減するためのレスポンス形式の最適化

3.推論の最適化

  • 反復されるインタラクションのためのキーバリュー(KV)キャッシュの実装
  • 時間的制約のないオペレーションのバッチ処理
  • ワークロードパターンに合わせたデプロイメントインフラストラクチャの適正化

4. RAGの実装

  • コンテキストサイズを縮小するための戦略的検索拡張生成
  • 効率的な情報アクセスのためのベクトルデータベースの最適化
  • 関連情報を圧縮するコンテキスト抽出技術

5.ドメイン特化のための微調整

  • パラメーター数を削減したドメイン固有のモデルの作成
  • 一般モデルを効率的に特殊なバリアントに抽出
  • LoRAやQLoRAなどのパラメータ効率の高いチューニングアプローチ

マッキンゼーの2024年AI経済報告書は、これらのストラテジーのうち3つ以上を実施することで、システムの機能を維持または向上させながら、AIの運用コストを平均62%削減できると述べています。

実装上の課題

エージェント・アーキテクチャーでは、新たな実装上の考慮事項が発生します。

オーケストレーションの複雑さ
自律エージェントを調整するには、従来のマイクロサービスのオーケストレーションとは異なるアプローチが必要です:

  • 分散型の意思決定には高度な調整が必要
  • 複数のエージェントが共通の目標に向かって取り組む必要がある
  • 非同期の変更によりシステム状態はより複雑になる

最新のフレームワークは、優先順位付けシステムと共有コンテキストを通じて、これらの課題に対処します。MicrosoftのSemantic Kernelは、エージェントの自律性とシステムの整合性のバランスをとるオーケストレーションを実装しています。

オブザーバビリティーとモニタリング
従来の監視アプローチは進化する必要があります。

  • システムは推論パスと決定基準を把握する必要がある
  • 行動分析はエージェントの対話全体のパターンを特定するのに役立つ
  • 予測監視は潜在的なシステム状態を予測する

セキュリティーとガバナンス
エージェント・アーキテクチャーは、以下のような新しいセキュリティーを導入します。

  • エージェントの指示が組織のポリシーと一致していることを確認するメカニズム
  • 実行前にエージェントの動作を検証するシステム
  • コンプライアンスに対するエージェントの推論を検査する機能

マイクロサービスとエージェントシステムの比較:実際のユースケース

マイクロサービスとエージェント・アーキテクチャーの違いを説明するために、金融サービス取引プラットフォームを考えてみましょう。

従来のマイクロサービスの実装:

  • アカウントサービスは顧客情報と残高を管理
  • 取引サービスは明示的なリクエストに基づいて注文を実行
  • 市場データサービスは、問い合わせ時に価格を提供
  • 通知サービスは、事前に定義されたイベントの後にアラートを送信
  • リスク管理サービスはルールベースのチェックを適用

顧客が取引を行うと、システムは事前に決められたパスをたどり、各ステップは明示的にトリガーされたときに実行される

エージェント的実装:

  • ポートフォリオ・エージェントが保有保有額を継続的に監視し、リバランスの機会を提案
  • 取引実行エージェントが市場の状況に基づいて最適なタイミングを選択
  • リスクアセスメントエージェントが市場の変動を積極的に評価
  • コミュニケーション・エージェントが設定済みチャネルを通じて関連情報を提供

実際には、エージェントの導入は根本的に異なる顧客体験を生み出します。市場の変動性が高まると、リスクアセスメントエージェントは取引制限を自律的に調整し、ポートフォリオに通知する場合があります。ポートフォリオは、顧客の保有資産の潜在的な脆弱性を分析します。システムは、明示的にコード化されたものを超えたインテリジェンスを発揮します。

今後の展望: エージェント規模のプラットフォーム・エンジニアリング

モノリスからサービス、マイクロサービス、エージェントへの進歩は、明確な歴史的パターンに従っています。進化するごとに、インテリジェンスと自律性が向上し、より細分化されたコンポーネントが導入されました。

エージェント アーキテクチャを大規模に実装する組織は、アプリケーション ポートフォリオ全体で一貫した品質、コスト効率、ガバナンスを達成するために、プラットフォーム・エンジニアリングの原則を採用する必要があります。

プラットフォーム駆動型の導入

先進的な組織は、内部開発者プラットフォーム(IDP)を使用してエージェントの導入を加速させています。

標準化されたエージェントインフラストラクチャ

  • 監視機能が組み込まれた事前構成済みのエージェント・テンプレート
  • 一般的なエージェント・タイプに対応したゴールデン・パスの実装パターン
  • 自動化された品質ゲートによるセルフサービス デプロイメント

オブザーバビリティー

  • エージェントのパフォーマンスと動作の集中監視
  • エージェント間のインタラクションの追跡と可視化
  • 根本原因分析による自動異常検知

開発者エクスペリエンスの重視

  • エージェントの開発とテストのためのセルフサービスツール
  • 特殊なエージェントデバッグを備えた統合開発環境
  • 開発中のコンプライアンス・チェックの自動化

大規模なガバナンス

  • 一元的なポリシー管理と適用
  • 標準に対するエージェントの動作の自動評価
  • すべてのエージェントの行動に対する包括的な監査記録

Gartner の 2024 年プラットフォーム・エンジニアリング レポートは、成熟したプラットフォーム アプローチにより、新しいエージェント機能の市場投入までの時間が 3.2 倍短縮され、開発者の満足度が 76% 向上したと述べています。

組織は現在、適切なユースケースにエージェント アーキテクチャを導入する先導役となるか、早期に優位性を獲得した競合他社に追随するかという選択に直面しています。証拠は、プラットフォーム駆動型アプローチを導入する先駆者が、開発速度、システムの柔軟性、機能において大きな競争優位性を得ていることを示唆しています。

関連ソリューション
IBM watsonx.ai

AI開発者向けの次世代エンタープライズ・スタジオであるIBM watsonx.aiを使用して、生成AI、基盤モデル、機械学習機能をトレーニング、検証、チューニング、導入しましょう。わずかなデータとわずかな時間でAIアプリケーションを構築できます。

watsonx.aiの詳細はこちら
人工知能ソリューション

IBMの業界をリードするAIの専門知識とソリューションのポートフォリオを活用して、AIをビジネスの業務に利用しましょう。

AIソリューションの詳細はこちら
人工知能(AI)コンサルティングおよびサービス

IBMコンサルティングAIサービスは、企業がAIをトランスフォーメーションに活用する方法を再考するのに役立ちます。

AIサービスの詳細はこちら
次のステップへ

AI開発ライフサイクル全体にわたる機能にワンストップでアクセスできます。使いやすいインターフェース、ワークフロー、業界標準のAPIやSDKを利用して、強力なAIソリューションを構築できます。

watsonx.aiの詳細はこちら デモの予約