AI 에이전트 프로토콜이란 무엇인가요?

작성자

Staff Writer

IBM Think

Staff Editor, AI Models

IBM Think

AI 에이전트 프로토콜은 인공 지능 에이전트 간, 그리고 인공 지능 에이전트와 다른 시스템 간의 통신 표준을 설정합니다. 이러한 프로토콜은 메시지의 구문, 구조 및 순서와 함께 에이전트가 대화에서 수행하는 역할 및 메시지에 응답하는 시기와 같은 커뮤니케이션 규칙을 지정합니다.

에이전트 기반 AI 시스템은 종종 사일로에서 실행됩니다. 다양한 AI 에이전트 프레임워크를 사용하고 각기 다른 에이전틱 아키텍처를 사용하는 여러 공급자에서 구축합니다. 실제 통합은 어려운 과제이며, 이러한 파편화된 시스템을 연결하려면 가능한 모든 유형의 에이전트 상호 작용을 위한 맞춤형 커넥터가 필요합니다.

여기서 프로토콜이 필요합니다. 서로 다른 다중 에이전트 시스템을 상호 연결된 에코시스템으로 전환하여 AI 기반 에이전트가 서로 검색, 이해 및 협업하는 방법을 공유합니다.

에이전틱 프로토콜은 AI 에이전트 오케스트레이션의 일부이지만 오케스트레이터 역할을 하지는 않습니다. 커뮤니케이션을 표준화하지만 에이전틱 워크플로 조정, 실행 및 최적화를 관리하지는 않습니다.

AI 에이전트 프로토콜의 이점

AI 에이전트 프로토콜은 다음과 같은 이점을 제공합니다.

상호 운용성
에이전트 개발 복잡성 감소
표준화 및 원활한 통합

상호 운용성

에이전트 프로토콜은 사일로를 허물어 에이전틱 AI가 각자의 기본 구현에 관계없이 서로 통신할 수 있도록 합니다. 이를 통해 다양한 디바이스, 환경 및 플랫폼에서 원활한 에이전트 간 협업이 가능해집니다.

에이전트 개발 복잡성 감소

프로토콜은 에이전트 상호작용의 복잡한 문제를 해결하고 소프트웨어 개발 키트(SDK)를 통해 복잡성을 추상화하므로 다중 에이전트 시스템을 구축하는 과정을 간소화하는 데 도움이 됩니다. AI 개발자는 새로운 에이전트 기능을 만들고 기존 기능을 개선하는 데 더 집중할 수 있습니다.

표준화 및 원활한 통합

AI 에이전트 프로토콜은 집합적이고 구조화된 커뮤니케이션 수단을 제공합니다. 또한 이러한 표준화된 프로토콜의 대부분은 기존 기술을 기반으로 구축되었기 때문에 현재 기술 스택과의 호환성을 보장하여 보다 원활한 기업 통합을 가능하게 합니다.

업계 뉴스레터

전문가가 전하는 최신 AI 트렌드

가장 중요하고 흥미로운 AI 뉴스에 대한 선별된 인사이트를 확인하세요. 주간 Think 뉴스레터를 구독하세요. IBM 개인정보 보호정책을 참조하세요.

AI 에이전트 프로토콜의 예

많은 프로토콜이 아직 초기 단계에 있기 때문에 아직 널리 사용되거나 대규모로 적용되지는 않았습니다. 이러한 성숙도가 부족하다는 것은 조직이 얼리어댑터로서 행동하여 주요 변경 사항과 진화하는 사양에 적응할 준비가 되어 있어야 한다는 것을 의미합니다.

에이전트 기술이 발전함에 따라 새로운 프로토콜이 등장할 수 있습니다. 현재 사용 중인 AI 에이전트 프로토콜은 다음과 같습니다.

Agent2Agent(A2A) 프로토콜
에이전트 통신 프로토콜(ACP)
에이전트 네트워크 프로토콜(ANP)
에이전트-사용자 상호작용(AG-UI) 프로토콜
Agora
LMOS 프로토콜
모델 컨텍스트 프로토콜(MCP)

사용자, 애플리케이션/시스템 UI 및 멀티 에이전트 시스템 간의 상호 작용을 보여주는 순서도.

Agent2Agent(A2A) 프로토콜

A2A 프로토콜은 Google에서 처음 출시하여 현재 Linux Foundation에서 관리하는 AI 에이전트 통신을 위한 개방형 표준입니다. 이는 3단계 워크플로를 갖춘 클라이언트-서버 모델 설정을 따릅니다.

발견은 엔터티(인간 사용자 또는 다른 AI 에이전트)가 클라이언트 에이전트에 작업 요청을 시작하고, 클라이언트 에이전트가 원격 에이전트를 검색하여 가장 적합한 에이전트를 결정할 때 발생합니다.
클라이언트 에이전트가 작업을 수행할 수 있는 원격 에이전트를 식별하면 인증을 거칩니다. 원격 에이전트는 권한 부여 및 액세스 제어 권한 부여를 담당합니다.
통신은 클라이언트 에이전트가 작업을 보내고 원격 에이전트가 작업을 처리하는 방식으로 진행됩니다. 에이전트 간 통신은 보안 전송을 위해 HTTPS를 통해 이루어지며, JSON-RPC(원격 프로시저 호출) 2.0을 데이터 교환 형식으로 사용합니다.

에이전트 통신 프로토콜(ACP)

A2A와 마찬가지로 에이전트 통신 프로토콜(ACP)은 에이전트 간 통신을 위한 또 다른 개방형 표준으로, 처음에는 IBM의 BeeAI에 의해 도입되었으며 현재는 Linux Foundation의 일부입니다.

주요 구성 요소에는 ACP 클라이언트와 ACP 서버가 포함됩니다. ACP 클라이언트는 HTTP를 통해 RESTful API를 통해 ACP 서버에 요청을 보냅니다. ACP 서버는 단일 HTTP 엔드포인트 뒤에서 하나 이상의 에이전트를 호스팅하고 작업을 적절한 에이전트로 라우팅합니다.

ACP의 다른 주요 기능은 다음과 같습니다.

이 프로토콜은 Postman 또는 브라우저와 같은 표준 HTTP 도구와 함께 사용할 수 있지만 SDK도 사용할 수 있습니다.
검색은 ACP 서버를 직접 쿼리하고 잘 알려진 URL에서 공용 매니페스트 파일을 쿼리하여 온라인으로 수행할 수 있습니다. 오프라인 검색은 중앙 집중식 레지스트리를 통해 또는 에이전트 메타데이터를 배포 패키지에 직접 임베딩하여 발생합니다.
ACP는 오디오, 이미지, 텍스트, 비디오 또는 사용자 지정 바이너리 형식과 같은 다양한 메시지 유형을 허용합니다.

에이전트 네트워크 프로토콜(ANP)

에이전트 네트워크 프로토콜(ANP)은 '에이전트 웹 시대의 HTTP'가 되는 것을 목표로 하는 오픈 소스 프로토콜입니다. 따라서 데이터 전송에는 HTTP를 사용하고 데이터 형식 지정에는 JSON-LD(연결된 데이터의 경우 JSON)를 사용합니다.

ANP는 다음과 같은 세 가지 계층으로 구성된 P2P 아키텍처를 채택합니다.

ID 계층은 안전한 통신을 위한 엔드투엔드 암호화와 W3C DID(분산식 식별자) 표준을 기반으로 하는 분산형 ID 인증을 모두 구현합니다.
메타 프로토콜 계층은 에이전트가 통신 방법을 협상하고 합의할 수 있도록 해줍니다.
애플리케이션 프로토콜 계층은 자율 에이전트가 자신의 능력을 설명할 수 있도록 하고 에이전트 검색을 지원합니다.

에이전트-사용자 상호 작용(AG-UI) 프로토콜

에이전트-사용자 상호 작용(AG-UI) 프로토콜은 백엔드 AI 에이전트가 프런트엔드 또는 사용자 대면 애플리케이션에 연결하는 방법을 표준화하기 위한 것입니다. AI 어시스턴트 및 챗봇과의 채팅, 실시간 스트리밍 상태 업데이트 및 기타 휴먼 인 더 루프 접근 방식을 수반하는 에이전틱 자동화와 같은 실시간 인간과 에이전트 간의 상호 작용을 위해 설계되었습니다.

AG-UI의 이벤트 기반 아키텍처를 통해 AI 에이전트는 특정 시스템 트리거 또는 사용자의 입력을 기반으로 이벤트를 생성할 수 있습니다. 이 프로토콜은 메시지 전송 및 수신, 도구 호출, 작업 완료를 포함한 여러 카테고리를 정의합니다.

미들웨어 계층은 서버 전송 이벤트(SSE), 웹훅, 웹소켓 등 여러 전송 방법을 지원합니다. AG-UI를 사용하면 에이전트와 UI 간에 요청을 안전하게 라우팅할 수 있는 보안 프록시도 사용할 수 있습니다.

Agora

Agora는 대규모 언어 모델(LLM)을 기반으로 하는 에이전트를 위한 통신 프로토콜입니다. 이는 자연어 이해, 명령 준수, 코드 작성 및 실행, 자율 협상과 같은 몇 가지 핵심 LLM 에이전트 기능에 의존합니다.

LLM 에이전트는 프로토콜 문서 내에서 일반 텍스트로 설명하는 자체 프로토콜을 구현하고 지원할 수 있습니다. 문서의 첫 번째 부분에는 프로토콜 이름, 설명, 단일 대화 또는 여러 대화용인지 여부를 식별하는 메타데이터가 포함되어 있습니다. 두 번째 부분에서는 자연어와 코드를 혼합한 지침을 통해 커뮤니케이션이 이루어지는 방식을 간략하게 설명합니다. 그런 다음 에이전트는 어떤 프로토콜을 채택할지 자율적으로 협상해야 합니다.

Agora는 데이터 전송에 HTTPS를 사용하고 형식화에 JSON을 사용합니다. 또한 프로토콜 문서에 해시 기반 식별 시스템을 사용합니다.

LMOS 프로토콜

Eclipse Foundation에서 개발한 언어 모델 운영 체제(LMOS) 프로토콜은 인터넷 규모의 멀티 에이전트 에코시스템인 에이전트 인터넷(IoA)을 여는 것을 목표로 합니다. ANP와 마찬가지로 구조화된 아키텍처는 다음과 같은 세 가지 계층으로 구성됩니다.

ID 및 보안 계층은 암호화된 통신을 제공하고 W3C DID 및 OAuth 2.0과 같은 다양한 인증 체계를 지원합니다.
전송 프로토콜 계층을 통해 에이전트는 각 상호작용의 목적에 맞는 전송 프로토콜을 선택하고 조정할 수 있습니다.
애플리케이션 프로토콜 계층은 에이전트 및 도구 설명, 검색 방법, 의미 데이터 모델 및 웹소켓 하위 프로토콜에 대한 형식을 설명합니다.

LMOS 프로토콜은 JSON-LD를 사용하여 도구 및 에이전트 능력과 기타 메타데이터를 설명합니다. 검색은 중앙 디렉토리를 쿼리하거나 분산된 네트워크를 통해 동적으로 발생합니다.

모델 컨텍스트 프로토콜(MCP)

Anthropic에서 도입한 모델 컨텍스트 프로토콜(MCP)은 AI 모델이 작업을 수행하는 데 필요한 컨텍스트를 얻을 수 있는 표준화된 방법을 제공합니다. 에이전트 영역에서 MCP는 AI 에이전트가 API, 데이터베이스, 파일, 웹 검색 및 기타 데이터 소스 등의 외부 서비스 및 도구와 연결하고 통신할 수 있는 계층 역할을 합니다.

MCP는 다음과 같은 세 가지 주요 아키텍처 요소를 포함합니다.

MCP 호스트에는 오케스트레이션 논리가 포함되어 있으며 각 MCP 클라이언트를 MCP 서버에 연결할 수 있습니다. 여러 클라이언트를 호스팅할 수 있습니다.
MCP 클라이언트는 사용자 요청을 프로토콜이 처리할 수 있는 구조화된 형식으로 변환합니다. 각 클라이언트는 MCP 서버와 일대일 관계를 갖습니다. 클라이언트는 세션을 관리하고, 응답을 구문 분석 및 확인하며, 오류를 처리합니다.
MCP 서버는 사용자 요청을 서버 작업으로 변환합니다. 서버는 일반적으로 다양한 프로그래밍 언어로 제공되는 GitHub 리포지토리이며 도구에 대한 액세스를 제공합니다. IBM 및 OpenAI와 같은 AI 플랫폼 공급자를 통해 LLM 추론을 MCP SDK에 연결하는 데에도 사용할 수 있습니다.

클라이언트와 서버 간의 전송 계층에서 메시지는 경량 동기 메시징의 경우 표준 입력/아웃풋(stdio) 또는 비동기 이벤트 기반 호출의 경우 SSE를 사용하여 JSON-RPC 2.0 형식으로 전송됩니다.

AI 에이전트

AI 에이전트의 5가지 유형: 자율 기능 및 실제 애플리케이션

목표 중심 및 유틸리티 기반 AI가 워크플로와 복잡한 환경에 어떻게 적응하는지 알아보세요.

AI 에이전트 구축, 배포 및 모니터링

AI 에이전트 프로토콜을 선택할 때 고려해야 할 요소

표준화된 평가를 위한 벤치마크가 부족하기 때문에 기업은 비즈니스 요구 사항에 가장 적합한 프로토콜에 대한 자체 평가를 수행해야 합니다. 철저하고 엄격한 테스트와 결합된 작고 통제된 사용 사례로 시작해야 할 수도 있습니다.

다음은 에이전트 프로토콜을 평가할 때 염두에 두어야 할 몇 가지 사항입니다.

효율성
신뢰성
확장성
보안

효율성

이상적으로 프로토콜은 지연 시간을 제한하도록 설계되어 신속한 데이터 전송과 빠른 응답 시간을 가져옵니다. 약간의 통신 오버헤드가 예상되지만 이를 최소화해야 합니다.

신뢰성

AI 에이전트 프로토콜은 에이전트 워크플로 전반에 걸쳐 변화하는 네트워크 조건을 처리할 수 있어야 하며, 장애 또는 중단을 관리하는 메커니즘이 마련되어 있어야 합니다. 예를 들어, ACP는 기본적으로 비동기 통신으로 설계되어 복잡하거나 오래 실행되는 작업에 적합합니다. 한편, A2A는 대규모 또는 긴 아웃풋 또는 지속적인 상태 업데이트를 위해 SSE를 사용하는 실시간 스트리밍을 지원합니다.

확장성

프로토콜은 성능 저하 없이 성장하는 에이전트 에코시스템을 수용할 수 있을 만큼 충분히 견고해야 합니다. 확장성 평가에는 일정 기간 동안 점진적으로 또는 갑자기 외부 도구에 대한 에이전트 또는 링크 수를 늘려 해당 조건에서 프로토콜이 어떻게 작동하는지 관찰하는 것이 포함될 수 있습니다.