기존의 결제 처리 마이크로서비스는 유효성 검사, 처리, 오류 상태 및 통합을 처리하기 위해 수천 줄의 코드가 필요합니다. 반면, 성능이 높은 AI 에이전트는 중요 경로에 대해 사전 컴파일된 구성 요소와 복잡한 의사 결정을 위한 추론 기능을 결합합니다. 이러한 하이브리드 접근 방식은 성능 안정성과 적응형 인텔리전스를 모두 보장하는 데 도움이 됩니다.
예를 들어 사전(AOT) 컴파일을 통해 C#으로 Semantic Kernel 에이전트를 구현하면 프로덕션 에이전트 시스템이 성능 면에서 기존 마이크로서비스와 비슷하거나 그 이상의 성능을 제공하면서 귀중한 능력을 추가할 수 있음을 알 수 있습니다.
마이크로서비스에 기본 오케스트레이션 플랫폼이 필요한 것처럼, AI 에이전트에도 전문화된 에이전틱 프레임워크가 필요합니다. Semantic Kernel 및 LangChain Enterprise와 같은 최신 솔루션은 에이전트 조정에 필요한 이러한 인프라를 엔터프라이즈급 성능으로 제공합니다.
이러한 프레임워크는 엔터프라이즈급 성능 표준을 유지하면서 기존 서비스 오케스트레이션을 뛰어넘는 기능을 제공합니다.
에이전틱 아키텍처로의 전환은 다음과 같은 측정 가능한 이점을 제공합니다.
조직에는 AI 이점을 활용하면서 엔터프라이즈 표준을 유지하는 실용적인 구현 전략이 필요합니다.
성능 우선 접근 방식을 구현하면 조직이 전략적인 AI 기능을 구축하는 동시에 운영상의 이점을 달성하는 데 도움이 될 수 있습니다.
Evals는 다양한 차원에서 상담원 행동을 평가하도록 설계된 전문 테스트 모음입니다.
일부 클라우드, 데이터 및 AI 제공업체의 내부 데이터에 따르면 에이전트 시스템에 대한 다차원 평가를 구현한 후 운영 인시던트가 크게 감소한 것으로 나타났습니다.
성숙한 평가 중심 개발 프로세스에는 다음과 같은 핵심 요소가 포함됩니다.
모든 차원에 걸쳐 기대치를 정의하는 것부터 시작하세요. 각 에이전트에 대해 다음을 수행하세요.
개발 수명 주기 전반에 걸쳐 평가를 실행하는 자동화된 파이프라인을 구축하세요.
동적으로 생성된 시나리오로 정적 테스트 케이스를 뛰어넘으세요.
2024년 스탠포드 인간 중심 AI 연구소(HAI)의 연구에 따르면 포괄적인 평가 프레임워크를 활용하는 기업은 개발 주기가 65% 빨라지고 생산 롤백이 42% 줄어든 것으로 나타났습니다.
상위 10위권의 한 글로벌 은행은 고객 서비스 에이전트를 위한 평가 중심 개발을 구현하여 인상적인 결과를 얻었습니다.
이 은행의 접근 방식은 기능 검증을 위한 자동화된 테스트 세트, 복잡한 의사 결정 시나리오를 위한 추론 평가, 중요한 상호 작용을 위한 인적 전문가 검토라는 3단계 평가 프레임워크에 중점을 두었습니다.
이 프레임워크는 기존 테스트에서는 놓칠 수 있는 미묘한 문제를 발견했습니다. 예를 들어, 한 에이전트는 정책에 따라 대출 신청을 올바르게 승인했지만, 배포 전 추론 평가에서 확인된 문제인 경계선 사례에서 의도치 않게 편견을 강화하는 추론을 사용했습니다.
비용과 관련하여 조직은 두 가지 주요 고려 사항에 직면합니다.
토큰 비용: 파운데이션 모델과의 상호 작용마다 토큰당 비용이 발생하며, 이는 규모가 커지면 빠르게 누적됩니다. 다단계 추론을 사용하는 복잡한 에이전트 네트워크는 유사한 직접 API 호출보다 10~15배 더 많은 토큰을 생성할 수 있습니다.
계산 비용: 추론, 특히 정교한 추론을 실행하려면 상당한 컴퓨팅 리소스가 필요합니다. 추론을 위한 온프레미스 GPU 클러스터에는 일반적으로 막대한 초기 투자가 필요합니다. 클라우드 기반 추론은 소규모 및 중간 규모 배포의 경우 월 10,000달러에서 50,000달러 사이의 비용이 발생할 수 있습니다.
주요 조직은 이러한 비용을 관리하기 위해 체계적인 접근 방식을 개발했습니다.
JPMorgan Chase는 결정론적 경로를 통해 트랜잭션의 89%를 처리하는 하이브리드 아키텍처를 통해 추론 비용을 67% 절감하고 복잡한 시나리오에만 LLM 리소스를 사용하고 있습니다.
McKinsey의 2024년 AI 경제학 보고서는 이러한 전략 중 세 가지 이상을 구현하면 시스템 능력을 유지하거나 개선하면서 AI 운영 비용을 평균 62% 절감할 수 있다고 밝혔습니다.
마이크로서비스와 에이전틱 아키텍처의 차이점을 설명하기 위해 금융 서비스 거래 플랫폼을 예로 들어보겠습니다.
고객이 거래를 하면 시스템은 명시적으로 트리거된 각 단계에 따라 미리 정해진 경로를 따릅니다.
실제로 에이전트 구현은 근본적으로 다른 고객 경험을 창출합니다. 시장 변동성이 커지면 위험 평가 에이전트가 자율적으로 거래 한도를 조정하고 포트폴리오 에이전트에게 알려 고객 보유 자산의 잠재적 취약성을 분석할 수 있습니다. 이 시스템은 명시적으로 코딩된 것 이상의 지능을 보여줍니다.
모놀리스에서 서비스, 마이크로서비스, 에이전트로의 발전은 명확한 역사적 패턴을 따릅니다. 각 진화에는 지능과 자율성이 향상되면서 더욱 세분화된 구성 요소가 도입되었습니다.
대규모 에이전틱 아키텍처를 구현하는 조직은 애플리케이션 포트폴리오 전반에서 일관된 품질, 비용 효율성 및 거버넌스를 달성하기 위해 플랫폼 엔지니어링 원칙을 채택해야 합니다.
미래 지향적인 조직은 내부 개발자 플랫폼(IDP)을 사용하여 에이전트 도입을 가속화합니다.
Gartner의 2024년 플랫폼 엔지니어링 보고서는 성숙한 플랫폼 접근 방식이 새로운 에이전트 기능의 시장 출시 시간을 3.2배 단축하고 개발자 만족도를 76% 높인다고 밝혔습니다.
이제 조직은 적절한 사용 사례를 위해 에이전트 아키텍처를 선도적으로 채택할 것인지, 아니면 조기에 이점을 확보한 경쟁업체를 따라갈 것인지 선택의 기로에 서 있습니다. 조사에 따르면 플랫폼 중심 접근 방식을 도입한 초기 기업이 개발 속도, 시스템 유연성 및 기술 역량에서 상당한 경쟁 우위를 확보하는 것으로 나타났습니다.