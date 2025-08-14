예를 들어 고객 지원 티켓을 처리하기 위해 구축된 AI 에이전트는 다양한 도구를 사용하는 하나 이상의 대규모 언어 모델(LLM)을 통해 다양한 작업을 처리할 가능성이 높습니다. 이러한 에이전트 워크플로에는 수신 이메일 모니터링, 기업 지식 기반 검색, 지원 티켓 자율 생성이 포함될 수 있습니다.
이러한 에이전트를 디버깅하는 것은 복잡합니다. 다양한 동작으로 인해 여러 지점이 발생할 수 있기 때문입니다. 그러나 에이전트 모니터링을 통해 개발자는 에이전트 실행을 단계별로 다시 보면서 AI 시스템이 언제 무엇을 했는지 관찰할 수 있습니다. 에이전트가 적절한 고객 지원 문서를 참조했는지, 도구 사용 패턴은 무엇이며 어떤 API가 사용되었는지, 각 단계의 지연 시간은 얼마나 있었는지, 궁극적인 LLM 비용은 얼마였는지, 에이전트가 다른 에이전트들과 얼마나 소통하거나 협업했는지 확인합니다.
AI 에이전트의 행동을 감사할 계획 없이 AI 에이전트를 풀어주는 것은 청소년에게 신용 카드를 쥐어주고 명세서를 확인하지 않는 것과 같습니다. Agency AI의 COO인 Adam Silverman은 최근 Google for Developers 블로그에서, 다양한 업무에 다양한 LLM을 사용하면 비용을 줄일 수 있다고 말했습니다. 이는 시간이 지나면서 에이전트의 비용 효율성이 최적화되도록 조정할 수 있는 많은 매개변수 중 하나입니다.2
더 깊이 들어가면, 개발자는 다양한 공급자(예: Azure 또는 AWS)의 LLM 상호 작용 각각에 대한 비용을 포함하여 에이전트의 엔드투엔드 동작을 추적할 수 있습니다. 개발자는 대시보드에서 에이전트 수명 주기의 다양한 단계에서 나오는 데이터를 보며, 이 지표들을 실시간으로 참고할 수 있습니다. 반복적인 벤치마킹을 통해 개발자는 에이전트를 최적화하기 위해 노력할 수 있습니다.