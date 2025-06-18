2025년 6월 18일
Gartner는 2028년까지 생성형 AI 상호 작용의 3분의 1이 행동 모델과 자율 에이전트를 사용할 것으로 예측하는 등 에이전틱 AI는 혁신의 원동력입니다.
그러나 비지도형 AI 에이전트는 상당한 자율성과 권한을 가지고 운영될 수 있으며, 이로 인해 조직은 비즈니스와 고객 모두에게 해롭고 돌이킬 수 없는 영향을 미칠 수 있는 예측할 수 없는 수많은 위험에 노출될 수 있습니다. 데이터의 영향을 받는 복잡한 의사 결정 프로세스는 편견을 야기하고 추적성을 복잡하게 하며 보안 문제를 야기할 수 있습니다. 할루시네이션과 잘못된 선택은 이러한 문제를 더욱 복잡하게 만듭니다.
이러한 문제를 해결하기 위해 3월에 IBM은 에이전틱 AI 거버넌스 기능에 대한 기술 미리 보기를 발표했습니다. 이러한 모멘텀을 바탕으로 IBM은 watsonx.governance의 일부로 새로운 기능을 추가로 출시할 예정입니다.
Governed Agentic Catalog는 AI 도구, 에이전트 및 워크플로를 관리하고 선택하기 위한 포괄적인 리소스로, 도구/에이전트 선택을 간소화하고 사용자 및 사용 사례 전반에 걸쳐 재사용을 촉진하도록 설계되었습니다. 이 중앙 집중식 저장소는 에이전틱 시스템을 설계하고 구축하는 데 필수적인 특정 작업을 수행하는 다양한 도구를 통합하여 팀이 일관성과 효율성을 유지하는 데 도움이 됩니다. 이러한 에이전틱 도구에는 데이터 검색 및 외부 연결과 같은 다양한 기능이 포함됩니다.
카탈로그의 주요 기능은 다음과 같습니다.
Governed Agentic Catalog를 활용함으로써 팀은 도구 확산을 관리하고 적절한 도구 활용을 보장하며 부서 간 일관성을 유지할 수 있습니다. 도구 관리에 대한 이러한 포괄적인 접근 방식은 궁극적으로 진행을 가속화하고 에이전틱 시스템 개발을 위한 협업 환경을 조성합니다.
AI 에이전트의 보급이 증가함에 따라 이러한 자율 AI 에이전트의 성능, 신뢰성, 안전성 및 윤리적 행동을 평가하는 문제와 같은 상당한 복잡성이 발생하고 있습니다.
에이전틱 AI 평가 모범 사례는 예측 가능하고 알려지지 않은 다양한 위험에 대한 노출을 줄일 수 있습니다. 그러나 에이전트는 아웃풋뿐만 아니라 행동, 의사 결정 및 의도를 관찰해야 하기 때문에 효과적인 성과 추적은 조직과 개발자에게 어려울 수 있습니다. watsonx.governance와 함께라면 조직은 다음을 사용하여 성능을 평가할 수 있습니다.
3월부터 watsonx.governance는 추가적인 전문 지표를 지원하기 위해 이러한 새로운 능력을 도입했습니다. 이제 새로운 RAG 에이전틱 AI 평가 지표를 사용할 수 있습니다. 성능을 평가하는 종합적인 지표에는 HAP, PII, 프롬프트 삽입, 문맥 관련성, 충실도, 답변 유사성, 답변 관련성, 적중률, 평균 정확도, 상호 순위, 실패한 요청 등이 포함되어 있어 시스템의 효율성을 철저히 평가할 수 있습니다. 이를 통해 에이전트가 적절하게 행동하는지 확인하고, 원하는 결과를 향해 에이전트의 행동을 조절하는 데 필요한 가드레일을 추가하여 경고 신호를 감지할 수 있습니다.
이러한 지표는 LangGraph 애플리케이션의 도구 노드에 간단한 python 데코레이터를 추가하여 사용할 수 있습니다. 이 데코레이터를 추가하면 지표가 에이전틱 애플리케이션에서 노드를 실행할 때 부산물로 계산됩니다. 계산된 지표는 애플리케이션 내에서 흐름 결정을 내리는 데 사용할 수 있습니다. 예를 들어, 벡터 데이터베이스에서 가져온 컨텍스트가 사용자 쿼리와 관련이 없는 경우 답변을 생성하지 말고 웹 검색을 시도하여 올바른 컨텍스트를 가져옵니다. 이러한 평가기는 사용하기 쉬울 뿐만 아니라 효율적이며 오픈 소스 지표와 IBM 고급 지표를 모두 포함합니다. 따라서 평가를 위한 넓은 범위의 능력을 제공하며 다양한 사용 사례 및 작업 유형에 적합합니다.
실험 추적은 개발 프로세스 중에 이루어진 모든 변경 사항, 반복 및 개선에 대한 포괄적인 기록을 제공하기 때문에 AI 에이전트를 관리하는 데 매우 중요합니다. 여기에는 알고리즘, 데이터 입력, 하이퍼파라미터 및 기타 중요한 측면에 대한 수정이 포함됩니다.
에이전틱 앱 개발은 반복적인 프로세스입니다. 개발자가 에이전틱 AI 앱을 구축하고, 테스트하고, 필요할 때 미세 조정하고, 아웃풋을 개선하기 위해 새 버전을 구축하면 프로세스가 추가 최적화를 위해 계속됩니다. Watsonx.governance는 Evaluation Studio를 사용하여 다양한 실험 및 비교 추적을 자동으로 지원합니다.
Watsonx.governance는 에이전틱 AI 애플리케이션을 빠르게 비교할 수 있도록 하여 반복 및 개발 프로세스를 가속화합니다. 이 기능은 watsonx 플랫폼에 구축된 AI 앱에만 국한되지 않고 타사 플랫폼으로 지원을 확장하여 다양한 기능을 제공합니다.
지표를 모니터링하면 에이전트의 성능을 추적하고, 성능 저하, 데이터 드리프트 및 프로덕션의 모델 편향과 같은 문제를 감지하고 개선을 안내하는 데 도움이 될 수 있습니다. 적절한 평가가 없으면 정확도 향상을 위해 AI 에이전트를 신뢰, 제어 또는 미세 조정하기가 어려워져 의도하지 않은 결과가 발생할 위험이 증가합니다.
에이전틱 AI가 프로덕션에 배포되는 시나리오에서는 에이전틱 할루시네이션, 응답 시간, 모델 드리프트 및 편향과 같은 문제를 해결하기 위해 지속적인 감시가 필수적입니다. 지속적인 프로덕션 모니터링을 통해 에이전틱 AI 애플리케이션을 배포하는 것은 시스템 안정성과 신뢰를 유지하는 데 매우 중요합니다. 실시간 감시를 통해 MLOps 및 AgentOps 팀은 모델 및 에이전트 행동, 성능 드리프트, 예기치 않은 아웃풋을 추적할 수 있으므로 편차가 발생하면 즉각적인 개입이 가능합니다. 이러한 운영 준비 상태를 통해 자율 시스템은 의도한 목표 및 안전 제약 조건에 부합하는 상태를 유지할 수 있습니다.
향후 릴리스에서 IBM의 watsonx.governance는 에이전틱 애플리케이션을 지속적으로 감독하여 지정된 지표 중 하나라도 사전 정의된 제한을 초과할 때 경고를 시작하는 기능을 제공할 예정입니다. 이 기능은 최적의 AI 성능을 유지하기 위한 사전 관리와 적절한 개입을 보장합니다.
빠르게 발전하는 다른 기술과 마찬가지로 AI 에이전트는 가능한 위험, 장애물 및 사회적 결과를 초래합니다. AI 에이전트로 인해 발생하는 몇 가지 새로운 위험으로는 데이터 편향, 중복 작업, 함수 호출 할루시네이션, 기밀 정보 공유, AI 에이전트의 외부 리소스에 대한 공격 등이 있습니다. 이 외에도 에이전틱 AI는 기존의 위험, 과제 및 사회적 영향을 강화합니다.
IBM® Risk Atlas는 데이터와 AI에 내재된 위험 목록을 제공하며, 에이전트의 위험과 위협을 반영하도록 업데이트되고 있습니다.
AI 거버넌스는 사용 사례 생성, 개발 및 검증에서 프로덕션 모니터링에 이르기까지 AI 수명 주기 전반에 걸쳐 필요합니다. 모든 단계에는 위험과 함정이 있으며, 적절하게 관리하지 않으면 현재 또는 미래의 문제를 일으킬 수 있습니다. 예를 들어, 새로운 사용 사례를 만드는 동안 watsonx.governance는 위험 평가를 제공하여 사용 사례에 어떤 위험이 발생하기 쉬운지 파악하여 필요한 위험 관리 기술을 통합할 수 있습니다. 마찬가지로, 에이전틱 애플리케이션을 개발하는 동안 향후 반복 작업에서 개선하기 위해 애플리케이션의 각 도구 또는 노드의 성능을 측정하고 평가해야 합니다.
watsonx.governance는 애플리케이션에 데코레이터로 추가하고 성능을 측정할 수 있는 50개 이상의 지표가 포함된 라이브러리를 제공합니다. 거버넌스가 없으면 AI를 확장하거나 신뢰를 구축할 수 없습니다.
효과적인 거버넌스와 보안은 필수적이지만, 기업이 성장하고 AI를 대규모로 채택함에 따라 안전한 실험을 보장하고 광범위한 AI 채택의 복잡성을 효율적으로 관리하려면 강력한 AI 거버넌스 구조를 구현하는 것이 필수적입니다.
watsonx.governance를 통해 기업이 AI의 진정한 잠재력을 실현하고 AI 거버넌스 경험을 혁신할 수 있도록 지원하는 새로운 기능 릴리스와 기타 여러 개선 사항을 살펴보세요.
