watsonx.governance의 에이전트 모니터링 및 인사이트와 보안 지표

도시 창문을 배경으로 책상에 앉아 노트북을 보고 있는 두 사람

작성자

Neil Leblanc

watsonx.governance Go-To-Market Lead

IBM

위험 및 규정 준수 리더, 보안팀 및 AI 소유자는 종종 "AI 에이전트가 프로덕션에서 무엇을 하고 있는지 정확히 확인할 수 있나요?", "AI 거버넌스 및 AI 보안 태세를 통합적으로 파악할 수 있나요?"라는 두 가지 질문을 합니다.

watsonx.governance를 사용하면 이제 두 질문 모두에 대해 '예'라는 답을 얻을 수 있습니다.

  1. 에이전트 모니터링 및 인사이트: 기업이 프로덕션 환경에서 에이전틱 AI의 행동, 조치 및 의사 결정에 대한 가시성을 확보할 수 있도록 지원합니다.
  2. 거버넌스 콘솔의 보안 지표: Guardium AI 보안 인사이트를 워크플로에 직접 제공합니다.

이러한 기능을 함께 사용하면 스프레드시트 추적이나 탭 호핑 없이 정책, 보호 및 성능과 같은 AI 신뢰를 위한 포괄적인 솔루션을 제공할 것입니다.

에이전트 모니터링: 에이전트의 투명성을 확보하고 자신 있게 배포

기업들은 생산성의 새로운 지평을 열기 위해 AI 에이전트로 눈을 돌리고 있습니다. 단순히 아웃풋을 생성하는 기존 모델과 달리 에이전트는 작업 연쇄 및 여러 시스템 활용 등의 조치를 취할 수 있습니다. 이를 통해 반복적인 워크플로를 자동화하고 의사 결정과 가속화하며 팀이 더 가치 있는 업무에 집중할 수 있도록 합니다.

그러나 이러한 약속에는 새로운 위험이 따릅니다. 에이전트는 더 많은 자율성을 가지고 운영하므로 의사 결정이 어떻게 내려지는지 확인하고 의도한 대로 작동하는지 확인하기가 더 어려워집니다. 오늘날의 모니터링은 느리고 수동적이며 파편화되어 있기 때문에 개발자는 시스템을 신뢰, 추적 또는 미세 조정하는 데 필요한 도구가 없습니다. 그리고 확장 가능한 거버넌스 인프라가 없으면 기업은 에이전트형 AI를 평가하고 제어하며 자신 있게 확장하는 데 어려움을 겪습니다.

이러한 문제를 해결하기 위해 watsonx.governance는 향후 릴리스에서 에이전트 모니터링 및 인사이트를 watsonx.governance에 도입할 예정입니다. 이 새로운 기능은 프로덕션에서 애플리케이션을 모니터링합니다. 에이전트 인사이트는 의사 결정, 행동 및 성능을 실시간으로 추적하여 지표가 임계값을 초과할 때 알림을 발행합니다. 이를 통해 사전 예방적으로 관리하고, 문제를 신속하게 해결하며, 상담원 중심 결과에 대한 신뢰도를 높일 수 있습니다.

주요 에이전트 거버넌스 개선 사항

  • 인더루프(In The Loop) 평가: AI 에이전트의 성능(품질 및 동작)을 정확하게 평가하기 위해 업데이트된 지표입니다. 이 지표를 통해 대화, 상호 작용 및 도구 수준에서 집계된 모든 성능 지표를 한 곳에서 확인하고 에이전트 성능을 전체적으로 파악하여 효율성을 높여 시간을 절약할 수 있습니다. 
  • 품질과 정확성 향상: 2026년 1분기에는 근본 원인 분석을 통해 실행 가능한 인사이트를 도입할 예정입니다. 이를 통해 팀은 무엇이 효과가 있는지 측정하고, 시간 경과에 따른 성능을 비교하고, AI와 에이전트를 지속적으로 최적화하고 미세 조정할 수 있습니다.
  • 실시간 실험 추적: 모든 변경 사항, 지표 및 아웃풋을 한 곳에서 확인하여 에이전틱 애플리케이션의 여러 실행을 평가하고 비교합니다. 이를 통해 모든 변경 사항, 지표 및 아웃풋이 포함된 에이전트 개발 프로세스에 대한 구조와 가시성을 확보하여 프로덕션 시간을 단축할 수 있을 뿐만 아니라, 프로젝트의 성공 지표에 맞춘 사용자 지정 순위를 통해 프로젝트에 가장 중요한 지표에만 집중하여 노이즈를 제거하는 효율성도 향상되어 더 빠른 의사 결정과 미세 조정된 에이전트 성능을 보장합니다.
  • 보고서: AI 에이전트가 의도한 운영 범위를 벗어날 때 내장된 대시보드와 자동 알림을 제공하여 팀이 에이전트를 더 빠르게 테스트, 도입 및 확장할 수 있도록 지원합니다. Agent Insights 대시보드를 통해 사전 예방적 관리를 추진하고 시간 경과에 따른 성능 추세를 추적하는 사전 예방적 관리가 보장됩니다. 또한 실시간으로 위험을 완화하여 에이전트가 오류나 할루시네이션을 겪을 경우 즉시 알림을 받아 적시에 개입하고 수정할 수 있도록 함으로써 신뢰를 얻을 수 있습니다.

지원 방법

  • 위험 및 규정 준수는 에이전트가 승인된 범위 내에 머물고 결정을 감사할 수 있다는 확신을 제공합니다.
  • AI/ML 운영 및 개발자는 문제를 더 빠르게 해결하고 효율성을 개선하며 신뢰할 수 있는 결과를 보장합니다.
  • 비즈니스 리더는 에이전틱 AI 프로그램을 책임감 있게 확장하여 ROI를 극대화할 수 있다는 자신감을 얻습니다.

실제 사례:

구매/조달을 자동화하는 AI 에이전트가 범위를 벗어난 공급업체 계약을 승인하려고 시도할 수 있습니다. 모니터링이 활성화되면 해당 작업에 실시간으로 플래그가 지정되므로 팀은 다운스트림 문제가 발생하기 전에 에이전트를 조사, 정책 조정 또는 개선할 수 있습니다.

보안 지표: 위험을 확인하고 더 빠르게 결정

AI 거버넌스와 AI 보안은 병렬 작업 흐름으로 취급되는 경우가 너무 많습니다. Guardium AI Security가 watsonx.governance 콘솔에 통합되면서 상황이 바뀌었습니다. 위험 및 규정 준수 리더는 사용 사례를 승인하고 관리하는 곳에서 직접 실시간 보안 태세를 확인할 수 있습니다.

거버넌스와 보안을 결합하는 방법:

  • 사용 사례별 보안 패널: 각 AI 사용 사례는 간결한 보안 카드를 표시합니다. 여기에는 취약점 스캔 및 침투 테스트 결과, 실시간 탐지(예: 프롬프트 인젝션 시도), 7/30일 추세가 포함됩니다.
  • 프로그램 수준 보안 대시보드: 사용 사례 전반에 걸친 집계 보기, 심각도별 미해결 결과, 시간 경과에 따른 공격 활동 및 수정 상태를 표시합니다.
  • 적용 범위 확대 로드맵: 1일차 지표는 취약점, 침투 테스트 및 탐지에 중점을 두고, 잘못된 구성 및 더 많은 신호에 대한 지표가 추가될 예정입니다.

다음과 같은 이점을 제공합니다.

  • 위험 및 규정 준수는 중요한 취약성에 대한 실시간 가시성을 제공하는 실시간 보안 데이터로 검토를 가속화합니다.
  • 심층 검색 및 보호를 위해 Guardium을 사용하는 보안팀은 주요 지표를 AI 거버넌스 이해관계자와 공유할 수 있습니다. AI 소유자는 사용 사례와 관련된 실행 가능한 지표를 확인하여 해결해야 하는 보안 취약점과 위험을 완벽하게 파악할 수 있습니다.

실제 사례:

IT 티켓을 관리하는 AI 에이전트는 거버넌스에 등록되고 위험도에 따라 등급이 지정됩니다. Guardium은 남용 또는 유출 여부를 지속적으로 테스트합니다. 이제 심각도가 높은 결과, 침투 테스트 날짜 및 차단된 시도가 위험 기록 바로 옆에 표시되므로 전체 컨텍스트를 통해 승인이 더 빠르게 이루어집니다.

하나의 로드맵, 하나의 신뢰할 수 있는 소스

두 가지 새로운 기능은 모두 AI 프로그램이 하나의 신뢰할 수 있는 통합 소스에서 실행되어야 한다는 동일한 원칙에 따라 진행됩니다. 에이전트 모니터링은 관리형 에이전트 카탈로그, 미세 조정 제어 및 더 뛰어난 관측 가능성을 통해 AI 에이전트가 신뢰할 수 있고 책임감 있고 조정된 상태를 유지할 수 있도록 발전할 것입니다.

보안 지표는 취약성과 탐지를 넘어 잘못된 구성과 더 심층적인 Guardium 통합으로 계속 확장될 것입니다.

이 두 가지는 함께 보안과 거버넌스를 통합된 흐름으로 가져와 기업이 빠르고 안전하며 자신감 있게 AI를 관리하고 확장할 수 있도록 지원합니다.

관리되고 안전하며 신뢰할 수 있는 관리형 AI 구축 준비

이미 watsonx.governance를 사용하고 있다면 릴리스를 주목하며 가장 중요한 AI 사용 사례에서 이러한 기능을 사용할 수 있게 되면 바로 활성화할 수 있도록 준비하세요.

 IBM 팀은 올바른 길을 찾고 이러한 향후 기능을 통해 관리되고 안전하며 신뢰할 수 있는 AI를 구축할 수 있도록 준비할 수 있도록 도와드릴 수 있습니다.

watsonx.governance로 신뢰할 수 있는 AI 확장