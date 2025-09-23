IBM은 IDC MarketScape: 2025년 전 세계 생성형 AI 모델 평가 기술 제품 공급업체 평가에서 리더로 선정되었습니다.
이번 수상이 IBM® watsonx.governance의 증가하는 영향력과 지속적인 혁신을 반영한다고 생각합니다. IBM는 신뢰할 수 있고 확장 가능하며 책임감 있는 AI에 대한 현대의 요구를 충족하기 위해 노력하고 있습니다.
"다양한 기술 환경을 갖춘 기업은 IBM이 특정 클라우드 서비스에 종속되지 않는 중립적인 공급업체라는 사실을 알게 될 것입니다. 또한 자동화된 문서화, 가드레일, 보안 제품 등 더 광범위한 인접 IBM 제품을 중요하게 생각하는 기업이라면 IBM을 고려해야 합니다"라고 IDC MarketScape 보고서는 말합니다.
IDC MarketScape 공급업체 분석 모델은 특정 시장에서 기술 및 공급업체의 경쟁 적합성에 대한 개요를 제공하도록 설계되었습니다. 연구 방법론은 정성적 및 정량적 기준을 기반으로 한 엄격한 채점 방법론을 활용하여 특정 시장 내에서 각 공급업체의 위치를 단일 그래픽으로 보여줍니다. 기능 점수는 단기적으로 공급업체 제품, 시장 진출, 단기 비즈니스 실행을 측정합니다. 전략 점수는 3~5년 동안 공급업체 전략과 고객 요구 사항의 일치도를 측정합니다. 공급업체 시장 점유율은 아이콘의 크기로 표시됩니다.
IDC MarketScape의 엄격한 평가 프레임워크는 조직이 생성형 AI 모델 평가 기술 결정을 내릴 때 신뢰할 수 있는 객관적인 제3자 평가를 제공합니다.
프레임워크는 다음 5가지 카테고리를 고려합니다.
IBM의 강점은 다음과 같습니다.
IBM watsonx.governance는 개발부터 배포에 이르기까지 전체 AI 라이프사이클을 관리하는 통합 접근 방식을 제공합니다. 안내형 설문지를 통해 사용자는 비즈니스 문제를 정의하고, 잠재적 위험을 발견 및 식별하며, 완화 전략을 발견할 수 있습니다.
이러한 위험 차원은 평가 과정 중에 사용할 수 있는 지표에 매핑됩니다. 또한 이 통합 프로세스는 평가 과정에서 메타데이터를 자동으로 추출하여 중앙 집중식 팩트 시트에 저장하고 모델에 대한 정보, 프롬프트 템플릿 등을 포함하여 애플리케이션 개발 프로세스에 대한 투명한 기록을 제공합니다. 문서화를 포함한 긴밀하게 통합된 라이프사이클에 평가 기술을 통합함으로써 기업 사용자에게 이상적인 솔루션으로 차별화됩니다.
팀은 위험 데이터, 위험 및 제어 평가, 내부 및 외부 손실 이벤트, 주요 위험 지표 또는 메트릭을 통합함으로써 기업 전체의 위험 태세에 대한 종합적인 관점을 얻을 수 있습니다. 이를 통해 기업은 위험이 발생할 때 이를 실시간으로 자동으로 식별할 수 있습니다. 또한 IBM watsonx.governance는 자동 위험 등급을 제공하여 위험 팀에게 위험 수준에 대한 명확하고 객관적인 평가를 제공합니다. 동적 대시보드와 차트를 통해 신속한 식별, 측정, 모니터링 및 분석이 가능하며, 자동화된 알림을 통해 위험 임계값을 위반할 때 즉각적으로 문제를 해결할 수 있습니다.
IBM watsonx.governance를 통해 사용자는 AI 시스템 성능 및 효과성을 평가하기 위해 사전 구축된 지표를 이용할 수 있습니다. 여기에는 드리프트 식별, 모델 성능 및 기타 주요 영역에 대한 성능 지표가 포함됩니다.
이러한 지표는 무엇보다도 AI 시스템의 성능 및 효율성을 평가하기 위한 포괄적인 프레임워크를 제공합니다. 또한 사용자는 사용자 지정 지표를 생성하여 특정 비즈니스 요구 사항 및 위험 프로필에 맞게 평가를 조정하여 포괄적인 평가 프레임워크를 제공할 수 있습니다.
IBM 팀의 또 다른 혁신은 '평가 스튜디오(Evaluation Studio)'입니다. 이 기능은 다음과 같은 두 가지 주요 능력을 제공합니다.
평가 스튜디오는 개발자가 데이터 세트에서 다양한 버전의 프롬프트를 평가하고 직관적인 사용자 인터페이스에서 결과를 비교할 수 있도록 도와줍니다. 또한 사용자가 지표를 선택하고 중요도에 따라 가중치를 할당하여 사용자 지정 순위 체계를 제시할 수 있는 고유한 사용자 지정 순위를 지원합니다. 이를 통해 사용자는 도구 또는 에이전트에서 사용할 프롬프트를 쉽게 최적화할 수 있습니다.
Watsonx.governance 평가 스튜디오는 더 뛰어난 에이전틱 AI 시스템을 구축하기 위한 강력한 도구인 실험 추적도 지원합니다. 실험을 빠르게 설정하고, (에이전트의) 다양한 변형을 시도하고, 사용한 모델, 검색기 또는 프롬프트와 같은 세부 정보로 태그를 지정할 수 있습니다. 지연 시간, 비용 및 품질(예: 충실도)을 기반으로 나란히 비교하면 어떤 변형이 가장 효과적인지 쉽게 확인할 수 있습니다. 중요한 것은 이 플랫폼을 통해 각 실행에 대한 정확한 코드를 저장할 수 있으므로 개발자가 각 버전을 저장하는 데 시간을 할애하고 에이전트 구축 및 개선에 집중할 수 있다는 것입니다.
IBM watsonx.governance 솔루션은 즉시 사용 가능한 데코레이터 기반의 인더루프 평가기를 지원하여 에이전트 거버넌스에 대한 새로운 표준을 설정하며, 고객에게 지표를 평가하고 이를 사용하여 에이전트 실행 흐름을 결정할 수 있는 기능을 제공합니다. IBM watsonx.governance는 또한 AI 에이전트를 구축된 테스트 데이터에서 평가하는 데 도움이 되는 에이전트 평가기를 통한 오프라인 에이전트 평가를 지원합니다. 주요 기능은 다음과 같습니다.
이 혁신적인 도구는 에이전트 성능에 대한 탁월한 가시성과 제어 기능을 제공하여 고객이 워크플로를 최적화하고 더 나은 결과를 도출할 수 있도록 지원합니다.
AI/ML Ops 팀의 역량을 더욱 강화하기 위해 IBM은 새로운 기능의 파이프라인으로 혁신을 주도하기 위해 최선을 다하고 있습니다. 향후 릴리스에서는 다음과 같은 추가 에이전트 거버넌스 기능을 경험할 수 있습니다.
거버넌스는 더 이상 규정 준수 및 감사로 정의되는 장벽이 아닙니다. 이제 확장의 원동력이 되어, 팀이 강력하고 투명하며 엔터프라이즈 배포에 대비한 생성형 AI 시스템을 구축할 수 있도록 지원합니다. 거버넌스는 처음부터 효율적이고 안전하며 신뢰할 수 있는 AI 에이전트, 애플리케이션 및 모델을 구축하기 위한 것입니다.
생성형 AI가 계속 발전함에 따라 팀은 watsonx.governance를 통해 확신을 갖고 투명성과 제어력을 바탕으로 빠르게 움직일 수 있습니다. 평가에 대한 IBM의 접근 방식은 실시간 위험 관리, 자동화된 실험 관리, 모든 단계에서의 추적 및 투명성에 중점을 둡니다. 실제 복잡성을 염두에 두고 구축된 watsonx.governance는 팀이 책임감 있게 확장하고, 위험을 줄이며, 속도 저하 없이 생성형 AI의 잠재력을 최대한 활용할 수 있도록 지원합니다.
