대부분의 조직에서는 수많은 데이터 사이언스 툴을 사용하고 있어, 점점 더 엄격해지는 보안, 규정 준수, 거버넌스 규제를 준수하는 것은 물론, 정보를 관리하고 통제하기조차 점점 더 어려워지고 있습니다. 자동화되고 확장 가능한 AI 거버넌스를 활용하면 일관되고 반복 가능한 프로세스를 주도하여 모델의 투명성을 높이고, 추적 가능성과 책임성을 동시에 확보할 수 있습니다. 이를 통해 협업을 강화하고, 모델 예측을 비교하며, 모델 위험을 정량화하고 성능을 최적화할 수 있습니다. 또한 편향을 식별하고 완화하며, 데이터 드리프트와 같은 위험을 줄이며, 모델 재학습의 필요성을 낮출 수 있습니다.

결국 성공적인 AI와 AI 거버넌스의 핵심은 데이터 관리와, 사용자가 적시에 적절한 데이터에 접근할 수 있도록 하는 것입니다. 데이터 패브릭 아키텍처는 데이터 통합의 복잡성을 최소화하고 조직 전반의 데이터 접근을 간소화하여, 셀프서비스 데이터 소비를 용이하게 함으로써 이러한 목표를 달성하는 데 기여합니다.

IBM Cloud Pak for Data를 활용하면 다양한 팀이 모델의 여러 단계에서 상호 작용할 수 있는 정식 워크플로를 구축할 수 있습니다. 이는 단지 데이터 사이언스 팀에 적절한 접근 권한을 부여하는 것에 그치지 않습니다. 모델 위험 관리 팀, IT 운영 팀 및 핵심 사업부의 직원도 적절한 접근 권한을 부여받을 수 있도록 지원합니다.

또한 학습 데이터, 페이로드 데이터, 실측 정보 데이터 등 다양한 데이터 세트와 소스를 다루면서, 각 데이터에 맞는 프라이버시 및 거버넌스 수준을 적용할 수 있습니다. 중요한 것은, 각 데이터 세트와 모델에서 메타데이터를 자동으로 수집하여 중앙 카탈로그에 보관할 수 있다는 점입니다. IBM Cloud Pak for Data는 이러한 과정을 대규모 환경에서도 일관성 있게 수행할 수 있으며, 오픈 소스나 타사 툴로 구축된 모델에도 동일하게 적용할 수 있습니다.