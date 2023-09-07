비즈니스에서 신뢰는 곧 운영을 가능하게 하는 '허가증'입니다. 특히 AI 분야에서 '우리를 믿어주세요'라는 말만으로는 충분하지 않습니다. 엔터프라이즈 AI를 가장 먼저 개발한 기업 중 하나로서 IBM은 신뢰와 투명성에 대한 약속을 기반으로 한 핵심 원칙에 따라 AI를 개발하고 있습니다. IBM watsonx 제품군은 단순히 AI를 사용하는 것을 넘어, AI로부터 실제 비즈니스 가치를 창출할 수 있도록 지원합니다. 이 플랫폼은 데이터 수집에서 시작해, 모델과 애플리케이션이 책임 있게 배포되고 운영되는지 추적하는 제어 지점에 이르기까지, 기초 모델 및 생성형 AI를 구축하고 테스트하는 엔드투엔드 프로세스를 제공합니다. 이 과정은 거버넌스, 위험 평가, 편향 완화, 그리고 규정 준수에 초점을 맞추고 있습니다.

Granite 모델은 고객이 자체 애플리케이션에 맞게 조정하여 사용할 수 있도록 제공될 예정이므로, 학습에 사용되는 모든 데이터 세트는 정의된 거버넌스, 위험 및 규정 준수(GRC) 검토 절차를 거칩니다. IBM은 IBM AI 윤리 원칙에 부합하도록, 데이터를 IBM Data Pile에 포함시키기 위한 거버넌스 절차를 개발했습니다. 데이터에 대한 GRC 기준 충족은 학습 데이터의 전체 라이프사이클에 걸쳐 적용됩니다. 저희의 목표는 학습된 기반 모델에서, 그 모델이 학습된 특정 버전의 데이터셋까지 감사 가능한 연결 고리를 구축하는 것입니다.

언론의 많은 관심이(당연히) 생성형 AI가 혐오적이거나 명예훼손적 내용을 만들어낼 위험에 초점을 맞추고 있습니다. IBM은 기업이 이런 위험을 감수할 수 없다는 것을 잘 알고 있습니다. 그래서 Granite 모델은 IBM이 자체적으로 개발한 "HAP 감지기"로 면밀히 검토된 데이터로 학습됩니다. HAP 감지기는 혐오 및 욕설 콘텐츠를 탐지하고 제거하도록 훈련된 언어 모델로, 내부 모델뿐 아니라 공개 모델을 기준으로 벤치마크됩니다. 문서의 각 문장에 점수가 부여된 후, 분석을 통해 문장과 점수의 분포를 확인하여 필터링해야 할 문장의 비율을 결정합니다.

이 외에도 다양한 품질 측정을 적용하고 있습니다. 아웃풋 품질을 개선하기 위해 중복을 찾아 제거하고, 교육에 적합하지 않은 낮은 품질의 문서를 제거하기 위해 문서 품질 필터를 사용합니다. 또한 불법 복제 자료나 기타 불쾌한 자료를 게시하는 것으로 알려진 웹사이트를 모니터링하고 해당 웹사이트를 피하는 등 정기적이고 지속적인 데이터 보호 조치를 취하고 있습니다.

또한 생성형 AI 기술 환경은 끊임없이 변화하고 있기 때문에 엔드투엔드 프로세스는 지속적으로 진화하고 개선하여 기업이 신뢰할 수 있는 결과를 제공할 것입니다.