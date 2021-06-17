신뢰할 수 있는 AI에 대한 업계의 관심은 기업의 사회적 책임 태세, 평판 위험에 대한 우려, 증가하는 규제 등 여러 요인에 의해 주도되고 있습니다. 조직은 AI와 머신러닝을 신뢰하고 운영하기 위해 체계적인 접근 방식이 필요하다는 것을 알고 있습니다. 신뢰할 수 있는 AI의 측면에는 공정성, 견고성, 개인정보 보호, 설명 가능성, 투명성이 포함됩니다. 사용 사례 패턴에는 기존 애플리케이션의 상태 확인을 수행하고 AI 거버넌스를 위한 조직 전반의 프레임워크를 만드는 것이 포함되지만, 오늘은 새로운 애플리케이션을 운영화하는 데 집중할 예정입니다.
조직은 신뢰할 수 있는 방식으로 새로운 AI 애플리케이션을 구축하고 운영하기 위한 체계적인 접근법이 필요합니다. 이 접근 방식은 엔드투엔드 데이터 과학 및 AI 라이프사이클을 고려해야 합니다. AI 라이프사이클은 다양한 페르소나와 모범 사례가 함께하는 일련의 단계로 구성됩니다. (일반적인 내용은 O'Reilly 보고서 Operationalizing AI 참조). 라이프사이클의 단계는 다음과 같습니다.
이상적인 시나리오에서는 신뢰할 수 있는 AI의 측면을 마지막뿐만 아니라 이러한 각 단계에서 해결해야 합니다. 비즈니스 정의, 데이터 탐색 및 모델 구축부터 모델 검증, 배포, 모니터링 및 지속적인 관리에 이르기까지 각 단계에서 적절한 가드레일이 필요합니다. 각 단계를 자세히 살펴보고 신뢰할 수 있는 AI의 다양한 측면을 어떻게 해결하는지 살펴보겠습니다.
이 단계에서는 사용 사례의 우선순위를 정하고 AI 실행 계획을 개발합니다. 비즈니스 이해관계자, 데이터 과학자, 데이터 소유자, 운영 책임자 및 기타 역할로 구성된 이 팀은 먼저 비즈니스 가치를 정의하고 비즈니스 KPI를 지정하는 비즈니스 사용 사례에 중점을 둡니다. 그런 다음 기술 작업을 처리하여 비즈니스 목표를 해결해야 할 특정 AI 작업으로 변환합니다. 마지막으로, 팀은 비즈니스 목표를 지원하기 위해 식별된 기술 작업에 대한 솔루션을 위한 구조화된 실행 계획을 개발합니다.
Enterprise 디자인 사고 원칙을 적용하는 것이 이 단계의 모범 사례입니다. 디자인 사고는 사용 사례의 맥락에서 편향성/공정성, 견고성, 설명 가능성 등의 다양한 비즈니스 및 기술적 측면을 식별하고 정의하는 데 도움이 됩니다. 이 단계에서는 다음과 같은 질문에 답하는 데 도움이 됩니다.
또한 팀이 이러한 사용 사례를 구축하는 동안 따라야 하는 조직 데이터 및 AI 정책을 기록하여 프로덕션 사용을 위한 유효성 검사를 시도할 때 막판 문제를 방지하는 것도 중요합니다.
이 단계를 통해 데이터 소비자는 관련 데이터 세트를 찾고 액세스할 수 있습니다. 데이터 사이언스 팀은 메타데이터나 비즈니스 용어를 사용하여 중앙 카탈로그에서 '데이터를 쇼핑'할 수 있습니다. 소유자, 계보, 다른 데이터 세트와의 관계 등 데이터를 이해할 수 있습니다. 데이터 과학자에게 데이터 리니지에 대한 기술적 관점을 제공하여 기능을 생성하고 사용하는 방식에 영향을 미칠 수 있는 각 데이터 변환을 이해할 수 있도록 하는 것이 중요합니다.
그 탐색을 바탕으로 데이터 피드를 요청할 수 있습니다. 승인되면 데이터 과학 개발 환경에서 데이터 과학 팀이 데이터 세트를 사용할 수 있습니다.
팀이 개인 식별 정보(PII) 또는 보호 대상 건강 정보(PHI)와 같은 규제 대상 개인 데이터로 작업해야 하는 경우, 데이터 관리자 또는 데이터 제공자는 적절한 익명화를 통해 공유된 데이터가 규정을 준수하는지 확인해야 합니다.
데이터 과학팀은 이 단계에서 데이터를 탐색 및 준비하고 AI/ML 모델을 구축, 학습 및 테스트합니다. 이 단계의 활동은 일련의 민첩한 스프린트 형태로 수행하는 것이 가장 좋습니다. 모델 구축 작업을 시작하기 전에도 이 단계에서 데이터의 편향성을 확인하는 것이 중요합니다. 이것은 공정성을 위한 내부 가드레일이며, 이러한 가드레일은 모형 제작 단계의 중과 후에 설치할 수 있습니다. 이 단계에서 모델 견고성, 설명 가능성 및 기타 측면을 유사하게 고려하고 테스트할 수 있습니다.
이러한 테스트가 성공적으로 완료되면 MLOps 파이프라인을 통해 모델 및 관련 자산을 개발 환경에서 사전 프로덕션 검증 환경으로 이동할 수 있습니다.
이 단계에는 모델 검증 및 프로덕션에 배포가 포함됩니다. 유효성 검사 활동은 모델을 구축한 팀이 아닌 다른 팀(예: 조직의 모델 유효성 검사 또는 모델 위험 관리 팀 또는 외부 기관)이 수행할 수 있습니다.
이 팀은 품질, 견고성, 공정성 등을 검증하고 검증 보고서를 생성합니다. 참조 및 비교를 위해 검증 결과를 캡처하는 것이 중요합니다. 모델 팩트 시트, 로컬 및 글로벌 설명 및 기타 지표도 확인합니다.
모델이 유효성 검사를 통과하면 운영 팀은 MLOps 파이프라인을 사용하여 프로덕션 환경으로 승격할 수 있습니다. 모델은 온라인 또는 배치 호출용으로 배포됩니다.
이 단계에서 운영팀은 프로덕션 환경의 AI/ML 모델에 대한 지속적인 모니터링 및 관리를 설정합니다. 팀은 정기적으로 예약된 지표 수집을 위해 모니터를 구성합니다. 품질, 견고성 및 공정성은 비즈니스 요구 사항에 따라 지정된 빈도로 모니터링됩니다. 데이터 및 정확도 드리프트를 모니터링하고 선택한 트랜잭션 및 글로벌 동작에 대한 설명을 생성하는 것은 지속적인 활동의 예입니다.
비즈니스는 모니터가 임계값 위반을 감지한 경우 경고부터 시정 조치에 이르기까지 다양한 조치를 선택할 수 있습니다. 편향 완화 또는 모델 재학습 단계를 구성하여 신뢰할 수 있는 행동을 지속할 수 있습니다. 비즈니스 또는 기술 기준에 따라 모델을 폐기할 수 있습니다. 이 단계에서는 신뢰할 수 있는 AI를 위한 가장 바깥쪽의 가드레일을 설정합니다.
이러한 AI 라이프사이클 단계는 기업의 전반적인 AI 거버넌스 프레임워크에 적합합니다. 이러한 프레임워크를 사용하면 사용되는 개발 툴에 관계없이 여러 사용 사례가 라이프사이클 단계를 일관되게 따를 수 있습니다. 라이프사이클 전반에 걸쳐 문서를 자동화하고 다양한 이해관계자에게 일관된 시각을 제공합니다.
신뢰할 수 있는 AI를 운영하려면 사람(전문성), 프로세스(모범 사례), 플랫폼(기술)을 한데 모아야 합니다. IBM® Cloud Pak for Data와 IBM® Spectrum Fusion는 엔드투엔드 AI 라이프사이클의 다양한 단계를 지원하는 기술 프레임워크를 제공합니다. 기존 환경에 적합하고 기존 모델 개발 및 배포 툴을 보완할 수 있습니다. 이 플랫폼은 다양한 클라우드(IBM, AWS, Azure, GCP 등) 및 온프레미스 인프라에서 실행할 수 있어 진정한 하이브리드 클라우드 기능을 제공합니다.
IBM은 고객이 신뢰할 수 있는 AI 운영을 시작할 수 있도록 교육, 전문 지식, 모범 사례 및 기술을 통합하는 일련의 서비스 오퍼링을 제공합니다.