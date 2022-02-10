IBM® Consulting의 데이터 과학자로서 저는 운 좋게도 IBM 고객의 다양한 요구를 충족하기 위해 여러 프로젝트를 진행할 수 있었습니다. IBM에서 근무하는 동안 저는 원래는 불가능하다고 생각했던 다양한 사용 사례에 기술이 적용되는 것을 보았기 때문에 오늘날 우리가 직면한 가장 교묘한 사회적 문제 중 하나인 인종 불공정을 해결하기 위해 인공 지능을 구현하는 일을 맡게 되어 기뻤습니다.
2020년 Black Lives Matter 운동이 국가와 전 세계에 스며들기 시작하면서 고객의 문제를 해결하는 저의 능력이 주요 사회 문제에 적용될 수 있을지 궁금해졌습니다. 이 아이디어를 바탕으로 저는 인종 평등을 위한 투쟁에 동참할 기회를 찾기로 결심했고, 인종 정의를 위한 행동 강령(Call for Code for Racial Justice)을 통해 공개될 프로젝트를 진행하고 있는 IBM 내부 커뮤니티를 발견했습니다.
IBM 내에서 인큐베이팅 중인 프로젝트는 무수히 많았지만, 저는 특히 암묵적인 편견과 명시적인 편견을 모두 담고 있는 프로젝트에 끌렸습니다. 그 프로젝트가 바로 TakeTwo로, 1년여 전 외부 오픈 소스 프로젝트로 공개된 7개 프로젝트 중 하나였습니다. TakeTwo 프로젝트는 자연어 이해를 사용하여 서면 콘텐츠에서 명시적이든 미묘한 것이든 인종적 편견을 감지하고 제거하는 데 도움을 줍니다. TakeTwo를 사용하여 인종적으로 편향된 것으로 보일 수 있는 문구와 단어를 탐지하면 콘텐츠 제작자가 글을 쓸 때 잠재적인 편견을 사전에 완화하는 데 도움이 될 수 있습니다. 콘텐츠 제작자는 현재 온라인 텍스트 편집기를 통해 콘텐츠를 게시하기 전에 자신이 만든 콘텐츠를 확인할 수 있습니다. 잠재적인 인종 차별적 언어를 발견하는 Grammarly처럼 생각하면 됩니다. TakeTwo는 Inclusive Naming Initiative와 같은 신뢰할 수 있는 출처에서 수집한 포괄적 용어 디렉터리를 활용하도록 설계되었습니다.
TakeTwo를 통해 제 전문 지식을 적용하여 프로젝트를 개선할 수 있었을 뿐만 아니라, 제가 가지고 있었을 수도 있지만 이전에는 인식하지 못했던 암묵적인 인종 편견을 들여다볼 수 있는 기회도 얻었습니다. TakeTwo 작업은 세상에 중요한 임무를 수행할 수 있는 좋은 방법이었고 동시에 자기 성찰의 기회를 제공했습니다.
다음과 같은 솔루션을 살펴보세요.
TakeTwo 작업을 진행하면서 이 솔루션이 방대한 양의 데이터를 수집하고 평가하여 편향을 감지하는 것을 목표로 하지만, 데이터 자체에 암묵적인 편향이 있을 수 있다는 점을 인식하는 것이 중요하다는 사실을 분명히 알게 되었습니다. TakeTwo 솔루션은 인공 지능과 Python, FastAPI, JavaScript 및 CouchDB와 같은 오픈 소스 기술을 활용하여 수집한 데이터를 계속 평가하고 데이터 내에 편향이 존재하는 경우를 더 잘 감지할 수 있습니다. 예를 들어, 미국에서는 사용이 허용될 수 있는 단어나 문구를 일본에서는 허용하지 않을 수 있으므로 이를 최대한 인지하고 그에 따라 솔루션이 작동하도록 해야 합니다. 데이터 과학에 열정을 가진 사람으로서 저는 직접 경험한 바에 따르면, 우리 모델은 우리가 공급하는 데이터만큼만 우수하다는 것을 잘 알고 있습니다. 참고로, 이 프로젝트를 진행하면서 배운 한 가지는 이러한 시스템을 뒷받침하는 머신 러닝(ML) 모델을 훈련하는 데 도움이 될 수 있는 더 나은 데이터 세트가 필요하다는 것입니다. Kaggle 데이터 세트는 우리에게 훌륭한 출발점이었지만, 인종 차별이 존재하는 모든 곳에서 이를 해결하기 위해 프로젝트를 확장하려면 더 다양한 데이터가 필요합니다.
이와 같은 프로젝트에 필요한 기술은 단순한 데이터 과학 그 이상입니다. 특히 이 프로젝트에서는 TakeTwo와 같은 시스템이 코드화하거나 무시해야 하는 언어에 존재하는 문화적 뉘앙스를 정의하는 데 도움을 줄 수 있는 언어 전문가를 활용하는 것이 중요했습니다. 여러 분야가 협력해야만 실행 가능한 해결책을 찾을 수 있습니다.
ML과 AI가 TakeTwo와 같은 솔루션을 개선하는 데 제공하는 가치는 고무적입니다. 직원 채용부터 은행 대출 승인에 이르기까지, 머신 러닝과 AI는 우리가 서로 소통하는 방식에 스며들어 있으며, 비즈니스 의사 결정에서 인종적 편견을 최대한 제거할 수 있도록 도울 수 있습니다. 기술자로서 우리는 정직하고 편항되지 않으며 가능한 한 최고 수준의 성능을 발휘하여 결과물을 신뢰할 수 있는 모델을 생산해야 할 분명한 책임이 있습니다.
IBM에서 더 나은 AI를 구축하는 방법을 여기에서 확인할 수 있습니다. TakeTwo는 그 효능을 개발하고 강화하기 위해 계속해서 발전하고 있으며, 여러분은 이 오픈 소스 프로젝트를 더 잘 만드는 데 기여할 수 있습니다. 오늘 TakeTwo와 다른 모든 인종 정의 코드 요청 프로젝트를 확인하세요!
이 게시물은 흑인 역사의 달을 맞아 인공지능과 사회 정의의 관계를 다룬 시리즈의 일부입니다.
