우리는 AI 혁명의 최전선에 서 있습니다. 지난 10년 동안 딥 러닝은 데이터 가용성과 엄청난 컴퓨팅 파워가 충돌하면서 생겨났으며, 이를 통해 수많은 놀라운 AI 기능이 가능해졌습니다. 하지만 자동화는 노동 집약적이라는 역설적인 과제에 직면했습니다. 농담처럼 들리지만, AI로 비즈니스 문제를 해결해 본 사람이라면 누구나 알 수 있듯이 결코 농담이 아닙니다.
기존 AI 도구는 강력하지만 비용이 많이 들고 시간이 많이 걸리며 사용하기 어려울 수 있습니다. AI 모델을 학습시키기 위해서는 데이터를 힘들게 수집하고, 선별하고, 작업별 주석으로 레이블을 지정해야 합니다. 모델을 구축하려면 전문적이고 찾기 어려운 기술이 필요하며, 새로운 작업을 수행할 때마다 이 과정을 반복해야 합니다. 그 결과 기업들은 주로 데이터가 풍부하고 비즈니스 가치가 높은 작업을 자동화하는 데 집중하고 그 외의 모든 작업은 뒷전으로 미뤄두었습니다. 하지만 상황이 바뀌기 시작했습니다.
트랜스포머와 자가 지도 학습 방법의 등장으로 라벨이 없는 방대한 양의 데이터를 활용할 수 있게 되면서 "파운데이션 모델"이라고도 불리는 사전 학습된 대규모 모델을 위한 기반을 마련할 수 있게 되었습니다. 이러한 대형 모델은 자동화에 대한 비용과 노동력을 줄였습니다.
파운데이션 모델은 다양한 AI 애플리케이션을 위한 강력하고 다양한 기반을 제공합니다. 파운데이션 모델을 사용하면 주석이 달린 제한된 데이터와 최소한의 노력으로 작업을 빠르게 수행할 수 있으며, 경우에 따라서는 당면한 작업을 설명하기만 하면 모델이 문제를 해결하도록 유도할 수 있습니다.
그러나 이러한 강력한 기술은 기업에 새로운 위험과 과제를 안겨주기도 합니다. 오늘날의 많은 모델은 품질과 출처를 알 수 없는 데이터 세트를 기반으로 학습되므로 공격적이거나 편향된 또는 사실에 기반한 잘못된 응답을 초래할 수 있습니다. 대형 모델은 학습하고 실행하는 데 비용이 많이 들고 에너지 집약적이며 배포가 복잡합니다.
IBM은 엔터프라이즈용 파운데이션 모델을 사용하기 위한 핵심 과제를 해결하는 접근 방식을 개발해 왔습니다. 오늘, IBM은 최신 AI 도구와 기술에 대한 IBM의 게이트웨이인 watsonx.ai를 발표했습니다. 이 분야가 얼마나 빠르게 변화하고 있는지를 증명하듯, 일부 도구는 출시된 지 몇 주밖에 되지 않았고 이 글을 쓰는 지금도 새로운 도구가 추가되고 있습니다.
이번 주 발표된 IBM의 더 큰 watsonx 제품군의 일부인 watsonx.ai에 포함된 제품은 다양하며 계속 발전해 나갈 것이지만, 안전하고 엔터프라이즈급 자동화 제품을 제공한다는 중요한 약속은 동일합니다.
이는 AI의 새로운 패러다임에서 가치를 창출하기 위한 고객의 여정을 가속화하기 위한 IBM의 지속적인 노력의 일부입니다. 여기서는 데이터 및 모델 아키텍처에 대한 접근 방식을 포함하여 IBM이 훈련한 엔터프라이즈급 파운데이션 모델 제품군을 구축하기 위한 작업에 대해 설명하겠습니다. 또한, 저희만의 모델 외에도 다양한 오픈소스 모델을 활용하여 기업이 파운데이션 모델 기반 솔루션을 구축하고 배포할 수 있도록 지원하는 새로운 포트폴리오와 툴링에 대해서도 간략히 설명하겠습니다.
데이터 품질은 중요합니다. 편향되거나 유해한 데이터를 기반으로 학습된 AI 모델은 당연히 편향되거나 유해한 아웃풋을 생성하는 경향이 있습니다. 파운데이션 모델 시대에는 모델 학습에 사용되는 데이터가 일반적으로 많은 소스에서 제공되고 너무 방대하여 인간이 모든 데이터를 합리적으로 검토할 수 없기 때문에 이 문제가 더욱 복잡해집니다.
데이터는 파운데이션 모델을 구동하는 연료이기 때문에 IBM은 모델에 들어가는 모든 것을 세심하게 큐레이팅하는 데 집중해 왔습니다. 저희는 혐오와 욕설, 라이선스 제한, 편견에 대한 데이터를 적극적으로 필터링하는 AI 도구를 개발했습니다. 문제가 있는 데이터가 식별되면 이를 제거하고 모델을 재학습한 후 반복합니다.
데이터 큐레이션은 결코 끝나지 않은 작업입니다. IBM은 진화하는 법률 및 규제 요구 사항을 충족하기 위해 데이터 품질과 제어를 개선하는 새로운 방법을 지속적으로 개발하고 개선하고 있습니다. 정리된 원시 데이터, 사용된 방법, 각 데이터 포인트가 건드린 모델을 추적하는 엔드투엔드 프레임워크를 구축했습니다.
IBM은 금융, 법률, 사이버 보안, 지속가능성 등 다양한 영역에서 가장 시급한 비즈니스 과제를 해결하는 데 도움이 되도록 고품질 데이터를 지속적으로 수집하고 있습니다. 현재 파운데이션 모델, 선별된 소프트웨어 코드, 위성 데이터, IT 네트워크 이벤트 데이터 및 로그를 추가하는 동시에 1테라바이트 이상의 선별된 텍스트를 파운데이션 모델 훈련을 위해 타겟팅하고 있습니다.
또한 IBM Research는 파운데이션 모델 라이프사이클 전반에 걸쳐 신뢰를 주입하고 편향을 완화하며 모델 안전성을 개선하는 기술을 개발하고 있습니다. 이 분야의 작업에는 모델을 조정하는 데 사용되는 데이터에서 편향된 데이터 포인트를 식별하여 이를 편집할 수 있도록 하는 FairIJ가 포함됩니다. 공정성 재프로그래밍과 같은 다른 방법을 사용하면 모델이 학습된 후에도 편향성을 완화할 수 있습니다.
IBM의 새로운 watsonx.ai 스튜디오는 엔터프라이즈 가치 제공을 목표로 하는 파운데이션 모델을 제공합니다. 이는 앞으로 몇 달 안에 IBM 고객에게 제공될 다양한 IBM 제품에 통합되었습니다.
저희는 한 가지 방법이 모든 상황에 맞는 것은 아니라는 점을 인식하고 다양한 크기와 아키텍처의 언어 및 코드 파운데이션 모델 제품군을 구축하고 있습니다. 각 모델 패밀리에는 지질학을 주제로 한 코드명(Granite, Sandstone, Obsidian 및 Slate)이 있으며, 여기에는 IBM Research와 오픈 연구 커뮤니티의 최첨단 혁신이 통합되어 있습니다. 각 모델은 다양한 엔터프라이즈 작업에 맞게 사용자 정의할 수 있습니다.
Granite 모델은 생성형 작업을 위한 디코더 전용 GPT와 유사한 아키텍처를 기반으로 합니다. Sandstone 모델은 인코더-디코더 아키텍처를 사용하며 특정 작업의 미세 조정에 적합하며 Google의 인기 있는 T5 모델과 호환됩니다. Obsidian 모델은 IBM Research에서 개발한 새로운 모듈식 아키텍처를 활용하여 다양한 작업에서 높은 추론 효율성과 성능을 제공합니다. Slate는 인코더 전용(RoBERTa 기반) 모델 제품군을 말하며, 생성형은 아니지만 많은 엔터프라이즈 NLP 작업에 빠르고 효과적입니다. 모든 watsonx.ai 모델은 IBM의 엄선된 엔터프라이즈 중심 데이터 레이크와 맞춤형으로 설계된 클라우드 네이티브 AI 슈퍼컴퓨터인 Vela에서 학습됩니다.
효율성과 지속 가능성은 watsonx.ai 의 핵심 설계 원칙입니다. IBM Research에서는 효율적인 모델 학습을 위한 새로운 기술을 발명했는데, 여기에는 작은 모델을 재활용하여 더 큰 모델로 "성장"시키는 "LiGO" 알고리즘이 포함됩니다. 이 방법을 사용하면 모델 학습에 필요한 시간, 비용 및 아웃풋을 40%에서 70%까지 절감할 수 있습니다. 추론 속도를 향상시키기 위해 양자화에 대한 심층적인 전문 지식을 활용하거나 32포인트 부동 소수점 연산에서 훨씬 작은 정수 비트 형식으로 모델을 축소하고 있습니다. AI 모델 정밀도를 낮추면 정확도는 그대로 유지하면서 효율성은 크게 향상됩니다. 곧 이러한 압축 모델을 AI에 최적화된 칩인 IBM® AIU에서 실행할 예정입니다.
파운데이션 모델 퍼즐의 마지막 부분은 모델 조정 및 배포를 위한 사용하기 쉬운 소프트웨어를 만드는 것입니다. RedHat OpenShift를 기반으로 구축된 IBM의 하이브리드 클라우드 네이티브 추론 스택은 파운데이션 모델의 학습 및 제공에 최적화되어 있습니다. 기업은 OpenShift의 유연성을 활용하여 온프레미스를 비롯한 어디서나 모델을 실행할 수 있습니다.
파운데이션 모델 기반 솔루션 구축을 위한 사용자 친화적인 사용자 인터페이스와 개발자 친화적인 라이브러리를 고객에게 제공하는 도구 모음을 watsonx.ai 기반으로 만들었습니다. Prompt Lab을 사용하면 사용자는 몇 가지 레이블이 지정된 예제만으로 AI 작업을 빠르게 수행할 수 있습니다. Tuning Studio를 사용하면 IBM Research에서 개발한 최첨단의 효율적인 미세 조정 기술을 기반으로 사용자의 데이터를 사용하여 빠르고 강력한 모델 사용자 정의가 가능합니다.
watsonx.ai는 IBM의 자체 모델 외에도 기업이 실험하고 빠르게 반복할 수 있도록 광범위한 오픈 소스 모델 카탈로그에 원활하게 액세스할 수 있도록 지원합니다. IBM은 Hugging Face와의 새로운 파트너십을 통해 watsonx.ai에서 수천 개의 오픈 소스 파운데이션 모델, 데이터 세트, 라이브러리를 제공할 예정입니다. Hugging Face는 IBM의 모든 독점 및 오픈 액세스 모델과 도구를 watsonx.ai에서 제공할 예정입니다.
새 모델을 사용해 보려면 드롭다운 메뉴에서 모델을 선택하기만 하면 됩니다. 스튜디오에 대한 자세한 내용은 여기에서 확인할 수 있습니다.
파운데이션 모델은 AI의 환경을 변화시키고 있으며, 최근 몇 년 동안 발전이 더욱 가속화되고 있습니다. IBM은 빠르게 진화하는 이 분야의 지평을 개척하고 혁신을 실질적인 기업 가치로 전환하는 데 일조할 수 있게 되어 기쁩니다.
IBM은 2,000개 조직을 대상으로 AI 이니셔티브에 대한 설문조사를 실시하여 효과적인 전략과 효과적이지 못한 전략, 그리고 앞서나갈 수 있는 방법을 알아보았습니다.
AI 투자에 대해 더 나은 수익을 얻고 싶으신가요? 주요 영역에서 차세대 AI를 확장하여 최고의 인재들이 혁신적인 새 솔루션을 구축하고 제공하도록 지원함으로써 변화를 주도하는 방법을 알아보세요.
AI 개발 라이프사이클 전반에 걸친 기능에 원스톱으로 액세스하세요. 사용자 친화적인 인터페이스, 워크플로, 업계 표준 API 및 SDK에 대한 액세스를 통해 강력한 AI 솔루션을 제작할 수 있습니다.