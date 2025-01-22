ChatGPT 및 이와 유사한 생성형 AI 앱의 인기에 힘입어 대규모 언어 모델(LLM)이 AI 대화를 주도하고 있습니다. 그러나 소규모 언어 모델(SLM)이 증가하고 있습니다. 더 작고 효율적인 SLM은 메모리와 처리 능력을 덜 사용합니다. 따라서 리소스가 제한된 환경에 적합합니다.
방대한 데이터 세트에서 고유한 콘텐츠와 인사이트를 생성하는 능력은 전 세계를 사로잡았고 새로운 도구와 앱에 박차를 가하여 특히 기업에서의 문화적 영향력을 더욱 공고히 했습니다. IBM® Research 유럽의 영국 및 아일랜드 담당 이사인 Juan Bernabe Moreno 박사와 함께 SLM이 엔터프라이즈 AI 도입에 어떤 이점을 제공할 수 있는지 살펴보겠습니다.
생성형 인공 지능(생성형 AI)은 기업에 상당한 생산성 잠재력을 제공합니다. 하지만 AI 모델을 구현할 때 더 큰 것이 항상 좋은 것은 아닙니다. 기업의 도입을 방해하는 두 가지 주요 LLM 문제가 있습니다.
첫째, 많은 LLM이 범용이므로 그 가치가 제한됩니다. "평균적인" 회사 모델은 "평균적인" 회사가 존재하지 않기 때문에 효과적이지 않습니다. 효과적인 AI 모델은 조직의 특정 요구에 맞게 구축, 조정 및 배포되어야 합니다.
둘째, 많은 독점 LLM은 데이터 투명성이 부족하고 AI의 진정한 가치가 있는 엔터프라이즈 데이터로의 조정을 방해하는 '블랙 박스', 즉 이를 소유한 회사만 구성 요소를 볼 수 있는 폐쇄형 모델입니다. 이로 인해 기업은 인사이트나 통제력 없이 모델 성능에 대한 책임을 지게 됩니다.
이러한 문제로 인해 모델 안전에 대한 신뢰와 이해가 저해됩니다. 산업, 법률 및 규제 요구 사항을 충족하는 생성형 AI 솔루션을 효과적으로 선택하지 않으면 기업은 생성형 AI의 힘을 완전히 활용할 수 없습니다.
성공적인 생성형 AI를 위해서는 다음과 같은 세 가지가 필요합니다.
이러한 요구 사항을 충족하고 AI 가치를 극대화하기 위해 기업은 SLM으로 전환하고 소규모의 힘을 발견하고 있습니다. SLM은 범용 LLM에 대한 강력한 대안을 제공합니다.
SLM은 관심과 호응이 훨씬 낮았지만 모든 규모의 조직에 매력적인 선택지를 제공합니다. 에너지 효율성, 데이터 투명성 및 강력한 성능(종종 대규모 모델과 동등하거나 그 이상의 성능)은 혁신을 방해하지 않으면서 책임감 있는 생성형 AI 채택을 가능하게 합니다.
일반적으로 300억 개 미만의 매개변수를 SLM으로 간주합니다. 주요 이점으로는 비용 절감, 에너지 소비 감소, 데이터 투명성 및 무결성 향상 등이 있습니다. 특정 작업을 위해 정제되고 필터링된 데이터 세트를 기반으로 구축된 IBM® Granite와 같은 차세대 소규모 모델은 편향성 및 부적절한 아웃풋과 같은 위험을 줄이면서 데이터 가시성을 높입니다.
이 신뢰할 수 있는 기본 모델을 통해 독점 데이터를 자신 있게 통합하여 AI의 진정한 가치를 실현할 수 있습니다. IBM은 모든 Granite 모델에 대해 지식 재산(IP) 면책을 제공하여 데이터를 모델과 병합하는 데 대한 신뢰도를 더욱 높입니다.
IBM은 오픈 소스 기본 모델이 조직이 전문화된 데이터 탑재 모델을 만들 수 있도록 지원한다고 믿습니다. 이를 지원하기 위해 IBM은 투명하고 필터링된 데이터 세트를 기반으로 학습했으며 사용자 지정 가능한 Granite SLM 제품군을 오픈소스화했습니다.
소규모 Granite 모델을 엔터프라이즈 데이터와 결합하면 적은 비용으로 대규모 모델에 필적하는 작업별 성능을 달성할 수 있습니다. 초기 개념 증명에 따르면 IBM Granite 모델은 대규모 프론티어 모델보다 훨씬 저렴한(3~23배) 비용이 드는 동시에 주요 벤치마크에서 유사한 규모의 경쟁사보다 성능이 뛰어나거나 이에 필적하는 것으로 나타났습니다.
또한 2024년 5월 IBM 및 RedHat에서 도입한 InstructLab과 같은 새로운 기술은 LLM에 대한 엔터프라이즈 데이터 주입을 간소화합니다. InstructLab을 통해 기업은 기존의 재 교육보다 훨씬 적은 사람이 생성한 정보 및 컴퓨팅 리소스를 사용하여 AI 모델을 사용자 지정할 수 있습니다.
Granite 모델을 포함한 SLM은 이미 영향을 미치고 있습니다. 글로벌 스포츠 기관은 자체 도메인 데이터로 조정된 Granite 모델을 사용한 AI 생성 해설을 통해 팬 경험을 개선합니다. IBM은 내부적으로 Granite 모델을 사용하여 인적 자원(HR) 서비스 플랫폼인 AskHR을 운영합니다. IBM 직원이 자연어 프롬프트를 사용하여 한 곳에서 HR 서비스에 액세스할 수 있어 직원과 HR 전문가 모두의 시간을 절약할 수 있습니다.
대규모 LLM은 생성형 AI의 이점을 누릴 수 있는 유일한 방법이 아닙니다. 작고 접근성이 뛰어난 특수 모델은 재정적, 환경적으로 더 낮은 비용으로 필요한 효율성, 신뢰, 유연성 및 성능을 제공합니다.
