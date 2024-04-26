통신사, 의료 서비스 또는 석유 및 가스 회사와 같은 전문 영역에서 운영되는 기업은 레이저에 집중하고 있습니다. 일반적인 생성형 AI 시나리오와 사용 사례에서 이점을 얻을 수 있지만, 더 작은 모델을 사용하는 것이 더 효과적일 것입니다.

예를 들어 통신사의 경우 일반적인 사용 사례로는 컨택 센터의 AI 어시스턴트, 서비스 제공의 맞춤형 제안, 고객 경험을 향상시키는 AI 기반 챗봇이 있습니다. 통신사가 네트워크 성능을 개선하고, 5G 네트워크의 스펙트럼 효율성을 높이거나 네트워크의 특정 병목 현상을 파악하는 데 도움이 되는 사용 사례는 기업의 자체 데이터(공개 LLM과 대조적으로)를 활용하는 것이 가장 좋습니다.

그래서 우리는 작을수록 좋다는 생각을 하게 됩니다. 이제 LLM에 비해 크기가 '더 작은' 소형 언어 모델(SLM)이 있습니다. SLM은 수백억 개의 매개변수에 대해 훈련되는 반면, LLM은 수천억 개의 매개변수에 대해 학습됩니다. 더 중요한 것은 SLM은 특정 도메인과 관련된 데이터로 훈련된다는 것입니다. 광범위한 컨텍스트 정보를 가지고 있지 않을 수도 있지만 선택한 도메인에서 매우 잘 수행됩니다.

이러한 모델은 크기가 작기 때문에 클라우드가 아닌 기업의 데이터 센터에서 호스팅할 수 있습니다. SLM은 단일 GPU 칩에서 대규모로 실행되어 연간 수천 달러의 컴퓨팅 비용을 절감할 수도 있습니다. 그러나 칩 설계가 발전함에 따라 클라우드에서만 실행할 수 있는 것과 엔터프라이즈 데이터 센터에서만 실행할 수 있는 것 사이의 구분이 명확하지 않습니다.

비용, 데이터 프라이버시 또는 데이터 주권 문제 등 기업은 데이터 센터에서 이러한 SLM을 실행하기를 원할 수 있습니다. 대부분의 기업은 데이터를 클라우드로 전송하는 것을 좋아하지 않습니다. 또 다른 주요 이유는 성능입니다. 엣지의 생성형 AI는 데이터에 최대한 가까운 곳에서 계산과 추론을 수행하므로 클라우드 제공자를 통하는 것보다 더 빠르고 안전합니다.

SLM은 계산 능력이 덜 필요하며 리소스가 제한된 환경과 모바일 디바이스에 배포하는 데 이상적입니다.

온프레미스의 예로는 LLM을 호스팅하는 IBM® Cloud에 안전하게 고속으로 연결되는 IBM Cloud Satellite 위치가 있습니다. 통신사는 이러한 SLM을 기지국에서 호스팅하고 고객에게도 이 옵션을 제공할 수 있습니다. 데이터가 이동해야 하는 거리가 줄어들어 대역폭이 향상되기 때문에 GPU 사용을 최적화하는 것이 중요합니다.