오픈 소스 대규모 언어 모델: 이점, 위험 및 유형

휴게실에서 새 프로젝트를 논의하는 팀

대규모 언어 모델(LLM)은 인공 지능(AI), 딥 러닝 및 웹사이트, 기사 및 책을 포함한 방대한 데이터 세트를 사용하여 텍스트를 생성하고 언어 간 번역을 하며 다양한 유형의 콘텐츠를 작성하는 파운데이션 모델입니다. 이러한 생성형 AI 모델에는 독점 대규모 언어 모델과 오픈 소스 대규모 언어 모델의 두 가지 유형이 있습니다.

이 영상에서 Martin Keen은 대규모 언어 모델과 파운데이션 모델 간의 관계, 작동 방식, 다양한 비즈니스 문제를 해결하는 데 사용하는 방법을 간략하게 설명합니다.

독점 LLM은 회사 소유이며 라이선스를 구매한 고객만 사용할 수 있습니다. 라이선스에 따라 LLM 사용 방법이 제한될 수 있습니다. 반면, 오픈 소스 LLM은 무료이며 누구나 액세스하고, 어떤 목적으로든 사용하고, 수정하고, 배포할 수 있습니다.

"오픈 소스"라는 용어는 LLM 코드와 기본 아키텍처가 대중이 액세스할 수 있음을 의미하며, 이는 개발자와 연구자가 모델을 자유롭게 사용, 개선 또는 수정할 수 있음을 의미합니다.

오픈 소스 LLM의 이점은 무엇인가요?

이전에는 LLM이 클수록 좋다고 생각했지만 이제 기업은 연구 및 혁신 측면에서 엄청나게 비쌀 수 있다는 것을 깨닫고 있습니다. 이에 대한 대응으로 오픈 소스 모델 에코시스템이 유망해지면서 LLM 비즈니스 모델에 도전하기 시작했습니다.

투명성 및 유연성

 

사내 머신 러닝 인재가 없는 기업은 클라우드든 온프레미스든 자체 인프라 내에서 투명성과 유연성을 제공하는 오픈 소스 LLM을 사용할 수 있습니다. 이를 통해 데이터를 완벽하게 제어할 수 있으며 민감한 정보가 네트워크 내에 유지됩니다. 이 모든 것이 데이터 유출 또는 무단 액세스의 위험을 줄여줍니다.

오픈 소스 LLM은 작동 방식, 아키텍처, 교육 데이터, 방법론, 사용 방법에 대한 투명성을 제공합니다. 코드를 검사하고 알고리즘에 대한 가시성을 확보할 수 있으면 기업의 신뢰가 높아지고 감사를 지원하며 윤리적, 법적 준수를 보장하는 데 도움이 됩니다. 또한 오픈 소스 LLM을 효율적으로 최적화하면 대기 시간을 줄이고 성능을 높일 수 있습니다.

비용 절감

 

일반적으로 라이선스 비용이 수반되지 않기 때문에 장기적으로 독점 LLM보다 훨씬 저렴합니다. 단, LLM 운영 비용에는 클라우드 또는 온프레미스 인프라 비용이 포함되며, 일반적으로 상당한 초기 롤아웃 비용이 소요됩니다.

추가된 기능 및 커뮤니티 기여

 

사전 학습된 오픈 소스 LLM을 통해 미세 조정할 수 있습니다. 기업은 특정 용도에 도움이 되는 기능을 LLM에 추가할 수 있으며 LLM은 특정 데이터 세트에 대해 학습될 수도 있습니다. 독점 LLM에서 이러한 변경이나 사양을 적용하려면 공급업체와 협력해야 하며 시간과 비용이 소요됩니다.

독점 LLM은 기업이 단일 공급자에 의존해야 한다는 것을 의미하지만, 오픈 소스 LLM을 사용하면 기업이 커뮤니티 기여, 여러 서비스 공급자 및 내부 팀을 활용하여 업데이트를 처리하고, 개발 및 유지 관리와 지원을 받을 수 있습니다. 오픈 소스를 통해 기업은 다양한 관점을 가진 사람들의 기여를 실험하고 사용할 수 있습니다. 그 결과 기업이 최첨단 기술을 유지할 수 있는 솔루션이 탄생할 수 있습니다. 또한 오픈 소스 LLM을 사용하는 기업은 기술 및 사용 방법에 대한 결정을 더 잘 제어할 수 있습니다.

전문가가 전하는 최신 AI 트렌드

가장 중요하고 흥미로운 AI 뉴스에 대한 선별된 인사이트를 확인하세요. 주간 Think 뉴스레터를 구독하세요. IBM 개인정보 보호정책을 참조하세요.

감사합니다! 구독이 완료되었습니다.

구독은 영어로 제공됩니다. 모든 뉴스레터에는 구독 취소 링크가 있습니다. 여기에서 구독을 관리하거나 취소할 수 있습니다. 자세한 정보는 IBM 개인정보 보호정책을 참조하세요.

오픈 소스 LLM 모델로 어떤 유형의 프로젝트를 지원할 수 있나요?

조직은 오픈 소스 LLM 모델을 사용하여 직원에게 유용한 거의 모든 프로젝트를 만들거나 오픈 소스 라이선스가 허용하는 경우 상용 제품으로 제공할 수 있습니다. 그 예는 다음과 같습니다.

텍스트 생성(text generation)

 

오픈 소스 LLM 모델을 사용하면 이메일, 블로그 게시물 또는 창의적인 스토리 작성과 같은 언어 생성 기능을 갖춘 앱을 만들 수 있습니다. Apache 2.0 라이선스에 따라 제공되는 Falcon-40B와 같은 LLM은 고품질 텍스트 제안으로 프롬프트에 응답한 다음 개선하고 다듬을 수 있습니다.

코드 생성

 

기존 코드 및 프로그래밍 언어에 대해 교육된 오픈 소스 LLM은 개발자가 애플리케이션을 구축하고 오류 및 보안 관련 결함을 찾는 데 도움이 될 수 있습니다.

가상 튜터링

 

오픈 소스 LLM을 사용하면 특정 학습 스타일에 맞게 사용자 정의하고 미세 조정할 수 있는 개인화된 학습 경험을 제공하는 애플리케이션을 만들 수 있습니다.

콘텐츠 요약

 

긴 기사, 뉴스 기사, 연구 보고서 등을 요약하는 오픈 소스 LLM 도구를 사용하면 주요 데이터를 쉽게 추출할 수 있습니다.

AI 기반 챗봇

 

이들은 질문을 이해하고 답하고, 제안을 제공하고, 자연어 대화에 참여할 수 있습니다.

언어 번역

 

다국어 데이터 세트를 학습하는 오픈 소스 LLM은 여러 언어로 정확하고 유창한 번역을 제공할 수 있습니다.

감정 분석

 

LLM은 텍스트를 분석하여 감정적 또는 감정적 어조를 결정할 수 있으며, 이는 브랜드 평판 관리 및 고객 피드백 분석에 유용합니다.

콘텐츠 필터링 및 검토

 

LLM은 부적절하거나 유해한 온라인 콘텐츠를 식별하고 필터링하는 데 유용할 수 있으며, 이는 보다 안전한 온라인 환경을 유지하는 데 큰 도움이 됩니다.

AI 아카데미

파운데이션 모델이 AI 패러다임의 전환을 가져오는 이유

새로운 수익을 창출하고 비용을 절감하며 생산성을 높일 수 있는, 유연하고 재사용 가능한 새로운 AI 모델을 살펴봅니다. 그다음, 가이드북을 통해 보다 심층적으로 알아봅니다.

어떤 종류의 조직이 오픈 소스 LLM을 사용하나요?

다양한 유형의 조직이 오픈 소스 LLM을 사용합니다. 예를 들어, IBM과 NASA는 과학자와 그들의 조직이 기후 변화에 맞서 싸우는 데 도움이 되는 공간 데이터에 대한 교육을 받은 오픈 소스 LLM을 개발했습니다.

출판사 및 언론인은 내부적으로 오픈 소스 LLM을 사용하여 뉴스룸 외부에서 독점 데이터를 공유하지 않고도 정보를 분석, 식별 및 요약합니다.

일부 조직은 진단 도구, 치료 최적화 및 환자 정보, 공중 보건 등을 처리하는 도구를 포함하여 의료 소프트웨어에 오픈 소스 LLM을 사용합니다.

오픈 소스 LLM FinGPT는 금융 산업을 위해 특별히 개발되었습니다.

엄선된 최고의 오픈 소스 LLM

Open LLM Leaderboard는 다양한 벤치마크에서 오픈 소스 LLM 및 챗봇을 추적하고 순위를 매기고 평가하는 것을 목표로 합니다.

  • 상업적 사용을 위한 계약을 허용하는 라이선스를 보유한 우수한 성능의 오픈 소스 LLM 중 하나는 Meta AI의 LLaMa 2로, 70억~700억 개의 매개변수가 있는 사전 학습되고 미세 조정된 생성 텍스트 모델을 포함하며 Watsonx.ai 스튜디오에서 사용할 수 있습니다. Hugging Face 에코시스템과 트랜스포머 라이브러리를 통해서도 사용할 수 있습니다.
  • Vicuna와 Alpaca는 LLaMa 모델 위에 생성되었으며 Google의 Bard 및 OpenAI의 ChatGPT와 마찬가지로 지침을 따르도록 미세 조정되었습니다. Alpaca를 능가하는 Vicuna는 GPT-4 성능에 필적합니다.
  • BigScience의 Bloom(ibm.com 외부 링크)은 1,000명 이상의 AI 연구자들이 만든 다국어 언어 모델로, 완전한 투명성을 위해 훈련된 최초의 다국어 LLM입니다.
  • TII(Technology Innovation Institute)의 Falcon(ibm.com 외부 링크) LLM을 챗봇과 함께 사용하여 창의적인 텍스트를 생성하고, 복잡한 문제를 해결하고, 반복적인 작업을 줄이고 자동화할 수 있습니다. Falcon 6B와 40B는 모두 미세 조정을 위한 원시 모델 또는 현 상태 그대로 사용할 수 있는 이미 명령어 조정된 모델로 제공됩니다. Falcon은 GPT-3 훈련 컴퓨팅 예산의 약 75%만 사용하며 이 모델의 성능을 크게 상회했습니다.
  • MPT-7B 및 MPT-30B(ibm.com 외부 링크)는 상업적 용도로 라이선싱된 MosaicML(최근 Databricks에 인수됨)의 오픈 소스 LLM입니다. MPT-7B의 동일은 LlaMA의 성능과 동일하며, MPT-30B는 GPT-3보다 성능이 뛰어납니다. 두 모델 모두 1T 토큰으로 훈련됩니다.
  • Google AI에서 출시한 FLAN-T5는 1,800개 이상의 다양한 작업을 처리할 수 있습니다.
  • Hugging Face의 StarCoder(ibm.com 외부 링크)는 GitHub의 허용 코드로 훈련된 오픈 소스 LLM 코딩 어시스턴트입니다.
  • RedPajama-Incite(ibm.com 외부 링크)는 Apache-2에 따라 라이선싱되었으며, Together가 몬트리올 대학교 및 스탠포드 파운데이션 모델 연구 센터를 비롯한 다양한 기관의 리더와 함께 개발한 69억 매개변수 규모의 사전 학습 언어 모델입니다.
  • Cerebras의 Cerebras-GPT(ibm.com 외부 링크)는 1억 1,100만 개~130억 개에 달하는 매개변수가 있는 7개의 GPT 모델로 구성된 제품군입니다.
  • StableLM은 AI 이미지 생성기 Stable Diffusion을 만든 Stability AI의 오픈 소스 LLM입니다. 'The Pile'이라는 1조 5천억 개의 토큰이 포함된 데이터 세트를 이용하여 훈련되었으며, Alpaca, GPT4All(GPT-J, MPT 및 LlaMa를 기반으로 다양한 모델 제공), Dolly, ShareGPT 및 HH의 오픈 소스 데이터 세트를 함께 활용하여 미세 조정되었습니다.

대규모 언어 모델과 관련된 위험

LLM 아웃풋은 유창하고 권위 있는 것처럼 들리지만 '할루시네이션'에 기반한 정보를 제공하거나 편향, 동의 또는 보안 문제를 포함할 위험이 있을 수 있습니다. 이러한 위험에 대한 교육은 데이터 및 AI의 문제에 대한 해결책 중 하나입니다.

  • 할루시네이션이나 거짓은 LLM이 불완전하거나 모순되거나 부정확한 데이터로 훈련되거나 의미를 이해하지 못한 채 문맥을 기반으로 다음 정확한 단어를 예측하기 때문에 발생할 수 있습니다.
  • 편향은 데이터 소스가 다양하지 않거나 대표성이 없을 때 발생합니다.
  • 동의는 훈련 데이터가 책임을 가지고 수집되었는지 여부를 의미하며, 이는 법률 및 규정을 준수하고 사람들이 피드백을 통합할 수 있는 방법을 제공하는 AI 거버넌스 프로세스를 따른다는 것을 의미합니다.
  • 보안 문제에는 PII 유출, 피싱 및 스팸과 같은 악의적인 작업에 LLM을 사용하는 사이버 범죄자, 원래의 프로그래밍을 변경하는 해커 등이 포함될 수 있습니다.

 

 

오픈 소스 대규모 언어 모델과 IBM

AI 모델, 특히 LLM은 향후 10년 동안 가장 혁신적인 기술 중 하나가 될 것입니다. 새로운 AI 규정이 AI 사용에 관한 지침을 강제함에 따라 AI 모델을 관리하고 통제하는 것뿐만 아니라 AI에 입력되는 데이터를 관리하는 것도 중요합니다.

IBM은 조직이 이러한 요구 사항을 해결하고 AI의 영향력을 확대할 수 있도록 기업용 AI 및 데이터 플랫폼인 watsonx를 제공합니다. 이와 함께 watsonx는 조직에 다음과 같은 기능을 제공합니다.

  • watsonx.ai를 사용하여 비즈니스 전반에서 AI를 훈련, 조정 및 배포합니다.
  • watsonx.data를 사용하여 어디서나 모든 데이터에 대해 AI 작업 부하를 확장할 수 있습니다.
  • watsonx.governance를 통해 책임감 있고 투명하며 설명 가능한 데이터 및 AI 워크플로를 활성화합니다.

IBM watsonx Assistant 대화형 검색 기능은 사전 구축된 통합, 로우코드 통합 프레임워크(ibm.com 외부 링크) 및 노코드 작성 경험을 기반으로 구축됩니다. 개발자와 비즈니스 사용자 모두 대화형 검색을 통해 질문에 대한 답변을 자동화하여 더 높은 가치의 트랜잭션 흐름과 가상 어시스턴트와 통합된 디지털 경험을 구축할 수 있습니다.

watsonx Assistant는 대화형 검색 외에도 IBM 연구 및 watsonx와 지속적으로 협력하여 분류, 추론, 정보 추출, 요약 및 기타 대화형 사용 사례를 전문으로 하는 맞춤형 watsonx LLM을 개발하고 있습니다. Watsonx Assistant는 대규모 언어 모델을 사용하여 고객을 이해하는 능력을 크게 향상했습니다.

 

작성자

IBM Data and AI Team

관련 솔루션
파운데이션 모델

watsonx 포트폴리오의 IBM 파운데이션 모델 라이브러리에 대해 자세히 알아보고 비즈니스를 위한 생성형 AI를 자신 있게 확장하세요.

watsonx.ai에 대해 알아보기
인공 지능 솔루션

업계 최고의 AI 전문성과 솔루션 포트폴리오를 보유한 IBM과 함께 AI를 비즈니스에 활용하세요.

AI 솔루션 살펴보기
AI 컨설팅 및 서비스

AI 추가를 통해 중요한 워크플로와 운영을 혁신함으로써 경험, 실시간 의사 결정 및 비즈니스 가치를 극대화합니다.

AI 서비스 살펴보기
다음 단계 안내

IBM watsonx 포트폴리오의 IBM 파운데이션 모델 라이브러리에 대해 자세히 알아보고 비즈니스를 위한 생성형 AI를 자신 있게 확장하세요.

watsonx.ai 살펴보기 AI 솔루션 살펴보기