유연한 모델 선택으로 생성형 AI 확장

현대적인 도서관 공간의 큰 창가에 앉아 노트북으로 작업하는 한 남성.

이 블로그 시리즈에서는 비즈니스 및 기술 리더를 위해 엔터프라이즈 생성형 AI(gen AI)에 대해 쉽게 이해할 수 있도록 설명합니다. 또한 혁신적인 인공 지능(AI)을 향한 여정에 도움이 되는 간단한 프레임워크와 기본 원칙을 알아봅니다. 이전 블로그에서는 엔터프라이즈급 모델을 제공하기 위한 IBM의 차별화된 접근 방식에 대해 설명했습니다. 이 블로그에서는 파운데이션 모델 선택이 중요한 이유와 파운데이션 모델을 통해 기업이 자신 있게 생성형 AI를 확장할 수 있도록 지원하는 방법에 대해 알아봅니다.

모델 선택이 중요한 이유는 무엇인가요?

생성형 AI의 역동적인 세계에서는 획일적인 접근 방식은 부적절합니다. 기업이 AI의 힘을 활용하기 위해 노력함에 따라 다음을 위해서는 다양한 모델을 자유롭게 선택할 수 있어야 합니다.

  • 혁신 촉진: 다양한 모델을 통해 다양한 문제를 해결할 수 있는 고유한 강점을 제공하여 혁신을 촉진할 뿐만 아니라 팀이 변화하는 비즈니스 요구 사항과 고객 기대에 적응할 수 있도록 지원합니다.
  • 경쟁 우위를 위한 맞춤 설정: 다양한 모델을 통해 기업은 틈새 시장 요구 사항에 맞게 AI 애플리케이션을 맞춤화하여 경쟁 우위를 확보할 수 있습니다. 생성형 AI는 질문에 답변하는 애플리케이션이든 빠른 요약을 생성하기 위한 코드 작성이든, 특정 작업에 맞게 미세 조정할 수 있습니다.
  • 시장 출시 기간 단축: 오늘날과 같이 빠르게 변화하는 비즈니스 환경에서는 시간이 가장 중요합니다. 다양한 모델 포트폴리오를 통해 개발 프로세스를 가속화하여 기업이 AI 기반 제품을 신속하게 도입할 수 있습니다. 이는 최신 혁신에 대한 접근이 중요한 경쟁 우위를 제공하는 생성형 AI에서 특히 중요합니다.
  • 변화에 유연하게 대처: 시장 상황과 비즈니스 전략은 끊임없이 진화합니다. 다양한 모델 선택으로 기업은 빠르고 효과적으로 전환할 수 있습니다. 다양한 옵션에 액세스하면 새로운 트렌드나 전략적 변화가 발생했을 때 신속하게 적응하여 민첩성과 복원력을 유지할 수 있습니다.
  • 사용 사례 전반에 걸쳐 비용 최적화: 모델마다 비용에 미치는 영향은 다양합니다. 다양한 모델에 액세스함으로써 기업은 각 애플리케이션에 가장 비용 효율적인 옵션을 선택할 수 있습니다. 일부 작업에는 고가의 정밀도가 필요한 경우도 있지만, 품질 저하 없이 보다 저렴한 대안으로 해결할 수 있는 작업도 있습니다. 예를 들어 고객 관리 분야에서는 정확도보다 처리량과 지연 시간이 더 중요할 수 있지만, 리소스 및 개발 분야에서는 정확도가 더 중요할 수 있습니다.
  • 위험 완화: 단일 모델이나 제한된 선택에 의존하는 것은 위험할 수 있습니다. 다양한 모델 포트폴리오는 집중 위험을 완화하여 기업이 특정 접근 방식의 단점이나 실패에 대한 탄력성을 유지할 수 있도록 도와줍니다. 이 전략을 통해 위험을 분산하고 문제가 발생할 경우 대체 솔루션을 제공할 수 있습니다.
  • 규정 준수: AI에 대한 규제 환경은 윤리적 고려 사항을 최우선으로 하여 계속 진화하고 있습니다. 모델에 따라 공정성, 개인정보 보호 및 규정 준수에 미치는 영향은 다양할 수 있습니다. 폭넓은 선택권을 통해 기업은 이 복잡한 지형을 탐색하고 법적 및 윤리적 기준을 충족하는 모델을 선택할 수 있습니다.

올바른 AI 모델 선택

이제 모델 선택의 중요성을 이해했으니, 특정 사용 사례에 적합한 모델을 선택할 때 발생하는 선택 과부하 문제를 어떻게 해결할 수 있을까요? 이 복잡한 문제를 지금 바로 적용할 수 있는 간단한 단계로 세분화할 수 있습니다.

  1. 명확한 사용 사례 파악: 비즈니스 애플리케이션의 특정 요구 사항 및 요구 사항을 결정합니다. 이것은 모델이 목표에 밀접하게 부합하도록 업계 및 비즈니스의 미묘한 차이를 고려한 상세한 프롬프트를 작성하는 것을 포함합니다.
  2. 모든 모델 옵션 나열: 크기, 정확도, 지연 시간 및 관련 위험을 기반으로 다양한 모델을 평가합니다. 여기에는 정확도, 지연 시간 및 처리량 간의 절충점과 같은 각 모델의 강점과 약점을 이해하는 것이 포함됩니다.
  3. 모델 속성 평가: 모델의 규모가 성능 및 관련 위험에 미치는 영향을 고려하여 모델 크기가 요구 사항에 비해 적절한지 평가합니다. 이 단계에서는 더 큰 것이 반드시 더 좋은 것은 아니기 때문에 사용 사례에 맞게 모델의 크기를 최적으로 조정하는 데 중점을 둡니다. 더 작은 모델은 타겟 도메인 및 사용 사례에서 더 큰 모델보다 더 나은 성능을 발휘할 수 있습니다.
  4. 모델 옵션 테스트: 테스트를 수행하여 실제 시나리오를 모방한 조건에서 모델이 예상대로 작동하는지 확인합니다. 이는 학술 벤치마크와 도메인별 데이터 세트를 사용하여 아웃풋 품질을 평가하고, 예를 들어 프롬프트 엔지니어링이나 모델 튜닝을 통해 모델을 조정하여 성능을 최적화하는 것을 포함합니다.
  5. 비용과 배포 요구사항에 따라 선택 범위를 구체화: 테스트 후에는 투자 수익률, 비용 효율성, 기존 시스템 및 인프라 내에서 모델을 배포할 때의 실용성 등의 요소를 고려하여 선택을 구체화합니다. 지연 시간 단축 또는 투명성 향상과 같은 다른 이점에 따라 선택 사항을 조정하세요.
  6. 가장 큰 가치를 제공하는 모델 선택: 사용 사례의 특정 요구 사항에 맞게 성능, 비용 및 관련 위험 간에 최적의 균형을 제공하는 AI 모델을 최종적으로 선택합니다.

IBM® watsonx 모델 라이브러리

이미지와 같이 IBM watsonx 라이브러리는 다중 모델 전략을 추구하여 독점, 오픈 소스 및 타사 모델을 제공합니다.

2024년 5월 8일 기준 watsonx 파운데이션 모델 목록. 2024년 5월 8일 기준 watsonx 파운데이션 모델 목록.

이를 통해 고객에게 다양한 선택권을 제공하여 고유한 비즈니스, 지역 및 위험 선호도에 가장 적합한 모델을 선택할 수 있습니다.

또한 watsonx를 사용하면 고객이 하이브리드, 멀티클라우드 및 온프레미스 옵션을 사용하여 원하는 인프라에 모델을 배포하여 벤더 종속을 방지하고 총 소유 비용을 줄일 수 있습니다.

IBM Granite: 엔터프라이즈급 파운데이션 모델에서 IBM

파운데이션 모델의 특성은 3가지 주요 속성으로 그룹화할 수 있습니다. 조직은 하나의 속성을 지나치게 강조하면 다른 속성도 손상될 수 있다는 것을 이해해야 합니다. 조직의 특정 요구 사항에 맞게 모델을 맞춤화하려면 이러한 속성의 균형을 맞추는 것이 중요합니다.

  1. 신뢰받는 모델: 명확하고 설명 가능하며 해가 없는 모델.
  2. 성능: 대상 비즈니스 도메인 및 사용 사례에 적합한 성능 수준.
  3. 비용 효율성: 총 소유 비용을 낮추고 위험을 줄여서 생성형 AI를 제공하는 모델.

IBM® Granite는 IBM® Research에서 개발한 엔터프라이즈급 플래그십 모델 시리즈입니다. 이러한 모델은 신뢰와 안정성에 중점을 두고 이러한 속성을 최적으로 조합하여 기업이 생성형 AI 이니셔티브에서 성공할 수 있도록 지원합니다. 기업은 신뢰할 수 없는 파운데이션 모델로는 생성형 AI를 확장할 수 없다는 점을 기억하세요.

IBM watsonx는 엄격한 개선 프로세스를 거친 엔터프라이즈급 AI 모델을 제공합니다. 이 프로세스는 IBM 연구가 주도하는 모델 혁신으로 시작되며, 여기에는 데이터 투명성을 증진하기 위해 IBM AI 윤리 강령에 따른 기업 관련 콘텐츠에 대한 공개 협업 및 교육이 포함됩니다.

IBM Research는 기업에서 사용하는 데 필수적인 능력을 갖춘 IBM에서 개발한 오픈 소스 모델과 선별된 오픈 소스 모델을 모두 향상시키는 명령 조정 기법을 개발했습니다. 학술적 벤치마크 외에도 'FM_EVAL' 데이터 세트는 실제 엔터프라이즈 AI 애플리케이션을 시뮬레이션합니다. 이 파이프라인의 가장 강력한 모델은 IBM watsonx.ai에서 확인할 수 있습니다, 이미지와 같이 고객에게 신뢰할 수 있는 엔터프라이즈급 생성형 AI 파운데이션 모델을 제공합니다.

엔터프라이즈급 생성형 AI 파운데이션 모델

최신 모델 발표:

  • Granite 코드 모델: 116개의 프로그래밍 언어로 학습되고 30억 개에서 340억 개의 매개변수 크기에 이르는 모델 제품군으로, 기본 모델과 명령을 따르는 모델 변형 모두에서 사용할 수 있습니다.
  • Granite-7b-lab: 범용 작업을 지원하며, 새로운 기술과 지식을 통합하기 위해 IBM의 대규모 챗봇 정렬(LAB) 방법론을 사용하여 조정됩니다.

새로운 watsonx.ai 채팅 데모를 통해 watsonx의 엔터프라이즈급 파운데이션 모델을 사용해 보세요. 단순하고 직관적인 채팅 인터페이스를 통해 요약, 콘텐츠 생성 및 문서 처리 기능을 살펴보세요.