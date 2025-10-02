Granite 4.0의 출시는 새로운 아키텍처 발전을 활용하여 비용과 지연 시간을 줄이면서 경쟁력 있는 성능을 제공하는 작고 효율적인 언어 모델을 두 배로 늘림으로써 IBM의 엔터프라이즈용 대규모 언어 모델 제품군에 새로운 시대를 열었습니다. Granite 4.0 모델은 독립형 배포로서 그리고 대규모 추론 모델 외 복잡한 시스템의 비용 효율적인 구성 요소로서 워크플로의 필수적인 작업에 특히 중점을 두고 개발되었습니다.

Granite 4.0 컬렉션은 다음과 같은 다양한 하드웨어 제약 조건에서 최적의 프로덕션을 제공하기 위해 다양한 모델 크기와 아키텍처 스타일로 구성되어 있습니다.

총 320억 개(활성 매개변수 90억 개)의 매개변수가 포함된 Mixture of Experts 하이브리드(MoE) 모델인 Granite-4.0-H-Small

총 70억 개(활성 매개변수 10억 개)의 매개변수가 포함된 하이브리드 MoE인 Granite-4.0-H-Tiny

30억 개의 매개변수가 포함된 고밀도 하이브리드 모델인 Granite-4.0-H-Micro

이 릴리스는 30억 개의 매개변수가 포함된 고밀도 모델인 Granite-4.0-Micro를 포함. 이 모델은 아직 하이브리드 아키텍처를 지원하지 않는 플랫폼과 커뮤니티를 수용하기 위해 기존의 트랜스포머 아키텍처를 갖춤

Granite 4.0-H Small은 멀티 툴 에이전트 및 고객 지원 자동화와 같은 엔터프라이즈 워크플로에서 강력하고 비용 효율적인 성능을 제공하는 핵심 모델입니다. Tiny 및 Micro 모델은 짧은 지연 시간의 엣지 및 로컬 애플리케이션용으로 설계되었으며, 대규모 에이전트 워크플로 내에서 함수 호출과 같은 주요 작업을 빠르게 실행하기 위한 빌딩 블록 역할을 할 수도 있습니다.

Granite 4.0 벤치마크 성능은 이전 세대에 비해 크게 개선되었습니다. 작은 Granite 4.0 모델조차 규모가 절반 미만임에도 불구하고 가장 Granite 3.3 8B를 크게 능가합니다. 하지만 가장 눈에 띄는 강점은 추론 효율성이 크게 향상되었다는 것입니다. 하이브리드 Granite 4.0 모델은 기존 LLM에 비해 실행에 훨씬 적은 RAM이 필요하며, 특히 컨텍스트가 긴 작업(예: 대규모 코드베이스 또는 광범위한 문서 수집)과 동시에 여러 세션이 필요한 작업(예: 사용자 문의를 동시)에서는 더욱 그렇습니다.

가장 중요한 것은 Granite 4.0의 메모리 요구 사항이 이렇게 극적으로 감소하면 높은 추론 속도로 무거운 워크로드를 실행하는 데 필요한 하드웨어 비용도 크게 절감된다는 것입니다. 당사의 목표는 기업과 오픈 소스 개발자 모두에게 경쟁이 치열한 LLM에 대해 비용 효율적인 액세스를 제공하여 진입 장벽을 낮추는 것입니다.