Granite

개방적이고 성능이 뛰어나며 신뢰할 수 있는 비즈니스용 AI 모델입니다.

색채 그라데이션으로 겹겹이 쌓인 기하학적 도형의 일러스트
IBM Granite 4.0: 차세대 Granite 모델
확장 가능한 엔터프라이즈급 AI 도입을 위해 설계된 효율적인 모델을 통해 비용을 절감하고 워크로드 속도를 높이세요.
자세히 보기

Granite 소개

엔터프라이즈 워크로드, 비용 효율성, 유연한 배포에 최적화된 맞춤형 오픈 소스 모델을 통해 AI를 더 빠르게 구축하고 확장하세요.

오픈형
Apache 2.0의 오픈 소스인 Granite는 투명성을 보장하는 동시에 모든 인프라에서 완전히 맞춤형 가능한 기능과 배포 유연성을 제공합니다.
고성능
필수 엔터프라이즈 작업의 효율성과 확장성을 극대화하도록 설계된 소형의 고성능 모델입니다
신뢰성
훈련 데이터 및 프로세스에 대한 투명성, 피해 탐지 기능 및 내장된 가드레일을 통해 '블랙박스' AI의 위험을 제거합니다.

Granite 4.0 소개

모델 소개

Granite 4.0 Nano
컴퓨팅 및 연결이 제한된 경량, 로컬 및 엣지 AI 작업
Granite 4.0 Micro & Tiny
속도, 비용, 효율성이 최우선 순위인 대량의 낮은 복잡성 작업
Granite 4.0 Small
프런티어 모델 비용 없이 더 강력한 성능을 필요로 하는 기업 워크플로

숫자로 보기

70%+
메모리 요구 사항 감소
2배
추론 속도 증가
Granite-Docling: 문서 변환을 위한 초소형 모델
IBM® Granite-Doclying은 레이아웃을 완전히 보존하면서 문서를 기계가 읽을 수 있는 형식으로 변환하는 매우 효율적인 오픈 소스 모델입니다.
자세히 보기

Granite 소형 모델 제품군

소규모 언어 모델(SLM)

RAG 및 에이전트 워크플로에 최적화된 추론 기능이 포함된 핵심 언어 모델입니다.

임베딩

시맨틱 검색, RAG 및 맥락적 멀티턴 정보 검색을 위한 고품질 텍스트 임베딩을 생성하는 모델입니다.

문서 변환

레이아웃, 테이블, 수식을 보존하면서 문서를 구조화되고 기계가 읽을 수 있는 형식으로 변환하는 초소형 비전 언어 모델입니다.

비전

문서 및 이미지 이해를 위한 효율적인 비전 언어 모델로, OCR, 차트 분석 및 엔터프라이즈 콘텐츠 추출을 지원합니다.

음성

7개 언어에 걸친 전사 및 번역을 위한 경량 음성 언어 모델로, 강력한 정확성과 효율성을 제공합니다.

시계열

빠르고 정확한 시계열 예측을 위해 사전 학습된 경량 모델로, 하드웨어 환경 전반에서 효율적으로 배포할 수 있도록 최적화되어 있습니다.

가드레일

가드레일 모델은 할루시네이션, 편향, 유해 콘텐츠, 탈옥을 탐지하여 워크플로 전반에 걸쳐 안전한 엔터프라이즈 AI 배포를 보장합니다.

지리공간

지구 관측을 위한 NASA-IBM 모델로, 대규모 위성 데이터를 활용하여 바이오매스, 기후, 지표 온도 및 홍수를 예측합니다.

성능 및 효율성

Granite 4.0은 효율성을 높이도록 설계되었으며, 더 적은 메모리를 사용하여 더 빠른 속도와 뛰어난 성능을 제공합니다. 이러한 균형을 통해 기업은 중요한 워크로드에서 비용을 절감하고 솔루션을 더 빠르게 확장할 수 있습니다.

Granite 4.0 RAM 요구 사항 원형 차트

Granite 4.0 모델은 적은 자원으로 더 많은 작업을 수행할 수 있도록 설계되었습니다. 유사한 모델보다 70% 이상 적은 메모리 사용량을 통해 조직은 보다 저렴한 하드웨어에서 강력한 AI를 실행할 수 있습니다. 즉, 인프라 비용을 절감하고, 성능을 향상하고, 비즈니스 전반에서 AI를 더 쉽게 확장할 수 있습니다.

Granite 4.0 처리량 선 그래프

Granite 4.0은 워크로드가 확장됨에 따라 일관되게 높은 처리량을 제공하므로, 다른 모델의 속도가 느려지더라도 더 큰 배치 크기를 쉽게 처리할 수 있습니다. 이를 통해 기업은 많은 사용자 또는 복잡한 작업을 한 번에 처리해야 하는 애플리케이션의 성능을 안정적으로 유지할 수 있습니다.

Granite 4.0 일반 성능 산점도 그래프

Granite 4.0은 작은 크기에도 불구하고 경쟁 모델보다 훨씬 낮은 메모리를 요구하고 더 강력한 정확도를 제공합니다. 이러한 효율성은 비용 절감, 접근성 향상, 그리고 엔터프라이즈 AI를 더 광범위하고 유연하게 배포할 수 있는 능력으로 이어집니다.

Granite 4.0 RAG 점수
Granite 4.0은 RAG 작업에서 비슷한 크기 또는 더 큰 개방형 모델 모두에서 더 뛰어난 성능을 발휘합니다. 추가 인프라 없이도 더 높은 정확도를 제공하는 Granite는 기업이 배포를 효율적이고 비용 효율적으로 유지하면서 보다 안정적인 지식 기반 애플리케이션을 구축할 수 있도록 지원합니다.
Granite 4.0 IFEval 리더보드 막대형 차트

Granite 4.0는 개방형 모델 중에서 업계 최고의 명령 준수 성능을 보여주는데, 이러한 기능은 에이전틱 워크플로에 필수적입니다. Granite는 강력한 정확도와 작은 크기 간의 균형을 유지함으로써 대규모 개방형 모델보다 더 낮은 인프라 비용으로 복잡한 작업을 위한 고품질 아웃풋을 기업에 제공합니다.

Granite 4.0 RAM 요구 사항 원형 차트

Granite 4.0 모델은 적은 자원으로 더 많은 작업을 수행할 수 있도록 설계되었습니다. 유사한 모델보다 70% 이상 적은 메모리 사용량을 통해 조직은 보다 저렴한 하드웨어에서 강력한 AI를 실행할 수 있습니다. 즉, 인프라 비용을 절감하고, 성능을 향상하고, 비즈니스 전반에서 AI를 더 쉽게 확장할 수 있습니다.

Granite 4.0 처리량 선 그래프

Granite 4.0은 워크로드가 확장됨에 따라 일관되게 높은 처리량을 제공하므로, 다른 모델의 속도가 느려지더라도 더 큰 배치 크기를 쉽게 처리할 수 있습니다. 이를 통해 기업은 많은 사용자 또는 복잡한 작업을 한 번에 처리해야 하는 애플리케이션의 성능을 안정적으로 유지할 수 있습니다.

Granite 4.0 일반 성능 산점도 그래프

Granite 4.0은 작은 크기에도 불구하고 경쟁 모델보다 훨씬 낮은 메모리를 요구하고 더 강력한 정확도를 제공합니다. 이러한 효율성은 비용 절감, 접근성 향상, 그리고 엔터프라이즈 AI를 더 광범위하고 유연하게 배포할 수 있는 능력으로 이어집니다.

Granite 4.0 RAG 점수
Granite 4.0은 RAG 작업에서 비슷한 크기 또는 더 큰 개방형 모델 모두에서 더 뛰어난 성능을 발휘합니다. 추가 인프라 없이도 더 높은 정확도를 제공하는 Granite는 기업이 배포를 효율적이고 비용 효율적으로 유지하면서 보다 안정적인 지식 기반 애플리케이션을 구축할 수 있도록 지원합니다.
Granite 4.0 IFEval 리더보드 막대형 차트

Granite 4.0는 개방형 모델 중에서 업계 최고의 명령 준수 성능을 보여주는데, 이러한 기능은 에이전틱 워크플로에 필수적입니다. Granite는 강력한 정확도와 작은 크기 간의 균형을 유지함으로써 대규모 개방형 모델보다 더 낮은 인프라 비용으로 복잡한 작업을 위한 고품질 아웃풋을 기업에 제공합니다.

개발자를 위한 Granite

레시피: 문서 요약

IBM Granite로 문서 요약기를 구축하여 컨텍스트 창 제한을 넘어 문서를 처리하세요.

RAG 및 LangChain

Granite로 RAG 파이프라인을 구축하여 외부 지식 베이스를 사용하여 쿼리에 응답하세요.

레시피: 멀티모달 RAG

Granite 및 Docling으로 멀티모달 RAG 파이프라인을 구축하여 텍스트, 테이블 및 이미지를 쿼리하세요.

가이드: 오픈 소스 모델

오픈 소스 LLM이 자율성을 지원하고, 비용을 절감하고, 개발자의 평가, 조정 및 배포를 지원하는 방법을 알아보세요.

튜토리얼: 시계열 예측

Granite 시계열 모델을 사용하여 제로샷 및 미세 조정된 시계열 예측을 수행하세요.

튜토리얼: 음성 번역

자동 음성 인식(ASR) 기능을 사용하여 Granite 및 watsonx.ai로 팟캐스트 대본을 생성하세요.

튜토리얼: 로컬 AI 코파일럿

IBM® Granite Code, Ollama, Continu를 사용하여 로컬 AI 코파일럿을 구축하세요.

전체 granite 설명서 보기

전체 granite 설명서 보기

Granite로 구축하기

Granite 모델은 많은 IBM 제품 및 서비스의 기반이 되는 AI를 구동합니다. 코드 생성, 애플리케이션 개발, 모델 테스트를 위한 즉시 사용 가능한 솔루션을 찾아보세요. 모두 IBM Granite에 의해 구동됩니다.

AI 뉴스 최신 정보 받기

블로그 | Granite 3.2: 새로운 추론 및 멀티모달 기능

최신 Granite 모델은 새로운 추론 기능, 비전 지원 모델, 향상된 효율성을 통해 더 낮은 비용으로 경쟁력 있는 결과를 제공합니다

팟캐스트 | DeepSeek: 사실 vs 과장, 모델 증류, 오픈소스 경쟁

Mixture of Experts 40화에서 패널은 DeepSeek R1에 대한 오해를 해소하고 모델 증류를 설명하며 오픈소스 경쟁 환경을 분석합니다.

AI Think 뉴스레터 | AI 인사이트 받아보기

엄선된 AI 주제, 트렌드 및 연구를 이메일로 직접 받아보세요.

기사 | DeepSeek의 AI, 소형 모델의 가능성을 보여주다

DeepSeek-R1은 수학 및 코딩 작업의 특정 AI 벤치마크에서 OpenAI의 o1과 동일한 성능을 발휘하는 디지털 어시스턴트로, 훨씬 적은 수의 칩으로 학습되었으며 약 96% 더 저렴하다고 회사 측은 설명합니다.

IBM은 엔터프라이즈 전반을 책임감 있게 혁신하는 AI 모델 생성, 배포 및 활용이 가능하다고 믿습니다. IBM watsonx AI와 데이터 플랫폼은 파운데이션 모델과 생성형 AI를 구축하고 테스트하기 위한 엔드투엔드 프로세스를 갖추었습니다. IBM에서 개발한 모델의 경우, 모델 학습 전에 중복을 찾아 제거하고 URL 차단 목록, 유해한 콘텐츠 배제 및 문서 품질 관리를 위한 필터, 문장 분할, 토큰화 기법을 모두 적용합니다.

데이터 학습 과정에서는 모델 아웃풋의 오정렬을 방지하고 감독형 미세 조정을 활용하여 더 면밀한 지침 준수를 가능하게 함으로써 프롬프트 엔지니어링을 통해 엔터프라이즈 작업을 완료하는 데 모델을 사용할 수 있도록 합니다. 기타 모달 기능(Modality), 산업별 콘텐츠, 학습용 데이터 주석 추가 등 다양한 방향으로 Granite 모델의 개발을 이어 나가고 있으며, 동시에 IBM이 개발한 모델에 대해 정기적이고 지속적인 보호장치를 배포하고 있습니다. 

생성형 AI 기술 환경이 급속히 변화하는 만큼 엔드투엔드 프로세스 또한 지속적으로 진화하고 개선되어야 합니다. IBM은 IBM 하드웨어 및 소프트웨어 제품에 제공하는 것과 유사하게 IBM에서 개발한 모델에 표준 계약 지적 재산권 배상을 제공합니다. 이는 IBM이 파운데이션 모델의 개발과 테스트에 투입하는 막대한 노력의 증명입니다.

더 나아가 IBM은 일부 대형 언어 모델 제공자와 달리 고객이 IBM에서 개발한 모델을 사용할 때 IBM에 배상하도록 요구하지 않습니다. 이는 IBM의 배상에 관한 표준 접근법에 부합하는 것입니다. 또한 IBM은 자사의 배상 의무에 대한 접근법에 부합하도록 IBM에서 개발한 모델의 배상 책임에 한도를 적용하지 않습니다.

현재 이러한 보호가 적용되는 watsonx 모델은 다음과 같습니다.

(1) Slate 인코더 전용 모델 제품군

(2) Granite 디코더 전용 모델 제품군

Granite 모델 라이선싱에 대해 자세히 알아보기

* How smaller, industry-tailored AI models can offer greater benefits 
https://www.ft.com/partnercontent/ibm/how-smaller-industry-tailored-ai-models-can-offer-greater-benefits.html

1IBM Research에서 학술 벤치마크 및 엔터프라이즈 벤치마크 모두에서 주요 개방형 모델과 비교하여 수행한 Granite 모델의 성능 - https://ibm.com/new/ibm-granite-3-0-open-state-of-the-art-enterprise-models