IBM Granite

개발자가 효율성을 높일 수 있도록 설계된 Granite의 더 작고 개방적인 모델로 90% 이상 비용을 절감하세요*

Granite 소개

3세대 AI 언어 모델을 만나보세요. 목적에 적합하며 오픈 소스로 제공되는 이 엔터프라이즈 지원 모델은 사이버 보안에서 RAG에 이르기까지 광범위한 엔터프라이즈 작업에서 안전 벤치마크에 대한 탁월한 성능을 제공합니다.

Granite를 선택해야 하는 이유
오픈형

Apache 2.0에서 오픈 소스로 제공되는 10억 개 미만의 매개변수에서 340억 개 매개변수에 이르기까지 적합한 모델을 선택하세요.

고성능

비용을 쫓아가다가 성능을 놓치지 마세요. Granite는 다양한 엔터프라이즈 작업에서 다른 모델1보다 우수한 성능을 발휘합니다.

신뢰성

포괄적인 위험 및 피해 탐지 기능, 투명성 및 IP 보호를 통해 책임감 있는 AI를 구축하세요.

모델

Granite 언어 모델

에이전틱 워크플로, RAG, 텍스트 요약, 텍스트 분석 및 추출, 분류, 콘텐츠 생성을 위해 설계된 새로운 추론 기능을 갖춘 기본 및 명령어 조정 언어 모델입니다.

Hugging Face에서 언어 모델 가져오기
Granite 비전 모델

문서 및 이미지 이해를 위한 비전 작업에 특화된 사전 학습 모델로, 다양한 파일 유형과 해상도를 지원하며 엔터프라이즈 환경에서 효율적으로 배포할 수 있도록 설계되었습니다.

Hugging Face에서 비전 모델 가져오기
코드용 Granite

코드 생성, 코드 설명, 코드 편집 등 코드 생성 작업을 위해 설계된 디코더 전용 모델로, 116개 프로그래밍 언어로 작성된 코드로 학습되어 있습니다.

Hugging Face에서 코드 모델 가져오기
시계열용 Granite

시계열 예측을 위해 사전 학습된 가벼운 모델로, 다양한 하드웨어 구성에서 효율적으로 실행되도록 최적화되어 있습니다.

Hugging Face에서 시계열 모델 가져오기
Granite Guardian

Granite Guardian으로 AI를 보호하고, 엔터프라이즈 데이터 보안을 보장하며, 다양한 사용자 프롬프트 및 LLM 응답에서 위험을 완화하고, 15개 이상의 안전 벤치마크에서 최고의 성능을 발휘합니다.

Hugging Face에서 Granite Guardian 사용하기
지리공간 데이터용 Granite

NASA와 IBM은 대규모 위성 및 원격 감지 데이터를 사용하여 지구 관측을 위한 AI 파운데이션 모델을 개발하기 위해 협력했습니다.

Hugging Face에서 지리공간 모델 가져오기
Granite Embedding 모델

사용자 의도에 대한 이해를 크게 향상하고 쿼리에 대한 정보 및 출처의 관련성을 높이도록 설계되었습니다.

Hugging Face에서 임베딩 모델 가져오기

벤치마크

Granite에 추론 기능을 적용한 결과 복잡한 명령어를 따르는 데 있어 성능이 크게 상승하고 일반적인 성능 및 안전 특성이 유지되는 반면, 유사한 모델은 이러한 영역에서 성능이 저하되었습니다.

더 많은 벤치마크 살펴보기
벤치마크 Granite 추론 기능

Granite-3.2-8B-Instruct

Llama 추론 기능

DeepSeek-R1-Distill-Llama-8B

Qwen 추론 기능

DeepSeek-R1-Distill-Qwen-7B

ArenaHard

Instruction Following

55.23

17.17

10.36

Alpaca-Eval-2

Instruction Following

61.16

21.85

15.35

IFEval

Instruction Following

73.57

66.50

59.10

MMLU
일반

66.93

45.80

50.72

PopQA
일반

28.08

13.25

9.94

TruthfulQA
일반

66.37

47.43

47.14

BigBenchHard

일반

65.60

65.71

65.04

DROP

일반

50.73

44.46

42.76

GSM8K

수학

83.09

72.18

78.47

HumanEval

코드

89.47

67.54

79.89

HumanEval+

코드

86.88

62.91

78.43

AttaQ

안전

85.99

42.87

42.45

* 표시된 가격은 참고용으로서 국가별로 다를 수 있고, 관련 세금 및 관세가 제외된 가격이며, 지역별로 제공되는 제품에 따라 달라질 수 있습니다. 

성공을 위한 기반 마련

"CrushBank에서는 IBM의 개방적이고 효율적인 AI 모델이 성능, 비용 효율성, 확장성 간의 균형을 제공하여 엔터프라이즈 AI에 대한 실질적인 가치를 제공하는 것을 직접 확인했습니다. Granite 3.2는 새로운 추론 기능으로 한 단계 더 나아갔으며, 새로운 에이전트 솔루션을 구축하는 데 이러한 기능을 활용할 수 있게 되어 매우 기쁩니다."

David Tan
CrushBank
CTO

US 오픈 로고

U.S. 오픈에서는 Granite 파운데이션 모델을 사용하여 수백 개의 경기에 대한 해설을 제공합니다. Granite를 활용하여 경기 보고서 생성 건수가 220% 증가했습니다.

 

자세히 알아보기
LM 및 Astris AI 로고

Lockheed Martin과 새로운 자회사인 Astris AI는 IBM의 최신 Granite 모델과 다른 고성능 오픈 소스 모델을 AI Factory 툴에 통합하여 기업 및 국가 보안 애플리케이션을 위한 AI 기반 개발을 가속화합니다.

보도 자료 읽기
ESPN 로고

초당 수천 번의 히트와 무한한 수의 사용자 지정 설정? ESPN Fantasy 앱은 1,200만 명의 팬을 대상으로 대규모 맞춤형 설명 기능이 필요했으며, Granite가 이를 해냈습니다.

방법 알아보기
Blue Pearl 로고

Blue Pearl은 Granite에 구축된 작업 매칭 엔진을 통해 데이터 처리 및 분석 시간을 65% 단축할 수 있었습니다.

자세히 보기

자습서

Granite 3.1과 Docling을 사용하여 문서 기반 질의응답 시스템을 구축하기

IBM Docling 및 오픈 소스 Granite 3.1을 사용하여 다양한 파일 유형에 대한 문서의 시각적 질의 응답 수행 가능

watsonx.ai의 Granite-3.0-8B-Instrut를 사용하여 LangChain agentic RAG 시스템을 구축하세요

질문에 답할 수 있는 AI 에이전트 구축 방법 알아보기

IBM Granite 3.0 8B Instruct를 사용한 함수 호출

이 튜토리얼에서는 이제 watsonx.ai에서 사용 가능한 IBM Granite-3.0-8B-Instruct 모델을 사용하여 사용자 지정 함수 호출을 수행할 수 있습니다.

watsonx를 사용하여 Python의 Granite-3.0-8B-Instruct 학습 후 양자화

몇 가지 다양한 방법으로 사전 훈련된 모델을 양자화하여 모델의 크기를 표시하고 작업에서 어떻게 수행되는지 비교합니다.

시계열 예측을 위한 파운데이션 모델 사용

TinyTimeMixer(TTM) Granite 모델을 통한 학습에 기반하여 미래 예측

LLM을 사용하여 텍스트에서 SQL 생성

텍스트를 구조적인 표현으로 변환하고 의미론적으로 올바는 SQL Query 생성

IBM Granite Code, Ollama, and Continu를 사용하여 로컬 AI 코파일럿 구축

긍정적인 고객 후기와 부정적인 고객 후기가 포함된 합성 데이터 세트를 사용하여 Python에서 Granite 모델 프롬프트 조정

전체 granite 설명서 보기

전체 granite 설명서 보기

Granite로 구축하기

Red Hat Enterprise Linux AI와 watsonx를 사용하여 오픈 소스 Granite 모델을 기반으로 프로덕션에서 규모에 맞는 AI를 자신 있게 배포하세요. 툴 호출, 12개 언어, 체인 추론, 멀티모달 어댑터와 같은 기능을 통해 더 빠르게 빌드 가능

AI 뉴스 최신 정보 받기

블로그 | Granite 3.2: 새로운 추론 및 멀티모달 기능

최신 Granite 모델은 새로운 추론 기능, 비전 지원 모델, 향상된 효율성을 통해 더 낮은 비용으로 경쟁력 있는 결과를 제공합니다

팟캐스트 | DeepSeek: 사실 vs 과장, 모델 증류, 오픈소스 경쟁

Mixture of Experts 40화에서 패널은 DeepSeek R1에 대한 오해를 해소하고 모델 증류를 설명하며 오픈소스 경쟁 환경을 분석합니다.

AI Think 뉴스레터 | AI 인사이트 받아보기

엄선된 AI 주제, 트렌드 및 연구를 이메일로 직접 받아보세요.

기사 | DeepSeek의 AI, 소형 모델의 가능성을 보여주다

DeepSeek-R1은 수학 및 코딩 작업의 특정 AI 벤치마크에서 OpenAI의 o1과 동일한 성능을 발휘하는 디지털 어시스턴트로, 훨씬 적은 수의 칩으로 학습되었으며 약 96% 더 저렴하다고 회사 측은 설명합니다.

IBM은 엔터프라이즈 전반을 책임감 있게 혁신하는 AI 모델 생성, 배포 및 활용이 가능하다고 믿습니다. IBM watsonx AI와 데이터 플랫폼은 파운데이션 모델과 생성형 AI를 구축하고 테스트하기 위한 엔드투엔드 프로세스를 갖추었습니다. IBM에서 개발한 모델의 경우, 모델 학습 전에 중복을 찾아 제거하고 URL 차단 목록, 유해한 콘텐츠 배제 및 문서 품질 관리를 위한 필터, 문장 분할, 토큰화 기법을 모두 적용합니다.

데이터 학습 과정에서는 모델 아웃풋의 오정렬을 방지하고 감독형 미세 조정을 활용하여 더 면밀한 지침 준수를 가능하게 함으로써 프롬프트 엔지니어링을 통해 엔터프라이즈 작업을 완료하는 데 모델을 사용할 수 있도록 합니다. 기타 모달 기능(Modality), 산업별 콘텐츠, 학습용 데이터 주석 추가 등 다양한 방향으로 Granite 모델의 개발을 이어 나가고 있으며, 동시에 IBM이 개발한 모델에 대해 정기적이고 지속적인 보호장치를 배포하고 있습니다. 

생성형 AI 기술 환경이 급속히 변화하는 만큼 엔드투엔드 프로세스 또한 지속적으로 진화하고 개선되어야 합니다. IBM은 IBM 하드웨어 및 소프트웨어 제품에 제공하는 것과 유사하게 IBM에서 개발한 모델에 표준 계약 지적 재산권 배상을 제공합니다. 이는 IBM이 파운데이션 모델의 개발과 테스트에 투입하는 막대한 노력의 증명입니다.

더 나아가 IBM은 일부 대형 언어 모델 제공자와 달리 고객이 IBM에서 개발한 모델을 사용할 때 IBM에 배상하도록 요구하지 않습니다. 이는 IBM의 배상에 관한 표준 접근법에 부합하는 것입니다. 또한 IBM은 자사의 배상 의무에 대한 접근법에 부합하도록 IBM에서 개발한 모델의 배상 책임에 한도를 적용하지 않습니다.

현재 이러한 보호가 적용되는 watsonx 모델은 다음과 같습니다.

(1) Slate 인코더 전용 모델 제품군

(2) Granite 디코더 전용 모델 제품군

Granite 모델 라이선싱에 대해 자세히 알아보기

* 더 작고 산업에 맞춤화된 AI 모델이 더 큰 이점을 제공할 수 있는 방법  
https://www.ft.com/partnercontent/ibm/how-smaller-industry-tailored-ai-models-can-offer-greater-benefits.html

1IBM Research에서 학술 벤치마크 및 엔터프라이즈 벤치마크 모두에서 주요 개방형 모델과 비교하여 수행한 Granite 모델의 성능 - https://ibm.com/new/ibm-granite-3-0-open-state-of-the-art-enterprise-models