Apache 2.0에서 오픈 소스로 제공되는 10억 개 미만의 매개변수에서 340억 개 매개변수에 이르기까지 적합한 모델을 선택하세요.
비용을 쫓아가다가 성능을 놓치지 마세요. Granite는 다양한 엔터프라이즈 작업에서 다른 모델1보다 우수한 성능을 발휘합니다.
포괄적인 위험 및 피해 탐지 기능, 투명성 및 IP 보호를 통해 책임감 있는 AI를 구축하세요.
에이전틱 워크플로, RAG, 텍스트 요약, 텍스트 분석 및 추출, 분류, 콘텐츠 생성을 위해 설계된 새로운 추론 기능을 갖춘 기본 및 명령어 조정 언어 모델입니다.
문서 및 이미지 이해를 위한 비전 작업에 특화된 사전 학습 모델로, 다양한 파일 유형과 해상도를 지원하며 엔터프라이즈 환경에서 효율적으로 배포할 수 있도록 설계되었습니다.
코드 생성, 코드 설명, 코드 편집 등 코드 생성 작업을 위해 설계된 디코더 전용 모델로, 116개 프로그래밍 언어로 작성된 코드로 학습되어 있습니다.
시계열 예측을 위해 사전 학습된 가벼운 모델로, 다양한 하드웨어 구성에서 효율적으로 실행되도록 최적화되어 있습니다.
Granite Guardian으로 AI를 보호하고, 엔터프라이즈 데이터 보안을 보장하며, 다양한 사용자 프롬프트 및 LLM 응답에서 위험을 완화하고, 15개 이상의 안전 벤치마크에서 최고의 성능을 발휘합니다.
NASA와 IBM은 대규모 위성 및 원격 감지 데이터를 사용하여 지구 관측을 위한 AI 파운데이션 모델을 개발하기 위해 협력했습니다.
사용자 의도에 대한 이해를 크게 향상하고 쿼리에 대한 정보 및 출처의 관련성을 높이도록 설계되었습니다.
Granite에 추론 기능을 적용한 결과 복잡한 명령어를 따르는 데 있어 성능이 크게 상승하고 일반적인 성능 및 안전 특성이 유지되는 반면, 유사한 모델은 이러한 영역에서 성능이 저하되었습니다.
Granite-3.2-8B-Instruct
DeepSeek-R1-Distill-Llama-8B
DeepSeek-R1-Distill-Qwen-7B
ArenaHard
55.23
| 17.17 |
10.36
Alpaca-Eval-2
61.16
21.85
15.35
IFEval
73.57
66.50
59.10
| MMLU |
66.93
45.80
50.72
| PopQA |
28.08
13.25
9.94
| TruthfulQA |
66.37
47.43
47.14
BigBenchHard
65.60
65.71
65.04
DROP
50.73
44.46
42.76
GSM8K
83.09
72.18
78.47
HumanEval
89.47
67.54
79.89
HumanEval+
86.88
62.91
78.43
AttaQ
85.99
42.87
42.45
* 표시된 가격은 참고용으로서 국가별로 다를 수 있고, 관련 세금 및 관세가 제외된 가격이며, 지역별로 제공되는 제품에 따라 달라질 수 있습니다.
"CrushBank에서는 IBM의 개방적이고 효율적인 AI 모델이 성능, 비용 효율성, 확장성 간의 균형을 제공하여 엔터프라이즈 AI에 대한 실질적인 가치를 제공하는 것을 직접 확인했습니다. Granite 3.2는 새로운 추론 기능으로 한 단계 더 나아갔으며, 새로운 에이전트 솔루션을 구축하는 데 이러한 기능을 활용할 수 있게 되어 매우 기쁩니다."
David Tan
CrushBank
CTO
IBM Docling 및 오픈 소스 Granite 3.1을 사용하여 다양한 파일 유형에 대한 문서의 시각적 질의 응답 수행 가능
질문에 답할 수 있는 AI 에이전트 구축 방법 알아보기
이 튜토리얼에서는 이제 watsonx.ai에서 사용 가능한 IBM Granite-3.0-8B-Instruct 모델을 사용하여 사용자 지정 함수 호출을 수행할 수 있습니다.
몇 가지 다양한 방법으로 사전 훈련된 모델을 양자화하여 모델의 크기를 표시하고 작업에서 어떻게 수행되는지 비교합니다.
TinyTimeMixer(TTM) Granite 모델을 통한 학습에 기반하여 미래 예측
텍스트를 구조적인 표현으로 변환하고 의미론적으로 올바는 SQL Query 생성
긍정적인 고객 후기와 부정적인 고객 후기가 포함된 합성 데이터 세트를 사용하여 Python에서 Granite 모델 프롬프트 조정
전체 granite 설명서 보기
Red Hat Enterprise Linux AI와 watsonx를 사용하여 오픈 소스 Granite 모델을 기반으로 프로덕션에서 규모에 맞는 AI를 자신 있게 배포하세요. 툴 호출, 12개 언어, 체인 추론, 멀티모달 어댑터와 같은 기능을 통해 더 빠르게 빌드 가능
최신 Granite 모델은 새로운 추론 기능, 비전 지원 모델, 향상된 효율성을 통해 더 낮은 비용으로 경쟁력 있는 결과를 제공합니다
Mixture of Experts 40화에서 패널은 DeepSeek R1에 대한 오해를 해소하고 모델 증류를 설명하며 오픈소스 경쟁 환경을 분석합니다.
엄선된 AI 주제, 트렌드 및 연구를 이메일로 직접 받아보세요.
DeepSeek-R1은 수학 및 코딩 작업의 특정 AI 벤치마크에서 OpenAI의 o1과 동일한 성능을 발휘하는 디지털 어시스턴트로, 훨씬 적은 수의 칩으로 학습되었으며 약 96% 더 저렴하다고 회사 측은 설명합니다.
IBM은 엔터프라이즈 전반을 책임감 있게 혁신하는 AI 모델 생성, 배포 및 활용이 가능하다고 믿습니다. IBM watsonx AI와 데이터 플랫폼은 파운데이션 모델과 생성형 AI를 구축하고 테스트하기 위한 엔드투엔드 프로세스를 갖추었습니다. IBM에서 개발한 모델의 경우, 모델 학습 전에 중복을 찾아 제거하고 URL 차단 목록, 유해한 콘텐츠 배제 및 문서 품질 관리를 위한 필터, 문장 분할, 토큰화 기법을 모두 적용합니다.
데이터 학습 과정에서는 모델 아웃풋의 오정렬을 방지하고 감독형 미세 조정을 활용하여 더 면밀한 지침 준수를 가능하게 함으로써 프롬프트 엔지니어링을 통해 엔터프라이즈 작업을 완료하는 데 모델을 사용할 수 있도록 합니다. 기타 모달 기능(Modality), 산업별 콘텐츠, 학습용 데이터 주석 추가 등 다양한 방향으로 Granite 모델의 개발을 이어 나가고 있으며, 동시에 IBM이 개발한 모델에 대해 정기적이고 지속적인 보호장치를 배포하고 있습니다.
생성형 AI 기술 환경이 급속히 변화하는 만큼 엔드투엔드 프로세스 또한 지속적으로 진화하고 개선되어야 합니다. IBM은 IBM 하드웨어 및 소프트웨어 제품에 제공하는 것과 유사하게 IBM에서 개발한 모델에 표준 계약 지적 재산권 배상을 제공합니다. 이는 IBM이 파운데이션 모델의 개발과 테스트에 투입하는 막대한 노력의 증명입니다.
더 나아가 IBM은 일부 대형 언어 모델 제공자와 달리 고객이 IBM에서 개발한 모델을 사용할 때 IBM에 배상하도록 요구하지 않습니다. 이는 IBM의 배상에 관한 표준 접근법에 부합하는 것입니다. 또한 IBM은 자사의 배상 의무에 대한 접근법에 부합하도록 IBM에서 개발한 모델의 배상 책임에 한도를 적용하지 않습니다.
현재 이러한 보호가 적용되는 watsonx 모델은 다음과 같습니다.
(1) Slate 인코더 전용 모델 제품군
(2) Granite 디코더 전용 모델 제품군
* 더 작고 산업에 맞춤화된 AI 모델이 더 큰 이점을 제공할 수 있는 방법
https://www.ft.com/partnercontent/ibm/how-smaller-industry-tailored-ai-models-can-offer-greater-benefits.html
1IBM Research에서 학술 벤치마크 및 엔터프라이즈 벤치마크 모두에서 주요 개방형 모델과 비교하여 수행한 Granite 모델의 성능 - https://ibm.com/new/ibm-granite-3-0-open-state-of-the-art-enterprise-models