비즈니스에 가장 적합한 IBM Granite, 오픈 소스 또는 서드파티 모델을 선택하여 온프레미스 또는 클라우드에 배포하세요.
특정 사용 사례, 예산 고려 사항, 지역별 관심사 및 위험 프로필에 가장 적합한 모델을 선택하세요.
비즈니스용으로 맞춤 설계된 개방적이고 성능이 뛰어나며 신뢰할 수 있는 IBM Granite 제품군은 안전성을 저하하지 않으면서도 경쟁력 있는 가격으로 탁월한 성능을 제공합니다.
Llama 모델은 광범위한 자연어 작업에서 다양성과 강력한 성능을 발휘하도록 설계된 개방적이고 효율적인 대규모 언어 모델입니다.
Mistral 모델은 모듈화를 위해 설계되고 텍스트 생성, 추론 및 다국어 애플리케이션에 최적화된 빠르고 성능이 뛰어난 개방형 가중치 언어 모델입니다.
다른 제공 업체의 여러 파운데이션 모델을 watsonx.ai에서 사용할 수 있습니다.
고유한 데이터로 강력한 AI 모델을 학습시키면 어떻게 될까요? AI를 통해 더 나은 고객 경험과 더 빠른 가치를 제공할 수 있습니다. 이러한 사례를 살펴보고 방법을 알아보세요.
윔블던은 왓슨X.AI 파운데이션 모델을 사용해 AI를 학습시켜 테니스 해설을 제작했습니다.
The Recording Academy는 IBM watsonx의 AI Stories를 활용하여 GRAMMY 후보자를 중심으로 에디토리얼 콘텐츠를 생성하고 확장했습니다.
The Masters는 watsonx.ai를 사용하여 전문가의 의견과 결합된 AI 기반 홀 인사이트를 디지털 플랫폼에 제공합니다.
AddAI.Life는 watsonx.ai를 사용하여 엄선된 오픈 소스 대규모 언어 모델에 액세스하여 고품질의 가상 어시스턴트를 구축하고 있습니다.
granite-3-3-8b-instruct
IBM
추론 및 계획, 질문과 답변(Q&A), 중간 자동 완성, 요약, 분류, 생성, 추출, RAG 및 코딩 작업을 지원합니다.
128k
0.20
granite-3-2-8b-instruct
IBM
추론 및 계획, Q&A, 요약, 분류, 생성, 추출, RAG 및 코딩 작업을 지원합니다.
128k
0.20
granite-vision-3-2-2b
IBM
차트, 그래프 및 인포그래픽 분석을 위한 이미지-텍스트 변환 사용 사례와 컨텍스트 Q&A를 지원합니다.
16,384
0.10
granite-3-2b-instruct (v3.1)
IBM
Q&A, 요약, 분류, 생성, 추출, RAG 및 코딩 작업을 지원합니다.
128k
0.10
granite-3-8b-instruct (v3.1)
IBM
Q&A, 요약, 분류, 생성, 추출, RAG 및 코딩 작업을 지원합니다.
128k
0.20
granite-guardian-3-8b (v3.1)
IBM
HAP/ 또는 PII, 탈옥, 편향, 폭력 및 기타 유해한 콘텐츠 감지를 지원합니다.
128k
0.20
granite-guardian-3-2b (v3.1)
IBM
HAP/ 또는 PII, 탈옥, 편향, 폭력 및 기타 유해한 콘텐츠 감지를 지원합니다.
128k
0.10
granite-13b-instruct
IBM
Q&A, 요약, 분류, 생성, 추출 및 RAG 작업을 지원합니다.
8192
0.60
granite-8b-code-instruct
IBM
자연어 프롬프트에서 코드를 생성하고, 설명하고 번역하여 코드를 위한 작업별 모델 제공.
128k
0.60
granite-20b-multilingual
IBM
프랑스어, 독일어, 포르투갈어, 스페인어 및 영어로 Q&A, 요약, 분류, 생성, 추출, 번역 및 RAG 작업을 지원합니다.
8192
0.60
granite-34b-code-instruct
IBM
자연어 프롬프트에서 코드를 생성하고, 설명하고 번역하여 코드를 위한 작업별 모델 제공.
8192
0.60
granite-20b-code-instruct
IBM
자연어 프롬프트에서 코드를 생성하고, 설명하고 번역하여 코드를 위한 작업별 모델 제공.
8192
0.60
granite-3b-code-instruct
IBM
자연어 프롬프트에서 코드를 생성하고, 설명하고 번역하여 코드를 위한 작업별 모델 제공.
128k
0.60
granite-8b-japanese
IBM
일본어로 Q&A, 요약, 분류, 생성, 추출, 번역 및 RAG 작업을 지원합니다.
4096
0.60
* 표시된 가격은 참고용으로서 국가별로 다를 수 있고, 관련 세금 및 관세가 제외된 가격이며, 지역별로 제공되는 제품에 따라 달라질 수 있습니다.
llama-4-scout-17b-16e-instruct
Meta
멀티모달 추론, 긴 컨텍스트 처리(10M 토큰), 코드 생성 및 분석, 다국어 작업(200개 언어 지원), STEM 및 논리적 추론을 지원합니다.
128k
무료 미리보기
llama-4-maverick-17b-128e-instruct-fp8
Meta
멀티모달 추론, 긴 컨텍스트 처리(10M 토큰), 코드 생성 및 분석, 다국어 작업(200개 언어 지원), STEM 및 논리적 추론을 지원합니다.
128k
입력: 0.35 / 아웃풋: 1.40
llama-3-3-70b-instruct
Meta
영어, 독일어, 프랑스어, 이탈리아어, 포르투갈어, 힌디어, 스페인어 및 태국어로 Q&A, 요약, 생성, 코딩, 분류, 추출, 번역 및 RAG 작업을 지원합니다.
128k
0.71
llama-3-2-90b-vision-instruct
Meta
이미지 캡션, 필기를 포함한 이미지-텍스트 전사(OCR), 데이터 추출 및 처리, 컨텍스트 Q&A 및 개체 식별을 지원합니다.
128k
2.00
llama-3-2-11b-vision-instruct
Meta
이미지 캡션, 필기를 포함한 이미지-텍스트 전사(OCR), 데이터 추출 및 처리, 컨텍스트 Q&A 및 개체 식별을 지원합니다.
128k
0.35
llama-guard-3-11b-vision
Meta
이미지 필터링, HAP 또는 PII 탐지 및 유해 콘텐츠 필터링을 지원합니다.
128k
0.35
llama-3-2-1b-instruct
Meta
영어, 독일어, 프랑스어, 이탈리아어, 포르투갈어, 힌디어, 스페인어 및 태국어로 Q&A, 요약, 생성, 코딩, 분류, 추출, 번역 및 RAG 작업을 지원합니다.
128k
0.10
llama-3-2-3b-instruct
Meta
영어, 독일어, 프랑스어, 이탈리아어, 포르투갈어, 힌디어, 스페인어 및 태국어로 Q&A, 요약, 생성, 코딩, 분류, 추출, 번역 및 RAG 작업을 지원합니다.
128k
0.15
llama-3-405b-instruct
Meta
영어, 독일어, 프랑스어, 이탈리아어, 포르투갈어, 힌디어, 스페인어 및 태국어로 Q&A, 요약, 생성, 코딩, 분류, 추출, 번역 및 RAG 작업을 지원합니다. |
128k
입력: 5.00/아웃풋: 16.00
llama-3-1-70b-instruct
Meta
영어, 독일어, 프랑스어, 이탈리아어, 포르투갈어, 힌디어, 스페인어 및 태국어로 Q&A, 요약, 생성, 코딩, 분류, 추출, 번역 및 RAG 작업을 지원합니다.
128k
1.80
llama-3-1-8b-instruct
Meta
영어, 독일어, 프랑스어, 이탈리아어, 포르투갈어, 힌디어, 스페인어 및 태국어로 Q&A, 요약, 생성, 코딩, 분류, 추출, 번역 및 RAG 작업을 지원합니다.
128k
0.60
llama-3-70b-instruct
Meta
RAG, 생성, 요약, 분류, Q&A, 추출, 번역 및 코드 생성 작업 지원.
8192
1.80
codellama-34b-instruct
Meta
자연어 프롬프트에서 코드를 생성하고 번역하여 코드를 위한 작업별 모델 제공.
16384
1.80
* 표시된 가격은 참고용으로서 국가별로 다를 수 있고, 관련 세금 및 관세가 제외된 가격이며, 지역별로 제공되는 제품에 따라 달라질 수 있습니다.
mistral-medium-2505
Mistral AI
코딩, 이미지 캡션, 이미지-텍스트 전사, 함수 호출, 데이터 추출 및 처리, 컨텍스트 Q&A, 수학적 추론 지원
128k
입력: 3.00/아웃풋: 10.00
mistral-small-3-1-24b-instruct-2503
Mistral AI
이미지 캡션, 이미지-텍스트 전사, 함수 호출, 데이터 추출 및 처리, 컨텍스트 Q&A, 개체 식별 지원
128k
입력: 0.10 / 아웃풋: 0.30
pixtral-12b
Mistral AI
이미지 캡션, 필기를 포함한 이미지-텍스트 전사(OCR), 데이터 추출 및 처리, 컨텍스트 Q&A 및 개체 식별을 지원합니다.
128k
0.35
mistral-large-2
Mistral AI
프랑스어, 독일어, 이탈리아어, 스페인어 및 영어로 Q&A, 요약, 생성, 코딩, 분류, 추출, 번역 및 RAG 작업 지원.
128k*
입력: 3.00/아웃풋: 10.00
Mistral-Small-24B-Instruct-2501
Mistral AI
수십 개 언어로 언어 작업, 에이전틱 워크플로, RAG 등을 지원하며 빠른 응답 시간을 보장합니다.
32768
0.35
mixtral-8x7b-instruct
Mistral AI
Q&A, 요약, 분류, 생성, 추출, RAG 및 코드 생성 작업을 지원합니다.
32768
0.60
* 표시된 가격은 참고용으로서 국가별로 다를 수 있고, 관련 세금 및 관세가 제외된 가격이며, 지역별로 제공되는 제품에 따라 달라질 수 있습니다.
allam-1-13b-instruct
SDAIA
아랍어로 Q&A, 요약, 분류, 생성, 추출, RAG 및 번역을 지원합니다.
4096
1.80
jais-13b-chat (Arabic)
core42
아랍어로 Q&A, 요약, 분류, 생성, 추출 및 번역 지원.
2048
1.80
flan-t5-xl-3b
Q&A, 요약, 분류, 생성, 추출 및 RAG 작업을 지원합니다. 프롬프트 조정 가능
4096
0.60
flan-t5-xxl-11b
Q&A, 요약, 분류, 생성, 추출 및 RAG 작업을 지원합니다.
4096
1.80
flan-ul2-20b
Q&A, 요약, 분류, 생성, 추출 및 RAG 작업을 지원합니다.
4096
5.00
elyza-japanese-llama-2-7b-instruct
ELYZA
Q&A, 요약, RAG, 분류, 생성, 추출 및 번역 작업을 지원합니다.
4096
1.80
* 표시된 가격은 참고용으로서 국가별로 다를 수 있고, 관련 세금 및 관세가 제외된 가격이며, 지역별로 제공되는 제품에 따라 달라질 수 있습니다.
IBM watsonx.ai에 배포되었으며 IBM이 개발하고 오픈 소스로 제공하는 임베딩 모델을 사용해 보세요. 이러한 모델은 검색 증강 생성, 시맨틱 검색 및 문서 비교 작업에 사용됩니다. 또는 서드파티 임베딩 모델 공급자를 선택하세요.
granite-embedding-107m-multilingual
IBM
검색 증강 생성, 시맨틱 검색 및 문서 비교 작업.
512
0.10
granite-embedding-278m-multilingual
IBM
검색 증강 생성, 시맨틱 검색 및 문서 비교 작업.
512
0.10
slate-125m-english-rtrvr-v2
IBM
검색 증강 생성, 시맨틱 검색 및 문서 비교 작업.
512
0.10
slate-125m-english-rtrvr
IBM
검색 증강 생성, 시맨틱 검색 및 문서 비교 작업.
512
0.10
slate-30m-english-rtrvr-v2
IBM
검색 증강 생성, 시맨틱 검색 및 문서 비교 작업.
512
0.10
slate-30m-english-rtrvr
IBM
검색 증강 생성, 시맨틱 검색 및 문서 비교 작업.
512
0.10
* 표시된 가격은 참고용으로서 국가별로 다를 수 있고, 관련 세금 및 관세가 제외된 가격이며, 지역별로 제공되는 제품에 따라 달라질 수 있습니다.
all-mini-l6-v2
Microsoft
검색 증강 생성, 시맨틱 검색 및 문서 비교 작업.
256
0.10
all-minilm-l12-v2
OS-NLP-CV
검색 증강 생성, 시맨틱 검색 및 문서 비교 작업.
256
0.10
multilingual-e5-large
Intel
검색 증강 생성, 시맨틱 검색 및 문서 비교 작업.
512
0.10
* 표시된 가격은 참고용으로서 국가별로 다를 수 있고, 관련 세금 및 관세가 제외된 가격이며, 지역별로 제공되는 제품에 따라 달라질 수 있습니다.
IBM은 기업 전반에 걸쳐 혁신을 책임감 있게 추진하는 AI 모델의 생성, 배포 및 활용이 가능하다고 믿습니다. IBM watsonx AI 포트폴리오는 파운데이션 모델과 생성형 AI를 구축하고 테스트하기 위한 엔드투엔드 프로세스를 제공합니다. IBM은 당사가 개발하는 모델을 훈련하기 전에 중복을 찾아 제거하고 URL 차단 목록, 유해한 콘텐츠 배제 및 문서 품질 관리를 위한 필터, 문장 분할, 토큰화 기법을 모두 적용합니다.
데이터 훈련 프로세스에서는 모델 결과의 불일치를 방지하기 위해 노력하며, 지도형 미세 조정을 활용하여 보다 면밀한 지침 준수를 가능하게 함으로써 모델이 프롬프트 엔지니어링을 통해 엔터프라이즈 작업 완료에 사용될 수 있도록 합니다. IBM은 기타 모달 기능(Modality), 업계별 콘텐츠, 훈련을 위한 추가적인 데이터 어노테이션 등 다양한 방향으로 Granite 모델의 개발을 이어나가고 있으며, 동시에 IBM이 개발한 모델에 대해 정기적이고 지속적인 안전 장치를 배포하고 있습니다.
생성형 AI 기술 환경이 급속히 변화하는 만큼 엔드투엔드 프로세스 또한 지속적으로 진화하고 개선되어야 합니다. IBM은 자사의 하드웨어 및 소프트웨어 제품에 제공하는 것과 유사하게 IBM에서 개발한 모델에 표준 계약 지적 재산권 배상을 제공합니다. 이는 IBM이 파운데이션 모델의 개발과 테스트에 투입하는 막대한 노력의 증명입니다.
더 나아가 IBM은 일부 대형 언어 모델 제공자와 달리 고객이 IBM에서 개발한 모델을 사용할 때 IBM에 고객의 배상을 청구하지 않습니다. 이는 IBM의 배상에 관한 표준 접근법에 부합하는 것입니다. 또한 IBM은 자사의 배상 의무에 대한 접근법에 부합하도록 IBM에서 개발한 모델의 배상 책임에 한도를 적용하지 않습니다.
현재 이러한 보호가 적용되는 watsonx 모델은 다음과 같습니다.
(1) Slate 인코더 전용 모델 제품군
(2) Granite 디코더 전용 모델 제품군
*모델 공급업체별로 지원되는 컨텍스트 길이. 단, 플랫폼의 실제 컨텍스트 길이는 제한되어 있습니다. 자세한 내용은 문서를 참조하세요.
추론은 리소스 단위 기준으로 청구됩니다. 리소스 단위 1개는 토큰 1,000개입니다. 입력 및 완료 토큰은 같은 비율로 부과됩니다. 토큰 1,000개는 보통 약 750단어입니다.
지역에 따라 일부 모델을 사용하지 못할 수 있으므로, 자세한 내용은 문서를 참조하세요.
토큰으로 표현한 컨텍스트 길이.
IBM이 제시한 계획, 방향, 의도에 대한 설명은 IBM의 단독 재량에 따라 예고 없이 변경되거나 철회될 수 있습니다. 자세한 내용은 가격 책정을 참고하세요. 소프트웨어 가격 책정에 달리 명시되지 않는 한, 모든 특징, 기능 및 잠재적 업데이트는 SaaS에만 적용됩니다. IBM은 SaaS와 소프트웨어의 특징 및 기능이 동일함을 보증하지 않습니다.