비즈니스에 가장 적합한 IBM Granite, 오픈 소스 또는 서드파티 모델을 선택하여 온프레미스 또는 클라우드에 배포하세요.
특정 사용 사례, 예산 고려 사항, 지역별 관심사 및 위험 프로필에 가장 적합한 모델을 선택하세요.
비즈니스용으로 맞춤 설계된 개방적이고 성능이 뛰어나며 신뢰할 수 있는 IBM Granite 제품군은 안전성을 저하하지 않으면서도 경쟁력 있는 가격으로 탁월한 성능을 제공합니다.
Llama 모델은 광범위한 자연어 작업에서 다양성과 강력한 성능을 발휘하도록 설계된 개방적이고 효율적인 대규모 언어 모델입니다.
Mistral 모델은 모듈화를 위해 설계되고 텍스트 생성, 추론 및 다국어 애플리케이션에 최적화된 빠르고 성능이 뛰어난 개방형 가중치 언어 모델입니다.
다른 제공 업체의 여러 파운데이션 모델을 watsonx.ai에서 사용할 수 있습니다.
고유한 데이터로 강력한 AI 모델을 학습시키면 어떻게 될까요? AI를 통해 더 나은 고객 경험과 더 빠른 가치를 제공할 수 있습니다. 이러한 사례를 살펴보고 방법을 알아보세요.
윔블던은 왓슨X.AI 파운데이션 모델을 사용해 AI를 학습시켜 테니스 해설을 제작했습니다.
The Recording Academy는 IBM watsonx의 AI Stories를 활용하여 GRAMMY 후보자를 중심으로 에디토리얼 콘텐츠를 생성하고 확장했습니다.
The Masters는 watsonx.ai를 사용하여 전문가의 의견과 결합된 AI 기반 홀 인사이트를 디지털 플랫폼에 제공합니다.
AddAI.Life는 watsonx.ai를 사용하여 엄선된 오픈 소스 대규모 언어 모델에 액세스하여 고품질의 가상 어시스턴트를 구축하고 있습니다.
gpt-oss-120b
OpenAI
프라이빗 온프레미스 또는 엣지 배포, 추론 워크플로, 툴 사용(예: 검색, 코드 실행), 사용자 지정 가능한 생각의 연결고리, 구조화된 아웃풋, 조정 가능한 추론 활동
128K
0.15 토큰 입력
0.60 토큰 아웃풋
granite-3-3-8b-instruct
IBM
추론 및 계획, 질문과 답변(Q&A), 중간 자동 완성, 요약, 분류, 생성, 추출, RAG 및 코딩 작업을 지원합니다.
128k
0.20
granite-3-2-8b-instruct
IBM
추론 및 계획, Q&A, 요약, 분류, 생성, 추출, RAG 및 코딩 작업을 지원합니다.
128k
0.20
granite-vision-3-2-2b
IBM
차트, 그래프 및 인포그래픽 분석을 위한 이미지-텍스트 변환 사용 사례와 컨텍스트 Q&A를 지원합니다.
16,384
0.10
granite-3-2b-instruct (v3.1)
IBM
Q&A, 요약, 분류, 생성, 추출, RAG 및 코딩 작업을 지원합니다.
128k
0.10
granite-3-8b-instruct (v3.1)
IBM
Q&A, 요약, 분류, 생성, 추출, RAG 및 코딩 작업을 지원합니다.
128k
0.20
granite-guardian-3-8b (v3.1)
IBM
HAP/ 또는 PII, 탈옥, 편향, 폭력 및 기타 유해한 콘텐츠 감지를 지원합니다.
128k
0.20
granite-guardian-3-2b (v3.1)
IBM
HAP/ 또는 PII, 탈옥, 편향, 폭력 및 기타 유해한 콘텐츠 감지를 지원합니다.
128k
0.10
granite-13b-instruct
IBM
Q&A, 요약, 분류, 생성, 추출 및 RAG 작업을 지원합니다.
8192
0.60
granite-8b-code-instruct
IBM
자연어 프롬프트에서 코드를 생성하고, 설명하고 번역하여 코드를 위한 작업별 모델 제공.
128k
0.60
granite-8b-japanese
IBM
일본어로 Q&A, 요약, 분류, 생성, 추출, 번역 및 RAG 작업을 지원합니다.
4096
0.60
* 표시된 가격은 참고용으로서 국가별로 다를 수 있고, 관련 세금 및 관세가 제외된 가격이며, 지역별로 제공되는 제품에 따라 달라질 수 있습니다.
llama-4-scout-17b-16e-instruct
Meta
멀티모달 추론, 긴 컨텍스트 처리(10M 토큰), 코드 생성 및 분석, 다국어 작업(200개 언어 지원), STEM 및 논리적 추론을 지원합니다.
128k
무료 미리보기
llama-4-maverick-17b-128e-instruct-fp8
Meta
멀티모달 추론, 긴 컨텍스트 처리(10M 토큰), 코드 생성 및 분석, 다국어 작업(200개 언어 지원), STEM 및 논리적 추론을 지원합니다.
128k
입력: 0.35 / 아웃풋: 1.40
llama-3-3-70b-instruct
Meta
영어, 독일어, 프랑스어, 이탈리아어, 포르투갈어, 힌디어, 스페인어 및 태국어로 Q&A, 요약, 생성, 코딩, 분류, 추출, 번역 및 RAG 작업을 지원합니다.
128k
0.71
llama-3-2-90b-vision-instruct
Meta
이미지 캡션, 필기를 포함한 이미지-텍스트 전사(OCR), 데이터 추출 및 처리, 컨텍스트 Q&A 및 개체 식별을 지원합니다.
128k
2.00
llama-3-2-11b-vision-instruct
Meta
이미지 캡션, 필기를 포함한 이미지-텍스트 전사(OCR), 데이터 추출 및 처리, 컨텍스트 Q&A 및 개체 식별을 지원합니다.
128k
0.35
llama-guard-3-11b-vision
Meta
이미지 필터링, HAP 또는 PII 탐지 및 유해 콘텐츠 필터링을 지원합니다.
128k
0.35
llama-3-2-1b-instruct
Meta
영어, 독일어, 프랑스어, 이탈리아어, 포르투갈어, 힌디어, 스페인어 및 태국어로 Q&A, 요약, 생성, 코딩, 분류, 추출, 번역 및 RAG 작업을 지원합니다.
128k
0.10
llama-3-2-3b-instruct
Meta
영어, 독일어, 프랑스어, 이탈리아어, 포르투갈어, 힌디어, 스페인어 및 태국어로 Q&A, 요약, 생성, 코딩, 분류, 추출, 번역 및 RAG 작업을 지원합니다.
128k
0.15
llama-3-405b-instruct
Meta
영어, 독일어, 프랑스어, 이탈리아어, 포르투갈어, 힌디어, 스페인어 및 태국어로 Q&A, 요약, 생성, 코딩, 분류, 추출, 번역 및 RAG 작업을 지원합니다. |
128k
입력: 5.00/아웃풋: 16.00
* 표시된 가격은 참고용으로서 국가별로 다를 수 있고, 관련 세금 및 관세가 제외된 가격이며, 지역별로 제공되는 제품에 따라 달라질 수 있습니다.
mistral-medium-2505
Mistral AI
코딩, 이미지 캡션, 이미지-텍스트 전사, 함수 호출, 데이터 추출 및 처리, 컨텍스트 Q&A, 수학적 추론 지원
128k
입력: 3.00/아웃풋: 10.00
mistral-small-3-1-24b-instruct-2503
Mistral AI
이미지 캡션, 이미지-텍스트 전사, 함수 호출, 데이터 추출 및 처리, 컨텍스트 Q&A, 개체 식별 지원
128k
입력: 0.10 / 아웃풋: 0.30
pixtral-12b
Mistral AI
이미지 캡션, 필기를 포함한 이미지-텍스트 전사(OCR), 데이터 추출 및 처리, 컨텍스트 Q&A 및 개체 식별을 지원합니다.
128k
0.35
mistral-large-2
Mistral AI
프랑스어, 독일어, 이탈리아어, 스페인어 및 영어로 Q&A, 요약, 생성, 코딩, 분류, 추출, 번역 및 RAG 작업 지원.
128k*
입력: 3.00/아웃풋: 10.00
* 표시된 가격은 참고용으로서 국가별로 다를 수 있고, 관련 세금 및 관세가 제외된 가격이며, 지역별로 제공되는 제품에 따라 달라질 수 있습니다.
allam-1-13b-instruct
SDAIA
아랍어로 Q&A, 요약, 분류, 생성, 추출, RAG 및 번역을 지원합니다.
4096
1.80
jais-13b-chat (Arabic)
core42
아랍어로 Q&A, 요약, 분류, 생성, 추출 및 번역 지원.
2048
1.80
flan-t5-xl-3b
Q&A, 요약, 분류, 생성, 추출 및 RAG 작업을 지원합니다. 프롬프트 조정 가능
4096
0.60
flan-t5-xxl-11b
Q&A, 요약, 분류, 생성, 추출 및 RAG 작업을 지원합니다.
4096
1.80
flan-ul2-20b
Q&A, 요약, 분류, 생성, 추출 및 RAG 작업을 지원합니다.
4096
5.00
elyza-japanese-llama-2-7b-instruct
ELYZA
Q&A, 요약, RAG, 분류, 생성, 추출 및 번역 작업을 지원합니다.
4096
1.80
* 표시된 가격은 참고용으로서 국가별로 다를 수 있고, 관련 세금 및 관세가 제외된 가격이며, 지역별로 제공되는 제품에 따라 달라질 수 있습니다.
IBM watsonx.ai에 배포되었으며 IBM이 개발하고 오픈 소스로 제공하는 임베딩 모델을 사용해 보세요. 이러한 모델은 검색 증강 생성, 시맨틱 검색 및 문서 비교 작업에 사용됩니다. 또는 서드파티 임베딩 모델 공급자를 선택하세요.
granite-embedding-107m-multilingual
IBM
검색 증강 생성, 시맨틱 검색 및 문서 비교 작업.
512
0.10
granite-embedding-278m-multilingual
IBM
검색 증강 생성, 시맨틱 검색 및 문서 비교 작업.
512
0.10
slate-125m-english-rtrvr-v2
IBM
검색 증강 생성, 시맨틱 검색 및 문서 비교 작업.
512
0.10
slate-125m-english-rtrvr
IBM
검색 증강 생성, 시맨틱 검색 및 문서 비교 작업.
512
0.10
slate-30m-english-rtrvr-v2
IBM
검색 증강 생성, 시맨틱 검색 및 문서 비교 작업.
512
0.10
slate-30m-english-rtrvr
IBM
검색 증강 생성, 시맨틱 검색 및 문서 비교 작업.
512
0.10
* 표시된 가격은 참고용으로서 국가별로 다를 수 있고, 관련 세금 및 관세가 제외된 가격이며, 지역별로 제공되는 제품에 따라 달라질 수 있습니다.
all-mini-l6-v2
Microsoft
검색 증강 생성, 시맨틱 검색 및 문서 비교 작업.
256
0.10
all-minilm-l12-v2
OS-NLP-CV
검색 증강 생성, 시맨틱 검색 및 문서 비교 작업.
256
0.10
multilingual-e5-large
Intel
검색 증강 생성, 시맨틱 검색 및 문서 비교 작업.
512
0.10
* 표시된 가격은 참고용으로서 국가별로 다를 수 있고, 관련 세금 및 관세가 제외된 가격이며, 지역별로 제공되는 제품에 따라 달라질 수 있습니다.
* 모델 공급업체별로 지원되는 컨텍스트 길이. 단, 플랫폼의 실제 컨텍스트 길이는 제한되어 있습니다. 자세한 내용은 문서를 참조하세요.
추론은 리소스 단위 기준으로 청구됩니다. 리소스 단위 1개는 토큰 1,000개입니다. 입력 및 완료 토큰은 같은 비율로 부과됩니다. 토큰 1,000개는 보통 약 750단어입니다.
지역에 따라 일부 모델을 사용하지 못할 수 있으므로, 자세한 내용은 문서를 참조하세요.
토큰으로 표현한 컨텍스트 길이.
IBM이 제시한 계획, 방향, 의도에 대한 설명은 IBM의 단독 재량에 따라 예고 없이 변경되거나 철회될 수 있습니다. 자세한 내용은 가격 책정을 참고하세요. 소프트웨어 가격 책정에 달리 명시되지 않는 한, 모든 특징, 기능 및 잠재적 업데이트는 SaaS에만 적용됩니다. IBM은 SaaS와 소프트웨어의 특징 및 기능이 동일함을 보증하지 않습니다.