파운데이션 모델 - IBM watsonx.ai

필요한 모델 선택

비즈니스에 가장 적합한 IBM Granite, 오픈 소스 또는 서드파티 모델을 선택하여 온프레미스 또는 클라우드에 배포하세요.

IBM의 AI 모델에 대한 POV

적절한 파운데이션 모델 선택

새로운 기능

Granite 3.3은 이제 Watsonx 파운데이션 모델 라이브러리에서 사용할 수 있습니다.

이제 watsonx.ai에서 Mistral Medium 3 사용 가능

새로운 모델 기능

이제 watsonx.ai에서 Meta Llama 4 Maverick 및 Llama 4 Scout 사용 가능

새로운 모델 기능

음성-텍스트 변환 기능과 향상된 언어 모델 성능을 보유한 새로운 Granite 3.3 모델

새로운 모델 기능

파운데이션 모델 라이브러리

특정 사용 사례, 예산 고려 사항, 지역별 관심사 및 위험 프로필에 가장 적합한 모델을 선택하세요.

임베딩 모델 라이브러리 보기

IBM 모델

비즈니스용으로 맞춤 설계된 개방적이고 성능이 뛰어나며 신뢰할 수 있는 IBM Granite 제품군은 안전성을 저하하지 않으면서도 경쟁력 있는 가격으로 탁월한 성능을 제공합니다.

IBM 모델 라이브러리 보기

Granite 자세히 보기

Meta Llama 모델

Llama 모델은 광범위한 자연어 작업에서 다양성과 강력한 성능을 발휘하도록 설계된 개방적이고 효율적인 대규모 언어 모델입니다.

Meta 모델 라이브러리 보기

IBM 파트너십에 대해 더 알아보기

Mistral AI 모델

Mistral 모델은 모듈화를 위해 설계되고 텍스트 생성, 추론 및 다국어 애플리케이션에 최적화된 빠르고 성능이 뛰어난 개방형 가중치 언어 모델입니다.

Mistral 모델 라이브러리 보기

기타 서드파티 모델 제공 업체

다른 제공 업체의 여러 파운데이션 모델을 watsonx.ai에서 사용할 수 있습니다.

모델 라이브러리 보기

클라이언트 사례

고유한 데이터로 강력한 AI 모델을 학습시키면 어떻게 될까요? AI를 통해 더 나은 고객 경험과 더 빠른 가치를 제공할 수 있습니다. 이러한 사례를 살펴보고 방법을 알아보세요.

윔블던

윔블던은 왓슨X.AI 파운데이션 모델을 사용해 AI를 학습시켜 테니스 해설을 제작했습니다.

사례 연구 읽기

The Recording Academy

The Recording Academy는 IBM watsonx의 AI Stories를 활용하여 GRAMMY 후보자를 중심으로 에디토리얼 콘텐츠를 생성하고 확장했습니다.

공지 사항 읽기

The Masters

The Masters는 watsonx.ai를 사용하여 전문가의 의견과 결합된 AI 기반 홀 인사이트를 디지털 플랫폼에 제공합니다.

공지 사항 읽기

AddAI.Life

AddAI.Life는 watsonx.ai를 사용하여 엄선된 오픈 소스 대규모 언어 모델에 액세스하여 고품질의 가상 어시스턴트를 구축하고 있습니다.

사례 연구 읽기

IBM 파운데이션 모델

Granite 모델 학습 방법 보기(PDF)

Granite 자세히 보기

모델명

제공자

사용 사례

컨텍스트 길이

가격

USD/1백만 토큰*

gpt-oss-120b

OpenAI

프라이빗 온프레미스 또는 엣지 배포, 추론 워크플로, 툴 사용(예: 검색, 코드 실행), 사용자 지정 가능한 생각의 연결고리, 구조화된 아웃풋, 조정 가능한 추론 활동

128K

0.15 토큰 입력
0.60 토큰 아웃풋

granite-3-3-8b-instruct

신규

주요 모델

IBM

추론 및 계획, 질문과 답변(Q&A), 중간 자동 완성, 요약, 분류, 생성, 추출, RAG 및 코딩 작업을 지원합니다.

128k

0.20

granite-3-2-8b-instruct

IBM

추론 및 계획, Q&A, 요약, 분류, 생성, 추출, RAG 및 코딩 작업을 지원합니다.

128k

0.20

granite-vision-3-2-2b

IBM

차트, 그래프 및 인포그래픽 분석을 위한 이미지-텍스트 변환 사용 사례와 컨텍스트 Q&A를 지원합니다.

16,384

0.10

granite-3-2b-instruct (v3.1)

IBM

Q&A, 요약, 분류, 생성, 추출, RAG 및 코딩 작업을 지원합니다.

128k

0.10

granite-3-8b-instruct (v3.1)

주요 모델

IBM

Q&A, 요약, 분류, 생성, 추출, RAG 및 코딩 작업을 지원합니다.

128k

0.20

granite-guardian-3-8b (v3.1)

IBM

HAP/ 또는 PII, 탈옥, 편향, 폭력 및 기타 유해한 콘텐츠 감지를 지원합니다.

128k

0.20

granite-guardian-3-2b (v3.1)

지원 중단

IBM

HAP/ 또는 PII, 탈옥, 편향, 폭력 및 기타 유해한 콘텐츠 감지를 지원합니다.

128k

0.10

granite-13b-instruct

지원 중단

IBM

Q&A, 요약, 분류, 생성, 추출 및 RAG 작업을 지원합니다.

8192

0.60

granite-8b-code-instruct

IBM

자연어 프롬프트에서 코드를 생성하고, 설명하고 번역하여 코드를 위한 작업별 모델 제공.

128k

0.60

granite-8b-japanese

지원 중단

IBM

일본어로 Q&A, 요약, 분류, 생성, 추출, 번역 및 RAG 작업을 지원합니다.

4096

0.60

* 표시된 가격은 참고용으로서 국가별로 다를 수 있고, 관련 세금 및 관세가 제외된 가격이며, 지역별로 제공되는 제품에 따라 달라질 수 있습니다.

메타 모델

IBM 파트너십에 대해 더 알아보기

모델명

제공자

사용 사례

컨텍스트 길이

가격

USD/1백만 토큰*

llama-4-scout-17b-16e-instruct

신규

Meta

멀티모달 추론, 긴 컨텍스트 처리(10M 토큰), 코드 생성 및 분석, 다국어 작업(200개 언어 지원), STEM 및 논리적 추론을 지원합니다.

128k

무료 미리보기

llama-4-maverick-17b-128e-instruct-fp8

신규

Meta

멀티모달 추론, 긴 컨텍스트 처리(10M 토큰), 코드 생성 및 분석, 다국어 작업(200개 언어 지원), STEM 및 논리적 추론을 지원합니다.

128k

입력: 0.35 / 아웃풋: 1.40

llama-3-3-70b-instruct

Meta

영어, 독일어, 프랑스어, 이탈리아어, 포르투갈어, 힌디어, 스페인어 및 태국어로 Q&A, 요약, 생성, 코딩, 분류, 추출, 번역 및 RAG 작업을 지원합니다.

128k

0.71

llama-3-2-90b-vision-instruct

Meta

이미지 캡션, 필기를 포함한 이미지-텍스트 전사(OCR), 데이터 추출 및 처리, 컨텍스트 Q&A 및 개체 식별을 지원합니다.

128k

2.00

llama-3-2-11b-vision-instruct

Meta

이미지 캡션, 필기를 포함한 이미지-텍스트 전사(OCR), 데이터 추출 및 처리, 컨텍스트 Q&A 및 개체 식별을 지원합니다.

128k

0.35

llama-guard-3-11b-vision

Meta

이미지 필터링, HAP 또는 PII 탐지 및 유해 콘텐츠 필터링을 지원합니다.

128k

0.35

llama-3-2-1b-instruct

Meta

영어, 독일어, 프랑스어, 이탈리아어, 포르투갈어, 힌디어, 스페인어 및 태국어로 Q&A, 요약, 생성, 코딩, 분류, 추출, 번역 및 RAG 작업을 지원합니다.

128k

0.10

llama-3-2-3b-instruct

Meta

영어, 독일어, 프랑스어, 이탈리아어, 포르투갈어, 힌디어, 스페인어 및 태국어로 Q&A, 요약, 생성, 코딩, 분류, 추출, 번역 및 RAG 작업을 지원합니다.

128k

0.15

llama-3-405b-instruct

Meta

영어, 독일어, 프랑스어, 이탈리아어, 포르투갈어, 힌디어, 스페인어 및 태국어로 Q&A, 요약, 생성, 코딩, 분류, 추출, 번역 및 RAG 작업을 지원합니다.

128k

입력: 5.00/아웃풋: 16.00

* 표시된 가격은 참고용으로서 국가별로 다를 수 있고, 관련 세금 및 관세가 제외된 가격이며, 지역별로 제공되는 제품에 따라 달라질 수 있습니다.

Mistral 모델

모델명

제공자

사용 사례

컨텍스트 길이

가격

USD/1백만 토큰*

mistral-medium-2505

신규

Mistral AI

코딩, 이미지 캡션, 이미지-텍스트 전사, 함수 호출, 데이터 추출 및 처리, 컨텍스트 Q&A, 수학적 추론 지원

128k

입력: 3.00/아웃풋: 10.00

mistral-small-3-1-24b-instruct-2503

신규

Mistral AI

이미지 캡션, 이미지-텍스트 전사, 함수 호출, 데이터 추출 및 처리, 컨텍스트 Q&A, 개체 식별 지원

128k

입력: 0.10 / 아웃풋: 0.30

pixtral-12b

지원 중단

Mistral AI

이미지 캡션, 필기를 포함한 이미지-텍스트 전사(OCR), 데이터 추출 및 처리, 컨텍스트 Q&A 및 개체 식별을 지원합니다.

128k

0.35

mistral-large-2

지원 중단

Mistral AI

프랑스어, 독일어, 이탈리아어, 스페인어 및 영어로 Q&A, 요약, 생성, 코딩, 분류, 추출, 번역 및 RAG 작업 지원.

128k*

입력: 3.00/아웃풋: 10.00

* 표시된 가격은 참고용으로서 국가별로 다를 수 있고, 관련 세금 및 관세가 제외된 가격이며, 지역별로 제공되는 제품에 따라 달라질 수 있습니다.

서드파티 파운데이션 모델

모델명

제공자

사용 사례

컨텍스트 길이

가격

USD/1백만 토큰*

allam-1-13b-instruct

SDAIA

아랍어로 Q&A, 요약, 분류, 생성, 추출, RAG 및 번역을 지원합니다.

4096

1.80

jais-13b-chat (Arabic)

core42

아랍어로 Q&A, 요약, 분류, 생성, 추출 및 번역 지원.

2048

1.80

flan-t5-xl-3b

지원 중단

Google

Q&A, 요약, 분류, 생성, 추출 및 RAG 작업을 지원합니다. 프롬프트 조정 가능

4096

0.60

flan-t5-xxl-11b

지원 중단

Google

Q&A, 요약, 분류, 생성, 추출 및 RAG 작업을 지원합니다.

4096

1.80

flan-ul2-20b

지원 중단

Google

Q&A, 요약, 분류, 생성, 추출 및 RAG 작업을 지원합니다.

4096

5.00

elyza-japanese-llama-2-7b-instruct

지원 중단

ELYZA

Q&A, 요약, RAG, 분류, 생성, 추출 및 번역 작업을 지원합니다.

4096

1.80

* 표시된 가격은 참고용으로서 국가별로 다를 수 있고, 관련 세금 및 관세가 제외된 가격이며, 지역별로 제공되는 제품에 따라 달라질 수 있습니다.

임베딩 모델 라이브러리

IBM watsonx.ai에 배포되었으며 IBM이 개발하고 오픈 소스로 제공하는 임베딩 모델을 사용해 보세요. 이러한 모델은 검색 증강 생성, 시맨틱 검색 및 문서 비교 작업에 사용됩니다. 또는 서드파티 임베딩 모델 공급자를 선택하세요.

IBM 임베딩 모델

모델명

제공자

사용 사례

컨텍스트 길이

가격

USD/1백만 토큰*

granite-embedding-107m-multilingual

신규

IBM

검색 증강 생성, 시맨틱 검색 및 문서 비교 작업.

512

0.10

granite-embedding-278m-multilingual

IBM

검색 증강 생성, 시맨틱 검색 및 문서 비교 작업.

512

0.10

slate-125m-english-rtrvr-v2

IBM

검색 증강 생성, 시맨틱 검색 및 문서 비교 작업.

512

0.10

slate-125m-english-rtrvr

IBM

검색 증강 생성, 시맨틱 검색 및 문서 비교 작업.

512

0.10

slate-30m-english-rtrvr-v2

IBM

검색 증강 생성, 시맨틱 검색 및 문서 비교 작업.

512

0.10

slate-30m-english-rtrvr

IBM

검색 증강 생성, 시맨틱 검색 및 문서 비교 작업.

512

0.10

* 표시된 가격은 참고용으로서 국가별로 다를 수 있고, 관련 세금 및 관세가 제외된 가격이며, 지역별로 제공되는 제품에 따라 달라질 수 있습니다.

타사 임베딩 모델

모델명

제공자

사용 사례

컨텍스트 길이

가격

USD/1백만 토큰*

all-mini-l6-v2

신규

Microsoft

검색 증강 생성, 시맨틱 검색 및 문서 비교 작업.

256

0.10

all-minilm-l12-v2

OS-NLP-CV

검색 증강 생성, 시맨틱 검색 및 문서 비교 작업.

256

0.10

multilingual-e5-large

Intel

검색 증강 생성, 시맨틱 검색 및 문서 비교 작업.

512

0.10

* 표시된 가격은 참고용으로서 국가별로 다를 수 있고, 관련 세금 및 관세가 제외된 가격이며, 지역별로 제공되는 제품에 따라 달라질 수 있습니다.

리소스

적절한 파운데이션 모델을 선택하는 방법

전체 Granite 설명서 보기

엔터프라이즈용 생성형 AI 및 ML

Hugging Face와 IBM의 오픈소스 협업

지적 재산

IBM은 기업 전반에 걸쳐 혁신을 책임감 있게 추진하는 AI 모델의 생성, 배포 및 활용이 가능하다고 믿습니다. IBM watsonx AI 포트폴리오는 파운데이션 모델과 생성형 AI를 구축하고 테스트하기 위한 엔드투엔드 프로세스를 제공합니다. IBM은 당사가 개발하는 모델을 훈련하기 전에 중복을 찾아 제거하고 URL 차단 목록, 유해한 콘텐츠 배제 및 문서 품질 관리를 위한 필터, 문장 분할, 토큰화 기법을 모두 적용합니다.

데이터 훈련 프로세스에서는 모델 결과의 불일치를 방지하기 위해 노력하며, 지도형 미세 조정을 활용하여 보다 면밀한 지침 준수를 가능하게 함으로써 모델이 프롬프트 엔지니어링을 통해 엔터프라이즈 작업 완료에 사용될 수 있도록 합니다. IBM은 기타 모달 기능(Modality), 업계별 콘텐츠, 훈련을 위한 추가적인 데이터 어노테이션 등 다양한 방향으로 Granite 모델의 개발을 이어나가고 있으며, 동시에 IBM이 개발한 모델에 대해 정기적이고 지속적인 안전 장치를 배포하고 있습니다.

생성형 AI 기술 환경이 급속히 변화하는 만큼 엔드투엔드 프로세스 또한 지속적으로 진화하고 개선되어야 합니다. IBM은 자사의 하드웨어 및 소프트웨어 제품에 제공하는 것과 유사하게 IBM에서 개발한 모델에 표준 계약 지적 재산권 배상을 제공합니다. 이는 IBM이 파운데이션 모델의 개발과 테스트에 투입하는 막대한 노력의 증명입니다.

더 나아가 IBM은 일부 대형 언어 모델 제공자와 달리 고객이 IBM에서 개발한 모델을 사용할 때 IBM에 고객의 배상을 청구하지 않습니다. 이는 IBM의 배상에 관한 표준 접근법에 부합하는 것입니다. 또한 IBM은 자사의 배상 의무에 대한 접근법에 부합하도록 IBM에서 개발한 모델의 배상 책임에 한도를 적용하지 않습니다.

현재 이러한 보호가 적용되는 watsonx 모델은 다음과 같습니다.

(1) Slate 인코더 전용 모델 제품군

(2) Granite 디코더 전용 모델 제품군

Granite 모델 라이선싱에 대해 자세히 알아보기(PDF)

다음 단계 안내

무료 평가판을 살펴보거나 라이브 데모를 예약하여 비즈니스용 생성형 AI 및 머신 러닝을 운영하고 확장하세요.

무료 평가판 시작하기

라이브 데모 예약하기

더 살펴보기

IBM 커뮤니티와 소통하기

SaaS 문서 읽기

소프트웨어 설명서 읽기

지원 자료 찾아보기

각주

^* 모델 공급업체별로 지원되는 컨텍스트 길이. 단, 플랫폼의 실제 컨텍스트 길이는 제한되어 있습니다. 자세한 내용은 문서를 참조하세요.

추론은 리소스 단위 기준으로 청구됩니다. 리소스 단위 1개는 토큰 1,000개입니다. 입력 및 완료 토큰은 같은 비율로 부과됩니다. 토큰 1,000개는 보통 약 750단어입니다.

지역에 따라 일부 모델을 사용하지 못할 수 있으므로, 자세한 내용은 문서를 참조하세요.

토큰으로 표현한 컨텍스트 길이.

IBM이 제시한 계획, 방향, 의도에 대한 설명은 IBM의 단독 재량에 따라 예고 없이 변경되거나 철회될 수 있습니다. 자세한 내용은 가격 책정을 참고하세요. 소프트웨어 가격 책정에 달리 명시되지 않는 한, 모든 특징, 기능 및 잠재적 업데이트는 SaaS에만 적용됩니다. IBM은 SaaS와 소프트웨어의 특징 및 기능이 동일함을 보증하지 않습니다.

watsonx.ai의 파운데이션 모델

필요한 모델 선택

새로운 기능

파운데이션 모델 라이브러리

클라이언트 사례

IBM 파운데이션 모델

메타 모델

Mistral 모델

서드파티 파운데이션 모델

임베딩 모델 라이브러리

IBM 임베딩 모델

타사 임베딩 모델

리소스

지적 재산

각주