Seleccione el modelo IBM Granite de código abierto o de terceros que mejor se adapte a su negocio y despliéguelo a nivel local o en la nube.
Elija el modelo que mejor se adapte a su caso de uso específico y sus consideraciones presupuestarias, intereses regionales y perfil de riesgo.
Diseñada para empresas, la familia IBM Granite de modelos abiertos, eficaces y confiables ofrece un rendimiento excepcional a un precio competitivo, sin comprometer la seguridad.
Los modelos Llama son modelos de lenguaje grandes, abiertos y eficientes, diseñados para ofrecer versatilidad y un sólido rendimiento en una amplia gama de tareas de lenguaje natural.
Los modelos Mistral son modelos de lenguaje rápidos, de alto rendimiento y de peso abierto diseñados para la modularidad y optimizados para la generación de texto, el razonamiento y las aplicaciones multilingües.
Hay varios modelos fundacionales de otros proveedores disponibles en watsonx.ai.
¿Qué ocurre cuando usted entrena a un potente modelo de IA con sus propios datos? Mejores experiencias del cliente y un valor más rápido con IA. Para saber cómo, explore estas historias.
Wimbledon utilizó modelos fundacionales de watsonx.ai a fin de entrenar su IA para crear comentarios sobre tenis.
La Recording Academy utilizó AI Stories con IBM watsonx para generar y escalar contenidos editoriales en torno a los nominados a los premios GRAMMY.
El Masters emplea watsonx.ai para brindar insights impulsados por IA combinados con opiniones de expertos a las plataformas digitales.
AddAI.Life utiliza watsonx.ai para acceder a modelos de lenguaje grandes de código abierto, seleccionados para crear asistentes virtuales de mayor calidad.
gpt-oss-120b
OpenAI
Despliegue privado on premises o en el edge, flujos de trabajo de razonamiento, uso de herramientas (por ejemplo, búsqueda y ejecución de código), cadena de pensamiento personalizable, resultados estructurados y esfuerzo de razonamiento ajustable
128 000
0.15 tokens de entrada (input)
0.60 tokens de salida (output)
granite-3-3-8b-instruct
IBM
Admite tareas de razonamiento y planificación, preguntas y respuestas, apoyo de rellenado, síntesis, clasificación, generación, extracción, RAG y programación.
128k
0.20
granite-3-2-8b-instruct
IBM
Admite razonamiento y planeación, preguntas y respuestas, resumen, clasificación, generación, extracción, RAG y tareas de programación.
128k
0.20
granite-vision-3-2-2b
IBM
Admite casos de uso de imagen a texto para análisis de tablas, gráficos e infografías, y preguntas y respuestas contextuales.
16,384
0.10
granite-3-2b-instruct (v3.1)
IBM
Admite tareas de preguntas y respuestas, resumen, clasificación, generación, extracción, RAG y programación.
128k
0.10
granite-3-8b-instruct (v3.1)
IBM
Admite tareas de preguntas y respuestas, resumen, clasificación, generación, extracción, RAG y programación.
128k
0.20
granite-guardian-3-8b (v3.1)
IBM
Admite la detección de HAP/ o PII, jailbreaking, sesgos, violencia y otros contenidos nocivos.
128k
0.20
granite-guardian-3-2b (v3.1)
IBM
Apoya la detección de HAP o PII, jailbreaking, sesgo, violencia y otros contenidos dañinos.
128k
0.10
granite-13b-instruct
IBM
Admite tareas de preguntas y respuestas, resumen, clasificación, generación, extracción y RAG.
8192
0.60
granite-8b-code-instruct
IBM
Modelo específico de tareas para código mediante la generación, explicación y traducción de código a partir de una instrucción de lenguaje natural.
128k
0.60
granite-8b-japanese
IBM
Admite tareas de preguntas y respuestas, resumen, clasificación, generación, extracción, traducción y RAG en japonés.
4096
0.60
*Los precios mostrados son indicativos, pueden variar según el país, excluyen los impuestos y aranceles aplicables y están sujetos a la disponibilidad de la opción de productos en un lugar.
llama-4-scout-17b-16e-instruct
Meta
Razonamiento multimodal, procesamiento de contexto largo (10 millones de tokens), generación y análisis de código, operaciones multilingües (compatible con 200 idiomas), STEM y razonamiento lógico.
128k
Vista previa libre
llama-4-maverick-17b-128e-instruct-fp8
Meta
Razonamiento multimodal, procesamiento de contexto largo (10 millones de tokens), generación y análisis de código, operaciones multilingües (compatible con 200 idiomas), STEM y razonamiento lógico.
128k
Entrada: 0.35 / Salida: 1.40
llama-3-3-70b-instruct
Meta
Admite tareas de preguntas y respuestas, síntesis, generación, programación, clasificación, extracción, traducción y RAG en inglés, alemán, francés, italiano, portugués, hindi, español y tailandés.
128k
0.71
llama-3-2-90b-vision-instruct
Meta
Admite subtítulos de imágenes, transcripción de imágenes a texto (OCR), incluidos la escritura a mano, extracción y procesamiento de datos, Q&A de contexto e identificación de objetos.
128k
2.00
llama-3-2-11b-vision-instruct
Meta
Admite subtítulos de imágenes, transcripción de imágenes a texto (OCR), incluidos la escritura a mano, extracción y procesamiento de datos, Q&A de contexto e identificación de objetos.
128k
0.35
llama-guard-3-11b-vision
Meta
Admite filtrado de imágenes, detección de HAP o PII y filtrado de contenido dañino.
128k
0.35
llama-3-2-1b-instruct
Meta
Admite tareas de preguntas y respuestas, síntesis, generación, programación, clasificación, extracción, traducción y RAG en inglés, alemán, francés, italiano, portugués, hindi, español y tailandés.
128k
0.10
llama-3-2-3b-instruct
Meta
Admite tareas de preguntas y respuestas, síntesis, generación, programación, clasificación, extracción, traducción y RAG en inglés, alemán, francés, italiano, portugués, hindi, español y tailandés.
128k
0.15
llama-3-405b-instruct
Meta
Admite tareas de preguntas y respuestas, síntesis, generación, programación, clasificación, extracción, traducción y RAG en inglés, alemán, francés, italiano, portugués, hindi, español y tailandés. |
128k
Entrada: 5.00/Salida: 16.00
*Los precios mostrados son indicativos, pueden variar según el país, excluyen los impuestos y aranceles aplicables y están sujetos a la disponibilidad de la opción de productos en un lugar.
mistral-medium-2505
Mistral AI
Admite programación, subtitulado de imágenes, transcripción de imágenes a texto, llamadas de funciones, extracción y procesamiento de datos, preguntas frecuentes de contexto y razonamiento matemático.
128k
Entrada: 3.00/Salida: 10.00
mistral-small-3-1-24b-instruct-2503
Mistral AI
Admite subtítulos de imágenes, transcripción de imagen a texto, llamadas a funciones, extracción y procesamiento de datos, preguntas y respuestas contextuales e identificación de objetos
128k
Entrada: 0.10 / Salida: 0.30
pixtral-12b
Mistral AI
Admite subtítulos de imágenes, transcripción de imágenes a texto (OCR), incluidos la escritura a mano, extracción y procesamiento de datos, Q&A de contexto e identificación de objetos.
128k
0.35
mistral-large-2
Mistral AI
Admite preguntas frecuentes, resumen, generación, programación, clasificación, extracción, traducción y tareas RAG en francés, alemán, italiano, español e inglés.
128k*
Entrada: 3.00/Salida: 10.00
*Los precios mostrados son indicativos, pueden variar según el país, excluyen los impuestos y aranceles aplicables y están sujetos a la disponibilidad de la opción de productos en un lugar.
allam-1-13b-instruct
SDAIA
Admite preguntas frecuentes, síntesis, clasificación, generación, extracción, RAG y traducción al árabe.
4096
1.80
jais-13b-chat (árabe)
core42
Admite preguntas frecuentes, resumen, clasificación, generación, extracción y traducción en árabe.
2048
1.80
flan-t5-xl-3b
Admite tareas de preguntas y respuestas, resumen, clasificación, generación, extracción y RAG. Disponible para el ajuste rápido.
4096
0.60
flan-t5-xxl-11b
Admite tareas de preguntas y respuestas, resumen, clasificación, generación, extracción y RAG.
4096
1.80
flan-ul2-20b
Admite tareas de preguntas y respuestas, resumen, clasificación, generación, extracción y RAG.
4096
5.00
elyza-japanese-llama-2-7b-instruct
ELYZA
Admite tareas de preguntas y respuestas, resumen, RAG, clasificación, generación, extracción y traducción.
4096
1.80
*Los precios mostrados son indicativos, pueden variar según el país, excluyen los impuestos y aranceles aplicables y están sujetos a la disponibilidad de la opción de productos en un lugar.
Utilice los modelos de incorporación desarrollados por IBM y de código abierto, desplegados en IBM watsonx.ai, para tareas de generación aumentada por recuperación, búsqueda semántica y comparación de documentos. O elija un tercero proveedor de modelos de incorporación.
granite-embedding-107m-multilingual
IBM
Tareas de recuperación, generación aumentada por recuperación, búsqueda semántica y comparación de documentos.
512
0.10
granite-embedding-278m-multilingual
IBM
Tareas de recuperación, generación aumentada por recuperación, búsqueda semántica y comparación de documentos.
512
0.10
slate-125m-english-rtrvr-v2
IBM
Tareas de recuperación, generación aumentada por recuperación, búsqueda semántica y comparación de documentos.
512
0.10
slate-125m-english-rtrvr
IBM
Tareas de recuperación, generación aumentada por recuperación, búsqueda semántica y comparación de documentos.
512
0.10
slate-30m-english-rtrvr-v2
IBM
Tareas de recuperación, generación aumentada por recuperación, búsqueda semántica y comparación de documentos.
512
0.10
slate-30m-english-rtrvr
IBM
Tareas de recuperación, generación aumentada por recuperación, búsqueda semántica y comparación de documentos.
512
0.10
*Los precios mostrados son indicativos, pueden variar según el país, excluyen los impuestos y aranceles aplicables y están sujetos a la disponibilidad de la opción de productos en un lugar.
all-mini-l6-v2
Microsoft
Tareas de recuperación, generación aumentada por recuperación, búsqueda semántica y comparación de documentos.
256
0.10
all-minilm-l12-v2
OS-NLP-CV
Tareas de recuperación, generación aumentada por recuperación, búsqueda semántica y comparación de documentos.
256
0.10
multilingual-e5-large
Intel
Tareas de recuperación, generación aumentada por recuperación, búsqueda semántica y comparación de documentos.
512
0.10
*Los precios mostrados son indicativos, pueden variar según el país, excluyen los impuestos y aranceles aplicables y están sujetos a la disponibilidad de la opción de productos en un lugar.
* Longitud de contexto admitida por el proveedor del modelo, pero la longitud de contexto real en la plataforma es limitada. Para más información, consulte Documentation.
La inferencia se factura en unidades de recursos. 1 unidad de recursos son 1000 tokens. Los tokens de entrada y finalización se cobran a la misma tarifa. 1000 tokens equivalen generalmente a alrededor de 750 palabras.
No todos los modelos están disponibles en todas las regiones. Consulte nuestra documentación para obtener más detalles.
La longitud del contexto se expresa en tokens.
Las declaraciones de IBM con respecto a sus planes, instrucciones e intenciones están sujetas a cambios o retiros sin previo aviso según el criterio exclusivo. Consulte los Precios para obtener más detalles. A menos que se especifique lo contrario en los precios del software, todas las características, capacidades y actualizaciones potenciales se refieren exclusivamente a SaaS. IBM no garantiza que las características y capacidades de SaaS del software sean las mismas.