Modelos fundacionales en watsonx.ai 

Explore la biblioteca de modelos de IA de IBM disponible en el estudio watsonx.ai
Captura de pantalla del producto de modelos fundacionales watsonx.ai

Elija el modelo que necesita

Seleccione el modelo IBM Granite de código abierto o de terceros que mejor se adapte a su negocio y despliéguelo a nivel local o en la nube.

Punto de vista de IBM sobre los modelos de IA Elija el modelo fundacional adecuado

¿Qué hay de nuevo?

Granite 3.3 ya está disponible en la biblioteca de modelos fundacionales de watsonx.
Mistral Medium 3 ya disponible en watsonx.ai ®
Nueva característica del modelo
Llama 4 Maverick y Llama 4 Scout de Meta ya están disponibles en watsonx.ai
Nueva característica del modelo
Los nuevos modelos Granite 3.3 tienen capacidades Speech to Text y un modelo de lenguaje con rendimiento mejorado
Nueva característica del modelo

Biblioteca de modelos fundacionales

Elija el modelo que mejor se adapte a su caso de uso específico y sus consideraciones presupuestarias, intereses regionales y perfil de riesgo.

Vea la biblioteca de modelos de incorporación
Logotipo de IBM
Modelos de IBM

Diseñada para empresas, la familia IBM Granite de modelos abiertos, eficaces y confiables ofrece un rendimiento excepcional a un precio competitivo, sin comprometer la seguridad.

Vea la biblioteca de modelos de IBM Aprenda más sobre Granite
Logotipo de Meta
Modelos Llama de Meta

Los modelos Llama son modelos de lenguaje grandes, abiertos y eficientes, diseñados para ofrecer versatilidad y un sólido rendimiento en una amplia gama de tareas de lenguaje natural.

Ve la biblioteca de modelos Meta Aprenda más sobre nuestra asociación
Logotipo de Mistral
Modelos de IA Mistral

Los modelos Mistral son modelos de lenguaje rápidos, de alto rendimiento y de peso abierto diseñados para la modularidad y optimizados para la generación de texto, el razonamiento y las aplicaciones multilingües.

Vea la biblioteca de modelos Mistral
Ilustración de una lupa
Otros proveedores de modelos de terceros

Hay varios modelos fundacionales de otros proveedores disponibles en watsonx.ai.

Vea la biblioteca de modelos
Logotipo de la empresa Gartner

IBM es nombrada líder en ciencia de datos y machine learning

IBM ha sido reconocida como líder en el 2025 Gartner Magic Quadrant for Data Science and Machine Learning Platforms.

Obtener el informe

Historias de clientes

¿Qué ocurre cuando usted entrena a un potente modelo de IA con sus propios datos? Mejores experiencias del cliente y un valor más rápido con IA. Para saber cómo, explore estas historias.

Logotipo de Wimbledon
Wimbledon

Wimbledon utilizó modelos fundacionales de watsonx.ai a fin de entrenar su IA para crear comentarios sobre tenis.

Lea el estudio de caso
Logotipo de Recording Academy
The Recording Academy

La Recording Academy utilizó AI Stories con IBM watsonx para generar y escalar contenidos editoriales en torno a los nominados a los premios GRAMMY.

Lea el anuncio
Logotipo de Masters
Los maestros

El Masters emplea watsonx.ai para brindar insights impulsados por IA combinados con opiniones de expertos a las plataformas digitales.

Lea el anuncio
Logotipo de AddAI.Life
AddAI.Life

AddAI.Life utiliza watsonx.ai para acceder a modelos de lenguaje grandes de código abierto, seleccionados para crear asistentes virtuales de mayor calidad.

Lea el estudio de caso
Nombre del modelo Proveedor Casos de uso Longitud del contexto Precio USD/1 millón de tokens*

gpt-oss-120b

OpenAI

Despliegue privado on premises o en el edge, flujos de trabajo de razonamiento, uso de herramientas (por ejemplo, búsqueda y ejecución de código), cadena de pensamiento personalizable, resultados estructurados y esfuerzo de razonamiento ajustable

128 000

0.15 tokens de entrada (input) 
0.60 tokens de salida (output)

granite-3-3-8b-instruct

Nuevo
Modelo destacado

IBM

Admite tareas de razonamiento y planificación, preguntas y respuestas, apoyo de rellenado, síntesis, clasificación, generación, extracción, RAG y programación.

128k

0.20

granite-3-2-8b-instruct

IBM

Admite razonamiento y planeación, preguntas y respuestas, resumen, clasificación, generación, extracción, RAG y tareas de programación.

128k

0.20

granite-vision-3-2-2b

IBM

Admite casos de uso de imagen a texto para análisis de tablas, gráficos e infografías, y preguntas y respuestas contextuales.

16,384

0.10

granite-3-2b-instruct (v3.1)

IBM

Admite tareas de preguntas y respuestas, resumen, clasificación, generación, extracción, RAG y programación. 

128k

0.10

granite-3-8b-instruct (v3.1)

Modelo destacado

IBM

Admite tareas de preguntas y respuestas, resumen, clasificación, generación, extracción, RAG y programación. 

128k

0.20

granite-guardian-3-8b (v3.1)

IBM

Admite la detección de HAP/ o PII, jailbreaking, sesgos, violencia y otros contenidos nocivos.

128k

0.20

granite-guardian-3-2b (v3.1)

En desuso

IBM

Apoya la detección de HAP o PII, jailbreaking, sesgo, violencia y otros contenidos dañinos.

128k

0.10

granite-13b-instruct

En desuso

IBM 

Admite tareas de preguntas y respuestas, resumen, clasificación, generación, extracción y RAG.

8192

0.60

granite-8b-code-instruct

IBM

Modelo específico de tareas para código mediante la generación, explicación y traducción de código a partir de una instrucción de lenguaje natural.

 

128k

0.60

granite-8b-japanese

En desuso

IBM

Admite tareas de preguntas y respuestas, resumen, clasificación, generación, extracción, traducción y RAG en japonés. 

4096

0.60

*Los precios mostrados son indicativos, pueden variar según el país, excluyen los impuestos y aranceles aplicables y están sujetos a la disponibilidad de la opción de productos en un lugar. 

Nombre del modelo Proveedor Casos de uso Longitud del contexto Precio USD/1 millón de tokens*

llama-4-scout-17b-16e-instruct

Nuevo

Meta

Razonamiento multimodal, procesamiento de contexto largo (10 millones de tokens), generación y análisis de código, operaciones multilingües (compatible con 200 idiomas), STEM y razonamiento lógico.

128k

Vista previa libre

llama-4-maverick-17b-128e-instruct-fp8

Nuevo

Meta

Razonamiento multimodal, procesamiento de contexto largo (10 millones de tokens), generación y análisis de código, operaciones multilingües (compatible con 200 idiomas), STEM y razonamiento lógico.

128k

Entrada: 0.35 / Salida: 1.40

llama-3-3-70b-instruct

Meta

Admite tareas de preguntas y respuestas, síntesis, generación, programación, clasificación, extracción, traducción y RAG en inglés, alemán, francés, italiano, portugués, hindi, español y tailandés.

128k

0.71

llama-3-2-90b-vision-instruct

Meta

Admite subtítulos de imágenes, transcripción de imágenes a texto (OCR), incluidos la escritura a mano, extracción y procesamiento de datos, Q&A de contexto e identificación de objetos.

128k

2.00

llama-3-2-11b-vision-instruct

Meta

Admite subtítulos de imágenes, transcripción de imágenes a texto (OCR), incluidos la escritura a mano, extracción y procesamiento de datos, Q&A de contexto e identificación de objetos.

128k

0.35

llama-guard-3-11b-vision

Meta

Admite filtrado de imágenes, detección de HAP o PII y filtrado de contenido dañino.

128k

0.35

llama-3-2-1b-instruct

Meta

Admite tareas de preguntas y respuestas, síntesis, generación, programación, clasificación, extracción, traducción y RAG en inglés, alemán, francés, italiano, portugués, hindi, español y tailandés.

128k

0.10

llama-3-2-3b-instruct

Meta

Admite tareas de preguntas y respuestas, síntesis, generación, programación, clasificación, extracción, traducción y RAG en inglés, alemán, francés, italiano, portugués, hindi, español y tailandés.

128k

0.15

llama-3-405b-instruct

Meta

Admite tareas de preguntas y respuestas, síntesis, generación, programación, clasificación, extracción, traducción y RAG en inglés, alemán, francés, italiano, portugués, hindi, español y tailandés.

128k

Entrada: 5.00/Salida: 16.00

*Los precios mostrados son indicativos, pueden variar según el país, excluyen los impuestos y aranceles aplicables y están sujetos a la disponibilidad de la opción de productos en un lugar. 

Modelos Mistral

Nombre del modelo Proveedor Casos de uso Longitud del contexto Precio USD/1 millón de tokens*

mistral-medium-2505

Nuevo

Mistral AI

Admite programación, subtitulado de imágenes, transcripción de imágenes a texto, llamadas de funciones, extracción y procesamiento de datos, preguntas frecuentes de contexto y razonamiento matemático.

128k

Entrada: 3.00/Salida: 10.00

mistral-small-3-1-24b-instruct-2503

Nuevo

Mistral AI

Admite subtítulos de imágenes, transcripción de imagen a texto, llamadas a funciones, extracción y procesamiento de datos, preguntas y respuestas contextuales e identificación de objetos

128k

Entrada: 0.10 / Salida: 0.30

pixtral-12b

En desuso

Mistral AI

Admite subtítulos de imágenes, transcripción de imágenes a texto (OCR), incluidos la escritura a mano, extracción y procesamiento de datos, Q&A de contexto e identificación de objetos.

128k

0.35

mistral-large-2

En desuso

Mistral AI

Admite preguntas frecuentes, resumen, generación, programación, clasificación, extracción, traducción y tareas RAG en francés, alemán, italiano, español e inglés.

128k*

Entrada: 3.00/Salida: 10.00

*Los precios mostrados son indicativos, pueden variar según el país, excluyen los impuestos y aranceles aplicables y están sujetos a la disponibilidad de la opción de productos en un lugar. 

Modelos fundacionales de terceros

Nombre del modelo Proveedor Casos de uso Longitud del contexto Precio USD/1 millón de tokens*

allam-1-13b-instruct

SDAIA

Admite preguntas frecuentes, síntesis, clasificación, generación, extracción, RAG y traducción al árabe.

4096

1.80

jais-13b-chat (árabe)

core42

Admite preguntas frecuentes, resumen, clasificación, generación, extracción y traducción en árabe.

2048

1.80

flan-t5-xl-3b

En desuso

Google

Admite tareas de preguntas y respuestas, resumen, clasificación, generación, extracción y RAG. Disponible para el ajuste rápido.

4096

0.60

flan-t5-xxl-11b

En desuso

Google

Admite tareas de preguntas y respuestas, resumen, clasificación, generación, extracción y RAG.

4096

1.80

flan-ul2-20b

En desuso

Google

Admite tareas de preguntas y respuestas, resumen, clasificación, generación, extracción y RAG.

4096

5.00

elyza-japanese-llama-2-7b-instruct

En desuso

ELYZA

Admite tareas de preguntas y respuestas, resumen, RAG, clasificación, generación, extracción y traducción. 

4096

1.80

*Los precios mostrados son indicativos, pueden variar según el país, excluyen los impuestos y aranceles aplicables y están sujetos a la disponibilidad de la opción de productos en un lugar. 

Biblioteca de modelos de incrustación

Utilice los modelos de incorporación desarrollados por IBM y de código abierto, desplegados en IBM watsonx.ai, para tareas de generación aumentada por recuperación, búsqueda semántica y comparación de documentos. O elija un tercero proveedor de modelos de incorporación.

Modelos de incorporación IBM

Nombre del modelo Proveedor Casos de uso Longitud del contexto Precio USD/1 millón de tokens*

granite-embedding-107m-multilingual

Nuevo

IBM

Tareas de recuperación, generación aumentada por recuperación, búsqueda semántica y comparación de documentos.

512

0.10

granite-embedding-278m-multilingual

IBM

Tareas de recuperación, generación aumentada por recuperación, búsqueda semántica y comparación de documentos.

512

0.10

slate-125m-english-rtrvr-v2

IBM

Tareas de recuperación, generación aumentada por recuperación, búsqueda semántica y comparación de documentos.

512

0.10

slate-125m-english-rtrvr

IBM

Tareas de recuperación, generación aumentada por recuperación, búsqueda semántica y comparación de documentos.

512

0.10

slate-30m-english-rtrvr-v2

IBM

Tareas de recuperación, generación aumentada por recuperación, búsqueda semántica y comparación de documentos.

512

0.10

slate-30m-english-rtrvr

IBM

Tareas de recuperación, generación aumentada por recuperación, búsqueda semántica y comparación de documentos.

512

0.10

*Los precios mostrados son indicativos, pueden variar según el país, excluyen los impuestos y aranceles aplicables y están sujetos a la disponibilidad de la opción de productos en un lugar. 

Modelos de incrustación de terceros

Nombre del modelo Proveedor Casos de uso Longitud del contexto Precio USD/1 millón de tokens*

all-mini-l6-v2

Nuevo

Microsoft

Tareas de recuperación, generación aumentada por recuperación, búsqueda semántica y comparación de documentos.

256

0.10

all-minilm-l12-v2

OS-NLP-CV

Tareas de recuperación, generación aumentada por recuperación, búsqueda semántica y comparación de documentos.

256

0.10

multilingual-e5-large

Intel

Tareas de recuperación, generación aumentada por recuperación, búsqueda semántica y comparación de documentos.

512

0.10

*Los precios mostrados son indicativos, pueden variar según el país, excluyen los impuestos y aranceles aplicables y están sujetos a la disponibilidad de la opción de productos en un lugar. 

Propiedad intelectual

IBM cree en la creación, el despliegue y la utilización de modelos de IA que impulsan la innovación en toda la empresa de manera responsable. La cartera de soluciones de inteligencia artificial IBM watsonx cuenta con un proceso integral para crear y probar modelos fundacionales e IA generativa. Para los modelos desarrollados por IBM, buscamos y eliminamos duplicaciones; además, empleamos listas de bloqueo de URL, filtros para contenido objetable y calidad de documentos, división de oraciones y creación de tokens, todo antes del entrenamiento del modelo.

Durante el proceso de entrenamiento con datos, trabajamos para evitar desalineaciones en las salidas del modelo y utilizamos ajustes supervisados para permitir un mejor seguimiento de las instrucciones, de modo que el modelo pueda usarse para completar tareas empresariales mediante la ingeniería rápida. Continuamos desarrollando los modelos Granite en varias direcciones, entre ellas otras modalidades, contenido específico de las industrias y más anotaciones de datos para el entrenamiento, al tiempo que desplegamos salvaguardas de protección de datos para los modelos desarrollados por IBM.  

Dado el cambiante panorama de la tecnología de IA generativa, se prevé que nuestros procesos de extremo a extremo evolucionen y mejoren continuamente. Como testimonio del rigor que aplica en el desarrollo y prueba de sus modelos fundacionales, la compañía ofrece su indemnización contractual estándar por propiedad intelectual para los modelos desarrollados por ella, similar a la que ofrece para sus productos de hardware y software.

Además, a diferencia de otros proveedores de grandes modelos de lenguaje y en sintonía con su enfoque estándar en materia de indemnización, IBM no exige a sus clientes que la indemnicen por el uso que hagan de los de los modelos desarrollados por ella. Además, de acuerdo con su enfoque de la obligación de indemnización, IBM no limita su responsabilidad de indemnización para los modelos desarrollados por ella.

Los modelos actuales watsonx que ahora están amparados por estas protecciones incluyen:

(1) Familia Slate de modelos de solo codificador

(2) Familia Granite de un modelo con decodificador únicamente

Aprenda más sobre las licencias para modelos Granite (PDF)

Dé el siguiente paso

Empiece a poner en práctica y a escalar la IA generativa y el aprendizaje automático para su negocio explorando nuestra prueba gratuita o reservando una demostración en vivo.

Comience su prueba sin coste Reserve una demostración en vivo
Más formas de explorar Póngase en contacto con la comunidad IBM Lea la documentación de SaaS Lea la documentación del software Encuentre soporte
Notas de pie de página

* Longitud de contexto admitida por el proveedor del modelo, pero la longitud de contexto real en la plataforma es limitada. Para más información, consulte Documentation.

La inferencia se factura en unidades de recursos. 1 unidad de recursos son 1000 tokens. Los tokens de entrada y finalización se cobran a la misma tarifa. 1000 tokens equivalen generalmente a alrededor de 750 palabras.

No todos los modelos están disponibles en todas las regiones. Consulte nuestra documentación para obtener más detalles.

La longitud del contexto se expresa en tokens.

Las declaraciones de IBM con respecto a sus planes, instrucciones e intenciones están sujetas a cambios o retiros sin previo aviso según el criterio exclusivo. Consulte los Precios para obtener más detalles. A menos que se especifique lo contrario en los precios del software, todas las características, capacidades y actualizaciones potenciales se refieren exclusivamente a SaaS. IBM no garantiza que las características y capacidades de SaaS del software sean las mismas.