Modelos fundacionales - IBM watsonx.ai

Elija el modelo que necesita

Seleccione el modelo IBM Granite de código abierto o de terceros que mejor se adapte a su negocio y despliéguelo a nivel local o en la nube.

Punto de vista de IBM sobre los modelos de IA

Elija el modelo fundacional adecuado

¿Qué hay de nuevo?

Granite 3.3 ya está disponible en la biblioteca de modelos fundacionales de watsonx.

Mistral Medium 3 ya disponible en watsonx.ai ®

Nueva característica del modelo

Llama 4 Maverick y Llama 4 Scout de Meta ya están disponibles en watsonx.ai

Nueva característica del modelo

Los nuevos modelos Granite 3.3 tienen capacidades Speech to Text y un modelo de lenguaje con rendimiento mejorado

Nueva característica del modelo

Biblioteca de modelos fundacionales

Elija el modelo que mejor se adapte a su caso de uso específico y sus consideraciones presupuestarias, intereses regionales y perfil de riesgo.

Vea la biblioteca de modelos de incorporación

Modelos de IBM

Diseñada para empresas, la familia IBM Granite de modelos abiertos, eficaces y confiables ofrece un rendimiento excepcional a un precio competitivo, sin comprometer la seguridad.

Vea la biblioteca de modelos de IBM

Aprenda más sobre Granite

Modelos Llama de Meta

Los modelos Llama son modelos de lenguaje grandes, abiertos y eficientes, diseñados para ofrecer versatilidad y un sólido rendimiento en una amplia gama de tareas de lenguaje natural.

Ve la biblioteca de modelos Meta

Aprenda más sobre nuestra asociación

Modelos de IA Mistral

Los modelos Mistral son modelos de lenguaje rápidos, de alto rendimiento y de peso abierto diseñados para la modularidad y optimizados para la generación de texto, el razonamiento y las aplicaciones multilingües.

Vea la biblioteca de modelos Mistral

Otros proveedores de modelos de terceros

Hay varios modelos fundacionales de otros proveedores disponibles en watsonx.ai.

Vea la biblioteca de modelos

Historias de clientes

¿Qué ocurre cuando usted entrena a un potente modelo de IA con sus propios datos? Mejores experiencias del cliente y un valor más rápido con IA. Para saber cómo, explore estas historias.

Wimbledon

Wimbledon utilizó modelos fundacionales de watsonx.ai a fin de entrenar su IA para crear comentarios sobre tenis.

Lea el estudio de caso

The Recording Academy

La Recording Academy utilizó AI Stories con IBM watsonx para generar y escalar contenidos editoriales en torno a los nominados a los premios GRAMMY.

Lea el anuncio

Los maestros

El Masters emplea watsonx.ai para brindar insights impulsados por IA combinados con opiniones de expertos a las plataformas digitales.

Lea el anuncio

AddAI.Life

AddAI.Life utiliza watsonx.ai para acceder a modelos de lenguaje grandes de código abierto, seleccionados para crear asistentes virtuales de mayor calidad.

Lea el estudio de caso

Modelos fundacionales de IBM

Vea cómo se entrenaron los modelos de Granite (PDF)

Aprenda más sobre Granite

Nombre del modelo

Proveedor

Casos de uso

Longitud del contexto

Precio

USD/1 millón de tokens*

gpt-oss-120b

OpenAI

Despliegue privado on premises o en el edge, flujos de trabajo de razonamiento, uso de herramientas (por ejemplo, búsqueda y ejecución de código), cadena de pensamiento personalizable, resultados estructurados y esfuerzo de razonamiento ajustable

128 000

0.15 tokens de entrada (input)
0.60 tokens de salida (output)

granite-3-3-8b-instruct

Nuevo

Modelo destacado

IBM

Admite tareas de razonamiento y planificación, preguntas y respuestas, apoyo de rellenado, síntesis, clasificación, generación, extracción, RAG y programación.

128k

0.20

granite-3-2-8b-instruct

IBM

Admite razonamiento y planeación, preguntas y respuestas, resumen, clasificación, generación, extracción, RAG y tareas de programación.

128k

0.20

granite-vision-3-2-2b

IBM

Admite casos de uso de imagen a texto para análisis de tablas, gráficos e infografías, y preguntas y respuestas contextuales.

16,384

0.10

granite-3-2b-instruct (v3.1)

IBM

Admite tareas de preguntas y respuestas, resumen, clasificación, generación, extracción, RAG y programación.

128k

0.10

granite-3-8b-instruct (v3.1)

Modelo destacado

IBM

Admite tareas de preguntas y respuestas, resumen, clasificación, generación, extracción, RAG y programación.

128k

0.20

granite-guardian-3-8b (v3.1)

IBM

Admite la detección de HAP/ o PII, jailbreaking, sesgos, violencia y otros contenidos nocivos.

128k

0.20

granite-guardian-3-2b (v3.1)

En desuso

IBM

Apoya la detección de HAP o PII, jailbreaking, sesgo, violencia y otros contenidos dañinos.

128k

0.10

granite-13b-instruct

En desuso

IBM

Admite tareas de preguntas y respuestas, resumen, clasificación, generación, extracción y RAG.

8192

0.60

granite-8b-code-instruct

IBM

Modelo específico de tareas para código mediante la generación, explicación y traducción de código a partir de una instrucción de lenguaje natural.

128k

0.60

granite-8b-japanese

En desuso

IBM

Admite tareas de preguntas y respuestas, resumen, clasificación, generación, extracción, traducción y RAG en japonés.

4096

0.60

*Los precios mostrados son indicativos, pueden variar según el país, excluyen los impuestos y aranceles aplicables y están sujetos a la disponibilidad de la opción de productos en un lugar.

Meta modelos

Aprenda más sobre nuestra asociación

Nombre del modelo

Proveedor

Casos de uso

Longitud del contexto

Precio

USD/1 millón de tokens*

llama-4-scout-17b-16e-instruct

Nuevo

Meta

Razonamiento multimodal, procesamiento de contexto largo (10 millones de tokens), generación y análisis de código, operaciones multilingües (compatible con 200 idiomas), STEM y razonamiento lógico.

128k

Vista previa libre

llama-4-maverick-17b-128e-instruct-fp8

Nuevo

Meta

128k

Entrada: 0.35 / Salida: 1.40

llama-3-3-70b-instruct

Meta

Admite tareas de preguntas y respuestas, síntesis, generación, programación, clasificación, extracción, traducción y RAG en inglés, alemán, francés, italiano, portugués, hindi, español y tailandés.

128k

0.71

llama-3-2-90b-vision-instruct

Meta

Admite subtítulos de imágenes, transcripción de imágenes a texto (OCR), incluidos la escritura a mano, extracción y procesamiento de datos, Q&A de contexto e identificación de objetos.

128k

2.00

llama-3-2-11b-vision-instruct

Meta

Admite subtítulos de imágenes, transcripción de imágenes a texto (OCR), incluidos la escritura a mano, extracción y procesamiento de datos, Q&A de contexto e identificación de objetos.

128k

0.35

llama-guard-3-11b-vision

Meta

Admite filtrado de imágenes, detección de HAP o PII y filtrado de contenido dañino.

128k

0.35

llama-3-2-1b-instruct

Meta

128k

0.10

llama-3-2-3b-instruct

Meta

128k

0.15

llama-3-405b-instruct

Meta

128k

Entrada: 5.00/Salida: 16.00

*Los precios mostrados son indicativos, pueden variar según el país, excluyen los impuestos y aranceles aplicables y están sujetos a la disponibilidad de la opción de productos en un lugar.

Modelos Mistral

Nombre del modelo

Proveedor

Casos de uso

Longitud del contexto

Precio

USD/1 millón de tokens*

mistral-medium-2505

Nuevo

Mistral AI

Admite programación, subtitulado de imágenes, transcripción de imágenes a texto, llamadas de funciones, extracción y procesamiento de datos, preguntas frecuentes de contexto y razonamiento matemático.

128k

Entrada: 3.00/Salida: 10.00

mistral-small-3-1-24b-instruct-2503

Nuevo

Mistral AI

Admite subtítulos de imágenes, transcripción de imagen a texto, llamadas a funciones, extracción y procesamiento de datos, preguntas y respuestas contextuales e identificación de objetos

128k

Entrada: 0.10 / Salida: 0.30

pixtral-12b

En desuso

Mistral AI

Admite subtítulos de imágenes, transcripción de imágenes a texto (OCR), incluidos la escritura a mano, extracción y procesamiento de datos, Q&A de contexto e identificación de objetos.

128k

0.35

mistral-large-2

En desuso

Mistral AI

Admite preguntas frecuentes, resumen, generación, programación, clasificación, extracción, traducción y tareas RAG en francés, alemán, italiano, español e inglés.

128k*

Entrada: 3.00/Salida: 10.00

*Los precios mostrados son indicativos, pueden variar según el país, excluyen los impuestos y aranceles aplicables y están sujetos a la disponibilidad de la opción de productos en un lugar.

Modelos fundacionales de terceros

Nombre del modelo

Proveedor

Casos de uso

Longitud del contexto

Precio

USD/1 millón de tokens*

allam-1-13b-instruct

SDAIA

Admite preguntas frecuentes, síntesis, clasificación, generación, extracción, RAG y traducción al árabe.

4096

1.80

jais-13b-chat (árabe)

core42

Admite preguntas frecuentes, resumen, clasificación, generación, extracción y traducción en árabe.

2048

1.80

flan-t5-xl-3b

En desuso

Google

Admite tareas de preguntas y respuestas, resumen, clasificación, generación, extracción y RAG. Disponible para el ajuste rápido.

4096

0.60

flan-t5-xxl-11b

En desuso

Google

Admite tareas de preguntas y respuestas, resumen, clasificación, generación, extracción y RAG.

4096

1.80

flan-ul2-20b

En desuso

Google

Admite tareas de preguntas y respuestas, resumen, clasificación, generación, extracción y RAG.

4096

5.00

elyza-japanese-llama-2-7b-instruct

En desuso

ELYZA

Admite tareas de preguntas y respuestas, resumen, RAG, clasificación, generación, extracción y traducción.

4096

1.80

*Los precios mostrados son indicativos, pueden variar según el país, excluyen los impuestos y aranceles aplicables y están sujetos a la disponibilidad de la opción de productos en un lugar.

Biblioteca de modelos de incrustación

Utilice los modelos de incorporación desarrollados por IBM y de código abierto, desplegados en IBM watsonx.ai, para tareas de generación aumentada por recuperación, búsqueda semántica y comparación de documentos. O elija un tercero proveedor de modelos de incorporación.

Modelos de incorporación IBM

Nombre del modelo

Proveedor

Casos de uso

Longitud del contexto

Precio

USD/1 millón de tokens*

granite-embedding-107m-multilingual

Nuevo

IBM

Tareas de recuperación, generación aumentada por recuperación, búsqueda semántica y comparación de documentos.

512

0.10

granite-embedding-278m-multilingual

IBM

Tareas de recuperación, generación aumentada por recuperación, búsqueda semántica y comparación de documentos.

512

0.10

slate-125m-english-rtrvr-v2

IBM

Tareas de recuperación, generación aumentada por recuperación, búsqueda semántica y comparación de documentos.

512

0.10

slate-125m-english-rtrvr

IBM

Tareas de recuperación, generación aumentada por recuperación, búsqueda semántica y comparación de documentos.

512

0.10

slate-30m-english-rtrvr-v2

IBM

Tareas de recuperación, generación aumentada por recuperación, búsqueda semántica y comparación de documentos.

512

0.10

slate-30m-english-rtrvr

IBM

Tareas de recuperación, generación aumentada por recuperación, búsqueda semántica y comparación de documentos.

512

0.10

*Los precios mostrados son indicativos, pueden variar según el país, excluyen los impuestos y aranceles aplicables y están sujetos a la disponibilidad de la opción de productos en un lugar.

Modelos de incrustación de terceros

Nombre del modelo

Proveedor

Casos de uso

Longitud del contexto

Precio

USD/1 millón de tokens*

all-mini-l6-v2

Nuevo

Microsoft

Tareas de recuperación, generación aumentada por recuperación, búsqueda semántica y comparación de documentos.

256

0.10

all-minilm-l12-v2

OS-NLP-CV

Tareas de recuperación, generación aumentada por recuperación, búsqueda semántica y comparación de documentos.

256

0.10

multilingual-e5-large

Intel

Tareas de recuperación, generación aumentada por recuperación, búsqueda semántica y comparación de documentos.

512

0.10

*Los precios mostrados son indicativos, pueden variar según el país, excluyen los impuestos y aranceles aplicables y están sujetos a la disponibilidad de la opción de productos en un lugar.

Recursos

Cómo elegir el modelo fundacional de IA adecuado

Consulte el recetario completo de Granite

IA generativa y aprendizaje automático (ML) para empresas

Hugging Face e IBM trabajan juntas en código abierto

Propiedad intelectual

IBM cree en la creación, el despliegue y la utilización de modelos de IA que impulsan la innovación en toda la empresa de manera responsable. La cartera de soluciones de inteligencia artificial IBM watsonx cuenta con un proceso integral para crear y probar modelos fundacionales e IA generativa. Para los modelos desarrollados por IBM, buscamos y eliminamos duplicaciones; además, empleamos listas de bloqueo de URL, filtros para contenido objetable y calidad de documentos, división de oraciones y creación de tokens, todo antes del entrenamiento del modelo.

Durante el proceso de entrenamiento con datos, trabajamos para evitar desalineaciones en las salidas del modelo y utilizamos ajustes supervisados para permitir un mejor seguimiento de las instrucciones, de modo que el modelo pueda usarse para completar tareas empresariales mediante la ingeniería rápida. Continuamos desarrollando los modelos Granite en varias direcciones, entre ellas otras modalidades, contenido específico de las industrias y más anotaciones de datos para el entrenamiento, al tiempo que desplegamos salvaguardas de protección de datos para los modelos desarrollados por IBM.

Dado el cambiante panorama de la tecnología de IA generativa, se prevé que nuestros procesos de extremo a extremo evolucionen y mejoren continuamente. Como testimonio del rigor que aplica en el desarrollo y prueba de sus modelos fundacionales, la compañía ofrece su indemnización contractual estándar por propiedad intelectual para los modelos desarrollados por ella, similar a la que ofrece para sus productos de hardware y software.

Además, a diferencia de otros proveedores de grandes modelos de lenguaje y en sintonía con su enfoque estándar en materia de indemnización, IBM no exige a sus clientes que la indemnicen por el uso que hagan de los de los modelos desarrollados por ella. Además, de acuerdo con su enfoque de la obligación de indemnización, IBM no limita su responsabilidad de indemnización para los modelos desarrollados por ella.

Los modelos actuales watsonx que ahora están amparados por estas protecciones incluyen:

(1) Familia Slate de modelos de solo codificador

(2) Familia Granite de un modelo con decodificador únicamente

Aprenda más sobre las licencias para modelos Granite (PDF)

Dé el siguiente paso

Empiece a poner en práctica y a escalar la IA generativa y el aprendizaje automático para su negocio explorando nuestra prueba gratuita o reservando una demostración en vivo.

Comience su prueba sin coste

Reserve una demostración en vivo

Más formas de explorar

Póngase en contacto con la comunidad IBM

Lea la documentación de SaaS

Lea la documentación del software

Encuentre soporte

Notas de pie de página

^* Longitud de contexto admitida por el proveedor del modelo, pero la longitud de contexto real en la plataforma es limitada. Para más información, consulte Documentation.

La inferencia se factura en unidades de recursos. 1 unidad de recursos son 1000 tokens. Los tokens de entrada y finalización se cobran a la misma tarifa. 1000 tokens equivalen generalmente a alrededor de 750 palabras.

No todos los modelos están disponibles en todas las regiones. Consulte nuestra documentación para obtener más detalles.

La longitud del contexto se expresa en tokens.

Las declaraciones de IBM con respecto a sus planes, instrucciones e intenciones están sujetas a cambios o retiros sin previo aviso según el criterio exclusivo. Consulte los Precios para obtener más detalles. A menos que se especifique lo contrario en los precios del software, todas las características, capacidades y actualizaciones potenciales se refieren exclusivamente a SaaS. IBM no garantiza que las características y capacidades de SaaS del software sean las mismas.

Modelos fundacionales en watsonx.ai

Elija el modelo que necesita

¿Qué hay de nuevo?

Biblioteca de modelos fundacionales

Historias de clientes

Modelos fundacionales de IBM

Meta modelos

Modelos Mistral

Modelos fundacionales de terceros

Biblioteca de modelos de incrustación

Modelos de incorporación IBM

Modelos de incrustación de terceros

Recursos

Propiedad intelectual

Notas de pie de página