Elija el modelo adecuado, desde parámetros de menos de mil millones hasta 34B, de código abierto bajo Apache 2.0.
No sacrifique el rendimiento por el costo. Granite supera a los modelos comparables1 en una variedad de tareas empresariales.
Cree IA responsable con un conjunto integral de capacidades de detección de riesgos y daños, transparencia y protección de la propiedad intelectual.
Modelos de lenguaje básicos y ajustados a las instrucciones con nuevas capacidades de razonamiento diseñados para flujos de trabajo de agentes, RAG, resumen de textos, analytics y extracción de textos, clasificación y generación de contenido.
Modelo preentrenado especializado en tareas de visión para la comprensión de documentos e imágenes, compatible con diversos tipos de archivos y resoluciones, y diseñado para un despliegue eficaz en entornos empresariales.
Modelos de solo decodificación diseñados para tareas generativas de código, como generación de código, explicación de código y edición de código, entrenados con código escrito en 116 lenguajes de programación.
Ligero y preentrenado para pronosticar seriales temporales, optimizado para funcionar de manera eficiente en una variedad de configuraciones de hardware.
Proteja la IA con Granite Guardian, garantizando la seguridad de los datos empresariales y mitigando los riesgos en una variedad de instrucciones de usuario y respuestas de LLM, con el mejor rendimiento en más de 15 puntos de referencia de seguridad.
La NASA e IBM se unieron para crear un modelo fundacional de IA para observaciones de la Tierra utilizando datos a gran escala de satélites y teledetección.
Diseñado para mejorar significativamente la comprensión de la intención del usuario y aumentar la relevancia de la información y las fuentes en respuesta a una consulta.
Nuestra tercera generación de modelos de lenguaje de IA ya está aquí. Estos modelos preparados para la empresa, aptos para su propósito y de código abierto, ofrecen un rendimiento excepcional en función de los puntos de referencia de seguridad y en una amplia gama de tareas empresariales, desde ciberseguridad hasta RAG.
Granite-3.2-8B-Instruct
DeepSeek-R1-Distill-Llama-8B
DeepSeek-R1-Distill-Qwen-7B
ArenaHard
55.23
17.17 |
10.36
Alpaca-Eval-2
61.16
21.85
15.35
IFEval
73.57
66.50
59.10
MMLU |
66.93
45.80
50.72
PopQA |
28.08
13.25
9.94
TruthfulQA |
66.37
47.43
47.14
BigBenchHard
65.60
65.71
65.04
DROP
50.73
44.46
42.76
GSM8K
83.09
72.18
78.47
HumanEval
89.47
67.54
79.89
HumanEval+
86.88
62.91
78.43
AttaQ
85.99
42.87
42.45
*Los precios mostrados son indicativos, pueden variar según el país, excluyen los impuestos y aranceles aplicables y están sujetos a la disponibilidad de la opción de productos en un lugar.
"En CrushBank, hemos visto de primera mano cómo los modelos de IA abiertos y eficientes de IBM aportan un valor real a la IA empresarial, ofreciendo el equilibrio adecuado entre rendimiento, rentabilidad y escalabilidad. Granite 3.2 va más allá con nuevas capacidades de razonamiento, y estamos emocionados de explorarlas en la creación de nuevas soluciones agénticas."
David Tan
Director de tecnología
CrushBank
Utilice IBM Docling y Granite 3.1 de código abierto para responder a preguntas visuales sobre documentos para varios tipos de archivos
Descubra cómo crear un agente de IA capaz de responder preguntas
En este tutorial empleará IBM Granite-3.0-8B-Instruct, el modelo que ahora está disponible en watsonx.ai para realizar llamadas a funciones personalizadas.
Cuantifique un modelo previamente entrenado de diferentes maneras para mostrar el tamaño de los modelos y comparar cómo se desempeñan en una tarea
Prevea el futuro con base en el aprendizaje con el modelo de TinyTimeMixer (TTM) de Granite
Convierta texto en una representación estructurada y genere una consulta SQL semánticamente correcta
Ajuste rápidamente un modelo Granite en Python con un conjunto de datos sintéticos que contenga reseñas positivas y negativas de clientes.
Ver el recetario completo de granite
Despliegue la IA a escala de forma segura con modelos Granite de código abierto en producción con Red Hat Enterprise Linux AI y watsonx. Desarrolle con mayor rapidez gracias a capacidades como la llamada a herramientas, 12 lenguajes, razonamiento en cadena y adaptadores multimodales.
Los últimos modelos Granite ofrecen nuevas capacidades de razonamiento, un modelo basado en la visión y una mayor eficiencia, lo que brinda resultados competitivos a un costo menor
En Mixture of Experts, episodio 40, el panel aborda los conceptos erróneos de DeepSeek R1, explica la destilación del modelo y analiza el escenario de competencia de código abierto.
Reciba una selección de temas, tendencias e investigaciones sobre IA directamente en su bandeja de entrada.
DeepSeek-R1 es un asistente digital que funciona tan bien como OpenAI o1 en ciertos puntos de referencia de IA para tareas matemáticas y de programación, se entrenó con muchos menos chips y es aproximadamente un 96 % más barato de usar, según la empresa.
IBM cree en la creación, el despliegue y la utilización de modelos de IA que impulsan la innovación en toda la empresa de manera responsable. La plataforma de datos y de IA watsonx tiene un proceso de extremo a extremo para diseñar y probar modelos fundacionales e IA generativa. Para los modelos desarrollados por IBM, buscamos y eliminamos duplicaciones; además, empleamos listas de bloqueo de URL, filtros para contenido objetable y calidad de documentos, división de oraciones y creación de tokens, todo antes del entrenamiento del modelo.
Durante el proceso de entrenamiento con datos, trabajamos para evitar desalineaciones en las salidas del modelo y utilizamos ajustes supervisados para permitir un mejor seguimiento de las instrucciones, de modo que el modelo pueda usarse para completar tareas empresariales mediante la ingeniería de indicaciones. Continuamos desarrollando los modelos Granite en varias direcciones, entre ellas otras modalidades, contenido específico de las industrias y más anotaciones de datos para el entrenamiento, al tiempo que desplegamos salvaguardas de protección de datos para los modelos desarrollados por IBM.
Dado el cambiante panorama de la tecnología de la IA generativa, se espera que nuestro proceso de extremo a extremo evolucione y mejore continuamente. Como testimonio del rigor que IBM ejerce en el desarrollo y prueba de sus modelos fundacionales, la compañía proporciona su indemnización contractual estándar de propiedad intelectual para los modelos desarrollados por IBM, similar a la que ofrece para el hardware y los productos de software de IBM.
Además, a diferencia de otros proveedores de modelos de lenguajes de gran tamaño y en sintonía con el enfoque estándar de IBM sobre la indemnización, IBM no exige a sus clientes que indemnicen a IBM por el uso que hacen los clientes de los modelos desarrollados por IBM. Además, de acuerdo con el enfoque de IBM respecto de su obligación de indemnización, IBM no limita su responsabilidad de indemnización para los modelos desarrollados por IBM.
Los modelos actuales watsonx que ahora están amparados por estas protecciones incluyen:
(1) Familia Slate de modelos de solo codificador.
(2) Familia Granite de modelo de solo decodificador.
Obtenga más información sobre las licencias para los modelos Granite
* Cómo los modelos de IA más pequeños y adaptados a la industria pueden ofrecer mayores beneficios
https://www.ft.com/partnercontent/ibm/how-smaller-industry-tailored-ai-models-can-offer-greater-benefits.html
1Rendimiento de los modelos Granite realizados por IBM Research en comparación con los principales modelos abiertos en puntos de referencia académicos y empresariales: https://ibm.com/new/ibm-granite-3-0-open-state-of-the-art-enterprise- modelos