Elija el modelo adecuado, desde parámetros por debajo del billón hasta 34B, de código abierto bajo Apache 2.0.
No sacrifique el rendimiento en aras del coste. Granite supera a los modelos comparables1 en una gran variedad de tareas empresariales.
Cree una IA responsable con un conjunto completo de capacidades de detección de riesgos y daños, transparencia y protección de la propiedad intelectual.
Modelos de lenguaje base y ajustados mediante instrucciones con nuevas capacidades de razonamiento diseñadas para flujos de trabajo agentivos, RAG, resumen de textos, análisis y extracción de textos, clasificación y generación de contenidos.
Modelo preentrenado especializado en tareas de visión para la comprensión de documentos e imágenes, compatible con una amplia gama de tipos de archivo y resoluciones, y diseñado para una implementación eficiente en entornos empresariales.
Modelos de solo decodificación diseñados para tareas generativas de código, incluidas la generación, la explicación y la edición de código, entrenados con código escrito en 116 lenguajes de programación.
Ligero y preentrenado para la previsión de series temporales, optimizado para funcionar de manera eficaz en una amplia gama de configuraciones de hardware.
Proteja la IA con Granite Guardian, para garantizar la seguridad de los datos de la empresa y mitigar los riesgos en una variedad de solicitudes de usuarios y respuestas LLM, con el máximo rendimiento en más de 15 puntos de referencia de seguridad.
La NASA e IBM se unieron para crear un modelo fundacional de IA para observar la Tierra utilizando datos por satélite y teledetección a gran escala.
Diseñado para mejorar significativamente la comprensión de la intención del usuario y aumentar la relevancia de la información y las fuentes en respuesta a una consulta.
Aplicar las capacidades de razonamiento a Granite dio lugar a un salto significativo en el seguimiento de instrucciones complejas y mantuvo las características generales de rendimiento y seguridad, mientras que los modelos comparables experimentaron una degradación en estos dominios
Granite-3.2-8B-Instruct
DeepSeek-R1-Distill-Llama-8B
DeepSeek-R1-Distill-Qwen-7B
ArenaHard
55.23
17.17 |
10.36
Alpaca-Eval-2
61.16
21,85
15.35
IFEval
73.57
66.50
59.10
MMLU |
66.93
45.80
50.72
PopQA |
28.08
13.25
9.94
TruthfulQA |
66.37
47.43
47.14
BigBenchHard
65.60
65.71
65.04
DROP
50.73
44.46
42,76
GSM8K
83.09
72.18
78.47
HumanEval
89.47
67.54
79.89
HumanEval+
86.88
62,91
78.43
AttaQ
85.99
42,87
42.45
*Los precios indicados son orientativos, pueden variar según el país, no incluyen impuestos ni aranceles aplicables y están sujetos a la disponibilidad de la oferta de productos
"En CrushBank, hemos comprobado de primera mano cómo los modelos de IA abiertos y eficientes de IBM aportan un valor real a la IA empresarial, ofreciendo el equilibrio adecuado entre rendimiento, rentabilidad y escalabilidad. Granite 3.2 va más allá con nuevas capacidades de razonamiento, y estamos entusiasmados por explorarlas en el desarrollo de nuevas soluciones agentivas".
David Tan
CTO
CrushBank
Utilice IBM Docling y Granite 3.1 de código abierto para responder a preguntas visuales sobre documentos para varios tipos de archivos
Descubra cómo crear un agente de IA que pueda responder preguntas
En este tutorial, utilizará el modelo IBM Granite-3.0-8B-Instruct ahora disponible en watsonx.ai para realizar llamadas a funciones personalizadas.
Cuantifique un modelo preentrenado de varias formas diferentes para mostrar el tamaño de los modelos y comparar su rendimiento en una tarea.
Pronostique el futuro en función del aprendizaje con el modelo Granite TinyTimeMixer (TTM)
Convierta texto en una representación estructurada y genere una consulta SQL semánticamente correcta
Prompt sintoniza un modelo Granite en Python mediante un conjunto de datos sintéticos que contenga reseñas positivas y negativas de clientes
Consulte el manual de instrucciones completo de Granite
Implemente la IA a escala de forma segura con modelos Granite de código abierto en producción con Red Hat Enterprise Linux AI y watsonx. Desarrolle con mayor rapidez gracias a capacidades como la llamada a herramientas, 12 lenguajes, razonamiento en cadena y adaptadores multimodales.
Los últimos modelos Granite ofrecen nuevas capacidades de razonamiento, un modelo basado en la visión y una mayor eficiencia, lo que se traduce en resultados competitivos a un coste menor
En Mixture of Experts - episodio 40, el panel aborda los conceptos erróneos de DeepSeek R1, explica la destilación del modelo y disecciona el panorama de la competencia de código abierto.
Reciba directamente en su bandeja de entrada una selección curada de temas, tendencias e investigaciones sobre IA.
DeepSeek-R1 es un asistente digital que rinde tan bien como el o1 de OpenAI en determinadas pruebas de referencia de IA para tareas matemáticas y de codificación, se entrenó con muchos menos chips y es aproximadamente un 96 % más barato de usar, según la empresa.
IBM cree en la creación, implementación y utilización de modelos de IA que impulsen la innovación en toda la empresa de manera responsable. La plataforma de datos e IA IBM watsonx cuenta con un proceso integral para crear y probar modelos fundacionales e IA generativa. Para los modelos desarrollados por IBM, buscamos y eliminamos duplicaciones, y empleamos listas de bloqueo de URL, filtros para contenido objetable y calidad de documentos, división de oraciones y técnicas de tokenización, todo ello antes de la fase de entrenamiento del modelo.
Durante el proceso de entrenamiento con datos, trabajamos para evitar desajustes en los resultados del modelo y utilizamos ajustes supervisados para facilitar el seguimiento de las instrucciones, de modo que el modelo pueda usarse para completar tareas empresariales mediante prompt engineering. Seguimos desarrollando los modelos Granite en varias direcciones, incluidas otras modalidades, contenidos específicos del sector y anotaciones de datos adicionales para el entrenamiento, al tiempo que implementamos salvaguardas regulares y continuas de protección de datos para los modelos desarrollados por IBM.
Dada la rápida evolución del panorama tecnológico de la IA generativa, se espera que nuestros procesos integrales evolucionen y mejoren continuamente. Como testimonio del rigor que IBM pone en el desarrollo y prueba de sus modelos fundacionales, la compañía proporciona su indemnización contractual estándar de propiedad intelectual para los modelos desarrollados por IBM, similar a la que proporciona para el hardware y los productos de software de IBM.
Además, a diferencia de otros proveedores de grandes modelos de lenguaje y en consonancia con el enfoque estándar de IBM en materia de indemnización, IBM no exige a sus clientes que indemnicen a IBM por el uso que hacen de los modelos desarrollados por IBM. Durante el proceso de entrenamiento con datos, trabajamos para evitar desalineaciones en los resultados del modelo y utilizamos ajustes supervisados para permitir un mejor seguimiento de las instrucciones, de modo que el modelo pueda usarse para completar tareas empresariales mediante ingeniería rápida.
Entre los modelos watsonx que actualmente gozan de estas protecciones figuran:
(1) Familia Slate de modelos solo con codificador.
(2) Familia Granite de modelo solo con decodificador.
* Cómo los modelos de IA más pequeños y adaptados al sector pueden ofrecer mayores beneficios
https://www.ft.com/partnercontent/ibm/how-smaller-industry-tailored-ai-models-can-offer-greater-benefits.html
1Rendimiento de los modelos Granite realizados por IBM Research frente a los principales modelos abiertos, tanto en el ámbito académico como en el empresarial - https://ibm.com/new/ibm-granite-3-0-open-state-of-the-art-enterprise-models