Granite

Modelos de IA abiertos, eficaces y fiables, diseñados para empresas.

Ilustración de formas geométricas superpuestas en un degradado de colores
IBM Granite 4.0: la próxima generación de modelos Granite
Reduzca costes y acelere las cargas de trabajo con modelos eficientes diseñados para una adopción de IA escalable y preparada para la empresa.
Más información

Conozca Granite

Cree y amplíe la IA más rápidamente con modelos personalizables y de código abierto, optimizados para cargas de trabajo empresariales, rentabilidad e implementaciones flexibles.

Abierta
De código abierto bajo Apache 2.0, Granite garantiza la transparencia, al mismo tiempo que permite una personalización total y flexibilidad de implementación en cualquier infraestructura.
Rendimiento
Los modelos pequeños y de alto rendimiento están diseñados para maximizar la eficiencia y la escalabilidad en las tareas empresariales esenciales.
de confianza
Elimine el riesgo de la IA de "caja negra" con transparencia en los datos y procesos de entrenamiento, capacidades de detección de daños y salvaguardas integrados.
Más información

Presentamos Granite 4.0

Conozca los modelos

Granite 4.0 Nano
Tareas de IA ligeras, locales y periféricas en las que la capacidad de cálculo y la conectividad son limitadas
Granite 4.0 Micro y Tiny
Tareas de gran volumen y baja complejidad en las que la velocidad, el coste y la eficiencia son la máxima prioridad
Granite 4.0 Small
Flujos de trabajo empresariales que requieren un mayor rendimiento sin el coste de los modelos de vanguardia
Más información

En cifras

+70 %
de reducción en los requisitos de memoria
2x
más rápido en velocidades de inferencia
Granite-Docling: un modelo ultracompacto para la conversión de documentos
IBM Granite-Docling es un modelo de código abierto y altamente eficiente que convierte documentos a formatos legibles por máquina conservando íntegramente el diseño.
Más información

Familia Granite de modelos pequeños

Modelos de lenguaje pequeños (SLM)

Modelos de lenguaje básicos con razonamiento, optimizados para RAG y flujos de trabajo agénticos.

Incrustación

Modelos que generan embeddings de texto de alta calidad para la búsqueda semántica, RAG y recuperación de información contextual de múltiples turnos.

Conversión de documentos

Modelo de lenguaje visual ultracompacto que convierte documentos en formatos estructurados y legibles por máquina, conservando el diseño, las tablas y las ecuaciones.

Visión

Modelos eficientes de visión y lenguaje para la comprensión de documentos e imágenes que permiten el reconocimiento óptico de caracteres (OCR), el análisis de gráficos y la extracción de contenido empresarial.

Discurso

Modelos ligeros de lenguaje y voz para la transcripción y traducción en 7 idiomas que ofrecen una gran precisión y eficiencia.

Series temporales

Modelos ligeros preentrenados para realizar previsiones rápidas y precisas de series temporales, optimizados para una implementación eficiente en entornos de hardware.

Protección

Modelos de protección que detectan alucinaciones, sesgos, contenido perjudicial y fugas para garantizar una implementación segura de la IA empresarial en todos los flujos de trabajo.

Geoespacial

Modelos de la NASA e IBM para la observación de la Tierra que predicen la biomasa, el clima, la temperatura terrestre y las inundaciones a partir de datos satelitales a gran escala.

Rendimiento y eficiencia

Granite 4.0 está diseñado para ofrecer eficiencia, ya que utiliza menos memoria y proporciona velocidades más rápidas y un alto rendimiento. Este equilibrio permite a las empresas reducir costes y escalar soluciones con mayor rapidez en cargas de trabajo críticas.

Gráfico circular de requisitos de RAM de Granite 4.0

Los modelos Granite 4.0 están diseñados para hacer más con menos. Utilizan mucha menos memoria (más del 70 % menos que modelos similares), por lo que las organizaciones pueden ejecutar una IA potente en un hardware más asequible. Esto se traduce en menores costes de infraestructura, mayor rapidez de rendimiento y la posibilidad de escalar la IA con mayor facilidad en toda la empresa.

Gráfico lineal de rendimiento de Granite 4.0

Granite 4.0 ofrece un rendimiento elevado y constante a medida que aumentan las cargas de trabajo y gestiona con facilidad lotes de mayor tamaño, mientras que otros modelos se ralentizan. De este modo, las empresas pueden garantizar un rendimiento fiable para aplicaciones que deben atender a muchos usuarios o tareas complejas simultáneamente.

Gráfico de dispersión del rendimiento general de Granite 4.0

Granite 4.0 ofrece una mayor precisión con requisitos de memoria mucho menores que los de los modelos de la competencia, incluso en tamaños más pequeños. Esta eficiencia se traduce en un ahorro de costes, una mayor accesibilidad y la posibilidad de implementar la IA empresarial de manera más amplia y flexible.

Puntuación RAG de Granite 4.0
Granite 4.0 supera a modelos abiertos de tamaño similar e incluso a modelos de mayor tamaño en tareas RAG. Al ofrecer una mayor precisión sin necesidad de infraestructura adicional, Granite permite a las empresas crear aplicaciones más fiables y basadas en el conocimiento, manteniendo la eficiencia y la rentabilidad de las implementaciones.
Gráfico de barras de la tabla de clasificación IFEval de Granite 4.0

Granite 4.0 ofrece un rendimiento líder en el sector en cuanto al seguimiento de instrucciones entre los modelos abiertos, una capacidad esencial para los flujos de trabajo agentes. Al combinar una gran precisión con un tamaño reducido, Granite ofrece a las empresas outputs de alta calidad para tareas complejas con unos costes de infraestructura inferiores a los de los modelos de mayor tamaño.

Gráfico circular de requisitos de RAM de Granite 4.0

Los modelos Granite 4.0 están diseñados para hacer más con menos. Utilizan mucha menos memoria (más del 70 % menos que modelos similares), por lo que las organizaciones pueden ejecutar una IA potente en un hardware más asequible. Esto se traduce en menores costes de infraestructura, mayor rapidez de rendimiento y la posibilidad de escalar la IA con mayor facilidad en toda la empresa.

Gráfico lineal de rendimiento de Granite 4.0

Granite 4.0 ofrece un rendimiento elevado y constante a medida que aumentan las cargas de trabajo y gestiona con facilidad lotes de mayor tamaño, mientras que otros modelos se ralentizan. De este modo, las empresas pueden garantizar un rendimiento fiable para aplicaciones que deben atender a muchos usuarios o tareas complejas simultáneamente.

Gráfico de dispersión del rendimiento general de Granite 4.0

Granite 4.0 ofrece una mayor precisión con requisitos de memoria mucho menores que los de los modelos de la competencia, incluso en tamaños más pequeños. Esta eficiencia se traduce en un ahorro de costes, una mayor accesibilidad y la posibilidad de implementar la IA empresarial de manera más amplia y flexible.

Puntuación RAG de Granite 4.0
Granite 4.0 supera a modelos abiertos de tamaño similar e incluso a modelos de mayor tamaño en tareas RAG. Al ofrecer una mayor precisión sin necesidad de infraestructura adicional, Granite permite a las empresas crear aplicaciones más fiables y basadas en el conocimiento, manteniendo la eficiencia y la rentabilidad de las implementaciones.
Gráfico de barras de la tabla de clasificación IFEval de Granite 4.0

Granite 4.0 ofrece un rendimiento líder en el sector en cuanto al seguimiento de instrucciones entre los modelos abiertos, una capacidad esencial para los flujos de trabajo agentes. Al combinar una gran precisión con un tamaño reducido, Granite ofrece a las empresas outputs de alta calidad para tareas complejas con unos costes de infraestructura inferiores a los de los modelos de mayor tamaño.

Granite para desarrolladores

Receta: Resumen de documentos

Cree un generador de resúmenes de documentos con IBM Granite para procesar documentos más allá de los límites de la ventana de contexto.

RAG con Langchain

Crea un pipeline RAG con Granite para responder a consultas utilizando una base de conocimientos externa.

Receta: RAG multimodal

Cree un pipeline RAG multimodal con Granite y Docling para consultar texto, tablas e imágenes.

Guía: Modelos de código abierto

Descubra cómo los LLM de código abierto permiten la autonomía, reducen los costes y ayudan a los desarrolladores en la evaluación, el ajuste y la implementación.

Tutorial: Previsión de series temporales

Utilice los modelos de series temporales de Granite para realizar previsiones de series temporales sin necesidad de entrenamiento previo y con un ajuste preciso.

Tutorial: Traducción de voz

Utilice el reconocimiento automático de voz (ASR) para generar una transcripción de pódcast con Granite y watsonx.ai.

Tutorial: Copiloto de IA local

Cree un copiloto de IA local con IBM Granite Code, Ollama y Continue.

Consulte el manual de instrucciones completo de Granite

Consulte el manual de instrucciones completo de Granite

Diseñe con Granite

Los modelos Granite están detrás de la IA de muchos productos y servicios de IBM. Descubra soluciones listas para usar en la generación de código, el desarrollo de aplicaciones y la prueba de modelos. Todo ello, impulsado por IBM Granite.

Manténgase al tanto de las noticias sobre IA

Blog | Granite 3.2: Nuevas capacidades de razonamiento y multimodales

Los últimos modelos Granite ofrecen nuevas capacidades de razonamiento, un modelo basado en la visión y una mayor eficiencia, lo que se traduce en resultados competitivos a un coste menor

Pódcast | DeepSeek facts vs hype, model distillation, and open source competition

En Mixture of Experts - episodio 40, el panel aborda los conceptos erróneos de DeepSeek R1, explica la destilación del modelo y disecciona el panorama de la competencia de código abierto.

Boletín de Think IA | Obtenga conocimientos de IA

Reciba directamente en su bandeja de entrada una selección curada de temas, tendencias e investigaciones sobre IA.

Artículo | La IA de DeepSeek muestra el poder de los modelos pequeños

DeepSeek-R1 es un asistente digital que rinde tan bien como el o1 de OpenAI en determinadas pruebas de referencia de IA para tareas matemáticas y de codificación, se entrenó con muchos menos chips y es aproximadamente un 96 % más barato de usar, según la empresa.

IBM cree en la creación, implementación y utilización de modelos de IA que impulsen la innovación en toda la empresa de manera responsable. La plataforma de datos e IA IBM watsonx cuenta con un proceso integral para crear y probar modelos fundacionales e IA generativa. Para los modelos desarrollados por IBM, buscamos y eliminamos duplicaciones, y empleamos listas de bloqueo de URL, filtros para contenido objetable y calidad de documentos, división de oraciones y técnicas de tokenización, todo ello antes de la fase de entrenamiento del modelo.

Durante el proceso de entrenamiento con datos, trabajamos para evitar desajustes en los resultados del modelo y utilizamos ajustes supervisados para facilitar el seguimiento de las instrucciones, de modo que el modelo pueda usarse para completar tareas empresariales mediante prompt engineering. Seguimos desarrollando los modelos Granite en varias direcciones, incluidas otras modalidades, contenidos específicos del sector y anotaciones de datos adicionales para el entrenamiento, al tiempo que implementamos salvaguardas regulares y continuas de protección de datos para los modelos desarrollados por IBM. 

Dada la rápida evolución del panorama tecnológico de la IA generativa, se espera que nuestros procesos integrales evolucionen y mejoren continuamente. Como testimonio del rigor que IBM pone en el desarrollo y prueba de sus modelos fundacionales, la compañía proporciona su indemnización contractual estándar de propiedad intelectual para los modelos desarrollados por IBM, similar a la que proporciona para el hardware y los productos de software de IBM.

Además, a diferencia de otros proveedores de grandes modelos de lenguaje y en consonancia con el enfoque estándar de IBM en materia de indemnización, IBM no exige a sus clientes que indemnicen a IBM por el uso que hacen de los modelos desarrollados por IBM. Durante el proceso de entrenamiento con datos, trabajamos para evitar desalineaciones en los resultados del modelo y utilizamos ajustes supervisados para permitir un mejor seguimiento de las instrucciones, de modo que el modelo pueda usarse para completar tareas empresariales mediante ingeniería rápida.

Entre los modelos watsonx que actualmente gozan de estas protecciones figuran:

(1) Familia Slate de modelos solo con codificador.

(2) Familia Granite de modelo solo con decodificador.

Más información sobre licencias para modelos Granite

* Cómo los modelos de IA más pequeños y adaptados al sector pueden ofrecer mayores beneficios [How smaller, industry-tailored AI models can offer greater benefits] 
https://www.ft.com/partnercontent/ibm/how-smaller-industry-tailored-ai-models-can-offer-greater-benefits.html

1Rendimiento de los modelos Granite realizados por IBM Research frente a los principales modelos abiertos, tanto en el ámbito académico como en el empresarial - https://ibm.com/new/ibm-granite-3-0-open-state-of-the-art-enterprise-models