Granite

Modelos de IA abiertos, eficientes y de confianza diseñados para el negocio.

Ilustración de formas geométricas en capas en un degradado de colores
IBM Granite 4.0: la próxima generación de modelos Granite
Reduzca los costos y acelere las cargas de trabajo con modelos eficientes diseñados para la adopción de IA escalable y lista para la empresa.
Aprenda más

Conozca Granite

Cree y escale la IA más rápido con modelos personalizables de código abierto optimizados para cargas de trabajo empresariales, rentabilidad y despliegues flexibles.

Abierta
Con código abierto bajo Apache 2.0, Granite garantiza la transparencia, al tiempo que permite una personalización completa y flexibilidad de despliegue en cualquier infraestructura.
Rendimiento
Los modelos pequeños y de alto rendimiento están diseñados para maximizar la eficiencia y la escalabilidad de las tareas empresariales esenciales.
de confianza
Elimine el riesgo de la IA de "caja negra" con transparencia en los datos y procesos de entrenamiento, capacidades de detección de daños y medidas de seguridad integradas.

Presentamos Granite 4.0

Conozca los modelos

Granite 4.0 Nano
Tareas de IA ligeras, locales y periféricas en las que la capacidad de cálculo y la conectividad son limitadas.
Granite 4.0 Micro y Tiny
Tareas de gran volumen y baja complejidad en las que la velocidad, el costo y la eficiencia son la máxima prioridad.
Granite 4.0 Small
Flujos de trabajo empresariales que requieren un rendimiento más sólido sin el costo de los modelos de frontera

En cifras

70 %+
reducción de los requisitos de memoria
2X
velocidades de inferencia más rápidas
Granite-Docling: un modelo ultracompacto para la conversión de documentos
IBM® Granite-Docling es un modelo de código abierto y altamente eficiente que convierte documentos a formatos legibles por máquina, conservando íntegramente el diseño.
Aprenda más

Familia Granite de modelos pequeños

Modelos de lenguaje pequeños (SLM)

Modelos de lenguaje central con razonamiento, optimizados para RAG y flujos de trabajo agénticos.

Incrustación

Modelos que generan incorporaciones de texto de alta calidad para búsqueda semántica, RAG y recuperación de información contextual de varios turnos.

Conversión de documentos

Modelo de lenguaje de visión ultracompacto que convierte documentos en formatos estructurados legibles por máquina mientras se preserva el diseño, las tablas y las ecuaciones.

Visión

Modelos de visión y lenguaje eficientes para la comprensión de documentos e imágenes, lo que permite OCR, análisis de gráficos y extracción de contenido empresarial.

Discurso

Modelos ligeros de lenguaje hablado para transcripción y traducción en 7 idiomas, ofreciendo gran precisión y eficiencia.

Series temporales

Modelos ligeros previamente entrenados para un forecasting rápido y preciso de series de tiempo, optimizados para un despliegue eficiente en todos los entornos de hardware.

Protección

Modelos de protección que detectan alucinaciones, sesgo, contenido dañino y jailbreak, lo que garantiza un despliegue seguro de IA empresarial en todos los flujos de trabajo.

Geoespacial

Modelos NASA-IBM para la observación de la Tierra, que predicen la biomasa, el clima, la temperatura terrestre y las inundaciones a partir de datos satelitales a gran escala.

Rendimiento y eficiencia

Granite 4.0 está diseñado para la eficiencia, ya que utiliza menos memoria y ofrece velocidades más rápidas y un alto rendimiento. Este equilibrio permite a las empresas reducir costos y escalar soluciones más rápido en cargas de trabajo críticas.

Gráfico circular de requisitos de RAM de Granite 4.0

Los modelos Granite 4.0 están diseñados para hacer más con menos. Utilizan mucho menos memoria, más del 70 % menos que modelos similares, por lo que las organizaciones pueden ejecutar una IA potente en hardware más asequible. Eso significa menores costos de infraestructura, un rendimiento más rápido y la capacidad de escalar IA con mayor facilidad en todo el negocio.

Gráfico de líneas de rendimiento de Granite 4.0

Granite 4.0 ofrece un alto rendimiento constante a medida que escalan las cargas de trabajo, manejando lotes más grandes con facilidad mientras que otros modelos se ralentizan. Esto garantiza que las empresas puedan mantener un rendimiento confiable para aplicaciones que necesitan atender a muchos usuarios o tareas complejas a la vez.

Gráfico de diagrama de dispersión de rendimiento general de Granite 4.0

Granite 4.0 ofrece una mayor precisión con requisitos de memoria mucho más bajos que los modelos de la competencia, incluso en tamaños más pequeños. Esa eficiencia se traduce en ahorro de costos, mayor accesibilidad y la capacidad de desplegar la IA empresarial de manera más amplia y flexible.

Puntuación RAG de Granite 4.0
Granite 4.0 supera tanto a los modelos abiertos de tamaño similar como a los de mayor tamaño en tareas de RAG. Al ofrecer una mayor precisión sin exigir infraestructura adicional, Granite ayuda a las empresas a crear aplicaciones más confiables y basadas en el conocimiento, al tiempo que mantiene los despliegues eficientes y rentables.
Gráfico de barras de la clasificación IFEval de Granite 4.0

Granite 4.0 demuestra un rendimiento líder en el seguimiento de instrucciones entre modelos abiertos, una capacidad esencial para flujos de trabajo agentes. Al equilibrar una gran precisión con un tamaño más pequeño, Granite proporciona a las empresas resultados de alta calidad para tareas complejas a costos de infraestructura más bajos que los modelos abiertos más grandes.

Gráfico circular de requisitos de RAM de Granite 4.0

Los modelos Granite 4.0 están diseñados para hacer más con menos. Utilizan mucho menos memoria, más del 70 % menos que modelos similares, por lo que las organizaciones pueden ejecutar una IA potente en hardware más asequible. Eso significa menores costos de infraestructura, un rendimiento más rápido y la capacidad de escalar IA con mayor facilidad en todo el negocio.

Gráfico de líneas de rendimiento de Granite 4.0

Granite 4.0 ofrece un alto rendimiento constante a medida que escalan las cargas de trabajo, manejando lotes más grandes con facilidad mientras que otros modelos se ralentizan. Esto garantiza que las empresas puedan mantener un rendimiento confiable para aplicaciones que necesitan atender a muchos usuarios o tareas complejas a la vez.

Gráfico de diagrama de dispersión de rendimiento general de Granite 4.0

Granite 4.0 ofrece una mayor precisión con requisitos de memoria mucho más bajos que los modelos de la competencia, incluso en tamaños más pequeños. Esa eficiencia se traduce en ahorro de costos, mayor accesibilidad y la capacidad de desplegar la IA empresarial de manera más amplia y flexible.

Puntuación RAG de Granite 4.0
Granite 4.0 supera tanto a los modelos abiertos de tamaño similar como a los de mayor tamaño en tareas de RAG. Al ofrecer una mayor precisión sin exigir infraestructura adicional, Granite ayuda a las empresas a crear aplicaciones más confiables y basadas en el conocimiento, al tiempo que mantiene los despliegues eficientes y rentables.
Gráfico de barras de la clasificación IFEval de Granite 4.0

Granite 4.0 demuestra un rendimiento líder en el seguimiento de instrucciones entre modelos abiertos, una capacidad esencial para flujos de trabajo agentes. Al equilibrar una gran precisión con un tamaño más pequeño, Granite proporciona a las empresas resultados de alta calidad para tareas complejas a costos de infraestructura más bajos que los modelos abiertos más grandes.

Conozca Granite

Nuestra tercera generación de modelos de lenguaje de IA ya está aquí. Estos modelos preparados para la empresa, aptos para su propósito y de código abierto, ofrecen un rendimiento excepcional en función de los puntos de referencia de seguridad y en una amplia gama de tareas empresariales, desde ciberseguridad hasta RAG.

Conozca los nuevos modelos Granite 3.2 con funcionalidad de razonamiento

Granite para desarrolladores

Receta: resumen de documentos

Cree un resumen de documentos con IBM Granite para procesar documentos más allá de los límites de la ventana de contexto.

RAG con Langchain

Cree un pipeline de RAG con Granite para responder consultas utilizando una base de conocimientos externa.

Receta: RAG multimodal

Cree un pipeline de RAG multimodal con Granite y Docling para consultar texto, tablas e imágenes.

Guía: modelos de código abierto

Vea cómo los LLM de código abierto permiten la autonomía, reducen costos y ayudan a los desarrolladores con la evaluación, el ajuste y el despliegue.

Tutorial: Forecasting de series temporales

Utilice los modelos de series temporales de Granite para realizar forecasting de series temporales zero-shot y ajustados.

Tutorial: Traducción de voz

Utilice el reconocimiento automático de voz (ASR) para generar una transcripción de podcast con Granite y watsonx.ai.

Tutorial: Copiloto de IA local

Cree un copiloto de IA local a través de IBM Granite Code, Ollama y Continue.

Ver el recetario completo de granite

Ver el recetario completo de granite

Crear con Granite

Los modelos Granite impulsan la IA detrás de muchos productos y servicios de IBM. Descubra soluciones listas para usar para la generación de código, el desarrollo de aplicaciones y las pruebas de modelos. Todo con tecnología IBM Granite.

Manténgase al tanto de las novedades sobre la IA

Blog | Granite 3.2: Nuevo razonamiento y capacidades multimodales

Los últimos modelos Granite ofrecen nuevas capacidades de razonamiento, un modelo basado en la visión y una mayor eficiencia, lo que brinda resultados competitivos a un costo menor

Podcast | Datos de DeepSeek frente al revuelo, destilación de modelos y competencia de código abierto

En Mixture of Experts, episodio 40, el panel aborda los conceptos erróneos de DeepSeek R1, explica la destilación del modelo y analiza el escenario de competencia de código abierto.

Boletín AI Think | Obtenga insights de la IA

Reciba una selección de temas, tendencias e investigaciones sobre IA directamente en su bandeja de entrada.

Artículo | La IA de DeepSeek muestra el poder de los modelos pequeños

DeepSeek-R1 es un asistente digital que funciona tan bien como OpenAI o1 en ciertos puntos de referencia de IA para tareas matemáticas y de programación, se entrenó con muchos menos chips y es aproximadamente un 96 % más barato de usar, según la empresa.

IBM cree en la creación, el despliegue y la utilización de modelos de IA que impulsan la innovación en toda la empresa de manera responsable. La plataforma de datos y de IA watsonx tiene un proceso de extremo a extremo para diseñar y probar modelos fundacionales e IA generativa. Para los modelos desarrollados por IBM, buscamos y eliminamos duplicaciones; además, empleamos listas de bloqueo de URL, filtros para contenido objetable y calidad de documentos, división de oraciones y creación de tokens, todo antes del entrenamiento del modelo.

Durante el proceso de entrenamiento con datos, trabajamos para evitar desalineaciones en las salidas del modelo y utilizamos ajustes supervisados para permitir un mejor seguimiento de las instrucciones, de modo que el modelo pueda usarse para completar tareas empresariales mediante la ingeniería de indicaciones. Continuamos desarrollando los modelos Granite en varias direcciones, entre ellas otras modalidades, contenido específico de las industrias y más anotaciones de datos para el entrenamiento, al tiempo que desplegamos salvaguardas de protección de datos para los modelos desarrollados por IBM.  

Dado el cambiante panorama de la tecnología de la IA generativa, se espera que nuestro proceso de extremo a extremo evolucione y mejore continuamente. Como testimonio del rigor que IBM ejerce en el desarrollo y prueba de sus modelos fundacionales, la compañía proporciona su indemnización contractual estándar de propiedad intelectual para los modelos desarrollados por IBM, similar a la que ofrece para el hardware y los productos de software de IBM.

Además, a diferencia de otros proveedores de modelos de lenguajes de gran tamaño y en sintonía con el enfoque estándar de IBM sobre la indemnización, IBM no exige a sus clientes que indemnicen a IBM por el uso que hacen los clientes de los modelos desarrollados por IBM. Además, de acuerdo con el enfoque de IBM respecto de su obligación de indemnización, IBM no limita su responsabilidad de indemnización para los modelos desarrollados por IBM.

Los modelos actuales watsonx que ahora están amparados por estas protecciones incluyen:

(1) Familia Slate de modelos de solo codificador.

(2) Familia Granite de modelo de solo decodificador.

Obtenga más información sobre las licencias para los modelos Granite

* Cómo los modelos de IA más pequeños y adaptados a la industria pueden ofrecer mayores beneficios 
https://www.ft.com/partnercontent/ibm/how-smaller-industry-tailored-ai-models-can-offer-greater-benefits.html

1Rendimiento de los modelos Granite realizados por IBM Research en comparación con los principales modelos abiertos en puntos de referencia académicos y empresariales: https://ibm.com/new/ibm-granite-3-0-open-state-of-the-art-enterprise- modelos