Granite

Abierto. Eficiente. De confianza. Licencia Apache 2.0. Firmado criptográficamente1. Certificado ISO2.

Ilustración de formas geométricas superpuestas en un degradado de colores
IBM Granite 4.1 está impulsando la implementación segura de IA en las instalaciones
Modelos ligeros y de alto rendimiento, lanzados bajo una licencia Apache 2.0, diseñados para cargas de trabajo empresariales escalables
Más información sobre Granite 4.1

¿Por qué construir con Granite?

Cree y escale la IA más rápido con modelos personalizables de código abierto optimizados para cargas de trabajo empresariales, rentabilidad e implementaciones flexibles.

Abierta
De código abierto bajo Apache 2.0, Granite garantiza la transparencia, al mismo tiempo que permite una personalización total y flexibilidad de implementación en cualquier infraestructura.
Descargue los modelos
Rendimiento
Los modelos pequeños y de alto rendimiento están diseñados para maximizar la eficiencia y la escalabilidad en las tareas empresariales esenciales.
Revise los puntos de referencia
de confianza
Elimine el riesgo de la IA de "caja negra" con transparencia en los datos y procesos de entrenamiento, capacidades de detección de daños y salvaguardas integrados.
Más información
Presentamos Granite 4.1
Modelos de lenguaje Granite 4.1

Nuestros modelos de lenguaje base más potentes y densos hasta ahora. Compiten con modelos de pensamiento más grandes en una amplia gama de tareas empresariales, a una fracción del coste. 

Descargar modelos de lenguaje
Modelos de voz Granite 4.1

Pequeños pero potentes. Precisión de transcripción líder en el sector en acentos, dominios y entornos ruidosos. 

Descargar modelos de habla
Modelos de visión Granite 4.1

Comprenda documentos, gráficos e imágenes con precisión de nivel empresarial.

Descargar modelos de visión
Modelos Granite Guardian 4.1

Guardrails para detectar contenido malintencionado y outputs dañinos. Diseñados para el cumplimiento empresarial.

Descargar modelos Guardian
Modelos de embedding de Granite

Representaciones semánticas precisas para la recuperación, la búsqueda y la clasificación.

Descargar modelos de embedding

Explore los puntos de referencia

Estos modelos se evaluaron en función de una gran colección de conjuntos de datos y métricas para cubrir diferentes aspectos de la generación de texto. Consulte otros puntos de referencia en el blog técnico de Granite.​

 

Referencia​Métricagranite-4.1-3b​granite-4.1-8b​granite-4.1-30b​
MMLU​5-shot​67,02​73,84​80,16​
IFEval Avg​ 82,3​87,06​89,65​
ArenaHard​ 37,8​68,98​71,02​
GSM8K​8-shot​86,88​92,49​94,16​
HumanEval​pass@1​79,27​87,2​89,63​
BFCL v3​ 60,8​68,27​73,68​
MMMLU​5-shot​57,61​64,84​73,71​
AttaQ​ 81,88​81,19​85,76​

Acceder y construir

Hugging Face

Ir a Hugging Face
Ollama

Ir a Ollama
LM Studio

Ir a LM Studio
watsonx.ai

Ir a watsonx
OpenRouter

Ir a OpenRouter
Replicate

Ir a Replicate
Weights & Biases

Ir a Weights & Biases
Unsloth

Ir a Unsloth
AnythingLLM

Ir a AnythingLLM

Rendimiento y eficiencia

Granite 4.1 ofrece un rendimiento competitivo de seguimiento de instrucciones y llamada de herramientas sin depender de largas cadenas de pensamiento, ofreciendo latencia predecible, uso de token estable y menor coste operativo. Esto lo convierte en una opción sólida y lista para producción para cargas de trabajo empresariales donde la eficiencia y la fiabilidad son lo más importante.

Los modelos de lenguaje Granite 4.1 entienden y ejecutan instrucciones basadas en herramientas, lo que permite una integración perfecta con varias herramientas de software y API. Esta capacidad permite a las empresas crear potentes flujos de trabajo impulsados por IA al tiempo que automatizan tareas complejas.

Gráfico de barras horizontales titulado "Los modelos de lenguaje Granite 4.1 ofrecen capacidades superiores de llamada a herramientas", basado en las puntuaciones de referencia de BFCL V3 (cuanto más altas, mejor). Granite-4.1-30B ocupa el primer lugar con 73,7, seguido de Gemma-4-31B-it con 72,7 y Granite-4.1-8B con 68,3. Los modelos restantes obtienen una puntuación de entre 61,7 y 67,8, incluidos Gemma-4-26B-A4B-it (67,8), Qwen3-30B-A3B-Instruct-2507 (65,1), Granite-4.0-H-Small (64,7), Qwen3.5-35B-A3B (64,2), Gemma-4-E4B-it (63,2), Qwen3-4B-Instruct-2507 (61,9) y Qwen3.5-9B (61,7). Los modelos Granite 4.1 están resaltados en azul y superan a los demás.

Los modelos de lenguaje Granite 4.1 comprenden y se adhieren a las instrucciones del usuario, lo que garantiza una finalización fiable y precisa de las tareas. Esta capacidad es especialmente valiosa para las empresas que buscan automatizar procesos y proporcionar resultados consistentes y de alta calidad.

Gráfico de barras horizontales titulado "Los modelos de lenguaje Granite 4.1 ofrecen capacidades competitivas de seguimiento de instrucciones", basado en los resultados de IFEval. Gemma-4-31B-it ocupa el primer lugar con 94,1, seguido de Gemma-4-26B-A4B-it con 91,3. Granite-4.1-30B obtiene una puntuación de 89,7, un rendimiento ligeramente superior a Qwen3.5-35B-A3B con 89,1 y por delante de varios modelos agrupados entre aproximadamente 85 y 88, incluido Gemma-4-E4B-it (87,8), Granite-4.0-H-Small (87,5), Qwen3.5-9B (87,2) y Granite-4.1-8B (87,1). Las puntuaciones más bajas incluyen Granite-4.1-3B con 82,1 y Qwen3.5-2B con 70,6. Los modelos Granite 4.1 están resaltados en azul, mostrando un rendimiento competitivo pero no superior en comparación con los modelos Gemma.

Granite Guardian 4.1 detecta las dimensiones de riesgo clave catalogadas en el IBM AI Risk Atlas. Entrenado con datos únicos que incluyen anotaciones humanas y datos sintéticos de red teaming interno, Guardian supera a modelos similares en referencias estándar (incluyendo, entre otros, intentos de jailbreak, lenguaje ofensivo y alucinaciones relacionados con llamadas a herramientas y generación aumentada por recuperación en sistemas basados en agentes).

Tabla que compara el rendimiento del modelo en conjuntos de datos de evaluación, con columnas para Granite-Guardian-4.1-8B, OffsetBias-8B, Skywork-Reward-8B, Skywork-Reward-27B, SFR-Judge-70B y una línea base de Oracle. Granite-Guardian-4.1-8B (resaltado) logra sólidos resultados en todos los conjuntos de datos: GSM8k (93,71), MATH (50,79), HumanEval+ (80,08), MBPP+ (70,63), BigCodeBench (43,70) e IFEval (82,81), con una puntuación global de 70,29. Supera ligeramente a otros modelos en la mayoría de las categorías, mientras que las puntuaciones de Oracle siguen siendo las más altas en general, incluidos 97,46 en el GSM8k y 81,54 en general.

Granite Speech 4.1 ofrece un reconocimiento de voz altamente preciso y listo para la empresa en diversos entornos de audio del mundo real, logrando bajas tasas de error de palabras en puntos de referencia que abarcan voz conversacional, reuniones, presentaciones y llamadas de resultados o "earning calls".

Gráfico de barras agrupadas titulado "Granite Speech 4.1 supera a sus pares en precisión de transcripción", que muestra las tasas de error de palabras ASR en inglés en nueve conjuntos de datos (cuanto más bajo, mejor): GigaSpeech, LScln, LSoth, SPGI, AMI_IHM, AMI_SDM, VoxPopuli, TED-LIUM y Earnings-22. Se comparan varios modelos, incluyendo las variantes Whisper-large-v3, Gemini 2.0 Flash, phi-4-mm, Qwen ASR, Canary y Granite Speech (azul más claro). Los modelos Granite Speech siempre alcanzan una de las tasas de error más bajas en la mayoría de los conjuntos de datos. Las tasas de error oscilan entre 1 y 2 en LScln, entre 3 y 5 en LSoth y SPGI, entre 9 y 16 en AMI_IHM y las más altas en AMI_SDM (aproximadamente 22–41). El gráfico destaca que Granite Speech 4.1 ofrece la mejor precisión de transcripción general en relación con los modelos de la competencia.

Granite Vision 4.1 ofrece un rendimiento líder en el sector en la extracción de información estructurada de contenido visual, logrando la puntuación media más alta en siete puntos de referencia que abarcan la extracción de gráficos, la extracción de tablas y la extracción de pares clave-valor (KVP).

Gráfico de barras horizontales titulado "Granite Vision 4.1 supera a Claude Opus 4.6 en extracción de tablas", que muestra las puntuaciones medias en siete puntos de referencia de extracción (cuanto más altas, mejor). Granite-Vision-4.1-4B ocupa el primer lugar con una puntuación de 86,5, seguido de Claude-Opus-4.6 con 83,8. Otros modelos obtienen una puntuación más baja: Gemma4-E4B (72,4), Qwen3.5-4B (71,7), Ministral-3-8B (68.2), e InternVL3.5-4B (66,4). Granite Vision está resaltado en azul, Claude en morado y los demás modelos en gris, lo que destaca a Granite Vision como el de mejor rendimiento.

Con la confianza de empresas de todos los sectores

US Open

El US Open quería involucrar a los aficionados de todo el mundo con experiencias digitales en constante evolución. IBM ayudó a transformar los grandes datos de los partidos en información impulsada por IA y características interactivas, ofreciendo una experiencia dinámica de la aplicación y el sitio web que mantiene a los fans conectados e inmersos en cada momento.

14M
millones de fans de todo el mundo que acceden a experiencias digitales de primera clase
7 millones
puntos de datos capturados y analizados a lo largo del torneo
Vista amplia del estadio del US Open con los aficionados viendo un partido

Granite para desarrolladores

Receta: Resumen de documentos

Cree un generador de resúmenes de documentos con IBM Granite para procesar documentos más allá de los límites de la ventana de contexto.

RAG con Langchain

Crea un pipeline RAG con Granite para responder a consultas utilizando una base de conocimientos externa.

Receta: RAG multimodal

Cree un pipeline RAG multimodal con Granite y Docling para consultar texto, tablas e imágenes.

Guía: Modelos de código abierto

Descubra cómo los LLM de código abierto permiten la autonomía, reducen los costes y ayudan a los desarrolladores en la evaluación, el ajuste y la implementación.

Tutorial: Previsión de series temporales

Utilice los modelos de series temporales de Granite para realizar previsiones de series temporales sin necesidad de entrenamiento previo y con un ajuste preciso.

Manual de Granite Agent

Recetas de Granite para tareas agénticas.

Tutorial: Copiloto de IA local

Cree un copiloto de IA local con IBM Granite Code, Ollama y Continue.

Manual de Granite

Consulte el manual completo de Granite

Diseñe con Granite

Los modelos Granite están detrás de la IA de muchos productos y servicios de IBM. Descubra soluciones listas para usar en la generación de código, el desarrollo de aplicaciones y la prueba de modelos. Todo ello, impulsado por IBM Granite.

Agente de codificación de IA

Acelere la codificación y optimice el desarrollo con IA y automatización aprovechando los modelos Granite.

Explore el agente de codificación de IA
watsonx.ai

Cree e implemente aplicaciones de IA con modelos Granite o seleccione entre una variedad de modelos de terceros.

Explore watsonx.ai
watsonx Orchestrate

Desarrolle y gestione agentes de IA impulsados por Granite y explore el catálogo de agentes prediseñados.

Explore watsonx Orchestrate
Red Hat Enterprise Linux AI

Desarrolle, pruebe y ejecute LLM, incluyendo Granite.

Explore la IA de Red Hat Enterprise Linux

IBM cree en la creación, implementación y utilización de modelos de IA que impulsen la innovación en toda la empresa de manera responsable. La plataforma de datos e IA IBM watsonx cuenta con un proceso integral para crear y probar modelos fundacionales e IA generativa. Para los modelos desarrollados por IBM, buscamos y eliminamos duplicaciones, y empleamos listas de bloqueo de URL, filtros para contenido objetable y calidad de documentos, división de oraciones y técnicas de tokenización, todo ello antes de la fase de entrenamiento del modelo.

Durante el proceso de entrenamiento con datos, trabajamos para evitar desajustes en los resultados del modelo y utilizamos ajustes supervisados para facilitar el seguimiento de las instrucciones, de modo que el modelo pueda usarse para completar tareas empresariales mediante prompt engineering. Seguimos desarrollando los modelos Granite en varias direcciones, incluidas otras modalidades, contenidos específicos del sector y anotaciones de datos adicionales para el entrenamiento, al tiempo que implementamos salvaguardas regulares y continuas de protección de datos para los modelos desarrollados por IBM. 

Dada la rápida evolución del panorama tecnológico de la IA generativa, se espera que nuestros procesos integrales evolucionen y mejoren continuamente. Como testimonio del rigor que IBM pone en el desarrollo y prueba de sus modelos fundacionales, la compañía proporciona su indemnización contractual estándar de propiedad intelectual para los modelos desarrollados por IBM, similar a la que proporciona para el hardware y los productos de software de IBM.

Además, a diferencia de otros proveedores de grandes modelos de lenguaje y en consonancia con el enfoque estándar de IBM en materia de indemnización, IBM no exige a sus clientes que indemnicen a IBM por el uso que hacen de los modelos desarrollados por IBM. Durante el proceso de entrenamiento con datos, trabajamos para evitar desalineaciones en los resultados del modelo y utilizamos ajustes supervisados para permitir un mejor seguimiento de las instrucciones, de modo que el modelo pueda usarse para completar tareas empresariales mediante ingeniería rápida.

Entre los modelos watsonx que actualmente gozan de estas protecciones figuran:

(1) Familia Slate de modelos solo con codificador.

(2) Familia Granite de modelo solo con decodificador.

Más información sobre licencias para modelos Granite

1Desde el 29 de abril de 2026, los modelos Granite de lenguaje, visión, voz, embedding y guardian están siendo firmados criptográficamente.

2La certificación ISO es para el sistema de gestión de IA Granite (AIMS) de los modelos de lenguaje Granite. Puede encontrar el certificado aquí: https://www.schellman.com/certificate-directory bajo el certificado n.º  1102257-1.