Granite

Aberto. Eficiente. Confiável. Licença Apache 2.0. Assinado criptograficamente1. Certificação ISO2.

Ilustração de formas geométricas em camadas em um gradiente de cores
O IBM® Granite 4.1 está viabilizando a implementação mais segura da IA no local
Modelos leves e de alto desempenho, lançados sob uma licença Apache 2.0, projetados para cargas de trabalho empresariais escaláveis
Saiba mais sobre o Granite 4.1

Por que criar com o Granite?

Crie e escale a IA mais rápido com modelos personalizáveis, de código aberto, otimizados para cargas de trabalho empresariais, eficiência de custos e implementações flexíveis.

Abertura
Com código aberto sob a licença Apache 2.0, o Granite garante transparência, ao mesmo tempo em que permite total personalização e flexibilidade de implementação em qualquer infraestrutura.
Baixar modelos
Eficiente
Os modelos pequenos e de alto desempenho são projetados para maximizar a eficiência e a escalabilidade em tarefas corporativas essenciais.
Analisar benchmarks
Confiança
Elimine o risco da IA “caixa-preta” com transparência nos dados e processos de treinamento, recursos de detecção de danos e proteções incorporadas.
Saiba mais
Apresentamos o Granite 4.1
Modelos de linguagem Granite 4.1

Nossos modelos mais eficientes, densos e sem raciocínio explícito até agora. Competitivos com modelos maiores baseados em raciocínio em uma variedade de tarefas empresariais, por uma fração do custo. 

Baixar modelos linguagem
Modelos de fala Granite 4.1

Pequenos, mas poderosos. Precisão de transcrição líder do setor em diferentes sotaques, domínios e ambientes com ruído. 

Baixar modelos de fala
Modelos de visão Granite 4.1

Compreenda documentos, gráficos e imagens com precisão de nível empresarial.

Baixar modelos de visão
Modelos Guardian Granite 4.1

Proteções para detectar conteúdos maliciosos e saídas prejudiciais. Desenvolvidos para conformidade empresarial.

Baixar modelos Guardian
Modelos de embedding Granite

Representações semânticas precisas para recuperação, busca e classificação.

Baixar modelos de embedding

Explore os benchmarks

Esses modelos foram avaliados em relação a uma grande coleção de conjuntos de dados e métricas para abranger aspectos diferentes da geração de texto. Veja outros benchmarks no blog técnico do Granite.​

 

Benchmark​Métricagranite-4.1-3b​granite-4.1-8b​granite-4.1-30b​
MMLU​5 exemplos​67,02​73,84​80,16​
IFEval Avg​ 82,3​87,06​89,65​
ArenaHard​ 37,8​68,98​71,02​
GSM8K​8 exemplos​86,88​92,49​94,16​
HumanEval​pass@1​79,27​87,2​89,63​
BFCL v3​ 60,8​68,27​73,68​
MMMLU​5 exemplos​57,61​64,84​73,71​
AttaQ​ 81,88​81,19​85,76​

Desempenho e eficiência

O Granite 4.1 oferece desempenho competitivo em seguimento de instruções e chamadas de ferramentas sem depender de longas cadeias de raciocínio, oferecendo latência previsível, uso estável de tokens e custo operacional menor. Isso o torna uma escolha robusta e pronta para produção no caso de cargas de trabalho empresariais, onde a eficiência e a confiabilidade são mais importantes.

Os modelos de linguagem Granite 4.1 entendem e executam instruções baseadas em ferramentas, permitindo a integração perfeita com várias ferramentas de software e APIs. Esse recurso permite que as empresas criem fluxos de trabalho eficientes orientados por IA e, ao mesmo tempo, automatizem tarefas complexas.

Gráfico de barras horizontais intitulado “Os modelos de linguagem do Granite 4.1 oferecem recursos superiores de chamadas de ferramentas”, com base nas pontuações de benchmark BFCL V3 (quanto maior, melhor). O Granite-4.1-30B fica na posição mais alta, com 73,7, seguido pelo Gemma-4-31B-it, com 72,7, e o Granite-4.1-8B-it, com 68,3. Os modelos restantes têm pontuação entre cerca de 61,7 e 67,8, incluindo o Gemma-4-26B-A4B-it (67,8), Qwen3-30B-A3B-Instruct-2507 (65,1), Granite-4.0-H-Small (64,7), Qwen3.5-35B-A3B (64,2), Gemma-4-E4B-it (63,2), Qwen3-4B-Instruct-2507 (61,9) e Qwen3.5-9B (61,7). Os modelos Granite 4.1 estão destacados em azul e superam os outros.

Os modelos de linguagem Granite 4.1 compreendem e aderem às instruções do usuário, garantindo uma conclusão confiável e precisa das tarefas. Esse recurso é particularmente valioso para empresas que desejam automatizar processos e fornecer resultados sistemáticos e de alta qualidade.

Gráfico de barras horizontais intitulado “Os modelos de linguagem Granite 4.1 oferecem recursos competitivos de seguimento de instruções”, com base nos resultados da iFEval. O Gemma-4-31b-it ocupa a posição mais alta com 94,1, seguido pelo Gemma-4-26B-A4B-it, com 91,3. O Granite-4.1-30B tem pontuação de 89,7, com desempenho ligeiramente acima do Qwen 3.5-35B-A3B, com 89,1, e à frente de vários modelos agrupados entre cerca de 85 e 88, incluindo o Gemma-4-E4B-it (87,8), Granite-4.0-H-Small (87,5), Qwen 3.5-9B (87,2) e Granite-4.1-8B (87,1). As pontuações mais baixas incluem o Granite-4.1-3B, com 82,1, e Qwen3.5-2B, com 70,6. Os modelos Granite 4.1 estão destacados em azul, mostrando um desempenho competitivo, mas não superior, em comparação com os modelos Gemma.

O Granite Guardian 4.1 detecta as principais dimensões de risco catalogadas no Atlas de Riscos de IA da IBM. Treinado com dados exclusivos que incluem anotações humanas e dados sintéticos de red-teaming interno, o Guardian supera modelos semelhantes em benchmarks padrão (incluindo, entre outros, tentativas de jailbreak, linguagem ofensiva e alucinações relacionadas a chamadas de ferramentas e geração aumentada de recuperação em sistemas baseados em agentes).

Tabela comparando o desempenho dos modelos em conjuntos de dados de avaliação, com colunas para o Granite-Guardian-4.1-8B, OffsetBias-8B, Skywork-Reward-8B, Skywork-Reward-27B, SFR-Judge-70B e uma referência da Oracle. O Granite-Guardian-4.1-8B (destacado) alcança resultados sólidos em todos os conjuntos de dados: GSM8k (93,71), MATEMÁTICA (50,79), HumanEval+ (80,08), MBPP+ (70,63), BigCodeBench (43,70) e IFEval (82,81), com uma pontuação geral de 70,29. Ele supera ligeiramente outros modelos na maioria das categorias, enquanto as pontuações da Oracle continuam sendo as mais altas no geral, incluindo 97,46 no GSM8k e 81,54 no geral.

O Granite Speech 4.1 oferece reconhecimento de fala de alta precisão e pronto para empresas em diversos ambientes de áudio reais, alcançando baixas taxas de erro de palavras em benchmarks que abrangem fala conversacional, reuniões, apresentações e chamadas de resultados.

Gráfico de barras agrupado intitulado “O Granite Speech 4.1 supera os concorrentes em precisão da transcrição”, mostrando as taxas de erros de palavras em inglês para ASR em nove conjuntos de dados (quanto menor, melhor): GigaSpeech, LScln, LSoth, SPGI, AMI_IHM, AMI_SDM, VoxPopuli, TED-LIUM e Earnings-22. Vários modelos são comparados, incluindo Whisper-large-v3, Gemini 2.0 Flash, phi-4-mm, Qwen ASR, Canary e variantes do Granite Speech (azul mais claro). Os modelos Granite Speech alcançam sistematicamente uma das menores taxas de erros na maioria dos conjuntos de dados. As taxas de erro variam de cerca de 1 a 2 no LScln, 3 a 5 no LSoth e SPGI, em torno de 9 a 16 no AMI_IHM e as mais altas no AMI_SDM (aproximadamente 22 a 41). O gráfico destaca o Granite Speech 4.1 como oferecendo a melhor precisão geral na transcrição em relação aos modelos concorrentes.

O Granite Vision 4.1 oferece desempenho líder do setor na extração de informações estruturadas de conteúdo visual, alcançando a maior pontuação média em sete benchmarks que abrangem extração de gráficos, extração de tabelas e extração de pares chave-valor (KVP).

Gráfico de barras horizontais intitulado “Granite Vision 4.1 supera Claude Opus 4.6 na extração de tabelas”, mostrando pontuações médias em sete benchmarks de extração (quanto maior, melhor). O Granite-Vision-4.1-4B ocupa a posição mais alta com uma pontuação de 86,5, seguido pelo Claude-Opus-4,6, com 83,8. Outros modelos têm pontuação mais baixa: Gemma4-E4B (72,4), Qwen3.5-4B (71,7), Ministral-3-8B (68,2) e InternVL3.5-4B (66,4). O Granite Vision está destacado em azul, o Claude em roxo e os demais modelos em cinza, enfatizando o Granite Vision como o de melhor desempenho.

Tem a confiança de empresas de todos os setores

US Open

O US Open queria envolver fãs do mundo todo com experiências digitais em constante evolução. A IBM ajudou a transformar enormes quantidades de dados de partidas em insights orientados por IA e funcionalidades interativas, oferecendo uma experiência dinâmica no aplicativo e no site, que mantém os fãs conectados e imersos a cada momento.

14 mi
milhões de fãs em todo o mundo desfrutando de experiências digitais de alto nível
7 milhões
pontos de dados capturados e analisados ao longo do torneio
Vista ampla de um estádio do US Open com torcedores assistindo a uma partida

Granite para desenvolvedores

Receita: sumarização de documentos

Crie um sumarizador de documentos com o IBM Granite para processar documentos além dos limites da janela de contexto.

RAG with Langchain

Construa um pipeline da RAG com o Granite para responder a consultas usando uma base de conhecimento externa.

Receita: RAG multimodal

Crie um pipeline da RAG multimodal com o Granite e o Docling para consultar texto, tabelas e imagens.

Guia: modelos de código aberto

Veja como os LLMs de código aberto dão autonomia, reduzem custos e ajudam os desenvolvedores com avaliação, ajuste e implementação.

Tutorial: forecasting de séries temporais

Use os modelos de séries temporais Granite para realizar forecasting de séries temporais zero-shot e com ajuste fino.

Guia prático para agentes do Granite

Receitas do Granite para tarefas de agentes.

Tutorial: copiloto de IA local

Construa um copiloto de IA local usando o IBM Granite Code, Ollama e Continue

Guia prático do Granite

Veja o guia prático completo do Granite

Crie com o Granite

Os modelos Granite impulsionam a IA por trás de muitos produtos e serviços da IBM. Descubra soluções prontas para uso para geração de código, desenvolvimento de aplicações e testes de modelos. Tudo isso impulsionado pelo IBM Granite.

Agente de programação com IA

Acelere a programação e simplifique o desenvolvimento com IA e automação aproveitando os modelos Granite.

Explore o agente de programação com IA
watsonx.ai

Crie e implemente aplicações de IA com modelos Granite ou selecione entre uma variedade de modelos de terceiros.

Explore o watsonx.ai
watsonx Orchestrate

Desenvolva e gerencie agentes de IA impulsionados pelo Granite e explore o catálogo de agentes criados previamente.

Explore o watsonx Orchestrate
IA do Red Hat Enterprise Linux

Desenvolva, teste e execute LLMs, incluindo o Granite.

Explore o Red Hat Enterprise Linux AI

A IBM acredita na criação, na implementação e na utilização de modelos de IA que promovam a inovação responsável em toda a empresa. A plataforma de dados e IA watsonx da IBM conta com um processo completo para criação e teste de modelos de base e IA generativa. Nos modelos desenvolvidos pela IBM, procuramos e removemos duplicidades e empregamos listas de bloqueio de URL, filtros de conteúdo questionável e qualidade de documento, divisão de frases e técnicas de tokenização, tudo antes do treinamento do modelo.

Durante o processo de treinamento de dados, trabalhamos para evitar desajustes nos resultados do modelo e aplicamos ajuste fino supervisionado para melhor acompanhamento das instruções, para que o modelo possa ser utilizado em tarefas empresariais via engenharia de prompt. Continuamos desenvolvendo os modelos Granite em diversos sentidos, incluindo outras modalidades, conteúdo específico do setor e mais anotações de dados para treinamento e ainda implementamos regularmente salvaguardas de proteção de dados para os modelos desenvolvidos pela IBM. 

Dado o cenário de rápida mudança da tecnologia da IA generativa, espera-se que nosso processo completo evolua e melhore constantemente. Como prova do rigor que a IBM aplica no desenvolvimento e teste de seus modelos de base, a empresa oferece indenização contratual padrão de propriedade intelectual para os modelos desenvolvidos pela IBM, semelhante àquelas que oferece para itens de hardware e software da IBM.

Além disso, ao contrário de alguns outros fornecedores de grandes modelos de linguagem e coerente com a abordagem padrão da IBM sobre indenização, a IBM não exige que seus clientes indenizem a IBM pelo uso, por parte dos clientes, de modelos desenvolvidos pela IBM. Além disso, de acordo com a abordagem da IBM em relação à sua obrigação de indenização, a IBM não limita sua responsabilidade de indenização para os modelos desenvolvidos pela IBM.

Agora, sob essas proteções, os modelos watsonx incluem:

(1) Família Slate de modelos somente para codificação.

(2) Família Granite de modelos somente para decodificação.

Saiba mais sobre o licenciamento dos modelos Granite

1A partir de 29 de abril de 2026, os modelos de linguagem, visão, fala, embedding e Guardian do Granite lançados estão sendo assinados criptograficamente.

2.A certificação ISO refere-se ao sistema de gerenciamento de IA (AIMS) do Granite para modelos de linguagem Granite. O certificado pode ser encontrado aqui: https://www.schellman.com/certificate-directory sob o certificado n.º 1102257-1.