Granite | IBM

Ilustração de formas geométricas em camadas em um gradiente de cores

O IBM® Granite 4.1 está viabilizando a implementação mais segura da IA no local

Modelos leves e de alto desempenho, lançados sob uma licença Apache 2.0, projetados para cargas de trabalho empresariais escaláveis

Saiba mais sobre o Granite 4.1

Por que criar com o Granite?

Crie e escale a IA mais rápido com modelos personalizáveis, de código aberto, otimizados para cargas de trabalho empresariais, eficiência de custos e implementações flexíveis.

Abertura

Com código aberto sob a licença Apache 2.0, o Granite garante transparência, ao mesmo tempo em que permite total personalização e flexibilidade de implementação em qualquer infraestrutura.

Baixar modelos

Eficiente

Os modelos pequenos e de alto desempenho são projetados para maximizar a eficiência e a escalabilidade em tarefas corporativas essenciais.

Analisar benchmarks

Confiança

Elimine o risco da IA “caixa-preta” com transparência nos dados e processos de treinamento, recursos de detecção de danos e proteções incorporadas.

Saiba mais

Apresentamos o Granite 4.1

Modelos de linguagem Granite 4.1

Nossos modelos mais eficientes, densos e sem raciocínio explícito até agora. Competitivos com modelos maiores baseados em raciocínio em uma variedade de tarefas empresariais, por uma fração do custo.

Baixar modelos linguagem

Modelos de fala Granite 4.1

Pequenos, mas poderosos. Precisão de transcrição líder do setor em diferentes sotaques, domínios e ambientes com ruído.

Baixar modelos de fala

Modelos de visão Granite 4.1

Compreenda documentos, gráficos e imagens com precisão de nível empresarial.

Baixar modelos de visão

Modelos Guardian Granite 4.1

Proteções para detectar conteúdos maliciosos e saídas prejudiciais. Desenvolvidos para conformidade empresarial.

Baixar modelos Guardian

Modelos de embedding Granite

Representações semânticas precisas para recuperação, busca e classificação.

Baixar modelos de embedding

Explore os benchmarks

Esses modelos foram avaliados em relação a uma grande coleção de conjuntos de dados e métricas para abranger aspectos diferentes da geração de texto. Veja outros benchmarks no blog técnico do Granite.

Benchmark	Métrica	granite-4.1-3b	granite-4.1-8b	granite-4.1-30b
MMLU	5 exemplos	67,02	73,84	80,16
IFEval Avg		82,3	87,06	89,65
ArenaHard		37,8	68,98	71,02
GSM8K	8 exemplos	86,88	92,49	94,16
HumanEval	pass@1	79,27	87,2	89,63
BFCL v3		60,8	68,27	73,68
MMMLU	5 exemplos	57,61	64,84	73,71
AttaQ		81,88	81,19	85,76

Acesse e crie

Hugging Face

Ir para a Hugging Face

Ollama

LM Studio

watsonx.ai

OpenRouter

Replicate

Weights & Biases

Ir para a Weights & Biases

Unsloth

Ir para o Unsloth

AnythingLLM

Ir para o AnythingLLM

Desempenho e eficiência

O Granite 4.1 oferece desempenho competitivo em seguimento de instruções e chamadas de ferramentas sem depender de longas cadeias de raciocínio, oferecendo latência previsível, uso estável de tokens e custo operacional menor. Isso o torna uma escolha robusta e pronta para produção no caso de cargas de trabalho empresariais, onde a eficiência e a confiabilidade são mais importantes.

Chamada de ferramenta
Seguimento de instruções
Detecção de danos
Precisão da transcrição
Extração de tabelas e gráficos

Os modelos de linguagem Granite 4.1 entendem e executam instruções baseadas em ferramentas, permitindo a integração perfeita com várias ferramentas de software e APIs. Esse recurso permite que as empresas criem fluxos de trabalho eficientes orientados por IA e, ao mesmo tempo, automatizem tarefas complexas.

Gráfico de barras horizontais intitulado “Os modelos de linguagem do Granite 4.1 oferecem recursos superiores de chamadas de ferramentas”, com base nas pontuações de benchmark BFCL V3 (quanto maior, melhor). O Granite-4.1-30B fica na posição mais alta, com 73,7, seguido pelo Gemma-4-31B-it, com 72,7, e o Granite-4.1-8B-it, com 68,3. Os modelos restantes têm pontuação entre cerca de 61,7 e 67,8, incluindo o Gemma-4-26B-A4B-it (67,8), Qwen3-30B-A3B-Instruct-2507 (65,1), Granite-4.0-H-Small (64,7), Qwen3.5-35B-A3B (64,2), Gemma-4-E4B-it (63,2), Qwen3-4B-Instruct-2507 (61,9) e Qwen3.5-9B (61,7). Os modelos Granite 4.1 estão destacados em azul e superam os outros.

Os modelos de linguagem Granite 4.1 compreendem e aderem às instruções do usuário, garantindo uma conclusão confiável e precisa das tarefas. Esse recurso é particularmente valioso para empresas que desejam automatizar processos e fornecer resultados sistemáticos e de alta qualidade.

Gráfico de barras horizontais intitulado “Os modelos de linguagem Granite 4.1 oferecem recursos competitivos de seguimento de instruções”, com base nos resultados da iFEval. O Gemma-4-31b-it ocupa a posição mais alta com 94,1, seguido pelo Gemma-4-26B-A4B-it, com 91,3. O Granite-4.1-30B tem pontuação de 89,7, com desempenho ligeiramente acima do Qwen 3.5-35B-A3B, com 89,1, e à frente de vários modelos agrupados entre cerca de 85 e 88, incluindo o Gemma-4-E4B-it (87,8), Granite-4.0-H-Small (87,5), Qwen 3.5-9B (87,2) e Granite-4.1-8B (87,1). As pontuações mais baixas incluem o Granite-4.1-3B, com 82,1, e Qwen3.5-2B, com 70,6. Os modelos Granite 4.1 estão destacados em azul, mostrando um desempenho competitivo, mas não superior, em comparação com os modelos Gemma.

O Granite Guardian 4.1 detecta as principais dimensões de risco catalogadas no Atlas de Riscos de IA da IBM. Treinado com dados exclusivos que incluem anotações humanas e dados sintéticos de red-teaming interno, o Guardian supera modelos semelhantes em benchmarks padrão (incluindo, entre outros, tentativas de jailbreak, linguagem ofensiva e alucinações relacionadas a chamadas de ferramentas e geração aumentada de recuperação em sistemas baseados em agentes).

Tabela comparando o desempenho dos modelos em conjuntos de dados de avaliação, com colunas para o Granite-Guardian-4.1-8B, OffsetBias-8B, Skywork-Reward-8B, Skywork-Reward-27B, SFR-Judge-70B e uma referência da Oracle. O Granite-Guardian-4.1-8B (destacado) alcança resultados sólidos em todos os conjuntos de dados: GSM8k (93,71), MATEMÁTICA (50,79), HumanEval+ (80,08), MBPP+ (70,63), BigCodeBench (43,70) e IFEval (82,81), com uma pontuação geral de 70,29. Ele supera ligeiramente outros modelos na maioria das categorias, enquanto as pontuações da Oracle continuam sendo as mais altas no geral, incluindo 97,46 no GSM8k e 81,54 no geral.

O Granite Speech 4.1 oferece reconhecimento de fala de alta precisão e pronto para empresas em diversos ambientes de áudio reais, alcançando baixas taxas de erro de palavras em benchmarks que abrangem fala conversacional, reuniões, apresentações e chamadas de resultados.

Gráfico de barras agrupado intitulado “O Granite Speech 4.1 supera os concorrentes em precisão da transcrição”, mostrando as taxas de erros de palavras em inglês para ASR em nove conjuntos de dados (quanto menor, melhor): GigaSpeech, LScln, LSoth, SPGI, AMI_IHM, AMI_SDM, VoxPopuli, TED-LIUM e Earnings-22. Vários modelos são comparados, incluindo Whisper-large-v3, Gemini 2.0 Flash, phi-4-mm, Qwen ASR, Canary e variantes do Granite Speech (azul mais claro). Os modelos Granite Speech alcançam sistematicamente uma das menores taxas de erros na maioria dos conjuntos de dados. As taxas de erro variam de cerca de 1 a 2 no LScln, 3 a 5 no LSoth e SPGI, em torno de 9 a 16 no AMI_IHM e as mais altas no AMI_SDM (aproximadamente 22 a 41). O gráfico destaca o Granite Speech 4.1 como oferecendo a melhor precisão geral na transcrição em relação aos modelos concorrentes.

O Granite Vision 4.1 oferece desempenho líder do setor na extração de informações estruturadas de conteúdo visual, alcançando a maior pontuação média em sete benchmarks que abrangem extração de gráficos, extração de tabelas e extração de pares chave-valor (KVP).

Gráfico de barras horizontais intitulado “Granite Vision 4.1 supera Claude Opus 4.6 na extração de tabelas”, mostrando pontuações médias em sete benchmarks de extração (quanto maior, melhor). O Granite-Vision-4.1-4B ocupa a posição mais alta com uma pontuação de 86,5, seguido pelo Claude-Opus-4,6, com 83,8. Outros modelos têm pontuação mais baixa: Gemma4-E4B (72,4), Qwen3.5-4B (71,7), Ministral-3-8B (68,2) e InternVL3.5-4B (66,4). O Granite Vision está destacado em azul, o Claude em roxo e os demais modelos em cinza, enfatizando o Granite Vision como o de melhor desempenho.

Tem a confiança de empresas de todos os setores

US Open

O US Open queria envolver fãs do mundo todo com experiências digitais em constante evolução. A IBM ajudou a transformar enormes quantidades de dados de partidas em insights orientados por IA e funcionalidades interativas, oferecendo uma experiência dinâmica no aplicativo e no site, que mantém os fãs conectados e imersos a cada momento.

14 mi

milhões de fãs em todo o mundo desfrutando de experiências digitais de alto nível

7 milhões

pontos de dados capturados e analisados ao longo do torneio

Leia o estudo de caso

Scuderia Ferraria HP

A Scuderia Ferrari queria aprimorar sua experiência digital para interagir melhor com os fãs no mundo todo. A IBM ajudou a transformar vastos dados de corrida em insights impulsionados por IA e conteúdos personalizados, entregando um aplicativo reinventado que aproxima os fãs da ação com funcionalidades interativas e narrativa imersiva.

Leia o estudo de caso

Blue Pearl

A Blue Pearl queria tornar seus processos de contratação mais rápidos e eficientes. A IBM ajudou a transformar os fluxos de trabalho de RH com a correspondência de vagas impulsionada por IA e a criação automatizada de conteúdo para conectar candidatos e empregadores com maior precisão e velocidade.

85%

redução no tempo médio de preenchimento de vagas

97%

redução no tempo de triagem

Leia o estudo de caso

Food Ladder

A Food Ladder precisava escalar sua luta contra a insegurança alimentar enquanto apoiava comunidades remotas. A IBM ajudou a trazer automação impulsionada por IA e ferramentas digitais para expandir seu alcance, entregando uma plataforma mais inteligente que permite a produção sustentável de alimentos e experiências de aprendizado personalizadas em todo o mundo.

85 mil

refeições fornecidas a partir de um único armazém

25 milhões

de meta de refeições para 2030, contra 132.480 refeições em 2024

Leia o estudo de caso

Granite para desenvolvedores

Receita: sumarização de documentos

Crie um sumarizador de documentos com o IBM Granite para processar documentos além dos limites da janela de contexto.

RAG with Langchain

Construa um pipeline da RAG com o Granite para responder a consultas usando uma base de conhecimento externa.

Receita: RAG multimodal

Crie um pipeline da RAG multimodal com o Granite e o Docling para consultar texto, tabelas e imagens.

Guia: modelos de código aberto

Veja como os LLMs de código aberto dão autonomia, reduzem custos e ajudam os desenvolvedores com avaliação, ajuste e implementação.

Tutorial: forecasting de séries temporais

Use os modelos de séries temporais Granite para realizar forecasting de séries temporais zero-shot e com ajuste fino.

Guia prático para agentes do Granite

Receitas do Granite para tarefas de agentes.

Tutorial: copiloto de IA local

Construa um copiloto de IA local usando o IBM Granite Code, Ollama e Continue

Guia prático do Granite

Veja o guia prático completo do Granite

Crie com o Granite

Os modelos Granite impulsionam a IA por trás de muitos produtos e serviços da IBM. Descubra soluções prontas para uso para geração de código, desenvolvimento de aplicações e testes de modelos. Tudo isso impulsionado pelo IBM Granite.

Agente de programação com IA

Acelere a programação e simplifique o desenvolvimento com IA e automação aproveitando os modelos Granite.

Explore o agente de programação com IA

watsonx.ai

Crie e implemente aplicações de IA com modelos Granite ou selecione entre uma variedade de modelos de terceiros.

Explore o watsonx.ai

watsonx Orchestrate

Desenvolva e gerencie agentes de IA impulsionados pelo Granite e explore o catálogo de agentes criados previamente.

Explore o watsonx Orchestrate

IA do Red Hat Enterprise Linux

Desenvolva, teste e execute LLMs, incluindo o Granite.

Explore o Red Hat Enterprise Linux AI

Analistas e tabelas de classificação

IBM reconhecida como líder em ciência de dados e aprendizado de máquina

Leia o relatório para ver como a IBM capacita os cientistas de dados e engenheiros de aprendizado de máquina a criar, implementar e controlar aplicações de IA impactantes em suas empresas.

GuardBench Leaderboard for Guardrail Models

Descubra por que os modelos Granite Guardian ocupam seis das dez primeiras posições no ranking da GuardBench, destacando-se na identificação de respostas prejudiciais ou maliciosas geradas por prompts e LLMs.

Speech Recognition Open ASR Leaderboard

Explore a tabela de classificação na qual a IBM está classificada como os melhores modelos de fala com base na baixa taxa de erro de palavras.

Stanford Transparency Index

Explore por que o Granite obteve uma classificação máxima no Stanford Foundation Model Transparency Index, que avalia a abertura em torno de fontes de dados, tamanho do conjunto de dados, filtragem de conteúdo nocivo e outros fatores importantes de transparência.

Próximas etapas

A IBM acredita na criação, na implementação e na utilização de modelos de IA que promovam a inovação responsável em toda a empresa. A plataforma de dados e IA watsonx da IBM conta com um processo completo para criação e teste de modelos de base e IA generativa. Nos modelos desenvolvidos pela IBM, procuramos e removemos duplicidades e empregamos listas de bloqueio de URL, filtros de conteúdo questionável e qualidade de documento, divisão de frases e técnicas de tokenização, tudo antes do treinamento do modelo.

Durante o processo de treinamento de dados, trabalhamos para evitar desajustes nos resultados do modelo e aplicamos ajuste fino supervisionado para melhor acompanhamento das instruções, para que o modelo possa ser utilizado em tarefas empresariais via engenharia de prompt. Continuamos desenvolvendo os modelos Granite em diversos sentidos, incluindo outras modalidades, conteúdo específico do setor e mais anotações de dados para treinamento e ainda implementamos regularmente salvaguardas de proteção de dados para os modelos desenvolvidos pela IBM.

Dado o cenário de rápida mudança da tecnologia da IA generativa, espera-se que nosso processo completo evolua e melhore constantemente. Como prova do rigor que a IBM aplica no desenvolvimento e teste de seus modelos de base, a empresa oferece indenização contratual padrão de propriedade intelectual para os modelos desenvolvidos pela IBM, semelhante àquelas que oferece para itens de hardware e software da IBM.

Além disso, ao contrário de alguns outros fornecedores de grandes modelos de linguagem e coerente com a abordagem padrão da IBM sobre indenização, a IBM não exige que seus clientes indenizem a IBM pelo uso, por parte dos clientes, de modelos desenvolvidos pela IBM. Além disso, de acordo com a abordagem da IBM em relação à sua obrigação de indenização, a IBM não limita sua responsabilidade de indenização para os modelos desenvolvidos pela IBM.

Agora, sob essas proteções, os modelos watsonx incluem:

(1) Família Slate de modelos somente para codificação.

(2) Família Granite de modelos somente para decodificação.

Saiba mais sobre o licenciamento dos modelos Granite

¹A partir de 29 de abril de 2026, os modelos de linguagem, visão, fala, embedding e Guardian do Granite lançados estão sendo assinados criptograficamente.

^2.A certificação ISO refere-se ao sistema de gerenciamento de IA (AIMS) do Granite para modelos de linguagem Granite. O certificado pode ser encontrado aqui: https://www.schellman.com/certificate-directory sob o certificado n.º 1102257-1.