Aberto. Eficiente. Confiável. Licença Apache 2.0. Assinado criptograficamente1. Certificação ISO2.
Crie e escale a IA mais rápido com modelos personalizáveis, de código aberto, otimizados para cargas de trabalho empresariais, eficiência de custos e implementações flexíveis.
Nossos modelos mais eficientes, densos e sem raciocínio explícito até agora. Competitivos com modelos maiores baseados em raciocínio em uma variedade de tarefas empresariais, por uma fração do custo.
Pequenos, mas poderosos. Precisão de transcrição líder do setor em diferentes sotaques, domínios e ambientes com ruído.
Compreenda documentos, gráficos e imagens com precisão de nível empresarial.
Proteções para detectar conteúdos maliciosos e saídas prejudiciais. Desenvolvidos para conformidade empresarial.
Representações semânticas precisas para recuperação, busca e classificação.
Esses modelos foram avaliados em relação a uma grande coleção de conjuntos de dados e métricas para abranger aspectos diferentes da geração de texto. Veja outros benchmarks no blog técnico do Granite.
| Benchmark | Métrica | granite-4.1-3b | granite-4.1-8b | granite-4.1-30b |
| MMLU | 5 exemplos | 67,02 | 73,84 | 80,16 |
| IFEval Avg | 82,3 | 87,06 | 89,65 | |
| ArenaHard | 37,8 | 68,98 | 71,02 | |
| GSM8K | 8 exemplos | 86,88 | 92,49 | 94,16 |
| HumanEval | pass@1 | 79,27 | 87,2 | 89,63 |
| BFCL v3 | 60,8 | 68,27 | 73,68 | |
| MMMLU | 5 exemplos | 57,61 | 64,84 | 73,71 |
| AttaQ | 81,88 | 81,19 | 85,76 |
O Granite 4.1 oferece desempenho competitivo em seguimento de instruções e chamadas de ferramentas sem depender de longas cadeias de raciocínio, oferecendo latência previsível, uso estável de tokens e custo operacional menor. Isso o torna uma escolha robusta e pronta para produção no caso de cargas de trabalho empresariais, onde a eficiência e a confiabilidade são mais importantes.
Os modelos de linguagem Granite 4.1 entendem e executam instruções baseadas em ferramentas, permitindo a integração perfeita com várias ferramentas de software e APIs. Esse recurso permite que as empresas criem fluxos de trabalho eficientes orientados por IA e, ao mesmo tempo, automatizem tarefas complexas.
Os modelos de linguagem Granite 4.1 compreendem e aderem às instruções do usuário, garantindo uma conclusão confiável e precisa das tarefas. Esse recurso é particularmente valioso para empresas que desejam automatizar processos e fornecer resultados sistemáticos e de alta qualidade.
O Granite Guardian 4.1 detecta as principais dimensões de risco catalogadas no Atlas de Riscos de IA da IBM. Treinado com dados exclusivos que incluem anotações humanas e dados sintéticos de red-teaming interno, o Guardian supera modelos semelhantes em benchmarks padrão (incluindo, entre outros, tentativas de jailbreak, linguagem ofensiva e alucinações relacionadas a chamadas de ferramentas e geração aumentada de recuperação em sistemas baseados em agentes).
O Granite Speech 4.1 oferece reconhecimento de fala de alta precisão e pronto para empresas em diversos ambientes de áudio reais, alcançando baixas taxas de erro de palavras em benchmarks que abrangem fala conversacional, reuniões, apresentações e chamadas de resultados.
O Granite Vision 4.1 oferece desempenho líder do setor na extração de informações estruturadas de conteúdo visual, alcançando a maior pontuação média em sete benchmarks que abrangem extração de gráficos, extração de tabelas e extração de pares chave-valor (KVP).
O US Open queria envolver fãs do mundo todo com experiências digitais em constante evolução. A IBM ajudou a transformar enormes quantidades de dados de partidas em insights orientados por IA e funcionalidades interativas, oferecendo uma experiência dinâmica no aplicativo e no site, que mantém os fãs conectados e imersos a cada momento.
Crie um sumarizador de documentos com o IBM Granite para processar documentos além dos limites da janela de contexto.
Construa um pipeline da RAG com o Granite para responder a consultas usando uma base de conhecimento externa.
Crie um pipeline da RAG multimodal com o Granite e o Docling para consultar texto, tabelas e imagens.
Veja como os LLMs de código aberto dão autonomia, reduzem custos e ajudam os desenvolvedores com avaliação, ajuste e implementação.
Use os modelos de séries temporais Granite para realizar forecasting de séries temporais zero-shot e com ajuste fino.
Receitas do Granite para tarefas de agentes.
Construa um copiloto de IA local usando o IBM Granite Code, Ollama e Continue
Veja o guia prático completo do Granite
Os modelos Granite impulsionam a IA por trás de muitos produtos e serviços da IBM. Descubra soluções prontas para uso para geração de código, desenvolvimento de aplicações e testes de modelos. Tudo isso impulsionado pelo IBM Granite.
Acelere a programação e simplifique o desenvolvimento com IA e automação aproveitando os modelos Granite.
Crie e implemente aplicações de IA com modelos Granite ou selecione entre uma variedade de modelos de terceiros.
Desenvolva e gerencie agentes de IA impulsionados pelo Granite e explore o catálogo de agentes criados previamente.
Desenvolva, teste e execute LLMs, incluindo o Granite.
A IBM acredita na criação, na implementação e na utilização de modelos de IA que promovam a inovação responsável em toda a empresa. A plataforma de dados e IA watsonx da IBM conta com um processo completo para criação e teste de modelos de base e IA generativa. Nos modelos desenvolvidos pela IBM, procuramos e removemos duplicidades e empregamos listas de bloqueio de URL, filtros de conteúdo questionável e qualidade de documento, divisão de frases e técnicas de tokenização, tudo antes do treinamento do modelo.
Durante o processo de treinamento de dados, trabalhamos para evitar desajustes nos resultados do modelo e aplicamos ajuste fino supervisionado para melhor acompanhamento das instruções, para que o modelo possa ser utilizado em tarefas empresariais via engenharia de prompt. Continuamos desenvolvendo os modelos Granite em diversos sentidos, incluindo outras modalidades, conteúdo específico do setor e mais anotações de dados para treinamento e ainda implementamos regularmente salvaguardas de proteção de dados para os modelos desenvolvidos pela IBM.
Dado o cenário de rápida mudança da tecnologia da IA generativa, espera-se que nosso processo completo evolua e melhore constantemente. Como prova do rigor que a IBM aplica no desenvolvimento e teste de seus modelos de base, a empresa oferece indenização contratual padrão de propriedade intelectual para os modelos desenvolvidos pela IBM, semelhante àquelas que oferece para itens de hardware e software da IBM.
Além disso, ao contrário de alguns outros fornecedores de grandes modelos de linguagem e coerente com a abordagem padrão da IBM sobre indenização, a IBM não exige que seus clientes indenizem a IBM pelo uso, por parte dos clientes, de modelos desenvolvidos pela IBM. Além disso, de acordo com a abordagem da IBM em relação à sua obrigação de indenização, a IBM não limita sua responsabilidade de indenização para os modelos desenvolvidos pela IBM.
Agora, sob essas proteções, os modelos watsonx incluem:
(1) Família Slate de modelos somente para codificação.
(2) Família Granite de modelos somente para decodificação.
1A partir de 29 de abril de 2026, os modelos de linguagem, visão, fala, embedding e Guardian do Granite lançados estão sendo assinados criptograficamente.
2.A certificação ISO refere-se ao sistema de gerenciamento de IA (AIMS) do Granite para modelos de linguagem Granite. O certificado pode ser encontrado aqui: https://www.schellman.com/certificate-directory sob o certificado n.º 1102257-1.