Granite

Modelos de IA abertos, de alto desempenho e confiáveis, desenvolvidos para empresas.

Ilustração de formas geométricas em camadas em um gradiente de cores
IBM Granite 4.0: a última geração de modelos Granite
Reduza os custos e acelere as cargas de trabalho com modelos eficientes projetados para a adoção de IA escalável e pronta para empresas.
Saiba mais

Conheça o Granite

Crie e escale a IA mais rápido com modelos de código aberto personalizáveis e otimizados para cargas de trabalho empresariais, eficiência de custos e implementações flexíveis.

Abertura
Com código aberto sob a licença Apache 2.0, o Granite garante transparência, ao mesmo tempo em que permite total personalização e flexibilidade de implementação em qualquer infraestrutura.
Eficiente
Os modelos pequenos e de alto desempenho são projetados para maximizar a eficiência e a escalabilidade em tarefas corporativas essenciais.
Confiança
Elimine o risco da IA “caixa-preta” com transparência nos dados e processos de treinamento, recursos de detecção de danos e proteções incorporadas.

Apresentando o Granite 4.0

Conheça os modelos

Granite 4.0 Nano
Tarefas de IA leves, locais e de edge em que a computação e a conectividade são limitadas
Granite 4.0 Micro & Tiny
Tarefas de alto volume e baixa complexidade em que a velocidade, o custo e a eficiência são as principais prioridades
Granite 4.0 Small
Fluxos de trabalho empresariais que exigem desempenho mais forte sem o custo de modelos de fronteira

Pelos números

Mais de 70%
redução nos requisitos de memória
2X
velocidades de inferência mais rápidas
Granite-Docling: um modelo ultracompacto para document conversion
O IBM Granite-Docling é um modelo de código aberto e altamente eficiente que converte documentos em formatos legíveis por máquina preservando totalmente o layout.
Saiba mais

Família Granite de pequenos modelos

Pequenos modelos de linguagem (SLMs)

Modelos de linguagem central com raciocínio, otimizados para RAG e fluxos de trabalho agênticos.

Incorporação

Modelos que geram embeddings de texto de alta qualidade para pesquisa semântica, RAG e recuperação de informações contextuais de múltiplas tentativas.

Conversão de documentos

Modelo de linguagem de visão ultracompacto que converte documentos em formatos estruturados e legíveis por máquina, preservando layout, tabelas e equações.

Visão

Modelos de linguagem de visão eficientes para compreensão de documentos e imagens, permitindo OCR, análise de gráficos e extração de conteúdo empresarial.

Voz

Modelos leves de linguagem de fala para transcrição e tradução em sete idiomas, proporcionando grande precisão e eficiência.

Séries temporais

Modelos pré-treinados leves para forecasting rápido e preciso de séries temporais, otimizados para implementação eficiente em todos os ambientes de hardware.

Proteção

Modelos de proteção que detectam alucinações, vieses, conteúdos nocivos e jailbreaks, garantindo a implementação segura da IA empresarial em todos os fluxos de trabalho.

Geoespacial

Modelos da NASA-IBM para observação da Terra, prevendo biomassa, clima, temperatura terrestre e inundações a partir de dados de satélites em grande escala.

Desempenho e eficiência

O Granite 4.0 foi desenvolvido para eficiência, usando menos memória e oferecendo velocidades mais rápidas e alto desempenho. Esse equilíbrio permite que as empresas reduzam custos e escalem soluções mais rapidamente em cargas de trabalho críticas.

Gráfico de círculos de requisitos de RAM do Granite 4.0

Os modelos Granite 4.0 são projetados para fazer mais com menos. Eles usam bem menos memória (mais de 70% menos do que modelos semelhantes) e permitem que as organizações executem uma IA avançada em hardwares mais acessíveis. Isso se traduz em custos de infraestrutura mais baixos, desempenho mais rápido e capacidade de escalar a IA mais facilmente em toda a empresa.

Gráfico de linhas da taxa de transferência do Granite 4.0

O Granite 4.0 oferece consistentemente alta taxa de transferência à medida que as cargas de trabalho aumentam, lidando com tamanhos de lotes maiores com facilidade, enquanto outros modelos ficam mais lentos. Isso garante que as empresas possam manter um desempenho confiável para aplicações que precisam atender a muitos usuários ou tarefas complexas de uma só vez.

Gráfico de gráfico de dispersão de desempenho geral do Granite 4.0

O Granite 4.0 oferece uma maior precisão com requisitos de memória muito menores do que os modelos concorrentes, mesmo em tamanhos menores. Essa eficiência se traduz em economia de custos, maior acessibilidade e a capacidade de implementar a IA empresarial de forma mais ampla e flexível.

Pontuação de RAG do Granite 4.0
O Granite 4.0 supera o desempenho de modelos abertos de tamanho semelhante e maiores em tarefas de RAG. Ao oferecer maior precisão sem exigir infraestrutura adicional, o Granite ajuda as empresas a construir aplicações mais confiáveis e baseadas em conhecimento, mantendo as implementações eficientes e econômicas.
Gráfico de barras da tabela de classificação do IFEval do Granite 4.0

O Granite 4.0 demonstra um desempenho de seguimento de instruções líder do setor entre os modelos abertos, um recurso essencial para fluxos de trabalho agênticos. Ao equilibrar forte precisão com tamanho menor, o Granite fornece às empresas saídas de alta qualidade para tarefas complexas a custos de infraestrutura mais baixos do que modelos abertos maiores.

Gráfico de círculos de requisitos de RAM do Granite 4.0

Os modelos Granite 4.0 são projetados para fazer mais com menos. Eles usam bem menos memória (mais de 70% menos do que modelos semelhantes) e permitem que as organizações executem uma IA avançada em hardwares mais acessíveis. Isso se traduz em custos de infraestrutura mais baixos, desempenho mais rápido e capacidade de escalar a IA mais facilmente em toda a empresa.

Gráfico de linhas da taxa de transferência do Granite 4.0

O Granite 4.0 oferece consistentemente alta taxa de transferência à medida que as cargas de trabalho aumentam, lidando com tamanhos de lotes maiores com facilidade, enquanto outros modelos ficam mais lentos. Isso garante que as empresas possam manter um desempenho confiável para aplicações que precisam atender a muitos usuários ou tarefas complexas de uma só vez.

Gráfico de gráfico de dispersão de desempenho geral do Granite 4.0

O Granite 4.0 oferece uma maior precisão com requisitos de memória muito menores do que os modelos concorrentes, mesmo em tamanhos menores. Essa eficiência se traduz em economia de custos, maior acessibilidade e a capacidade de implementar a IA empresarial de forma mais ampla e flexível.

Pontuação de RAG do Granite 4.0
O Granite 4.0 supera o desempenho de modelos abertos de tamanho semelhante e maiores em tarefas de RAG. Ao oferecer maior precisão sem exigir infraestrutura adicional, o Granite ajuda as empresas a construir aplicações mais confiáveis e baseadas em conhecimento, mantendo as implementações eficientes e econômicas.
Gráfico de barras da tabela de classificação do IFEval do Granite 4.0

O Granite 4.0 demonstra um desempenho de seguimento de instruções líder do setor entre os modelos abertos, um recurso essencial para fluxos de trabalho agênticos. Ao equilibrar forte precisão com tamanho menor, o Granite fornece às empresas saídas de alta qualidade para tarefas complexas a custos de infraestrutura mais baixos do que modelos abertos maiores.

Granite para desenvolvedores

Receita: sumarização de documentos

Crie um sumarizador de documentos com o IBM Granite para processar documentos além dos limites da janela de contexto.

RAG with Langchain

Construa um pipeline da RAG com o Granite para responder a consultas usando uma base de conhecimento externa.

Receita: RAG multimodal

Crie um pipeline da RAG multimodal com o Granite e o Docling para consultar texto, tabelas e imagens.

Guia: modelos de código aberto

Veja como os LLMs de código aberto dão autonomia, reduzem custos e ajudam os desenvolvedores com avaliação, ajuste e implementação.

Tutorial: forecasting de séries temporais

Use os modelos de séries temporais Granite para realizar forecasting de séries temporais zero-shot e com ajuste fino.

Tutorial: tradução de fala

Use o reconhecimento automático de fala (ASR) para gerar a transcrição de um podcast usando o Granite e o watsonx.ai.

Tutorial: copiloto de IA local

Construa um copiloto de IA local usando o IBM Granite Code, Ollama e Continue

Veja o manual completo do Granite

Veja o manual completo do Granite

Crie com o Granite

Os modelos Granite impulsionam a IA por trás de muitos produtos e serviços da IBM. Descubra soluções prontas para uso para geração de código, desenvolvimento de aplicações e testes de modelos. Tudo isso impulsionado pelo IBM Granite.

Fique por dentro das notícias de IA

Blog | Granite 3.2: novo raciocínio e recursos multimodais

Os novos modelos do Granite trazem novos recursos de raciocínio, um modelo que viabiliza a visão e mais eficiência, proporcionando resultados competitivos com menor custo.

Podcast | DeepSeek: fatos vs. euforia, destilação de modelos e concorrência de código aberto

Em Mixture of Experts - episódio 40, o painel aborda os equívocos do DeepSeek R1, explica a destilação de modelos e disseca o cenário de concorrência de código aberto.

Boletim informativo AI Think | Receba insights de IA

Receba uma seleção de assuntos, tendências e pesquisas de IA diretamente na sua caixa de entrada.

Artigo | A IA do DeepSeek mostra o poder dos pequenos modelos

O DeepSeek-R1 é um assistente digital cujo desempenho se assemelha ao do o1 da OpenAI em determinados benchmarks de IA em tarefas de matemática e programação, foi treinado com muito menos chips e, de acordo com a empresa, o uso dele custa 96% menos.

A IBM acredita na criação, na implementação e na utilização de modelos de IA que promovam a inovação responsável em toda a empresa. A plataforma de dados e IA watsonx da IBM conta com um processo completo para criação e teste de modelos de base e IA generativa. Nos modelos desenvolvidos pela IBM, procuramos e removemos duplicidades e empregamos listas de bloqueio de URL, filtros de conteúdo questionável e qualidade de documento, divisão de frases e técnicas de tokenização, tudo antes do treinamento do modelo.

Durante o processo de treinamento de dados, trabalhamos para evitar desajustes nos resultados do modelo e aplicamos ajuste fino supervisionado para melhor acompanhamento das instruções, para que o modelo possa ser utilizado em tarefas empresariais via engenharia de prompt. Continuamos desenvolvendo os modelos Granite em diversos sentidos, incluindo outras modalidades, conteúdo específico do setor e mais anotações de dados para treinamento e ainda implementamos regularmente salvaguardas de proteção de dados para os modelos desenvolvidos pela IBM. 

Dado o cenário de rápida mudança da tecnologia da IA generativa, espera-se que nosso processo completo evolua e melhore constantemente. Como prova do rigor que a IBM aplica no desenvolvimento e teste de seus modelos de base, a empresa oferece indenização contratual padrão de propriedade intelectual para os modelos desenvolvidos pela IBM, semelhante àquelas que oferece para itens de hardware e software da IBM.

Além disso, ao contrário de alguns outros fornecedores de grandes modelos de linguagem e coerente com a abordagem padrão da IBM sobre indenização, a IBM não exige que seus clientes indenizem a IBM pelo uso, por parte dos clientes, de modelos desenvolvidos pela IBM. Além disso, de acordo com a abordagem da IBM em relação à sua obrigação de indenização, a IBM não limita sua responsabilidade de indenização para os modelos desenvolvidos pela IBM.

Agora, sob essas proteções, os modelos watsonx incluem:

(1) Família Slate de modelos somente para codificação.

(2) Família Granite de modelos somente para decodificação.

Saiba mais sobre o licenciamento dos modelos Granite

* Como modelos menores de IA adaptados ao setor podem oferecer maiores benefícios 
https://www.ft.com/partnercontent/ibm/how-smaller-industry-tailored-ai-models-can-offer-greater-benefits.html

1Avaliação comparativa do desempenho dos modelos Granite e dos principais modelos abertos, conduzida pela IBM Research, em relação a referências acadêmicas e empresariais — https://ibm.com/new/ibm-granite-3-0-open-state-of-the-art-enterprise-models