Modelos de base — IBM watsonx.IA

Apresentamos a terceira geração de modelos Granite da IBM: modelos de linguagem abertos, eficientes e confiáveis

Acelere sua jornada de IA com nossos novos modelos linguísticos de terceira geração, preparados para a empresa.

Modelos de base com liberdade de escolha

Ter opções é essencial para adotar a IA no seu negócio com sucesso. Nem todos os modelos são criados iguais. Os melhores modelos dependerão de seus setores, áreas e casos de uso. A watsonx.ai oferece aos clientes e parceiros uma seleção de modelos que abrangem os modelos de base desenvolvidos pela IBM, modelos de código aberto e modelos provenientes de fornecedores terceirizados. Oferecemos opções e flexibilidade em duas frentes: modelos e ambientes de implementação. Você pode implementar os modelos de IA onde quer que sua carga de trabalho se encontre.

Por mais de um século, a IBM trabalha para conquistar a confiança das empresas e da sociedade introduzindo no mundo tecnologias novas e avançadas, entre elas a IA, de forma responsável e com um propósito claro.

Perspectiva do modelo IBM: uma abordagem diferenciada para modelos de base de IA

O Granite 3.1 já está disponível na biblioteca de modelos de base do watsonx.

Novidades

Nova funcionalidade do modelo

Novidades do Granite - Modelos Granite 3.1 atualizados, novos modelos de integrações e muito mais

Nova funcionalidade do modelo

O modelo Llama 3.3 70b Instruct da Meta agora está disponível no watsonx.ai

Nova funcionalidade do modelo

Agora, os modelos de base no local da Mistral IA estão disponíveis no watsonx

Ebook: veja como escolher os modelos de base certos

Modelos IBM

A primeira versão da watsonx.ai incluía a família Slate de modelos somente de codificação voltados para casos de uso de processamento de linguagem natural (PNL) empresarial.

Com os recém-lançados modelos de base Granite, você pode aproveitar as vantagens de uma arquitetura somente de decodificação, projetada para tarefas generativas tais como resumo, geração de conteúdo e extração de insights.

Granite, desenvolvido pela IBM Research

IBM® Granite é nossa família de modelos de IA abertos, de alto desempenho e confiáveis, desenvolvidos para negócios e otimizados para ampliar suas aplicações de IA. Com o Granite 3.1, você encontrará modelos de código aberto, prontos para uso corporativo, que oferecem desempenho excepcional em uma ampla variedade de tarefas empresariais, como cibersegurança e RAG, além de atender a benchmarks de segurança.

Granite 3.1 8b e 2b: instrua modelos treinados em dados de alta qualidade otimizados para casos de uso corporativo e de linguagem natural
Granite Guardian: barreiras baseadas em LLM projetadas para detectar conteúdos prejudiciais, como discurso de ódio, linguagem ofensiva, viés social, entre outros.
Chat Granite 13b: modelo de chat otimizado para diálogos, adequado para assistentes virtuais e aplicativos de chat
Granite 13b instruct: modelo treinado com dados financeiros de alta qualidade para executar tarefas no setor financeiro.
Granite Code: família de modelos que variam de 3 a 34 bilhões de parâmetros e foram treinados em 116 linguagens de programação.
Granite multilíngue: treinado para entender e gerar textos em inglês, alemão, espanhol, francês e português
Granite japonês: projetado para executar tarefas linguísticas em textos em japonês.

IBM Embedding Models

Utilize modelos de incorporação desenvolvidos pela IBM e de código aberto, implementados no IBM watsonx.ai, para tarefas de geração aumentada por recuperação, busca semântica e comparação de documentos.

Granite-embedding-30M-english
Granite-embedding-125M-english
Granite-embedding-107M-multilingual
Granite-embedding-278M-multilingual

Conheça o watsonx.ai sem custo

Relatório da IBM Research

Veja como os modelos Granite foram treinados e como as fontes de dados foram utilizadas

Por que utilizar o IBM Granite?

Saiba mais sobre o Granite

Acelerar o time-to-value

Escolha o modelo certo, desde menos de um bilhão até 34 bilhões de parâmetros, com código aberto sob a licença Apache 2.0.

Eficiente

Não sacrifique desempenho por custo. Granite supera modelos comparáveis em diversas tarefas empresariais.

Confiança

Crie uma IA responsável com um conjunto abrangente de recursos para detecção de riscos e danos, transparência e proteção de propriedade intelectual.

Biblioteca de modelos base

Selecione um modelo de base generativo que melhor se adapte às suas necessidades. Após definir uma lista curta de modelos para o seu caso de uso, teste-os sistematicamente utilizando técnicas de engenharia de prompts para identificar aqueles que retornam os resultados desejados com maior consistência.

Veja mais informações sobre os preços do watsonx

Nome do modelo

Fornecedor

Casos de uso

Comprimento do contexto

Preço

USD/1 milhão de tokens

granite-3-2b-instruct (v3.1)

Novo

Modelo em destaque

IBM

Suporta perguntas e respostas (Q&A), sumarização, classificação, geração, extração, RAG e tarefas de codificação.

128 mil

0,10

granite-3-8b-instruct (v3.1)

Novo

Modelo em destaque

IBM

Suporta perguntas e respostas (Q&A), sumarização, classificação, geração, extração, RAG e tarefas de codificação.

128 mil

0,20

granite-guardian-3-8b (v3.1)

Novo

Modelo em destaque

IBM

Suporta a detecção de HAP/PII, jailbreaking, viés, violência e outros conteúdos prejudiciais.

128 mil

0,20

granite-guardian-3-2b (v3.1)

Novo

Modelo em destaque

IBM

Suporta a detecção de HAP/PII, jailbreaking, viés, violência e outros conteúdos prejudiciais.

128 mil

0,10

granite-20b-multilingual

Descontinuado

IBM

Suporta perguntas e respostas, sumarização, classificação, geração, extração, tradução e tarefas de RAG em francês, alemão, português, espanhol e inglês.

8192

0,60

granite-13b-chat

Descontinuado

IBM

Oferece suporte a tarefas de perguntas e respostas (Q&A), sumarização, classificação, geração, extração e RAG.

8192

0,60

granite-13b-instruct

IBM

Oferece suporte a tarefas de perguntas e respostas, sumarização, classificação, geração, extração e RAG.

8192

0,60

granite-34b-code-instruct

IBM

Modelo específico para tarefas de código, capaz de gerar, explicar e traduzir código a partir de um prompt em linguagem natural.

8192

0,60

granite-20b-code-instruct

IBM

Modelo específico para tarefas de código, capaz de gerar, explicar e traduzir código a partir de um prompt em linguagem natural.

8192

0,60

granite-8b-code-instruct

IBM

Modelo específico para tarefas de código, capaz de gerar, explicar e traduzir código a partir de um prompt em linguagem natural.

128 mil

0,60

granite-3b-code-instruct

IBM

Modelo específico para tarefas de código, capaz de gerar, explicar e traduzir código a partir de um prompt em linguagem natural.

128 mil

0,60

granite-8b-japanese

IBM

Oferece suporte a tarefas de perguntas e respostas, sumarização, classificação, geração, extração, tradução e RAG em japonês.

4096

0,60

llama-3-3-70b-instruct

Novo

Saiba mais

Meta

Oferece suporte a perguntas e respostas, sumarização, geração, codificação, classificação, extração, tradução e RAG em inglês, alemão, francês, italiano, português, hindi, espanhol e tailandês.

128 mil

0,71

llama-3-2-90b-vision-instruct

Novo

Saiba mais

Meta

Suporta legendagem de imagens, transcrição de imagem para texto (OCR), incluindo escrita manual, extração e processamento de dados, perguntas e respostas baseadas em contexto e identificação de objetos.

128 mil

2,00

llama-3-2-11b-vision-instruct

Novo

Saiba mais

Meta

128 mil

0,35

llama-guard-3-11b-vision

Novo

Saiba mais

Meta

Suporta filtragem de imagens, detecção de HAP/PII e filtragem de conteúdo prejudicial.

128 mil

0,35

llama-3-2-1b-instruct

Novo

Saiba mais

Meta

128 mil

0,10

llama-3-2-3b-instruct

Novo

Saiba mais

Meta

128 mil

0,15

llama-3-405b-instruct

Meta

Suporta perguntas e respostas, sumarização, geração, programação, classificação, extração, tradução e tarefas de RAG em inglês, alemão, francês, italiano, português, hindi, espanhol e tailandês.

128 mil

Input: 5.00/Saída: 16.00

llama-3-1-70b-instruct

Descontinuado

Meta

Suporta tarefas de perguntas e respostas (Q&A), sumarização, geração, codificação, classificação, extração, tradução e RAG em inglês, alemão, francês, italiano, português, hindi, espanhol e tailandês.

128 mil

1,80

llama-3-1-8b-instruct

Descontinuado

Meta

128 mil

0,60

llama-3-8b-instruct

Descontinuado

Meta

Suporta tarefas de sumarização, classificação, geração, extração e tradução.

8192

0,60

llama-3-70b-instruct

Descontinuado

Meta

Suporta tarefas de RAG, geração, sumarização, classificação, perguntas e respostas, extração, tradução e geração de código.

8192

1,80

allam-1-13b-instruct

SDAIA

Suporta perguntas e respostas, sumarização, classificação, geração, extração, RAG e tradução em árabe.

4096

1,80

codellama-34b-instruct

Descontinuado

Meta

Modelo específico para código, gerando e traduzindo código a partir de um prompt em linguagem natural.

16384

1,80

pixtral-12b

Novo

IA Mistral

128 mil

0,35

mistral-large-2

Novo

IA Mistral

Suporta perguntas e respostas, sumarização, geração, programação, classificação, extração, tradução e tarefas de RAG em francês, alemão, italiano, espanhol e inglês.

128 mil*

Input: 3.00/Saída: 10.00

Mistral-Small-24B-Instruct-2501

Novo

IA Mistral

Suporta tarefas de linguagem, fluxos de trabalho agênticos, RAG e muito mais em dezenas de idiomas, com tempo de resposta rápido.

32768

0,35

mixtral-8x7b-instruct

IA Mistral

Suporta perguntas e respostas, sumarização, classificação, geração, extração, RAG e geração de código.

32768

0,60

jais-13b-chat (árabe)

core42

Suporta perguntas e respostas, sumarização, classificação, geração, extração e tradução em árabe.

2048

1,80

flan-t5-xl-3b

Google

Suporta perguntas e respostas, sumarização, classificação, geração, extração e tarefas de RAG. Disponível para ajuste fino de prompt.

4096

0,60

flan-t5-xxl-11b

Google

Oferece suporte a tarefas de perguntas e respostas, sumarização, classificação, geração, extração e RAG.

4096

1,80

flan-ul2-20b

Google

Oferece suporte a tarefas de perguntas e respostas, sumarização, classificação, geração, extração e RAG.

4096

5,00

elyza-japanese-llama-2-7b-instruct

ELYZA

Suporta perguntas e respostas, sumarização, RAG, classificação, geração, extração e tradução.

4096

1,80

*Os preços apresentados são indicativos, podem variar de acordo com o país, excluem impostos e taxas aplicáveis e estão sujeitos à disponibilidade de ofertas do produto em uma localidade.

Incorporando biblioteca de modelos

Modelos de embedding convertem texto de input em embeddings, que são representações vetoriais densas do texto. Os embeddings capturam relações semânticas e sintáticas sutis entre palavras e trechos no espaço vetorial.

Nome do modelo

Fornecedor

Casos de uso

Comprimento do contexto

Preço

USD/1 milhão de tokens

granite-embedding-107m-multilingual

Novo

IBM