Modelos de base no watsonx.ai 
Explore a biblioteca de modelos de base da IBM na plataforma watsonx para escalar a IA generativa para sua empresa
Experimente sem custo Agende uma demo
Captura de tela do produto da interface do software watsonx.ai
Modelos de nível empresarial com poder de escolha

Ter opções é essencial para adotar a IA no seu negócio com sucesso. Nem todos os modelos são criados iguais. Os melhores modelos dependerão de seus setores, áreas e casos de uso. A watsonx.ai oferece aos clientes e parceiros uma seleção de modelos que abrangem os modelos de base desenvolvidos pela IBM, modelos de código aberto e modelos provenientes de fornecedores terceirizados. Oferecemos opções e flexibilidade em duas frentes: modelos e ambientes de implementação. Você pode implementar os modelos de IA onde quer que sua carga de trabalho se encontre.

Por mais de um século, a IBM trabalha para conquistar a confiança das empresas e da sociedade introduzindo no mundo tecnologias novas e avançadas, entre elas a IA, de forma responsável e com um propósito claro. 

Ebook: veja como escolher os modelos de base certos
O modelo Granite multilíngue já está disponível
Modelos IBM

A primeira versão da watsonx.ai incluía a família Slate de modelos somente de codificação voltados para casos de uso de processamento de linguagem natural (PNL) empresarial. 

Com os recém-lançados modelos de base Granite, você pode aproveitar as vantagens de uma arquitetura somente de decodificação, projetada para tarefas generativas tais como resumo, geração de conteúdo e extração de insights.

Modelos Granite    

O IBM Granite é uma série de destaque dos modelos de base de grande porte de linguagem baseados na arquitetura de transformação apenas de decodificação. Os modelos de linguagem Granite são treinados com dados empresariais confiáveis, abrangendo da internet, acadêmicos, código, jurídico e financeiro.

Os modelos oferecem desempenho aprimorado de forma consistente em casos de uso populares, como geração de conteúdo, resumos, classificações, extração de insights e Retrieval Augmented Generation (RAG).

Conheça o watsonx.ai sem custo

Relatório da IBM Research

Veja como os modelos Granite foram treinados e como as fontes de dados foram utilizadas

Por que utilizar o IBM Granite?         Confiável

Treinado com conteúdo relevante para empresas, o IBM Granite atende a rigorosos critérios de governança de dados, regulatórios e de risco, definidos e aplicados pelo código de ética de IA da IBM e pelo Chief Privacy Office.

Eficiente

Maior precisão para segmentos de negócios corporativos específicos, como finanças, e casos de uso como RAG, alcançada por meio de ajustes finos de conversação e técnicas de alinhamento de modelos.

Acelerar o time-to-value  

Um modelo com preço competitivo que precisa de menos infraestrutura, indenização de propriedade intelectual, e um toolkit fácil de usar para personalização do modelo e integração de aplicativos.

Biblioteca de modelo de base

Selecione um modelo de base generativo que melhor atenda às suas necessidades. Assim que você tiver uma pequena lista de modelos para o seu caso de uso, teste-os sistematicamente usando técnicas de engenharia de prompt para ver quais trazem os resultados desejados de forma consistente.

Veja mais informações sobre os preços do watsonx
Nome do modelo Fornecedor Casos de uso Comprimento do contexto Preço tokens USD/1000

granite-13b-chat 

Modelo em destaque

IBM

Oferece suporte a tarefas de perguntas e respostas (Q&A), sumarização, classificação, geração, extração e RAG.

 

8192

0.0006

granite-13b-instruct

Modelo em destaque

IBM 

Oferece suporte a tarefas de Q&A, sumarização, classificação, geração, extração e RAG.

8192

0.0006

granite-20b-multilingual

Modelo em destaque

IBM

Compatível com tarefas de Q&A, sumarização, classificação, geração, extração, tradução e RAG em francês, alemão, português, espanhol e inglês.

8190

0.0006

llama-2-70b-chat

Meta

Oferece suporte a tarefas de Q&A, sumarização, classificação, geração, extração e RAG.

4096

0.0018

llama-2-13b-chat

Meta

Oferece suporte a tarefas de Q&A, sumarização, classificação, geração, extração e RAG. Disponível para ajuste de prompt.

4096

0.0006

codellama-34b-instruct

Novo

Meta

Modelo específico para tarefas de programação, que gera e traduz códigos a partir de instruções em linguagem natural.

4096

0.0018

mixtral-8x7b-instruct

Novo

IA Mistral

Oferece suporte a tarefas de Q&A, sumarização, classificação, geração, extração, RAG e geração de código.

32768

0.0006

granite-8b-japanese

Novo

IBM

Oferece suporte a tarefas de Q&A, sumarização, classificação, geração, extração, tradução e RAG em japonês.

4096

0.0006

flan-t5-xl-3b

Google

Oferece suporte a tarefas de Q&A, sumarização, classificação, geração, extração e RAG. Disponível para ajuste de prompt.

4096

0.0006

flan-t5-xxl-11b

Google

Oferece suporte a tarefas de Q&A, sumarização, classificação, geração, extração e RAG.

4096

0.0018

flan-ul2-20b

Google

Oferece suporte a tarefas de Q&A, sumarização, classificação, geração, extração e RAG.

4096

0.005 

elyza-japanese-llama-2-7b-instruct

ELYZA

Oferece suporte a tarefas de Q&A, sumarização, RAG, classificação, geração, extração e tradução.

4096

0.0018

mt0-xxl-13b

BigScience 

Oferece suporte a tarefas de Q&A, sumarização, classificação e geração.

4096

0.0018 

Casos de clientes

As empresas estão entusiasmadas com a perspectiva de utilizar modelos de base e ML em um só lugar, com dados próprios, para acelerar as cargas de trabalho de IA generativa.

O Wimbledon usou os modelos de base do watsonx.ai para treinar a IA para criar comentários sobre tênis. Leia o estudo de caso

Proteção de propriedade intelectual para modelos de IA

A IBM acredita na criação, implementação e utilização de modelos de IA que promovam a inovação responsável em toda a empresa. A plataforma de dados e IA watsonx da IBM conta com um processo completo para construção e teste de modelos de base e IA generativa. Nos modelos desenvolvidos pela IBM, procuramos e removemos duplicidades e empregamos listas de bloqueio de URL, filtros para conteúdo questionável e qualidade de documento, divisão de frases e técnicas de tokenização, tudo antes do treinamento de modelo.

Durante o processo de treinamento de dados, trabalhamos para evitar desajustes nos resultados do modelo e usamos o ajuste fino supervisionado para melhor acompanhamento das instruções, para que o modelo possa ser usado para realizar tarefas empresariais via engenharia de prompt. Continuamos desenvolvendo os modelos Granite em diversos sentidos, incluindo outras modalidades, conteúdo específico do setor e mais anotações de dados para treinamento, ao mesmo tempo em que implementamos regularmente salvaguardas de proteção de dados para os modelos desenvolvidos pela IBM.

Dado o cenário de rápida mudança da tecnologia da IA generativa, espera-se que nossos processos completos evoluam e melhorem de forma contínua. Como prova do rigor que a IBM aplica ao desenvolvimento e teste de seus modelos de base, a empresa oferece indenização contratual padrão de propriedade intelectual para os modelos desenvolvidos pela IBM, semelhante àquelas que oferece para itens de hardware e software da IBM.

Além disso, ao contrário de alguns outros fornecedores de grandes modelos de linguagem e coerente com a abordagem padrão da IBM sobre indenização, a IBM não exige que seus clientes indenizem a IBM pelo uso, por parte dos clientes, de modelos desenvolvidos pela IBM. Além disso, de acordo com a abordagem da IBM em relação à sua obrigação de indenização, a IBM não limita sua responsabilidade de indenização para os modelos desenvolvidos pela IBM.

Agora, sob essas proteções, os modelos watsonx incluem:

(1) Família Slate de modelos somente para codificação.

(2) Família Granite de modelos somente para decodificação.

Saiba mais sobre o licenciamento dos modelos Granite

Dê o próximo passo

Dê o próximo passo para começar a operacionalizar e ajustar a escala da IA generativa e aprendizado de máquina para os negócios.

Experimente sem custo Agende uma demonstração
Outras maneiras de explorar Torne-se um Parceiro de Negócios IBM Interaja com a comunidade da IBM Documentação do SaaS Documentação de software Suporte
Notas de rodapé

Os preços de inferência são por 1.000 tokens (1 unidade de recurso). Os tokens de input e conclusão têm a mesma taxa de cobrança. 1.000 tokens geralmente equivalem a cerca de 750 palavras.

Nem todos os modelos estão disponíveis em todas as regiões. Consulte nossa documentação para ver os detalhes.

O comprimento do contexto é medido em tokens.

As declarações da IBM relativas a planos, orientações e intenções estão sujeitas a alteração ou cancelamento sem aviso prévio, a seu exclusivo critério. Consulte Preços para mais detalhes. Salvo disposição em contrário em preços do software, todos os recursos, variáveis e possíveis atualizações referem-se exclusivamente ao SaaS. A IBM não garante que os recursos e variáveis do SaaS e do software são os mesmos.