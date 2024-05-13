Tags
Dimensionamento da IA generativa com opções flexíveis de modelos

Esta série de blogs desmistifica a IA generativa (IA gen) empresarial para líderes de negócios e tecnologia. Ela fornece frameworks simples e princípios orientadores para sua jornada de inteligência artificial (IA) transformadora. No blog anterior, discutimos a abordagem diferenciada da IBM para fornecer modelos de nível empresarial. Neste blog, nos aprofundaremos no motivo pelo qual as escolhas de modelos de base são importantes e como elas permitem que as empresas escalem a IA generativa com confiança.

Por que as escolhas de modelos são importantes?

No mundo dinâmico da IA generativa, as abordagens de tamanho único são inadequadas. À medida que as empresas se esforçam para aproveitar o poder da Power, ter um espectro de opções de modelos à sua disposição é necessário para:

  • Estimular a inovação: uma paleta diversificada de modelos não apenas promove a inovação, trazendo pontos fortes distintos para lidar com uma ampla gama de problemas, mas também permite que as equipes se adaptem às necessidades de negócios em constante evolução e às expectativas dos clientes.
  • Personalizar para obter vantagem competitiva: uma variedade de modelos permite que as empresas adaptem as aplicações de IA aos requisitos de nicho, proporcionando uma vantagem competitiva. A IA generativa pode ser ajustada para tarefas específicas, como responder a perguntas em aplicação de chat ou escrever código para gerar resumos rápidos.
  • Acelerar o tempo de lançamento no mercado: no ambiente de negócios acelerado de hoje, o tempo é essencial. Um portfólio diversificado de modelos pode agilizar o processo de desenvolvimento, permitindo que as empresas apresentem rapidamente ofertas impulsionadas por IA. Isso é especialmente crucial na IA generativa, em que o acesso às últimas inovações oferece uma vantagem competitiva fundamental.
  • Manter-se flexível diante das mudanças: as condições de mercado e as estratégias de negócios estão em constante evolução. Várias opções de modelos permitem que as empresas se adaptem de forma rápida e eficaz. O acesso a várias opções permite uma rápida adaptação quando ocorrem novas tendências ou mudanças estratégicas, mantendo a agilidade e a resiliência.
  • Otimizar os custos entre os casos de uso: os diferentes modelos têm implicações de custo variadas. Ao acessar uma variedade de modelos, as empresas podem selecionar a opção mais econômica para cada aplicação. Embora algumas tarefas possam exigir a precisão de modelos de alto custo, outras podem ser abordadas com alternativas mais acessíveis sem sacrificar a qualidade. Por exemplo, no atendimento ao cliente, o rendimento e a latência podem ser mais críticos do que a precisão, enquanto em recursos e desenvolvimento, a precisão é mais importante.
  • Mitigar riscos: confiar em um único modelo ou em uma seleção limitada pode ser arriscado. Um portfólio diversificado de modelos ajuda a mitigar os riscos de concentração, ajudando a garantir que as empresas permaneçam resilientes às deficiências ou falhas de uma abordagem específica. Essa estratégia permite a distribuição de riscos e fornece soluções alternativas em caso de desafios.
  • Cumprir as regulamentações: o cenário regulatório para a IA ainda está evoluindo, com preocupações éticas em primeiro lugar. Modelos diferentes podem ter implicações variadas em termos de justiça, privacidade e conformidade. Uma ampla seleção permite que as empresas naveguem por esse terreno complexo e escolham modelos que atendam aos padrões legais e éticos.

Seleção dos modelos de IA certos

Agora que entendemos a importância da seleção de modelos, como lidamos com o problema de sobrecarga de escolha ao selecionar o modelo certo para um caso de uso específico? Podemos dividir esse problema complexo em um conjunto de etapas simples que você pode aplicar hoje mesmo:

  1. Identificar um caso de uso claro: determine as necessidades e os requisitos específicos da sua aplicação de negócios. Isso envolve a elaboração de prompts detalhados que consideram sutilezas em seu setor e negócio para ajudar a garantir que o modelo esteja alinhado com seus objetivos.
  2. Listar todas as opções de modelo: avalie vários modelos com base em tamanho, precisão, latência e riscos associados. Isso inclui entender os pontos fortes e fracos de cada modelo, como as compensações entre precisão, latência e rendimento.
  3. Avaliar os atributos do modelo: avalie a adequação do tamanho do modelo às suas necessidades, considerando como a escala do modelo pode afetar seu desempenho e os riscos envolvidos. Esta etapa se concentra em dimensionar corretamente o modelo para se ajustar ao caso de uso de forma otimizada, já que maior não é necessariamente melhor. Os modelos menores podem superar os maiores em domínios-alvo e casos de uso.
  4. Testar opções de modelo: realize testes para verificar se o modelo funciona conforme o esperado sob condições que imitam cenários do mundo real. Isso envolve o uso de benchmarks acadêmicas e conjuntos de dados específicos de domínio para avaliar a qualidade da produção e ajustar o modelo, por exemplo, por meio de engenharia de prompts ou ajuste de modelo para otimizar o desempenho.
  5. Refinar sua seleção com base no custo e nas necessidades de implementação: após o teste, refine sua escolha considerando fatores como retorno do investimento, custo-benefício e os aspectos práticos de implementar o modelo dentro dos seus sistemas e infraestrutura existentes. Ajuste as opções com base em outros benefícios, como menor latência ou maior transparência.
  6. Escolher o modelo que oferece maior valor: faça a seleção final de um modelo de IA que ofereça o melhor equilíbrio entre desempenho, custo e riscos associados, adaptada às demandas específicas do seu caso de uso.

Biblioteca de modelos IBM® watsonx

Ao buscar uma estratégia multimodelo, a biblioteca do IBM watsonx oferece modelos proprietários, de código aberto e de terceiros, como mostra a imagem:

Lista de modelos de base do watsonx em 8 de maio de 2024.

Isso oferece aos clientes uma variedade de opções, permitindo que selecionem o modelo que melhor se adapte às suas preferências exclusivas de negócios, regionais e de risco.

Além disso, o watsonx permite que os clientes implementem modelos na infraestrutura de sua escolha, com opções de multinuvem híbrida, para evitar o lock-in com fornecedor e reduzir o custo total de propriedade.

IBM Granite: modelos de base de nível empresarial da IBM

As características dos modelos de base podem ser agrupadas em três atributos principais. As organizações devem entender que enfatizar demais um atributo pode comprometer os outros. Equilibrar esses atributos é fundamental para personalizar o modelo de acordo com as necessidades específicas de uma organização:

  1. Confiável: modelos claros, explicáveis e inofensivos.
  2. Desempenho: o nível certo de desempenho para domínios de negócios específicos e casos de uso específicos.
  3. Econômico: modelos que oferecem IA generativa a um custo total de propriedade e risco reduzidos.

O IBM Granite é uma série de destaque dos modelos de nível empresarial desenvolvidos pela IBM Research. Esses modelos têm uma funcionalidade ideal desses atributos, com foco na confiança e na confiabilidade, permitindo que as empresas tenham sucesso em suas iniciativas de IA generativa. Lembre-se de que as empresas não podem escalar a IA generativa com modelos de base nos quais não possam confiar.

O IBM watsonx oferece modelos de IA de nível empresarial resultantes de um rigoroso processo de refinamento. Esse processo começa com a inovação do modelo liderada pela IBM Research, envolvendo colaborações abertas e treinamento em conteúdo relevante para empresas sob o Código de Ética de IA da IBM para promover a transparência dos dados.

A IBM Research desenvolveu uma técnica de ajuste de instruções que aprimora os modelos de código aberto desenvolvidos pela IBM e os modelos desenvolvidos pela IBM com recursos essenciais para o uso empresarial. Além de benchmarks acadêmicas, nosso conjunto de dados "FM_EVAL" simula aplicação de IA corporativa do mundo real. Os modelos mais robustos deste pipeline são disponibilizados no IBM watsonx.ai, fornecendo aos clientes modelos de base de IA generativa confiáveis e de nível empresarial, como mostra a imagem:

Modelos de base de IA generativa de nível empresarial

Anúncios de modelos mais recentes:

  • Modelos de código Granite: uma família de modelos treinados em 116 linguagens de programação e que variam em tamanho de 3 a 34 bilhões de parâmetros, tanto em um modelo base quanto em variantes de modelo de acompanhamento de instruções.
  • Granite-7b-lab: suporta tarefas de uso geral e é ajustado com a metodologia de alinhamento em grande escala de chatbot (LAB) da IBM para incorporar novas habilidades e conhecimentos.

Experimente nossos modelos de base de nível empresarial no watsonx com nossa nova demonstração de bate-papo do watsonx.ai. Descubra seus recursos em resumo, geração de conteúdo e processamento de documentos por meio de uma interface de bate-papo simples e intuitiva.