Selecionar os modelos de base certos antecipadamente pode ajudar a obter resultados mais precisos e eficientes para sua empresa.

A arquitetura de transformadores favorece o tamanho: modelos maiores produzem melhores resultados. Então, há uma corrida na IA generativa para construir modelos de base cada vez maiores para aplicações cada vez mais amplas. Mas, embora os modelos maiores sejam poderosos, um modelo pesado com vários bilhões de parâmetros pode nem sempre ser a melhor opção para uma empresa. Um modelo menor que foi ajustado para uma tarefa pode muitas vezes superar um modelo grande que não foi ajustado para essa tarefa. Esses modelos podem ser executados em LLMs de uso geral com pequenos ajustes se a base subjacente for adequada para uso empresarial. Por exemplo, os modelos de base Granite de 13 bilhões de parâmetros da IBM, disponíveis na próxima versão do watsonx.ai, são muito menores do que os maiores LLMs (que contêm centenas de bilhões de parâmetros), mas têm bom desempenho em tarefas específicas de negócios, como sumarização, resposta a perguntas e classificação, sendo muito mais eficientes.

Modelos de base adequados à finalidade também permitem que as organizações automatizem e acelerem a modernização ao gerar trechos de código e componentes de aplicações, juntamente com a automação de testes de aplicações. Com base nos modelos de código incorporados ao watsonx.ai, o IBM watsonx Code Assistant também pode ser usado para converter código, por exemplo, de COBOL para Java. No watsonx Code Assistant, desenvolvedores de todos os níveis de experiência podem formular solicitações em linguagem simples e obter recomendações geradas por IA ou gerar código com base no código-fonte existente. O watsonx.ai também inclui acesso ao StarCoder LLM, treinado em dados licenciados abertamente do GitHub. Os desenvolvedores podem aproveitar o StarCoder para acelerar a geração de código e aumentar a produtividade para modernização de aplicações e modernização de TI.

Além do tamanho, ao escolher um modelo de base, os CTOs também devem considerar as linguagens naturais e as linguagens de programação compatíveis com o modelo e a quantidade de ajuste fino de que o modelo precisa.