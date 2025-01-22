Os grandes modelos de linguagem (LLMs) têm dominado o debate sobre IA, impulsionados pela popularidade do ChatGPT e de aplicativos de IA generativa semelhantes. No entanto, os modelos de linguagem pequenos (SLMs) estão em ascensão. Mais compactos e eficientes, os SLMs usam menos memória e poder de processamento. Isso os torna adequados para ambientes com recursos limitados.
Sua capacidade de produzir conteúdo e insights exclusivos a partir de um vasto conjunto de dados cativou o mundo e impulsionou o desenvolvimento de novas ferramentas e aplicações, consolidando ainda mais seu impacto cultural, especialmente no ambiente corporativo. Com o Dr. Juan Bernabe Moreno, Diretor da IBM Research Europe para o Reino Unido e Irlanda, exploraremos como os SLMs podem beneficiar a adoção da IA empresarial.
A inteligência artificial generativa (IA generativa) tem um potencial de produtividade significativo para as empresas. No entanto, na implementação de modelos de IA, maior nem sempre é melhor. Existem dois problemas principais com o LLM que impedem sua adoção pelas empresas.
Primeiro, muitos LLMs são de uso geral, o que limita seu valor. Os modelos de empresas "médias" são ineficazes porque não existe uma empresa "média". É necessário criar, ajustar e implementar modelos de IA eficazes de acordo com as necessidades específicas de cada organização.
Em segundo lugar, muitos LLMs proprietários são "caixas-pretas" – um modelo fechado em que apenas a empresa proprietária pode ver os componentes –, carecendo de transparência de dados e dificultando a integração com dados corporativos, onde reside o verdadeiro valor da IA. Isso deixa as empresas responsáveis pelo desempenho do modelo sem insights nem controle.
Esses problemas impedem a confiança e a compreensão da segurança do modelo. Sem escolher efetivamente as soluções de IA generativa para atender aos requisitos setoriais, legais e regulatórios, as empresas não podem usar totalmente o poder da IA generativa.
Para que a IA generativa seja bem-sucedida, as empresas precisam de três itens:
Para atender a essas necessidades e maximizar o valor da IA, as empresas estão recorrendo aos SLMs e descobrindo o poder dos pequenos. Os SLMs oferecem uma alternativa atraente aos LLMs de uso geral.
Os SLMs receberam muito menos atenção e alarde, mas oferecem uma opção atraente para organizações de todos os tamanhos. Sua eficiência energética, transparência de dados e alto desempenho (muitas vezes igual ou superior a modelos maiores) liberam a adoção responsável da IA generativa sem impedir a inovação.
Geralmente, qualquer modelo com menos de 30 bilhões de parâmetros é considerado um SLM. Entre as principais vantagens, destacam-se os custos mais baixos, o menor consumo de energia e a melhoria da transparência e integridade dos dados. Uma nova geração de modelos menores, como o IBM Granite, desenvolvidos com base em um conjunto de dados limpo e filtrado para tarefas específicas, reduz riscos como vieses e produção inadequada, ao mesmo tempo que aumenta a visibilidade dos dados.
Este modelo básico confiável permite a integração confiável de dados proprietários, liberando o verdadeiro valor da IA. A IBM oferece uma garantia de propriedade intelectual (PI) para todos os modelos Granite, aumentando ainda mais a confiança na integração de seus dados com os modelos.
IBM acredita que os modelos básicos de código aberto capacitam a organização a criar modelos especializados e integradores de dados. Para dar suporte a isso, a IBM tornou de código aberto sua família Granite de SLMs personalizáveis, treinados em conjuntos de dados transparentes e filtrados.
Ao combinar um modelo Granite de menor porte com os dados da própria empresa, é possível alcançar um desempenho específico para cada tarefa que rivaliza com o de modelos maiores, mas a uma fração do custo. Os primeiros testes de conceito mostram que os modelos Granite da IBM custam significativamente menos (entre 3 e 23 vezes menos) do que os grandes modelos de fronteira, ao mesmo tempo que superam ou igualam concorrentes de tamanho semelhante em benchmarks importantes.
Além disso, novas técnicas como o InstructLab, apresentado pela IBM e RedHat em maio de 2024, simplificam a infusão de dados corporativos em LLMs. O InstructLab permite que as empresas personalizem modelos de IA usando muito menos informações geradas por humanos e recursos computacionais do que o treinamento tradicional.
Os SLMs, incluindo os modelos Granite, já estão causando impacto. Instituições esportivas globais usam modelos Granite, ajustados com seus próprios dados de domínio, para aprimorar a experiência dos fãs com comentários gerados por IA. Internamente, a IBM usa modelos Granite para alimentar sua plataforma de serviços de recursos humanos (RH), AskHR. Usando prompts em linguagem natural, os funcionários da IBM podem acessar os serviços de RH em um único local, economizando tempo tanto para os colaboradores quanto para os profissionais de RH.
Grandes LLMs não são a única maneira de se beneficiar da IA generativa. Modelos menores, mais acessíveis e especializados oferecem a eficiência, a confiança, a flexibilidade e o desempenho necessários a um custo menor, tanto financeiramente quanto ambientalmente.
