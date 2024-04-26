Empresas que operam em domínios especializados, como empresas de telecomunicações, saúde ou petróleo e gás, têm um foco direcionado. Embora possam se beneficiar de cenários e casos de uso típicos de IA generativa, seriam mais bem atendidos com modelos menores.

No caso das empresas de telecomunicações, por exemplo, alguns dos casos de uso comuns são assistentes de IA em centrais de contato, ofertas personalizadas na prestação de serviços e chatbots impulsionados por IA para melhorar a experiência do cliente. Os casos de uso que ajudam as empresas de telecomunicações a melhorar o desempenho de sua rede, aumentar a eficiência espectral em redes 5G ou ajudá-las a determinar gargalos específicos em sua rede são mais bem atendidos pelos dados da própria empresa (em oposição a um LLM público).

Isso nos leva à noção de que menor é melhor. Agora, existem pequenos modelos de linguagem (SLMs) que são "menores" em tamanho em comparação com os LLMs. Os SLMs são treinados com dezenas de bilhões de parâmetros, enquanto os LLMs são treinados com centenas de bilhões de parâmetros. Mais importante, os SLMs são treinados com dados relativos a um domínio específico. Eles podem não ter informações contextuais amplas, mas têm um desempenho muito bom no domínio escolhido.

Devido ao seu tamanho menor, esses modelos podem ser hospedados no data center de uma empresa em vez de na nuvem. Os SLMs podem até ser executados em um único chip de GPU em escala, economizando milhares de dólares em custos anuais de computação. No entanto, a distinção entre o que só pode ser executado em uma nuvem ou em um data center corporativo se torna menos clara com os avanços no projeto de chips.

Seja por custo, privacidade de dados ou soberania de dados, as empresas podem querer executar esses SLMs em seus data centers. A maioria das empresas não gosta de enviar seus dados para a nuvem. Outro motivo importante é o desempenho. A IA generativa na edge realiza a computação e a inferência o mais próximo possível dos dados, tornando-a mais rápida e segura do que através de um provedor de nuvem.

Vale a pena observar que os SLMs exigem menos poder computacional e são ideais para implementação em ambientes com recursos limitados e até mesmo em dispositivos móveis.

Um exemplo no local pode ser uma localização do IBM Cloud Satellite , que possui uma conexão segura de alta velocidade com o IBM Cloud que hospeda os LLMs. As empresas de telecomunicações podem hospedar esses SLMs em suas estações base e oferecer essa opção aos seus clientes também. É tudo uma questão de otimizar o uso de GPUs, pois a distância que os dados devem percorrer é diminuída, resultando em largura de banda melhorada.