Os sistemas de IA compostos são configurações avançadas que combinam vários modelos, técnicas ou sistemas de IA para resolver problemas complexos de forma mais eficaz do que um único modelo de inteligência artificial (IA). Esses sistemas integram diferentes componentes, cada um especializado em uma tarefa específica, para trabalhar de forma colaborativa ou sequencial.
Embora muita atenção seja dada aos grandes modelos de linguagem (LLMs), esses modelos maciços de aprendizado de máquina (ML) enfrentam limitações. Eles são caros para executar e desenvolver e são lentos. Eles não têm conhecimento especializado específico do domínio e nem sempre são hábeis em lidar com tarefas complexas que envolvem muitas etapas entre sistemas.
Devido a essas restrições, os pesquisadores descobriram que complementar modelos monolíticos com outros modelos e ferramentas, cada um otimizado para uma função específica, pode proporcionar uma abordagem mais eficaz.
Um post de blog de 2024 do Berkeley Artificial Intelligence Research (BAIR) Lab (link externo a IBM.com) foi uma visão esclarecedora precoce de como seriam os sistemas de IA compostos. O post propôs que poderiam ser obtidos melhores resultados criando sistemas compostos de IA e que o futuro da IA envolveria organizações reunindo LLMs, sistemas de recuperação, agentes de IA e ferramentas externas, cada um otimizado para tarefas específicas.
Há inúmeros benefícios na orquestração de vários modelos individuais e componentes em interação.
Ao dividir tarefas entre modelos especializados, os sistemas compostos reduzem a carga cognitiva dos componentes individuais da IA. Por exemplo, um modelo pode se concentrar na análise de dados estruturados, enquanto outro interpreta dados não estruturados, como imagens ou texto. Essa divisão de trabalho leva a um melhor desempenho e maior precisão em comparação com sistemas de modelo único.
Os LLMs são poderosos e tornam-se ainda mais eficazes com mais recursos computacionais. No entanto, enfrentam limites de desempenho e retornos decrescentes devido às leis da escalabilidade. Em certos casos, em vez de aumentar os recursos computacionais de um LLM, pode ser preferível delegar determinadas tarefas a outro modelo, agente ou ferramenta que consuma menos recursos.
Combinar vários modelos para executar uma tarefa às vezes pode ser mais rápido do que treinar um único LLM para fazê-la. Além disso, os sistemas compostos podem processar diferentes tipos de dados simultaneamente, permitindo a tomada de decisões em tempo real. Isso é crítico em aplicações de IA, como detecção de fraudes, onde respostas rápidas são essenciais, ou aplicações de edge, onde a latência deve ser minimizada.
Sistemas compostos são altamente versáteis e aplicáveis a diversos casos de uso. Essa versatilidade torna os sistemas de IA compostos ótimos para empresas que buscam otimizar operações em múltiplos domínios.
As organizações podem se beneficiar de projetos de sistemas que utilizam uma combinação de componentes pré-treinados, soluções de código aberto e módulos personalizados. Cada componente pode ser atualizado ou substituído de forma independente à medida que a tecnologia evolui sem reformular todo o sistema. Ao distribuir tarefas entre vários modelos, os sistemas compostos se beneficiam da adaptabilidade e da resiliência a falhas de componentes individuais.
Métodos compostos, incluindo geração aumentada de recuperação (RAG), ampliam os recursos dos LLMs, permitindo que eles acessem fontes de dados fora de seus conjuntos de dados de treinamento iniciais. A combinação de diferentes modelos permite que os desenvolvedores otimizem para objetivos específicos, como velocidade ou conhecimento especializado do domínio.
Os LLMs podem ser pesados, propensos a alucinações e tomar decisões que nem sempre são facilmente explicáveis. Uma solução de IA composta pode ajudar a controlar as entradas e filtras as saídas, resultando em um comportamento mais controlado, que promove a confiança.
Sistemas de IA compostos já estão sendo utilizados em casos de uso reais, como:
Certas versões de chatbots, incluindo o ChatGPT da OpenAI e o Copilot da Microsoft, são desenvolvidas em arquiteturas compostas. O ChatGPT, por exemplo, amplia sua utilidade por meio de várias ferramentas e APIs para tarefas específicas.
Ele reúne um LLM, o gerador de imagens DALL-E e um plug-in interpretador de código. Ele usa RAG para acessar fontes de dados externas e bases de conhecimento dinamicamente. Modelos de IA separados são utilizados para detectar e filtrar conteúdos prejudiciais ou inadequados antes de gerar uma resposta.
Ainda que essa tecnologia não tenha sido amplamente adotada, sistemas de veículos autônomos utilizam modelos de visão computacional para detectar e reconhecer objetos ao redor do carro. Algoritmos de fusão de sensores combinam dados de câmeras, LiDAR, radar e sensores ultrassônicos para criar um mapa 3D abrangente do ambiente, aprimorando a consciência situacional.
Modelos de aprendizado por reforço lidam com a tomada de decisões, como determinar quando trocar de faixa, ajustar a velocidade ou parar em um semáforo, com base nas condições em tempo real.
Além disso, o processamento de linguagem natural (NLP) permite que o veículo interprete e responda aos comandos falados dos passageiros. Esses componentes trabalham juntos sem dificuldades para processar grandes volumes de dados, tomar decisões inteligentes em tempo real e proporcionar uma experiência intuitiva.
Um sistema de IA composto para suporte ao cliente combina diversas tecnologias de IA para fornecer um serviço eficiente, personalizado e responsivo. Por exemplo, modelos de processamento de linguagem natural analisam as solicitações dos clientes para extrair intenção e detalhes fundamentais, permitindo que o sistema compreenda a questão com precisão.
Depois que a intenção é identificada, um chatbot alimentado por IA generativa (IA gen) interage com o cliente por meio de conversação, oferecendo assistência imediata ou esclarecendo detalhes adicionais. Ao mesmo tempo, um sistema de recomendação sugere soluções relevantes, como etapas de solução de problemas, artigos de perguntas frequentes ou recomendações de produtos adaptadas às necessidades do cliente.
Para aprimorar a experiência, um modelo de análise de sentimentos avalia o tom e o estado emocional do usuário, ajudando a priorizar casos urgentes ou clientes insatisfeitos para intervenção humana. Essa combinação de componentes permite um suporte ao cliente rápido, inteligente e empático, reduzindo o tempo de resolução e mantendo altos níveis de satisfação.
Um sistema de IA composto em cadeias de suprimentos usa múltiplos componentes de IA para otimizar a logística, o gerenciamento de inventário e eficiência geral. Por exemplo, os modelos de análise preditiva de dados preveem a demanda ao analisar dados históricos de vendas, tendências sazonais e variáveis de mercado, permitindo um planejamento preciso do inventário.
Os sistemas de visão computacional monitoram as operações do armazém, identificando ineficiências ou erros em tempo real, como itens extraviados ou mercadorias danificadas. Simultaneamente, algoritmos de otimização de rotas determinam os caminhos de entrega mais eficientes, considerando fatores como tráfego, clima e consumo de combustível.
Além disso, o NLP permite o gerenciamento automatizado da comunicação com fornecedores e clientes, como o processamento de pedidos de compra ou respostas a consultas. Ao integrar esses componentes, o sistema melhora a capacidade de resposta da cadeia de suprimentos, reduz desperdícios e garante entregas pontuais, adaptando-se dinamicamente às mudanças na demanda e às condições externas.
Projetar sistemas de IA compostos envolve a integração de vários modelos e componentes de IA em frameworks coesos, capazes de lidar com tarefas complexas. Esses frameworks fornecem a infraestrutura necessária para combinar modelos diversos e garantir uma comunicação contínua entre eles.
Em um sistema de IA composto, uma lógica de controle programada pode chamar um modelo, ou um LLM pode estar "no comando", dependendo dos objetivos do sistema.
Há vantagens distintas em ambas as abordagens, e as várias maneiras pelas quais modelos e outros componentes podem trabalhar juntos dentro de um sistema de IA são ilimitadas. Então, os projetistas precisam pensar criticamente em sua abordagem e estar dispostos a experimentar várias arquiteturas e combinações de componentes.
As operações de aprendizado de máquina (MLOps) se tornam mais complicadas com fluxos de trabalho compostos. Por exemplo, é difícil aplicar métricas consistentes a diferentes tipos de ferramentas e modelos. Os pesquisadores do BAIRD afirmam que uma nova fase de desenvolvimento da IA surge junto com a mudança para sistemas compostos, para ajudar a lidar com os desafios apresentados pelo monitoramento, depuração e outras questões operacionais envolvidas.
Entrevistamos duas mil organizações a respeito de suas iniciativas de IA para descobrir o que está funcionando, o que não está e como se preparar.
O IBM Granite é nossa família de modelos de IA abertos, de alto desempenho e confiáveis, personalizados para a empresa e otimizados para escalar suas aplicações de IA. Explore as opções de linguagens, código, séries temporais e proteções.
Acesse nosso catálogo completo com mais de 100 cursos online comprando uma assinatura individual ou multiusuário hoje mesmo, para você expandir suas habilidades em uma variedade de nossos produtos por um preço único com desconto.
Liderada pelos principais líderes da IBM, o currículo dessa experiência foi desenvolvido para ajudar líderes empresariais a terem o conhecimento necessário para priorizar os investimentos em IA que podem estimular o crescimento.
Quer ter mais retorno sobre seus investimentos em IA? Saiba como o dimensionamento da IA generativa em áreas importantes promove mudanças, ajudando suas melhores mentes a criar e oferecer soluções novas e inovadoras.
Saiba como incorporar com confiança a IA generativa e o aprendizado de máquina em sua empresa.
Aprofunde-se nos três elementos críticos de uma estratégia de IA forte: gerar vantagem competitiva, escalar a IA em toda a empresa e avançar na IA confiável.