O que é um agente baseado em metas?

Agentes baseados em objetivos, definidos

Um agente baseado em objetivos é um agente de inteligência artificial que incorpora uma abordagem proativa e orientada a objetivos para resolução de problemas e tomada de decisão. É um exemplo de IA agêntica, em que os sistemas de IA realmente adotam ações em nome dos usuários (em nome distinto, digamos, um simples chatbot de suporte ao cliente de LLMs).

Na hierarquia de cinco níveis de complexidade de agentes, os agentes baseados em objetivos ficam diretamente no meio. Eles são mais complexos do que os agentes de reflexo simples (que seguem regras predefinidas) e os agentes de reflexo baseados em modelos (que adicionam um modelo interno do mundo). Mas são menos complexos do que os agentes baseados em utilidade (que podem calcular computações usando uma chamada função de utilidade) e agentes de aprendizado (que podem se adaptar e melhorar ao longo do tempo, muitas vezes por meio de aprendizado por reforço ou deep learning).

Os agentes baseados em objetivos superam os agentes de reflexo mais simples ao adicionar uma função de planejamento que considera estados futuros — mas não empregam as avaliações dinâmicas de agentes mais sofisticados, confiando em estratégias pré-programadas ou árvores de decisão em busca de seus objetivos. 

Um caso de uso real

Um exemplo de agente baseado em objetivos vem da robótica, especificamente da automação de armazéns. Um robô de armazém que precisa separar um determinado item de uma prateleira específica pode apenas reagir a obstáculos imediatos, como um robô aspirador de pó esbarrando nas paredes (um agente puramente reativo). No entanto, mais eficiente seria planejar um caminho que minimize desvios e evite obstáculos conhecidos. Por exemplo, em um ambiente dinâmico como um armazém moderno, um módulo de planejamento pode consultar sua base de conhecimento, observar o estado atual e mapear estados futuros (por exemplo, pela consciência dos movimentos planejados de outros bots), para alcançar melhor o resultado desejado eficientemente.

Como funcionam os agentes baseados em objetivos

Os agentes baseados em objetivos operam em quatro estágios: 

  1. Definição dos objetivos
  2. Planejamento
  3. Seleção de ações
  4. Execução

Definição dos objetivos

Primeiro, o agente recebe uma definição precisa de sucesso. Ao contrário dos agentes baseados em utilidade, os agentes baseados em objetivos operam sob condições lógicas e binárias. Mas, embora um agente baseado em objetivos possa definir sucesso como a inversão de bits de um estado para outro, não há nada que impeça que o "objetivo" singular de tal agente seja um conjunto moderadamente complexo de lógicas proposicionais e de primeira ordem. Por exemplo, um robô pode definir o objetivo de "para cada pacote atualmente marcado como urgente e entregar cada um a partir de seu respectivo local de inventário até a doca de expedição". O objetivo é fundamentalmente binário (pode-se ter sucesso ou falhar nesse objetivo), mas também tem múltiplos componentes, permitindo complexidade.

Embora seja bom que um usuário humano defina objetivos com precisão, também é possível que um humano insira um objetivo mais vago ("otimizar o atendimento de pedidos") e que um LLM preencha a lacuna e defina isso em um objetivos ou conjunto de objetivos mais preciso (por exemplo, "estimar a taxa de transferência diária do sistema", "definir pacotes P como prioridade mais alta", "definir objetivo para entregar pacotes P dentro de 24 horas"). 

Planejamento

Tendo formado seu objetivo, o agente baseado em objetivos se envolve em um pouco de planejamento antes de passar para a execução. Por exemplo, no exemplo do armazém, o agente passará algum tempo modelando as condições atuais e potenciais para escolher o caminho ideal para atender aos pedidos de prioridade mais alta no tempo, decidindo, por exemplo, com que frequência deve fazer viagens a partir das prateleiras do inventário até o local de expedição.

Seleção de ações

É claro que os planos são tão bons quanto a realidade que eles encontram. Enquanto alguns agentes baseados em objetivos são “conservadores” e preferem se ater aos planos até que se tornem literalmente impossíveis, abordagens mais flexíveis vêm de agentes “oportunistas” que, se encontrarem impedimentos a seus planos, calculam de forma flexível uma próxima ação melhor: muito como quando o Google Maps cria rotas para contornar um engarrafamento inesperado.

Execução

No caso de um robô de armazém, os sensores na máquina podem ajudar a monitorar a situação em tempo real, alimentando dados cruciais para o módulo de planejamento. Por exemplo, se um sensor detectar que o subobjetivo "pegar pacote" falhou por algum motivo, um agente baseado em objetivos pode tentar diagnosticar a causa, planejar uma abordagem alternativa ou pedir backup.

Agentes de IA

Cinco tipos de agentes de IA: funções autônomas e aplicações no mundo real

Saiba como a IA orientada por objetivos e baseada em utilidade se adapta a fluxos de trabalho e ambientes complexos.

Quando usar agentes baseados em objetivos versus tipos de agentes mais complexos 

A decisão sobre qual tipo de agente de IA usar se resume ao tipo de problema que se deve resolver. Desde que recebam objetivos específicos, os modelos de IA subjacentes aos agentes baseados em objetivos podem tomar decisões informadas e lidar com tarefas complexas, mas os critérios para o sucesso devem ser simples (muitas vezes binários).

No entanto, em situações em que a adaptabilidade em tempo real é crucial, ou quando há vários objetivos para se otimizar, as empresas podem querer passar de agentes baseados em objetivos para uma opção mais sofisticada, como agentes baseados em utilidade. Um exemplo canônico aqui seria um veículo autônomo. Quando um passageiro chama um carro autônomo, há vários objetivos para equilibrar: duração, preço, prevenção de trânsito e segurança. Para oferecer a melhor experiência do cliente, um veículo impulsionado por IA deve passar por processos de tomada de decisão complexos, calculando várias compensações de possíveis ações. A função de utilidade resultante ditará as ações do agente. 

Sistemas multiagentes

Não se pode dizer que um sistema agêntico não possa "misturar e combinar" tipos de agentes, com cada agente adaptado à complexidade do problema em questão. Por exemplo, pode-se imaginar um exemplo da área da saúde: um hospital que emprega não apenas agentes baseados em objetivos para executar fluxos de trabalho, mas também agentes dos outros quatro tipos examinados.

No nível mais simples, um agente de reflexo chamado Vitals Monitor pode simplesmente monitorar os sinais vitais de todos os pacientes. Seu objetivo específico é acionar um alarme se a frequência cardíaca de um paciente, por exemplo, cair abaixo de um certo nível, para melhor alertar um médico ou enfermeiro para intervenção humana. Esse agente pode confiar em algoritmos simples "if/then".

Um nível acima, um agente de reflexo baseado em modelo chamado Inventory Agent pode gerenciar o inventário de medicamentos e suprimentos para o hospital. Ele mantém um modelo interno de inventário atual, padrões de uso históricos e tempos de resposta de parceiros da cadeia de suprimentos, para melhor agilizar os pedidos de reabastecimento.

Em terceiro lugar, um agente baseado em objetivos de nível superior chamado Discharge Planner pode trabalhar para trás a partir do simples objetivo binário da alta do paciente. Ele se basearia em estratégias pré-programadas e árvores de decisão, ao mesmo tempo em que consideraria estados futuros, para coordenar laboratórios, medicamentos e aprovações de especialistas, incluindo todas as subtarefas necessárias. Se uma etapa estiver atrasada, seu módulo de planejamento poderá ser executado novamente, formulando um novo plano. (O agente baseado em objetivos, como a maioria desses agentes, provavelmente receberá ajuste fino em um grande modelo de linguagem.)

Em quarto lugar, um agente baseado em utilidade chamado Bed Assignment Optimizer pode atribuir pacientes a vários quartos, ao mesmo tempo em que tenta maximizar a segurança, a satisfação e o rendimento. Como deve gerenciar vários produtos e compensações complexas, o agente trabalha com uma função de utilidade, avaliando variáveis como contágio, níveis de pessoal e gravidade das doenças.

Em quinto e no mais alto nível, um agente de aprendizado chamado Intake Assistant emprega aprendizado de máquina, buscando padrões de experiências anteriores para melhorar perguntas de triagem, sinalizar pacientes de alto risco e reduzir etapas redundantes. Ao contrário dos agentes de nível inferior, esse agente de aprendizado deve avaliar continuamente conjuntos de dados em evolução, buscando padrões profundos que podem ser invisíveis para seres humanos. 

Os cinco agentes trabalham juntos como um conjunto de assistentes virtuais para resolver problemas complexos. Com a orquestração adequada, bem como a integração de vários recursos, desde processamento de linguagemnatural (NLP) e IA generativa até visão computacional e chamadas de ferramentas de APIs, o sistema multiagentes é simples onde precisa ser simples e complexo onde precisa ser complexo.

Techsplainers | Podcast

Ouça: “O que é um agente baseado em objetivos?”

Siga o Techsplainers: Spotify e Apple Podcasts

Autor

David Zax

Staff Writer

IBM Think

Soluções relacionadas
Agentes de IA para empresas

Crie, implemente e gerencie assistentes e agentes de IA potentes que automatizam fluxos de trabalho e processos com a IA generativa.

    Explore o watsonx Orchestrate
    Soluções de agentes de IA da IBM

    Construa o futuro do seu negócio com soluções de IA em que você pode confiar.

    Explore soluções de agentes de IA
    Serviços de IA do IBM® Consulting

    Os serviços de IA da IBM Consulting ajudam a reinventar a forma como as empresas trabalham com IA para gerar transformação.

    Explore os serviços de inteligência artificial
    Dê o próximo passo

    Se você optar por personalizar aplicativos e habilidades criados previamente ou criar e implementar serviços agênticos personalizados usando um estúdio de IA, a plataforma IBM watsonx tem aquilo de que você precisa.

    1. Explore o watsonx Orchestrate
    2. Explore o watsonx.ai