O que é planejamento de agentes de IA?

Autores

Cole Stryker

Staff Editor, AI Models

IBM Think

O que é planejamento de agentes de IA?

O planejamento de agentes de IA refere-se ao processo pelo qual um agente de inteligência artificial (IA) determina uma sequência de ações para alcançar um objetivo específico. Envolve tomada de decisão, priorização de metas e sequenciamento de ações, geralmente utilizando diversos algoritmos e frameworks de planejamento.

O planejamento de agentes de IA é um módulo comum a muitos tipos de agentes que existe juntamente com outros módulos, como percepção, raciocínio, tomada de decisão, ação, memória, comunicação e aprendizado. O planejamento trabalha em conjunto com esses outros módulos para ajudar a garantir que os agentes alcancem os resultados desejados por seus projetistas.

Nem todos os agentes podem planejar. Ao contrário de agentes reativos simples, que respondem imediatamente aos estímulos, os agentes planejadores preveem estados futuros e geram um plano de ação estruturado antes da execução. Isso torna o planejamento da IA essencial para tarefas de automação, que exigem tomada de decisão em várias etapas, otimização e adaptabilidade.

As mais recentes notícias de tecnologia, corroboradas por insights de especialistas.

Mantenha-se atualizado sobre as tendências mais importantes e fascinantes do setor em IA, automação, dados e muito mais com o boletim informativo da Think. Consulte a declaração de privacidade da IBM.

Agradecemos a você! Você se inscreveu.

Sua inscrição será entregue em inglês. Você pode encontrar um link para cancelar a inscrição em todos os boletins informativos. Você pode gerenciar suas inscrições ou cancelar a inscrição aqui. Consulte nossa declaração de privacidade da IBM para obter mais informações.

Como funciona o planejamento de agentes de IA

Avanços em grandes modelos de linguagem (LLMs), como o GPT da OpenAI, e técnicas relacionadas envolvendo algoritmos de aprendizado de máquina, resultaram no boom da IA generativa (IA gen) dos últimos anos, e outros avanços levaram ao campo emergente de agentes autônomos.

Ao integrar ferramentas, APIs, interfaces de hardware e outros recursos externos, os sistemas de IA agêntica tornam-se cada vez mais autônomos, capazes de tomar decisões em tempo real e resolver problemas em diversos casos de uso.

Agentes complexos não podem agir sem antes tomar uma decisão, e não podem tomar boas decisões sem primeiro elaborar um plano. O planejamento agêntico é composto por vários componentes fundamentais que trabalham em conjunto para incentivar a tomada de decisão ideal.

Definição do objetivo

O primeiro e mais crítico passo no planejamento da IA é definir um objetivo claro. O objetivo serve como princípio orientador para o processo de tomada de decisão do agente, determinando o estado final que ele busca alcançar. Os objetivos podem ser estáticos, permanecendo inalterados durante todo o processo de planejamento, ou dinâmicos, ajustando-se com base nas condições ambientais ou nas interações do usuário.

Por exemplo, um carro autônomo pode ter como objetivo chegar a um destino específico de forma eficiente, respeitando as normas de segurança Sem um objetivo bem definido, um agente ficaria sem direção, levando a comportamentos erráticos ou ineficientes.

Se o objetivo for complexo, os modelos de IA agêntica irão dividi-lo em subobjetivos menores e mais gerenciáveis, em um processo chamado decomposição de tarefas. Isso permite que o sistema se concentre em tarefas complexas de maneira hierárquica.

Grandes modelos de linguagem (LLMs) desempenham um papel vital na decomposição de tarefas, dividindo um objetivo de alto nível em subtarefas menores e, em seguida, executando essas subtarefas por meio de várias etapas. Por exemplo, um usuário pode pedir a um chatbot por meio de um prompt em linguagem natural para planejar uma viagem.

O agente primeiro decompõe a tarefa em componentes, como reservar voos, encontrar hotéis e planejar um itinerário. Depois da decomposição, o agente pode utilizar interfaces de programação de aplicativos (APIs) para buscar dados em tempo real, verificar preços e até sugerir destinos.

Representação de estado

Para planejar de forma eficaz, um agente deve ter uma compreensão estruturada de seu ambiente. Esse entendimento é alcançado por meio da representação de estado, que modela as condições atuais, as restrições e os fatores contextuais que influenciam a tomada de decisão.

Agentes possuem algum conhecimento embutido derivado de seus dados de treinamento ou de conjuntos de dados representando interações anteriores, mas a percepção em tempo real é necessária para que os agentes compreendam de fato seu ambiente. Os agentes coletam dados por meio de entradas sensoriais, permitindo que modelem seu ambiente, além de considerar entradas de usuários e dados que descrevem seu próprio estado interno.

A complexidade da representação do estado varia de acordo com a tarefa. Por exemplo, em um jogo de xadrez, o estado inclui a posição de todas as peças no tabuleiro, enquanto em um sistema de navegação robótica, o estado pode envolver coordenadas espaciais, obstáculos e condições do terreno.

A precisão da representação de estado influencia diretamente a capacidade do agente de tomar decisões informadas, pois determina quão bem o agente pode prever os resultados de suas ações.

Sequenciamento de ações

Uma vez que o agente tenha estabelecido seu objetivo e avaliado seu ambiente, ele precisa determinar uma sequência de ações que o levará do estado atual ao estado-alvo desejado. Esse processo, conhecido como sequenciamento de ações, envolve a estruturação de um conjunto lógico e eficiente de etapas que o agente deve seguir.

O agente precisa identificar ações potenciais, reduzir essa lista às ações ideais, priorizá-las e identificar dependências entre ações, além de etapas condicionais baseadas em possíveis mudanças no ambiente. O agente pode alocar recursos a cada etapa na sequência ou agendar ações com base em restrições ambientais.

Por exemplo, um aspirador robótico precisa decidir o caminho mais eficaz para limpar um cômodo, garantindo que todas as áreas necessárias sejam cobertas sem repetições desnecessárias. Se a sequência de ações não for bem planejada, o agente de IA poderá realizar etapas ineficientes ou redundantes, levando ao desperdício de recursos e ao aumento do tempo de execução.

O framework ReAct é uma metodologia usada em IA para lidar com a tomada de decisão dinâmica. No framework ReAct, o raciocínio se refere ao processo cognitivo em que o agente determina quais ações ou estratégias são necessárias para atingir um objetivo específico.

Essa fase é semelhante à fase de planejamento na IA agêntica, em que o agente gera uma sequência de etapas para resolver um problema ou cumprir uma tarefa. Outros frameworks emergentes incluem o ReWOO, RAISE e Reflexion, cada um com seus próprios pontos fortes e fracos.

Otimização e avaliação

O planejamento de IA geralmente envolve a seleção do caminho mais ideal para atingir um objetivo, especialmente quando várias opções estão disponíveis. A otimização ajuda a garantir que a sequência de ações escolhida por um agente seja a mais eficiente, econômica ou benéfica, dadas as circunstâncias. Esse processo geralmente exige a avaliação de diferentes fatores, como tempo, consumo de recursos, riscos e possíveis recompensas.

Por exemplo, um robô de armazém encarregado de buscar itens precisa determinar a rota mais curta e segura para evitar colisões e reduzir o tempo operacional. Sem uma otimização adequada, agentes de IA podem executar planos que, embora funcionais, estão abaixo do ideal, levando a ineficiências. Vários métodos podem ser usados para otimizar a tomada de decisão, incluindo:

Pesquisa heurística

Algoritmos de pesquisa heurística ajudam agentes a encontrar soluções ideais ao estimar o melhor caminho para alcançar um objetivo. Esses algoritmos se baseiam em funções heurísticas — estimativas matemáticas de quão próximo um determinado estado está da meta desejada. As pesquisas heurísticas são particularmente eficazes em ambientes estruturados, nos quais os agentes precisam encontrar caminhos ideais ótimos rapidamente.

Aprendizado de reforço

O aprendizado por reforço permite que agentes otimizem o planejamento por meio de tentativa e erro, aprendendo quais sequências de ações levam aos melhores resultados ao longo do tempo. Um agente interage com o ambiente, recebe feedback em forma de recompensas ou penalidades e ajusta devidamente suas estratégias.

Planejamento probabilístico

Em cenários do mundo real, agentes de IA frequentemente operam em ambientes incertos, onde os resultados não são determinísticos. Métodos de planejamento probabilístico levam em conta a incerteza ao avaliar múltiplos resultados possíveis e selecionar ações com a maior utilidade esperada.

Colaboração

O planejamento de um único agente é uma coisa, mas em um sistema multiagentes, os agentes de IA precisam trabalhar de forma autônoma enquanto interagem entre si para atingir objetivos individuais ou coletivos.

O processo de planejamento para agentes de IA em um sistema multiagente é mais complexo do que para um único agente, pois os agentes precisam não apenas planejar suas próprias ações, mas também considerar as ações dos outros agentes e como suas decisões interagem com as decisões deles.

Dependendo da arquitetura agêntica, cada agente no sistema normalmente tem seus próprios objetivos individuais, que podem envolver a realização de tarefas específicas ou a maximização de uma função de recompensa. Em muitos sistemas multiagentes, os agentes precisam trabalhar juntos para alcançar metas compartilhadas.

Esses objetivos podem ser definidos por um sistema abrangente ou emergir das interações entre os agentes. Os agentes precisam de mecanismos para se comunicar e alinhar seus objetivos, especialmente em cenários cooperativos. Isso pode ser feito por meio de mensagens explícitas, definições de tarefas compartilhadas ou coordenação implícita.

O planejamento em sistemas multiagentes pode ser centralizado, onde uma única entidade ou controlador (provavelmente um agente de LLM) gera o plano para todo o sistema.

Cada agente recebe instruções ou planos de uma autoridade central. Também pode ser descentralizado, em que os agentes geram seus próprios planos, mas trabalham de forma colaborativa para garantir que estejam alinhados entre si e contribuam para objetivos globais, frequentemente exigindo comunicação e negociação.

Esse processo de tomada de decisão colaborativa aumenta a eficiência, reduz vieses na execução de tarefas, ajuda a evitar alucinações por meio de validação cruzada e construção de consenso, e incentiva os agentes a trabalhar em direção a um objetivo comum.

Agentes de IA

Cinco tipos de agentes de IA: funções autônomas e aplicações no mundo real

Saiba como a IA orientada por objetivos e baseada em utilidade se adapta a fluxos de trabalho e ambientes complexos.

Depois do planejamento

As fases nos fluxos de trabalho de IA agêntica nem sempre ocorrem de forma estritamente linear. Embora essas fases sejam distintas conceitualmente, na prática, elas frequentemente se intercalam ou são iterativas, dependendo da natureza da tarefa e da complexidade do ambiente em que o agente opera.

As soluções de IA podem diferir dependendo de seu design, mas em um fluxo de trabalho agêntico típico, a próxima fase após o planejamento é a execução da ação, onde o agente realiza as ações definidas no plano. Isso envolve a execução de tarefas e a interação com sistemas externos ou bases de conhecimento com geração aumentada de recuperação (RAG), uso de ferramentas e chamada de funções (chamada de ferramentas).

A construção de agentes de IA para esses recursos pode envolver o LangChain. Scripts em Python, estruturas de dados em JSON e outras ferramentas programáticas ampliam a capacidade da IA de tomar decisões.

Após executar os planos, alguns agentes podem usar a memória para aprender com suas experiências e iterar devidamente seus comportamentos.

Em ambientes dinâmicos, o processo de planejamento deve ser adaptativo. Os agentes recebem continuamente feedback sobre o ambiente e as ações de outros agentes, e precisam ajustar seus planos conforme a necessidade. Isso pode envolver a revisão de objetivos, o ajuste das sequências de ações ou a adaptação a novos agentes que entram ou saem do sistema.

Quando um agente detecta que seu plano atual não é mais viável (por exemplo, devido a um conflito com outro agente ou a uma mudança no ambiente), ele pode se engajar em novo planejamento para ajustar sua estratégia. Os agentes podem ajustar suas estratégias usando raciocínio em cadeia de pensamento, um processo em que refletem sobre as etapas necessárias para alcançar seu objetivo antes de agir.

Soluções relacionadas
Agentes de IA para empresas

Crie, implemente e gerencie assistentes e agentes de IA potentes que automatizam fluxos de trabalho e processos com a IA generativa.

    Explore o watsonx Orchestrate
    Soluções de agentes de IA da IBM

    Construa o futuro do seu negócio com soluções de IA em que você pode confiar.

    Explore soluções de agentes de IA
    Serviços de IA do IBM® Consulting

    Os serviços de IA da IBM Consulting ajudam a reinventar a forma como as empresas trabalham com IA para gerar transformação.

    Explore os serviços de inteligência artificial
    Dê o próximo passo

    Se você optar por personalizar aplicativos e habilidades criados previamente ou criar e implementar serviços agênticos personalizados usando um estúdio de IA, a plataforma IBM watsonx tem aquilo de que você precisa.

    Explore o watsonx Orchestrate Explore o watsonx.ai