Minha IBM Efetue login Inscreva-se

O que é cadeia de ideias (CoT)?

12 de agosto de 2024

Autores

Vrunda Gadesha

AI Advocate | Technical Content Author

Eda Kavlakoglu

Program Manager

A cadeia de ideias (CoT) duplica o raciocínio humano, facilitando a solução sistemática de problemas por meio de uma série coerente de deduções lógicas.

O prompting com cadeia de pensamentos (CoT) é uma abordagem em inteligência artificial que simula processos de raciocínio semelhantes aos humanos ao delinear tarefas complexas em uma sequência de etapas lógicas para chegar a uma resolução final. Essa metodologia reflete um aspecto fundamental da inteligência humana, oferecendo um mecanismo estruturado para a resolução de problemas. Em outras palavras, CoT baseia-se na estratégia cognitiva de dividir problemas elaborados em pensamentos intermediários gerenciáveis que, sequencialmente, levam a uma resposta conclusiva.¹

Diferença entre encadeamento de prompts e de ideias (CoT)

Se pensarmos no encadeamento de prompts, trata-se de uma forma mais rudimentar de prompts de CoT, em que a IA é solicitada a gerar respostas com base em um determinado contexto ou pergunta. Em contrapartida, a solicitação de CoT vai além da mera geração de respostas coerentes e relevantes, exigindo que a IA construa um argumento lógico completo, incluindo premissas e uma conclusão a partir do zero. Enquanto encadeamento de prompts se concentra no refinamento de respostas individuais, as solicitações de CoT têm como objetivo criar um argumento abrangente e logicamente coerente, ampliando assim os limites dos recursos de solução de problemas da IA.

Considere que, se perguntassem a uma IA "Qual é a cor do céu?", a IA geraria uma resposta simples e direta, como "o céu é azul". No entanto, se fosse solicitada a explicar por que o céu é azul utilizando o prompt da CoT, a IA primeiro definiria o que significa "azul" (uma cor primária) e, em seguida, deduziria que o céu parece azul devido à absorção de outras cores pela atmosfera. Essa resposta demonstra a capacidade da IA de construir um argumento lógico.

Como funciona o prompt com cadeia de ideias?

O prompting com cadeia de pensamentos de ideias utiliza grandes modelos de linguagem (LLMs) para articular uma sucessão de etapas de raciocínio, guiando o modelo para gerar cadeias de raciocínio análogas para novas tarefas. Isso é alcançado por meio de prompts baseados em exemplos que ilustram o processo de raciocínio, aprimorando assim a capacidade do modelo para lidar com desafios complexos de raciocínio.2 Vamos entender o fluxo dessa técnica de prompting abordando um problema clássico de matemática: resolver uma equação polinomial.

Exemplo: como funciona o prompt com cadeia de ideias para resolver equações polinomiais?

O prompting com cadeia de pensamentos (CoT) pode ajudar consideravelmente na solução de equações polinomiais, orientando um grande modelo de linguagem (LLM) a seguir uma série de etapas lógicas, detalhando o processo de resolução de problemas.2 Vamos examinar como o prompting com CoT pode lidar com uma equação polinomial.

Considere o exemplo de resolução de uma equação quadrática.

Prompt de input: Resolva a equação quadrática: x2 - 5x + 6 = 0

Quando enviamos esse prompt para o chat do IBM watsonx.ai, podemos ver a seguinte conversa entre a pergunta humana e a resposta da assistência de IA.

Para gerar esse tipo de resultado, os fundamentos da CoT funcionam conforme ilustrado na imagem abaixo. A resposta final da cadeia de ideias será "As soluções da equação x2 ibm 5x + 6 = 0 são x = 3 e x = 2"

Variações da cadeia de ideias

O prompting com cadeia de pensamentos (CoT) evoluiu para diversas variantes inovadoras, cada uma adaptada para abordar desafios específicos e aprimorar os recursos de raciocínio do modelo de maneira única. Essas adaptações não apenas estendem a aplicabilidade do CoT em diferentes domínios, mas também refinam o processo de resolução de problemas do modelo.3

Cadeia de ideias zero-shot

A variante zero-shot do prompting com cadeia de pensamentos aproveita o conhecimento inerente aos modelos para lidar com problemas sem a necessidade de exemplos específicos prévios ou ajuste fino para a tarefa em questão. Essa abordagem é particularmente valiosa ao lidar com tipos de problemas novos ou diversos, nos quais dados de treinamento personalizados podem não estar disponíveis.4 Essa abordagem pode aproveitar as propriedades do prompting padrão e do prompting few-shot.

Por exemplo, ao responder à pergunta "Qual é a capital de um país que faz fronteira com a França e tem uma bandeira vermelha e branca?", um modelo que utilizasse CoT zero-shot se basearia em seu conhecimento geográfico e de bandeiras incorporado para deduzir etapas que levassem à Suíça como resposta, apesar de não ter sido explicitamente treinado para essas consultas.

Cadeia de ideias automática

O prompting automático com cadeia de pensamentos (auto-CoT) visa minimizar o esforço manual na criação de prompts, automatizando a geração e seleção de caminhos de raciocínio eficazes. Essa variante melhora a escalabilidade e a acessibilidade do prompting com cadeia de pensamentos para uma gama mais ampla de tarefas e usuários.5, 8

Por exemplo, para resolver um problema matemático como "Se você compra 5 maçãs e já tem 3, quantas você tem no total?", um sistema auto-CoT pode gerar automaticamente etapas intermediárias, como "Comece com 3 maçãs" e "Adicione 5 maçãs às 3 existentes", culminando em "Total de maçãs = 8", simplificando o processo de raciocínio sem intervenção humana.

Cadeia multimodal de ideias

O prompting multimodal com cadeia de pensamentos expande a estrutura do prompting com cadeia de pensamentos para incorporar entradas de diversas modalidades, como texto e imagens, permitindo que o modelo processe e integre diferentes tipos de informações para tarefas complexas de raciocínio.6

Por exemplo, ao apresentar uma imagem de uma praia lotada e perguntar: "Essa praia provavelmente é popular no verão?", um modelo que utiliza prompting multimodal com cadeia de pensamentos poderia analisar pistas visuais (incluindo ocupação da praia, condições climáticas e outros fatores), juntamente com seu conhecimento textual sobre popularidade sazonal, para formular uma resposta detalhada, como: "A praia está lotada, indicando alta popularidade, o que provavelmente aumentará ainda mais no verão."

Essas variantes do prompting com cadeia de pensamentos não apenas demonstram a flexibilidade e adaptabilidade dessa abordagem, mas também sugerem um vasto potencial para futuros avanços na capacidade de raciocínio e resolução de problemas da IA.

Projeto 3D de bolas rolando em uma pista

As últimas notícias e insights sobre IA 


Descubra insights selecionadas por especialistas sobre IA, nuvem e outros assuntos no boletim informativo semanal Think. 

Vantagens e limitações

O prompting com cadeia de pensamentos (CoT) é uma técnica poderosa para aprimorar o desempenho de grandes modelos de linguagem (LLMs) em tarefas de raciocínio complexo, oferecendo benefícios significativos em diversos domínios, como maior precisão, transparência e capacidade de raciocínio em várias etapas. No entanto, é essencial considerar suas limitações, incluindo a necessidade de prompts de alta qualidade, aumento do custo computacional, suscetibilidade a ataques adversários e desafios na avaliação das melhorias qualitativas no raciocínio ou na compreensão. Ao abordar essas limitações, pesquisadores e profissionais podem garantir uma implementação responsável e eficaz do CoT em diversas aplicações.10

Vantagens do prompt com cadeia de ideias

Os usuários podem se beneficiar de uma série de vantagens dentro do prompt com cadeia de ideias. Alguns deles são:

  • Melhoria nas saídas do prompt: o prompting com cadeia de pensamentos melhora o desempenho dos LLMs em tarefas complexas de raciocínio, decompondo-as em etapas mais simples e lógicas.
  • Transparência e compreensão: a geração de etapas de raciocínio intermediárias oferece transparência sobre como o modelo chega às suas conclusões, tornando o processo de tomada de decisão mais compreensível para os usuários.
  • Raciocínio em várias etapas: abordando sistematicamente cada componente de um problema, a solicitação da CoT geralmente leva a respostas mais precisas e confiáveis, principalmente em tarefas que exigem raciocínio em várias etapas. O raciocínio em várias etapas refere-se à capacidade de realizar operações lógicas complexas, dividindo-as em etapas menores e sequenciais. Essa habilidade cognitiva é essencial para resolver problemas complexos, tomar decisões e entender as relações de causa e efeito. 
  • Atenção aos detalhes: o modelo de explicação passo a passo é semelhante aos métodos de ensino que incentivam a compreensão por meio de detalhamentos, tornando os prompts de CoT úteis em contextos educacionais.
  • Diversidade: o CoT pode ser aplicado em uma ampla variedade de tarefas, incluindo, entre outras, raciocínio aritmético, raciocínio de senso comum e solução de problemas complexos, demonstrando sua flexibilidade e utilidade.

Limitações do prompt com cadeia de ideias

Aqui estão algumas limitações encontradas durante a adoção da cadeia de raciocínio.
  • Controle de qualidade: a eficácia dos prompts da CoT é altamente dependente da qualidade dos prompts apresentados, necessitando de exemplos cuidadosamente elaborados para orientar o modelo com precisão.
  • Alto poder computacional: a geração e o processamento de múltiplas etapas de raciocínio exigem mais poder computacional e tempo em comparação com o prompt padrão de etapa única. Portanto, essa técnica é mais cara para ser adotada por qualquer organização.
  • Conceito enganoso: há o risco de gerar caminhos de raciocínio plausíveis, mas incorretos, levando a conclusões enganosas ou falsas.
  • Caro e trabalhoso: projetar solicitações CoT eficazes pode ser mais complexo e trabalhoso, exigindo uma compreensão profunda do domínio do problema e das capacidades do modelo.
  • Superajuste de modelos: há um risco em potencial de superajuste de modelos ao estilo ou padrão de raciocínio nos prompts, o que pode reduzir suas capacidades de generalização em tarefas variadas.
  • Avaliação e validação: embora o CoT possa aumentar a interpretabilidade e a precisão, medir as melhorias qualitativas no raciocínio ou na compreensão pode ser um desafio. Isso ocorre devido à complexidade inerente à cognição humana e à natureza subjetiva da avaliação de expressões linguísticas. No entanto, diversas abordagens podem ser empregadas para avaliar a eficácia do prompting com cadeia de pensamentos. Por exemplo, comparar as respostas do modelo com as de um modelo de referência ou especialistas humanos pode fornecer insights sobre os ganhos de desempenho relativos. Além disso, analisar as etapas intermediárias de raciocínio geradas pelo LLM pode oferecer informações valiosas sobre o processo de tomada de decisão, mesmo que seja difícil medir diretamente as melhorias no raciocínio ou na compreensão.
Mistura de Especialistas | Podcast

Decodificando a IA: resumo semanal das notícias

Junte-se a nosso renomado painel de engenheiros, pesquisadores, líderes de produtos e outros enquanto filtram as informações sobre IA para trazerem a você as mais recentes notícias e insights sobre IA.

Avanços na cadeia de ideias

A evolução da cadeia de pensamentos (CoT) é um testemunho dos avanços sinérgicos em vários domínios, notavelmente no processamento de linguagem natural (PLN), aprendizado de máquina e o campo crescente da IA generativa. Esses avanços não apenas colocaram o CoT na vanguarda da solução de problemas complexos, mas também destacaram sua utilidade em uma ampla gama de aplicações. Aqui, exploramos os principais desenvolvimentos, integrando os termos especificados para oferecer uma visão abrangente do progresso do CoT.

Engenharia de prompt e o prompt original

As inovações em engenharia de prompts aprimoraram significativamente a compreensão e a interação dos modelos com o prompt original, levando a caminhos de raciocínio mais refinados e alinhados ao contexto. Esse desenvolvimento tem sido fundamental para aprimorar a eficácia do CoT.2

Raciocínio simbólico e raciocínio lógico

A integração do CoT em tarefas de raciocínio simbólico e lógico melhorou a capacidade dos modelos para o pensamento abstrato e a dedução, marcando um avanço significativo na resolução de desafios baseados em lógica.7

Por exemplo, o raciocínio simbólico é a resolução de equações matemáticas, como 2 + 3 = 5. Nesse caso, o problema é dividido em suas partes constituintes (adição e números), e o modelo deduz a resposta correta com base em seu conhecimento aprendido e regras de inferência. O raciocínio lógico, por outro lado, envolve tirar conclusões de instalações ou suposições, como "Todos os pássaros podem voar, e um pinguim é um pássaro". Então, o modelo determinaria se um pinguim pode voar com base nas informações apresentadas. A integração do prompt da CoT com tarefas de raciocínio simbólico e raciocínio lógico permitiu que os LLMs demonstrassem recursos aprimorados de ideias abstrato e dedução, capacitando-os a lidar com problemas mais complexos e diversos.

Aumento da criatividade

A aplicação da IA generativa e de arquiteturas de transformação revolucionou o CoT, permitindo a geração de cadeias de raciocínio sofisticadas que exibem criatividade e profundidade. Essa sinergia ampliou a aplicabilidade do CoT, influenciando tanto o meio acadêmico quanto os domínios práticos.9

Modelos menores e autoconsistência

Os avanços que permitem que modelos menores se envolvam eficazmente no raciocínio com cadeia de pensamentos (CoT) democratizaram o acesso a recursos sofisticados de raciocínio. O foco na autoconsistência dentro do CoT garante a solidez lógica dos caminhos gerados, aumentando a confiabilidade das conclusões extraídas pelos modelos.11

Assistente de IA

A integração do prompting com cadeia de pensamentos (CoT) em chatbots, com técnicas avançadas de processamento de linguagem natural (PLN), transformou a IA conversacional, permitindo que chatbots realizem interações mais complexas, exigindo um nível mais profundo de compreensão e proficiência na resolução de problemas.12

Esses avanços significam coletivamente um salto nos recursos da CoT e a importância da integração de chatbots e modelos de CoT, destacando seu potencial para revolucionar os processos de tomada de decisão e resolução de problemas orientados por IA. Ao combinar as habilidades de conversação dos chatbots com os recursos avançados de raciocínio dos modelos CoT, podemos criar sistemas de IA mais sofisticados e eficazes, capazes de lidar com uma gama mais ampla de tarefas e aplicações.

Além disso, a integração de várias aplicações e modelos de CoT pode aprimorar a experiência geral do usuário, permitindo que os sistemas de IA compreendam melhor e respondam às necessidades e preferências dos usuários. Ao integrar técnicas de processamento de linguagem natural (PLN) em modelos de CoT, podemos capacitar chatbots a entender e responder aos inputs dos usuários de maneira mais semelhante à humana, criando experiências conversacionais mais envolventes, intuitivas e eficazes.

Casos de uso para cadeia de ideias

A metodologia da cadeia de ideias (CoT), com sua capacidade de decompor problemas complexos em etapas de raciocínio compreensíveis, encontrou aplicações em uma ampla gama de campos. Esses casos de uso não só demonstram a versatilidade da CoT, mas também seu potencial para transformar a forma como os sistemas abordam as tarefas de resolução de problemas e tomada de decisões. Abaixo, exploramos vários casos de uso proeminentes em que a CoT foi aplicado de forma eficaz.

Chatbots de atendimento ao cliente

Chatbots avançados utilizam CoT para entender e lidar melhor com as consultas dos clientes. Dividindo o problema de um cliente em partes menores e gerenciáveis, os chatbots podem apresentar respostas mais precisas e úteis, melhorando a satisfação do cliente e reduzindo a necessidade de intervenção humana.

Pesquisa e inovação

Os pesquisadores empregam a CoT para estruturar seu processo de ideias na solução de problemas científicos complexos, facilitando a inovação. Essa abordagem estruturada pode acelerar o processo de descoberta e permitir a formulação de novas hipóteses.

Criação e resumo de conteúdo

Na criação de conteúdo, a CoT auxilia na geração de esboços ou resumos estruturados, organizando logicamente pensamentos e informações, aprimorando a coerência e a qualidade do conteúdo escrito.

Educação e aprendizado

A CoT é fundamental para plataformas de tecnologia educacional, auxiliando na geração de explicações passo a passo para problemas complexos. Isso é especialmente valioso em disciplinas como matemática e ciências, em que entender o processo é tão crucial quanto a resposta final. Os sistemas baseados em CoT podem orientar os alunos através de procedimentos de resolução de problemas, aprimorando sua compreensão e retenção.

Ética e tomada de decisões de IA

A CoT é crucial para elucidar o raciocínio por trás das decisões orientadas por IA, especialmente em cenários que exigem considerações éticas. Apresentando um caminho de raciocínio transparente, a CoT garante que as decisões de IA estejam alinhadas aos padrões éticos e às normas sociais.

Esses casos de uso ressaltam o potencial transformador da CoT em diversos setores, oferecendo um vislumbre de sua capacidade de redefinir os processos de resolução de problemas e tomada de decisão. À medida que a CoT continua evoluindo, espera-se que suas aplicações se expandam, incorporando ainda mais essa metodologia na estrutura dos avanços tecnológicos e sociais.

O prompt com cadeia de ideias significa um salto na capacidade da IA de realizar tarefas complexas de raciocínio, emulando os processos cognitivos humanos. Ao elucidar as etapas intermediárias de raciocínio, a CoT não apenas amplifica a perspicácia de resolução de problemas dos LLMs, mas também aumenta a transparência e a interpretabilidade. Apesar das limitações inerentes, as explorações contínuas em variantes e aplicações do CoT continuam a ampliar as capacidades de raciocínio dos modelos de IA, anunciando melhorias futuras nas funcionalidades cognitivas da IA.

Soluções relacionadas

Soluções relacionadas

IBM watsonx.ai

Treine, valide, ajuste e implemente recursos de IA generativa, modelos de base e recursos de aprendizado de máquina com o IBM watsonx.ai, um estúdio empresarial de última geração para construtores de IA. Crie aplicações de IA em uma fração do tempo com uma fração dos dados.

Conheça o watsonx.ai
Soluções de inteligência artificial

Use a IA a serviço de sua empresa com a experiência e o portfólio de soluções líder do setor da IBM à sua disposição.

Explore as soluções de IA
Serviços de IA

Reinvente os fluxos de trabalho e operações críticos adicionando IA para maximizar experiências, tomadas de decisão em tempo real e valor de negócios.

Explore os serviços de IA
Dê o próximo passo

Obtenha acesso completo aos recursos que abrangem o ciclo de vida do desenvolvimento da IA. Produza soluções poderosas de IA com interfaces fáceis de usar, fluxos de trabalhos e acesso a APIs e SDKs padrão do setor.

Explore o watsonx.ai Agende uma demonstração em tempo real
Notas de rodapé

1 Boshi Wang, SM (2022). Towards Understanding Chain-of-Thought Prompting: An Empirical Study of What Matters. 2717-2739, https://doi.org/10.48550/arXiv.2212.10001.

2Jason Wei, X. W. (2022). Chain of Thought Prompting Elicits Reasoning in Large Language Models. 36th Conference on Neural Information Processing Systems (NeurIPS 2022).

3Zheng Chu, J. C. (2023). A Survey of Chain of Thought Reasoning: Advances, Frontiers and Future. ArXiv, abs/2309.15402.

4Omar Shaikh, HZ (2022, dezembro). On Second Thought, Let’s Not Think Step by Step! Bias and Toxicity in Zero-Shot Reasoning. ArXiv, abs/2212.08061. https://doi.org/10.48550/arXiv.2212.08061.

5Zhuosheng Zhang, A. Z. (2022). Automatic Chain of Thought Prompting in Large Language Models. ArXiv, abs/2210.03493. https://doi.org/10.48550/arXiv.2210.03493.

6Zhuosheng Zhang, A. Z. (2023). Multimodal Chain-of-Thought Reasoning in Language Models. ArXiv, abs/2302.00923. https://doi.org/10.48550/arXiv.2302.00923.

7Yao, Z. L. (2023). Beyond Chain-of-Thought, Effective Graph-of-Thought Reasoning in Large Language Models. ArXiv, abs/2305.16582. https://doi.org/10.48550/arXiv.2305.16582.

8Kashun Shum, S. D. (2023). Automatic Prompt Augmentation and Selection with Chain-of-Thought from Labeled Data. ArXiv, abs/2302.12822. https://doi.org/10.48550/arXiv.2302.12822.

9A Vaswani, NS (2017). Attention is all you need. Advances in neural information processing systems.

10Zhengyan Zhang, YG (2021). CPM-2: Large-scale Cost-effective Pre-trained Language Models. AI Open, 2, 216--224.

11L Zheng, NG (2021). When does pretraining help? assessing self-supervised learning for law and the casehold dataset of 53,000+ legal holdings. In Proceedings of the eighteenth international conference on artificial intelligence and law , 159-168.

12S Roller, E. D. (2020). Recipes for building an open-domain chatbot. arXiv preprint arXiv:2004.13637 .