A cadeia de ideias (CoT) duplica o raciocínio humano, facilitando a solução sistemática de problemas por meio de uma série coerente de deduções lógicas.
O prompting com cadeia de pensamentos (CoT) é uma abordagem em inteligência artificial que simula processos de raciocínio semelhantes aos humanos ao delinear tarefas complexas em uma sequência de etapas lógicas para chegar a uma resolução final. Essa metodologia reflete um aspecto fundamental da inteligência humana, oferecendo um mecanismo estruturado para a resolução de problemas. Em outras palavras, CoT baseia-se na estratégia cognitiva de dividir problemas elaborados em pensamentos intermediários gerenciáveis que, sequencialmente, levam a uma resposta conclusiva.¹
Se pensarmos no encadeamento de prompts, trata-se de uma forma mais rudimentar de prompts de CoT, em que a IA é solicitada a gerar respostas com base em um determinado contexto ou pergunta. Em contrapartida, a solicitação de CoT vai além da mera geração de respostas coerentes e relevantes, exigindo que a IA construa um argumento lógico completo, incluindo premissas e uma conclusão a partir do zero. Enquanto encadeamento de prompts se concentra no refinamento de respostas individuais, as solicitações de CoT têm como objetivo criar um argumento abrangente e logicamente coerente, ampliando assim os limites dos recursos de solução de problemas da IA.
Considere que, se perguntassem a uma IA "Qual é a cor do céu?", a IA geraria uma resposta simples e direta, como "o céu é azul". No entanto, se fosse solicitada a explicar por que o céu é azul utilizando o prompt da CoT, a IA primeiro definiria o que significa "azul" (uma cor primária) e, em seguida, deduziria que o céu parece azul devido à absorção de outras cores pela atmosfera. Essa resposta demonstra a capacidade da IA de construir um argumento lógico.
O prompting com cadeia de pensamentos de ideias utiliza grandes modelos de linguagem (LLMs) para articular uma sucessão de etapas de raciocínio, guiando o modelo para gerar cadeias de raciocínio análogas para novas tarefas. Isso é alcançado por meio de prompts baseados em exemplos que ilustram o processo de raciocínio, aprimorando assim a capacidade do modelo para lidar com desafios complexos de raciocínio.2 Vamos entender o fluxo dessa técnica de prompting abordando um problema clássico de matemática: resolver uma equação polinomial.
O prompting com cadeia de pensamentos (CoT) pode ajudar consideravelmente na solução de equações polinomiais, orientando um grande modelo de linguagem (LLM) a seguir uma série de etapas lógicas, detalhando o processo de resolução de problemas.2 Vamos examinar como o prompting com CoT pode lidar com uma equação polinomial.
Considere o exemplo de resolução de uma equação quadrática.
Prompt de input: Resolva a equação quadrática: x2 - 5x + 6 = 0
Quando enviamos esse prompt para o chat do IBM watsonx.ai, podemos ver a seguinte conversa entre a pergunta humana e a resposta da assistência de IA.
O prompting com cadeia de pensamentos (CoT) evoluiu para diversas variantes inovadoras, cada uma adaptada para abordar desafios específicos e aprimorar os recursos de raciocínio do modelo de maneira única. Essas adaptações não apenas estendem a aplicabilidade do CoT em diferentes domínios, mas também refinam o processo de resolução de problemas do modelo.3
A variante zero-shot do prompting com cadeia de pensamentos aproveita o conhecimento inerente aos modelos para lidar com problemas sem a necessidade de exemplos específicos prévios ou ajuste fino para a tarefa em questão. Essa abordagem é particularmente valiosa ao lidar com tipos de problemas novos ou diversos, nos quais dados de treinamento personalizados podem não estar disponíveis.4 Essa abordagem pode aproveitar as propriedades do prompting padrão e do prompting few-shot.
Por exemplo, ao responder à pergunta "Qual é a capital de um país que faz fronteira com a França e tem uma bandeira vermelha e branca?", um modelo que utilizasse CoT zero-shot se basearia em seu conhecimento geográfico e de bandeiras incorporado para deduzir etapas que levassem à Suíça como resposta, apesar de não ter sido explicitamente treinado para essas consultas.
O prompting automático com cadeia de pensamentos (auto-CoT) visa minimizar o esforço manual na criação de prompts, automatizando a geração e seleção de caminhos de raciocínio eficazes. Essa variante melhora a escalabilidade e a acessibilidade do prompting com cadeia de pensamentos para uma gama mais ampla de tarefas e usuários.5, 8
Por exemplo, para resolver um problema matemático como "Se você compra 5 maçãs e já tem 3, quantas você tem no total?", um sistema auto-CoT pode gerar automaticamente etapas intermediárias, como "Comece com 3 maçãs" e "Adicione 5 maçãs às 3 existentes", culminando em "Total de maçãs = 8", simplificando o processo de raciocínio sem intervenção humana.
O prompting multimodal com cadeia de pensamentos expande a estrutura do prompting com cadeia de pensamentos para incorporar entradas de diversas modalidades, como texto e imagens, permitindo que o modelo processe e integre diferentes tipos de informações para tarefas complexas de raciocínio.6
Por exemplo, ao apresentar uma imagem de uma praia lotada e perguntar: "Essa praia provavelmente é popular no verão?", um modelo que utiliza prompting multimodal com cadeia de pensamentos poderia analisar pistas visuais (incluindo ocupação da praia, condições climáticas e outros fatores), juntamente com seu conhecimento textual sobre popularidade sazonal, para formular uma resposta detalhada, como: "A praia está lotada, indicando alta popularidade, o que provavelmente aumentará ainda mais no verão."
Essas variantes do prompting com cadeia de pensamentos não apenas demonstram a flexibilidade e adaptabilidade dessa abordagem, mas também sugerem um vasto potencial para futuros avanços na capacidade de raciocínio e resolução de problemas da IA.
O prompting com cadeia de pensamentos (CoT) é uma técnica poderosa para aprimorar o desempenho de grandes modelos de linguagem (LLMs) em tarefas de raciocínio complexo, oferecendo benefícios significativos em diversos domínios, como maior precisão, transparência e capacidade de raciocínio em várias etapas. No entanto, é essencial considerar suas limitações, incluindo a necessidade de prompts de alta qualidade, aumento do custo computacional, suscetibilidade a ataques adversários e desafios na avaliação das melhorias qualitativas no raciocínio ou na compreensão. Ao abordar essas limitações, pesquisadores e profissionais podem garantir uma implementação responsável e eficaz do CoT em diversas aplicações.10
Os usuários podem se beneficiar de uma série de vantagens dentro do prompt com cadeia de ideias. Alguns deles são:
A evolução da cadeia de pensamentos (CoT) é um testemunho dos avanços sinérgicos em vários domínios, notavelmente no processamento de linguagem natural (PLN), aprendizado de máquina e o campo crescente da IA generativa. Esses avanços não apenas colocaram o CoT na vanguarda da solução de problemas complexos, mas também destacaram sua utilidade em uma ampla gama de aplicações. Aqui, exploramos os principais desenvolvimentos, integrando os termos especificados para oferecer uma visão abrangente do progresso do CoT.
As inovações em engenharia de prompts aprimoraram significativamente a compreensão e a interação dos modelos com o prompt original, levando a caminhos de raciocínio mais refinados e alinhados ao contexto. Esse desenvolvimento tem sido fundamental para aprimorar a eficácia do CoT.2
A integração do CoT em tarefas de raciocínio simbólico e lógico melhorou a capacidade dos modelos para o pensamento abstrato e a dedução, marcando um avanço significativo na resolução de desafios baseados em lógica.7
Por exemplo, o raciocínio simbólico é a resolução de equações matemáticas, como 2 + 3 = 5. Nesse caso, o problema é dividido em suas partes constituintes (adição e números), e o modelo deduz a resposta correta com base em seu conhecimento aprendido e regras de inferência. O raciocínio lógico, por outro lado, envolve tirar conclusões de instalações ou suposições, como "Todos os pássaros podem voar, e um pinguim é um pássaro". Então, o modelo determinaria se um pinguim pode voar com base nas informações apresentadas. A integração do prompt da CoT com tarefas de raciocínio simbólico e raciocínio lógico permitiu que os LLMs demonstrassem recursos aprimorados de ideias abstrato e dedução, capacitando-os a lidar com problemas mais complexos e diversos.
A aplicação da IA generativa e de arquiteturas de transformação revolucionou o CoT, permitindo a geração de cadeias de raciocínio sofisticadas que exibem criatividade e profundidade. Essa sinergia ampliou a aplicabilidade do CoT, influenciando tanto o meio acadêmico quanto os domínios práticos.9
Os avanços que permitem que modelos menores se envolvam eficazmente no raciocínio com cadeia de pensamentos (CoT) democratizaram o acesso a recursos sofisticados de raciocínio. O foco na autoconsistência dentro do CoT garante a solidez lógica dos caminhos gerados, aumentando a confiabilidade das conclusões extraídas pelos modelos.11
A integração do prompting com cadeia de pensamentos (CoT) em chatbots, com técnicas avançadas de processamento de linguagem natural (PLN), transformou a IA conversacional, permitindo que chatbots realizem interações mais complexas, exigindo um nível mais profundo de compreensão e proficiência na resolução de problemas.12
Esses avanços significam coletivamente um salto nos recursos da CoT e a importância da integração de chatbots e modelos de CoT, destacando seu potencial para revolucionar os processos de tomada de decisão e resolução de problemas orientados por IA. Ao combinar as habilidades de conversação dos chatbots com os recursos avançados de raciocínio dos modelos CoT, podemos criar sistemas de IA mais sofisticados e eficazes, capazes de lidar com uma gama mais ampla de tarefas e aplicações.
Além disso, a integração de várias aplicações e modelos de CoT pode aprimorar a experiência geral do usuário, permitindo que os sistemas de IA compreendam melhor e respondam às necessidades e preferências dos usuários. Ao integrar técnicas de processamento de linguagem natural (PLN) em modelos de CoT, podemos capacitar chatbots a entender e responder aos inputs dos usuários de maneira mais semelhante à humana, criando experiências conversacionais mais envolventes, intuitivas e eficazes.
A metodologia da cadeia de ideias (CoT), com sua capacidade de decompor problemas complexos em etapas de raciocínio compreensíveis, encontrou aplicações em uma ampla gama de campos. Esses casos de uso não só demonstram a versatilidade da CoT, mas também seu potencial para transformar a forma como os sistemas abordam as tarefas de resolução de problemas e tomada de decisões. Abaixo, exploramos vários casos de uso proeminentes em que a CoT foi aplicado de forma eficaz.
Chatbots avançados utilizam CoT para entender e lidar melhor com as consultas dos clientes. Dividindo o problema de um cliente em partes menores e gerenciáveis, os chatbots podem apresentar respostas mais precisas e úteis, melhorando a satisfação do cliente e reduzindo a necessidade de intervenção humana.
Os pesquisadores empregam a CoT para estruturar seu processo de ideias na solução de problemas científicos complexos, facilitando a inovação. Essa abordagem estruturada pode acelerar o processo de descoberta e permitir a formulação de novas hipóteses.
Na criação de conteúdo, a CoT auxilia na geração de esboços ou resumos estruturados, organizando logicamente pensamentos e informações, aprimorando a coerência e a qualidade do conteúdo escrito.
A CoT é fundamental para plataformas de tecnologia educacional, auxiliando na geração de explicações passo a passo para problemas complexos. Isso é especialmente valioso em disciplinas como matemática e ciências, em que entender o processo é tão crucial quanto a resposta final. Os sistemas baseados em CoT podem orientar os alunos através de procedimentos de resolução de problemas, aprimorando sua compreensão e retenção.
A CoT é crucial para elucidar o raciocínio por trás das decisões orientadas por IA, especialmente em cenários que exigem considerações éticas. Apresentando um caminho de raciocínio transparente, a CoT garante que as decisões de IA estejam alinhadas aos padrões éticos e às normas sociais.
Esses casos de uso ressaltam o potencial transformador da CoT em diversos setores, oferecendo um vislumbre de sua capacidade de redefinir os processos de resolução de problemas e tomada de decisão. À medida que a CoT continua evoluindo, espera-se que suas aplicações se expandam, incorporando ainda mais essa metodologia na estrutura dos avanços tecnológicos e sociais.
O prompt com cadeia de ideias significa um salto na capacidade da IA de realizar tarefas complexas de raciocínio, emulando os processos cognitivos humanos. Ao elucidar as etapas intermediárias de raciocínio, a CoT não apenas amplifica a perspicácia de resolução de problemas dos LLMs, mas também aumenta a transparência e a interpretabilidade. Apesar das limitações inerentes, as explorações contínuas em variantes e aplicações do CoT continuam a ampliar as capacidades de raciocínio dos modelos de IA, anunciando melhorias futuras nas funcionalidades cognitivas da IA.
Treine, valide, ajuste e implemente recursos de IA generativa, modelos de base e recursos de aprendizado de máquina com o IBM watsonx.ai, um estúdio empresarial de última geração para construtores de IA. Crie aplicações de IA em uma fração do tempo com uma fração dos dados.
Use a IA a serviço de sua empresa com a experiência e o portfólio de soluções líder do setor da IBM à sua disposição.
Reinvente os fluxos de trabalho e operações críticos adicionando IA para maximizar experiências, tomadas de decisão em tempo real e valor de negócios.
Aprenda como os CEOs podem equilibrar o valor que a IA generativa pode criar com o investimento que ela exige e os riscos que ela introduz.
Aprenda conceitos fundamentais e desenvolva suas habilidades com laboratórios práticos, cursos, projetos guiados, avaliações e muito mais.
Saiba como incorporar com confiança a IA generativa e o aprendizado de máquina em sua empresa.
Quer ter mais retorno sobre seus investimentos em IA? Saiba como o dimensionamento da IA generativa em áreas importantes promove mudanças, ajudando suas melhores mentes a criar e oferecer soluções novas e inovadoras.
1 Boshi Wang, SM (2022). Towards Understanding Chain-of-Thought Prompting: An Empirical Study of What Matters. 2717-2739, https://doi.org/10.48550/arXiv.2212.10001.
2Jason Wei, X. W. (2022). Chain of Thought Prompting Elicits Reasoning in Large Language Models. 36th Conference on Neural Information Processing Systems (NeurIPS 2022).
3Zheng Chu, J. C. (2023). A Survey of Chain of Thought Reasoning: Advances, Frontiers and Future. ArXiv, abs/2309.15402.
4Omar Shaikh, HZ (2022, dezembro). On Second Thought, Let’s Not Think Step by Step! Bias and Toxicity in Zero-Shot Reasoning. ArXiv, abs/2212.08061. https://doi.org/10.48550/arXiv.2212.08061.
5Zhuosheng Zhang, A. Z. (2022). Automatic Chain of Thought Prompting in Large Language Models. ArXiv, abs/2210.03493. https://doi.org/10.48550/arXiv.2210.03493.
6Zhuosheng Zhang, A. Z. (2023). Multimodal Chain-of-Thought Reasoning in Language Models. ArXiv, abs/2302.00923. https://doi.org/10.48550/arXiv.2302.00923.
7Yao, Z. L. (2023). Beyond Chain-of-Thought, Effective Graph-of-Thought Reasoning in Large Language Models. ArXiv, abs/2305.16582. https://doi.org/10.48550/arXiv.2305.16582.
8Kashun Shum, S. D. (2023). Automatic Prompt Augmentation and Selection with Chain-of-Thought from Labeled Data. ArXiv, abs/2302.12822. https://doi.org/10.48550/arXiv.2302.12822.
9A Vaswani, NS (2017). Attention is all you need. Advances in neural information processing systems.
10Zhengyan Zhang, YG (2021). CPM-2: Large-scale Cost-effective Pre-trained Language Models. AI Open, 2, 216--224.
11L Zheng, NG (2021). When does pretraining help? assessing self-supervised learning for law and the casehold dataset of 53,000+ legal holdings. In Proceedings of the eighteenth international conference on artificial intelligence and law , 159-168.
12S Roller, E. D. (2020). Recipes for building an open-domain chatbot. arXiv preprint arXiv:2004.13637 .
IBM web domains
ibm.com, ibm.org, ibm-zcouncil.com, insights-on-business.com, jazz.net, mobilebusinessinsights.com, promontory.com, proveit.com, ptech.org, s81c.com, securityintelligence.com, skillsbuild.org, softlayer.com, storagecommunity.org, think-exchange.com, thoughtsoncloud.com, alphaevents.webcasts.com, ibm-cloud.github.io, ibmbigdatahub.com, bluemix.net, mybluemix.net, ibm.net, ibmcloud.com, galasa.dev, blueworkslive.com, swiss-quantum.ch, blueworkslive.com, cloudant.com, ibm.ie, ibm.fr, ibm.com.br, ibm.co, ibm.ca, community.watsonanalytics.com, datapower.com, skills.yourlearning.ibm.com, bluewolf.com, carbondesignsystem.com, openliberty.io