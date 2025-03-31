Enquanto modelos de raciocínio como o o1 da OpenAI, o DeepSeek-R1 e o Gemini 2.5 do Google competem pelos principais benchmarks de inteligência de IA, as empresas que buscam integrar a IA estão ficando cada vez mais cautelosas com algo chamado "inchaço do modelo", o fenômeno pelo qual os modelos se tornam desnecessariamente grandes ou complexos, impulsionando custos computacionais e tempo de treinamento do modelo, diminuindo a velocidade com que eles podem fornecer as respostas de que as empresas precisam.

O o1 da OpenAI e o DeepSeek-R1 utilizam o raciocínio em cadeia de pensamento (CoT) para dividir problemas complexos em etapas, alcançando um desempenho sem precedentes e maior precisão do que os modelos anteriores. Mas a CoT também exige recursos computacionais substanciais durante a inferência, levando a saídas demoradas e maior latência, diz Volkmar Uhlig, Vice-presidente e Líder de Portfólio de Infraestrutura de IA da IBM, em entrevista à IBM Think.

Entre em uma nova classe de técnicas de engenharia de prompt, descritas em vários novos artigos, que vão desde átomo de pensamento (AoT) até cadeia de rascunho (CoD), buscando aumentar a eficiência e precisão da CoT ajudando os modelos a resolver problemas mais rapidamente, reduzindo assim nos custos e na latência.

O cientista de IA e fundador de startups, Lance Elliott, vê os novos desdobramentos da cadeia de pensamento como variações no toolkit de um engenheiro de prompt. "Seu toolkit de trabalho manual típico pode ter um martelo comum — isso seria CoT", ele diz à IBM Think. "O AOT seria semelhante ao uso de um martelo especializado usado para situações envolvendo cortar e ajustar paredes de gesso. Você poderia usar um martelo comum para trabalhar com drywall, mas seria aconselhável usar um martelo para drywall se você tivesse um e soubesse como usá-lo adequadamente."

Vyoma Gajjar, Arquiteta de Soluções Técnicas de IA da IBM, vê potencial nesses novos primos da CoT, especialmente para empresas "que buscam maneiras mais econômicas de prompt pequenos modelos para obter respostas precisas para seus casos de uso específicos", diz ela.