Alors que des modèles de raisonnement comme o1 d'OpenAI, DeepSeek-R1 et Gemini 2.5 de Google rivalisent pour obtenir les meilleurs résultats en matière d'intelligence artificielle, les entreprises qui cherchent à intégrer l'IA se méfient de plus en plus d'un phénomène appelé « gonflement des modèles » — un phénomène par lequel les modèles deviennent inutilement volumineux ou complexes, ce qui augmente les coûts de calcul et le temps d'entraînement des modèles et diminue la vitesse à laquelle ils peuvent fournir les réponses dont les entreprises ont besoin.

O1 et DeepSeek-R1 d'OpenAI utilisent le raisonnement par chaîne de pensée (CoT) pour diviser des problèmes complexes en étapes, obtenant ainsi des performances et une précision sans précédent par rapport aux modèles précédents. Mais CoT exige également des ressources de calcul importantes lors de l'inférence, ce qui entraîne des sorties longues et une latence plus élevée, explique Volkmar Uhlig, vice-président et responsable du portefeuille d'infrastructure d'IA chez IBM, dans une interview avec IBM Think.

Voici une nouvelle classe de techniques de prompting, décrites dans divers articles récents, allant de l’atome de pensée (AoT) à la chaîne de brouillon (CoD), cherchant à augmenter l’efficacité et la précision de CoT en aidant les modèles à résoudre les problèmes plus rapidement — réduisant ainsi les coûts et la latence.

Lance Elliott, scientifique spécialisé dans l'IA et fondateur d'une startup, considère les nouvelles ramifications de la chaîne de pensée comme des variantes dans les outils d'un ingénieur de prompt. « Votre boîte à outils classique peut comporter un marteau, c’est-à-dire CoT », explique-t-il à IBM Think. « L'AoT reviendrait à utiliser un marteau spécialisé utilisé pour couper et ajuster des cloisons sèches. Vous pouvez utiliser un marteau ordinaire pour les travaux sur les cloisons sèches, mais il serait conseillé d'utiliser un marteau à placoplâtre si vous en avez un et que vous savez vous en servir correctement. »

Vyoma Gajjar, architecte de solutions techniques en IA chez IBM, entrevoit du potentiel dans ces nouveaux cousins du CoT, notamment pour les entreprises « à la recherche de moyens plus rentables pour prompt de petits modèles à obtenir des réponses précises pour leurs cas d'utilisation spécifiques », explique-t-elle.