Le fonctionnement interne des grands modèles de langage (LLM) est traditionnellement opaque. Un modèle recevrait un prompt et générerait une réponse, sans révéler les étapes de son raisonnement interne.

Le raisonnement hybride modifie cette dynamique en exposant le processus de réflexion étape par étape d'un modèle. Lorsqu'ils sont activés, les systèmes tels que Granite 3.2 montrent leur travail, rendant visibles les chemins logiques qu'ils suivent.

« Notre décision de rendre visible le raisonnement de Claude reflète la prise en compte de multiples facteurs. » L'un de ces facteurs inclut l'amélioration de l'expérience utilisateur et la transparence de la confiance dans le processus de raisonnement de Claude, a déclaré le porte-parole d'Anthropic ». « Cela donne aux utilisateurs des informations sur la manière dont les conclusions sont tirées, ce qui favorise les niveaux de confiance et de compréhension appropriés. Les utilisateurs font généralement davantage confiance aux résultats lorsqu’ils peuvent observer la chaîne de pensée. Nous espérons que cette visibilité permettra aux utilisateurs de mieux évaluer la qualité et la rigueur du raisonnement de Claude, et les aidera à mieux comprendre ses capacités. De plus, nous espérons que les utilisateurs et les développeurs pourront créer de meilleures prompts en lisant les productions de Claude et en fournissant des commentaires ciblés sur des étapes de raisonnement spécifiques. »

« Pouvoir exposer la réflexion réelle du modèle est excellent pour l’explicabilité », explique M. Daniels. « Avant de pouvoir démontrer le raisonnement de la chaîne de pensée (CoT), c’était en réalité juste la probabilité du token suivant. Donc, un peu comme une boîte noire. »

Ces technologies ont des applications commerciales qui s'étendent à de nombreux secteurs. « Les domaines financier et juridique sont des accords naturels, car ils traitent une documentation structurée », explique M. Daniels, ajoutant que « tout secteur réglementé peut tirer une valeur considérable » de ces modèles de réflexion avancés.

Mais le raisonnement hybride peut être particulièrement utile dans les domaines nécessitant une analyse complexe.

« Les mathématiques et le code sont vraiment les deux points principaux que j'ai constatés en termes de points de référence pour le raisonnement », explique M. Daniels. Pour le développement de logiciels, les avantages pourraient être substantiels : « L’utilisation d’un modèle de réflexion permettrait de définir la portée du projet compte tenu des exigences que vous avez définies », explique-t-il.

Les LLM Standard génèrent des réponses en prédisant le mot suivant le plus probable sur la base de modèles dans leurs données d'apprentissage. Cette approche fonctionne bien pour de nombreuses tâches, mais ces modèles peuvent rencontrer des problèmes de raisonnement à plusieurs étapes.

Les modèles de raisonnement hybrides peuvent passer à un mode de calcul intensif, en générant explicitement des étapes de raisonnement intermédiaires avant de fournir une réponse finale. Le modèle utilise ces étapes pour résoudre des problèmes complexes, de la même manière que les humains écrivent des étapes intermédiaires pour résoudre des problèmes mathématiques complexes.

L'architecture permettant le raisonnement hybride repose sur ce que les chercheurs appellent " test-time compute, " qui implique de consacrer des ressources informatiques à l'inférence plutôt qu'à la formation.

« Très souvent, traditionnellement, toute votre puissance de calcul Power® était utilisée pour entraîner le modèle, puis l’inférence du modèle était relativement faible en termes de besoins de calcul », explique M. Daniels.

Mais à mesure que les systèmes d'IA deviennent plus complexes, le défi ne sera pas seulement la puissance de traitement : il s'agira de savoir quand l'utiliser efficacement. C’est pourquoi la prochaine frontière du raisonnement hybride, explique Daniels, sera une autorégulation plus intelligente : apprendre à l’IA quand activer son mode de pensée plus profond d’elle-même, sans que les humains ne le lui disent.

« Les étapes suivantes en termes de modèles de raisonnement, ou modèles hybrides, est de savoir comment mieux comprendre ou mieux trier les entrées dans le calcul au moment du test, ou dans le cadre des exigences », explique-t-il.