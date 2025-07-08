Il est temps de regarder la vérité en face à propos de la génération augmentée par récupération, ou RAG : c’est une solution qui a besoin de sa propre solution.

La RAG avait pour objectif d’améliorer les performances des grands modèles de langage (LLM) et de réduire les hallucinations en permettant à ces derniers d’aller au-delà de leurs données d’entraînement grâce à l’accès à des bases de connaissances externes. Cependant, les limites réelles des systèmes RAG traditionnels sont devenues douloureusement évidentes.

« Dans une large mesure, la RAG est imparfaite, déclare Dinesh Nirmal, vice-président senior d’IBM Software. La RAG pure ne donne pas vraiment les résultats optimaux escomptés. »

Les défis auxquels les utilisateurs sont régulièrement confrontés avec la RAG comprennent les limites des fenêtres contextuelles et des opérations d’agrégation, l’incapacité à comprendre les relations complexes et la mauvaise qualité des résultats associés à un découpage en morceaux sous-optimal. En outre, la mise en œuvre de la RAG peut également présenter des problèmes de sécurité tels que la fuite de données.

La bonne nouvelle, c’est que les progrès réalisés dans le domaine des outils et des stratégies d’intelligence artificielle contribuent à compenser les défauts de la RAG traditionnelle, ce qui se traduit par des réponses plus précises aux requêtes des utilisateurs. Examinons de plus près comment améliorer les performances de la RAG.