Selon une étude d’IBM, environ 42 % des entreprises interrogées utilisent l’IA dans leurs activités. Parmi tous les cas d’utilisation, beaucoup d’entre nous connaissent désormais parfaitement les chatbots IA utilisant le traitement automatique du langage naturel, capables de répondre à nos questions et de nous aider dans des tâches comme la rédaction d’e-mails ou de mémoires. Cependant, même avec l’adoption généralisée de ces chatbots, les entreprises rencontrent encore parfois des difficultés. Par exemple, les chatbots peuvent produire des résultats incohérents car ils puisent dans de vastes quantités de données qui ne sont pas forcément pertinentes pour la requête en cours.
Heureusement, la génération augmentée par récupération (RAG) est devenue une solution prometteuse pour alimenter les grands modèles de langage (LLM) en informations plus précises et actuelles. En tant que cadre d’IA, la RAG vise à améliorer la qualité des réponses générées par LLM en fondant le modèle sur des sources de connaissances pour compléter la représentation interne des informations du LLM. IBM a dévoilé en mai 2023 son nouveau portefeuille de produits d’IA intégrant la RAG, watsonx.
En d’autres termes, exploiter la RAG revient à faire passer au modèle un examen à livre ouvert, puisque vous demandez au chatbot de répondre à une question en fournissant toutes les informations nécessaires. Mais comment fonctionne la RAG au niveau de l’infrastructure ? Un ensemble de services PaaS (plateforme en tant que service) permet à la RAG de fonctionner facilement et de manière optimale afin de fournir des résultats d’IA générative aux organisations de tous les secteurs d’activité qui utilisent des LLM.
L’IA dédiée aux entreprises, y compris l’IA générative, nécessite une infrastructure distribuée hautement durable, à forte intensité de calcul et de données. Bien que l’IA soit le composant clé du cadre RAG, d’autres « ingrédients », tels que les solutions PaaS, font partie intégrante du mix. Ces offres, en particulier les offres sans serveur et de stockage, fonctionnent avec diligence en coulisses, permettant de traiter et de stocker les données plus facilement, ce qui fournit des résultats de plus en plus précis des chatbots.
La technologie sans serveur prend en charge les workloads exigeants en ressources de calcul, tels que ceux produits par la RAG, en gérant et en sécurisant l’infrastructure qui les entoure. Les développeurs gagnent ainsi du temps pour mieux se concentrer sur le codage. L’approche sans serveur permet aux développeurs de créer et d’exécuter du code d’application sans avoir à provisionner ni à gérer des serveurs ou une infrastructure backend.
Si un développeur importe des données dans un chatbot ou un LLM mais ne sait pas comment les prétraiter pour qu’elles soient au bon format ou filtrées pour des points de données spécifiques, IBM Cloud Code Engine peut s’en charger entièrement, facilitant le processus global d’obtention de sorties correctes à partir de modèles d’IA. En tant que plateforme sans serveur entièrement gérée, IBM Cloud Code Engine peut facilement faire évoluer l’application grâce à des capacités d’automatisation qui gèrent et sécurisent l’infrastructure sous-jacente.
En outre, si un développeur importe des sources destinées aux LLM, il doit disposer d’un stockage hautement sécurisé, résilient et durable. Cet aspect est essentiel dans les secteurs fortement réglementés tels que les services financiers, la santé et les télécommunications.
IBM Cloud Object Storage, par exemple, offre sécurité et durabilité pour stocker de grands volumes de données. Avec des capacités de conservation des données immuables et de contrôles d’audit, IBM Cloud Object Storage prend en charge la RAG en aidant à protéger vos données contre toute falsification ou manipulation par des attaques de ransomware, et contribue à garantir qu’elles répondent aux exigences métier et de conformité.
Grâce à la vaste pile technologique d’IBM, notamment IBM Code Engine et Cloud Object Storage, les organisations de tous les secteurs peuvent exploiter la RAG de manière transparente et faire un usage plus efficace de l’IA dans leurs activités.
Nous avons vu que la RAG est extrêmement utile pour obtenir des résultats d’IA générative, mais comment cela se passe-t-il concrètement ?
Blendow Group, l’un des principaux fournisseurs de services juridiques en Suède, gère un large éventail de documents juridiques – décisions de justice, textes législatifs et de jurisprudence – qui doivent être analysés, résumés et évalués. Disposant d’une équipe relativement modeste, Blendow Group avait besoin d’une solution évolutive pour faciliter ses analyses juridiques. En collaboration avec IBM Client Engineering et NEXER, Blendow Group a créé un outil innovant piloté par l’IA doté de capacités complètes pour améliorer la recherche et l’analyse, et rationaliser le processus de création de contenu juridique, tout en préservant la stricte confidentialité des données sensibles.
En utilisant la pile technologique d’IBM, notamment IBM Cloud Object Storage et IBM Code Engine, la solution d’IA a été conçue pour accroître l’efficacité et l’étendue de l’analyse des documents juridiques de Blendow.
La Mawson’s Huts Foundation est également un excellent exemple d’utilisation de la RAG pour améliorer les résultats de l’IA. La fondation a pour mission de préserver l’héritage de l’explorateur australien Sir Douglas Mawson, y compris la revendication territoriale de 42 % de l’Australie sur l’Antarctique, et d’éduquer les écoliers et d’autres personnes sur l’Antarctique lui-même et sur l’importance de préserver son environnement vierge.
Avec The Antarctic Explorer, une plateforme d’apprentissage alimentée par l’IA qui fonctionne sur IBM Cloud, Mawson permet aux enfants et à d’autres personnes de découvrir l’Antarctique depuis un navigateur, où qu’ils se trouvent. Les utilisateurs peuvent soumettre des questions via une interface basée sur un navigateur, et la plateforme d’apprentissage utilise les capacités de traitement automatique du langage naturel alimentées par l’IA fournies par IBM watsonx Assistant pour interpréter les questions et donner des réponses appropriées avec les médias associés (vidéos, images et documents), lesquels sont stockés et récupérés dans IBM Cloud Object Storage.
En exploitant les offres d’infrastructure en tant que service en tandem avec watsonx, la Mawson’s Huts Foundation et Blendow Group sont en mesure de tirer des informations de grande valeur de leurs modèles d’IA en facilitant le processus de gestion et de stockage des données qu’ils contiennent.
L’IA générative et les LLM ont déjà démontré leur potentiel pour transformer les organisations dans tous les secteurs. Qu’il s’agisse d’éduquer le grand public ou d’analyser des documents juridiques, les solutions PaaS dans le cloud sont essentielles au succès de la RAG et à l’exécution de modèles d’IA.
Chez IBM, nous pensons qu’à l’avenir, les workloads d’IA seront la pièce maîtresse des workloads stratégiques en centralisant l’hébergement et la gestion des données de confiance. Par conséquent, l’infrastructure qui les entoure doit être fiable et résiliente dès la conception. IBM Cloud permet aux entreprises de tous les secteurs utilisant l’IA d’améliorer considérablement la résilience, les performances, la sécurité, la conformité et le coût total de possession. Pour en savoir plus sur IBM Cloud Code Engine et IBM Cloud Object Storage, cliquez ci-dessous.
Red Hat OpenShift on IBM Cloud est une plateforme de conteneurs OpenShift entièrement gérée.
Les solutions de conteneurs exécutent et étendent les workloads conteneurisés avec sécurité, innovation open source et déploiement rapide.
Déverrouillez de nouvelles fonctionnalités et stimulez l’agilité de votre entreprise grâce aux services de conseil d’IBM Cloud. Découvrez comment co-créer des solutions, accélérer la transformation numérique et optimiser les performances grâce à des stratégies de cloud hybride et à des partenariats d’experts.