72 % des PDG les plus performants reconnaissent que le fait de disposer des outils d’IA générative les plus avancés confère à une entreprise un avantage concurrentiel, selon l’IBM Institute for Business Value. Mais si ces outils d’IA générative ne sont pas ancrés dans le contexte unique d’une entreprise, les organisations risquent de ne pas en tirer tous les avantages.
Aussi puissants que soient les grands modèles d’IA générative à usage général tels que ChatGPT et Google Gemini, ils ne sont pas entraînés sur des ensembles de données spécifiques à l’organisation. Lorsqu’ils sont connectés aux processus d’une organisation, ils peuvent manquer d’informations importantes, ce qui peut les amener à s’embrouiller et à produire des résultats sous-optimaux.
« Chaque entreprise a son propre langage », explique Michael Choie, consultant principal en IA et analytique chez IBM Consulting. « Prenons le mot “dressing” en anglais. » Pour une chaîne de supermarchés, cela signifie « sauce salade ». Pour un hôpital, le même mot en anglais veut dire « pansements ».
IBM s’est associé à The Harris Poll pour publier AI in Action 2024, une enquête menée auprès de 2 000 entreprises à travers le monde. L’enquête a révélé que 15 % de ces entreprises, appelées AI Leaders, obtiennent des résultats quantifiables grâce à l’IA.
Ce qui distingue les AI Leaders, c’est la confiance dans leur capacité à personnaliser leurs efforts en matière d’IA pour en tirer le meilleur parti. Cela ne signifie pas qu’une entreprise doit créer ses propres modèles en partant de zéro pour se démarquer de la concurrence. En revanche, elle peut adapter les modèles d’IA existants en tirant parti de ce que personne d’autre ne possède : les données propriétaires de l’entreprise.
« Tous les fournisseurs d’IA, tels que X ou Google, ont accès aux informations publiques. »Ils ont également accès aux données de leurs propres plateformes », explique Shobhit Varshney, vice-président et associé principal, responsable de l’IA pour les Amériques, IBM Consulting. « Ce à quoi ils n’ont pas accès, ce sont les données de votre entreprise. » Il manque cette pièce du puzzle.
Comme le précise Varshney dans AI in Action 2024, « Le prochain objectif consiste à franchir le gouffre et à faire pénétrer l’IA dans l’entreprise afin qu’elle puisse s’en imprégner, apprendre et devenir votre avantage concurrentiel. »
Newsletter sectorielle
Obtenez des informations sur les actualités les plus importantes et les plus intrigantes en matière d’intelligence artificielle. Abonnez-vous à notre newsletter hebdomadaire Think. Lire la Déclaration de confidentialité d’IBM.
Vous recevrez votre abonnement en anglais. Vous trouverez un lien de désabonnement dans chaque newsletter. Vous pouvez gérer vos abonnements ou vous désabonner ici. Consultez la Déclaration de confidentialité d’IBM pour plus d’informations.
Il existe trois méthodes principales pour alimenter un modèle d’IA en données propriétaires : le prompt engineering, la génération augmentée de récupération (RAG) et le réglage fin.
Dans ce contexte, le prompt engineering signifie inclure des données propriétaires dans le prompt transmis à l’IA.
Supposons qu’un utilisateur souhaite qu’un modèle d’IA résume les conversations des centres d’appels. L’utilisateur peut rédiger un prompt – « Résumer cette conversation » – et joindre la transcription de l’appel au prompt.
Le prompt engineering ne nécessite pas de modifier le modèle lui-même. Il convient mieux aux tâches génériques de faible volume pour lesquelles il est raisonnable d’inclure le contexte nécessaire dans chaque prompt.
La génération augmentée de récupération (RAG) consiste à connecter un modèle d’IA à une base de données propriétaire. Le modèle peut extraire des informations pertinentes de cette base de données lorsqu’il répond aux prompts.
Par exemple, une organisation peut donner à un chatbot de service à la clientèle l’accès à une base de données de produits de l’entreprise. Lorsque les utilisateurs posent des questions au chatbot sur ces produits, celui-ci peut consulter la documentation correspondante et trouver la bonne réponse.
La RAG ne nécessite aucune modification permanente du modèle. Cela peut améliorer la précision et réduire les hallucinations, mais aussi augmenter les temps de réponse.
Le réglage fin signifie fournir à un modèle d’IA suffisamment de données supplémentaires pour modifier certains de ses paramètres. Le réglage fin modifie définitivement le comportement d’un modèle, en l’adaptant à un cas d’utilisation ou à un contexte particulier. C’est également plus rapide et moins coûteux que de former un tout nouveau modèle.
« Si vous avez un réseau de neurones composé de 100 couches différentes, l’entraîner signifierait que vous modifiez les 100 couches », explique Choie. « Un réglage fin signifierait que vous modifiez vraiment les dernières couches. Vous êtes encore en train de modifier le modèle, mais vous n’avez pas besoin de le changer complètement, car il fonctionne déjà bien. »
Le réglage fin nécessite un peu plus d’investissement initial que le prompt engineering et la RAG. Il est utile pour transformer un modèle plus petit en expert dans un domaine spécialisé. Par exemple, une compagnie d’assurance peut affiner un modèle pour maîtriser l’art de traiter les nouvelles réclamations.
Varshney compare un modèle finement réglé à un nouvel employé suivant une formation intensive. Il n’a peut-être pas l’étendue des connaissances d’un polymathe de génie (ou d’un grand modèle IA à usage général), mais il est bien meilleur dans le traitement des demandes d’indemnisation que le polymathe.
« Il ne peut pas faire vos déclarations de revenus ni rédiger un contrat légal », explique Varshney, « mais si je lui demande de traiter une réclamation, il saura comment faire immédiatement. »
L’utilisation de données propriétaires de cette manière peut offrir un avantage concurrentiel significatif en familiarisant les modèles d’IA avec les processus, produits, clients et autres particularités uniques d’une entreprise.
« Si vous avez une IA dont les principaux utilisateurs appartiennent à une entreprise particulière, il est important que cette IA utilise les données de cette même entreprise », explique Choie.
Lorsque les modèles d’IA ont accès à des données propriétaires, ils sont ancrés dans un contexte commercial spécifique, ce qui signifie que leurs résultats sont également ancrés dans ce contexte.
« Je peux prendre un modèle d’IA ouvert, l’affiner avec mes propres données propriétaires, et cette copie est uniquement la mienne », explique Varshney. « Je possède la propriété intellectuelle sous-jacente. Je l’exécute sur ma propre infrastructure. »
En conséquence, ces modèles peuvent produire des résultats plus précis et efficaces que les modèles non augmentés, prêts à l’emploi, puisant dans un corpus général de données publiques.
Les entreprises peuvent utiliser de nombreux types de modèles d’IA pour obtenir des résultats. Mais les modèles open source — tels que les modèles IBM Granite™, disponibles sous licence Apache 2.0 pour un usage commercial large et sans entrave — offrent certains avantages.
« Lorsque vous entraînez un modèle d’IA, il y a de nombreux paramètres et techniques différents que vous devez ajuster pour vous assurer que le modèle apprend de manière efficace et efficiente. Des data scientists spécialisés et des experts en apprentissage automatique sont nécessaires pour mettre cela en place », explique Choie. « L’avantage de l’ajustement des modèles ouverts, c’est que nous disposons de modèles sur lesquels des personnes brillantes ont déjà travaillé. Tout ce que nous avons à faire, c’est alimenter les modèles avec des données supplémentaires spécifiques à la tâche et ajuster quelques couches, ce qui est une tâche beaucoup plus simple que de construire un modèle. »
En plus de permettre aux organisations de bénéficier de l’intelligence collective, les modèles open source peuvent leur permettre d’expérimenter sans que le coût de l’échec ne soit trop élevé. Cette expérimentation, à son tour, aide les organisations à adopter une stratégie multimodèle, en utilisant de nombreux modèles différents — et ajustés différemment — pour des tâches spécifiques à un domaine.
Cette stratégie multimodèle est considérée comme une bonne pratique. AI in Action 2024 a révélé que 62 % des « AI Leaders » utilisent plusieurs modèles, contre 32 % des « AI Learners ».
« Utiliser des modèles open source est une évidence », précise Choie. « Ils sont rentables, les meilleurs experts du secteur y travaillent et, en cas de mises à jour ou de problèmes, la communauté s’y attelle ensemble. »
Une gestion des données efficace est l’une des principales caractéristiques qui différencient les AI Leaders des autres entreprises, selon AI in Action 2024. 61 % des AI Leaders estiment pouvoir accéder aux données de l’organisation et les gérer efficacement pour soutenir les initiatives d’IA, contre 11 % des AI Learners.
Mais alimenter les modèles d’IA avec des données propriétaires n’est pas aussi simple qu’il n’y paraît. Les silos de données, le contrôle de la qualité et d’autres problèmes peuvent constituer des obstacles.
Globalement, la solution consiste à mettre en place une data fabric intégrée qui élimine les silos, assure l’interopérabilité et orchestre la circulation fluide des données entre les plateformes.
Mais à quoi cela ressemble-t-il en pratique ? Voici quelques considérations clés :
Les premiers obstacles à de nombreux efforts en matière d’IA sont la collecte et le stockage des données, des processus qui ne sont pas aussi simples qu’ils peuvent le sembler.
La capture des données dans des bases de données traditionnelles conduit souvent à la création de silos de données, ce qui peut empêcher une organisation d’agréger toutes les données nécessaires pour constituer une base de données RAG efficace ou affiner les modèles. Selon le Data Differentiator d'IBM, 82 % des entreprises connaissent des silos de données qui entravent leurs principaux workflows.
Les entreprises ont besoin de mettre en œuvre des pipelines pour récupérer les données provenant de sources disparates, les préparer pour leur utilisation et les déposer dans un espace de stockage centralisé et accessible.
La récupération et la préparation des données peuvent impliquer l’utilisation d’outils de traitement des flux, tels qu’Apache Kafka, ou d’outils d’intégration de données compatibles ETL et ELT, tels que IBM DataStage. Les entreprises doivent également choisir les bons référentiels de données, tels que :
Les data lakes sont des environnements de stockage à faible coût, conçus pour gérer d’immenses quantités de données brutes structurées et non structurées.
Les entrepôts de données sont conçus pour soutenir les efforts en matière d’analyse des données, de Business Intelligence et de science des données.
Les data lakehouses, tels que watsonx.data, regroupent les capacités des entrepôts de données et des data lakes au sein d’une seule et même solution de gestion des données.
Une infrastructure de cloud hybride est également un composant important des efforts d’intégration des données. De nombreuses entreprises ont aujourd’hui des données distribuées entre des systèmes de stockage de données sur site et de multiples services cloud.
« Vous devez vous assurer de pouvoir agréger toutes ces informations, où qu’elles se trouvent, et les intégrer à vos modèles d’IA », explique Choie. « Si vous ne faites pas d’hybride, vous allez passer à côté de quelque chose. »
De mauvaises entrées conduisent à de mauvaises sorties. Les organisations doivent s’assurer que les données propriétaires qu’elles fournissent aux modèles d’IA sont fiables et précises.
« Vous devez identifier la valeur ajoutée de vos données — l’élément différenciateur — afin de pouvoir l’amplifier », explique Varshney. « Vous voulez réduire le bruit dans les données, et vous voulez fournir des données de haute qualité à affiner. »
Les données doivent être nettoyées avant d’être transmises à une IA. Sinon, cela peut rendre le modèle moins performant.
Varshney donne l’exemple d’un ticket de centre d’appel avec une solution pas si évidente : « Les gens peuvent essayer cinq façons différentes de le résoudre avant de trouver celle qui fonctionne. Vous ne pouvez pas envoyer ce ticket directement au modèle. Ce sera très “bruité”. Il contiendra tout ce que les gens ont essayé. Le modèle risque de ne pas savoir quel est le bon résultat. Vous devez éliminer le bruit afin que le modèle ne puisse voir que la solution réelle. »
Le nettoyage, la préparation et la curation des jeux de données impliquent un certain travail manuel de la part des data scientists et des analystes, qu’ils soient internes ou externes. Il implique également des outils tels que :
Les outils de gestion des données basés sur l’IA peuvent valider automatiquement les données, signaler les erreurs et convertir les données dans le format approprié.
Les générateurs de données synthétiques peuvent aider à combler les valeurs manquantes et à compléter les actifs préparés par des humains avec des corpus plus importants.
Outils de prétraitement et d’ingénierie des données, tels que Apache Spark et la bibliothèque Python pandas.
Les outils d’observabilité des données permettent de suivre le flux de données dans le temps, de surveiller l’utilisation et la traçabilité des données, et de détecter les anomalies.
Quels que soient les avantages concurrentiels que les données propriétaires peuvent apporter à l’IA générative, un avantage stratégique durable découle du déploiement de la bonne combinaison de technologies et de processus opérationnels.
« C’est dans le workflow lui-même que se trouve l’argent », explique M. Varshney. « Le modèle est une marchandise, et nous continuerons à obtenir de meilleurs modèles. Ce que nous devons vraiment trouver, c’est la bonne combinaison entre l’IA traditionnelle, l’automatisation et l’IA générative dans un workflow.
En d’autres termes, les entreprises ne peuvent pas introduire l’IA générative – même un modèle perfectionné et adapté à leurs spécifications – dans leurs processus et attendre des résultats. Ils doivent plutôt évaluer leurs processus et adapter leurs workflows aux modèles autant qu’ils adaptent leurs modèles à ces workflows.
Pensez au modeste lave-vaisselle.
« Lorsque nous avons mis au point les lave-vaisselle, nous ne nous attendions pas à ce qu’ils puissent se tenir debout et laver comme nous le faisons au-dessus d’un évier », explique Varshney. « Nous avons modifié le processus afin que le lave-vaisselle puisse vraiment exceller dans le lavage. » Nous avons défini le problème dans le format approprié. Nous devons faire de même ici. Nous devons réorganiser les processus et trouver la bonne combinaison entre l’IA traditionnelle et l’IA générative. Ensuite, vous commencez à déverrouiller de la valeur. »
Découvrez comment les PDG peuvent trouver un équilibre entre la valeur que l’IA générative peut créer, l’investissement qu’elle exige et les risques qu’elle introduit.
Apprenez des concepts fondamentaux et développez vos compétences grâce à des ateliers pratiques, à des cours, à des projets guidés, à des essais et à d’autres ressources.
Découvrez comment intégrer en toute confiance l’IA générative et le machine learning dans votre entreprise.
Vous voulez obtenir un meilleur retour sur vos investissements dans l’IA ? Découvrez comment la mise à l’échelle de l’IA générative dans des domaines clés favorise le changement en aidant vos meilleurs éléments à créer et à fournir de nouvelles solutions innovantes.
Nous avons interrogé 2 000 entreprises à propos de leurs initiatives d’IA pour découvrir ce qui fonctionne, ce qui ne fonctionne pas et comment progresser.
IBM Granite est notre famille de modèles d’IA ouverts, performants et fiables, conçus pour les entreprises et optimisés pour dimensionner vos applications d’IA. Explorez les options de langage, de code, de séries temporelles et de garde-fous.
Découvrez comment choisir le modèle de fondation d’IA le mieux adapté à votre cas d’utilisation.
Entraînez, validez, réglez et déployez une IA générative, des modèles de fondation et des capacités de machine learning avec IBM watsonx.ai, un studio d’entreprise nouvelle génération pour les générateurs d’IA. Créez des applications d’IA en peu de temps et avec moins de données.
Mettez l’IA au service de votre entreprise en vous appuyant sur l’expertise de pointe d’IBM dans le domaine de l’IA et sur son portefeuille de solutions.
Réinventez les workflows et les opérations critiques en ajoutant l’IA pour optimiser les expériences, la prise de décision et la valeur métier en temps réel.
Bénéficiez d’un accès centralisé aux fonctionnalités couvrant le cycle de développement de l’IA. Produisez des solutions IA puissantes offrant des interfaces conviviales, des workflows et un accès à des API et SDK conformes aux normes du secteur.