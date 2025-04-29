Grâce à ChatGPT et à des dizaines d’autres chatbots construits sur des modèles de fondation, presque tout le monde connaît les modèles de langage (LLM). Mais qu’en est-il des grands modèles de bases de données (LDM) ?
« Les LDM sont des modèles optimisés pour extraire des informations à partir de grands jeux de données et de flux de transactions plutôt qu’à partir du langage et du texte humains, qui sont le domaine des LLM et des chatbots », explique Ric Lewis, vice-président senior de l’infrastructure chez IBM, lors de la journée des investisseurs IBM 2025.
Alors que les LLM sont formés à partir de données accessibles au public telles que des livres, des articles, Wikipedia et diverses autres sources, leurs supports de formation n’incluent généralement pas la grande quantité de données des entreprises. En fait, seulement 1 % des données d’entreprise est actuellement utilisé dans de grands modèles linguistiques.
Les LDM, en revanche, sont entraînés sur des enregistrements de transactions, des informations sur les produits, des données sur les relations avec les clients, des registres de formation et des dossiers sur les employés, entre autres sources de données d’entreprise. Ainsi, les entreprises peuvent utiliser les LDM pour découvrir la signification des données inexploitées présentes dans leurs bases de données à l’aide de questions conversationnelles, lors d’un processus connu sous le nom de recherche sémantique. La recherche sémantique ne se limite pas à la recherche de mots clés pour comprendre le sens et le contexte de la requête de recherche d’un utilisateur.
« Les LDM représentent une nouvelle manière passionnante de tirer parti des données intégrées dans les applications métier et les flux de transactions afin d’extraire de nouvelles informations et de nouvelles valeurs pour l’entreprise », déclare Lewis dans une interview accordée à IBM Think. « Même si les LDM sont encore nouveaux, nous sommes optimistes quant à leur potentiel pour informer les applications agentiques et aider les entreprises à obtenir de meilleurs résultats », explique-t-il, ajoutant que ces modèles ont déjà été adoptés pour intégrer l’IA dans les processus transactionnels.
Considérons, par exemple, un commerce de vente au détail qui cherche à identifier les clients dont le pouvoir d’achat moyen et l’historique d’achat sont similaires à ceux d’une cliente nommée Claire, qui est récemment venue dans le magasin et a exprimé un vif intérêt pour un nouveau produit de beauté. Traditionnellement, le data scientist du détaillant commence par définir le pipeline, c’est-à-dire les processus permettant de transformer les données brutes en réponses utiles à la question commerciale spécifique à l’étude. Ensuite, ils formuleraient la requête de base de données avec des termes très spécifiques, tels que « Trouver tous les clients âgés de 20 à 40 ans qui vivent à New York et qui ont dépensé au moins 1 000 dollars américains en produits de beauté au cours de l’année écoulée. »
Le data scientist extrayait alors les données nécessaires, les chargeait sur une autre plateforme, et, après plusieurs semaines ou plusieurs mois, déterminait quels clients ressemblaient à Claire dans leur base de données.
Considérant la complicité que représente l’exécution de requêtes de bases de données traditionnelles, « une grande quantité de données stockées sur les mainframes des entreprises ne sont généralement pas la cible de l’IA générative et les entreprises n’en tirent aucune information », explique Catherine Wu, directrice du programme Db2 au sein du Silicon Valley Lab d’IBM à IBM Think.
Cela tient en partie aux coûts et aux préoccupations de sécurité liées au transfert des données vers un environnement externe. « Certains clients nous disent que le simple fait de déplacer les données représente 30 à 40 % de leurs coûts informatiques », explique Mme Wu. « De plus, une fois que les données ont quitté leur mainframe, il leur est impossible de savoir où elles vont, c’est donc une préoccupation majeure pour les clients. »
Les LDM, en revanche, permettent aux utilisateurs de rechercher dans les bases de données et d’obtenir des réponses beaucoup plus rapidement et facilement, qu’il s’agisse d’une base de données sur site, dans le cloud ou hybride. Ainsi, le détaillant cité dans l’exemple ci-dessus pourrait simplement interroger la base de données avec la requête suivante : « Lister les 100 meilleurs clients comme Claire. » Et peu de temps après, toute personne ayant une formation SQL de base pouvait extraire ces informations sans avoir à déplacer les données, explique Mme Wu. IBM a lancé son premier produit de base de données en 2022, en utilisant un grand modèle de base de données appelé SQL Data Insights (SQL DI), qui fait partie de la base de données Db2 for z/OS située sur les mainframes IBM® Z, qui alimentent plus de 70 % des transactions financières mondiales en valeur.
Comme le dit Kate Soule, directrice de la gestion technique des produits chez Granite, dans un récent épisode du podcast Mixture of Experts , les LLM peuvent « souvent être excessifs ».
« Les exigences de formation et de réglage des LDM peuvent être satisfaites avec une infrastructure différente de celle des LLM », explique M. Lewis d’IBM. « Vous n’avez pas besoin d’énormes parcs de GPU pour résoudre les problèmes que la plupart des entreprises essaient de résoudre. Pa rapport au volume de données utilisées pour entraîner un LLM, la base de données des transactions d’entreprise est relativement petite. » Mais, selon Ric Lewis, les données spécifiques à une entreprise peuvent créer « des modèles spécifiques pour fournir un résultat précis de manière plus rentable et souvent plus efficace ».
Avec le SQL DI d’IBM, chaque valeur dans une colonne de base de données, quel que soit son type de données, est traduite sous forme de token. « Par conséquent, le modèle perçoit chaque enregistrement de base de données comme un sac de mots dans une phrase assimilable à de l’anglais où chaque token maintient une relation égale avec les autres, quelle que soit sa position dans l’enregistrement », explique Akiko Hoshikawa, ingénieur émérite IBM. Ensuite, SQL DI déduit les valeurs significatives de la base de données en se basant sur les valeurs des colonnes environnantes, à la fois à l’intérieur et entre les lignes de la table. Avec le modèle conçu de cette manière, presque tout le monde peut exécuter une requête IA sur des données relationnelles afin de détecter et de faire correspondre des données sémantiquement similaires directement dans la base de données.
Au moment où de nombreuses entreprises découvrent les LDM comme preuve de concept, certaines entreprises des secteurs de l’assurance et de la vente au détail utilisent déjà ces outils pour accélérer le processus d’extraction de valeur de leurs bases de données.
Thomas Baumann, data evangelist chez Swiss Mobiliar, la plus ancienne compagnie d’assurance suisse, utilise SQL DI d’IBM dans plusieurs domaines de l’entreprise. M. Baumann a commencé à utiliser SQL DI pour aider l’entreprise à mieux cibler les devis d’assurance automobile pour augmenter les ventes. Lorsqu’un vendeur interagit avec un nouveau titulaire potentiel d’une police d’assurance, il peut saisir un devis et le LDM extrait l’historique des dossiers similaires pour déterminer la probabilité que le client l’accepte.
« Ensuite, l’utilisateur peut modifier certains paramètres, comme diminuer les franchises ou offrir une réduction plus importante, puis recalculer les nouvelles chances de succès », explique M. Baumann dans une interview accordée à IBM Think. « Désormais, les devis sont beaucoup plus sophistiqués et personnalisés. »
Lors de l’utilisation de SQL DI d’IBM pour le produit d’assurance automobile de Swiss Mobiliar, la société a entraîné le modèle avec environ 15 millions d’enregistrements de données de devis d’assurance automobile, chaque enregistrement contenant plusieurs dizaines d’attributs, tels que des données démographiques, des données sur le véhicule et le prix. M. Baumann explique que le personnel de vente a découvert qu’il pouvait établir des devis plus scientifiques en vérifiant les chances des différents devis candidats avant d’en sélectionner un.
Ils ont ainsi amélioré le taux de clôture des contrats d’assurance de 7 % en six mois, une amélioration qui, selon lui, aurait pris environ deux ans sans les LDM. Fort du succès de ce projet pilote, Swiss Mobiliar utilise désormais les LDM pour tous ses produits d’assurance (à l’exception de l’assurance-vie), de l’assurance bâtiment à l’assurance habitation.
« Les deux principaux avantages de SQL DI sont qu’il est très rapide de passer de l’idée à la pré-production, dit-il. Vous n’avez pas non plus besoin de déplacer des données d’une plateforme à une autre. »
Au-delà de l’assurance, l’équipe SQL DI d’IBM travaille également avec plusieurs détaillants alimentaires aux États-Unis et en Europe qui souhaitent utiliser les LDM pour offrir à leurs clients des expériences d’achat plus personnalisées. Un client peut, par exemple, tenir un type de céréale dans sa main et lancer une requête sémantique dans la base de données pour extraire d’autres céréales similaires mais offrant un profil nutritionnel plus sain. Les LDM utilisés pour faire des suggestions sont comme « des recommandations Amazon ou Netflix plus sophistiquées et personnalisées », explique Akiko Hoshikawa.
Au-delà des applications destinées aux clients, les entreprises déploient déjà des LDM dans de nombreux domaines B2B, tels que la détection des anomalies et la détection des fraudes en temps réel. Toute entreprise qui émet des contrats, par exemple, pourrait utiliser un LDM pour identifier rapidement les contrats qui sortent de l’ordinaire, explique-t-elle.
Par ailleurs, les LDM peuvent également permettre une détection des fraudes en temps réel plus sophistiquée. En plus d’identifier les transactions qui ne suivent pas les schémas habituels, les LDM peuvent interroger les bases de données pour identifier les enregistrements qui comportent divers attributs associés à un comportement suspect, comme les entreprises qui ne figurent pas dans les rapports du Better Business Bureau ou qui n’ont pas d’adresse physique.
M. Lewis pense que les modèles LLM et LDM seront suivis par de nombreux autres modèles spécialisés. « Nous pensons que les LDM, tout comme les LLM, sont un outil précieux qui permet de lancer une vague d’applications agentiques et d’améliorer les résultats », affirme-t-il. « Mais nous ne nous attendons pas à ce qu’ils soient toujours utilisés de manière isolée. En fait, nous pensons que le scénario idéal consiste à intégrer les LDM dans le modèle de données d’entreprise et à les combiner avec des LLM et d’autres modèles adaptés pour générer de manière massive une valeur nouvelle à l’échelle pour les entreprises et la société dans son ensemble. »
De même, M. Lewis ne s’attend pas à ce qu’une entreprise ou une organisation domine nécessairement. « Ne croyez pas qu’une seule entreprise, ou celle qui possède le plus grand nombre de serveurs et de GPU, développera le couteau suisse des modèles, » explique M. Lewis. « Je n’y crois pas. Tout comme je pense que nous pouvons obtenir un maximum d’informations en exploitant les connaissances spécialisées d’experts en la matière dans différents domaines, je crois que la capacité à combiner les LLM, les LDM et les futures vagues de modèles spécifiques conduira à des informations véritablement nouvelles et à des résultats réellement optimisés.
