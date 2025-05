Lorsqu’il s’agit de précision et de performance d’IA générative, notamment d’IA agentique, les entreprises se heurtent à un obstacle de taille. Mais l’obstacle n’est pas celui auquel pensent la plupart des responsables d’entreprise.

Le problème ne concerne pas les coûts d’inférence ou l’inatteignable modèle « parfait » : le problème, ce sont les données.

Les entreprises ont besoin de données fiables et spécifiques pour que l’IA agentique puisse créer une vraie valeur ; les données non structurées contenues dans les e-mails, les documents, les présentations et les vidéos. On estime qu’en 2022, 90 % des données générées par les entreprises n’étaient pas structurées, mais les projets IBM ne représentent que 1 % des LLM.

Les données non structurées peuvent être extrêmement difficiles à exploiter. Souvent distribuées et dynamiques, elles sont restreintes à des formats, manquent d’étiquettes claires et ont souvent besoin de contexte supplémentaire pour une interprétation complète. La génération augmentée par récupération conventionnelle (RAG) ne permet d’extraire leur valeur et n’est pas en mesure de correctement associer les données non structurées et structurées.

À l’inverse, une gamme d’outils déconnectés peut complexifier et encombrer la pile de données d’IA. Les entreprises doivent jongler entre entrepôts de données, data lakes et outils de gouvernance et d’intégration des données. La pile de données peut sembler aussi désordonnée que les données non structurées qu’elle est censée gérer.

Bien souvent, les entreprises ne s’attaquent pas au problème de base : elles se concentrent uniquement sur la couche applicative d’IA générative, plutôt que sur la couche de données essentielle sous-jacente. Tant que les entreprises n’auront pas renforcé leur socle de données, les agents d’IA et autres initiatives d’IA générative ne pourront pas atteindre leur plein potentiel.