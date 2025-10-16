Environ 80 % des données d’entreprise ne sont pas structurées. Elles se trouvent dans des fichiers PDF, des e-mails, des plateformes de collaboration et des référentiels de documents. Pourtant, moins de 1 % de ces données présentent un format adapté directement à la consommation d’IA. Cet écart représente à la fois une opportunité considérable et un défi majeur pour les entreprises qui souhaitent développer leurs projets en matière d’IA.​​​​​​

​​​​Les approches traditionnelles de la préparation des données non structurées freinent les entreprises. Les pipelines manuels nécessitent 6 à 12 mois pour être construits, restent fragiles et s’interrompent à chaque nouveau format de document ou changement du système source. Les équipes d’ingénierie consacrent un temps considérable à la « plomberie » des données, au lieu de pouvoir se concentrer sur l’innovation en matière d’IA. Sans une structure et une cohérence appropriées, les modèles d’IA donnent des résultats peu fiables, ce qui entrave la confiance et retarde la création de valeur.​​​

​​​​IBM watsonx.data répond à ce défi en tant que seul data lakehouse du secteur qui soit hybride, ouvert et conçu pour l’IA et l’analytique. Il simplifie l’accès, la préparation et la gouvernance des données structurées et non structurées, aidant les entreprises à établir un socle de données fiable pour l’IA générative à l’échelle.​​​​​