Ungefähr 80 % der Unternehmensdaten sind unstrukturiert und befinden sich in PDF-Dateien, E-Mails, Kollaborationsplattformen und Dokumenten-Repositories. Allerdings liegen weniger als 1 % dieser Daten in einem Format vor, das direkt für die Nutzung durch KI geeignet ist. Diese Lücke stellt sowohl eine große Chance als auch eine entscheidende Herausforderung für Unternehmen dar, die ihre KI-Initiativen skalieren.​​​​​​

​​​​Traditionelle Ansätze für die Aufbereitung unstrukturierter Daten behindern Unternehmen. Manuelle Pipelines benötigen 6 bis 12 Monate für die Einrichtung und sind anfällig für Störungen, da sie bei jedem neuen Dokumentformat oder jeder Änderung des Quellsystems ausfallen. Entwicklungsteams verbringen wertvolle Zeit mit der Datenanalyse statt mit KI-Innovation. Ohne die richtige Struktur und Konsistenz liefern KI-Modelle unzuverlässige Ergebnisse, was das Vertrauen untergräbt und die Time-to-Value verzögert.​​​

​​​​IBM watsonx.data adressiert diese Herausforderung als das einzige hybride, offene Data Lakehouse der Branche, das für KI und Analyse entwickelt wurde. Es vereinfacht den Zugriff, die Aufbereitung und die Verwaltung von strukturierten und unstrukturierten Daten und hilft Unternehmen, eine vertrauenswürdige Datengrundlage für generative KI in großem Maßstab zu schaffen.​​​​​