IBM® watsonx.data: Verbesserung der KI-Genauigkeit mit KI-fähigen unstrukturierten und strukturierten Daten

Digitales Rendering zur Darstellung des watsonx.ai-Unternehmens

Autor

Edward Calvesbert

Vice President, Product Management - watsonx.data

IBM

Heute hat IBM® die Weiterentwicklung von IBM® watsonx.data, dem einzigen hybriden, offenen Data Lakehouse für KI und Analysen in Unternehmen, zur allgemeinen Verfügbarkeit gestartet.

Unternehmen können jetzt den Zugriff, die Aufbereitung und die Bereitstellung von unstrukturierten und strukturierten Daten vereinfachen und skalieren, um genauere, relevantere generative KI-Anwendungen zu entwickeln, Self-Service-Analytics zu skalieren und den vormals komplexen Datenzugriff, die Anreicherung und Governance zu vereinfachen und zu skalieren.

Genauere KI als herkömmliche RAG

Enterprise-Daten sind das beste Mittel, um präzise, differenzierte KI zu entwickeln, die für Ihre Branche und Ihre Kunden relevant ist und Wettbewerbsvorteile verschafft. Allerdings sind 90 % der Unternehmensdaten unstrukturierte Daten, die für generative KI weitgehend unzugänglich bleiben und nicht vollumfänglich genutzt werden.2

Mit IBM® watsonx.data können Sie jetzt auf Ihre unstrukturierte Unternehmensdaten zugreifen, sie vorbereiten und liefern, um eine um 40 % genauere KI als mit herkömmlichen RAG-Daten zu unterstützen. Watsonx.data ist einzigartig:

  1. Hybrid und offen für den Zugriff auf Daten, egal wo sie sich befinden, und die Bereitstellung lokal, in der Cloud und in Multi-Cloud-Umgebungen mit Interoperabilität zu Ihrem bestehenden Ökosystem und Ihren Dateninvestitionen.
  2. Workloadoptimiert mit mehreren zweckmäßigen Abfrage-Engines, einschließlich der neuen Open-Source-Lösung Apache Gluten Enhanced Spark zur Optimierung von Workload für Kosten und Leistung.
  3. Bereit für die generative KI mit eingebetteten Data Fabric-Funktionen – watsonx.data integration und watsonx.data intelligence – alle innerhalb des Data Lakehouse, um die Entstehung einer weiteren Isolation zu vermeiden.

Jetzt können Sie skalieren und automatisieren:

  1. Aufnahme Ihrer unstrukturierten und strukturierten Daten aus einer Vielzahl neuer Quellsysteme wie Filenet, Box, Google Docs und mehr.
  2. Semantische Anreicherung Ihrer Daten, die sowohl vektorisierte Einbettungen als auch strukturierte Derivate von extrahierten und normalisierten Entitäten in Ihren Dokumenten erstellt, um KI-Anwendungen zu unterstützen, die Positionskontext, Beziehungen und Berechnungen verstehen und so genauere, vollständigere Ausgaben erzielen.
  3. Governance Ihrer Daten mit Zugriffskontrollen, die von den Quellsystemen der Dokumente bis hin zum Abruf Ihrer Daten für KI reichen, mit PII-Anmerkungen, um zu verhindern, dass sensible Informationen an die Oberfläche gelangen.
  4. Abfrage von Daten über ein breites Spektrum von Workloads von BI bis hin zu generativen KI-Anwendungen und -Agenten

All dies kann in IBM® watsonx.data durchgeführt werden, um unstrukturierte Daten für KI und traditionelle Analysen wie Data Engineering, BI und ML freizuschalten.

Geschwindigkeit und Skalierbarkeit für komplexe analytische Workloads

IBM® watsonx.data bietet jetzt Apache Glue-beschleunigtes Spark als eine seiner mehreren zweckmäßigen Abfrage-Engines an, was die Leistung für rechenintensive Spark SQL-Workloads erheblich steigert. Apache Gluten, eine Bibliothek mit hoher Leistung, optimiert Apache Spark SQL-Workloads, indem sie die Ausführung an Velox, eine native C++-Ausführungs-Engine, auslagert. Diese Integration ermöglicht eine schnellere Abfrageverarbeitung und eine verbesserte Ressourceneffizienz für die Analyse von großen Datenmengen. Jetzt können Unternehmen komplexe analytische Aufgaben noch schneller und mit größerer Skalierbarkeit sowie zu geringeren Kosten ausführen.

Die neue noSQL-Datenbank DataStax fügt operative und Vektorfunktionen hinzu 

IBM® hat vor kurzem DataStax übernommen und damit einen operativen NoSQL-Vektordatenspeicher, der auf Apache Cassandra basiert, zu watsonx.data gebracht. Diese Ergänzung zu watsonx.data erweitert unsere Funktionen und stärkt unsere Retrieval-Augmented Generation- und Einbettungsfähigkeiten.

DataStax ist optimiert für generative KI-Anwendungen mit Lese- und Schreibzugriff und operative Workloads, die Echtzeitleistung, Hochverfügbarkeit und Skalierbarkeit erfordern und Unternehmen die Geschwindigkeit, Zuverlässigkeit und multimodale Unterstützung bieten, die für moderne KI-Anwendungen erforderlich sind.

DataStax lässt sich auch nahtlos mit Langflow verbinden, das bald als Teil von IBM® watsonx.ai verfügbar sein wird. Langflow ist ein Open-Source-Tool mit über 60.000 GitHub-Sternen, das es Entwicklern ermöglicht, über eine intuitive Low-Code-Schnittstelle Prototypen für Retrieval-Augmented Generation und Multi-Agent-KI-Anwendungen zu erstellen, zu bauen und bereitzustellen, um die Entwicklungsreibungsverluste zu reduzieren und die Time-to-Value zu beschleunigen.

Unsere Think 2025-Vorschau verfügbar für die Allgemeinheit

Wir haben die geschlossene Vorschau dieser Funktionen auf der Think 2025 angekündigt und gleichzeitig die Bühne mit renommierten Gastrednern in der Data-Keynote-Session, Spotlight-Sessions und Techbyte-Demos geteilt, die den Weg für Daten- und KI-Innovation in ihren Branchen ebnen.

Lockheed Martin nahm mit Meta an der Keynote-Bühne teil. Lockheed nutzte kürzlich die transformierte Lösung watsonx.data, mit der 70.000 Ingenieure, Wissenschaftler und Techniker Antworten und Informationen aus Millionen von Dokumenten in natürlicher Sprache abrufen können. „Wir beschleunigen unsere Innovation und Effizienz rasch, um Lösungen aus dem Labor in die Praxis zu bringen und so eine sicherere Welt zu schaffen“, sagt John Clark, Senior Vice President für Technologie und strategische Innovation bei Lockheed.

EY hat vor Kurzem bahnbrechende KI-gestützte globale Steuer-Compliance-Lösungen vorgestellt, die die größten Herausforderungen für Steuerabteilungen beseitigen und mit watsonx entwickelt wurden. „EY bietet Steuerdienstleistungen in über 150 Ländern an, und fast überall in diesen Ländern haben unsere Kunden Probleme mit Daten“, sagt Christopher Aiken, Americas Indirect Tax KI Leader bei EY. „ watsonx hat unseren menschlichen Aufwand für die Datenbereinigung, -anreicherung und -qualitätsprüfung um 30–50 % reduziert.“

USAA nutzt generative KI, um die Zukunft des Versicherungswesens voranzutreiben und die Customer Experience zu verbessern. „In der Versicherungsbranche haben wir es mit einer großen Menge unstrukturierter Daten zu tun“, sagt Ramnik Bajaj, Chief Data Analytics & AI Officer bei USAA. „Zum Beispiel enthalten Hausinspektionsberichte, Polizeiberichte und Unfallbilder nur sehr wenige strukturierte Daten. Mit generativer KI haben wir die Möglichkeit, wichtige Attribute und eine Erkenntnis aus diesen unstrukturierten Daten zu extrahieren, wodurch sie für Antragsprüfer, Schadensregulierer und Servicemitarbeiter viel zugänglicher und nützlicher werden.“

Beginnen Sie noch heute mit watsonx.data

Sie können jetzt erste Schritte mit watsonx.data als Teil der Premium-Edition machen.

Mehr erfahren

Testen Sie eine kostenlose Testversion mit 2.000 USD an kostenlosem Guthaben

Kontaktieren Sie uns, um loszulegen