Wir freuen uns, eine neue Partnerschaft zwischen IBM und Unstructured, einem Portfolio-Unternehmen von IBM Ventures, bekannt zu geben. Gemeinsam gehen wir eines der größten Hindernisse für die Skalierung von KI in Unternehmen an: die Aufbereitung unstrukturierter Daten für generative KI.
Ungefähr 80 % der Unternehmensdaten sind unstrukturiert und befinden sich in PDF-Dateien, E-Mails, Kollaborationsplattformen und Dokumenten-Repositories. Allerdings liegen weniger als 1 % dieser Daten in einem Format vor, das direkt für die Nutzung durch KI geeignet ist. Diese Lücke stellt sowohl eine große Chance als auch eine entscheidende Herausforderung für Unternehmen dar, die ihre KI-Initiativen skalieren.
Traditionelle Ansätze für die Aufbereitung unstrukturierter Daten behindern Unternehmen. Manuelle Pipelines benötigen 6 bis 12 Monate für die Einrichtung und sind anfällig für Störungen, da sie bei jedem neuen Dokumentformat oder jeder Änderung des Quellsystems ausfallen. Entwicklungsteams verbringen wertvolle Zeit mit der Datenanalyse statt mit KI-Innovation. Ohne die richtige Struktur und Konsistenz liefern KI-Modelle unzuverlässige Ergebnisse, was das Vertrauen untergräbt und die Time-to-Value verzögert.
IBM watsonx.data adressiert diese Herausforderung als das einzige hybride, offene Data Lakehouse der Branche, das für KI und Analyse entwickelt wurde. Es vereinfacht den Zugriff, die Aufbereitung und die Verwaltung von strukturierten und unstrukturierten Daten und hilft Unternehmen, eine vertrauenswürdige Datengrundlage für generative KI in großem Maßstab zu schaffen.
Durch diese Partnerschaft erweitert Unstructured die Leistungsfähigkeit von watsonx.data, um auf unstrukturierte Daten zuzugreifen und diese in KI-fähige Formate umzuwandeln, die eine zuverlässige, skalierbare und vertrauenswürdige generative KI ermöglichen.
Unstructured bietet mehr als 30 vorkonfigurierte Konnektoren zu Unternehmensdatenquellen wie SharePoint, Google Drive, Salesforce, Confluence, Box und Dropbox. Durch die Unterstützung von über 70 Dateitypen – von PDF-Dateien mit komplexen Layouts bis hin zu gescannten Bildern, E-Mails und Microsoft-Office-Dokumenten – können Unternehmen auf ihren gesamten Datenbestand zugreifen und ihn umgestalten.
Im Gegensatz zu einfachen Textextraktionstools bewahrt das intelligente Dokumentenverständnis von Unstructured entscheidende Elemente wie Tabellen, Hierarchien und semantische Struktur und stellt so sicher, dass KI-Modelle kontextbezogene Daten und nicht nur Rohtext erhalten.
Ein visueller No-code-Workflow-Builder ermöglicht es Geschäfts- und Datenteams, Datenpipelines zu entwerfen und zu verwalten, ohne dass dafür spezielle technische Ressourcen erforderlich sind. Für Unternehmen mit Entwicklungsteams bietet eine umfassende API programmatische Steuerung und Anpassungsoptionen.
Automatische inkrementelle Synchronisierungsprozesse nehmen nur neue und geänderte Dokumente auf, wodurch die Rechenkosten gesenkt und KI-Anwendungen auf dem neuesten Stand gehalten werden. Die Multi-Source-Orchestrierung koordiniert den Datenfluss über mehrere Systeme gleichzeitig, wodurch der manuelle Koordinationsaufwand entfällt.
Unstructured ist SOC 2 Typ II-, HIPAA- und GDPR-konform und erfüllt die strengen Sicherheits- und Datenschutzstandards, die IT-Unternehmen benötigen. Zusammen mit watsonx.data bietet die Lösung Versionskontrolle, Datenabstammungsverfolgung und granulare Zugriffskontrollen, die die Berechtigungen des Quellsystems in der gesamten Datenpipeline berücksichtigen.
Unstructured liefert semantisch aufbereitete, richtig aufgeteilte Daten, die für moderne KI-Architekturen optimiert sind:
Mit watsonx.data und Unstructured können Teams schnell mit produktionsreifen Pipelines arbeiten, die Geschwindigkeit, Flexibilität und KI-Bereitschaft umfassend in einer integrierten Lösung vereinen.
Wenn watsonx.data die Daten-Engine ist, die generative KI-Anwendungen vorantreibt, liefert Unstructured den Treibstoff. Zusammen liefern watsonx.data und Unstructured unstrukturierte Daten und ermöglichen Retrieval-Augmented Generation, was die Genauigkeit und Zuverlässigkeit von KI verbessert.
Unternehmen können die Time-to-Value beschleunigen, indem sie die manuelle Dokumentenerstellung durch eine automatisierte, intelligente Verarbeitung ersetzen. Governance-Richtlinien reichen von den Dokumentenquellensystemen bis hin zu den KI-Anwendungen und verbessern das Vertrauen und die Transparenz in jeder Phase. Durch die Beseitigung des Engpasses der Aufbereitung unstrukturierter Daten und die Bereitstellung einer Datengrundlage mit einheitlichem Datenzugriff, einheitlicher Datenaufbereitung und einheitlicher Datenverwaltung können Unternehmen endlich das volle Potenzial ihrer unstrukturierten Inhalte ausschöpfen, um zuverlässige KI der Unternehmensklasse zu ermöglichen.
Um watsonx.data und Unstructured in Aktion zu sehen, nehmen Sie an unserem bevorstehenden gemeinsamen Webinar teil oder vereinbaren Sie ein Meeting. Gemeinsam helfen wir Ihnen dabei, weniger Zeit mit der Aufbereitung unübersichtlicher, unstrukturierter Daten zu verbringen und stattdessen KI-Agenten und -Anwendungen der Unternehmensklasse zu beschleunigen, die auf KI-fähigen Daten basieren und in großem Maßstab eingesetzt werden können.