IBMと、IBM Venturesのポートフォリオ企業である Unstructuredとの新しいパートナーシップを発表いたします。私たちは共に、エンタープライズAI拡張における最も重要な障壁の1つである、生成AIのための非構造化データの準備に取り組んでいます。
企業データの約80%は非構造化データであり、PDF、Eメール、協働プラットフォーム、ドキュメント・リポジトリーに保存されています。しかし、このデータのうちAIで直接使用できる形式になっているのは1%未満です。このギャップは、 AIイニシアチブを拡張する組織にとって大きなチャンスであると同時に、重大な課題でもあります。
非構造化データの準備に対する従来のアプローチは、企業の足を引っ張っています。手動パイプラインは構築に6～12か月かかり、脆弱なままであり、新しいドキュメント形式やソース・システムの変更のたびに中断されます。エンジニアリング・チームは、AIイノベーションではなく、データの「配管」に貴重な時間を費やしています。適切な構造と一貫性がなければ、AIモデルは信頼性の低い結果をもたらし、信頼性が損なわれ、価値実現までの時間が遅れます。
IBM watsonx.dataは、AIと分析のために構築された業界唯一のハイブリッドなオープン・データレイクハウスとして、この課題に取り組みます。構造化データと非構造化データの両方で、アクセス、準備、ガバナンスを簡素化し、生成AIのための信頼できるデータ基盤を大規模に確立できるように組織を支援します。
このパートナーシップを通じて、Unstructuraldはwatsonx.dataの力を拡張し、非構造化データにアクセスしてAI対応形式に変換し、信頼性が高く、スケーラブルで信頼できる生成AIを推進します。
Unstructuredは、SharePoint、Google Drive、Salesforce、Confluence、Box、Dropboxなどのエンタープライズ・データ・ソースへの30以上の事前構築済みコネクターを提供します。複雑なレイアウトのPDFから、スキャンされた画像、eメール、Microsoft Officeドキュメントに至るまで、70種類以上のファイル・タイプをサポートすることで、組織は完全なデータ資産にアクセスして変換できます。
基本的なテキスト抽出ツールとは異なり、Unstructuredのインテリジェントなドキュメントの理解は、テーブル、階層、セマンティック構造などの重要な要素を保持し、AIモデルが単なる未加工テキストではなく、文脈に即した豊富なデータを受信できるようにします。
ノーコード・ビジュアル・ワークフロー・ビルダーにより、ビジネス・チームとデータ・チームは、専門的なエンジニアリングの人材を必要とせずにデータ・パイプラインを設計および管理できるようになります。開発チームが存在する組織の場合、包括的なAPIにより、プログラムによる制御とカスタマイズのオプションが提供されます。
自動増分同期プロセスは、新規および変更されたドキュメントのみを取り込むので、演算処理コストを削減してAIアプリケーションを最新の状態に維持します。マルチソース・オーケストレーションは、複数のシステムにわたるデータ・フローを同時に調整し、手動による調整オーバーヘッドを排除します。
Unstructuredは、SOC 2 Type II、HIPAA、およびGDPRに準拠しており、企業のIT組織が必要とする厳格なセキュリティーおよびプライバシー基準を満たしています。このソリューションは、watsonx.dataと併用することで、データ・パイプライン全体でソース・システムの権限を尊重するバージョン管理、データ・リネージュの追跡、詳細なアクセス制御を実現します。
Unstructuredは、最新のAIアーキテクチャー向けに最適化された、意味論的に強化され、適切にチャンク化されたデータを提供します。
watsonx.dataとUnstructuredを使用すると、チームは、スピード、柔軟性、AI対応をすべて1つの統合ソリューションに組み合わせた、本番環境対応パイプラインでより迅速に作業を進めることができます。
watsonx.dataは生成AIアプリケーションを動かすデータ・エンジンであり、Unstructuredはその燃料の供給源です。watsonx.dataとUnstructuredは連携して、AI対応の非構造化データを提供し、AIの精度と信頼性を向上させる高度な検索拡張生成パターンを実現します。
企業は、手作業による文書作成を自動化されたインテリジェントな処理に置き換えることで、価値実現までの時間を短縮できます。ガバナンス・ポリシーは、ドキュメント・ソース・システムからAIアプリケーションに至るまで、あらゆる段階で信頼性と透明性を向上させます。非構造化データの準備のボトルネックを取り除き、統合されたデータ・アクセス、準備、ガバナンスを備えたデータ基盤を提供することで、組織は最終的に非構造化コンテンツの可能性を最大限に解き放って、信頼できるエンタープライズ・グレードのAIを強化できます。
watsonx.dataとUnstructuredの実際の動作をご覧になりたい方は、今後の共同Webセミナーにご参加いただくか、専門家との相談をご予約ください。IBMは、煩雑な非構造化データの準備に時間を費やしているだけでなく、AI対応データを活用したエンタープライズ・グレードのAIエージェントとアプリケーションを大規模に加速する方法に移行するお手伝いをします。