フィンランドを拠点とする情報管理ソリューションおよびサービスのプロバイダーであるDigital Office Company(DOC)は、文書の識別、分類、洞察の抽出を可能にすることで、企業が大量の文書を迅速かつ大規模に検出および管理できるように支援しています。
ほとんどの場合、自動化された文書分類システムは、汎用タグやメタデータのエンリッチメントを通じて、文書の性質に関する表面的な洞察を提供します。このような表面的な分類では、文書の内容そのものは十分に考慮されません。つまり、各文書を手作業で評価しない限り、データの真の価値を活用することができません。
要するに、文書の種類を特定し、見当違いの文書を検出し、重要な詳細を抽出するために文書を手作業で評価するプロセスは、非常に手間と時間がかかるということです。さらに、メタデータを適切に処理しないと、GDPR違反の可能性が生じたり、ダウンストリーム・タスクのデータ品質に悪影響を及ぼしたりします。こうした課題が解決されない場合、データ品質や法令遵守の問題により、DOCの顧客の競争上の優位性や効率性が脅かされる可能性があります。
これらの課題に対処するために、DOCはIBM Ecosystem Engineering Build Lab、IBM Client Engineering、IBM Technology Expert Labsと協力し、 IBM® watsonx.aiおよびIBM® Watson Discoveryを使用して、従来の機械学習と生成AIを組み合わせた大規模言語モデル(LLM)を活用するパイロットを開発しました。
DOCは6週間の共同制作パイロットを通じて、IBM Watson Discoveryプラットフォームを活用したデータ・パイプライン・ソリューションを開発しました。このソリューションは、カスタム機械学習モデルとMistral AIのMixtral-8x7B LLMを使用し、カスタム・ラベルとメタデータ・タグで文書を分類します。DOCの顧客がこの分野で直面するデータの種類や規制要件は多岐にわたるため、パイロットの焦点は不動産業界に設定されました。この業界に焦点を当てたことで、ソリューションの範囲を拡大する新たな能力が追加されました。これにより、LLMを使用して、議事録文書から取締役会の決定事項などの豊富なインサイトを抽出できるようになります。
このパイロットは、文書分類の速度と品質の向上、および大量の文書の洞察という点で大きな成功を収めたことが証明されました。加えて、パイロットの結果は、従来の機械学習と生成AIを組み合わせたアプローチのメリットを明確に示しています。つまり、一方のアプローチの欠点を、もう一方のアプローチの長所がカバーするというメリットがあります。以前は、個人が手作業で文書を調べて分類するのに数分かかっていましたが、自動化されたプロセスでは、システムによって外れ値としてフラグが立てられた文書に対してのみ人間による評価が必要となるため、1文書あたりわずか2秒しかかかりません。
今後、DOCはこのパイロットをさらに発展させ、他の業界や顧客セグメントにもこのソリューションを拡大することを目指しています。
Digital Office Company(DOC)(ibm.com外部へのリンク)は、1996年に設立されたフィンランドの会社で、さまざまな規模の組織に最新の情報管理ソリューションを提供しています。オフィスは、フィンランドのエスポー、ハメーンリンナ、ラハティ、ラッペーンランタにあります。
© Copyright IBM Corporation 2024.IBM、IBMのロゴ、IBM Watson、watsonx.aiは、米国およびその他の国または地域におけるIBM社の商標または登録商標です。その他の製品名およびサービス名は、IBMまたは他社の商標である可能性があります。IBM商標の最新リストは、https://www.ibm.com/jp-ja/legal/copytradeでご確認いただけます。 本書は最初の発行日時点における最新情報を記載しており、IBMにより予告なしに変更される場合があります。 示されている例は、説明のみを目的として提供されています。実際の結果はお客様の構成や条件により異なるため、一般的に期待される結果を提供するものではありません。IBMが事業を展開している国または地域であっても、特定の製品を利用できない場合があります。 お客様は適用法・規則の遵守を徹底する責任を負うものとします。IBMは法律上の助言を提供せず、IBMのサービスまたは製品を使用することでお客様による法律または規則の遵守が確約されると表明することも保証することもありません。 |