IBM®
本文へジャンプ
    Japan [変更]    ご利用条件
 
 
検索範囲検索:    
    ホーム    製品    サービス & ソリューション    サポート & ダウンロード    マイアカウント    
skip to main content

developerWorks Japan  >  Information Management  >

IBM FileNet P8 機能概説: Part 4 – IBM ECMコンプライアンス技術概説

developerWorks
ページオプション

JavaScript を要するドキュメントオプションは表示されません


レベル: 中級

善家 直己, ソフトウェア開発研究所, IBM
古澤 修, ソフトウェア開発研究所, IBM

2009年 1月 09日

2007年12月に「IBM FileNet P8 機能概説: Part 3 - コンプライアンス管理」を執筆後、IBM ECM (Enterprise Content Management, 企業規模コンテンツ管理)、特にコンプライアンス管理製品の周辺は劇的に変化しました。社会全体としてコンプライアンス(法令順守)を求める声が強まる中、コンテンツ、特に電子メールの証跡としての重要性は更に増し、IBMは既存製品パッケージ群を整理、拡張することで、お客様のビジネスニーズに迅速かつ的確に応えようとしています。

この記事では、IBM FileNetを含むIBM ECM製品全体のコンプライアンス機能に関する最新テクノロジーを、可能な限り歴史的な経緯や内部アーキテクチャ、旧製品呼称等も織り込みながら紹介し、IBM ECMの目指す方向性と共に概説します。



IBM ECMコンプライアンス概観

「IBM FileNet P8 機能概説: Part 3 - コンプライアンス管理」ではIBM FileNet P8を中心としてコンプライアンス機能を説明しましたが、IBM ECMではより広い範囲でのコンプライアンス機能の提供を目的として、図1左に示す「ECMコンプライアンスアーキテクチャ」を提唱しています。図1右はこれを詳細なフロー図として表したものです。


図 1. IBM ECMコンプライアンスアーキテクチャ(左)、およびそのフロー詳細(右)

Information On Demandを体現する「Information Infrastructure」上に構築された「ECM プラットフォーム」では、これまでも数多くのお客様でコンテンツベースのミッション・クリティカルなソリューションを提供してきました。今日では、従来からの非構造化データの管理だけでなく、ビジネスプロセスと連携した動的なサービスや、セキュリティ機能の共通基盤をも担います。ECMコンプライアンスは、ECMプラットフォームで提供されるサービスを利用しながら、互いに作用し合う4つのコンポーネントから形成されます。

  1. Content Collection (コンテンツの収集)
  2. Advanced Classification (高度な分類)
  3. Records Management (レコード管理)
  4. Electronic eDiscovery (eDiscovery管理・分析)

それぞれの特徴について、対応する製品と共に説明します。




上に戻る


コンテンツの収集

企業組織内のさまざまなコンテンツ、具体的には電子メール、ファイルシステム上のファイル、インスタント・メッセージのログ等を収集します。処理はルールベース、ポリシーベースで自動化され、取得されたデータはリポジトリ内にアーカイブされます。

従来、IBMではリポジトリの種類ごとに大きく2つのアーカイブ機能、管理機能を提供してきました。

  • コンテンツ管理製品として以前から使用されてきたIBM Content Manager(旧名称: DB2 Content Manager)をリポジトリとする電子メールアーカイブ製品「CommonStore」及び、アーカイブされた電子メールを管理する「eMail Search」
  • IBM FileNet P8をリポジトリとする電子メールアーカイブ製品「FileNet Email Manager」、ファイルアーカイブ製品「FileNet Records Crawler」、及びレコード管理製品「FileNet Records Manager」

これらのうち、アーカイブ製品が「IBM Content Collector」として統合されました。

IBM Content Collector V2.1

「IBM Content Collector」では、企業のルールやポリシーに基づき、電子メールやファイルシステム上のファイルが自動的に取得され、選択的に保存、分類、管理されます。取得された電子メールやファイルは、日常的なコンプライアンス、eDiscovery、ビジネスプロセス、ディスクサイズ管理等の対象として利用されます(図2左)。

取得に当たっては重複処理やメールボックスのライフサイクル管理、動的なコピー先フォルダの決定等によりアーカイブのサイズも適正化が図られます。また一般ユーザーがアーカイブにアクセスする手段や、セキュリティ機能、ビジネスプロセスとの連携もサポートされます(図2右)。

サポートするソースやリポジトリは次の通りです。

  • 複数のコンテンツソース: Lotus Domino、Microsoft Exchangeなどの電子メールサーバー、Windowsファイルシステムなど
  • 複数のコンテンツタイプ: Microsoft Office文書、電子メール、PDF文書、HTMLなど
  • 複数のコンテンツリポジトリ: Content Manager、FileNet P8

モジュラー方式を採用することで拡張性に富み、他ECM製品との連携も図られます。特に後述の「IBM Classification Module」と併用することで、コンテンツを高度に分類した上で管理できます。またAPIも提供されるため、お客様ニーズに応じたカスタムの拡張も可能です。


図 2. Content Collector(左)、およびContent Collectorを組み込んだLotus Notes(右)

2008年10月に発表された「IBM Content Collector」は、それまでコード名「Symphony」として紹介されてきた製品です。同名のLotusオフィス製品とは異なりますので注意してください。IBM Content Collectorは「CommonStore」、「FileNet EMail Manager」、「FileNet Records Crawler」の後継製品です。




上に戻る


高度な分類

一般にコンテンツをリポジトリに格納する際には、そのメタ情報に基づいて分類作業が行われます。メタ情報としてはコンテンツが作成された日付や作成者、ファイル名等の元々コンテンツに含まれるか、またはコンテンツの格納時に外部から設定された情報が含まれます。ただし後述するeDiscoveryなどでは、電子メール本文に記述された語句を基にした分類が必要になる場合があります。このような場合に必要となるのがフルテキストを分析したコンテンツの自動分類です。

IBM Classification Module V8.5

「IBM Classification Module」(図3 左)は電子メールや文書のフルテキストを読み取り、解釈することで、コンテンツを自動的に分類します。単語や語句を検索するだけでなく、テキスト内のトピックを認識し、カテゴリー分けできます。また学習機能も持ち、分類結果に対するレビューがシステムにフィードバックされ、リアルタイムに分析方法を改善できます。

「IBM Classification Module」は単独でも動作しますが、もっとも威力を発揮するのは「IBM Content Collector」と一緒に使われるときでしょう(図3右)。「Content Collector」のSource Connectorsによって取り込まれたコンテンツはTask Connectors利用して「Classification Module」と通信し、高度な分類を実行。その結果を基にして適切なリポジトリーにTarget Connectors を使用して格納します。このときイベント機能により、必要に応じてビジネスプロセスを起動できます。


図 3. IBM Classification Module (左)、及び IBM Content Collector と IBM Classification Module の概要図(右)




上に戻る


レコード管理

電子的なコンテンツだけでなく、物理的な書類やバインダーも含め、これらコンテンツ全体の管理用メタデータを「レコード」として、効率的に体系立てて管理するのがレコード管理です。レコード管理は、レコードの作成、取得、維持、使用、廃棄に対して責任を持ち、ビジネス活動の証跡として活用されます。

IBM FileNet P8 Records Manager V4.5

「FileNet P8 Records Manager」の詳細については「IBM FileNet P8 機能概説: Part 3 - コンプライアンス管理」を参照してください。基盤となるIBM ECMプラットフォームの機能を最大限活用し、レコードの生成、分類、監査ログ、ビジネスプロセスの起動、状態管理等、すべての処理を自動化し、人手を介することなく正確で迅速な処理を実現します。

新版の「FileNet P8 Records Manager」では従来から管理対象としてきたFileNet P8リポジトリ内のコンテンツに加え、IBMで以前から使用されてきたIBM Content Managerリポジトリもサポートするよう拡張されました。ECMプラットフォームのリポジトリ種別によらないレコード管理が可能です。


図 4. FileNet P8 Records Manager




上に戻る


eDiscovery管理・分析

eDiscovery は、「Electric Discovery」の省略表記で、日本語では「電子証拠開示」と訳されます。訴訟手続きの際に利用される電子証拠の発見を目的として行う情報の特定、検索、保護、生成のプロセスを指します。米国においては、eDiscoveryに関する法案があり、企業は裁判所や政府の要求に応じて関係する電子メールの保存、提出が義務付けられていますが、その手間と費用は膨大です。また、日本企業でも米国でビジネスを行っている場合は、米国内で訴訟に遭遇した場合の為に、eDiscoveryの対応が必要となります。セキュリティに対する配慮からアウトソーシングの際にも注意が必要です。IBMのECM eDiscoveryではこれまで人手によって行われてきたeDiscovery関連のタスク、検索、分類、保管を低コストで、かつ組織内で実行し、組織が訴訟に機敏に対応することが可能です。


図 5. eDiscovery Manager (左) と eDiscovery Analyzer (右)

eDiscovery Manager V2.1

「eDiscovery Manager」は、電子メールに対応したeDiscoveryツールです。

IBM Content Collectorによって収集された、Content Manager、またはFileNet P8リポジトリ内のメールアーカイブに対して訴訟に関連する電子メールを検索、分類、維持、エクスポートできます。指定した日付、発信者等で検索した結果を「ケース」及び「フォルダ」として管理し、これを共有したり、eDiscovery Analyzerと連携して高度な分析を行ったり、外部にNotes Domino形式、Microsoft Exchange形式でエクスポートすることができます。

eDiscovery Managerの検索機能はリポジトリの種別に応じて、それぞれContent Manager、FileNet P8 の検索機能を呼び出す形で実現されています。

「eDiscovery Manager」は、以前は「eDiscovery Collection」とも呼ばれた製品で、Common Storeで登録された電子メールアーカイブに対する検索製品「e-Mail Search」の後継製品です。

eDiscovery Analyzer V2.1

「eDiscovery Analyzer」は、eDiscovery Managerで作成された「ケース」に対して高度な分析を行い、必要であれば新たな「フォルダ」を作成可能です。新たに作成された「フォルダ」も再度、eDiscovery Managerの処理対象とできます。

高度な分析には時系列分析やブール検索、近接検索、フィールド検索、ファジー検索、語幹検索などがあり、これらをサポートする強力で表現力に富むユーザーインターフェイスが提供されます。

「eDiscovery Analyzer」は検索エンジンOmniFind Yahoo! EditionをベースにIBM Content Analyzerのアノテーション機能を取り込む形で始まった製品ですが、現在ではeDiscovery Managerと一体化した電子メールコンプライアンスを実現する製品として拡張が続けられています。高度で使いやすいGUIは定評があり、多数の電子メールの中から必要な情報が含まれる電子メールを特定することを強力に支援します。




上に戻る


IBM ECMコンプライアンスを支えるテクノロジー

これまで、直接コンプライアンスに関する製品を紹介してきましたが、見えない部分で基礎技術を提供した、日本発の関連製品についてもここで触れておきます。

IBM OmniFind Enterprise Edition V8.5

「OmniFind Enterprise Edition(OEE)」はOmniFindファミリーの最高峰に位置する製品で、1インデックス当たり数千万単位の文書および大規模ユーザーに対応し、複数ノード構成、WebSphere Portalにも対応した企業向け検索エンジンソフトウエアです。

企業内での展開を前提に幅広いデータソースをサポート。Webサイトやコンテンツリポジトリだけでなく、ファイルシステム、Lotus Domino/Notes、データベースなどからデータを収集して、インデックス(索引)を作成し、ユーザー入力の単語や文章による全文検索機能を提供します。このとき付随するアクセス権を考慮したリアルタイム権限チェックも実行され、たとえばアクセス権のない文書は検索にヒットさせないなどの設定も可能です。サポートするファイル形式は通常のオフィス文書、Webページだけでなく電子メールの添付ファイルや圧縮ファイルを含め240種類以上に及びます。

内部的には形態素解析、Nグラム解析の両方式をサポートする上に、分かち書きにはIBM伝統の自然言語解析技術を採用。静的、動的なランキングにも対応します。

「OmniFind」は、IBMの検索エンジン製品、およびソリューションを総称するブランド名です。従来の「WebSphere Information Integrator OmniFind Edition」は「IBM OmniFind」に名称が変更されました。

IBM Content Analyzer V8.4.2

「Content Analyzer」ではUIMA (Unstructured Information Management Architecture) に基づくテキスト分析エンジンが提供されます。XML文書を介して入力されたコンテンツ情報をエンジンは分析し、構造化データと組み合わせて分布、傾向、偏差、相関関係を自動計算し、結果を迅速に視覚化します。

「Content Analyzer」の旧称は 「OmniFind Analytics Edition (OAE)」です。IBM東京基礎研究所のテキストアナリシス製品、およびソリューションである「TAKMI("たくみ"と読む)」を利用した、高度な分析機能が出発点となっています。




上に戻る


そしてAgile ECMへ

2008年10月のInformation On Demandカンファレンスにて、IBMは新しい戦略として「Agile ECM」を発表しました。これまで紹介してきた製品も、このAgile ECMの考え方のもと、整理され、発表されました。

「Agile」という言葉には従来のコンテンツ管理から、さらに速く、ダイナミックにビジネスニーズに応えるソリューションを提供する意図が込められています。Agile ECMを支える技術が、冒頭に述べたECMプラットフォームであり、その基盤のInformation Infrastructureです。コンテンツのキャプチャーから検索、分類、保存までの処理を正確に、かつ、自動で行うこと、またビジネスワークフローとの連携により、システムがコンテンツを認識すると同時に、あるいは適切なタイミングで処理を開始することができます。

ECMコンプライアンスは、ECMプラットフォームの上に構築され、Agile ECMの重要な特徴の一つを体現します。




上に戻る


まとめ

IBMでは「Agile ECM」を実現する「Information Infrastructure」および「ECM Platform」の上で、ECMコンプライアンス機能を提供します。提供に当たっては全体を司る包括的なECMコンプライアンスアーキテクチャが提唱され、大きく4つに分けた機能により構成されました。すなわち「収集」、「分類」、「レコード管理」、「eDiscovery対応」です。この流れに合わせて製品体系も統合され、新機能が拡張されました。この結果、IBM ECMではあらゆる種類のコンテンツのコンプライアンス管理が一元的に管理され、企業規模の統合されたコンプライアンス環境の構築が可能となりました。

注意: 本文で触れた製品中には、一部、日本語化されていないものも含まれます。詳細については次の参考文献のリンク先文書を参照してください。



参考文献



著者について

善家 直己はソフトウェア開発研究所のエンジニアです。FileNet製品、Cognos製品における日本市場向けテスト(JMAT)におけるテクニカルリードを努めています。


古澤 修はソフトウェア開発研究所のエンジニアです。OmniFind立ち上げ時からの開発メンバーで、製品全体の開発リードを努めています。 善家 直己、濱田 誠司(OmniFindアーキテクト)との共著に「DB2プログラミングJava編(ソフトバンク刊)」があります。




記事の評価


サイト改善のため、ご意見をお寄せください。こちらのフォームからお願いいたします。



 


 


不充分・不完全である大変素晴らしい
 


この記事を共有する

del.icio.us del.icio.us newsing newsing FC2ブックマーク FC2ブックマーク
Choix! Choix! ニフティクリップ ニフティクリップ Yahoo!ブックマーク Yahoo!ブックマーク
MM/memo MM/memo CZブックマーク CZブックマーク livedoorクリップ livedoorクリップ
はてなブックマーク はてなブックマーク Buzzurl(バザール) Buzzurl(バザール)




上に戻る


    日本IBMについて プライバシー お問い合わせ