目次


eDiscovery Manager/Analyzer V2.2 詳説

Comments

eディスカバリー

米国での訴訟において、企業は裁判所や政府などの要求に応じて関連する資料をディスカバリー (証拠開示) する義務があります。そして、電子情報を対象とするものがeディスカバリー (電子情報開示、Electronic Discovery) です。米国においては、eディスカバリーに関する法案があり、電子メールや社内資料の保存、提出が義務付けられています。もし万一情報の開示ができない場合、法的義務の不履行によって罰則や罰金が科せられます。そのため、通常eディスカバリーに対応するコストは膨大となります。さらに、企業のグローバル化、ボーダーレス化が進む中で、米国のみならず、あらゆる国や組織の懸念事項となってきています。そのため、適切に電子情報が保全、管理できて、迅速に必要とされる情報が開示できる仕組みがあれば、コストを抑えるとともに、リスクの軽減を図ることが可能です。

このようなeディスカバリー・ソリューションを支援するソフトウェア製品群がIBMから提供されています。本稿では、その中から、eDiscovery Manager、eDiscovery Analyzerの概要を説明します。通常、eディスカバリーのためのプロセスは、EDRM (Electronic Discovery Reference Model) で公開されているモデルにしたがって行われます。これらのプロセスは、電子メールといった電子情報の保存に始まって、証拠の提出までと広範囲に定義されています。それらのプロセスの中で、eDiscovery Manager / Analyzerは、Processing (必要なデータの選別など)、Review (評価および審査)、Analysis (解析)、Production (提出用データの生成及び加工) といったプロセスに該当する機能を支援します。なお、eディスカバリーでは、データを保持しておくことはもちろん、データが改ざんされないことも保証する必要があります。本稿では詳細には触れませんが、EDRM でいうところのPreservation (保存)、Collection (収集) を支援するするソフトウェア製品として、IBM Content Collectorという製品があります。

以下にeDiscovery Manager/Analyzerのシステム構成について簡単に説明します。

電子情報は、IBM Content Manager (以下CM)、またはIBM FileNet P8 (以下P8)のコンテント管理システムに保全されます。(1) Lotus Notesやファイルシステムにある実データを、IBM Content Collectorなどのツールによって、コンテント管理システムにアーカイブします。(2) eDiscovery Managerによって、保全されたデータの選別、検索、抽出を行います。(3) eDiscovery Analyzerを使用することにより、より高度な解析を行うことが可能です。必要であればDiscovery Analyzerで解析します。(4) 解析結果は、eDiscovery Managerへ送られます。(5) eDiscovery Managerから、(2) から (4) の過程で法的な検討を行うために選別されたデータを各種フォーマットで出力 (エクスポート) します。

図 1. システム構成図
システム構成図
システム構成図

2008年8月にeDiscovery Manager/Analyzer V2.1がリリースされてから、V2.1.1、 V2.1.1Fix Pack1、 V2.1.1 Fix Pack2が続けてリリースされ、2010年12月にさらに機能アップされたV2.2がリリースされました。ここではV2.2をベースに説明します。

eDiscovery Manager V2.2

コンテント管理システム内のデータに対して、訴訟に関連する電子データを検索、分類、維持、エクスポートする機能を提供します。これからeDiscovery Managerの使い方を説明しながらその機能を説明します。

サポートするデータタイプ:

eDiscovery Managerはコンテンツ管理システムにアーカイブされた様々なデータソースをサポートします。

  1. Content Collectorでアーカイブされているデータ

    - Lotus Domino 電子メール (複合)

    - Lotus Domino 電子メール (バンドル)

    - Microsoft Exchange 電子メール (複合)

    - Microsoft Exchange 電子メール (バンドル)

    - Windowsファイル・システム上のファイル

    - Microsoft SharePoint

    - SMTP 電子メール (複合)

  2. MIME (Multi-purpose Internet Mail Extensions) 形式の SMTP 電子メール:

    - SMTP 電子メール

  3. CommonStoreでアーカイブされているデータ

    - Lotus Domino 電子メール

    - Microsoft Exchange 電子メール

  4. FileNet Email Managerでアーカイブされているデータ

    - Lotus Domino 電子メール - FileNet Email Manager

    - Microsoft Exchange 電子メール - FileNet Email Manager

コンテンツ管理システムの構成

eDiscovery Manager はインストール時に、1 次コンテンツ・サーバー (Primary server) の情報を元に接続を行います。さらにユーザーが他のコンテンツ・サーバーの内容を監査の対象としたいときは、それらの コンテンツ・サーバーを2次サーバー (Secondary server) として追加できます。

図 2. コンテンツ管理システムの追加
コンテンツ管理システムの追加
コンテンツ管理システムの追加

コレクションの作成

リポジトリ内に保存されているデータをeDiscovery Managerで扱えるように、最初にコレクションを定義する必要があります。様々な形式でアーカイブされたデータを単一のコレクションにマッピングすることにより等価に扱うことも可能です。

ユーザーはコレクション名、データタイプ、コンテンツ・サーバー、項目タイプ/オブジェクト・クラス、またコンテンツ・サーバーとコレクションのフィールドマッピングを行うことで、コレクションを作成できます。P8 環境では、コレクションは 1 つ以上のオブジェクト・クラスで構成されますが、CM環境では、コレクションは 1 つ以上の項目タイプで構成されます。

図 3. コレクションの作成
コレクションの作成
コレクションの作成

検索テンプレートの作成

作成したコレクションに含まれているデータを検索するためには、そのコレクション用の検索テンプレートを作成します。ユーザーは、検索テンプレート名、検索対象のコレクションの定義、検索可能なコンテンツ・サーバーのプロパティーを用いた検索フィールドの指定、検索結果に表示する情報を指定することで、検索テンプレートを作成できます。一つの検索テンプレートは、一つのコレクションに固有の場合も、複数のコレクションを含んで作ることも可能です。

図 4. 検索テンプレートの作成
検索テンプレートの作成
検索テンプレートの作成

ケースの作成

英語でのCaseとは訴訟、裁判事件の意味を持っています。eDiscovery Managerのシステム上でも、最初にケースを作成します。作成したケースの中に、ある訴訟や裁判事件に対して関連する内容の電子メールおよび文書を取り込みます。ケースの単位で、検索、監査、解析といった作業が可能となります。場合によっては、内部調査、eディスカバリー要求、または法的事項に関連する内容を保持するために、それぞれに対応するケースを作成します。またケース内には、より柔軟に文書や検索結果を保管できるように複数のフォルダーを作成することができます。

図 5. ケースの作成
ケースの作成
ケースの作成

ユーザーは、検索テンプレートで指定した検索フィールドを使ってケース内に収集した文書を、eDiscovery Managerからプレビューすることができます。また、Lotus NotesクライアントあるいはMicrosoft Outlookといった実際の電子メールプログラムを用いることで、オリジナルと同等な内容を閲覧することができます。

図 6. ケースの情報
ケースの情報
ケースの情報

内容のエクスポート

検索、監査、解析を行った結果は、様々なフォーマットで指定されたディレクトリにエクスポートします。、ネイティブ (NotesやExchange) の形式や、EDRM XML、HTML、PDF、TIFFなどを選んで出力可能です。

図 7. エクスポート
エクスポート
エクスポート

eDiscovery Analyzer V2.2

eDiscovery Analyzerは、eDiscovery Managerで作成された「ケース」に対して、さらに高度な検索、解析、選別を行います。検討が必要であると考えられる文書をの特定を支援することで、コストの削減を実現します。

ケースの索引付け

ケース内の文書を検索、解析するには、ケースの索引を行う必要があります。

eDiscovery Manager で作成したケースは、eDiscovery Analyzer の「ケースの管理」ページに表示されます。eDiscover Analyzerでは、文書管理リポジトリから直接文書を取り込み、独自の索引を作成します。索引にあたり、内部ではテキスト解析処理が行われるため、文書によっては負荷のかかる作業となります。ケースの索引付けを高速化するため、最大で3台ののヘルパー・サーバーを追加することができます。。また「索引付けパフォーマンスのチューニング」ページでシステム・パラメーターを変更して、そのパフォーマンスも管理できます。

図 8. ケースの索引付け
ケースの索引付け
ケースの索引付け

ケースの索引付けを行うとき、ケースの言語およびケースのタイム・ゾーンを 指定します。言語に関しては、1 つ以上選択できます。ケースの索引付けを行うとき、検索フィールドのマッピング、フラグ、無視するテキストなどの設定をすべてのケース、もしくは、ケース毎に指定することが可能です。

フラグの管理

ユーザーは、特定の文書にその関連性をしめすフラグをつけることによって文書を管理します。例えば、eディスカバリー要求に対して反応があると考えられる文書に対して、ユーザーは「反応あり」というフラグを付け、法的な検討のためにそれらの文書をグループ化しeDiscovery Managerに送ります。 また、無関係な文書に「反応なし」のフラグを付けておき、その後の解析ではそれらの文書を検索および解析対象から除外することができます。

図 9. フラグの管理
フラグの管理
フラグの管理

無視するテキストの管理

eDiscovery Analyzer では無視するテキストを定義することで、検索するとき語または句を無視できます。例えば、メールの末尾の署名などは検索結果から除外することが可能です。署名のテキスト部分をコピーし、それを「テキストを無視する」ダイアログ内に貼り付けます。

ケースの検索

ケースの索引付けが終わったら、そのケースに含まれている文書をあらゆる角度から検索を行います。後述の各種絞り込みに関する機能を組み合わせて使用することにより、より柔軟な検索、解析を行うことが可能となります。

推奨された検索項目による照会の詳細化

検索されたキーワードに対してそれと似ているスペル、同義語、名前の変化形など、現在のケースで使用されている用語を候補として表示します。例えば、 キーワードにつづりの間違ったAdroid を含む場合、変化形には、android、avoid、afraidなどを表示してくれます。「用語の候補」機能を使用することで、ミススペル、同義語、およびその他の変化形を検索できます。

図 10. 用語の候補
用語の候補
用語の候補

カテゴリーの使用による検索結果の絞り込み

カテゴリー検索を行うことでさらに検索結果を絞り込むことができます。デフォルトのカテゴリーとしては、「保存された検索」、「句」、「送信者または作成者」、「受信者」、「送信者ドメイン」、「受信者ドメイン」、「人物」、「企業」、「ロケーション」、「概念グループ」、「ファイル・タイプ」、「手動での確認」、「フラグ」、「言語」など (新しいアノテーターを追加することで、カテゴリーを追加可能) があります。

カテゴリーは階層に表示でき、親のカテゴリーで検索すると自分の子供のカテゴリーに索引されたすべての文書を検索できますし、子供のカテゴリーで検索を行うとその子供のカテゴリーに索引された文書のみを検索します。 IBM JapanとIBM Indiaは親のカテゴリーIBMのサブカテゴリーとして表示されます。

カテゴリーを使用して検索結果を絞り込むには、以下のようにします。

「句」などの同じカテゴリー内で複数の緑色のプラス符号 (+) を選択した場合は、/phrase/("合法" OR "違法") の検索が行われます。また同じカテゴリー内で複数の赤色のマイナス符号 (-) を選択した場合は、 /phrase/(NOT ("合法" OR "違法"))の検索が行われます。しかしカテゴリーをまたがる場合はプラス符号 (+)は、AND演算子になり、マイナス符号 (-)はAND NOTになります。

キーワードでCountryを検索したとき 、「ロケーション」カテゴリーに United States、Canadaおよび China などの結果が戻され、「企業」カテゴリーには IBM、Oracle、および Microsoft などの結果が戻されます。 Canada の横にある緑色のプラス符号 (+)、China の横にある赤色のマイナス符号 (-)、および Filenet の横にある緑色のプラス符号 (+) をクリックし、「検索」をクリックすると、検索問合せは ( (/location/"Canada" AND NOT /location/"China") AND (NOT /company/"Filenet") AND country )となります。

図 11. カテゴリー検索
カテゴリー検索

検索結果の解釈

検索結果に対して以下のようなビジュアル的な機能を使ってケースの内容に関する理解を深め、その後結果を絞り込むことができます。

時系列の使用による関係の探索

検索結果を時系列に表示することで、隠された情報を明るみに出すことができます。時系列には、検索結果の文書の数が、文書が送信された日付、月、または年ごとにグラフィカルに表示されます。

時系列には、日付範囲ごとに、実際の文書カウント、および予想されたカウントの両方が表示されます。予想されたカウントは、対象の日付範囲において、ケース全体にわたって結果を均一に配分した場合を前提に計算されます。実際のカウントが想定されたカウントより多い場合は、その期間でアクティビティーが多いことを示しており、注目することになります。例えば、ケース全体の文書に対して「セクシャル・ハラスメント」で検索を行うと、1%ヒットしたと想定します。しかしある期間では5%の文書がヒットしたら、セクシャル・ハラスメント問題に関してその期間の文書を検討することになります。

図 12. 時系列グラフ
時系列グラフ
時系列グラフ

カテゴリー・グラフの使用による関係の探索

カテゴリー・グラフにで「1 次カテゴリー」で「ロケーション」を選ぶと、日本、東京、および大阪などを表示する水平バンドが表示されます。各々バンドの幅はその時刻におけるそのカテゴリーに索引された文書数によって決まります。たとえば、2009年9月にカテゴリーJapanに索引された文書が多いとそのときのバンドの幅は広く表示されます。そして、「2次カテゴリー」で「人物」を選択すると、1 次カテゴリーの水平バンド上に人物の名前を表示するので、二つのカテゴリーの相関関係を見つけることができます。

これの例ではロケーションと人物を設定していますが、メールの送受信者およびそのドメイン、抽出された語句、会社名などを1次カテゴリーおよび2次カテゴリーに自由に設定できます。

図 13. カテゴリー・グラフ
カテゴリー・グラフ
カテゴリー・グラフ

E メール・グラフを使用した関係の探索

Eメール・ダイアグラムの各ノードは、E メールの送信者と受信者のいずれかを表します。ノードは、さまざまな幅の線で接続されていますが、その幅は、送信者と受信者との間で送受信された Eメールの相対的な量を示します。このグラフを使用することで、人々の直接的または間接的な関係、サブグループまたはクラスター、さらに、特定の送信者と受信者との間のEメールの量などを特定できます。また、期間を指定すれば、その期間のメールの流れを表示することも可能です。

図 14. Eメール・ダイアグラム
Eメール・ダイアグラム
Eメール・ダイアグラム

類似文書を探索

類似文書を検索するためには、一致する必要がある用語の選択、またそのうちのいくつが一致する必要があるのかを指定します。類似文書の検索は、類似文書をすべて同じフラグに適用したり、以降の検索からそれらの文書を除外したりするためなどに有用です。

図 15. 類似文書を検索
類似文書を検索
類似文書を検索

文書へのコメントの追加

関連した文書にコメントを付けることで、他の監査者に情報を伝達することができます。

図 16. コメント、スレット、類似文書の表示
コメント、スレット、類似文書の表示
コメント、スレット、類似文書の表示

監査ログ・レコードの表示および検索

eDiscovery Analyzerでは誰がどのような監査を行ったかが逐次記録されますが、この機能を利用すると、複数の人間で監査を行っている場合でも誰がいつどのようなフラグをどの文書に付加したかを知ることができます。

図 17. 監査ログの表示
監査ログの表示
監査ログの表示

eDiscovery Managerへのエクスポート

eDiscovery Analyzer上では、解析した結果を単独で出力する機能は提供していないので、eDiscovery Managerへ結果を通知します。管理画面より、エクスポートボタンをクリックすることでeDiscovery Analyzer内部で保持されているフラグ情報が、eDiscovery Managerへ送られます。eDiscovery Managerでは、フラグの名前と一致するフォルダーが作成されて、フォルダー内文書として管理されます。提出の必要となるデータは、前述のeDiscovery Managerの機能によって作成されます。

まとめ

eDiscovery Manager/AnalyzerはIBM Content Collectorなどのアーカイブソフトによってコンテンツ管理システムに収集された膨大なEメール、文書に対してパワフルな検索を行い、またその検索結果に対して、高性能な解析を行い、素速く訴訟に関連する電子情報を見つけることで、企業のコストダウンを支援しています。


ダウンロード可能なリソース


関連トピック


コメント

コメントを登録するにはサインインあるいは登録してください。

static.content.url=http://www.ibm.com/developerworks/js/artrating/
SITE_ID=60
Zone=Information Management
ArticleID=732465
ArticleTitle=eDiscovery Manager/Analyzer V2.2 詳説
publish-date=07152011