データ・ソース

IBM Process Miningでプロセスを分析するには、データ・ソース ( .CSV 形式または .XES 形式のログ・ファイル) をアップロードする必要があります。アップロードを高速化するために、ファイルを ZIP または GZ の形式に圧縮することもできます。さらに、データ・ソース・ファイルの名前は UTF-8 標準に従う必要があります。 .zip ファイルをアップロードする場合は、 .zip ファイル内のすべてのファイルの名前が UTF-8 標準に従っている必要があります。

アプリケーションでは、以下の両方の方法でデータ・ソースを組み込むことができます。

「プロセス・マイニング・プロジェクトの作成」ウィザードの使用
詳しくは、プロセス・マイニング・プロジェクトの作成を参照してください。
「管理」 ページの「データ・ソース」セクションの使用

この資料では、 「管理」 ページの 「データ・ソース」 セクションを使用してデータ・ソースを管理する方法について説明します。

詳細については、以下のリンクを使用できます。

データ・ソース

概要

「データ・ソース」 セクションを使用して、以下のアクションを実行できます。

以下のいずれかの方法を使用して、データ・ソースをアップロードおよび管理します。
- ローカル・デバイスまたはネットワークからデータ・ソースをアップロードします。
- シミュレートされたデータ・ソースをアップロードします。
  メモ: BPMN ページを使用して、プロセス・データをシミュレートできます。詳しくは、シミュレーションを参照してください。
データを適切な列見出しにマップする
更新または変更されたデータ・ソースを使用してプロセスを視覚化します。

重要:

IBM Process Mining を使用すると、既存のデータ・ソースとは異なるヘッダーを持つログ・ファイルまたはデータ・ソースをアップロードできなくなります。

既存の見出し構造が保持されている場合は、以前のログよりも多くの列を持つ新しいログ・ファイルを組み込むことができます。例えば、ファイルの右側に新しい列を追加する必要がある場合があります。ただし、既存の見出し構造が保持されている場合でも、前のログよりも少ない列を持つ新しいログ・ファイルを組み込むことはできません。

注: IBM Process Mining では、スナップショットを介してプロジェクトにアクセスするプロジェクト所有者とコラボレーターの両方が、プロジェクト内のデータ・チャンクを組み込んだり除外したりすることができます。

IBM Process Miningには、以下の制限があります。

プロジェクトの所有者のみがデータを削除できます。
スナップショットに含まれるデータ・ソースは、プロジェクト所有者には表示されません。

「管理」ページを使用したデータ・ソースの管理

データ・ソースのアップロード

以下のステップを使用して、データ・ソースをアップロードできます。

「管理」 ページの左ペインで、 「データ・ソース」をクリックします。
「データ・ソース」 セクションでは、データ・ソースをアップロードすることも、シミュレーションからデータ・ソース・ファイルを取得することもできます。
- データ・ソースをアップロードするには、以下のいずれかの手順を実行します。
- 「ファイルをここにドラッグ・アンド・ドロップするか、クリックしてアップロードします」をクリックします。ファイル・ブラウザーで、ファイルを選択して 「開く」をクリックします。
- 「ファイルのアップロード」をクリックします。ファイル・ブラウザーで、ファイルを選択して 「開く」をクリックします。
新しく追加されたデータ・ソースの形式と構造が既存のデータ・ソースに準拠している場合は、 IBM Process Miningにアップロードされます。
- シミュレートされたデータからデータ・ソースを選択するには、以下の手順を実行します。
1. 「ファイルのアップロード」 オーバーフロー・メニューを展開し、 「シミュレーションから取得」を選択します。
2. 「シミュレーションからインポート」 ダイアログ・ボックスで、インポートするシミュレーションを展開し、必要なシミュレーションを選択します。
3. 「インポート」をクリックします。
注: シミュレーションによって取得した他のデータ・ソースをインポートするために、このプロセスを繰り返すことができます。

注:
- 「組み込み済み」 トグルを使用して、プロジェクトに含めるデータ・ソースを選択できます。
- 「削除」 ボタン () を使用して、テーブルからデータ・ソースを削除できます。

データのマッピング

以下のステップを使用して、データをマップできます。

「データ・ソース」 セクションの 「データ・マッピング」 サブセクションで、サンプル・マッピングに注意してください。
「データ・マッピングの編集」 をクリックして、「プロセス・マイニング・プロジェクトの作成」ウィザードの 「データのマップ」 ステップに進みます。
「プロセス・マイニング・プロジェクトの作成」ウィザードの 「データのマップ」 ステップで、データを適切な列見出しにマップしてから、 「次へ」をクリックします。注:
- 必須の列見出し、 「プロセス ID」、 「アクティビティー」、および 「開始時刻」をマップする必要があります。
- データ・マッピングについて詳しくは、プロセス・マイニング・プロジェクトの作成のステップ 6 を参照してください。
- バイアスのない複数レベルの Process Mining 機能を使用して複雑なプロセスを視覚化および分析するために、最大 5 つの「プロセス ID」をマップできます。これを行うには、対応する見出しを選択し、それらをプロセス ID としてマップします。このアクションにより、 IBM Process Miningのマルチレベル Process Mining 機能が自動的に有効になります。
「時刻形式の構成」 ページで、以下の手順を実行します。
a. 「すべての日付に同じ時刻形式を使用」 チェック・ボックスを選択します。
b. 「開始タイム・スタンプ」リストで、必要な時刻形式を選択します。
c. 「保存」をクリックします。

データ・ソースの視覚化

データ・マッピング・プロセスが完了したら、新しい更新を使用してプロセスを視覚化する必要があります。プロセスに変更を導入するたびに、可視化が必要になります。また、すべての変更を保存するのにも役立ちます。

プロセスを視覚化するには、 「データ・ソース」 セクションで 「視覚化」をクリックします。プロセスの視覚化

「モデル」 タブで、更新されたプロセス・モデルを確認できます。

マルチレベル Process Mining 分析用のデータ・ソースを生成してマップするためのベスト・プラクティス

複数レベルの Process Mining 分析用のデータ・ソースを生成してマップする場合は、以下のベスト・プラクティスに従う必要があります。

複数レベルのデータ・ソースには、プロセスに関与するエンティティー (ProcessID) ごとに異なる列が含まれている必要があります。例えば、単純な P2P プロセスには、 RequisitionID、 OrderID、 ReceiptID、および InvoiceIDなどの 4 つの異なる列を含めることができます。

サンプル・マルチレベル・データ・ソース

表示されている例では、以下の動作に注意することができます。

オーダーは、要求書から作成された後、リリースされます。
オーダーは、2 つの異なる商品受領で受領されます。
2 つの商品の領収書は登録され、1 つの請求書で支払います。

マルチレベル Process Mining のデータ・ソース生成

データ準備側では、列にそれぞれの entityID (ProcessID) を正しく取り込むことに加えて、それらのエンティティー間の関係を作成する必要があります。これを行うには、プロセス内で ブリッジ・アクティビティー を識別する必要があります。ブリッジ・アクティビティーは、エンティティーの作成を表します。同じ entityIDでの再作業を含めることはできません。

例えば、 P2P プロセスでは、典型的なブリッジ・アクティビティーは以下のとおりです。

オーダー作成
これは、1 つの「必要条件」エンティティーにリンクされる「オーダー」エンティティーの作成を表します。同じ OrderID が 2 回作成されることはないため、再作業は予期されません。
商品受領
これは、少なくとも 1 つのオーダー・エンティティーに常にリンクされる、受領エンティティーの登録を表します。同じ ReceiptID が 2 回作成されることはないため、再作業は予期されません。
請求書登録
これは請求書エンティティーの登録を表します。請求書エンティティーは、受領書またはオーダーのいずれかにリンクされます。同じ InvoiceID が 2 回作成されることはないため、再作業は予期されません。

ブリッジ・アクティビティーを識別した後、データ・ソース内の対応するレコードに正しくデータを取り込む必要があります。

ブリッジ・アクティビティーには、それぞれの entityIDが含まれている必要があります。例えば、請求書登録には、取り込まれた InvoiceIDが含まれている必要があります。
リンクされた entityIDごとにブリッジ・アクティビティーの 1 つのレコードを生成します。例えば、 InvoiceID は 4 つの異なる ReceiptIDsにリンクされます。つまり、4 つの請求書登録アクティビティーを作成する必要があります。 InvoiceID は同じ値を保持しますが、 ReceiptID は常に異なります。
- 同じブリッジ・アクティビティーに対して複数のレコードが生成される場合は、それらのレコードのタイム・スタンプが同じでなければなりません。
- IBM Process Mining は、ブリッジ・アクティビティーを認識し、レコードが繰り返される場合でも頻度 1 で管理します。
同じレコードに 3 つ以上の entityIDs を取り込まないでください。例えば、同じ請求書登録アクティビティー・レコードに InvoiceID、 ReceiptID、および OrderID を取り込むことはできません。

ブリッジ・アクティビティーにデータを取り込む際には、プロセスの機能フローまたは論理フローに従うことが重要です。例えば、 P2Pでは、Order Creation ブリッジ・アクティビティーで InvoiceID にデータを設定してはなりません。これは、Invoice が Order の後に生成されることになっているためです。予期されるフロー (例えば、オーダー作成前のインボイス・アクティビティー) が発生した場合、 IBM Process Mining がそれを自律的に処理します。

すべての非ブリッジ・アクティビティーには、それぞれの ID のみが含まれている必要があります (他のエンティティーとのリンクは含まれません)。例えば、 P2Pでは、オーダー・リリース・アクティビティーはオーダー・エンティティーのみを参照します。

データ・ソース・マッピング

ProcessIDsをマップする場合は、プロセスの機能フローまたは論理フローに従うことが重要です。例えば、 P2Pでは、以下の順序でエンティティーをマップする必要があります。

RequisitionID を ProcessID として
OrderID を ProcessID2 として指定します。
ReceiptID は ProcessID3
InvoiceID は ProcessID4