シーケンス抽出演算子のポート

シーケンス抽出演算子の入力ポートはシーケンス・ルール・マイニング・モデルに接続し、出力ポートは計算済みルール、シーケンス、各シーケンスに関する詳細、およびルール内で使用されるアイテム・セットを提供します。

入力ポート

マイニング・モデル: マイニング・モデルのポートはシーケンス・ルール・モデルに接続します。

出力ポート

規則

この出力ポートには、以下のルールのセットが含まれます。

RULEID: シーケンス・ルールの固有 ID。 1 からモデルのシーケンス・ルールの数までの範囲の整数の ID。
BODYSEQID: シーケンス・ルールの本体または先行部分を形成するシーケンスの固有 ID。 1 からモデルのシーケンスの数までの範囲の整数の ID。
HEADSETID: シーケンス・ルールのヘッドまたは後続部分を形成するシーケンスの固有 ID。 1 からモデルのシーケンスの数までの範囲の整数の ID。
BODYSEQTEXT: テキスト形式の、シーケンス・ルールの本体または先行部分。このテキスト内のアイテムはマップ名で表示されます。単一アイテム・セットを形成するアイテムは + で連結されます。シーケンスの隣接するアイテム・セットは、記号 >>> で連結されます。この記号はタイム・ステップを表します。
HEADSETTEXT: テキスト形式の、シーケンス・ルールのヘッドまたは後続部分。このテキスト内のアイテムはマップ名で表示されます。単一アイテム・セットを形成するアイテムは + で連結されます。シーケンスの隣接するアイテム・セットは、記号 >>> で連結されます。この記号はタイム・ステップを表します。
LENGTH: ルール・ヘッドにアイテム・セットが含まれるシーケンス・ルールのアイテム・セットの数。
NBOFITEMS: ルール・ヘッドにアイテムが含まれるシーケンス・ルールのアイテムの合計数。
SUPPORT: シーケンス・ルールのサポート。サポートの値は 0 から 1 までの数値です。これは、シーケンス・ルールをサポートする (または含む) トランザクション・グループの数とトランザクション・グループの合計数の比率を表します。
CONFIDENCE: シーケンス・ルールの確信度。確信度の値は 0 から 1 までの数値です。これは、シーケンス・ルール全体をサポートする (または含む) トランザクション・グループの数と、シーケンス・ルールの本体をサポートする (または含む) トランザクション・グループの合計数の比率を表します。
LIFT: シーケンス・ルールのリフト。リフトの値は、ルールの実際のサポートと、「期待される」つまり予測されるサポートの比率を表す正数です。これは、入力データ内のアイテムの分布が完全にランダムで、他のアイテム・セットと統計上独立しているという前提に基づいて計算されます。
MEANTIMEDIFF: シーケンス・ルールの先頭から末尾までの平均経過時間。この数量は、以下の手順でトレーニング・データから計算されます。まず、ルールをサポートする各トランザクション・グループは、最小グループ値から最大グループ値 (タイム・スタンプ) までトラバースされます。全体のルールをサポートし、マイニング・タスクのフィルター制約と一致する、アイテム・セットの最初の組み合わせが検出されます。次に、検出されたアイテム・セットのリスト内のグループ値 (タイム・スタンプ) の差の最大値が計算されます。続いて、これらの最大グループ値の差の平均が meanTimeDiff として戻されます。
STDDEVTIMEDIFF: シーケンス・ルールの先頭から末尾までの経過時間分布の標準偏差。この数量は、数量 meanStdDevTime と同じように計算されます。唯一の相違点は、3 番目のステップにおいて、最大グループ値の差の (平均ではなく) 標準偏差が戻されるという点です。

シーケンス

SEQUENCEID: シーケンスの固有 ID。 1 からモデルに含まれるシーケンスの数までの範囲の整数の ID。
LENGTH: シーケンスの長さ。シーケンスの長さは、シーケンスのアイテム・セットの数によって定義されます。
NBOFITEMS: シーケンス内のアイテムの合計数。
SUPPORT: シーケンスのサポート。サポートの値は 0 から 1 までの数値です。これは、シーケンスをサポートする (または含む) トランザクション・グループの数とトランザクション・グループの合計数の比率を表します。
MEANTIMEDIFF: シーケンスの先頭から末尾までの平均経過時間。この数量は、以下の手順でトレーニング・データから計算されます。まず、シーケンスをサポートする各トランザクション・グループは、最小グループ値から最大グループ値 (タイム・スタンプ) までトラバースされます。全体のシーケンスをサポートし、マイニング・タスクのフィルター制約と一致する、アイテム・セットの最初の組み合わせが検出されます。次に、検出されたアイテム・セットのリスト内のグループ値 (タイム・スタンプ) の差の最大値が計算されます。続いて、これらの最大グループ値の差の平均が 'meanTimeDiff' として戻されます。
STDDEVTIMEDIFF: シーケンスの先頭から末尾までの経過時間分布の標準偏差。この数量は、数量 meanStdDevTime と同じように計算されます。唯一の相違点は、3 番目のステップにおいて、最大グループ値の差の (平均ではなく) 標準偏差が戻されるという点です。
SEQTEXT: シーケンス全体のテキストでの説明が含まれるテキスト。このテキストでは、アイテムはマップ名で表示されます。単一アイテム・セットを形成するアイテムは + で連結されます。シーケンスの隣接するアイテム・セットは、記号 >>> で連結されます。この記号はタイム・ステップを表します。

SEQDETAILS

モデルのシーケンスに含まれるアイテム・セットおよびタイム・ステップに関する情報を戻します。表の各行は、1 つのアイテム・セットおよび前のアイテム・セットから現在のアイテム・セットまでのタイム・ステップに関する情報を表します。これは、タイム・ステップに関する情報が最初のアイテム・セットには存在しないことを意味します。

SEQUENCEID: シーケンスの固有 ID。1 からモデルのシーケンスの数までの範囲の整数の ID。

POSI: シーケンス内の現在のアイテム・セットの位置。 1 からシーケンスのアイテム・セットの数までの範囲の整数。

SETID: 現在のアイテム・セットの固有 ID。 1 からモデルのアイテム・セットの数までの範囲の整数の ID。

SETTEXT: テキスト形式で表示されたアイテム・セット全体が含まれるテキスト。このテキスト内のアイテムはマップ名で表示されます。アイテム・セット内のアイテムは + で連結されます。

MEANTIMEDIFF: 前のアイテム・セットから現在のアイテム・セットまでの平均経過時間。この数量は、以下の手順でトレーニング・データから計算されます。まず、シーケンスをサポートする各トランザクション・グループは、最小グループ値から最大グループ値 (タイム・スタンプ) までトラバースされます。全体のシーケンスをサポートし、マイニング・タスクのフィルター制約と一致する、アイテム・セットの最初の組み合わせが検出されます。次に、検出されたアイテム・セットのリスト内の 'posi-1' 番目のアイテム・セットと 'posi-1' 番目のアイテム・セットとのグループ値 (タイム・スタンプ) の差が計算されます。続いて、これらの最大グループ値の差の平均が 'meanTimeDiff' として戻されます。

STDDEVTIMEDIFF: シーケンスの 'posi-1' 番目と 'posi' 番目のアイテム・セット間のタイム・ステップの経過時間分布の標準偏差。この数量は、数量 'meanStdDevTime' と同じように計算されます。唯一の相違点は、3 番目のステップにおいて、グループ値の差の (平均ではなく) 標準偏差が戻されるという点です。

ITEMSET

アイテム・セット内のアイテムを記述する出力ポート。

ITEMSETID: アイテム・セットの ID
ITEMNAME: 可能なネーム・マッピング後のアイテムの名前
ITEM: ネーム・マッピング前のアイテムの元の名前
SUPPORT: アイテム・セットのサポート。サポート値は 0 から 1 までの数値です。この値は、アイテム・セットをサポートする (含む) トランザクションの数とトランザクションの合計数の比率を表します。

フィードバック | 情報ロードマップ