シーケンス・モデル・ナゲット
シーケンス・モデル・ナゲットは、シーケンス・ノードによって検出された特定の出力フィールドで見つかったシーケンスを表し、予測生成のためにストリームに追加されます。
シーケンス・ノードを含むストリームを実行すると、シーケンス・ノードによって、予測と各予測に関連付けられた確信度の値から成る 1 対のフィールドが、シーケンス・モデルからデータに追加されます。デフォルトでは、上位 3 つの予測からなる 3 対のフィールド (および対応する確信度値) が追加されます。モデル・ナゲットをストリームに追加した後の「設定」タブ上だけでなく、モデル作成時にシーケンス・ノードのモデル・オプションを設定することによっても、生成される予測の数を変更できます。 詳しくは、シーケンス・モデル・ナゲットの設定を参照してください。
新規フィールド名はモデル名から派生します。予測フィールドの名前は $S-sequence-n (n は n 番目の予測を示す)、確信度フィールドの名前は$SC-sequence-n です。連続する複数のシーケンス・ルール・ノードを含むストリームでは、新しいフィールド名の接頭辞にはそれぞれのノードを区別するための数字が含まれます。ストリーム内の最初のシーケンス・セット・ノードは通常の名前を使用します。2 番目のノードは $S1- と $SC1- で始まる名前、3 番目のノードは $S2- と $SC2- で始まる名前というように名前が付けられていきます。予測は、確信度の順に表示されます。したがって、$S-sequence-1 には最も確信度の高い予測が含まれ、$S-sequence-2 には次に確信度の高い予測が含まれます。使用可能な予測数が要求された予測数より少ないレコードの場合、残りの予測には値 $null$ が含まれます。例えば、特定のレコードに対して 2 つの予想しか行えなかった場合、$S-sequence-3 および $SC-sequence-3 の値は $null$ となります。
各レコードに対して、これまでに現在の ID に対して処理された一連のトランザクションとモデル中のルールが比較されます (現在のレコード、および同じ ID とより以前のタイムスタンプを持つ前のレコードを含む)。この一連のトランザクションに適用される、確信度の値が最も高い k ルールを使用して、レコードの k 予測が生成されます。k は、モデルをストリームに追加した後に「設定」タブで指定された予測の数です (複数のルールがトランザクション・セットに対して同じ結果を予測した場合、もっとも確信度が高いルールだけが使用されます)。詳しくは、シーケンス・モデル・ナゲットの設定を参照してください。
アソシエーション・ルール・モデルのほかのタイプと同様に、データの形式は、シーケンス・モデルの作成時に使用した形式と一致している必要があります。例えば、テーブル形式データを使用して作成されたモデルは、テーブル形式データのスコアリングだけに使用できます。 詳しくは、スコアリング・アソシエーション・ルールのトピックを参照してください。
注 : ストリームで生成されたシーケンス・セット・ノードを使用してデータの得点計算を行う場合、計算では、モデルの作成で選択した許容度と隔たりの設定は無視されます。
シーケンス・ルールからの予測
ノードはレコードを時間に依存する方法で処理します (モデル構築にタイムスタンプ・フィールドが使われていない場合は、順序に依存する方法で)。レコードは、ID フィールドとタイムスタンプ・フィールド (ある場合) でソートされていなければなりません。しかし、予測はこれらの追加先レコードのタイム・スタンプには関連付けられません。これらは現在の ID に対して、現在のレコードまでのトランザクション履歴に基づいて、将来のある時点で 最も可能性の高いアイテムを表しているだけです。
各レコードに対する予測が必ずしもレコードのトランザクションに依存するわけではないことに注意してください。現在のレコードのトランザクションが特定のルールの要因とならない場合、ルールは現在の ID の以前のトランザクションに基づいて選択されます。つまり、現在のレコードにより有益な予測情報がシーケンスに追加されない場合は、この ID に対する前回の有益な予測が現在のレコードで使用されます。
例えば、あるシーケンス・モデルに次のルールがある場合に、
Jam -> Bread (0.66)
これに次のレコードを渡す場合を考えてみましょう。
| ID | 購入品 | 予測 |
|---|---|---|
| 001 |
ジャム
|
bread (パン)
|
| 001 |
牛乳
|
bread (パン)
|
最初のレコードは、期待通りに予測「パン」を生成しています。2 番目のレコードの場合、ジャム の後にミルク が続くルールはないため、ミルク のトランザクションにより有益な情報は追加されません。そのため、ルール Jam -> Bread のルールが引き続き適用され、予測はパン になります。
ノードの生成
「ノードの生成」メニューでは、シーケンス・モデルに基づいて新しいスーパーノードを作成することができます。
- ルール スーパーノード: 得点計算されたデータ中のシーケンスの出現回数を検出、カウントできる、スーパーノードを作成します。ルールが選択されていない場合、このオプションは無効になります。 詳しくは、シーケンス・モデル・ナゲットからルール・スーパーノードを作成のトピックを参照してください。
- パレットのモデル: モデルをモデル・パレットに戻します。これは、同僚から、モデル自体ではなくモデルを含むストリームが送信されてきた場合に便利です。