Sequenzmodellnuggets

Sequenzmodellnuggets stellen die Sequenzen dar, die in einem bestimmten, vom Sequenzknoten ermittelten Ausgabefeld gefunden wurden und zum Erstellen von Vorhersagen einem Stream hinzugefügt werden können.

Bei der Ausführung eines Streams, der einen Sequenzknoten enthält, fügt der Knoten ein Felderpaar hinzu, das die Vorhersagen und die zugeordneten Konfidenzwerte für die einzelnen Vorhersagen aus dem Sequenzmodell den Daten hinzufügt. Standardmäßig werden drei Felderpaare mit den drei Top-Vorhersagen (und den zugehörigen Konfidenzwerten) hinzugefügt. Sie können die Anzahl der generierten Vorhersagen ändern, wenn Sie das Modell durch Festlegung der Sequenzknotenmodelloptionen zum Erstellungszeitpunkt erstellen, oder auch auf der Registerkarte "Einstellungen", nachdem das Modellnugget einem Stream hinzugefügt wurde. Weitere Informationen finden Sie in Sequenzmodellnugget - Einstellungen.

Die neuen Feldnamen werden aus dem Modellnamen abgeleitet. Die Feldnamen lauten $S-sequence-n für das Vorhersagefeld (dabei gibt n die n-te Vorhersage an) und $SC-sequence-n für das Konfidenzfeld. In einem Stream mit mehreren Sequenzregelknoten in einer Reihe enthalten die neuen Feldnamen Zahlen im Präfix, damit sie auseinander gehalten werden können. Beim ersten Sequenzset-Knoten im Stream werden die üblichen Namen verwendet, beim zweiten Knoten Namen, die mit $S1- und $SC1- beginnen, beim dritten Knoten Namen mit $S2- und $SC2- usw. Die Vorhersagen werden nach Konfidenz geordnet angezeigt, sodass $S-sequence-1 die Vorhersage mit der höchsten Konfidenz enthält, $S-sequence-2 die Vorhersage mit der zweithöchsten Konfidenz usw. Bei Datensätzen, bei denen die Anzahl der verfügbaren Vorhersagen kleiner ist als die Anzahl der angeforderten Vorhersagen, enthalten die restlichen Vorhersagen den Wert $null$. Beispiel: Wenn nur zwei Vorhersagen für einen bestimmten Datensatz vorgenommen werden können, weisen $S-sequence-3 und $SC-sequence-3 den Wert $null$ auf.

Bei jedem Datensatz werden die Regeln im Modell mit der Menge der Transaktionen verglichen, die bisher für die aktuelle ID verarbeitet wurden, einschließlich des aktuellen Datensatzes und aller vorangegangenen Datensätze mit derselben ID und früheren Zeitmarken. Die k Regeln mit den höchsten Konfidenzwerten, die für dieses Set von Transaktionen gelten, werden verwendet, um die k Vorhersagen für den Datensatz zu generieren. Dabei ist k die Anzahl der Vorhersagen, die nach dem Hinzufügen des Modells zum Stream auf der Registerkarte "Einstellungen" angegeben wurden. (Wenn mehrere Regeln dasselbe Ergebnis für das Transaktionsset vorhersagen, wird nur die Regel mit der höchsten Konfidenz verwendet.) Weitere Informationen finden Sie in Sequenzmodellnugget - Einstellungen.

Wie bei anderen Arten von Assoziationsregelmodellen muss das Datenformat mit dem Format übereinstimmen, das beim Aufbau des Sequenzmodells verwendet wurde. Mit Modellen, die mithilfe von Tabellendaten erstellt wurden, können entsprechend nur Tabellendaten gescort werden. Weitere Informationen finden Sie in Scoren von Assoziationsregeln.

Hinweis: Beim Scoring von Daten mithilfe eines generierten Sequenzsetknotens in einem Stream, werden alle Toleranz- oder Lückeneinstellungen, die Sie beim Erstellen des Modells ausgewählt haben, beim Scoring ignoriert.

Vorhersagen aus Sequenzregeln

Der Knoten bearbeitet die Datensätze in zeitabhängiger Weise (bzw. in Abhängigkeit von der Reihenfolge, wenn beim Erstellen des Modells kein Zeitmarkenfeld verwendet wurde). Die Datensätze sollten nach dem ID-Feld und dem Zeitmarkenfeld (sofern vorhanden) sortiert werden. Die Vorhersagen sind jedoch nicht an die Zeitmarke des Datensatzes gebunden, dem sie hinzugefügt werden. Sie beziehen sich einfach auf die Elemente, die unter Berücksichtigung des Transaktionsverlaufs für die aktuelle ID bis zum aktuellen Datensatz mit der größten Wahrscheinlichkeit irgendwann in der Zukunft auftreten.

Beachten Sie, dass die Vorhersagen für die einzelnen Datensätze nicht unbedingt von den Transaktionen des betreffenden Datensatzes abhängen. Wenn die Transaktionen des aktuellen Datensatzes keine spezifische Regel auslösen, werden die Regeln anhand der vorangegangenen Transaktionen für die aktuelle ID ausgewählt. Anders ausgedrückt: Wenn der aktuelle Datensatz keine verwertbaren Vorhersageinformationen zur Sequenz hinzufügt, wird die Vorhersage aus der letzten nützlichen Transaktion für diese ID auf den aktuellen Datensatz übertragen.

Beispiel: Angenommen Sie haben ein Sequenzmodell mit nur einer einzigen Regel:

Marmelade -> Brot (0,66)

und Sie übergeben es an die folgenden Datensätze.

Tabelle 1. Beispieldatensätze
ID Kauf Vorhersage
001 Marmelade Brot
001 Milch Brot

Der erste Datensatz generiert, wie zu erwarten, eine Vorhersage für Brot. Der zweite Datensatz enthält ebenfalls eine Vorhersage für Brot, da keine Regel für Marmelade gefolgt von Milch vorliegt; daher fügt die Transaktion Milch keine verwertbaren Informationen hinzu und die Regel Marmelade -> Brot gilt weiterhin.

Generieren neuer Knoten

Im Menü "Generieren" können Sie anhand des Sequenzmodells neue Superknoten erstellen.

  • Regelsuperknoten. Erstellt einen Superknoten, der die Vorkommen von Sequenzen in den gescorten Daten ermitteln und zählen kann. Diese Option ist inaktiviert, wenn keine Regel ausgewählt wurde. Weitere Informationen finden Sie in Generieren eines Regelsuperknotens aus einem Sequenzmodellnugget.
  • Modell in Palette. Gibt das Modell an die Modellpalette zurück. Das ist nützlich, wenn Sie von einem Kollegen einen Stream, der das Modell enthält, jedoch nicht das Modell selbst erhalten.