Eigenschaftssicht des Sequenzoperators

In dieser Sicht können Sie die Eigenschaften für den Sequenzoperator definieren.

Ein Sequenzoperator ist ein Grafiksymbol, das eine Mining-Task darstellt und das Sie im Erstellungsbereich des Mining-Editors platzieren, um typische Ereignissequenzen in der zugeordneten Eingabetabelle zu suchen.

In der Eigenschaftssicht legen Sie die Eigenschaften dieses Operators fest, indem Sie die Felder auf den folgenden Registerkarten ausfüllen:
  • Allgemein
  • Modellname
  • Mining-Einstellungen
  • Namenszuordnungen
  • Taxonomie
  • Spalteneigenschaften
  • Elementformat
  • Regelfilter

Allgemein (Registerkarte)

Bezeichnung
Sie können den Operator umbenennen, indem Sie einen neuen Namen angeben. Dieser neue Name wird auf dem Operatorsymbol im Erstellungsbereich des Mining-Editors angezeigt.
Beschreibung
Sie können eine Beschreibung für den Operator hinzufügen. Wird das genierte Modell in der Tabelle IDMMX.RuleModels gespeichert, wird die Beschreibung in die Beschreibungsspalte der Tabelle kopiert.

Modellname (Registerkarte)

Präfix
Das Präfix für den Namen des Modells, das vom Operator erstellt wird.

Standardwert: Name des Data-Warehousing-Projekts für den Mining-Fluss

Modellname
Der Name des Modells, das Sie erzeugen wollen. Das Modell wird in der Tabelle IDMMX.RuleModels gespeichert. Ist bereits ein Modell mit demselben Namen vorhanden, wird das bisherige Modell durch das neue Modell ersetzt. Die maximale Namenslänge ist 240 Zeichen.
Standardwert: Vom System festgelegt

Mining-Einstellungen (Registerkarte)

Die Spalten, die Sie in der Tabelle Verfügbare Spalten auswählen und in die Tabelle Ausgabespalten verschieben, werden in der Scorer-Ausgabe angezeigt. Die anderen Spalten werden ignoriert.

Gruppenspalte
Der Name der Spalte, die die Gruppen-ID enthält. Die Gruppen-ID kennzeichnet mehrere Elemente oder Ereignisse als Teile einer bestimmten Transaktionsgruppe. Diese Spalte ist meist (jedoch nicht unbedingt) eine Zeitmarkenspalte. Anfangs ist der Wert dieser Eigenschaft <keine>, es muss dann jedoch eine Spalte aus der Eingabetabelle ausgewählt werden. Die Spalten der Eingabetabelle, die nicht als Gruppen- oder Sequenzspalte definiert sind, werden als Elementspalten verwendet.
Standardwert: <keine>
Sequenzspalte
Der Name der Spalte, die die Sequenz-ID enthält. Die Sequenz-ID kennzeichnet mehrerer Elemente oder Ereignisse als zu einem Objekt gehörig (etwa einem Kunden). Anfangs ist der Wert dieser Eigenschaft <keine>, es muss dann jedoch eine Spalte aus der Eingabetabelle ausgewählt werden. Die Spalten der Eingabetabelle, die nicht als Gruppen- oder Sequenzspalte definiert sind, werden als Elementspalten verwendet.
Standardwert: <keine>
Maximale Regellänge
Der Wert für die maximale Regellänge. Die Regellänge bestimmt die maximale Anzahl Elementmengen, die in einer Sequenzregel auftreten. Sie müssen 0 oder einen Wert größer-gleich 2 angeben. Wenn Sie z. B. 3 als maximale Regellänge angeben, enthält die Sequenzregel zwei Elementmengen im Regelrumpf und eine Elementmenge im Regelkopf. Bei Angabe von 0 ist die Regellänge nicht begrenzt.
Standardwert: 2
Maximale Anzahl Regeln
Der Wert für die maximale Anzahl Regeln, die im Modell generiert werden. Bei Angabe von 0 ist die Anzahl der Regeln nicht begrenzt.
Standardwert: 10000
Minimale Konfidenz
Die minimale Konfidenz für alle Regeln in Prozent. Sie können einen Wert zwischen 0 und 100 angeben. Bei Angabe von 0 wird der Standardwert 25 % automatisch als Untergrenze für die Konfidenz einer Regel verwendet.
Standardwert: 25
Minimale Relevanz
Die minimale Relevanz für alle Regeln in Prozent. Sie können einen Wert zwischen 0 und 100 angeben. Bei Angabe von 0 wird der Wert für die minimale Relevanz automatisch so festgelegt, dass grundsätzlich ein Ergebnis erzeugt wird, das mindestens einige Regeln enthält.
Standardwert: 2
Anzahl Bins
Die Anzahl Bins, die für numerische Spalten automatisch erstellt werden. Die minimale Anzahl ist 2. Die maximale Anzahl ist unbegrenzt.

Standardwert: 5

Optionale Parameter
Mithilfe von optionalen Parameterzeichenfolgen können Sie die Standardparameter der Easy Mining-Prozeduren modifizieren. Dies ist fortgeschrittenen Benutzern vorbehalten. Informationen zu den unterstützten optionalen Parametern finden Sie in der Dokumentation zu Easy Mining-Prozeduren von Intelligent Miner.

Beispiel für den Sequenzoperator: DM_setPowerOptions('-buf 2000000'), DM_setItemFormat(10)

Namenszuordnungen (Registerkarte)

Auf der Registerkarte wird eine Tabelle angezeigt, mit deren Hilfe Sie die Element-ID-Spalte und die Namensspalte für jede (virtuelle) Namenszuordnungstabelle definieren können. Die Tabelle hat drei Spalten:

Zuordnungsname (= Port)
Die Tabelle enthält eine Zeile für jeden Subport Namen, der mit einer Namenszuordnungstabelle verbunden ist. Diese Spalte enthält den Namen des Subports, auf den die Zeile verweist. (Der Name des Subports wird gleichzeitig als Kennung für die Namenszuordnung verwendet.) Die Werte in dieser Spalte können nicht editiert werden. Wenn Sie Zeilen hinzufügen oder löschen wollen, fügen Sie die entsprechenden Subports im Mining-Editor hinzu oder löschen sie dort.
Element-ID-Spalte
Diese Spalte gibt den Namen der Spalte aus der Namenszuordnungstabelle an, die die Element-IDs enthält.
Standardwert: <keine> (nicht definiert). Sie müssen diesen Wert explizit definieren.
Elementnamensspalte
Diese Spalte gibt den Namen der Spalte aus der Namenszuordnungstabelle an, die die Elementnamen enthält.
Standardwert: <keine> (nicht definiert). Sie müssen diesen Wert explizit definieren.

Die Namenszuordnungstabelle kann mehr als zwei Spalten haben. Nur die als Element-ID und Elementname ausgewählten Spalten werden verwendet und die anderen Spalten werden ignoriert.

Eine weitere Registerkarte für Eigenschaften wird angezeigt, wenn Sie einen der Subports Namen auswählen: Auf dieser Registerkarte für Eigenschaften können Sie die Informationen zur Element-ID-Spalte und zur Namensspalte für diese bestimmte Namenszuordnungstabelle eingeben. Dies ist lediglich eine andere Methode zur individuellen Eingabe dieser Informationen auf Subportebene anstelle der Operatorebene.

Taxonomie (Registerkarte)

Auf der Registerkarte wird eine Tabelle gezeigt, mit deren Hilfe Sie die verschiedenen Eigenschaften aller (virtuellen) Kategoriezuordnungstabellen definieren können. Die Tabelle hat sechs Spalten:

Kategoriezuordnung
Die Tabelle enthält eine Zeile für jeden Subport, der mit einer Kategoriezuordnungstabelle verbunden ist. Diese Spalte enthält den Namen des Subports, auf den die Zeile verweist. (Der Name des Subports wird gleichzeitig als Kennung für die Kategoriezuordnung verwendet.) Die Werte in dieser Spalte können nicht editiert werden. Wenn Sie Zeilen hinzufügen oder löschen wollen, fügen Sie die entsprechenden Subports im Mining-Editor hinzu oder löschen sie dort.
Untergeordnete Spalte
Diese Spalte gibt den Namen der Spalte aus der Kategoriezuordnungstabelle an, die das untergeordnete Element oder die untergeordneten Kategorie-IDs enthält.
Standardwert: <keine> (nicht definiert). Sie müssen diesen Wert explizit definieren.
Übergeordnete Spalte
Diese Spalte gibt den Namen der Spalte aus der Kategoriezuordnungstabelle an, die die IDs der übergeordneten Kategorie enthält.
Standardwert: <keine> (nicht definiert). Sie müssen diesen Wert explizit definieren.
Rekursive Zuordnung
In dieser Spalte geben Sie an, ob es sich bei der Kategoriezuordnung um eine rekursive Zuordnung handelt. Wählen Sie bei einer rekursiven Zuordnung "Ja" und andernfalls "Nein" aus. Eine rekursive Kategoriezuordnung kann Relationen zwischen zwei aufeinanderfolgenden Ebenen der Kategoriehierarchie enthalten.
Standardwert: Nein
Namenszuordnung
Sie können der Kategoriezuordnungstabelle eine Namenszuordnungstabelle zuordnen. Die Namenszuordnungstabelle enthält Namen für die Kategorie-IDs in der Kategoriezuordnungstabelle. In dieser Spalte können Sie einen der vorhandenen Zuordnungsnamen auswählen.
Standardwert: <keine> (nicht definiert)
Beschreibung
In diese Spalte können Sie eine Beschreibung der Kategoriezuordnung eingeben. Dies wird nur zu Informationszwecken verwendet.
Standardwert: leer

Spalteneigenschaften (Registerkarte)

Auf der Registerkarte wird eine Tabelle gezeigt, mit deren Hilfe Sie die verschiedenen Eigenschaften aller Spalten der (virtuellen) Eingabetabelle definieren können. Die Tabelle hat folgende Spalten:

Eingabespalte
Diese Spalte enthält die Namen aller Spalten der Eingabetabelle. Die als Gruppenspalte (Assoziationsregeln) oder Sequenzspalte (Sequenzregeln) definierte Spalte wird nicht angezeigt. Für alle anderen Spalten der Eingabetabelle können hier Spalteneigenschaften definiert werden. Die Werte in dieser Spalte können nicht editiert werden.
SQL-Typ
Diese Spalte enthält den SQL-Datentyp der Eingabetabellenspalte. Die Werte in dieser Spalte können nicht editiert werden.
Feldtyp
Data-Mining-Algorithmen unterscheiden zwischen numerischen Eingabedaten und kategorischen Eingabedaten. Außerdem können kategorische Eingabedaten den Typ Gruppenwertig (kategorisch) haben.
Die Mining-Funktion stellt automatisch fest, ob die Eingabedaten numerisch oder kategorisch sind. Sie können den Eingabedatentyp für eine Spalte jedoch überschreiben, indem Sie den Spaltentyp Kategorisch angeben.
Die Mining-Funktion kann nicht feststellen, ob die Eingabedaten den Typ Gruppenwertig (kategorisch) haben. Hat eine Eingabespalte diesen Typ, müssen Sie explizit den Spaltentyp Gruppenwertig (kategorisch) angeben.
Standardwert: Vom System festgelegt
Feldverwendungstyp
Standardmäßig entscheidet ein Data-Mining-Algorithmus automatisch, welche Spalten der Eingabetabelle für die Erstellung eines Mining-Modells verwendet werden. Sie können diese Einstellung überschreiben, indem Sie eine Spalte als 'Aktiv' oder 'Inaktiv' angeben. Sie können auch angeben, dass eine Spalte als 'Wertigkeitsspalte' verwendet wird.
Standardwert: Vom System festgelegt
Namenszuordnung
Hier können Sie der Spalte der Eingabetabelle eine Namenszuordnung hinzufügen. Die auf der Registerkarte Namenszuordnung definierten Namenszuordnungen müssen den Spalten zugewiesen werden, deren Element-IDs Namen zugeordnet werden sollen.
Standardwert: <keine>
Taxonomie
Hier können Sie angeben, ob die auf der Registerkarte Taxonomie definierte Taxonomie für diese Spalte verwendet wird. Wählen Sie "Ja" aus, wenn die Taxonomie verwendet wird, andernfalls "Nein".
Standardwert: Nein
Wertigkeit
Hier können Sie Wertigkeitspalten Elementspalten von Eingabetabellen zuordnen. Wählen Sie Wertigkeitsspalten aus der Liste der verfügbaren Wertigkeitsspalten aus. Diese Liste umfasst die Spalten, deren Feldverwendungstyp Sie zuvor auf 'Wertigkeit' gesetzt haben. Wählen Sie <keine> aus, um die Zuordnung zu entfernen.

Spalten können in einer Tabelle als Elementspalten oder als Wertigkeitsspalten betrachtet werden. Standardmäßig werden Spalten als Elementspalten betrachtet. Sie können optional Spalten als Wertigkeitsspalten angeben, indem Sie für eine Spalte Wertigkeit als Feldverwendungstyp auswählen. Mindestens eine Spalte in einer Tabelle muss eine Elementspalte sein.

In der Spalte Wertigkeit können Sie Wertigkeitsspalten Elementspalten zuordnen.

  • Für jede Zeile, die in der Tabelle eine Elementspalte darstellt, steht eine Liste mit Wertigkeitsspalten zur Verfügung. Die Liste der Wertigkeitsspalten umfasst die Spalten, deren Feldverwendungstyp Sie zuvor auf 'Wertigkeit' gesetzt haben. Wenn Sie den Feldverwendungstyp für keine Spalte auf 'Wertigkeit' gesetzt haben, ist die Liste der Wertigkeitsspalten leer.
  • Für alle Zeilen, die in der Tabelle eine Wertigkeitsspalte darstellen, ist die Liste der Wertigkeitsspalten leer.

Standardmäßig bestehen keine Zuordnungen zwischen Wertigkeitsspalten und Elementspalten. Daher sind die Einträge in der Tabellenspalte 'Wertigkeit' auf 'Keine' gesetzt. Nachdem Sie eine Wertigkeitsspalte einer Elementspalte zugeordnet haben, zeigt der Eintrag in der Wertigkeitsspalte den Namen der zugeordneten Elementspalte an.

Für Wertigkeitsspalten stehen die Eigenschaften 'Feldtyp', 'Namenszuordnung' und 'Taxonomie' nicht zur Verfügung.

Wenn Sie eine Spalte als Wertigkeitsspalte definieren, ohne sie anderen Elementspalten zuzuordnen, tritt ein Gültigkeitsfehler auf.

Sie können eine Wertigkeitszuordnung entfernen, indem Sie <keine> auswählen.

Wenn Sie den Feldverwendungstyp 'Wertigkeit' aus einer Spalte entfernen, indem Sie einen der anderen Feldverwendungstypen angeben, werden die möglicherweise zuvor erstellten Zuordnungen zwischen dieser Spalte und anderen Elementspalten ebenfalls entfernt.

Standardwert: <keine>

Elementformat (Registerkarte)

Elementformat
Das Elementformat definiert, wie die Elementnamen aus dem Spaltenwert und dem Spaltennamen erstellt werden. Es gibt außerdem das Tabellenlayout an, das in den Eingabedaten vorausgesetzt wird. Das Elementformat gilt für alle Eingabespalten mit Ausnahme der Spalte, die als Gruppenspalte definiert wurde.

Standardwert: [Spaltenname] wenn nur eine Elementspalte vorhanden ist und [Spaltenname = Spaltenwert] wenn mehrere Elementspalten vorhanden sind.

Folgende Werte werden unterstützt:

[Spaltenname = Spaltenwert]
[Spaltenname = Spaltenwert] wird als Elementname verwendet. Liegt beispielsweise eine Spalte MARITAL_STATUS mit dem Wert 'married' vor, lautet der Elementname 'MARITAL_STATUS = married'.
[Feldwert]
[Feldwert] wird als Elementname verwendet. Liegt beispielsweise eine Spalte ITEM mit dem Wert 'Apple' vor, lautet der Elementname 'Apple'.
[Feldname]
[Feldname] wird als Elementname verwendet. Liegt beispielsweise eine Spalte MARRIED mit dem Wert 'y' vor, lautet der Elementname 'MARRIED'.

Regelfilter (Registerkarte)

Mithilfe von Regelfiltern können Sie die Regeln festlegen, die in den Ergebnissen berücksichtigt werden sollen. Sie machen dazu Vorgaben für den Bereich, die Anzahl oder die Elemente.

Auf der Registerkarte Regelfilter wird eine Tabelle mit den folgenden Spalten angezeigt:
Typ
Einer der folgenden Vorgabetypen:
Bereich
Begrenzt den Suchbereich für neue Regeln durch Einschränkung der zulässigen Bereichs für Regeleigenschaftswerte.
Zu den Regeleigenschaften gehören beispielsweise Relevanz, Konfidenz, relative Abweichung, abgelaufene Zeit oder die Länge der Regeln.
Anzahl
Wenn Sie die maximale Anzahl Regeln angegeben haben, können Sie die "besten" Regeln mithilfe von Anzahlvorgaben auswählen.
Element
Begrenzt die Anzahl der im Ergebnis enthaltenen Regeln auf die Regeln, die eine bestimmte Bedingung erfüllen. Sie können beispielsweise angeben, dass das Ergebnis nur Regeln enthält, die das Element "Getränk" im Regelrumpf aufweisen.
Beschreibung
Die Beschreibung der definierten Vorgabe.

Klicken Sie das Symbol Editieren über der Tabelle an, um die Vorgaben zu editieren. Der Regelfiltereditor wird geöffnet. Der Regelfiltereditor verfügt über folgende Registerkarten:

Bereich
Begrenzt den Suchbereich für neue Regeln durch Einschränkung der zulässigen Bereichs für Regeleigenschaftswerte.

Zu den Regeleigenschaften gehören beispielsweise Relevanz, Konfidenz, relative Abweichung, abgelaufene Zeit oder die Länge der Regeln.

Bereichsvorgaben werden in den folgenden Eigenschaften zusammengefasst:
Statistische Eigenschaften
Die folgenden statistischen Eigenschaften sind verfügbar:
  • Relevanz
  • Konfidenz
  • Relative Abweichung
  • Relevanz*Konfidenz
Längenbegrenzungen
Die folgenden Längenbegrenzungen sind verfügbar:
  • Anzahl Elemente
  • Anzahl Elementmengen
  • Anzahl der Elemente im Regelrumpf
  • Anzahl der Elemente im Regelkopf
Zeitschrittbegrenzungen
Die folgenden Zeitschrittbegrenzungen sind verfügbar:
  • Insgesamt vom Anfang bis zum Ende der Regel abgelaufene Zeit
  • Zwischen benachbarten Teilen der Regel abgelaufene Zeit
Kosten-/Wertigkeitsbegrenzungen
Die folgenden Kosten-/Wertigkeitsbegrenzungen sind verfügbar:
  • Wertigkeit der Regel
  • Wertigkeit des Regelrumpfs
  • Wertigkeit des Regelkopfs
  • Produkt aus Relevanz und Wertigkeit für die Regel
  • Wertigkeit der einzelnen Elemente
  • Erwarteter Umsatz
  • Gesamtgeschäftsvolumen, das die Regel unterstützt
Für jede Eigenschaft müssen Sie eine Ober- und eine Untergrenze sowie ein Vergleichselement festlegen. Beispiel: Eine vollständige Wertegruppe deckt den Bereich 1 - 7 ab. Die Untergrenze ist 3. Die Obergrenze ist 5. Die Vergleichselement haben folgende Bedeutung:
Untergruppe mit Grenzwerten
Die definierte Untergruppe schließt die Obergrenze und die Untergrenze der Werte ein. Auf der Grundlage der oben genannten Voraussetzungen ergibt dies die Werte 3, 4 und 5.
Untergruppe ohne Grenzwerte
Die definierte Untergruppe schließt die Obergrenze und die Untergrenze der Werte aus. Auf der Grundlage der oben genannten Voraussetzungen ergibt dies den Wert 4.
Alle mit Ausnahme der Untergruppe (mit Grenzwerten)
Alle Werte mit Ausnahme der definierten Untergruppe, aber einschließlich der Ober- und Untergrenze. Auf der Grundlage der oben genannten Voraussetzungen ergibt dies die Werte 1, 2, 6 und 7.
Alle mit Ausnahme der Untergruppe (ohne Grenzwerte)
Alle Werte mit Ausnahme der definierten Untergruppe und ausschließlich der Ober- und Untergrenze. Auf der Grundlage der oben genannten Voraussetzungen ergibt dies die Werte 1, 2, 3, 5, 6 und 7.
Anzahl
Wenn Sie die maximale Anzahl Regeln angegeben haben, können Sie die "besten" Regeln mithilfe von Anzahlvorgaben auswählen.
Anzahlvorgaben werden in den folgenden Eigenschaften zusammengefasst:
Statistische Eigenschaften
Die folgenden statistischen Eigenschaften sind verfügbar:
  • Relevanz
  • Konfidenz
  • Relative Abweichung
  • Relevanz*Konfidenz
Längenbegrenzungen
Die folgenden Längenbegrenzungen sind verfügbar:
  • Anzahl Elemente
  • Anzahl Elementmengen
Zeitschrittbegrenzungen
Die folgenden Zeitschrittbegrenzungen sind verfügbar:
  • Insgesamt vom Anfang bis zum Ende der Regel abgelaufene Zeit
  • Zwischen benachbarten Teilen der Regel abgelaufene Zeit
Kosten-/Wertigkeitsbegrenzungen
Die folgenden Kosten-/Wertigkeitsbegrenzungen sind verfügbar:
  • Wertigkeit der Regel
  • Wertigkeit des Regelrumpfs
  • Wertigkeit des Regelkopfs
  • Produkt aus Relevanz und Wertigkeit für die Regel
  • Erwarteter Umsatz
  • Gesamtgeschäftsvolumen, das die Regel unterstützt

Wenn Sie Anzahlvorgaben einsetzen wollen, müssen Sie die maximale Anzahl Regeln und mindestens eines Anzahlvorgabe angeben.

Führen Sie die folgenden Schritte aus, um Anzahlvorgaben festzulegen:
  1. Legen Sie die maximale Anzahl Regeln, die in den Ergebnissen enthalten sein sollen, fest, indem Sie eine ganze Zahl größer als 0 in das entsprechende Eingabefeld eingeben.
  2. Wählen Sie Anzahlvorgaben aus, indem Sie die entsprechenden Vorgaben aus der linken Liste in die rechte Liste verschieben.
  3. Geben Sie die Sortierreihenfolge an, beispielsweise aufsteigende Sortierung.
  4. Wählen Sie die Priorität der Anzahlvorgaben mithilfe der Pfeile in der Symbolleiste aus.
Element
Begrenzt die Anzahl der im Ergebnis enthaltenen Regeln auf die Regeln, die eine bestimmte Bedingung erfüllen. Sie können beispielsweise angeben, dass das Ergebnis nur Regeln enthält, die das Element "Brot" im Regelrumpf aufweisen.
Eine Filterbedingung für eine Elementvorgabe enthält eine der folgenden Elementmengen:
  • Einen Spaltennamen, eine Kategorie und den Bereich, in dem das Element angezeigt werden soll
  • Einen Spaltennamen, einen Wert und den Bereich, in dem das Element angezeigt werden soll
Sie können mehrere Filterbedingungen mithilfe eines der folgenden logischen Operatoren miteinander kombinieren:
  • And
  • Or
  • Not
Beispielsweise kann eine Filterbedingung wie folgt aussehen:
PRODUCT = 'Orangensaft' isIn BODY 
AND NOT PRODUCT = 'Spielzeug' categoryIsIn RULE

Der Container Spalten auf der Seite Element des Assistenten Filter enthält die Namen der Elementspalten. Die Gruppen- und die Wertigkeitsspalte von Assoziationsregeln und die Gruppen-, die Wertigkeits- und die Sequenzspalte von Sequenzregeln sind nicht enthalten.

Wenn Sie eine Spalte im Spaltencontainer auswählen, werden im Kategoriecontainer die zur ausgewählten Spalte gehörenden Kategorien angezeigt. Ist für die Taxonomie eine Namenszuordnung definiert, werden die den Kategorien zugeordneten Namen ebenfalls angezeigt.

Die Werte der Spalten werden im Wertecontainer angezeigt. Ist für die ausgewählte Spalte eine Namenszuordnung definiert, werden die den Werten zugeordneten Namen ebenfalls angezeigt.



Feedback | Literaturübersicht