Eigenschaftssicht für Spaltenberechnungen

Viele Eingabefelder für Mining-Algorithmen sind das Ergebnis einer Spaltenberechnung. Die Ebene einzelner Transaktionen ist für die Analyse jedoch häufig zu differenziert. Daher müssen die Werte vieler Transaktionen zu einer aussagekräftigen Ebene zusammengefasst werden. In der Regel wird die Spaltenberechnung auf allen Fokusebenen ausgeführt.

Die Eigenschaftssicht für Spaltenberechnungen enthält die folgenden Registerkarten:

Allgemein

Featurename
Sie müssen einen eindeutigen Namen für das Feature angeben.
Beschreibung
Sie können optional weitere Informationen zum Spaltenberechnungsfeature hinzufügen.

Spaltenberechnung

Spaltenberechnungsfunktion
Sie können die zu verwendende Spaltenberechnungsfunktion in der Dropdown-Liste auswählen.

Diese Funktion wird auf die Werte der zugrunde liegenden Kennzahl angewendet, z. B. den Umsatz einzelner Verkaufstransaktionen, um den zusammengefassten Featurewert des Fokus der Analyse zu generieren.

Nullwerte werden ignoriert. Dies bedeutet, dass sie in einer Summe (SUM) als 0 behandelt werden. Sie werden nicht gezählt, wenn die Spaltenberechnungsfunktion COUNT ist.

Spaltenberechnungsdefinition
Eine Spaltenberechnung kann auf einer einzelnen Spalte oder auf einem Spaltenausdruck basieren.
Auf einer einzelnen Spalte basierend
Wenn Sie die Spaltenberechnung basierend auf einer einzelnen Spalte definieren wollen, können Sie die Spalte in der Liste verfügbarer Spalten auswählen. Sie können die Spalten in einer Eingabetabelle anzeigen, indem Sie das Pluszeichen (+) neben dem Tabellennamen anklicken.

Die ausgewählte Spaltenberechnungsfunktion muss mit dem Datentyp der ausgewählten Spalte kompatibel sein.

Auf einem Spaltenausdruck basierend
Wenn Sie die Spaltenberechnung basierend auf einem Spaltenausdruck definieren möchten, klicken Sie SQL an, um SQL Expression Builder zu öffnen. In SQL Expression Builder können Sie mehrere Spalten auswählen, um einen SQL-Ausdruck zu erstellen.

Die Spaltenberechnungsfunktion muss mit dem Ergebnisdatentyp des Ausdrucks kompatibel sein.

Wenn das Eingabemodell ein importiertes Würfelmodell enthält, muss die Spaltenberechnung basierend auf einer einzelnen Kennzahl oder auf einem Kennzahlausdruck definiert werden.
SQL-Nullwert als Spaltenberechnungsergebnis ersetzen
Wenn die ausgewählte Spalte oder der ausgewählte Spaltenausdruck nur Nullwerte enthält, ist das Ergebnis der Spaltenberechnung null. Das Ergebnis ist ebenfalls null, wenn keine Zeilen für einen Fokuskomponentenwert vorhanden sind. Wenn beispielsweise product (Produkt) und day (Tag) Fokuskomponenten sind und Sie den Gesamtumsatz pro Produkt und Tag berechnen möchten, ist möglicherweise keine Transaktion in der Fakttabelle vorhanden, da das Produkt an dem bestimmten Tag nicht verkauft wurde.

Wenn Ihre Ergebnisse keine Nullwerte enthalten sollen, ersetzen Sie ein Nullergebnis durch den angegebenen Wert. Dies gilt auch für erweiterte Spaltenberechnungen und Teilungen für Spaltenberechnung.

Erweiterte Spaltenberechnung

Die folgenden Typen erweiterter Spaltenberechnung werden unterstützt:

Spaltenberechnung auf bereichsbasiertem gleitendem Fenster
Beim Analysieren von Daten ist eine wichtige Eingabe der Wert eines Features in vergleichbaren früheren oder angrenzenden Zeiträumen.

Wenn Sie z. B. den Umsatz für ein bestimmtes Produkt an einem bestimmten Tag analysieren wollen, kann es hilfreich sein, diesen Wert mit dem durchschnittlichen Umsatz der vorangegangenen Woche zu vergleichen. Sie müssen die folgenden Parameter angeben, um derartige Fenster zu definieren:

Referenzierte Fokuskomponente
Die Fokuskomponente, für die das Fenster berechnet wird.

Sie wählen in der Regel die Fokuskomponente aus, die die Zeitgranularität definiert. In Sonderfällen wollen Sie möglicherweise eine Fokuskomponente auswählen, für die Sie eine aussagekräftige Sortierung definieren können.

Sortierspalten
Sie müssen angeben, wie die Werte in der Fokuskomponente sortiert werden sollen, auf die verwiesen wird.

Die Sortierung basiert standardmäßig auf den Werten der Spalten, die die Fokuskomponente eindeutig definieren. Diese Sortierung ist manchmal nicht korrekt. Wenn z. B. MONTH der Fokus ist, der durch die Spalten YEAR und NAME_OF_MONTH definiert wird, ist die Sortierung alphabetisch, basierend auf den Monatsnamen. Sie vermeiden die alphabetische Sortierung, indem Sie YEAR und MONTH_NUMBER als Sortierspalten verwenden.

Sie können die Sortierspalten ändern, indem Sie Editieren... anklicken, um den Dialog Sortierspalten zu öffnen.

Gehen Sie im Dialog Sortierspalten wie folgt vor:
  • Sie können die Sortierspalten in der Liste verfügbarer Spalten auswählen. Klicken Sie den Rechtspfeil bzw. Linkspfeil an, um die Spalten zwischen den Listen zu verschieben.
  • Sie können eine aufsteigende oder eine absteigende Sortierreihenfolge auswählen, indem Sie die Spalte Sortierreihenfolge anklicken.
  • Klicken Sie Standardanordnung wiederherstellen an, um die Reihenfolge auf die Spalten zurückzusetzen, die die Fokuskomponente definieren, auf die im bereichsbasierten gleitenden Fenster verwiesen wird.

    Wenn Sie den wertebasierten Bereichstyp für das gleitende Fenster angegeben haben, darf die Reihenfolge nur eine einzige numerische Spalte enthalten.

Spaltenberechnungsfunktion
Die ausgewählte Spaltenberechnungsfunktion wird auf die Werte auf der Fokusebene angewendet, wenn das Fenster mehrere Fokuswerte umfasst.

Wählen Sie z. B. AVG aus, um den durchschnittlichen Umsatz der Woche vor dem Fokustag zu berechnen.

Fensteranfang und Fensterende
Die angegebenen Werte für den Fensteranfang und das Fensterende beziehen sich auf den Fokus.

Wenn Sie z. B. day als den Fokus, -7 als Fensteranfang und -1 als Fensterende angeben, umfasst das Fenster die sieben Tage vor dem Fokustag, aber nicht den Fokustag selbst.

Sie können 0 angeben, um in der aktuellen Zeile zu starten bzw. zu enden.

Sie können angeben, dass ein Fenster an einem Ende unbegrenzt ist, indem Sie -∞ oder anklicken.

Bereichstyp
Der Bereichstyp kann zeilenbasiert oder wertebasiert sein.

Wählen Sie den zeilenbasierten Bereichstyp aus, wenn Sie Ihr Fenster um eine feste Anzahl Einträge erweitern wollen. Beispielsweise wird ein Fenster mit einem Bereich von -7 bis -1 über die letzten sieben Tage zusammengefasst, für die in den Fakttabellen ein Eintrag vorhanden ist.

Wählen Sie den wertebasierten Bereichstyp aus, wenn Sie Ihr Fenster um einen festgelegten Bereich Ihrer Dimension erweitern wollen, auch wenn nicht alle Werte in Ihren Daten vorkommen. Beispielsweise wird ein Fenster mit einem Bereich von -7 bis -1 über die letzten sieben Tage unabhängig von Einträgen in den Fakttabellen zusammengefasst.

Spaltenberechnung auf einer Ebene über der Fokusebene
Manchmal müssen Informationen bis zu einer Ebene über der Fokusebene zusammengefasst werden. Wenn Sie z. B. die täglichen Ergebnisse mit dem Wochenumsatz vergleichen wollen, müssen Sie zuerst die Umsatzbeträge für Wochen anstelle von Tagen zusammenfassen.
Sie müssen die folgenden Parameter angeben, um eine Spaltenberechnung der höheren Ebene zu definieren:
Spaltenberechnungsfunktion
Die ausgewählte Funktion wird auf die Werte auf der Fokusebene angewendet.

Wählen Sie z. B. AVG aus, wenn Sie den durchschnittlichen Umsatz der Woche mit dem Fokustag berechnen wollen.

Höhere Spaltenberechnungsebene
Die Ebene, bis zu der Sie Daten zusammenfassen wollen.

Wenn Sie z. B. den durchschnittlichen Umsatz der Woche mit dem Fokustag berechnen wollen, müssen Sie die Wochenebene der Zeitdimension auswählen.

Sie können den Dialog Angabe von Ebenen durch Anklicken von Editieren... öffnen. Im Dialog Angabe von Ebenen können Sie die entsprechende Ebene für eine Fokuskomponente angeben, indem Sie das Pluszeichen (+) anklicken, die gewünschte Ebene auswählen und den Rechtspfeil anklicken.

Sie können Daten für höhere Ebenen von mehreren Fokuskomponenten zusammenfassen. Sie können Daten auch für alle Werte einer Fokuskomponente zusammenfassen, indem Sie Gesamtebene für eine bestimmte Dimension auswählen.

Ergebnisspalte

Sie müssen einen Namen für die Ergebnisspalte in der Ausgabetabelle definieren. Der Name muss ein gültiger Db2-Spaltenname sein. Der Name der Ergebnisspalte wird standardmäßig vom Namen der Spaltenberechnung abgeleitet.

Wenn Sie eine Spaltenberechnung umbenennen, wird der Name der Ergebnisspalte ebenfalls geändert. Wenn Sie den Namen der Ergebnisspalte in den Spaltenberechnungseigenschaften ändern, wird der Name der Spaltenberechnung nicht geändert.

Sie können den Standarddatentyp der Ergebnisspalten überschreiben. Die verfügbaren Datentypen werden in der Dropdown-Liste angezeigt.

Der Datentyp muss mit dem Ergebnistyp des definierten SQL-Ausdrucks kompatibel sein. Wenn Sie ausgewählt haben, dass die Werte als Prozentsätze zusammengefasst werden sollen, muss der Datentyp numerisch sein.



Feedback | Literaturübersicht