Einfache Funktionen verwenden

Für Ihre Berechnungen in, können Sie eine einfache Funktion als Teil Ihrer Berechnungen eingeben oder einfügen. Sie müssen verstehen, wie die einfache Funktion geschrieben wird, bevor Sie sie hinzufügen.

Eine einfache Funktion ist ein Python -Codeblock. Es verfügt über einen Datenrahmen und ein Verzeichnis von Parametern als Eingaben. Im Gegensatz zu angepassten Funktionenerzeugen einfache Funktionen ein einzelnes Datenelement als Ausgabe.

Gelegentlich können Sie eine einfache Berechnung auch mit einem Ausdruck anstatt einer einfachen Funktion ausführen. Verwenden Sie eine einfache Funktion, wenn Sie mehrere Zeilen Code hinzufügen oder Ihrem Code Steuerlogik hinzufügen möchten.

Verwenden Sie PythonFunction aus dem Funktionskatalog, um eine einfache Funktion hinzuzufügen.

Verwenden Sie für Streaming-Datenmetriken die Syntax Python . Sie können die Pandas-Syntax für Stapeldatenmetriken verwenden.

Einfache Funktionen schreiben

Batch-Datenmetriken verwenden die Pandas-Bibliothek. Weitere Informationen finden Sie unter Mit Berechnungen arbeiten. Bevor Sie Ausdrücke für Stapeldatenmetriken schreiben, machen Sie sich mit Datenstrukturen, Operationen und Syntax in Pandas vertraut.

Hinweis: Wenn Sie eine einfache Funktion in eingeben, schreiben Sie keine neue Python Funktion. Die einfache Funktion wird vielmehr als Eingabeparameter für eine integrierte Funktion verwendet. Sie müssen die Syntax Ihres Codeblocks entsprechend anpassen.

Beispiel

Ein Betriebsleiter beobachtet die Leistung eines neu eingeführten Roboterarms genau. Die von jedem Roboterarm während der Tests zurückgelegte Entfernung wird berechnet. Der Betriebsleiter möchte, dass Ausreißerwerte der einzelnen Roboterarme zur weiteren Analyse markiert werden. Der Betriebsleiter interessiert sich für Entfernungen, die zu groß sind.

Ein Data-Scientist definiert eine neue is_distance_high -Metrik wie folgt:

is_distance_high = True where distance > threshold

Der Data-Scientist definiert den Schwellenwert wie folgt:

threshold = (mean(distance) + 2) * std(distance)

Ein Analyst schreibt die folgende einfache Funktion für die Berechnung:

def f(df,parameters = None):
    import numpy as np
    threshold = df['distance'].mean() + 2 * df['distance'].std()
    output = np.where(df['distance']>threshold,1,0)
    return output

Bevor der Analytiker den Codeblock in einfügen kann, muss die Funktion diese Regeln einhalten:

  • Die Funktion muss den Namen f haben.
  • Die Funktion muss einen Datenrahmen (df) und Parameter als Eingabe akzeptieren.
  • Die Funktion muss als Ausgabe einen Datenrahmen (DataFrame), eine Zeitreihe (Series), ein NumPy-Array oder einen skalaren Wert zurückgeben.

Der Analyst fügt mithilfe von PythonFunction eine neue Berechnung aus dem Katalog hinzu. In den Eingabefeldern wählt der Analyst distance aus und fügt den Codeblock in das Eingabefeld function_code ein. Der Analyst kennzeichnet den Ausgabeparameter als is_distance_high.

Einfache Funktionen testen

Testen Sie Ihre einfache Funktion in Ihrer eigenen Umgebung, bevor Sie sie in.

Verwenden Sie einen Dateimodellspeicher, um eine Funktion lokal als persistent zu definieren, während Sie testen.

Weitere Informationen