Utilizzo delle funzioni semplici

Per i calcoli in, è possibile digitare o incollare una semplice funzione come parte dei calcoli. Devi capire come scrivere la funzione semplice prima di aggiungelo.

Una funzione semplice è un blocco di codice Python . Ha un dataframe e un dizionario di parametri come input. A differenza delle funzioni personalizzate, le funzioni semplici producono un singolo elemento dati come output.

A volte, è possibile scrivere un'espressione per eseguire un calcolo di base piuttosto che una semplice funzione. Utilizzare una funzione semplice se si desidera aggiungere più righe di codice o se si desidera aggiungere qualche logica di controllo al proprio codice.

Utilizzare PythonFunction dal catalogo delle funzioni per aggiungere una semplice funzione.

Per le metriche di dati in streaming, utilizza la sintassi Python . È possibile utilizzare la sintassi pandas per le metriche dei dati batch.

Scrittura di funzioni semplici

Le metriche dei dati in batch utilizzano la libreria pandas. Per ulteriori informazioni, vedere Lavorare con i calcoli. Prima di scrivere espressioni per metriche di dati batch, acquisire familiarità con le strutture dei dati, le operazioni e la sintassi nei panda.

Nota: Quando si inserisce una funzione semplice in, non si sta scrivendo una nuova funzione Python. La semplice funzione è invece un parametro di input ad una funzione incorporata. È necessario personalizzare di conseguenza la sintassi del blocco del codice.

Esempio

Un responsabile delle operazioni sta tenendo un occhio attento alle prestazioni di un braccio robotico appena introdotto. Viene calcolata la distanza percorsa da ciascun braccio robotico durante il test. Il gestore delle operazioni chiede che i valori di outlier vengano contrassegnati per ogni braccio robotico per ulteriori analisi. Il manager è interessato a distanze troppo elevate.

Un data scientist definisce una nuova metrica is_distance_high come segue:

is_distance_high = True where distance > threshold

Lo scienziato dei dati definisce la soglia come segue:

threshold = (mean(distance) + 2) * std(distance)

Un analista scrive la seguente semplice funzione per il calcolo:

def f(df,parameters = None):
    import numpy as np
    threshold = df['distance'].mean() + 2 * df['distance'].std()
    output = np.where(df['distance']>threshold,1,0)
    return output

Prima che l'analista possa incollare il blocco di codice in, la funzione deve rispettare queste regole:

  • La funzione deve essere denominata f.
  • La funzione deve accettare un dataframe (df) e i parametri come input.
  • La restituzione della funzione deve restituire un frame di dati, una serie, un array NumPy o un valore scalare come output.

L'analista aggiunge un nuovo calcolo utilizzando PythonFunction dal catalogo. Nei campi di input, l'analista seleziona distance e incolla il blocco di codice nel campo di input function_code . L'analista etichetta il parametro di output come is_distance_high.

Verifica delle funzioni semplici

Testate le vostre semplici funzioni nel vostro ambiente prima di utilizzarle in.

Utilizzare un negozio di modelli di file per persistere una funzione localmente mentre si sta testando.

Ulteriori informazioni