Proprietà di xgboosttreenode

Icona nodo XGBoost TreeXGBoost Tree© rappresenta un'implementazione avanzata di un algoritmo gradient boosting con un modello struttura ad albero come modello di base. Gli algoritmi Boosting rilevano in modo interattivo i classificatori deboli e li aggiungono ai classificatori forti finali. XGBoost Tree è molto flessibile e fornisce molti parametri che possono essere opprimenti per la maggior parte degli utenti, quindi il nodo XGBoost Tree in SPSS Modeler espone le funzioni principali e i parametri comunemente utilizzati. Il nodo è implementato in Python.

Tabella 1. proprietà xgboosttreenode
xgboosttreenode proprietà Tipo di dati Descrizione proprietà
custom_fields booleano Questa opzione indica al nodo di utilizzare le informazioni sui campi specificate qui al posto di quelle date in un qualsiasi nodo Tipo upstream. Dopo aver selezionato questa opzione, specificare i campi come richiesto.
target campo I campi obiettivo.
inputs campo I campi di input.
tree_method Stringa Il metodo della struttura ad albero per la creazione del modello. I valori possibili sono auto, exacto approx. Il valore predefinito è auto.
num_boost_round intero Il numero di iterazioni boost per la creazione del modello. Specificare un valore compreso tra 1 e 1000. Il valore predefinito è 10.
max_depth intero La profondità massima per l'espansione della struttura ad albero. Specificare il valore 1 o un valore maggiore. L'impostazione predefinita è 6.
min_child_weight Doppia Il peso minimo figlio per l'espansione della struttura ad albero. Specificare il valore 0 o un valore maggiore. L'impostazione predefinita è 1.
max_delta_step Doppia Il passo delta massimo per l'espansione della struttura ad albero. Specificare il valore 0 o un valore maggiore. L'impostazione predefinita è 0.
objective_type Stringa Il tipo di obiettivo per l'attività di apprendimento. I valori possibili sonoreg:linear, reg:logistic, reg:gamma, reg:tweedie,count:poisson,rank:pairwise, binary:logistico multi. Notare che per gli obiettivi indicatore, è possibile utilizzare solo binary:logistic o multi. Se si utilizza multi, il risultato del punteggio mostrerà i tipi di obiettivo XGBoost multi:softmax e multi:softprob.
early_stopping Booleano Indica se utilizzare la funzione di arresto anticipato. Il valore predefinito è False.
early_stopping_rounds intero Gli errori di convalida devono diminuire ad ogni iterazione di interruzione anticipata per proseguire con l'addestramento. Il valore predefinito è 10.
evaluation_data_ratio Doppia Rotazione dei dati di input per gli errori di convalida. Il valore predefinito è 0.3.
random_seed intero Il seed random. Qualsiasi numero compreso tra 0 e 9999999. Il valore predefinito è 0.
sample_size Doppia Il campione secondario per il controllo del sovradattamento. Specificare un valore compreso tra 0.1 e 1.0. Il valore predefinito è 0.1.
eta Doppia Il valore eta per il controllo del sovradattamento. Specificare un valore compreso tra 0 e 1. Il valore predefinito è 0.3.
gamma Doppia Il valore gamma per il controllo del sovradattamento. Specificare 0 o un valore maggiore. L'impostazione predefinita è 6.
col_sample_ratio Doppia Il campione di colonne in base alla struttura ad albero per il controllo del sovradattamento. Specificare un valore compreso tra 0.01 e 1. Il valore predefinito è 1.
col_sample_level Doppia Il campione di colonne in base al livello per il controllo del sovradattamento. Specificare un valore compreso tra 0.01 e 1. Il valore predefinito è 1.
lambda Doppia Il valore lambda per il controllo del sovradattamento. Specificare 0 o un valore maggiore. L'impostazione predefinita è 1.
alpha Doppia Il valore alpha per il controllo del sovradattamento. Specificare 0 o un valore maggiore. L'impostazione predefinita è 0.
scale_pos_weight Doppia La ponderazione per la gestione dei dataset sbilanciati. Il valore predefinito è 1.
use_HPO