Nodo Regressione
La regressione lineare è una tecnica statistica comune che consente di classificare i record in base ai valori dei campi di input numerici. La regressione lineare rappresenta una linea retta o un piano che riduce al minimo le differenze tra i valori di output previsti e quelli effettivi.
Requisiti. In un modello di regressione è possibile utilizzare solo
campi numerici. È necessario disporre esattamente di un campo obiettivo (con il ruolo impostato su Target) e di uno o più predittori (con il ruolo impostato su Input). I campi con ruolo Both o None vengono ignorati, così come i campi non numerici. Se necessario, i campi non numerici possono essere ricodificati utilizzando un nodo Nuovo campo.
Efficacia. I modelli di regressione sono relativamente semplici e danno una formula matematica di facile interpretazione per la generazione delle previsioni. La creazione di modelli di regressione è una procedura statistica nota da tempo, pertanto le proprietà di questi modelli non presentano difficoltà di comprensione. Inoltre, in genere l'addestramento dei modelli di regressione è rapido. Il nodo Regressione fornisce metodi di selezione automatica dei campi per eliminare dall'equazione i campi di input non significativi.
yes/no o churn/don't churn, è possibile utilizzare la regressione logistica come alternativa. La regressione logistica inoltre supporta gli input non numerici, eliminando la necessità di ricodificare questi campi. Per ulteriori informazioni, vedi Nodo logistico .