Nodo Lineal

La regresión lineal es una técnica de estadístico común para clasificar los registros en función los valores de los campos de entrada numérica. La regresión lineal se ajusta a una línea recta o una superficie que minimiza las discrepancias entre los valores de resultados predichos y reales.

Requisitos. Sólo se pueden utilizar campos numéricos en un modelo de regresión lineal. Debe tener exactamente un campo objetivo (con el rol definido a Objetivo) y uno o más predictores (con el rol definido a Entrada). Los campos con un rol Ambos o Ninguno se ignoran, ya que no son campos numéricos. (Si es necesario, los campos no numéricos se pueden recodificar mediante un nodo Derivar.)

Puntos fuertes. Los modelos de regresión lineal son relativamente simples y proporcionan una fórmula matemática fácil de interpretar para la creación de predicciones. Debido a que la regresión lineal es un procedimiento estadístico consolidado desde hace tiempo, las propiedades de estos modelos se conocen con mucho detalle. Normalmente, los modelos lineales se entrenan muy rápidamente. El nodo Lineal proporciona métodos para la selección automática de campos con el fin de eliminar de la ecuación los campos de entrada no significativos.

Nota: en los casos en que el campo objetivo es categórico en lugar de ser un rango continuo, como sí/no o abandonar/no abandonar, puede utilizarse la regresión logística como una alternativa. La regresión logística también admite las entradas no numéricas, por lo que no es necesario recodificar estos campos. Consulte el tema Nodo Logística para obtener más información. Las