Establecer el rol de campo

El rol de un campo especifica cómo se utiliza en la generación de modelos; por ejemplo, si un campo es de entrada o si es un campo objetivo (lo que se desea predecir).

Nota: Los roles Partición, Frecuencia e ID de registro solo se pueden aplicar a un único campo.

Éstos son los roles disponibles:

Entrada. El campo se utiliza como una entrada en el aprendizaje de las máquinas (un campo predictor).

Objetivo. El campo se utiliza como un campo de salida o un campo objetivo para el aprendizaje de las máquinas (uno de los campos que el modelo intentará predecir).

Ambas. El campo se utilizará como campo de entrada y de salida por el nodo Apriori. El resto de los nodos de modelado omiten el campo.

Ninguno. El aprendizaje de las máquinas omitirá el campo. Los campos cuyo nivel de medición se haya definido a Sin tipo se establecen automáticamente en Ninguna en la columna Rol.

Partición. Indica un campo utilizado para dividir los datos en muestras independientes para entrenamiento, comprobación y validación (opcional). El campo debe ser un tipo de conjunto instanciado con dos o más valores positivos (tal y como se define en el cuadro de diálogo Valores de campos). El primer valor representa la muestra de entrenamiento, el segundo representa la muestra de comprobación y el tercero (si está presente) representa la muestra de validación. Cualquier valor adicional se omite y los campos de marcas no se pueden usar. Tenga en cuenta que para utilizar la partición en un análisis, ésta debe estar activada en la pestaña Opciones de modelo en el nodo de análisis o de generación de modelos adecuado. Los registros con valores nulos para el campo de partición se excluyen del análisis cuando la partición está activada. Si se han definido varios campos de partición en la ruta, se deberá especificar un campo de partición simple en la pestaña Campos en todos los nodos de modelado correspondientes. Si no existe ningún campo apropiado en los datos, puede crear uno usando un nodo Partición o un nodo Derivar. Consulte Nodo Partición para obtener más información.

Dividir. (Campos nominales, ordinales o marca únicamente) Especifica que se creará un modelo para cada valor posible del campo.

Frecuencia. (Campos numéricos únicamente) La configuración de este rol permite que se pueda utilizar el valor del campo como un factor de ponderación de frecuencia para el registro. Esta característica es admitida únicamente por los modelos Árbol C&, CHAID, QUEST y lineales; el resto de los nodos ignoran este rol. La ponderación de frecuencias está activada por la opción Utilizar ponderaciones de frecuencia en la pestaña Campos de los nodos de modelado que admiten la característica.

ID de registro. El campo se utilizará como el identificador de registros exclusivo. La mayoría de los nodos ignoran esta característica; sin embargo es compatible con los modelos lineales y es necesaria para los nodos de minería interna de bases de datos de IBM Netezza.