Subcomando PARTITION (comando MLP)

El subcomando PARTITION especifica el método de particionamiento del conjunto de datos activo en muestras de entrenamiento, pruebas y reservadas. La muestra de entrenamiento comprende los registros de datos utilizados para entrenar la red neuronal. La muestra de prueba es un conjunto independiente de registros de datos utilizados para realizar un seguimiento del error de predicción durante el entrenamiento con el fin de evitar el sobreentrenamiento. La muestra reservada es otro conjunto independiente de registros de datos utilizados para evaluar la red neuronal final.

  • La partición se puede definir especificando la proporción de casos asignados aleatoriamente a cada muestra (entrenamiento, pruebas y reserva) o mediante una variable que asigna cada caso a la muestra de entrenamiento, prueba o reserva.
  • Si no se especifica el subcomando PARTITION , la partición predeterminada asigna aleatoriamente el 70% de los casos a la muestra de entrenamiento, el 30% a la muestra de comprobación y el 0% a la muestra reservada. Si desea especificar una asignación aleatoria diferente, debe especificar nuevos valores para las palabras clave TRAINING, TESTINGy HOLDOUT . El valor especificado en cada palabra clave proporciona el número relativo de casos en el conjunto de datos activo que se asignará a cada muestra. Por ejemplo, /PARTITION TRAINING = 50 TESTING = 30 HOLDOUT = 20 es equivalente a /PARTITION TRAINING = 5 TESTING = 3 HOLDOUT = 2; ambos subcomandos asignan aleatoriamente el 50% de los casos a la muestra de entrenamiento, el 30% a la muestra de prueba y el 20% a la muestra reservada.
  • Si desea poder reproducir los resultados basándose en las palabras clave TRAINING, TESTINGy HOLDOUT más adelante, utilice el mandato SET para establecer el valor de inicialización para el generador de números aleatorios antes de ejecutar el procedimiento MLP .
  • Tenga en cuenta la relación entre el cambio de escala y el particionamiento. Consulte el tema Submandato RESCALE (mandato MLP) para obtener más información.
  • Todo el particionamiento se realiza después de la supresión por lista de los casos con datos no válidos para cualquier variable utilizada por el procedimiento. Consulte MISSING Subcomando (comando MLP) para obtener detalles sobre los datos válidos y no válidos.

Palabra clave TRAINING

La palabra clave TRAINING especifica el número relativo de casos en el conjunto de datos activo que se asignará aleatoriamente a la muestra de entrenamiento. El valor debe ser un entero mayor que 0. El valor predeterminado (si no se especifica el submandato PARTITION ) es 70.

Palabra clave TESTING

La palabra clave TESTING especifica el número relativo de casos en el conjunto de datos activo para asignar aleatoriamente a la muestra de prueba. El valor debe ser un entero mayor que 0. El valor predeterminado (si no se especifica el submandato PARTITION ) es 30.

Palabra clave HOLDOUT

La palabra clave HOLDOUT especifica el número relativo de casos en el conjunto de datos activo que se asignará aleatoriamente a la muestra reservada. El valor debe ser un entero mayor que 0. El valor predeterminado (si no se especifica el submandato PARTITION ) es 0.

Palabra clave VARIABLE

La palabra clave VARIABLE especifica una variable que asigna cada caso del conjunto de datos activo a la muestra de entrenamiento, prueba o reserva. Los casos con un valor positivo en la variable se asignan a la muestra de entrenamiento, los casos con un valor de 0 a la muestra de prueba y los casos con un valor negativo a la muestra reservada. Los casos con un valor perdido del sistema se excluirán del análisis. (Los valores perdidos del usuario para la variable de partición siempre se tratan como válidos.)

La variable no puede ser la variable dependiente ni ninguna variable especificada en las listas de factores o covariables de la línea de mandatos. La variable debe ser numérica.