Subcomando PARTITION (comando MLP)
El subcomando PARTITION especifica el método de particionamiento del conjunto de datos activo en muestras de entrenamiento, pruebas y reservadas. La muestra de entrenamiento comprende los registros de datos utilizados para entrenar la red neuronal. La muestra de prueba es un conjunto independiente de registros de datos utilizados para realizar un seguimiento del error de predicción durante el entrenamiento con el fin de evitar el sobreentrenamiento. La muestra reservada es otro conjunto independiente de registros de datos utilizados para evaluar la red neuronal final.
- La partición se puede definir especificando la proporción de casos asignados aleatoriamente a cada muestra (entrenamiento, pruebas y reserva) o mediante una variable que asigna cada caso a la muestra de entrenamiento, prueba o reserva.
- Si no se especifica el subcomando
PARTITION, la partición predeterminada asigna aleatoriamente el 70% de los casos a la muestra de entrenamiento, el 30% a la muestra de comprobación y el 0% a la muestra reservada. Si desea especificar una asignación aleatoria diferente, debe especificar nuevos valores para las palabras claveTRAINING,TESTINGyHOLDOUT. El valor especificado en cada palabra clave proporciona el número relativo de casos en el conjunto de datos activo que se asignará a cada muestra. Por ejemplo,/PARTITION TRAINING = 50 TESTING = 30 HOLDOUT = 20es equivalente a/PARTITION TRAINING = 5 TESTING = 3 HOLDOUT = 2; ambos subcomandos asignan aleatoriamente el 50% de los casos a la muestra de entrenamiento, el 30% a la muestra de prueba y el 20% a la muestra reservada. - Si desea poder reproducir los resultados basándose en las palabras clave
TRAINING,TESTINGyHOLDOUTmás adelante, utilice el mandatoSETpara establecer el valor de inicialización para el generador de números aleatorios antes de ejecutar el procedimientoMLP. - Tenga en cuenta la relación entre el cambio de escala y el particionamiento. Consulte el tema Submandato RESCALE (mandato MLP) para obtener más información.
- Todo el particionamiento se realiza después de la supresión por lista de los casos con datos no válidos para cualquier variable utilizada por el procedimiento. Consulte MISSING Subcomando (comando MLP) para obtener detalles sobre los datos válidos y no válidos.
Palabra clave TRAINING
La palabra clave TRAINING especifica el número relativo de casos en el conjunto de datos activo que se asignará aleatoriamente a la muestra de entrenamiento. El valor debe ser un entero mayor que 0. El valor predeterminado (si no se especifica el submandato PARTITION ) es 70.
Palabra clave TESTING
La palabra clave TESTING especifica el número relativo de casos en el conjunto de datos activo para asignar aleatoriamente a la muestra de prueba. El valor debe ser un entero mayor que 0. El valor predeterminado (si no se especifica el submandato PARTITION ) es 30.
Palabra clave HOLDOUT
La palabra clave HOLDOUT especifica el número relativo de casos en el conjunto de datos activo que se asignará aleatoriamente a la muestra reservada. El valor debe ser un entero mayor que 0. El valor predeterminado (si no se especifica el submandato PARTITION ) es 0.
Palabra clave VARIABLE
La palabra clave VARIABLE especifica una variable que asigna cada caso del conjunto de datos activo a la muestra de entrenamiento, prueba o reserva. Los casos con un valor positivo en la variable se asignan a la muestra de entrenamiento, los casos con un valor de 0 a la muestra de prueba y los casos con un valor negativo a la muestra reservada. Los casos con un valor perdido del sistema se excluirán del análisis. (Los valores perdidos del usuario para la variable de partición siempre se tratan como válidos.)
La variable no puede ser la variable dependiente ni ninguna variable especificada en las listas de factores o covariables de la línea de mandatos. La variable debe ser numérica.