Visión general (mandato RBF)
Las redes neuronales son una herramienta de minería de datos para encontrar patrones desconocidos en bases de datos. Las redes neuronales se pueden utilizar para tomar decisiones empresariales previendo la demanda de un producto en función del precio y otras variables o categorizando a los clientes en función de los hábitos de compra y las características demográficas. El procedimiento RBF se ajusta a una red neuronal de función de base radial, que es una red de aprendizaje supervisada y de avance con una capa de entrada, una capa oculta denominada capa de función de base radial y una capa de salida. La capa oculta transforma los vectores de entrada en funciones de base radial. Al igual que el procedimiento MLP (perceptrón multicapa), el procedimiento RBF realiza la predicción y la clasificación.
El procedimiento RBF entrena la red en dos etapas:
- El procedimiento determina las funciones de base radial utilizando métodos de agrupación en clúster. Se determina el centro y el ancho de cada funcion de base radial.
- El procedimiento estima las ponderaciones sinápticas dadas las funciones de base radial. La función de error de suma de cuadrados con función de activación de identidad para la capa de salida se utiliza tanto para la predicción como para la clasificación. La regresión de mínimos cuadrados ordinarios se utiliza para minimizar el error de suma de cuadrados.
Debido a este enfoque de formación en dos etapas, la red de RBF se entrena en general mucho más rápido que MLP.
Opciones
Predicción o clasificación. Se pueden especificar una o más variables dependientes, y pueden ser de escala, categóricas o una combinación. Si una variable dependiente tiene un nivel de medición de escala, la red neuronal predice valores continuos que se aproximan al valor "verdadero" de alguna función continua de los datos de entrada. Si una variable dependiente es categórica, la red neuronal se utiliza para clasificar los casos en la categoría "mejor" basándose en los predictores de entrada.
Reescalado. RBF opcionalmente, rescales covariables (predictores con nivel de medición de escala) o variables dependientes de escala antes de entrenar la red neuronal. Hay tres opciones de cambio de escala: estandarización, normalización y normalización ajustada.
Datos de entrenamiento, pruebas y reserva. RBF divide opcionalmente el conjunto de datos en datos de entrenamiento, prueba y reserva. La red neuronal se entrena utilizando los datos de entrenamiento. Los datos de prueba se pueden utilizar para determinar el "mejor" número de unidades ocultas para la red. Los datos de reserva están completamente excluidos del proceso de formación y se utilizan para la evaluación independiente de la red final.
Selección de arquitectura. El procedimiento RBF crea una red neuronal con una capa oculta y puede realizar una selección de arquitectura automática para encontrar el "mejor" número de unidades ocultas. De forma predeterminada, el procedimiento calcula automáticamente un rango razonable y encuentra el "mejor" número dentro del rango. Sin embargo, puede alterar temporalmente estos cálculos proporcionando su propio rango o un número específico de unidades ocultas.
Funciones de activación. Las unidades de la capa oculta pueden utilizar la función de base radial normalizada o la función de base radial ordinaria.
Valores perdidos. El procedimiento RBF tiene una opción para tratar los valores perdidos del usuario de variables categóricas como válidos. Los valores perdidos del usuario de las variables de escala siempre se tratan como no válidos.
Salida. RBF muestra los resultados de la tabla dinámica, pero ofrece una opción para suprimir la mayoría de dichos resultados. La salida gráfica incluye un diagrama de red (predeterminado) y un número de gráficos opcionales: pronosticados por valores observados, residuales por valores pronosticados, curvas ROC (Receiver Operating Característico), ganancias acumuladas, elevación e importancia de variable independiente. El procedimiento también guarda opcionalmente los valores pronosticados en el conjunto de datos activo. Los vectores de centro y ancho de unidad ocultos y las estimaciones de peso sináptico se pueden guardar en archivos XML.
Especificación básica
La especificación básica es el mandato RBF seguido de una o más variables dependientes, la palabra clave BY y uno o más factores, y la palabra clave WITH y una o más covariables.
De forma predeterminada, el procedimiento RBF estandariza las covariables y escala las variables dependientes y selecciona una muestra de entrenamiento antes de entrenar la red neuronal. La selección automática de arquitectura se utiliza para encontrar la "mejor" arquitectura de red neuronal. Los valores perdidos del usuario se excluyen y se visualiza la salida de tabla dinámica predeterminada.
Reglas de la sintaxis
- Todos los submandatos son opcionales.
- Los subcomandos se pueden especificar en cualquier orden.
- Sólo se permite una única instancia de cada submandato.
- Se produce un error si se especifica una palabra clave más de una vez dentro de un subcomando.
- Son necesarios paréntesis, signos de igual y barras inclinadas que se muestran en el gráfico de sintaxis.
- El nombre de mandato, los nombres de submandato y las palabras clave deben escribirse en su totalidad.
- No se permiten subcomandos vacíos.
- Cualquier variable de división definida en el comando
SPLIT FILEno se puede utilizar como variable dependiente, factor, covariable o variable de partición.
Limitaciones
Las ponderaciones de frecuencia especificadas en el mandato WEIGHT se ignoran con un aviso mediante el procedimiento RBF .
Variables categóricas
El procedimiento RBF recodifica temporalmente los predictores categóricos y las variables dependientes utilizando una codificaciónc para la duración del procedimiento. Si hay c categorías de una variable, la variable se almacena como vectores c, con la primera categoría denotada (1,0, ..., 0), la siguiente categoría, (0,1,0, ..., 0), ..., y la categoría final (0,0, ..., 0, 1).
Debido a la codificación uno-de-c , el número total de unidades de entrada es el número de predictores de escala más el número de categorías en todos los predictores categóricos. Sin embargo, a diferencia del perceptrón multicapa (MLP), este esquema de codificación no aumenta el número de ponderaciones sintapíticas para predictores categóricos y, por lo tanto, no debe aumentar significativamente el tiempo de entrenamiento.
Toda la codificación de uno dec se basa en los datos de entrenamiento, incluso si se ha definido una muestra de prueba o reservada (consulte PARTITION Subcommand (RBF command) ). Por lo tanto, si las muestras de prueba o reservadas contienen casos con categorías de predictores que no están presentes en los datos de entrenamiento, el procedimiento o en la puntuación no utiliza esos casos. De este modo, si las muestras reservadas o de comprobación contienen casos con categorías de variables dependientes que no están presentes en los datos de entrenamiento, esos casos no son utilizados por el procedimiento o en la puntuación.
replicación de resultados
El procedimiento RBF utiliza la generación de números aleatorios durante la asignación aleatoria de particiones. Para reproducir los mismos resultados aleatorizados en el futuro, utilice el mandato SET para establecer el valor de inicialización para el generador de números aleatorios antes de cada ejecución del procedimiento RBF .
RBF Los resultados dependen también del orden de los datos porque se utiliza el algoritmo de agrupación en clústeres de dos fases para determinar las funciones de base radial. Para minimizar los efectos de orden de datos, ordene aleatoriamente los casos antes de ejecutar el procedimiento RBF . Para comprobar la estabilidad de una solución dada, puede obtener varias soluciones distintas con los casos ordenados en distintos órdenes aleatorios. En situaciones con tamaños de archivo extremadamente grandes, se pueden llevar a cabo varias ejecuciones con una muestra de casos ordenados con distintos órdenes aleatorios.
En resumen, si desea replicar exactamente los resultados de RBF en el futuro, utilice el mismo valor de inicialización para el generador de números aleatorios y el mismo orden de datos, además de utilizar los mismos valores de procedimiento de RBF .