Función de base radial

El procedimiento Función de base radial (RBF) genera un modelo predictivo para una o más variables dependientes (de destino) basado en los valores de las variables predictoras.

Ejemplo. Un proveedor de telecomunicaciones ha segmentado su base de clientes por patrones de uso del servicio, clasificando a los clientes en cuatro grupos. Una red RBF que utiliza los datos demográficos para pronosticar la pertenencia a los grupos permite a la compañía personalizar las ofertas para cada uno de los posibles clientes.

Consideraciones sobre los datos

Variables dependientes. Las variables dependientes pueden ser:

  • Nominal. Una variable puede ser tratada como nominal cuando sus valores representan categorías que no obedecen a una clasificación intrínseca. Por ejemplo, el departamento de la compañía en el que trabaja un empleado. Algunos ejemplos de variables nominales son: región, código postal o confesión religiosa.
  • Ordinal. Una variable puede ser tratada como ordinal cuando sus valores representan categorías con alguna clasificación intrínseca. Por ejemplo, los niveles de satisfacción con un servicio, que abarquen desde muy insatisfecho hasta muy satisfecho. Entre los ejemplos de variables ordinales se incluyen escalas de actitud que representan el grado de satisfacción o confianza y las puntuaciones de evaluación de las preferencias.
  • Escala. Una variable puede tratarse como escala (continua) cuando sus valores representan categorías ordenadas con una métrica con significado, por lo que son adecuadas las comparaciones de distancia entre valores. Son ejemplos de variables de escala: la edad en años y los ingresos en dólares.

    El procedimiento supone que el nivel de medición adecuado se ha asignado a todas las variables dependientes, aunque puede cambiar temporalmente el nivel de medición para una variable si pulsa el botón derecho la variable en la lista de variables de origen y selecciona un nivel de medición en el menú emergente. Para cambiar permanentemente el nivel de medición de una variable, consulte Nivel de medición de variable.

Un icono situado junto a cada variable de la lista de variables identifica el nivel de medición y el tipo de datos.

Tabla 1. Iconos de nivel de medición
  Numérico Serie Fecha Hora
Escala (Continuo)
Icono de escala
n/d
Icono de fecha de escala
Icono de tiempo de escala
Ordinal
Icono ordinal
Icono de serie ordinal
Icono de fecha ordinal
Icono de hora ordinal
Nominal
Icono nominal
Icono Cadena nominal
Icono de fecha nominal
Icono de hora nominal

Variables predictoras. Los predictores se pueden especificar como factores (categóricos) o covariables (de escala).

Codificación de la variable categórica. El procedimiento recodifica temporalmente predictores categóricos y variables dependientes utilizando la codificación "una de c" para todo el procedimiento. Si hay categorías c de una variable, la variable se almacena como vectores c, con la primera categoría denotada (1,0, ..., 0), la siguiente categoría (0,1,0, ..., 0), ..., y la categoría final (0,0, ..., 0, 1).

Este esquema de codificación incrementa el número de ponderaciones sinápticas y puede dar como resultado un entrenamiento más lento, pero los métodos de codificación más "compactos" normalmente conducen a redes neuronales con un peor ajuste. Si el entrenamiento de la red avanza muy lentamente, pruebe a reducir el número de categorías en los predictores categóricos combinando categorías similares o eliminando los casos que tengan categorías extremadamente raras.

Toda la codificación de una dec se basa en los datos de entrenamiento, incluso si se define una muestra de prueba o reservada (consulte Particiones (Función de base radial)). De este modo, si las muestras reservadas o de comprobación contienen casos con categorías de predictores que no están presentes en los datos de entrenamiento, esos casos no son utilizados por el procedimiento o en la puntuación. De este modo, si las muestras reservadas o de comprobación contienen casos con categorías de variables dependientes que no están presentes en los datos de entrenamiento, esos casos no son utilizados por el procedimiento o en la puntuación.

Reescalado. De forma predeterminada, se cambia la escala de las covariables y las variables dependientes de escala para mejorar el entrenamiento de la red. Todo el cambio de escala se realiza basándose en los datos de entrenamiento, incluso si se ha definido una muestra de prueba o reserva (consulte Particiones (Función de base radial)). Es decir, dependiendo del tipo de cambio de escala, la media, la desviación estándar, el valor mínimo o el valor máximo de una covariable o variable dependiente se calculan utilizando sólo los datos de entrenamiento. Si especifica una variable para definir particiones, es importante que estas covariables o variables dependientes tengan distribuciones similares en todas las muestras reservadas, de entrenamiento o comprobación. Utilice, por ejemplo, el procedimiento Explorar para examinar las distribuciones entre particiones.

Ponderaciones de frecuencia. Este procedimiento ignora las ponderaciones de frecuencia.

Replicación de los resultados. Si desea replicar exactamente sus resultados, utilice el mismo valor de inicialización para el generador de números aleatorios y el mismo orden de datos, además de utilizar la misma configuración del procedimiento. A continuación se incluyen más detalles sobre este tema:

  • Generación de números aleatorios. El procedimiento utiliza la generación de números aleatorios durante la asignación de particiones. Para reproducir los mismos resultados aleatorios en el futuro, utilice el mismo valor de inicialización para el generador de números aleatorios antes de cada ejecución del procedimiento Función de base radial. Consulte el tema Generadores de números aleatorios para obtener más información.
  • Orden de casos. Los resultados dependen también del orden de los datos porque se utiliza el algoritmo de agrupación en clústeres de dos fases para determinar las funciones de base radial. Consulte el tema TwoStep Análisis de clústeres para obtener más información.

    Para minimizar los efectos del orden, ordene los casos aleatoriamente. Para comprobar la estabilidad de una solución dada, puede obtener varias soluciones distintas con los casos ordenados en distintos órdenes aleatorios. En situaciones con tamaños de archivo extremadamente grandes, se pueden llevar a cabo varias ejecuciones con una muestra de casos ordenados con distintos órdenes aleatorios.

Creación de una red de función de base radial

Esta característica requiere la opción Redes neuronales.

En los menús seleccione:

Analizar > Redes neuronales > Base radial Función ...

Nota: Los campos resaltados en rojo son obligatorios. Los botones Pegar y Aceptar se activan después de introducir valores válidos en todos los campos obligatorios.
  1. Seleccione al menos una variable dependiente.
  2. Seleccione al menos un factor o covariable.

Si lo desea, en la pestaña Variables puede cambiar el método para cambiar la escala de las covariables. Las diferentes opciones son:

  • Estandarizado. Se resta la media y se divide por la desviación estándar, (x-media)/s.
  • Normalizado. Se resta el mínimo y se divide por el rango, (x−mín)/(máx−mín). Los valores normalizados quedan comprendidos entre 0 y 1.
  • Normalizados corregidos. Versión ajustada de la resta del mínimo y división por el rango, [2*(x−mín)/(máx−mín)]−1. Los valores normalizados ajustados quedan comprendidos entre -1 y 1.
  • Ninguno. Sin cambio de escala de covariables.

Campos con un nivel de medición desconocido

La alerta de nivel de medición se muestra si el nivel de medición de una o más variables (campos) del conjunto de datos es desconocido. Como el nivel de medición afecta al cálculo de los resultados de este procedimiento, todas las variables deben tener un nivel de medición definido.

Explorar datos. Lee los datos del conjunto de datos activo y asigna el nivel de medición predefinido en cualquier campo con un nivel de medición desconocido. Si el conjunto de datos es grande, puede llevar algún tiempo.

Asignar manualmente. Abre un cuadro de diálogo que contiene todos los campos con un nivel de medición desconocido. Puede utilizar este cuadro de diálogo para asignar el nivel de medición a esos campos. También puede asignar un nivel de medición en la Vista de variables del Editor de datos.

Como el nivel de medición es importante para este procedimiento, no puede acceder al cuadro de diálogo para ejecutar este procedimiento hasta que se hayan definido todos los campos en el nivel de medición.

Este procedimiento pega la sintaxis del mandato RBF .