Selección de procedimientos para la agrupación en clústeres

Los análisis de clústeres se pueden realizar mediante los procedimientos de análisis de clústeres en dos fases, jerárquico o de K-medias. Cada uno de estos procedimientos emplea un algoritmo distinto en la creación de clústeres y contiene opciones que no están disponibles en los otros.

Análisis de clústeres en dos fases. En algunas aplicaciones, se puede seleccionar como método el procedimiento Análisis de clústeres en dos fases. Ofrece una serie de características exclusivas que se detallan a continuación:

  • Selección automática del número más apropiado de clústeres y medidas para la selección de los distintos modelos de clúster.
  • Posibilidad de crear modelos de clúster basados al mismo tiempo en variables categóricas y continuas.
  • Posibilidad de guardar el modelo de clúster en un archivo XML externo y, a continuación, leer el archivo y actualizar el modelo de clúster con datos más recientes.

Asimismo, el procedimiento Análisis de clústeres en dos fases puede analizar archivos de datos grandes.

Análisis de clústeres jerárquico. El uso del procedimiento Análisis de clústeres jerárquico se limita a archivos de datos más pequeños (cientos de objetos por agrupar en clústeres) y ofrece una serie de características exclusivas que se detallan a continuación:

  • Posibilidad de agrupar en clústeres casos o variables.
  • Posibilidad de calcular un rango de soluciones posibles y guardar los clústeres de pertenencia para cada una de dichas soluciones.
  • Distintos métodos de formación de clústeres, transformación de variables y medida de disimilaridad entre clústeres.

Siempre que todas las variables sean del mismo tipo, el procedimiento Análisis de clústeres jerárquico podrá analizar variables de intervalo (continuas), de recuento o binarias.

Análisis de clústeres de K-medias. El uso del procedimiento Análisis de clústeres de K-medias se limita a datos continuos y requiere que el usuario especifique previamente el número de clústeres y ofrece una serie de características exclusivas que se detallan a continuación:

  • Posibilidad de guardar las distancias desde los centros de los clústeres hasta los distintos objetos.
  • Capacidad para leer los centros de clúster iniciales y guardar los centros de clúster finales en un archivo IBM® SPSS® Statistics externo.

Asimismo, el procedimiento Análisis de clústeres de K-medias puede analizar archivos de datos grandes.