Abordaje y aplicación de la segmentación óptima

Agrupación en clústers y árboles de clasificación

Este artículo plantea técnicas de agrupación en clústers, clasificación y segmentación específicas del marketing en el desarrollo de marketing focalizado, desarrollo de productos y soluciones de perfil. Se describen algoritmos y abordajes de segmentación populares y se plantean sus puntos fuertes y limitaciones. También se incluye un caso de uso de negocios para mostrar el proceso de selección de algoritmos.

Kimberly Chulis, CEO y Cofundadora, Core Analytics, LLC

Kimberly ChulisKimberly Chulis es parte de los fundadores originales de Core Analytics LLC. Con más de 18 años de experiencia profesional en análisis avanzado, ha demostrado experiencia analítica en proyectos en varias compañías e industrias, que incluyen WellPoint, HCSC, UHG, Great West, Accenture, Ogilvy, Microsoft, Sprint/Nextel, Commonwealth Edison, TXU, Eloyalty, SPSS, Allstate, Cendant y otros en los sectores financieros, de telecomunicaciones, cuidado de la salud, energéticos, sin fines de lucro, de venta y educacionales. Kimberly ha realizado investigaciones de postgrado en el programa Human Services Consumer Behavior de la Universidad de Purdue y tiene una maestría en economía con enfoque en economía de la salud y econometría de la Universidad de Illinois en Chicago.



22-10-2012

El término segmentación se ha vuelto común, pero tiene tantos significados diferentes según el contexto que a menudo causa confusión. No es inusual para las compañías tener varias tareas de segmentación operando en simultáneo a través de diferentes departamentos. En general, la mayoría de los profesionales coinciden en que la segmentación actúa como un término abarcativo que se refiere al particionamiento general de un todo en subconjuntos de unidades similares. Sin embargo, más allá de eso, el tema puede ser un asunto de intenso debate.

Supongamos que, en un momento dentro de una organización, las siguientes tareas de segmentación ocurren en simultáneo:

  • La investigación y desarrollo (R&D) es desarrollar una segmentación del cliente para conocer mejor sus preferencias y comportamiento de compra con el fin de impulsar mejoras de productos hechos a medida. La R&D también podría desarrollar una segmentación de productos para conocer las semejanzas de productos y los tipos de productos que habitualmente se compran juntos.
  • Las finanzas han identificado segmentos de clientes y perspectivas para asistir en la predicción de ingresos. En este caso los datos podrían ser la rentabilidad, el costo de adquisición, el valor de por vida, datos demográficos, costos de publicidad y retención, entre otros.
  • La segmentación de investigación de mercado constituye la base de la percepción de calidad y servicios con el fin de impulsar una estrategia de marca e iniciativas de publicidad. Los investigadores de mercado tradicionalmente realizan la segmentación con instrumentos de sondeo y datos de retroalimentación del cliente.
  • El marketing tiene aún otra segmentación para conocer quién reacciona ante las campañas de varios canales de marketing con el objetivo de afinar la focalización y mejorar la respuesta a campañas. Las personas del marketing analítico a menudo recurren a datos demográficos y del comportamiento de compra de clientes sin procesar como base para la segmentación.

Este tipo de escenario es muy común, en el cual una empresa carecerá de una estrategia de segmentación universal y segmentaciones dispares (y con frecuencia contradictorias) se desarrollan de forma interdepartamental y se usan de maneras diferentes. Esta práctica prevalece a través de muchas industrias en las que se usa la segmentación. Para brindar una visión acotada de cómo varias industrias enfocan la segmentación, considere las siguientes aplicaciones: Las compañías de seguros usan la segmentación para identificar grupos de riesgo y establecer el precio y ofrecer alta calidad de servicio. La industria de la electricidad usa un abordaje ascendente para cargar predicciones, realizando predicciones a nivel de segmento para la agregación de la demanda total. La industria automotriz usa la segmentación para comprender las preferencias del mercado objetivo acerca de diseño y características. Los bancos segmentan las perspectivas de tarjeta de crédito para campañas por correo. Los biólogos se refieren a la segmentación como algo muy diferente, separando los tipos de animales en categorías basadas en la estructura corporal y las zonas de crecimiento. Las compañías farmacéuticas implementan segmentaciones para maximizar los ciclos de vida en innovación de productos. El campo de procesamiento de imágenes (que incluye el reconocimiento facial) es una de las áreas más complejas, que utiliza una aplicación de segmentación sofisticada de algoritmos paramétricos, de crecimiento de regiones y de detección de límites. Independientemente de la industria, todas las empresas probablemente se beneficiarían al cambiar a una estrategia de segmentación empresarial más consolidada y ajustada.

Segmentación de marketing

Las distinciones enumeradas anteriormente describen los diferentes abordajes y objetivos de los proyectos de segmentación. Los investigadores de mercado y profesionales en marketing analítico generalmente tratan el proceso con objetivos, datos de entrada y metodología muy diferentes. Analicemos un poco más los abordajes estándar para la segmentación de marketing.

El primer paso en cualquier tarea de segmentación es comprender el objetivo y motivación del estudio. ¿Quién solicita la segmentación? ¿Para qué se usará? ¿Por qué es necesaria? ¿Qué información acerca de los clientes que no esté aún disponible se necesita? ¿Quién usará la salida? ¿Qué datos están disponibles para respaldar la segmentación? ¿Cómo se procesará e implementará la segmentación? ¿Cómo se medirá el éxito del proyecto? Las respuestas a todas estas preguntas ayudarán a identificar la técnica, datos y el algoritmo más apropiados y necesarios para enfrentar el problema. Analizaremos un caso de uso específico en una sección posterior y se describirán dos opciones viables como también se discutirán las semejanzas y diferencias entre la segmentación del cliente y el modelado predictivo (consulte la sección Recursos por enlaces con más información).

Abordajes de segmentación estándar y entradas de datos

Los datos son una entrada crucial para cualquier tarea de segmentación. Por lo general es preferible más datos a menos, siempre y cuando el origen de datos pueda asociarse con precisión a un ID de nivel individual o doméstico. La lista de datos disponibles es casi infinita, pero se presentan a continuación algunas categorías de datos claves:

  • Pueden recolectarse datos de encuestas de los clientes o clientes de la población general con relación a las preferencias de productos y precios, canales de ventas, satisfacción de la experiencia del cliente y recomendaciones para mejorar.
  • Los datos de transacciones normalmente se almacenan en bases de datos relacionales e incluyen compras, beneficios, descuentos, método de pago, fecha y hora de compra y productos comprados juntos en un contexto minorista. En un contexto financiero, esta información representa depósitos, retiros, productos como cuentas corrientes, ahorros e hipotecas, y detalles acerca de cada producto. En un contexto energético, esta información incluye consumo, cortes de luz, pagos, depósitos, instalación de medidores inteligentes, entre otros.
  • Los datos del comportamiento incluyen el comportamiento de navegación, navegación en tiendas, seguimiento de ojos, reconocimiento de voz, búsqueda, uso de celular e información de dispositivos, geolocalización, frecuencia y volumen de interacciones hacia adentro y afuera con la marca. La interacción en medios sociales tales como "me gusta", retwittear y seguir también forman parte de esta abundante categoría de datos.
  • Los datos demográficos pueden recolectarse directamente de clientes o comprarse a proveedores de datos demográficos que ofrecen entre 300 y más de 900 variables a nivel individual, doméstico o de código postal. Muchos de estos conjuntos de datos reunidos por terceros derivan de los datos de respuestas en el censo de los Estados Unidos.
  • Otras categorías de datos incluyen centro de asistencia telefónica, conversaciones por chat, búsqueda de información, comparación de precios, críticas, participación en comunidades y programas periféricos e información sobre el producto.

Después de completar el ajuste preliminar de objetivos de negocio y la obtención de datos, es el momento de considerar los posibles abordajes de segmentación. Es posible seleccionar dentro de una variedad de abordajes tradicionales y cada uno tiene sus propias ventajas y limitaciones. Por ejemplo, muchas de las opciones de agrupamiento por clúster producen clústers del mismo tamaño; aunque esto sea deseable desde un punto de vista del despliegue, forzar clústers del mismo tamaño también puede disminuir la fuerza de medidas de semejanza dentro de un clúster.

Existen tres opciones básicas cuando se determina el mejor abordaje de segmentación. La Ilustración 1 muestra los tres abordajes generales: no cuantitativo, interdependiente y dependiente.

Figura 1. Las tres opciones básicas de segmentación
Image showing the three basic segmentation choices

La primera opción es un abordaje cuantitativo o no cuantitativo que involucra dimensiones contrastantes derivadas de entrevistas con partes interesadas y grupos de foco para recolectar información anecdótica. Estas dimensiones reflejan datos adquiridos con la experiencia sobre el comportamiento del cliente y se usan para asignar segmentos subjetivos para la estrategia de tratamiento focalizado. A pesar de ser direccionalmente útil, estos abordajes no cuantitativos tienden a ser menos consistentes que las otras dos categorías de segmentación basadas en datos — interdependiente y dependiente.

El interdependiente se refiere a un subconjunto de técnicas de segmentación multivariada que agrupa clientes según características similares. El análisis de clúster es un tipo popular de segmentación interdependiente en la que se consideran simultáneamente todas las entradas de conjuntos de datos y no hay una división de variables dependientes e independientes. Integrales al proceso de agrupación en clústers son la correlación y gráfica iterativas de segmentos para visualizar las relaciones y variación de clústers en el espacio hasta que se identifique finalmente el más adecuado.

La dependiente se refiere a los abordajes de análisis de patrones, tales como redes de Kohonen, Inducción de reglas, Detección automática de interacciones mediante chi-cuadrado (CHAID), C5.0, Dicotomizador iterativo 3 (ID3) y árboles de clasificación y regresión (los CART), y normalmente se seleccionan para la identificación de segmentos claves de mercado. La mayoría de estos algoritmos como también los abordajes de aprendizaje de máquina (redes neuronales) producen una salida del tipo árbol que es útil por la entrega de una representación gráfica visual de segmentos que ayuda en la validación y explicación a partes interesadas sin conocimientos técnicos. Una diferencia clave en estos abordajes es que los modelos requieren una variable dependiente, por cuanto en los modelos de interdependencia no se designa ninguna variable dependiente. La variable dependiente usualmente es una variable del tipo bandera 0-1 que coincide con el objetivo de la segmentación (es decir, gira para identificar segmentos de clientes con más probabilidad de desertar, da un valor alto para clientes con probabilidad de sobrepasar un umbral deseado de gasto o un alto riesgo para grupos de clientes con probabilidad de incumplir con el pago de tarjetas de crédito o préstamos). Además de los agrupamientos resultantes en formato de árbol, estos modelos dependientes generan unas medidas de probabilidad y propensión asociadas en las medidas de salida. Por esta razón, existe un amplio debate de la industria acerca de la semántica de segmentación con abordajes dependientes.

Los defensores de este abordaje enfatizan que la salida principal de las segmentaciones dependientes son agrupamientos de clientes similares que pueden perfilarse más aún y se han confeccionado a medida estrategias de tratamiento aplicadas para reducir el giro, incentivar un comportamiento de mayor gasto o introducir estrategias de intervención del riesgo previo al incumplimiento obstaculizador. Los críticos de este abordaje sostienen que el modelo resultante es en realidad un modelo predictivo en vez de un modelo de segmentación debido a la salida de predicción de probabilidad. Esta distinción podría radicar en el uso del modelo. La segmentación es la clasificación de bases de clientes en grupos distintos con base en datos multidimensionales y se usa para sugerir una hoja de ruta aplicable con el fin de diseñar estrategias relevantes de marketing, producto y servicio al cliente a nivel de segmento que guiarán los resultados deseados de negocios. El modelado predictivo consiste en pronosticar un comportamiento específico del cliente a nivel individual. Si eso parece una definición lógica, se deduce que el uso de la salida debería determinar la segmentación frente a la designación del modelo predictivo.

El paso final de preparación antes de emprender una tarea de segmentación es seleccionar el software más apropiado para el trabajo. Numerosos proveedores comerciales y de código abierto ofrecen una gama de algoritmos de clasificación y agrupación en clústers. Algunos, como el Rapid Miner de libre distribución, ofrecen árboles de decisión, máquinas de vectores de soporte (SVM) y dos tipos de redes neuronales. Otros, como IBM, tienen una variedad de opciones, incluyendo el IBM® SPSS® Advanced Statistics (consulte los Recursos), que incluye Kohonen, Two-step, K-Means y el Decision Tree Module, el cual ofrece cuatro algoritmos de crecimiento de árboles: CHAID, CHAID exhaustivo, CART y QUEST (un algoritmo de construcción de árboles binarios precisos). IBM Unica tiene el Affinium Model, el cual ofrece un módulo de ventas cruzadas que provee CHAID, CART y redes neuronales. El suite de extracción de datos IBM Intelligent Miner® provee una amplia lista de algoritmos con la habilidad de medir el rendimiento y comparar múltiple algoritmos para facilitar la selección final del mejor algoritmo. Esta lista provee información detallada de muchos de los paquetes estadísticos que respaldan abordajes de segmentación.

Tipos de clústers y abordajes de clasificación

Tanto los clústers jerárquicos como los no jerárquicos (disjuntos) están limitados por su capacidad para analizar variables numéricas, a menos que se incluya una matriz de distancia que permita entradas numéricas y de caracteres. Los clústers jerárquicos no se solapan a pesar de que un clúster pueda ser un subconjunto completamente contenido en otro. Los clústers disjuntos tampoco se solapan porque los clientes solo pueden estar en un clúster. En cambio, los clústers solapados son versiones libres que pueden ajustarse para permitir varios grados de solapamiento. Los clústers difusos pueden incluirse en las tres categorías mencionadas y se diferencian por probabilidades asignadas de membresía para cada clúster. Los algoritmos K-Means pueden ejecutarse muchas veces para producir una cantidad específica de clústers planos y disjuntos. Una técnica más atenuada usa estimaciones de probabilidad mediante una clasificación iterativa llamada normal mixtures para asignar probabilidades de inclusión de grupo. El enlace simple es una técnica jerárquica de agrupación en clústers que combina dos clústers con la distancia por pares mínima más pequeña en cada paso; el enlace completo combina dos clústers cuya combinación representa el diámetro más pequeño. Un abordaje de agrupamiento de clúster con buen rendimiento en toda la placa descrito en la publicación centinela de 1981 de Milligan sobre el tema es el abordaje Enlace promedio (promedio de grupo) que combina características de enlace simples y completas (consulte los Recursos para acceder a enlaces con más información). También tiene buen rendimiento el método de Varianza mínima de Ward. Hay otros métodos disponibles, como el análisis de factores que a menudo se usa en la primera etapa del agrupación en clústers para la reducción de variables, y los algoritmos de clase latente que representan un abordaje de modelado de ecuación estructural que usa modelos de probabilidad para maximizar el ajuste completo con el fin de encontrar grupos en conjuntos de datos categóricos multivariados.

En cuanto a los abordajes de clasificación, CHAID es un árbol de decisión que usa una prueba de significación ajustada para detectar interacción entre variables con el objetivo de determinar divisiones de múltiple formas. Las ventajas son que tiene una salida fácil de entender e interpretar, es un abordaje estándar de la industria para dirigir el marketing y puede manejar fácilmente tanto salidas numéricas como categóricas. CHAID no funciona bien en pequeños conjuntos de datos y normalmente se asocia a las etapas iniciales de exploración de datos en tareas de modelado predictivo y de regresión. El CART (consulte los Recursos) es en realidad un término global tanto para árboles de regresión como de clasificación que difieren principalmente en el criterio de división de nodos. El ID3 (consulte los Recursos) es un abordaje que produce nodos que minimizan la entropía.


Caso de uso de segmentación:

Escenario de negocio: Una compañía de seguros de salud está interesada en segmentar su base de clientes para determinar cuáles son los mejores segmentos de clientes para una campaña de difusión que promueva su participación en otros programas de salud online. La idea es que a medida que los asociados asuman un rol mayor en la autogestión de asistencia, disminuirán los reclamos, mejorarán los efectos en la salud y se producirá la retención y satisfacción del asociado.

La compañía de seguros de salud recolecta datos sobre el tipo de plan, datos demográficos, reclamos, participación en programas de salud y manejo de la enfermedad, información detallada sobre llamadas entrantes y salientes, chat e e-mail, sesiones de búsqueda de información e inicio de sesión en sitios web, datos sobre prescripción de medicamentos y otras variables a nivel individual. ¿Cuáles son los abordajes de segmentación posibles para enfrentar este caso de negocios?

Como es cierto en muchos casos de analítica aplicada, el proceso involucra una combinación de arte y ciencia.

En cierta medida, la selección del abordaje proviene de una cuestión de preferencias del analista, la disponibilidad del software y algoritmos asociados y la familiaridad con el criterio de evaluación y validación del éxito de la salida. En este caso de uso, podría aplicarse un abordaje interdependiente (sin variables dependientes) de agrupación en clústers o un abordaje (de clasificación) dependiente. Recuerde que este último necesita una variable dependiente: si los datos respaldan la identificación de asociados que ya están participando en un programa de salud online o participan en un programa offline y se les asocia medidas de éxito deseadas, este grupo puede señalarse con WellFlag=1 y los otros pueden señalarse con WellFlag=0. Esta bandera binaria puede ajustarse más si se cuenta con una variable demográfica que indique un usuario de computadora o si el registro del asociado incluye una dirección de e-mail, ambas sirven como un proxy de propensión para tener y usar computadoras. Debido a que las entradas de datos son numéricas y de caracteres, CHAID es un abordaje flexible de clasificación que ordenadamente dividirá en segmentos a los asociados por los datos categóricos y numéricos y permitirá obtener perfiles más detallados para ayudar en el subprograma de salud y el diseño de sitio web (basado en necesidades médicas, riesgo de salud y necesidades focalizadas).

Esta segmentación también podría tratarse con una técnica de agrupación en clústers en la que se aplique Enlace promedio o K-Means usando valores numéricos y tratando lo categórico con medidas de "distancia" para la inclusión en el modelo. La efectiva elección de algoritmo depende de la salida deseada. Si se necesitan clústers diferentes (es decir, un asociado debería participar en un solo tipo de programa de salud), entonces pueden seleccionarse las opciones non-Fuzzy como K-Means y Normal. Si los clústers solapados son más adecuados, se recomiendan la rotación Factor y los clústers Fuzzy. La elección del algoritmo de mejor ajuste es el resultado de primero preparar el conjunto de datos y transformar valores categóricos apropiadamente, luego ejecutar los conjuntos de datos mediante los distintos abordajes posibles y revisar la salida gráfica para ver el tamaño relativo y agrupamientos de los clústers. Estas gráficas permiten la comparación y elección de los clústers ideales: lo más adecuado son aquellos con los clústers más compactos y mejor separados.


Implicaciones de grandes datos y segmentación

Grandes datos es un término que se aplica a los petabits de datos sociales, móviles, web, de texto y sensor generados y almacenados a nivel individual. Estos datos normalmente se almacenan en herramientas y bases de datos no estructuradas como IBM InfoSphere® BigInsights™, que se asienta en la plataforma Apache Hadoop y facilita el análisis a gran escala por analistas de negocios en lugar de expertos en aprendizaje de máquina. Estas nuevas tecnologías permiten el acceso a enormes orígenes de datos previamente desaprovechados como también funciones MapReduce y de filtro ligero, con lo cual se agrega valor al incluir la representación de datos no estructurados como imágenes, videos y opiniones basadas en texto al conjunto de datos tradicional.

Los algoritmos de segmentación clásica descritos en este artículo siguen siendo relevantes en un entorno de grandes datos. Los criterios de selección y abordaje permanecen iguales. La diferencia consiste principalmente en el preproceso e integración de datos no estructurados y la promesa de producir más y mejores resultados de segmentación aplicable. Las compañías que ensamblan una pila de tecnología para acceder a grandes datos pueden aprovechar lo que de otro modo quedaría como una reserva de información difícil de manejar y en su mayoría inaccesible. Muchas de las soluciones de código abierto diseñadas para gestionar grandes datos se basan en principios de filtro y segmentación similares a los algoritmos descritos en este artículo. Sin embargo, en vez de analizar los datos dentro de este por completo, es posible conseguir muestras filtradas de grandes datos y aplicar la segmentación tradicional para conocer sobre el comportamiento de nuevos canales digitales. Las empresas que puedan asociarse con estos nuevos orígenes de datos no estructurados e integrarlos completamente en un análisis multidimensional, estarán más cerca de la visión de 360 grados más actualizada del cliente y de todos los beneficios competitivos asociados con el conocimiento profundo del cliente.

Recursos

Aprender

Obtener los productos y tecnologías

  • Rapid Miner ofrece varias opciones de software para segmentación, incluidas las SVM.
  • Aprenda más sobre SPSS Advanced Statistics.
  • Evalúe los productos IBM de la forma en que más le convenga a usted: Descargue la prueba del producto, pruebe el producto online, use el producto en el entorno de la nube o pase unas pocas horas en SOA Sandbox aprendiendo cómo implementar arquitectura eficaz orientadas a servicios.
  • Pruebe el IBM InfoSphere BigInsights edición básica, una descarga integrada, gratuita, probada y preconfigurada para cualquier persona que desee experimentar con Hadoop. También es posible usar este producto en la nube.

Comentar

  • Participe de la comunidad developerWorks. Conéctese con otros usuarios de developerWorks mientras explora los blogs conducidos por desarrolladores, foros, grupos y wikis.

Comentarios

developerWorks: Ingrese

Los campos obligatorios están marcados con un asterisco (*).


¿Necesita un IBM ID?
¿Olvidó su IBM ID?


¿Olvidó su Password?
Cambie su Password

Al hacer clic en Enviar, usted está de acuerdo con los términos y condiciones de developerWorks.

 


La primera vez que inicie sesión en developerWorks, se creará un perfil para usted. La información en su propio perfil (nombre, país/región y nombre de la empresa) se muestra al público y acompañará a cualquier contenido que publique, a menos que opte por la opción de ocultar el nombre de su empresa. Puede actualizar su cuenta de IBM en cualquier momento.

Toda la información enviada es segura.

Elija su nombre para mostrar



La primera vez que inicia sesión en developerWorks se crea un perfil para usted, teniendo que elegir un nombre para mostrar en el mismo. Este nombre acompañará el contenido que usted publique en developerWorks.

Por favor elija un nombre de 3 - 31 caracteres. Su nombre de usuario debe ser único en la comunidad developerWorks y debe ser distinto a su dirección de email por motivos de privacidad.

Los campos obligatorios están marcados con un asterisco (*).

(Por favor elija un nombre de 3 - 31 caracteres.)

Al hacer clic en Enviar, usted está de acuerdo con los términos y condiciones de developerWorks.

 


Toda la información enviada es segura.


static.content.url=http://www.ibm.com/developerworks/js/artrating/
SITE_ID=90
Zone=Big data y analytics, Industries, Information mgmt
ArticleID=841622
ArticleTitle=Abordaje y aplicación de la segmentación óptima
publish-date=10222012