Enfóquese en los clientes a través del menú de Direct Marketing de SPSS Statistics

Variables y sus características

Descubra cómo usar los algoritmos sencillos pero efectivos del menú de Direct Marketing de SPSS Statistics. Aprenda acerca de los problemas estadísticos que se relacionan a variables potenciales y que pueden degradar los análisis, y las características del cliente comúnmente usadas y puntos de peligro potencial. Revise cómo efectuar la transición de los modelos de SPSS Statistics Direct Marketing hacia bid data.

David Gillman, Director de servicios, Data Sooner

David GillmanDavid Gillman ha trabajado en áreas de inteligencia de negocio, búsqueda de minería de datos y análisis predictivo por 20 años. Cuenta con formación académica en matemática aplicada, optimización y análisis estadístico con particular énfasis en su aplicación a actividades comerciales. Cuenta con experiencia práctica en la mejora de las operaciones empresariales mediante análisis aplicado en industrias de distribución, manufactura y hospitalidad con organizaciones de varios tamaños. Es posible ponerse en contacto con David en gillman@datasooner.com.



27-05-2013

Introducción

El análisis estadístico proporciona una manera de que cualquier negocio obtenga conocimiento de sus clientes. productos y procesos.

Este artículo cubre dos de las opciones en en menú de Direct Marketing de IBM® SPSS® Statistics al recorrer las opciones de los sub-menús. El artículo también cubre las características de las variables que son usadas e identifica las variables para evitar análisis. El menú de opciones que se muestra bajo el contexto de propiedades de variable consiste en Generar perfiles de clientes que respondieron a una oferta y Seleccionar contactos que más probablemente compren.

En SPSS Statistics, los estadísticos más avanzados pueden recoger la documentación e iniciar inmediatamente, necesitando tan solo aprender la estructura del menú. Los analistas de TI y de negocios usualmente necesitan el "por qué" sobre el "dónde" para usar el software.

Afortunadamente, SPSS Statistics incluye la opción de menú Direct Marketing , que simplifica las tareas comunes de análsis y las agrupa en un lugar, que proporciona un inicio fácil. Este artículo recorre algunos de esos procesos y describe qué datos usar y qué elementos comunes de datos no usar.

Existen muchos diferentes tipos de análisis disponibles a través de SPSS Statistics. El menú Direct Marketing ayuda a los usuarios a encontrar y usar los procesos analíticos comunes que hacen sentido para las personas de negocios.

Después de que los usuarios dominen el menú de Direct Marketing ellos pueden intentar usar algunos de los algoritmos más avanzados y personalizables. Esas variables están en el menú Analyze y generalmente tienen más opciones y son menos amigables si el usuario tiene pocos antecedentes estadísticos.


Motivos para refinar y focalizarse hacia los clientes

El primer motivo para refinar y focalizarse hacia los clientes tiene que ver con ahorros. La mejor focalización de clientes ayuda a la compañía a no gastar dinero en clientes que no tengan probabilidades de efectuar la compra. Una consecuencia es que el agrupar a clientes concentra esfuerzos en los clientes que más probablemente respondan.

el resultado neto es una ganancia en el índice de respuesta. En el análisis estadístico, el incremento en el índice de respuesta es llamado levantada. Una levantada se traduce en márgenes mayores para el negocio.

Los procesos de ventas también mejoran con buenos agrupamientos de clientes. Los buenos vendedores siempre son motivados para maximizar el retorno de su tiempo invertido. El proporcionar análisis predictivos que maximicen sus ingresos en el tiempo trabajado implica vendedores más efectivos.


Variables

El análisis inicial eventualmente se enfoca hacia el tema de las variables. Usted debe determinar qué variables incluir en el proceso analítico y en qué formato. Esta determinación nunca es rutinaria, incluso para los iniciadores en estadística.

Primero, determine qué variables están disponibles. Variables refiérase a las características de cliente en la base de datos que están almacenadas en los campos. Las variables comunes incluyen estado o provincia del cliente, códigos postales, número de órdenes a lo largo del tiempo, fecha del primer pedido, el valor de todos los pedidos a lo largo del tiempo, y tipo de cliente.

Muchas variables potenciales pueden desecharse inmediatamente. Muchas variables tienen significado para las personas pero no tienen valor para el análisis estadístico. El nombre del cliente es lo que más comúnmente se piensa primero. Siempre está presente debido a que es cómo las personas pueden relacionar y separar los datos. Sin embargo, el nombre del cliente es irrelevante para el análisis estadístico y para la elaboración de modelos predictivos.

De la misma manera, muchos campos, como las claves de tabla artificiales, en la base de datos tienen valor para el sistema de procesamiento de transacciones pero no tienen sentido, o incluso son confusas para el proceso de análisis estadístico.

algunas variables pueden no ser precisas. Algunos no son importantes para el procesamiento cotidiano y por lo tanto no tienen que corregirse nunca. una variable común en error es la fecha del primer pedido, si el sistema de planificación de recursos empresariales (ERP) cambió en el pasado. Usualmente, la totalidad de la base de datos previa de pedidos nunca es traducida hacia el nuevo sistema. Eventualmente, solo los datos financieros son migrados, y los pedidos individuales no son traídos a los nuevos sistemas.

Usualmente, las fechas del primer pedido se establecen artificialmente en algún punto o se alimentan como si todos hubieran sucedido en la misma fecha. Por lo tanto, el cómputo de la longevidad del cliente no es correcto. Así que, lo que puede ser una variable útil no sirve, o peor, corrompe al modelo estadístico con datos falsos.

Una categoría similar de variables, por ejemplo los códigos de Clasificación Industrial Estándar, requieren de interpretación humana. Aunque estos códigos son típicamente precisos, su alcance y consistencia pueden no serlos. El ERP o sistema de gestión de relación con el cliente puede tener espacio para solo un código, y la persona que lo alimenta puede colocarlo en una categoría importante en vez de en una clasificación más detallada. Y potencialmente peor para el elaborador de modelos estadísticos, diferentes personas lo pueden hacer diferentemente a lo largo del tiempo. La falta de consistencia genera un lío con el resultado.

Una segunda clase de variables a evitar es más difícil, por ejemplo, el número del cliente. El número del cliente es una parte invariable de cualquier extracción de datos acerca de clientes. El usarlo puede producir problemas rápidamente en el análisis. El número de cliente puede ser una variable "anacrónica", que es una variable que es colocada cuando el análisis es efectuado pero no cuando es usado en el campo. Un número de cliente usualmente es asignado después de que un cliente prospectivo se vuelve un cliente real. Por lo tanto, cuando un modelo estadístico es entrenado en los datos consistentes en clientes prospectivos y los clientes reales, el modelo puede indicar que la presencia de un número de cliente es un indicador clave de que la cuenta comprará.

Cuando usted considere qué variables incluir, piense acerca de si la variable puede inferir más o diferente información que el valor obvio o literal.

También considere cómo pueden estar relacionadas las variables. La medida en que cambian juntas se llama la covarianza. Una convarianza de cero significa que no hay conexión entre las variables y pueden ser llamadas independientes. Mientras mayor sea la convarianza, más cambiarán las variables juntas y estarán probablemente relacionadas.

Muchos procesos analíticos asumen que todas las variables son independientes. Esta suposición es importante cuando usted usa el menú Direct Marketing , pero no es algo que está resaltado en cualquiera de los submenús. Si muchas variables son usadas en el análisis que correlaciona, el análisis puede recoger aquellas variables y saturar todas las otras.

en lagunas ocasiones, sucede lo opusto en el análisis si las variables son altamente covariantes. el algoritmo puede distribuir impacto a lo largo de diversas variables relacionadas. El modelo de salida entonces resalta otros factores como más importantes. De cualquier manera, el modelo es menos preciso debido a que algunas de las variables de entrada que usa están relacionadas.

Usted puede ejecutar pruebas estadísticas en las variables para evaluar la independencia. Estas pruebas están en los menús de SPSS Statistics pero fuera del menú Direct Marketing . Otra opción a considerar es el uso de Microsoft® Office Excel®. Es fácil de comparar dos columnas al usar la función CORREL en una sencilla fórmula de Excel. El hacer lo no proporciona mucha profundidad pero le brinda un número rápido con el cual realizar una valoración.

Otra consideración es el formato o tipo de variable. Algunas variables son continuas, como valor d e pedido o el número de pedidos. Varios algoritmos para agrupar clientes no pueden manejar un valor numérico continuo. Para estos valores usted debe crear intervalos o grupos que agrupen a los clientes.

Por ejemplo, considere el valor de un pedido, que es un valor continuo sin divisiones o agrupamientos inherentes a los datos. Usted puede crear otra variable (como una columna en una hoja de cálculo) que desglose el valor en grupos o intervalos. Para la mayoría de los algoritmos, puede haber A, B y C, o alto, medio y bajo. El texto o el nombre no importan. Para el valor de pedido, los nombres de intervalo que tienen un significado para los usuarios de negocios, tales como alto, medio y bajo se comprenden mejor y no afectan el análisis.

Las variables más comunes para usar a lo largo de muchas incluyen variantes de:

  • Tipo de cliente
  • Geografía
  • Número de pedidos colocados
  • Valor de los pedidos
  • Tipo de productos pedidos
  • Historia de pagos, tiempo para pagar
  • Adquisición de marketing (cómo se volvieron clientes)
  • Evaluacion de vendedor

Generar perfiles de mis contactos

El primer paso para pasar por este submenú es extraer datos de su sistema ERP, que contiene una lista de clientes. Uno de esos campos debe representar si ese cliente compró—idealmente, si compró en respuesta a una campaña o mensaje de marketing particular. Otros campos deben contener variables relevantes, como se menciona en la sección previa. El resultado es un modelo que contiene las características de los clientes que tuvieron más probabilidades de responder versus los clientes que tuvieron menos probabilidades de responder.

Recopile los elementos de datos, con un registro para cada cliente, posteriormente lea esos datos en SPSS Statistics. Haga clic en Direct Marketing > Choose Technique (es la única opción), como se muestra en La Figura 1.

Figura 1. Acceda al menú de Direct Marketing en SPSS Statistics
Screen capture image showing how to access to the Direct Marketing menu in SPSS Statistics

Desde el menú, haga clic en Generate profiles of my contacts who responded to an offer, tal como se muestra en La Figura 2.

Figura 2. El menú gráfico de Direct Marketing
Screen capture image showing the Direct Marketing graphical menu

En la pestaña Fields , observe todas las columnas de sus datos en el recuadro Fields de la izquierda (ver Figura 3).

Figura 3. La ventana de Perfiles de Clientes Prospectivos
Screen capture image showing the Prospect Profiles window

En el recuadro Fields , seleccione el campo de respuesta de los datos. Use la flecha superior para moverse hacia el recuadro Response Field . Posteriormente, seleccione el valor positivo en Response Field. Si Response Field tiene múltiples valores, designe cuál será considerado el valor positivo. Todos los otros valores serán considerados respuestas negativas.

Posteriormente, seleccione las variables del recuadro Field y muévalas hacia el recuadro de Create Profiles with . SPSS Statistics analiza estas variables para ver si predicen el índice de respuesta y cómo lo hacen.

El algoritmo está listo para ejecutarse, pero la pestaña Settings tiene más opciones con las que puede refinar el procesamiento y mejorar el modelo. La Figura 4 muestra Settings .

Figura 4. La pestaña Settings en la ventana de Prospect Profiles
Screen capture image showing the Settings tab in the Prospect Profiles window

En la pestaña Settings , adjuste el tamaño de grupo de perfil mínimo para que coincida con lo que espera de los datos. Si el conjunto de datos es grande, incremente este número. Si el conjunto de datos es pequeño, disminuya este número.

Luego, seleccione Include minimum response rate threshold information in results . Coloque un porcentaje en el recuadro de Specify target response rate (%) que es el índice de respuesta de umbral mínimo para el grupo. El algoritmo todavía genera grupos con un índice de respuesta por debajo de este número, pero los codifica con colores diferentemente en la salida para mostrar que son grupos de respuesta malos.

Haga clic en Run para iniciar el análisis.

La ventana de salida muestra una tabla de los grupos encontrados. Usted también puede pegar esta tabla y gráficas en otros documentos y presentaciones para comunicar y capacitar a sus usuarios de negocios en relación a los descubrimientos. La Figura 5 muestra esta salida.

Figura 5. Ejemplo de salida del submenú de Generate profiles of my contacts who responded to an offer
Screen capture image showing example output of the Generate profiles of my contacts who responded to an offer submenu

(Vea una mayor de la Figura 5.)


Submenú de Select contacts most likely to purchase

A primera vista, este análisis se parece mucho al anterior. Sin embargo, el análisis Select contacts most likely to purchase incluye más opciones y la capacidad de crear un modelo que usted puede aplicar a nuevos datos en el futuro.

Como en las previas instrucciones, haga clic en Direct Marketing > Choose Technique. Desde el menú, haga clic en Select contacts most likely to purchase, tal como se muestra en La Figura 6.

Figura 6. El submenú Select contacts most likely to purchase
Screen capture image showing the Select contacts most likely to purchase submenu

En la ventana Propensity to Purchase , seleccione el campo de respuesta en el recuadro Fields y muévalo al recuadro Response Field . Designe qué valor en Response Field indica una respuesta positiva en la lista Positive response value .

Seleccione los campos a usar como las variables del análisis, moviéndolas del recuadro Fields hacia el recuadro Predict Propensity with .

En el área Save Model , haga clic en Browse para nombrar y colocar un archivo que contenga las reglas que genera el modelo. Este archivo puede alimentar a otros procesos analíticos, incluyendo un análisis de big data, al proporcionar reglas para clientes. Vea Figura 7.

Figura 7. Ventana Completed Propensity to Purchase
Screen capture image showing the completed Propensity to Purchase window

Luego, haga clic en Settings .

El área más importante de esta pestaña es Model Validation, que es donde un porcentaje de los datos son apartados del proceso de generación de modelo. Los datos apartados son usados para juzgar y calificar la efectividad del modelo. Seleccione el recuadro de selección Validate the model , y escrba un número en el recuadro Training sample partition size (%) .

En el área Diagnostic Output seleccione Overall model quality . Seleccione el recuadro de selección Classification table también, y escriba un número pequeño en el recuadro Minimum probability . Y o usé 0,02 en la Figura 8, pero cualquier número decimal que sea cercano al índice objetivo de respuesta estimada es aceptable.

En este ejemplo, los valores predeterminados son usados para el área Name and Label for Recoded Response Field . Estos valores son los nombres de la columna en la ventana de datos colocada a la derecha de los datos entrantes para cada registro de cliente. Estos valores brindan la predicción para ese cliente con base en el modelo de manera que usted pueda observar cómo se desempeña el modelo contra clientes individuales.

Figura 8. Pestaña Completed Settings
Screen capture image showing the completed Settings tab

Haga clic en Run.

El modelo genera varias gráficas y tablas en la ventana de salida, añade las columnas a la ventana de datos, y crea el archivo XML. Guarde la ventana de datos como hoja de cálculo, y posteriorment e use visualizaciones basadas en hoja de cálculo para ayudar en la comunicación con sus usuarios de negocios. La Figura 9 muestra un ejemplo de este archivo XML en formato Predictive Model Markup Language (PMML).

Figura 9. Ejemplo del archivo XML en el formato PMML
Screen capture image showing an example of the XML file in PMML format

(Vea una versión más grande de la Figura 9.)

La Tabla 1 muestra una tabla de clasificación. Estas tablas muestran qué tan preciso es el modelo en contraste con tanto los datos contra los que se entrenó como los datos de duración o validación.

Tabla 1. Tabla de clasificación para juzgar la efectividad del modelo
ObservadoPredecido
Muestra de entrenamientoMuestra de prueba
Respuesta registrada (0=No, 1=Sí)Porcentaje corregidoRespuesta registrada (0=No, 1=Sí)Porcentaje corregido
NoNo
Respuesta registrada (0=No, 1=Sí)No24196,0064198,46
02100,00011100,00
Porcentaje general,0066,6796,30,0091,6798,68

Traslado hacia big data

Usted puede usar el archivo XML en SPSS Statistics en el futuro para predecir el índice de respuesta contra nuevos conjuntos de datos. El archivo también puede ser usado por otras aplicaciones que pueden usarlo bajo el estándar PMML. Más allá de los consumidores tradicionales de archivos PMML XML para minería de datos están los big data.

El análisis de este artículo usa datos estructurados que se encuentran típicamente en una base de datos relacional. SPSS Statistics necesita esa estructura y formato para poder generar modelos. Usando el modelo que genera SPSS Statistics, varios paquetes de análisis de big data del mercado ahora pueden iniciar a dar puntuación a clientes y a clientes prospectivos conforme llegan al entorno de big data. Dicho análisis solo funcionará contra datos estructurados, pero eso puede cambiar en el futuro. O, hay maneras de hacer que algunos datos no estructurados parezcan estructurados para análisis.

Cuando se despliegan en un entorno de big data, los modelos de propensión pueden monitorear los datos entrantes de tiempo real en big data para proporcionar una puntuación en tiempo real de los clientes, por ejemplo, un modelo que detecte un probable cliente, y posteriormente de manera automática desencadene una oferta dirigida a ese cliente en tiempo real.

Este ejemplo es una mejora potencial pequeña y única en ingresos. El realizar miles o millones de dichas pequeñas recomendaciones puede producir inmensos resultados. En análisis predictivos, muchas pequeñas ganancias usualmente ganan el juego versus un punto único y grande de mejora.


Conclusión

Los análisis predictivos son un tema profundo y variado. Son prometedores y tienen potencial, pero puede ser difícil saber dónde iniciar. El menú Direct Marketing de SPSS Statistics simplifica y se dirige a varios usuarios que son grandes sujetos para su introducción.

Los tomadores de decisiones de TI y de negocios pueden aplicar análisis predictivos para ayudar a mejorar los índices de respuesta de los clientes al usar algún conocimiento básico de estadística. Con estas bases, posteriores procesos analíticos pueden ser comprendidos y aplicados en los negocios de todos los tamaños.

Recursos

Aprender

Obtener los productos y tecnologías

  • SPSS Statistics: Encuentre más información acerca de las características y de cómo acceder al producto.
  • Software de evaluación: Encuentre más software de evaluación, incluyendo varios productos SPSS. Descargue la versión de prueba, trabaje con el producto en un ambiente online seguro o tenga acceso a esta a través de la nube.

Comentar

Comentarios

developerWorks: Ingrese

Los campos obligatorios están marcados con un asterisco (*).


¿Necesita un IBM ID?
¿Olvidó su IBM ID?


¿Olvidó su Password?
Cambie su Password

Al hacer clic en Enviar, usted está de acuerdo con los términos y condiciones de developerWorks.

 


La primera vez que inicie sesión en developerWorks, se creará un perfil para usted. La información en su propio perfil (nombre, país/región y nombre de la empresa) se muestra al público y acompañará a cualquier contenido que publique, a menos que opte por la opción de ocultar el nombre de su empresa. Puede actualizar su cuenta de IBM en cualquier momento.

Toda la información enviada es segura.

Elija su nombre para mostrar



La primera vez que inicia sesión en developerWorks se crea un perfil para usted, teniendo que elegir un nombre para mostrar en el mismo. Este nombre acompañará el contenido que usted publique en developerWorks.

Por favor elija un nombre de 3 - 31 caracteres. Su nombre de usuario debe ser único en la comunidad developerWorks y debe ser distinto a su dirección de email por motivos de privacidad.

Los campos obligatorios están marcados con un asterisco (*).

(Por favor elija un nombre de 3 - 31 caracteres.)

Al hacer clic en Enviar, usted está de acuerdo con los términos y condiciones de developerWorks.

 


Toda la información enviada es segura.


static.content.url=http://www.ibm.com/developerworks/js/artrating/
SITE_ID=90
Zone=Big data y analytics
ArticleID=931519
ArticleTitle=Enfóquese en los clientes a través del menú de Direct Marketing de SPSS Statistics
publish-date=05272013