Dónde comenzar con la minería de datos en distribución mayorista

Aplique la analítica predictiva en la distribución desde el comienzo con big data

Los grandes distribuidores están abriendo el camino en la analítica predictiva para la distribución, lo que pone a los distribuidores medianos en una gran posición para aprovechar los éxitos y fracasos de las compañías más grandes. En este artículo descubrirá ejemplos sobre cómo puede usar a la analítica predictiva para mejorar las operaciones empresariales en varios departamentos de distinta función en un distribuidor mayorista, y aprender sobre el conjunto de productos de IBM, el cual funciona desde la exploración y las primeras aplicaciones hasta big data a medida que sus habilidades y datos crecen en el futuro.

David Gillman, Director de servicios, Data Sooner

David GillmanDavid Gillman ha trabajado en áreas de inteligencia de negocio, búsqueda de minería de datos y análisis predictivo por 20 años. Cuenta con formación académica en matemática aplicada, optimización y análisis estadístico con particular énfasis en su aplicación a actividades comerciales. Cuenta con experiencia práctica en la mejora de las operaciones empresariales mediante análisis aplicado en industrias de distribución, manufactura y hospitalidad con organizaciones de varios tamaños. Es posible ponerse en contacto con David en gillman@datasooner.com.



19-11-2012

La analítica predictiva y sus procesos de analítica asociados son el tema de demasiados escritos, y si piensa que verá más sobre esto en muchos foros distintos, está en lo correcto. Estos escritos tampoco están restringidos a discusiones secas y técnicas. Es posible leer sobre la analítica predictiva (un término actualizado y expandido para la minería de datos) en revistas y sitios web de TI y técnicos, en operaciones empresariales y en revistas de la industria de distribución, e incluso en revistas de noticias comunes.

Aunque la analítica predictiva no puede ser considerada como un tema principal en la industria de la distribución mayorista, aún así se está volviendo cada vez más utilizada. Al igual que con muchas tecnologías, existe un flujo de adopción que comienza con las empresas más grandes y que fluye hacia las compañías medianas. En concurrencia con la adopción incrementada está la proliferación de herramientas comerciales y de código abierto. Existen tantas herramientas actualmente que cualquiera que no sea un experto en el tema se puede perder en el proceso de elegir un conjunto de herramientas para seguir avanzando.

Definiendo la analítica predictiva

Para iniciar, observemos lo que es la analítica predictiva No:

  • No informando. Presentar información resumida de una base de datos transaccional es útil, pero no es analítica predictiva. La analítica predictiva utiliza procesos estadísticos para presentar a los usuarios empresariales información que no puede ser obtenida utilizando los informes tradicionales.
  • Sin procesamiento analítico online (OLAP), cubos de datos o bases de datos en la memoria. Aunque la llegada de las tecnologías de almacenamiento de datos no relacionales es una bendición para entregar información a usuarios empresariales, no es analítica predictiva. No se trata de subestimar los avances en el rendimiento de bases de datos en memoria y motores de OLAP, pero simplemente colocar información histórica en estos formatos no incrementa el conocimiento para el tomador de decisiones empresarial.
  • Sin hojas de datos. Este se encuentra en la cerca. La aplicación de hoja de cálculo más popular tiene algunas estadísticas que van más allá de los tipos de cálculo normales de máximo, mínimo, suma y promedio. (Sin embargo, sólo algunas personas están familiarizadas con el uso de funciones estadísticas más avanzadas.) Puede realizar varios tipos de regresión que son útiles para predecir tendencias futuras. A pesar de ello, las hojas de cálculo tienen importantes limitaciones en la cantidad de datos que pueden manejar, la velocidad a la que pueden hacerlo y su capacidad de aplicar predicciones (es decir, de hacer una predicción sobre nuevos datos y comunicar esa predicción a otros).

Respecto a lo que la analítica predictiva es, eso puede variar dependiendo de con quién esté hablando. Mi definición genérica es que la analítica predictiva es el proceso de analizar datos utilizando procesos estadísticos automatizados y resumir resultados en información útil. La forma de la información útil también puede variar enormemente, pero para el distribuidor debe estar en un formato que sea accionable para tomadores de decisiones empresariales o puede estar codificada en aplicaciones para inclusión automática en lógica empresarial basada en planificación de recursos empresariales (ERP).

La analítica predictiva es útil, ya que existen demasiados datos para una sola persona por absorber, analizar y actuar en su sistema de ERP y otras bases de datos que no sean de ERP. Los datos históricos de pedidos, gestión de relación con el cliente (CRM) y datos de compras e inventario entran y se acumulan en los sistemas de ERP a un ritmo estable y gestionable para los servidores. Usted tiene informes que resumen esta información y ejecutivos y usuarios de la línea de negocio (LOB) se refieren a esos informes continuamente. Sin embargo, esta información histórica por sí misma no proporciona recomendaciones predictivas ni tampoco de perspectiva. Es ahí donde la analítica predictiva se pone a trabajar.

Los conceptos, técnicas y herramientas que utilizan los grandes distribuidores pueden ser aplicados con éxito en operaciones y datos en distribuidores medianos. Discutamos dónde aprovechar los datos en su aplicación de ERP utilizando analítica predictiva. Después, es posible explorar herramientas para realizar y desplegar analítica predictiva y big data, así como la forma en que puede utilizar las herramientas y conceptos de big data en datos no estructurados o semi-estructurados.


Ejemplos de la analítica predictiva en la distribución

Las búsquedas rápidas de Internet con términos relevantes generan muchos ejemplos de la aplicación de analítica predictiva en distintos departamentos funcionales. Estos son algunos de mis favoritos.

Compras

Una aplicación de la analítica predictiva, utilizada desde hace tiempo, es en la optimización de las compras. Los distribuidores medianos frecuentemente han instalado sistemas que observan el inventario y el historial de pedidos de productos individuales para recomendar cantidades de compras y planificaciones. El efecto neto es la reducción de los niveles de inventario.

Las temporadas son frecuentemente un componente oculto en excedencia de existencias. La analítica predictiva ubica las tendencias de temporada. Más impresionante aún, algunos distribuidores utilizan analítica predictiva para identificar las temporadas secuenciales. Por ejemplo, un distribuidor de decoraciones navideñas puede encontrar mediante el proceso de analítica predictiva que la venta de árboles de Navidad artificiales y las series de luces decorativas muestran las mismas tendencias de temporada pero tienen cinco días de diferencia en sus picos y progresión.

Finanzas

El crédito del cliente siempre es un tema difícil de manejar. Cuando su compañía construye una historia, es posible aplicar la analítica predictiva a su CRM y a sus archivos de cuentas por pagar (AR) para supervisar individuos y grupos de clientes. Normalmente, el crédito es extendido con base en un informe sobre el cliente generado por una agencia externa cuando el cliente es nuevo para usted. Pocas veces se revisa ese informe, hasta que hay un problema con las AR del cliente en días destacados o el crédito total extendido. Los modelos de analítica predictiva pueden examinar el historial de clientes que ya no son recomendables y busca señales de advertencia. Algunos distribuidores han combinado los archivos de AR y de CRM en un modelo descriptivo y han descubierto que un retraso en aumento en el regreso de llamadas telefónicas del cliente es una importante señal de advertencia.

Marketing

Dividir a los clientes en grupos es algo natural que la mayoría de las organizaciones hacen para planificar y definir objetivos. Aunque una segmentación heurística es fácil de adoptar, aplicar técnicas de analítica predictiva puede crear un sistema de segmentación mejor ajustado. El modelo de segmentación es entonces aplicado a clientes nuevos y prospectos. Los usos específicos incluyen obtener los patrones de pedidos de los nuevos clientes para compararlos rápidamente con los de los buenos clientes antiguos en el mismo segmento.

Otro excelente uso de un modelo de segmentación de clientes en la distribución es en la gestión del ciclo de vida del cliente. Conocer cómo progresan los clientes a través de las distintas etapas de ser su cliente le ayudará a su compañía a diseñar programas e incentivos que ayuden a mantener a esos clientes.

Ventas

Algunos de los conceptos de utilizar analítica predictiva en el marketing entran también directamente en el departamento de ventas. Conocer el ciclo de vida de un cliente ayuda al vendedor a identificar los lugares donde el distribuidor puede estar perdiendo lentamente el negocio.

Los departamentos de ventas tienen muchos otros usos potenciales para la analítica predictiva. Mi favorito es el modelo de ventas cruzadas—un sistema automatizado o semi-automatizado que presenta productos que el cliente tiene probabilidades de comprar pero que no lo ha hecho todavía. Añadir líneas a un pedido es una de las mejores formas en las que los distribuidores pueden incrementar los márgenes más directamente. La verdadera analítica predictiva es más que simplemente mostrar los principales productos en un departamento para ventas cruzadas. Frecuentemente, el cliente ya está comprando esos productos. Los mejores modelos de ventas cruzadas actúan casi como asistentes personales de compras en la recomendación de productos que tengan una asociación positiva pero no obvia.

El modelo de ventas cruzadas también es útil para convertir a los clientes de valor bajo en clientes de valor más alto. Piense en él como un habilitador del vendedor para incrementar lo que el cliente está pidiendo en una sola ocasión. Dicho método es sutil y efectivo.


Herramientas de IBM y soluciones de software

Como se mencionó, existen muchas herramientas que pueden hacer algo o todo lo que es necesario hacer. Existen cientos de productos—algunos son viejos, algunos son nuevos, otros son comerciales y algunos más son de código abierto. Si está buscando una herramienta basada en IBM, existe una clara progresión para la forma en que es posible proceder desde las pruebas hasta la producción con big data como la aplicación definitiva (actual) de minería de datos para datos empresariales.

IBM® SPSS® Statistics es el paquete base necesario para comenzar con la analítica predictiva. Muchos cursos (quizá incluso recuerde su curso de estadística en la universidad) están disponibles para guiarlo a través de los procesos de análisis de datos. A medida que progresa, añade otros módulos a SPSS. La intención al utilizar SPSS Statistics es obtener un conocimiento estadístico base y poder aplicar ese conocimiento a sus datos. Puedo garantizarle que aunque esta es la etapa inicial, usted y su compañía obtendrán mucho valor del conocimiento con los patrones y tendencias que descubran.

Después de demostrar en su compañía la utilidad de utilizar análisis estadísticos para obtener conocimiento, verá el retorno de inversión (ROI) absoluto y podrá hacer que la gestión se mueva al siguiente nivel con facilidad. Ese siguiente nivel es IBM SPSS Modeler. Es aquí donde podrá ensuciarse las manos al aplicar analítica predictiva a sus datos en un entorno de producción.

Existen dos versiones de SPSS Modeler que se aplican a los datos estructurados: Professional y Server. Como una compañía mediana, casi seguramente iniciará con Professional y después se moverá a Server a medida que despliega los modelos predictivos en tareas de procesamiento automatizadas. (Vea la sección Resources para obtener más información.)

En el camino, también verá los beneficios de un depósito de datos. Nada puede atrasar el proceso de analítica predictiva como los malos datos (o llevar a modelos erróneos). Utilizar un origen de datos limpio (es decir, un depósito de datos o un mini-almacén de datos) requiere un gran paso del proyecto de minería de datos. IBM ayuda a proporcionar una familia de paquetes de depósitos de datos, todo dentro de la línea de productos de IBM InfoSphere® . Existen varios paquetes de depósitos de datos que puede utilizar dependiendo de las áreas de la compañía con las que esté trabajando. Vea InfoSphere Warehouse Packs para Customer Insight, Market y Campaign Insight y Supply Chain Insight.

La progresión anterior lo involucra con la analítica de datos de la lista Fortune 500. Continúe leyendo para obtener una visión del futuro.


Big data

Big data se refiere al análisis de datos no estructurados o semi-estructurados. En la discusión general, el término frecuentemente se refiere a analíticas de texto, incluyendo observar Twitter, Facebook y otros sitios de redes sociales para obtener información. Este tipo de datos no se ajustan con el molde tradicional de los datos de transacción y por lo tanto es distinto trabajar con ellos.

Los datos no estructurados también pueden tomar otras formas para el distribuidor. Piense en las etiquetas de ID de frecuencia de radio en productos y sus registros de movimiento en el almacén, alrededor del almacén y para el cliente. Si su compañía maneja su propia flota de entrega, los sensores de los camiones pueden proporcionar otra fuente de información valiosa para ayudar a optimizar el proceso de entrega.

Analizar esta masa de datos no estructurados es el dominio de big data.

IBM proporciona una ruta clara para big data. Dentro de la familia de productos de InfoSphere está la línea de productos de BigInsights. Esta línea está compilada con varios productos de código abierto, incluyendo Apache Hadoop para el almacén de datos y varios lenguajes administrativos y de consulta diseñados para trabajar con cantidades masivas de datos no estructurados.

Es posible iniciar sin costo al descargar e instalar IBM InfoSphere BigInsights Basic Edition (vea Resources). A medida que progresa en la cantidad de datos que tiene y los tipos de análisis que desea, tiene algunas elecciones qué tomar.

La siguiente etapa para el software es IBM InfoSphere BigInsights Enterprise Edition. Aquí, es posible utilizar todo el poder de las herramientas incluidas para extraer conocimiento. Su decisión consiste en dónde desplegarlo.

Por diseño, las tecnologías subyacentes en BigInsights están diseñadas para ejecutarse en hardware comercial (con ciertas excepciones para algunos nodos de control). No todos tienen mucho hardware disponible, así que IBM también puede alojar BigInsights en la nube de IBM. Es posible configurar cuántos nodos de almacenamiento y procesamiento desea y sólo pagar por el procesamiento que use por hora.


Conclusión

La analítica predictiva hará una diferencia en su organización de distribución. Analizando las historias de éxito, puede ver los beneficios en casi todos los departamentos. Muchas veces, la aplicación de analítica predictiva lleva a miles de millones de mejoras pequeñas e incrementales. Cada una de las mejoras es casi imperceptible, pero cuando se multiplican a través de miles de clientes o millones de transacciones, la red para la compañía es enorme.

Es difícil creer que habrá menos datos en su compañía en el futuro o que habrá menos análisis. Obtener las habilidades y el conocimiento de las herramientas ahora es la mejor forma de seguir siendo relevante en su organización. Entrar en la analítica predictiva ahora significa que será un líder en su compañía, pero puede apoyarse en las experiencias de personas que están fuera de su organización.

Recursos

Aprender

  • SPSS software: Aprenda más sobre el portafolio de productos de SPSS.
  • SPSS Modeler: Explore las diferencias entre las ediciones Modeler Professional y Server.
  • IBM InfoSphere Warehouse: Conozca más sobre este producto que ofrece un amplio conjunto de productos para casi cualquier necesidad de depósito de datos.
  • InfoSphere Warehouse Packs: Vea estos depósitos previamente compilados para analítica empresarial avanzada.
  • Prediciendo el futuro (Alex Guazzelli, developerWorks, 2012): vea esta serie de cuatro partes para aprender más sobre los aspectos importantes de la analítica predictiva.
  • Analítica Empresarial de developerWorks: Conozca más recursos técnicos de analítica para desarrolladores.
  • developerWorks Industries: Obtenga los recursos técnicos específicos de la industria para desarrolladores más recientes.
  • developerWorks en Twitter: Únase hoy para seguir los tweets de developerWorks.
  • Podcasts de developerWorks: Escuche interesantes entrevistas y discusiones para desarrolladores de software.
  • Demos bajo demanda de developerWorks: Vigile demostraciones que van desde la instalación de productos y demostraciones de configuración para principiantes, hasta funcionalidades avanzadas para desarrolladores experimentados.

Obtener los productos y tecnologías

  • IBM InfoSphere Warehouse 10.1 Enterprise Edition: Descargue la prueba para un periodo de evaluación de 90 días. O pruébelo en el recinto de seguridad en su lugar.
  • InfoSphere BigInsights es el punto de partida para aprender y trabajar con big data. Descargue la edición básica sin costo.
  • Software evaluativo: Encuentre más software de prueba. Descargue la versión de prueba, trabaje con el producto en un ambiente online seguro o tenga acceso a esta a través de la nube.

Comentar

Comentarios

developerWorks: Ingrese

Los campos obligatorios están marcados con un asterisco (*).


¿Necesita un IBM ID?
¿Olvidó su IBM ID?


¿Olvidó su Password?
Cambie su Password

Al hacer clic en Enviar, usted está de acuerdo con los términos y condiciones de developerWorks.

 


La primera vez que inicie sesión en developerWorks, se creará un perfil para usted. La información en su propio perfil (nombre, país/región y nombre de la empresa) se muestra al público y acompañará a cualquier contenido que publique, a menos que opte por la opción de ocultar el nombre de su empresa. Puede actualizar su cuenta de IBM en cualquier momento.

Toda la información enviada es segura.

Elija su nombre para mostrar



La primera vez que inicia sesión en developerWorks se crea un perfil para usted, teniendo que elegir un nombre para mostrar en el mismo. Este nombre acompañará el contenido que usted publique en developerWorks.

Por favor elija un nombre de 3 - 31 caracteres. Su nombre de usuario debe ser único en la comunidad developerWorks y debe ser distinto a su dirección de email por motivos de privacidad.

Los campos obligatorios están marcados con un asterisco (*).

(Por favor elija un nombre de 3 - 31 caracteres.)

Al hacer clic en Enviar, usted está de acuerdo con los términos y condiciones de developerWorks.

 


Toda la información enviada es segura.


static.content.url=http://www.ibm.com/developerworks/js/artrating/
SITE_ID=90
Zone=Industries, Big data y analytics
ArticleID=846238
ArticleTitle=Dónde comenzar con la minería de datos en distribución mayorista
publish-date=11192012