Análisis Predictivo para detectar el fraude con tarjeta de crédito

El perfil del fraude y su operación

El fraude en tarjetas de crédito causa pérdidas millonarias a los bancos año con año, los defraudadores buscan la manera de no ser detectados y cometer el ilícito. La minería de datos ayuda a mejorar la detección y prevención del fraude.

José Mondragón, SPSS Senior IT Specialist, IBM México

José Mondragón estudió Actuaría en la Universidad Nacional Autónoma de México. Tiene 10 años de experiencia en estadística aplicada y 7 años como consultor en minería de datos en proyectos para el sector bancario, entre ellos, el área de Prevención de Fraudes.



08-08-2011

Visión Global del Negocio

Diariamente se realizan millones de transacciones con tarjetas bancarias. Uno de los riesgos más altos que corre la banca es el fraude con tarjetas de crédito. Los defraudadores han desarrollado métodos sofisticados para robar la información de los clientes contenidos en las bandas magnéticas de los plásticos a través del skimming y la clonación de éstos en tarjetas apócrifas para realizar la compra de productos o servicios de manera ilícita.

Cada banco cuenta con área dedicada exclusivamente a la prevención del fraude buscando reducir las pérdidas sufridas año con año. Los sistemas de prevención han sido bastante útiles para la detección en línea pero resultan insuficientes pues muchas veces no logran detectar el cambiante comportamiento del defraudador que busca no ser atrapado y se las ingenia para mezclarse entre los patrones de compra habituales de los clientes pasando desapercibidos dentro de la herramienta calificadora de las transacciones al realizar la compra.

En promedio se registran más de 100 millones de transacciones diariamente a nivel mundial con una venta anual de más de $190 millones de dólares donde el fraude obtiene ganancias por $2.8 millones. En México, América Latina y el Caribe el fraude por clonación representa un 60% con un monto anual de 100 millones de dólares en promedio cada año.

Los datos anteriores dan una idea del impacto que tiene el fraude en el sector bancario, además del costo por mantenimiento del área. Este gasto lo absorben tanto el banco como los usuarios pues el precio de los servicios se ve incrementado para absorber la pérdida sufrida.

El impacto del fraude va más allá dentro de la institución ya que afecta de manera directa a sus clientes. Es necesario considerar los puntos clave del negocio como mantener la venta e incrementarla y el servicio al cliente, que se ve afectado cuando su transacción es calificada como fraude deteniendo alguna de sus compras con la tarjeta lo que provoca malestar y puede llevar a la cancelación de la cuenta por recibir un mal servicio. Mantener en equilibrio este triángulo es muy importante para alcanzar las metas de negocio propuestas por la dirección.

Figura 1. Equilibrio del Negocio
Equilibrio del Negocio

Análisis Predictivo

La tendencia actual es utilizar sistemas analíticos y predictivos que ayudan a mejorar el desempeño de las herramientas calificadoras del fraude de manera significativa. Una de estas tecnologías es la minería de datos (DataMining) que reúne técnicas provenientes de diversas disciplinas como la estadística, la inteligencia artificial, la computación gráfica y el procesamiento masivo de datos y que ayudan de manera rápida y fácil a desarrollar las reglas para definir un patrón de comportamiento del fraude para identificar y detener las transacciones de este tipo al momento que son hechas en el punto de venta.

Con IBM SPSS Modeler es posible analizar los datos de las transacciones históricas realizadas con las tarjetas de crédito en cierto; el objetivo es conocer el patrón de comportamiento del defraudador al crear un perfil de uso de la tarjeta para definir reglas que posteriormente se programarán dentro de los sistemas calificadores en línea y así ayudar a mejorar la detección de casos de fraude.

El modelo a desarrollar es un modelo de clasificación, en este caso se utilizará un árbol de decisión que por su facilidad para interpretar los resultados son muy utilizados para desarrollar reglas que se traducen en patrón de comportamiento del defraudador lo que nos lleva a tener un perfil de este tipo de transacciones.


Modelo de Fraude

La selección de variables dentro del modelo dependerá de la definición o relevancia para el negocio ya que el fraude es diferente para cada banco en cuánto a la cantidad de transacciones, región, país, tipo de cliente, etc.

Figura 2. Creación del Modelo
Creación del Modelo

(Haga clic para ver una versión ampliada de la figura 2.)


Resultados

Las variables relevantes son las que el modelo de minería ha determinado como las más importantes para la definición de la regla buscada dentro de los datos analizados. En la parte izquierda se puede observar la regla que buscamos donde el monto acumulado en las operaciones realizadas con la tarjeta se encuentra entre $1890 y $4095 se consideraría como un perfil de fraude.

Figura 3. Variables Relevantes
Variables Relevantes

(Haga clic para ver una versión ampliada de la figura 3.)


Desarrollo del Árbol

El árbol de decisión muestra de manera gráfica el monto acumulado donde se puede apreciar que el 86% de la población en nuestra tabla de datos tiene el perfil antes mencionado.

Figura 4. Árbol de Decisión
Árbol de Decisión

(Haga clic para ver una versión ampliada de la figura 4.)

Las reglas obtenidas por el árbol son programadas en el sistema calificador, Falcon por ejemplo. Es muy importante medir la madurez de éstas reglas y su poder de detección ya que por el dinamismo del negocio, éstas pierden efectividad a través del tiempo por lo que es necesario reajustarlas o crear nuevas reglas.


Curva ROC

Para medir la precisión de la clasificación del árbol se utiliza la curva de ROC (Receiver Operating Characteristic). La curva indica un 78% de asertividad en la clasificación de los casos de fraude y no fraude por lo que se puede concluir que el modelo obtiene una buena regla de clasificación para determinar los casos de fraude.

Figura 5. Poder de Predicción del Modelo
Poder de Predicción del Modelo

(Haga clic para ver una versión ampliada de la figura 5.)


Conclusión

La minería de datos ha cambiado la perspectiva de cómo detectar y prevenir el fraude en tarjetas de crédito ya que mediante técnicas analíticas y una metodología como CRISP-DM (Cross Industry Standard Process for Data Mining) es posible determinar el patrón de comportamiento del defraudador y que sumado a una estrategia de negocio bien definida lleva a minimizar el impacto ocasionado por el fraude.

Con el modelo desarrollado con SPSS Modeler se obtiene un muy buen resultado de clasificación que permite tomar decisiones y definir una línea base a seguir para optimizar la detección y prevención del fraude realizado con las tarjetas de crédito

Comentarios

developerWorks: Ingrese

Los campos obligatorios están marcados con un asterisco (*).


¿Necesita un IBM ID?
¿Olvidó su IBM ID?


¿Olvidó su Password?
Cambie su Password

Al hacer clic en Enviar, usted está de acuerdo con los términos y condiciones de developerWorks.

 


La primera vez que inicie sesión en developerWorks, se creará un perfil para usted. La información en su propio perfil (nombre, país/región y nombre de la empresa) se muestra al público y acompañará a cualquier contenido que publique, a menos que opte por la opción de ocultar el nombre de su empresa. Puede actualizar su cuenta de IBM en cualquier momento.

Toda la información enviada es segura.

Elija su nombre para mostrar



La primera vez que inicia sesión en developerWorks se crea un perfil para usted, teniendo que elegir un nombre para mostrar en el mismo. Este nombre acompañará el contenido que usted publique en developerWorks.

Por favor elija un nombre de 3 - 31 caracteres. Su nombre de usuario debe ser único en la comunidad developerWorks y debe ser distinto a su dirección de email por motivos de privacidad.

Los campos obligatorios están marcados con un asterisco (*).

(Por favor elija un nombre de 3 - 31 caracteres.)

Al hacer clic en Enviar, usted está de acuerdo con los términos y condiciones de developerWorks.

 


Toda la información enviada es segura.


static.content.url=http://www.ibm.com/developerworks/js/artrating/
SITE_ID=90
Zone=Information mgmt
ArticleID=750958
ArticleTitle=Análisis Predictivo para detectar el fraude con tarjeta de crédito
publish-date=08082011