Identificación Impersonal en IBM InfoSphere Identity Insight

Extendiendo las capacidades resolución de relaciones mediante atributos impersonales.

La “Identificación Impersonal” permite detectar relaciones definidas por atributos que no necesariamente determinan a una persona. Este artículo explica la identificación impersonal, enfatizando sus diferencias respecto al proceso de identificación de relaciones tradicional. Así mismo se muestra como IBM InfoSphere Identity Insight implementa la identificación impersonal, mediante un ejemplo de análisis de llamadas telefónicas.

Alexander Ambriz Rivas , Client Technical Professional for Information Management, IBM

Alexander Ambriz Rivas Alexander Ambriz Rivas es especialista técnico para el área de Information Management de IBM Software Group México, desde enero de 2010. En este rol, Alexander se encarga de apoyar técnicamente en labores de preventa para soluciones de Master Data Management (MDM) e Identity Insight. Alexander cuenta con 10 años de experiencia en el desarrollo de sistemas de software empresariales. Antes de unirse a IBM, Alexander participó en proyectos de software basados en Java Enterprise Edition con Multipack, Banco Azteca, Metlife y Telcel entre otros. Además de las áreas de MDM e Identity Insight, Alexander está interesado en temas de Arquitectura Orientada a Servicios (SOA) y tecnologías Java. Alexander es Ingeniero en Computación por la Universidad Nacional Autónoma de México y Maestro en Ciencias con especialidad en Tecnología de Software, por la Hochschule für Technik Stuttgart, Alemania. Ver Perfil en My developerWorks.



05-09-2011

Introducción

IBM InfoSphere Identity Insight es una solución ampliamente conocida por su capacidad de resolución de identidades y relaciones. Dicha capacidad permite a la herramienta inferir la identidad única de una persona a partir de registros provenientes de diferentes fuentes de datos, así como determinar las relaciones con otras personas.

El proceso de resolución de relaciones tradicionalmente se basa en atributos compartidos entre dos o más personas. Por ejemplo, si dos individuos viven en un mismo domicilio, es posible inferir que existe una relación entre ambos. Para conocer más detalles sobre las bases de IBM InfoSphere Identity Insight, puede visitar la sección de recursos [1].

Además de atributos en común, las relaciones entre personas también pueden estar definidas "indirectamente". Este concepto se conoce como "Identificación Impersonal". A continuación se explica a profundidad dicho concepto y se ejemplifica mediante un escenario ficticio.


Identificación Impersonal

Una relación impersonal es aquella en que dos o más personas se relacionan a través de una entidad "intermediaria" [2]. La entidad intermediaria típicamente representa un evento o actividad en que de alguna manera participan personas. Las personas involucradas en la relación impersonal se relacionan con la entidad intermediaria a través de atributos en común. Un ejemplo típico de una relación impersonal es aquella que se da entre dos personas que participan de una llamada telefónica. En ese caso, la entidad intermediaria es la llamada telefónica, y los atributos que relacionan a cada participante con la llamada son sus números telefónicos.

La Figura 1 muestra una red que contiene relaciones personales e impersonales. El recuadro verde señala una relación personal. En este caso, ALBERTO G y LEONARDO T comparten una misma dirección (Periferico Sur 3871, Mexico, DF 08767, MEX). No existen entidades intermediarias entre ambos actores. Por otro lado, el recuadro rojo indica una relación impersonal. Dicha relación está definida por una llamada telefónica, en la que participaron LEONARDO T (con el número 52-55-1830-2317) y ROBERTO M (con el número 52-55-8210-9450). LEONARDO no comparte atributo alguno con ROBERTO (cada quien tiene su propio número telefónico), pero sus números participaron en una misma llamada. La llamada es representada por una entidad del tipo "Phone Call", con el identificador 81017. Para fines de este ejemplo, no es relevante quién inició la llamada y quién la recibió.

Figura 1. Red de vínculos con relaciones “personales” e “impersonales”
Red de vínculos con relaciones “personales” e “impersonales”

Cabe destacar que la relación entre LEONARDO T y ROBERTO M es de dos "grados de separación". Entre LEONARDO T y la llamada telefónica (con identificador 81017) hay un grado de separación, y a su vez entre la llamada telefónica y ROBERTO M existe otro grado de separación. Por lo tanto, cuando se utiliza la identificación impersonal es necesario configurar la resolución de relaciones de manera que soporte múltiples grados de separación. Para aprender a configurar la resolución con múltiples grados de separación consulte la referencia [3] en la sección de Recursos.


Tipos de entidades

De la sección anterior es necesario retomar el concepto de "tipo de entidad". Los tipos de entidad son abstracciones de actores u objetos que existen en la realidad. IBM InfoSphere Identity Insight tiene por default dos tipos de entidades: Personas (PERSON) y búsquedas persistentes (SEARCH). Para utilizar la identificación impersonal es necesario configurar el tipo de entidad que servirá como "intermediaria" entre entidades de tipo persona para definir la relación. Los tipos de entidad pueden representar sucesos (como las llamadas telefónicas), o bien objetos físicos (por ejemplo vehículos, armas, etc.).

La Figura 2 muestra la pantalla para creación de un nuevo tipo de entidad en la Consola de Administración de IBM InfoSphere Identity Insight. Normalmente, es deseable que los nuevos tipos de entidad tengan las mismas características de resolución que la entidad PERSON. Para simplificar el proceso de creación de nuevos tipos, es posible clonar el tipo PERSON, y solamente definir el nombre y descripción del nuevo tipo de entidad.

Figura 2. Creación de un nuevo tipo de entidad
Creación de un nuevo tipo de entidad

Es importante tomar nota del nombre del tipo de entidad (marcado con la etiqueta Type en la imagen anterior), ya que este nombre se utiliza en los archivos utilizados para alimentar datos a IBM InfoSphere Identity Insight.


Ingestión de datos con tipos de entidades propios

Una vez definidos los tipos de entidad necesarios de acuerdo al caso de uso, es posible proceder a preparar los datos para que sean procesados por IBM InfoSphere Identity Insight. Siguiendo con el ejemplo, el Listado 1 muestra los fragmentos del archivo UMF que representan los registros de las personas LEONARDO T y ROBERTO M. Por default, Identity Insight asume que un registro es del tipo PERSON. Los números telefónicos que servirán para definir la relación impersonal se definen como NUMBER de tipo PH.

Listado 1. Fuente de datos de personas

<UMF_ENTITY><DSRC_ACTION>A</DSRC_ACTION><DSRC_CODE>NEUTRAL</DSRC_CODE>
<DSRC_ACCT>5</DSRC_ACCT><DSRC_REF>5</DSRC_REF><NAME><NAME_TYPE>M</NAME_TYPE><FULL_NAME>
LEONARDO
T.</FULL_NAME></NAME><NUMBER><NUM_TYPE>PH</NUM_TYPE><NUM_VALUE>52-
55-5679-
9485
</NUM_VALUE></NUMBER><NUMBER><NUM_TYPE>PH</NUM_TYPE><NUM_VALUE>
52-55-5230-8976</NUM_VALUE></NUMBER><NUMBER><NUM_TYPE>PH</NUM_TYPE>
<NUM_VALUE>52-55-1830-2317</NUM_VALUE></NUMBER>
<
ATTRIBUTE><ATTR_TYPE>DOB</ATTR_TYPE><ATTR_VALUE>18/10/1982</ATTR_VALUE></ATTRIBUTE>
<ATTRIBUTE><ATTR_TYPE>NAT</ATTR_TYPE><ATTR_VALUE>MEX</ATTR_VALUE>
</ATTRIBUTE><ADDRESS><ADDR_TYPE>H</ADDR_TYPE><ADDR1>PERIFERICO
SUR 3871</ADDR1><CITY>MEXICO</CITY><STATE>DF</STATE>
<POSTAL_CODE>08767</POSTAL_CODE><COUNTRY>MEX</COUNTRY></ADDRESS></UMF_ENTITY>


<UMF_ENTITY><DSRC_ACTION>A</DSRC_ACTION><DSRC_CODE>NEUTRAL</DSRC_CODE>
<DSRC_ACCT>9</DSRC_ACCT><DSRC_REF>9</DSRC_REF><NAME><NAME_TYPE>M</NAME_TYPE>
<FULL_NAME>ROBERTO
M.</FULL_NAME></NAME><NUMBER><NUM_TYPE>PH</NUM_TYPE>
<NUM_VALUE>52-55-8210-9450</NUM_VALUE></NUMBER><NUMBER>
<NUM_TYPE>PH</NUM_TYPE>
<NUM_VALUE>52-55-3345-1976</NUM_VALUE></NUMBER><ATTRIBUTE>
<ATTR_TYPE>DOB</ATTR_TYPE><ATTR_VALUE>25/03/1946</ATTR_VALUE></ATTRIBUTE> <ATTRIBUTE><ATTR_TYPE>NAT</ATTR_TYPE><ATTR_VALUE>MEX</ATTR_VALUE>
</ATTRIBUTE><ADDRESS><ADDR_TYPE>B</ADDR_TYPE><ADDR1>MAZARYK
80</ADDR1><CITY>MEXICO</CITY><STATE>DF</STATE>
<POSTAL_CODE>11570</POSTAL_CODE><COUNTRY>MEX</COUNTRY></ADDRESS></UMF_ENTITY>

El Listado 2 tiene el fragmento del UMF con el registro de la llamada telefónica entre LEONARDO T y ROBERTO M. Al observar este registro es posible señalar los detalles:

  • El tipo de la entidad (PH_CALL) debe indicarse explícitamente, dado que esta no es una entidad del tipo PERSON. El tipo de entidad se indica con la etiqueta <ENTITY_TYPE>.
  • El registro tiene dos atributos numéricos, del tipo PH (teléfono). Los valores coinciden con los atributos correspondientes de las personas ROBERTO M y LEONARDO T, respectivamente. Así es como IBM InfoSphere Identity Insight determina que existe una relación entre esas personas y la llamada telefónica, que los vincula de forma impersonal.

Listado 2. Fuente de datos de llamadas telefónicas

<UMF_ENTITY><DSRC_ACTION>A</DSRC_ACTION><DSRC_CODE>CDR</DSRC_CODE>
<DSRC_ACCT>3</DSRC_ACCT><DSRC_REF>3</DSRC_REF><ENTITY_TYPE>PH_CALL</ENTITY_TYPE>
<NUMBER><NUM_TYPE>PH</NUM_TYPE><NUM_VALUE>52-55-8210-9450</NUM_VALUE></NUMBER><NUMBER>
<NUM_TYPE>PH</NUM_TYPE><NUM_VALUE>52-55-1830-2317</NUM_VALUE>
</NUMBER>
</UMF_ENTITY>


Conclusiones

La "Identificación Impersonal" proporcionada por IBM InfoSphere Identity Insight es un mecanismo poderoso que extiende las capacidades del producto para que pueda ser utilizado en una mayor variedad de situaciones. El análisis de llamadas telefónicas es un buen ejemplo de identificación impersonal, ampliamente utilizado en el campo de seguridad e inteligencia. Dada la explosión en el crecimiento de los datos es prioritario contar con una solución que "elimine el ruido" y permita a los analistas concentrarse en la información relevante. IBM InfoSphere Identity Insight cumple con las características necesarias para relacionar tanto atributos personales como impersonales, y de esta manera "conectar los puntos" de información para tomar decisiones de manera más inteligente.


Recursos

  1. Lea el artículo "Use IBM Entity Analytic Solutions to analyze watch lists" para conocer las bases de IBM Identity Insight (antes Entity Analytic Solutions).
  2. Consulte la documentación sobre "Identificación Impersonal" en el Centro de Información de IBM InfoSphere Identity Insight v8.
  3. Aprenda a manipular la "Configuración de grados de separación" en el Centro de Información de IBM InfoSphere Identity Insight v8.

Comentarios

developerWorks: Ingrese

Los campos obligatorios están marcados con un asterisco (*).


¿Necesita un IBM ID?
¿Olvidó su IBM ID?


¿Olvidó su Password?
Cambie su Password

Al hacer clic en Enviar, usted está de acuerdo con los términos y condiciones de developerWorks.

 


La primera vez que inicie sesión en developerWorks, se creará un perfil para usted. La información en su propio perfil (nombre, país/región y nombre de la empresa) se muestra al público y acompañará a cualquier contenido que publique, a menos que opte por la opción de ocultar el nombre de su empresa. Puede actualizar su cuenta de IBM en cualquier momento.

Toda la información enviada es segura.

Elija su nombre para mostrar



La primera vez que inicia sesión en developerWorks se crea un perfil para usted, teniendo que elegir un nombre para mostrar en el mismo. Este nombre acompañará el contenido que usted publique en developerWorks.

Por favor elija un nombre de 3 - 31 caracteres. Su nombre de usuario debe ser único en la comunidad developerWorks y debe ser distinto a su dirección de email por motivos de privacidad.

Los campos obligatorios están marcados con un asterisco (*).

(Por favor elija un nombre de 3 - 31 caracteres.)

Al hacer clic en Enviar, usted está de acuerdo con los términos y condiciones de developerWorks.

 


Toda la información enviada es segura.


static.content.url=http://www.ibm.com/developerworks/js/artrating/
SITE_ID=90
Zone=Information mgmt
ArticleID=755055
ArticleTitle=Identificación Impersonal en IBM InfoSphere Identity Insight
publish-date=09052011