Aproximadamente una vez al año, generalmente por esta época y por razones desconocidas, me encuentro viendo la película "La búsqueda". Supongo que hay algo en ver a Nicolas Cage conectar los puntos para encontrar un tesoro escondido que no puedo dejar pasar cuando lo veo en la televisión. Sé que no estoy solo en esto; ya sea Nic robando la Declaración de Independencia o Indiana Jones buscando el santo grial, reunir pistas para completar una misión es una historia tradicional. Durante décadas, las empresas y los directores de datos (específicamente una vez que se creó el puesto) han estado buscando su propio santo grial. Es decir, quieren una única fuente de la verdad para los datos: una que sea fácilmente accesible, gobernada de forma responsable, que funcione con los sistemas actuales, que se integre en un conjunto de datos dispar y que no sea demasiado costosa. A medida que aprenden más sobre el tejido de datos, parece que es el protagonista perfecto. E, igual de sorprendentemente, conectar datos juega un papel crucial para obtener el tesoro que se busca.
Durante Think 2021, IBM anunció el lanzamiento de un tejido de datos modular y componible que permite una orquestación de datos dinámica e inteligente en un panorama distribuido, creando una red de información disponible al instante para los consumidores de datos. Sus capacidades de consumo de autoservicio permiten a los usuarios tener una visión completa de sus datos, conectándolos como uno solo, independientemente de dónde residan los datos o de lo aislados que estuvieran antes. Este acceso a datos optimizado significa que las empresas pueden reducir inmediatamente la cantidad de duplicación de datos y los procesos de migración requeridos. Además, los datos se pueden consultar donde están. Como resultado, las empresas pueden acelerar los resultados y acceder a datos más frescos. La incorporación de Watson Query (antes AutoSQL) proporciona acceso a bases de datos, almacenes de datos, data lakes y datos en streaming, y la posibilidad de ejecutar consultas sin cambios manuales adicionales ni movimientos de datos. Y como todos los datos son visibles y accesibles desde un único punto, la catalogación automatizada de datos y la aplicación de políticas de gobierno de datos es mucho más fácil. Las empresas ya no necesitaban aplicar estos componentes cruciales a través de una multitud de silos individuales.
Hoy, poco más de seis meses después de ese anuncio inicial, IBM presenta nuevas capacidades de tejido de datos que conectan aún más los datos y los hacen fácilmente accesibles para su uso incluso en los entornos regulatorios más estrictos. Lo más importante es la inclusión del proceso de datos distribuido. Los clientes ahora pueden ejecutar tiempos de ejecución en la nube de forma remota utilizando IBM® Cloud Satellite, lo que significa que las cargas de trabajo se pueden ejecutar dondequiera que residan los datos[1]. Gracias a esta capacidad de ejecutar tiempos de ejecución in situ, las necesidades de movimiento de datos se reducen aún más, lo que ayuda a ahorrar hasta un 47 %[2] al minimizar los costes de salida de datos, eliminar la necesidad de utilizar diferentes herramientas en diferentes cargas de trabajo y mantener la soberanía de los datos al permitir que los datos permanezcan en el área geográfica en la que se creó. Como resultado, se obtiene una mejora del rendimiento del 195 %[3] al ubicar la carga de trabajo junto con los datos.
También se están introduciendo funciones avanzadas de privacidad de datos en el tejido de datos. Gracias a esta capacidad, además del enmascaramiento dinámico de datos estructurados, el enmascaramiento de datos no estructurados puede aplicarse automáticamente de manera consistente, en lugar del proceso manual típico. Se pueden enviar copias de datos estructurados o no estructurados enmascarados estáticos a las fuentes de datos de destino deseadas por los clientes. Esta capacidad es especialmente importante para facilitar la anonimización de datos de entrenamiento y la creación de conjuntos de pruebas de datos. En otras palabras, ofrece una forma más en la que el tejido de datos permite a las empresas aprovechar al máximo sus datos respetando la privacidad de sus clientes y las normativas locales.
Aunque creemos en el valor de una infraestructura de datos sólida para todas las empresas, también creemos que cada organización tiene retos únicos que diferencian su implantación de la de cualquier otra. Mientras considera cómo un tejido de datos puede ayudarle a obtener la utopía basada en datos que ha estado persiguiendo, permítanos ayudarle compartiendo nuestra experiencia. Puede programar una llamada sin coste con uno de nuestros expertos o aprender más sobre el tejido de datos a su propio ritmo con este útil documento técnico.
