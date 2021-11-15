Aproximadamente una vez al año, generalmente en esta época y por razones desconocidas, me encuentro viendo la película National Treasure. Supongo que hay algo en ver a Nicolas Cage conectar los puntos para encontrar un tesoro escondido que no puedo dejar pasar cuando lo veo en la televisión. Sé que no estoy solo en esto; ya sea Nic robando la Declaración de Independencia o Indiana Jones buscando el santo grial, reunir pistas para completar una misión es una historia tradicional. Durante décadas, las empresas y los Chief Data Officers, específicamente una vez que se creó el puesto, han estado buscando su propio santo grial. Es decir, quieren una única fuente de la verdad para los datos: una que sea fácilmente accesible, gobernada de manera responsable, que funcione con los sistemas actuales, que se integre en un patrimonio de datos dispar y que no sea demasiado costosa. A medida que aprenden más sobre el tejido de datos, parece ser el protagonista perfecto. Y, igual de sorprendentemente, conectar datos juega un papel crucial para obtener el tesoro que se busca.
Durante Think 2021, IBM anunció el lanzamiento de un tejido de datos modular y componible que permite una orquestación de datos dinámica e inteligente en un escenario distribuido, creando una red de información disponible al instante para los consumidores de datos. Sus capacidades de consumo de autoservicio permiten a los usuarios tener una visión completa de sus datos, conectándolos como uno solo, independientemente de dónde residan los datos o de lo aislados que estuvieran antes. Este acceso optimizado a los datos significa que las empresas pueden reducir inmediatamente la cantidad de procesos de duplicación y migración de datos necesarios. Además, los datos se pueden consultar donde residen. Como resultado, las empresas pueden acelerar los resultados y acceder a datos más actualizados. La incorporación de Watson Query (anteriormente AutoSQL) proporciona acceso a bases de datos, almacenes de datos, lagos de datos y datos de transmisión, y la capacidad de ejecutar consultas sin cambios manuales adicionales ni movimiento de datos. Y como todos los datos son visibles y accesibles desde un único punto, la catalogación automatizada de datos y la aplicación de políticas de gobernanza de datos resultan mucho más sencillas. Las empresas ya no necesitaban aplicar estos componentes cruciales en innumerables silos individuales.
Hoy, poco más de seis meses después de ese anuncio inicial, IBM presenta nuevas capacidades de tejido de datos que conectan aún más los datos y los ponen a disposición para su uso incluso en los entornos normativos más estrictos. Lo más importante es la inclusión del procesamiento de datos distribuido. Los clientes ahora pueden ejecutar tiempos de ejecución en la nube de forma remota utilizando IBM Cloud Satellite, lo que significa que las cargas de trabajo se pueden ejecutar dondequiera que residan los datos[1]. Debido a esta capacidad de ejecutar tiempos de ejecución en el lugar, las necesidades de movimiento de datos se reducen aún más, lo que ayuda a ahorrar hasta un 47 %[2] al minimizar los costos de salida de datos, eliminar la necesidad de usar diferentes herramientas en diferentes cargas de trabajo y mantener la soberanía de los datos al permitir que los datos permanecer en el área geográfica en la que fue creada. 195 %[3] mejoras en el rendimiento al co-locar la carga de trabajo con los datos como resultado.
También se están introduciendo características Advanced de privacidad de datos en el tejido de datos. A través de esta capacidad, además del enmascaramiento dinámico de datos estructurados, el enmascaramiento de datos no estructurados ahora se puede aplicar automáticamente de manera coherente, a diferencia del típico proceso manual. Se pueden enviar copias de datos estructurados o no estructurados enmascarados estáticos a las fuentes de datos de destino deseadas de los clientes. Esta capacidad es especialmente importante para facilitar la anonimización de datos de entrenamiento y la creación de conjuntos de pruebas de datos. En otras palabras, ofrece una forma más en la que el tejido de datos permite a las compañías aprovechar al máximo sus datos respetando la privacidad de sus clientes y las normativas locales.
Si bien creemos en el valor de una infraestructura de datos sólida para cada negocio, también creemos que cada organización tiene desafíos únicos que diferencian su implementación de la de cualquier otra. Mientras considera cómo un tejido de datos puede ayudarle a obtener la utopía basada en datos que ha estado persiguiendo, permítanos ayudarle compartiendo nuestra experiencia. Puedes concertar una llamada gratis con uno de nuestros expertos o aprender más sobre el tejido de datos a tu propio ritmo con este útil trabajo inteligente.
