Blockchain y big data se encuentran entre las principales tecnologías emergentes destinadas a revolucionar varias industrias, cambiando radicalmente la forma en que se gestionan las empresas y las organizaciones. Se podría suponer que estas tecnologías son mutuamente excluyentes: cada una forja caminos únicos y se aplica de forma independiente entre sí.
Pero eso estará fuera de lugar.
Blockchain, al igual que la ciencia de datos, está transformando gradualmente la forma en que operan varias industrias. Y mientras que la ciencia de datos se centra en aprovechar los datos para una administración adecuada, blockchain garantiza la confianza de los datos manteniendo un libro mayor descentralizado.
La pregunta es: ¿hay algún lugar donde estos dos conceptos se intercepten?
¿Qué se logrará cuando estas dos tecnologías se apliquen simultáneamente?
En pocas palabras, ¿cómo puede blockchain revolucionar la ciencia de datos?
Para responder a estas preguntas, será útil comprender mejor Blockchain y ciencia de datos por separado.
Blockchain es básicamente un libro mayor desconfiado que registra las transacciones económicas de manera que no puedan manipularse. La tecnología cobró importancia como resultado del interés en bitcoin y las criptomonedas en general, pero desde entonces ha encontrado relevancia en el registro no solo de transacciones de criptomonedas, sino de cualquier cosa de valor. Conociendo las capacidades de esta tecnología emergente, los desarrolladores y entusiastas de la tecnología se han puesto a trabajar diseñando caso de uso tras caso de uso para blockchain.
La demanda de desarrolladores de blockchain ha aumentado en los últimos años, al igual que los proyectos que trabajan en diferentes aplicaciones de blockchain. Los informes de plataformas independientes como UpWork han mantenido las habilidades de blockchain como las habilidades más demandadas. De manera similar, se dice que los profesionales en otras áreas, como los estudios jurídicos, tienen una gran ventaja si tienen habilidades de blockchain, o al menos tienen una comprensión de la tecnología.
Boletín de la industria
Manténgase al día sobre las tendencias más importantes e intrigantes de la industria sobre IA, automatización, datos y más con el boletín Think. Consulte la Declaración de privacidad de IBM.
Su suscripción se entregará en inglés. En cada boletín, encontrará un enlace para darse de baja. Puede gestionar sus suscripciones o darse de baja aquí. Consulte nuestra Declaración de privacidad de IBM para obtener más información.
La ciencia de datos busca extraer conocimiento y insight de datos estructurados y no estructurados. Este campo abarca estadísticas, análisis de datos, machine learning y otros métodos avanzados utilizados para comprender y analizar procesos reales utilizando datos.
Los datos a menudo se describen como el nuevo petróleo en la jerga económica, razón por la cual las empresas líderes, incluidas las famosas GAFA (Google, Amazon, Facebook y Apple), controlan una gran cantidad de datos. Algunas aplicaciones comunes de la ciencia de datos se ven en protocolos de motores de Internet, anuncios digitales y servicios de recomendación. Se ha encontrado que el análisis de datos, un aspecto clave de la ciencia de datos, es relevante en la industria de la atención médica para rastrear el tratamiento de pacientes y el flujo de equipamiento; en viajes, un juego para mejorar la experiencia; para la gestión de la energía, así como muchas otras industrias.
También existe una demanda aparentemente insaciable de científicos de datos que puedan proporcionar más insights con los datos y ayudar a resolver más problemas. Esto es aún más pronunciado cuando se considera el big data, un aspecto avanzado de la ciencia de datos que se ocupa de cantidades extremadamente grandes de datos que no pueden manejarse con los métodos tradicionales de procesamiento de datos.
A diferencia de áreas como Fintech, atención médica y cadena de suministro, donde la tecnología blockchain ahora es muy familiar, esta no se ha explorado ampliamente en aspectos de la ciencia de datos. Para algunos, la relación entre los conceptos no está clara, si no es que es inexistente.
Para empezar, tanto blockchain como la ciencia de datos tratan datos: la ciencia de datos analiza los datos para obtener insights aplicables en la práctica, mientras que blockchain registra y valida los datos. Ambos utilizan algoritmos creados para regular las interacciones con diversos segmentos de datos. Un tema común que pronto notará es este: “ciencia de datos para la predicción; blockchain para la integridad de los datos”.
La ciencia de datos, al igual que cualquier avance tecnológico, tiene sus propios desafíos y limitaciones que, cuando se abordan, liberarán todas sus capacidades. Algunos de los principales desafíos para la ciencia de datos incluyen datos inaccesibles, problemas de privacidad de datos y datos sucios.
El control de los datos sucios (o información errónea) es un área en la que la tecnología blockchain puede tener un impacto positivo en el campo de la ciencia de datos en gran medida. Según una encuesta de 2017 a 16 000 profesionales de datos, la inclusión de datos sucios, como datos duplicados o incorrectos, se identificó como el mayor desafío para la ciencia de datos. A través de un algoritmo de consenso descentralizado y criptografía, blockchain valida los datos, lo que hace que sea casi imposible manipularlos debido a la enorme cantidad de potencia informática que se requerirá.
De nuevo, a través de su sistema descentralizado, la tecnología blockchain garantiza la seguridad y privacidad de los datos. La mayoría de los datos se almacenan en servidores centralizados que a menudo son el objetivo de los ciberatacantes; los diversos informes de hacks y violaciones de seguridad demuestran el alcance de la amenaza. Blockchain, por otro lado, restaura el control de los datos a las personas que los generan, lo que hace que sea una tarea difícil para los delincuentes cibernéticos acceder y manipular datos a gran escala.
Si grande se refiere a la cantidad, dice Maria Weinberger de Janexter, blockchain a la calidad. Esto sigue al entendimiento de que blockchain se centra en validar datos, mientras que la ciencia de datos o big data implica hacer predicciones a partir de grandes cantidades de datos.
Blockchain ha traído una forma completamente nueva de gestionar y operar con datos, ya no desde una perspectiva central donde todos los datos deben reunirse, sino de una manera descentralizada donde los datos pueden analizarse directamente desde el perímetro de los dispositivos individuales. Blockchain se integra con otras tecnologías avanzadas, como soluciones en la nube, inteligencia artificial (IA) e Internet de las cosas (IoT).
Además, los datos validados generados a través de la tecnología blockchain vienen estructurados y completos, además del hecho de que son inmutables, como se mencionó anteriormente. Otra área importante en la que los datos generados por blockchain se convierten en un impulso para big data es en la integridad de los datos, ya que blockchain determina el origen de los datos a través de sus cadenas vinculadas.
Hay al menos cinco formas específicas en que los datos de blockchain pueden ayudar a los científicos de datos en general.
Los datos registrados en blockchain son confiables porque deben haber pasado por un proceso de verificación que garantiza su calidad. También proporciona transparencia, ya que se pueden rastrear las actividades y transacciones que tienen lugar en la red blockchain.
El año pasado, Lenovo presentó este caso de uso de la tecnología blockchain para detectar documentos y formularios fraudulentos. Los gigantes de la PC utilizaron la tecnología blockchain para validar documentos físicos que estaban codificados con firmas digitales. Las firmas digitales son procesadas por computadoras y la autenticidad del documento se verifica a través de un registro de blockchain.
La mayoría de las veces, la integridad de los datos se garantiza cuando los detalles del origen y las interacciones relacionadas con un bloque de datos se almacenar en Blockchain y se verifican automáticamente antes de que se pueda actuar en consecuencia.
Debido a que blockchain emplea algoritmos de consenso para verificar las transacciones, es imposible que una sola unidad suponga una amenaza para la red de datos. Un nodo (o unidad) que comienza a actuar de manera anormal puede identificarse y eliminarse fácilmente de la red.
Debido a que la red está tan distribuida, es casi imposible que una sola parte genere suficiente potencia computacional para alterar los criterios de validación y permitir la entrada de datos no deseados en el sistema. Para alterar las reglas de blockchain, la mayoría de los nodos deben agruparse para crear un consenso. Esto no será posible para un solo actor malicioso.
Los datos de blockchain, al igual que otros tipos de datos, se pueden analizar para revelar insights valiosos sobre los comportamientos, las tendencias y, como tales, se pueden utilizar para predecir resultados futuros. Además, blockchain proporciona datos estructurados recopilados de individuos o dispositivos individuales.
En el análisis predictivo, los científicos de datos se basan en grandes conjuntos de datos para determinar con buena precisión el resultado de eventos sociales como las preferencias del cliente, el valor de vida del cliente, los precios dinámicos y las tasas de abandono en relación con las empresas. Sin embargo, esto no se limita a los insights empresariales, ya que casi cualquier evento se puede predecir con el análisis de datos correcto, ya sean sentimientos sociales o marcadores de inversión.
Y debido a la naturaleza distribuida de blockchain y la enorme potencia computacional disponible a través de ella, los científicos de datos incluso en organizaciones más pequeñas pueden llevar a cabo extensas tareas de análisis predictivo. Estos científicos de datos pueden utilizar la potencia computacional de varios miles de computadoras conectadas en una red Blockchain como un servicio basado en la nube para analizar los resultados sociales en una escala que de otro modo no habría sido posible.
Como se ha demostrado en los sistemas financieros y de pago, blockchain permite transacciones transfronterizas en tiempo real. Varios bancos e innovadores fintech están explorando ahora blockchain porque permite una liquidación rápida (de hecho, en tiempo real) de grandes sumas sin importar las barreras geográficas.
De la misma manera, las organizaciones que requieren análisis de datos en tiempo real a gran escala pueden recurrir a un sistema habilitado para blockchain para lograrlo. Con blockchain, los bancos y otras organizaciones pueden observar cambios en los datos en tiempo real, lo que permite tomar decisiones rápidas, ya sea para bloquear una transacción sospechosa o rastrear actividades anormales.
En este sentido, los datos obtenidos de los estudios de datos se pueden almacenar en una red blockchain. De esta manera, los equipos de proyecto no repiten el análisis de datos ya realizado por otros equipos ni reutilizan erróneamente datos que ya se han utilizado. Además, una plataforma blockchain puede ayudar a los científicos de datos a monetizar su trabajo, probablemente intercambiando resultados de análisis almacenados en la plataforma blockchain.
Blockchain, como se ha señalado, se encuentra en sus etapas iniciales, aunque puede no parecerlo debido a la exageración que ha recibido la tecnología en un corto período. Uno esperaría que a medida que la tecnología madure y haya más innovaciones alrededor de ella, se identificarán y explorarán más casos de uso concretos, y la ciencia de datos siendo un área que se beneficiará de esto.
Dicho esto, se han planteado algunos desafíos sobre su impacto en la ciencia de datos, especialmente en big data, que requiere el manejo de cantidades excepcionalmente grandes de datos. Una preocupación es que la aplicación de blockchain en este sentido será muy costosa. Esto se debe a que el almacenamiento de datos en blockchain es costoso en comparación con los medios tradicionales. Los bloques manejan cantidades relativamente pequeñas de datos en comparación con los grandes volúmenes de datos recopilados por segundo para big data y otras tareas de análisis de datos.
La forma en que blockchain evolucione para abordar estas preocupaciones y proceder a interrumpir el espacio de la ciencia de datos será particularmente interesante porque, como hemos visto, la tecnología tiene un enorme potencial para transformar la forma en que gestionamos y utilizamos los datos.
De vez en cuando, invitamos a líderes de opinión de la industria, expertos académicos y socios a compartir sus opiniones e insights sobre las tendencias actuales en blockchain al blog Blockchain Pulse. Si bien las opiniones en estas entradas en el blog son propias y no reflejan necesariamente los puntos de vista de IBM, este blog se esfuerza por dar la bienvenida a todos los puntos de vista a la conversación.
Optimice su transformación digital con las soluciones de nube híbrida de IBM, creadas para optimizar la escalabilidad, la modernización y la integración perfecta en toda su infraestructura de TI.
Desbloquee todo el potencial de la tecnología de blockchain con la consultoría y los servicios de IBM, diseñados para acelerar la transformación del negocio a través de soluciones escalables, seguras e innovadoras.
IBM Blockchain Platform: Hyperledger Fabric Support Edition ofrece acuerdos de nivel de servicio y soporte empresarial las 24 horas, los 7 días de la semana para Hyperledger Fabric, la norma de hecho para las plataformas blockchain empresariales de la Fundación Linux.