Un producto de datos es un paquete reutilizable y autónomo que combina datos, metadatos, semántica y plantillas para dar soporte a diversos casos de uso empresarial. Puede incluir componentes como conjuntos de datos, paneles de control, informes, modelos de machine learning (ML), consultas predefinidas o canalizaciones de datos.
Los productos de datos se desarrollan con un enfoque de pensamiento de producto y aplicando los principios tradicionales de desarrollo de productos. Este enfoque implica comprender las necesidades de los usuarios, priorizar las características de alto valor e iterar en función del feedback. En última instancia, trata los datos como un producto diseñado para resolver problemas específicos de los usuarios.
Los productos de datos están diseñados para ser detectables, interoperables y procesables. Permiten que todos, desde usuarios empresariales y analistas de datos hasta científicos de datos, administradores de datos e ingenieros, extraigan un valor significativo de los datos atrapados dentro de una empresa.
El concepto de productos de datos ganó protagonismo en 2019 cuando Zhamak Dehghani, director de tecnología de la consultora de TI ThoughtWorks, introdujo los productos de datos como un componente central de la arquitectura de malla de datos. Una malla de datos es una arquitectura de datos descentralizada que organiza los datos por dominios empresariales específicos (como marketing, ventas y servicio de atención al cliente) para proporcionar más propiedad a los productores de un conjunto de datos determinado.
Para funcionar eficazmente, un producto de datos debe presentar varias características clave:
Los stakeholders deben poder descubrir y encontrar con facilidad el producto de datos adecuado para su caso de uso.
Un producto de datos debe incluir metadatos claros y estar estructurado de acuerdo con dominios comerciales específicos, lo que permite a los consumidores de datos y a los equipos de dominio interpretar y aplicar la información de manera efectiva.
Los productos de datos deben integrarse de manera fluida con otros sistemas para ofrecer conocimientos coherentes en todas las plataformas.
Los productos de datos deben empaquetarse como una unidad cohesiva que pueda distribuirse fácilmente en toda la organización, garantizando un uso cohesivo y una comprensión cohesiva entre los equipos.
Un producto de datos debe tener controles de acceso y medidas de seguridad para garantizar que solo los usuarios autorizados puedan acceder a los datos manteniendo el cumplimiento.
Un producto de datos bien diseñado se construye a partir de componentes modulares que pueden reutilizarse para crear nuevos productos de datos o conocimientos derivados, lo que aumenta la eficiencia y reduce los esfuerzos redundantes.
McKinsey informa que las empresas basadas en datos tienen 23 veces más probabilidades de adquirir clientes y 19 veces más probabilidades de ser rentables. Sin embargo, a pesar de la creciente demanda de toma de decisiones basada en datos, muchas organizaciones siguen enfrentándose a obstáculos como silos de datos, dependencia de proveedores y riesgos de cumplimiento debido a marcos de gobierno de datos insuficientes.
Para abordar estos desafíos, algunas organizaciones han adoptado un enfoque de datos como producto, tratando los datos como un activo gestionado y consumible en lugar de un subproducto de las operaciones.
Las metodologías de datos como producto hacen hincapié en la estructuración y el gobierno de los datos para fundamentar las decisiones empresariales y mejorar la experiencia del usuario. Partiendo de esa base, los productos de datos ofrecen un enfoque estructurado y de autoservicio para la gestión de datos, lo que reduce la dependencia de los equipos técnicos mientras se apoya la toma de decisiones en tiempo real.
Las organizaciones que invierten en productos de datos pueden experimentar mejoras en el acceso a los datos, la interoperabilidad, el almacenamiento de datos y el gobierno. En todos los sectores, los productos de datos tienen el potencial de mejorar la automatización, respaldar la toma de decisiones basada en datos y ayudar a las empresas a alinear sus estrategias de datos con objetivos empresariales a largo plazo. Al aprovechar plataformas de datos robustas, modelos de machine learning y herramientas de visualización, las organizaciones pueden empoderar a los equipos para maximizar sus datos.
Los productos de datos a menudo logran estas ventajas al potenciar varios roles dentro de una organización:
La forma en que las organizaciones gestionan los datos ha evolucionado de un enfoque pasivo, basado en activos, a una estrategia activa, impulsada por productos.
Tradicionalmente, las empresas han tratado los datos principalmente como algo que reunir y almacenar. Este enfoque coloca los datos en un almacén de datos central o en un sistema fuente, organizándolos por áreas temáticas (como finanzas o marketing) y asignando la propiedad a equipos centralizados. El éxito se mide a menudo por el volumen de datos, como los terabytes almacenados, con la esperanza de que por el simple hecho de tener más datos, los empleados los utilicen.
Sin embargo, los metadatos suelen definirlos los departamentos de TI y no son fáciles de usar para los consumidores de datos. Como resultado, muchos esfuerzos con los activos de datos giran en torno al análisis descriptivo y la elaboración de informes, mirando hacia atrás para ver qué ha pasado en lugar de utilizar los datos de forma proactiva para resolver las cuestiones empresariales.
Por el contrario, ver los datos como un producto cambia el enfoque del almacenamiento al uso y la creación de valor. Los productos de datos tienen una experiencia de ciclo de vida del producto de datos y se diseñan, prueban e iteran, al igual que los productos de software que siguen una metodología ágil o DataOps.
La propiedad es específica del dominio (por ejemplo, un producto de datos de marketing gestionado por expertos en marketing), lo que mantiene los datos relevantes y de alta calidad. Los datos también se seleccionan para necesidades de consumo específicas, con metadatos enriquecidos impulsados por el negocio. Esto garantiza que los usuarios empresariales puedan descubrir y comprender fácilmente los productos de datos.
Dado que los propietarios de los datos asumen la responsabilidad de los productos de datos, existe una monitorización continua del uso, la calidad y el valor derivado de un producto a través de bucles de feedback con los usuarios finales.
El éxito se mide por cómo los datos mejoran la toma de decisiones, impulsan los ingresos o reducen los costes, en lugar de simplemente por cuántos terabytes se almacenan. Como resultado, las iniciativas de productos de datos pueden resolver preguntas empresariales con análisis avanzados, como el modelado predictivo y prescriptivo.
Un producto de datos bien estructurado consta de varios componentes que permiten la funcionalidad y la usabilidad dentro del ecosistema de datos de una organización:
Los productos de datos se pueden clasificar según la calidad de los datos y los niveles de refinamiento. Los tipos de productos de datos incluyen:
Productos de datos de los sistemas de origen. Este tipo de producto de datos sin procesar (o con una transformación mínima) suele ser el bloque de construcción fundacional para casos de uso como la ciencia de datos y la IA generativa.
Productos de datos seleccionados y consolidados en datos maestros que estandarizan las entidades empresariales clave (como clientes o productos) para garantizar la coherencia entre sistemas.
Productos de datos refinados, procesados y diseñados para respaldar la toma de decisiones y generar conocimientos que se pueden ejecutar.
Al seguir un ciclo de vida estructurado de gestión de productos, los equipos de datos pueden crear productos de datos que sean continuamente valiosos, escalables y alineados con las cambiantes necesidades empresariales.
Las etapas clave del ciclo de vida de un producto de datos incluyen:
Las organizaciones de todos los sectores confían en los productos de datos para impulsar el valor empresarial, respaldar iniciativas estratégicas y resolver problemas empresariales críticos.
Algunos ejemplos reales de productos de datos son:
El desarrollo exitoso de productos de datos requiere un enfoque estratégico que incluya comprender el consumo de datos, mapear las interacciones de datos, probar el valor de mercado e iterar para escalar.
El primer paso para crear un producto de datos es analizar el consumo de datos dentro de la organización. Este paso implica identificar a los usuarios objetivo, comprender los datos que consumen y por qué esos datos son importantes para ellos.
Revisar el uso de los datos en términos de volumen, frecuencia, sensibilidad y tipo proporciona conocimiento sobre qué conjuntos de datos tienen más valor. Al dar prioridad a los grupos de usuarios de alto impacto, las organizaciones pueden ayudar a garantizar que los esfuerzos iniciales se centren en las áreas con mayor potencial de impacto empresarial.
Una vez que los patrones de consumo de datos están claros, el siguiente paso es mapear el viaje de los datos. La creación de mapas detallados de las interacciones de datos del mundo real ayuda a visualizar cómo fluyen los datos a través de diferentes sistemas y equipos.
Estos mapas pueden servir como base para generar ideas sobre nuevos casos de uso generadores de ingresos para productos de datos. Desarrollar hipótesis sobre cómo los productos de datos pueden mejorar los procesos empresariales puede ayudar a las organizaciones a empezar a explorar formas de convertir los datos sin procesar en conocimientos significativos y que se pueden ejecutar.
Con conocimiento validado, el siguiente paso es iterar y escalar. En lugar de depender únicamente de los equipos centrales de TI, las organizaciones pueden fomentar la agilidad y la innovación capacitando a los dominios y equipos empresariales para perfeccionar y mejorar el producto de datos. Una vez realizadas las mejoras, el proyecto puede ampliarse a más equipos y dominios, garantizando que el producto de datos se escale de forma eficaz y siga impulsando el valor empresarial.
Gestione los datos como un producto a lo largo del ciclo de vida. Controle el ciclo de vida de los productos de datos, desde su incorporación hasta su retirada, con un sólido sistema de versionado, mantenimiento y actualización de los mismos.
Transforme rápidamente los datos sin procesar en conocimiento práctico, unifique el gobierno, la calidad, el linaje y el uso compartido de los datos, y capacite a los consumidores de datos con datos fiables y contextualizados.
Desbloquee el valor de los datos empresariales con IBM Consulting y cree una organización impulsada por conocimientos que ofrezca ventajas empresariales.