La integridad de los datos es la garantía de que los datos de una organización sean precisos, completos y coherentes en cualquier punto de su ciclo de vida. Mantener la integridad de los datos implica salvaguardar los datos de una organización contra pérdidas, fugas e influencias corruptoras.
Las organizaciones confían en datos limpios para la toma de decisiones, la predicción del comportamiento del consumidor, la evaluación de las tendencias del mercado y la seguridad contra las filtraciones de datos. A medida que los volúmenes de datos dentro de las organizaciones se disparan y esos datos se utilizan para tomar decisiones sobre el futuro de la empresa, maximizar la integridad de los datos se vuelve cada vez más importante.
Para lograr la integridad de los datos, las organizaciones se adhieren a procesos que incluyen verificación de errores, procedimientos de validación y estrictas medidas de seguridad, como cifrado, control de acceso y copias de seguridad. El objetivo de la integridad de los datos es ayudar a garantizar que el análisis de datos se base en información confiable respaldada por marcos regulatorios, como el RGPD, y que la información confidencial esté protegida contra el acceso o la explotación no autorizados.
La integridad de los datos no se limita a una sola herramienta o plataforma. En cambio, es un enfoque integral que implica el esfuerzo colectivo de la infraestructura tecnológica de una organización, las políticas y las personas que trabajan con el sistema de datos para garantizar que los datos sigan siendo un activo confiable.
Boletín de la industria
Manténgase al día sobre las tendencias más importantes e intrigantes de la industria sobre IA, automatización, datos y más con el boletín Think. Consulte la Declaración de privacidad de IBM.
Su suscripción se entregará en inglés. En cada boletín, encontrará un enlace para darse de baja. Puede gestionar sus suscripciones o darse de baja aquí. Consulte nuestra Declaración de privacidad de IBM para obtener más información.
La integridad de los datos es similar al control de calidad en las empresas tradicionales orientadas a los productos y garantiza que la materia prima sea correcta, segura y apropiada para el uso previsto.
La dependencia de buenos datos en analytics de negocio, interacciones con clientes y cumplimiento destaca la importancia de la integridad de los datos en toda la organización. El dicho "basura entra, basura sale" es muy relevante cuando se emplean datos para fundamentar decisiones comerciales acertadas, tratar a los clientes de manera justa y correcta y facilitar informes comerciales precisos que cumplan con las regulaciones de la industria. Los datos incorrectos, una vez operativos, conducen a resultados no deseados.
Las organizaciones necesitan mantener los datos completos, precisos, coherentes y seguros a lo largo de su ciclo de vida. La integridad de los datos ayuda a promover esta integridad al mantener todos los elementos de datos intactos, sin alteraciones, truncamientos o pérdidas, y al evitar cambios que podrían distorsionar el análisis y poner en peligro las condiciones de prueba consistentes. Sin procesos de integridad de datos, las organizaciones no podrían verificar que los datos futuros coincidan con los datos anteriores, independientemente de los patrones de acceso. Además, la integridad de los datos sirve para reforzar la seguridad de los datos controlando el acceso y protegiéndolos contra la explotación no autorizada a través de la autenticación, la autorización, el cifrado y las estrategias integrales de protección de datos, incluidas las copias de seguridad y el registro de acceso.
Más allá de la toma de decisiones, la integridad de los datos es crucial para proteger la información personal y confidencial de los interesados. Los errores en el manejo de los datos de los clientes, ya sea a través de errores humanos o ataques cibernéticos, pueden conducir a violaciones de la privacidad y la confianza, tergiversación de las personas y daños potencialmente graves a la reputación. Esto es igualmente cierto para los datos de propiedad menos sensibles, donde las imprecisiones pueden sesgar la comprensión y el tratamiento de la empresa hacia sus usuarios, afectando su inclusión en tendencias e interacciones con la marca. Mantener la integridad de los datos, por lo tanto, no es simplemente un problema operativo o de cumplimiento, sino un imperativo estratégico que impacta cada faceta de la relación de una organización con sus clientes y su posición en el mercado.
El concepto central de la integridad de los datos consiste en garantizar la usabilidad del conjunto de datos para fines analíticos de la actividad principal. Sustenta la estabilidad, el rendimiento, la capacidad de recuperación y la seguridad de los datos.
El problema es que los datos pueden verse comprometidos de varias maneras: por error humano, errores de transferencia involuntarios, virus, errores de software, malware, hacking, hardware comprometido y daños físicos a los dispositivos. Las organizaciones pueden lograr la integridad mediante restricciones de integridad y definiendo las reglas y procedimientos relacionados con el trabajo con datos. Las restricciones de integridad cubren acciones, como la eliminación, inserción y alteración de la información, lo que permite la aplicación de la integridad en sistemas comunes, como bases de datos de planeación de recursos empresariales (ERP), sistemas de gestión de relaciones con el cliente (CRM) y sistemas de gestión de la cadena de suministro.
Cinco tipos de integridad de datos ayudan a las organizaciones a verificar y mantener la calidad de sus datos:
Una característica de los sistemas de bases de datos relacionales que almacena datos dentro de tablas, que se pueden usar y vincular de varias maneras. La integridad de la entidad se basa en claves y valores únicos creados para identificar los datos, lo que garantiza que los mismos datos no aparezcan en la lista varias veces y que los campos de la tabla se rellenen correctamente.
Protege la exactitud, corrección e integridad de los datos durante su almacenamiento y recuperación. La integridad física puede ver comprometida por cortes de electricidad, erosión del almacenamiento, piratas informáticos y catástrofes naturales.
Una serie de procesos que garantizan que los datos se almacenen y empleen de manera uniforme. Las estructuras de base de datos incorporan reglas que imponen la presencia de registros coincidentes en tablas vinculadas, lo que evita los registros huérfanos y mantiene la coherencia de los datos en toda la base de datos.
Un dominio se define por un conjunto específico de valores para las columnas de una tabla, incluidas las restricciones y reglas que rigen la cantidad, el formato y los datos que se pueden ingresar. La integridad del dominio ayuda a garantizar la precisión de los elementos de datos dentro de un dominio.
Cuando los usuarios crean reglas y restricciones en torno a los datos para alinearse con sus especificaciones únicas. Este método generalmente se emplea con otros procesos que no garantizan la seguridad de los datos.
La integridad de datos, la calidad de datos y la seguridad de datos son conceptos fundamentales en la gestión de datos empresariales y, a menudo, se emplean indistintamente de forma errónea.
La calidad de datos se centra en las condiciones de los datos en función de factores, como la exactitud, la exhaustividad, la unicidad y la actualidad.
La seguridad de datos aborda la protección de los datos contra el acceso no autorizado, las filtraciones y otras formas de conducta indebida. Abarca las tecnologías, políticas y prácticas desplegadas para salvaguardar los datos a lo largo de su ciclo de vida, garantizando que solo el personal autorizado pueda acceder a la información confidencial para mantener la confidencialidad y la confianza.
La integridad de los datos es el principio general que incluye elementos de calidad y seguridad de los datos. Sirve para verificar la precisión y coherencia de los datos a lo largo de todo su ciclo de vida, desde la creación y el almacenamiento hasta la recuperación y eliminación, mediante la aplicación de reglas y estándares que evitan la alteración no autorizada de los datos. Los mecanismos de integridad de datos ayudan a garantizar que los datos no solo sean correctos y accesibles, sino que también estén protegidos contra manipulaciones no autorizadas, lo que respalda el cumplimiento de las regulaciones gubernamentales y de la industria.
La integridad de datos es una preocupación en todas las industrias, y cada una adopta prácticas y estándares únicos para salvaguardar sus datos. La industria farmacéutica debe cumplir con estrictas pautas establecido por organismos reguladores, como la FDA. La guía preliminar de la FDA (enlace externo a ibm.com) para los fabricantes farmacéuticos hace hincapié en el cumplimiento de los códigos y regulaciones federales para certificar que los medicamentos se producen constantemente y son rastreables, seguros para el consumo y eficaces. Del mismo modo, los estándares internacionales como ISO 13485 (enlace externo a ibm.com) para dispositivos médicos subrayan la importancia global de la integridad de los datos en la fabricación, asegurando que los productos cumplan con los más altos estándares de seguridad y calidad.
En el sector financiero, la Financial Industry Regulatory Authority (FINRA) reconoció la necesidad de medidas sólidas de integridad de datos, particularmente en sistemas automatizados de comercio y vigilancia de movimientos de dinero. Las iniciativas de FINRA (enlace externo a ibm.com) para desarrollar y ampliar los programas de integridad de datos reflejan un esfuerzo más amplio de la industria para proteger las transacciones financieras y la información confidencial de los clientes, que es crucial para mantener la confianza y el cumplimiento en un entorno fuertemente regulado.
Las industrias de minería y fabricación de productos también se centran cada vez más en la integridad de los datos dentro de sus sistemas de automatización y monitoreo de producción. El objetivo es garantizar que los datos que impulsan las decisiones operativas y las mejoras de eficiencia sean precisos y confiables, evitando errores costosos y mejorando la competencia.
Los proveedores de bases de datos de almacenamiento en la nube enfrentan desafíos únicos para mantener la integridad y la procedencia de los datos de los clientes. Con la creciente dependencia de los servicios en la nube para el almacenamiento y procesamiento de datos, estos proveedores deben implementar medidas sofisticadas para rastrear y prevenir violaciones de datos, garantizando que la información de sus clientes permanezca segura e inalterada.
Los ejemplos específicos de aplicaciones de integridad de datos también incluyen la atención médica, donde los errores en los registros de salud electrónicos pueden tener consecuencias nefastas. En el ámbito financiero, la precisión de los datos de las transacciones es fundamental para la evaluación de riesgos y la detección de fraudes, y prácticas como los protocolos de conocimiento del cliente (KYC) desempeñan un papel fundamental en la verificación de la información de los clientes y el mantenimiento del cumplimiento normativo. Las instituciones educativas dependen de registros precisos de los estudiantes para la gestión de inscripciones, el seguimiento académico y la asignación de recursos.
Proteger la integridad de los datos en las organizaciones empresariales no es una tarea única, sino un esfuerzo continuo que requiere una estrategia holística que involucre tecnología, procesos y personas para validar los datos al máximo. Las siguientes estrategias y mejores prácticas protegen los activos de datos y capacitan a las organizaciones para aprovechar los datos con confianza para la toma de decisiones y la innovación.
La implementación de comprobaciones de integridad de datos lo más cerca posible del punto de entrada de datos, como un humano en un teclado o una aplicación que transmite datos, limita y especifica el tipo de información que se permite ingresar a la base de datos.
La gran variedad de vulnerabilidades de los datos subraya la importancia de un enfoque integral para salvaguardar los datos. La gestión de la integridad de los datos en toda una organización se logra mediante un amplio espectro de políticas, directrices y reglas llamadas restricciones de integridad, que cubren los diversos aspectos de la gestión de datos, desde la retención hasta las relaciones entre los diferentes datos y las personas que trabajan con ellos.
Las restricciones de integridad están vinculadas a los tipos de modelo de datos relacionales: entidad, referencial, dominio y definido por el usuario. Por ejemplo, las restricciones de dominio limitan el tipo de valores que puede contener una columna, por lo que una columna de “edad” podría aceptar sólo números enteros entre 1 y 120.
La integridad de la entidad proporciona instrucciones para que cada fila de una tabla sea única e identificable, normalmente aplicada por una clave principal, lo que significa que hay un identificador único para cada fila de una tabla de base de datos.
Las restricciones de integridad también garantizan que las relaciones entre tablas estén claramente definidas y se mantengan mediante claves externas, que son columnas o conjuntos de columnas de una tabla que hacen referencia a la clave primaria de otra tabla.
Estas restricciones confirman que los datos de cada campo se adhieren a formatos y valores especificados y que se cumplen las reglas adicionales adaptadas a las necesidades específicas de la organización.
Las directrices y directivas de retención especifican cuánto tiempo se deben almacenar los datos en una base de datos para mantener la coherencia y minimizar los errores que se derivan de la información antigua. Los backups de datos pueden proteger contra la pérdida de datos y proporcionar un sistema a prueba de fallas en el sistema, corrupción de datos u otros incidentes imprevistos que puedan comprometer la integridad de los datos. Las estrategias de backup efectivas deben incluir instantáneas regulares de los datos almacenados en ubicaciones seguras y geográficamente dispersas para confirmar que los datos se pueden restaurar con una pérdida mínima.
La conectividad y el acceso a los datos también desempeñan un papel fundamental en el mantenimiento de la integridad de los datos. Garantizar una conectividad perfecta entre diferentes fuentes de datos y sistemas permite un flujo constante de información en toda la organización.
La gestión del acceso a los datos ayuda a garantizar que sólo el personal autorizado pueda modificarlos o interactuar con ellos para reducir el riesgo de manipulación accidental o maliciosa.
Además, la vigilancia continua en toda la organización también ayuda a mantener la integridad de los datos. La verificación periódica de errores, la conciencia de ciberseguridad y la comunicación clara entre los miembros del equipo sobre la importancia de los datos precisos son importantes.
Las organizaciones deben garantizar la integridad física de los datos, empleando medidas como sistemas de alimentación ininterrumpida y hardware redundante.
Una vez que se recopilan los datos, las prácticas sólidas de administración de bases de datos pueden hacer cumplir reglas que impiden la creación de datos duplicados. Aprovechar la tecnología, como las herramientas de linaje de datos, que rastrean el origen y las transformaciones de los datos, para las pruebas de auditoría, los catálogos de datos que ofrecen funciones de seguridad de control de acceso, rigurosos procesos de validación de entradas y un sistema de base de datos moderno para ayudar a prevenir violaciones de integridad.
Los sistemas de bases de datos vienen equipados con características que admiten restricciones de integridad, descargando la responsabilidad de verificar la precisión a la propia base de datos. Por ejemplo, mecanismos como las relaciones entre elementos primarios y secundarios ilustran cómo los procesos de integridad referencial gestionados a nivel de base de datos pueden salvaguardar automáticamente la integridad de los datos al ayudar a garantizar que se conserven las relaciones entre los registros, evitando registros huérfanos y eliminaciones no autorizadas.
Las herramientas de validación de datos como IBM Databand y Ataccama son un paso esencial para lograr precisión, consistencia e integridad. Las herramientas de validación ayudan a identificar discrepancias o anomalías que podrían indicar problemas. Una vez integradas en un sistema de administración de datos, estas herramientas verifican continuamente la calidad e integridad de los datos.
Este enfoque centralizado ayuda a mantener estables los sistemas de gestión de datos, al tiempo que garantiza la reutilización y el fácil mantenimiento de los datos en diferentes aplicaciones.
Una empresa deseosa de fomentar una cultura que priorice la precisión y la seguridad de los datos debe educar a los líderes empresariales y a los empleados sobre los riesgos del uso de datos inseguros o incorrectos.
Cree y gestione canalizaciones de datos de streaming inteligentes a través de una interfaz gráfica intuitiva, y facilite una integración de datos fluida en entornos híbridos y multinube.
watsonx.data le permite escalar los analytics y la IA con todos sus datos, residan donde residan, a través de un almacén de datos abierto, híbrido y gestionado.
Desbloquee el valor de los datos empresariales con IBM Consulting, y construya una organización impulsada por insights que ofrezca ventajas empresariales.