El modelado de datos es el proceso de crear una representación visual de un sistema de información completo o de partes del mismo para comunicar conexiones entre puntos de datos y estructuras. El objetivo es ilustrar los tipos de datos utilizados y almacenados dentro del sistema, las relaciones entre estos tipos de datos, las formas en que se pueden agrupar y organizar los datos y sus formatos y atributos.
Los modelos de datos se construyen en torno a las necesidades de la empresa. Las reglas y requisitos se definen por adelantado a través de los comentarios de las partes interesadas de la empresa para que puedan incorporarse en el diseño de un nuevo sistema o adaptarse en la iteración de uno existente.
Los datos se pueden modelar en varios niveles de abstracción. El proceso empieza por la recopilación de información sobre los requisitos de la empresa tanto de las partes interesadas como de los usuarios finales. Estas reglas de negocio luego se traducen en estructuras de datos para formular un diseño de base de datos concreto. Un modelo de datos puede compararse con una hoja de ruta, un plano de un arquitecto o cualquier diagrama formal que facilite una comprensión más profunda de lo que se está diseñando.
El modelado de datos emplea esquemas estandarizados y técnicas formales. Con ello, se obtiene una forma común, coherente y previsible de definir y gestionar los recursos de datos en una organización, o incluso más allá.
Idealmente, los modelos de datos son documentos vivos que evolucionan junto con las necesidades cambiantes de la empresa. Juegan un papel importante en el apoyo a los procesos de negocio y la planificación de la estrategia y la arquitectura de TI. Los modelos de datos se pueden compartir con proveedores, socios o colegas del sector.
Como todo proceso de diseño, el diseño de un sistema de base de datos e información empieza con un alto grado de abstracción y se vuelve cada vez más concreto y específico. Los modelos de datos se pueden dividir en tres categorías generales, que varían según su grado de abstracción. El proceso se iniciará con un modelo conceptual, que evolucionará a un modelo lógico y concluirá con un modelo físico. Cada tipo de modelo de datos se expone con más detalle a continuación:
Como disciplina, el modelado de datos invita a las partes interesadas a evaluar el procesamiento de datos y el almacenamiento hasta el último detalle. Las técnicas de modelado de datos presentan diferentes convenciones que determinan qué símbolos se utilizan para representar los datos, cómo se presentan los modelos y cómo se transmiten los requisitos del negocio. Todos los enfoques proporcionan flujos de trabajo formalizados que incluyen una secuencia de tareas a realizar de una forma iterativa. Estos flujos de trabajo suelen presentar el siguiente esquema:
El modelado de datos ha evolucionado junto con los sistemas de gestión de bases de datos, con tipos de modelos cada vez más complejos a medida que crecen las necesidades de almacenamiento de datos de las empresas. En este caso, hay varios tipos de modelos:
Las bases de datos relacionales emplean con frecuencia SQL (Structured Query Language) para la gestión de datos. Estas bases de datos son muy útiles para mantener la integridad de los datos y minimizar la redundancia. Suelen utilizarse en sistemas de punto de venta, así como para otros tipos de procesamiento de transacciones.
Dos modelos populares de datos dimensionales son el esquema de estrella, en el que los datos se organizan en hechos (elementos medibles) y dimensiones (información de referencia), donde cada hecho está rodeado por sus dimensiones asociadas en un patrón similar a una estrella. El otro es el esquema de copo de nieve, que se parece al esquema de estrella pero incluye capas adicionales de dimensiones asociadas, lo que hace que la ramificación del patrón sea más complejo.
El modelado de datos permite a los desarrolladores, arquitectos de datos, analistas de empresa y otras partes interesadas ver y comprender fácilmente las relaciones entre los datos que residen en una base de datos o almacén de datos. Además, puede:
Numerosas soluciones de ingeniería de software asistida por ordenador (CASE, por sus siglas en inglés) comerciales y de código abierto se utilizan hoy, incluidas varias herramientas de visualización, diagramación y modelado de datos. Estos son algunos ejemplos:
Un almacén de datos en cloud elástico y completamente gestionado, creado para la analítica de alto rendimiento y la IA
Híbrido. Abiertas. Resilientes. Su plataforma y su socio para la transformación digital.
Software de cloud híbrido basado en IA.