El modelado de datos es el proceso de crear una representación visual de todo un sistema de información o partes de él para comunicar conexiones entre puntos de datos y estructuras.
El objetivo del modelado de datos es ilustrar los tipos de datos utilizados y almacenados dentro del sistema, las relaciones entre estos tipos de datos, las formas en que se pueden agrupar y organizar los datos y sus formatos y atributos.
Los modelos de datos se crean en función de las necesidades empresariales. Las reglas y los requisitos se definen por adelantado a través de la retroalimentación de los stakeholders de la empresa para que puedan incorporarse al diseño de un nuevo sistema o adaptarse en la iteración de uno existente.
Los datos se pueden modelar en varios niveles de abstracción. El proceso comienza con la recopilación de información sobre los requisitos comerciales de los stakeholders y los usuarios finales. Estas business rules se traducen luego en estructuras de datos para formular un diseño de base de datos concreto. Un modelo de datos puede compararse con una hoja de ruta, un proyecto técnico o cualquier diagrama formal que facilite una comprensión más profunda de lo que se está diseñando.
El modelado de datos emplea esquemas estandarizados y técnicas formales. Esto proporciona una forma común, coherente y predecible de definir y gestionar los recursos de datos en toda una organización, o incluso más allá.
Idealmente, los modelos de datos son documentos vivos que evolucionan junto con las cambiantes necesidades del negocio. Desempeñan un papel importante en el soporte de los procesos de negocio y en la planificación de la arquitectura y la estrategia de IT. Los modelos de datos se pueden compartir con proveedores, socios o colegas de la industria.
Boletín de la industria
Manténgase al día sobre las tendencias más importantes e intrigantes de la industria sobre IA, automatización, datos y más con el boletín Think. Consulte la Declaración de privacidad de IBM.
Su suscripción se entregará en inglés. En cada boletín, encontrará un enlace para darse de baja. Puede gestionar sus suscripciones o darse de baja aquí. Consulte nuestra Declaración de privacidad de IBM para obtener más información.
Como cualquier proceso de diseño, el diseño de bases de datos y sistemas de información comienza en un alto nivel de abstracción y se vuelve cada vez más concreto y específico. Los modelos de datos generalmente se pueden dividir en tres categorías, que varían según su grado de abstracción. El proceso comenzará con un modelo conceptual, avanzará a un modelo lógico y concluirá con un modelo físico. Cada tipo de modelo de datos se analiza con más detalle en las secciones siguientes:
También se conocen como modelos de dominio y ofrecen una visión general de lo que contendrá el sistema, cómo se organizará y qué reglas de negocio están involucradas. Los modelos conceptuales usualmente se crean como parte del proceso de recopilación de los requisitos iniciales del proyecto. Por lo general, incluyen clases de entidad (que definen los tipos de cosas que es importante que el negocio represente en el modelo de datos), sus características y restricciones, las relaciones entre ellas y los requisitos relevantes de seguridad e integridad de datos. Cualquier notación suele ser sencilla.
Son menos abstractos y proporcionan más detalles sobre los conceptos y relaciones en el dominio en cuestión. Se sigue uno de varios sistemas formales de notación de modelado de datos. Estos indican atributos de datos, como tipos de datos y sus longitudes correspondientes, y muestran las relaciones entre entidades. Los modelos de datos lógicos no especifican ningún requisito técnico del sistema. Esta etapa se omite con frecuencia en las prácticas ágiles o DevOps. Los modelos de datos lógicos pueden ser útiles en entornos de implementación altamente procedimentales, o para proyectos que están orientados a los datos por naturaleza, como el diseño de almacenes de datos o el desarrollo de sistemas de informes.
Proporcionan un esquema sobre cómo se almacenarán físicamente los datos dentro de una base de datos. Por eso, son los menos abstractos de todos. Ofrecen un diseño finalizado que se puede implementar como una base de datos relacional, incluyendo tablas asociativas que ilustran las relaciones entre entidades así como las claves primarias y claves foráneas que se utilizarán para mantener esas relaciones. Los modelos de datos físicos pueden incluir propiedades específicas del sistema de gestión de bases de datos (DBMS), incluyendo el ajuste del rendimiento.
Como disciplina, la modelización de datos invita a los stakeholders a evaluar el procesamiento de datos y el almacenamiento con un detalle minucioso. Las técnicas de modelado de datos tienen diferentes convenciones que dictan qué símbolos se utilizan para representar los datos, cómo se presentan los modelos y cómo se transmiten los requisitos del negocio. Todos los enfoques proporcionan flujos de trabajo formalizados que incluyen una secuencia de tareas que se realizarán de manera iterativa. Esos flujos de trabajo generalmente se ven así:
El modelado de datos ha evolucionado junto con los sistemas de gestión de bases de datos, y los tipos de modelos aumentan en complejidad a medida que crecen las necesidades de almacenamiento de datos de las empresas. Estos son varios tipos de modelos:
Las bases de datos relacionales emplean con frecuencia lenguaje de consulta estructurado (SQL) para la gestión de datos. Estas bases de datos funcionan bien para mantener la integridad de los datos y minimizar la redundancia. A menudo se utilizan en sistemas de punto de venta, así como para otros tipos de procesamiento de transacciones.
Dos modelos de datos dimensionales populares son el esquema de estrella, en el que los datos se organizan en hechos (elementos medibles) y dimensiones (información de referencia), donde cada hecho está rodeado por sus dimensiones asociadas en un patrón similar a una estrella. El otro es el esquema de copo de nieve, que se asemeja al esquema de estrella pero incluye capas adicionales de dimensiones asociadas, lo que hace que el patrón de ramificación sea más complejo.
El modelado de datos facilita a los desarrolladores, arquitectos de datos, analistas de negocio y stakeholders ver y comprender las relaciones entre los datos de una base de datos o almacén de datos. Además, puede:
En la actualidad, se utilizan ampliamente numerosas soluciones comerciales y de código abierto de ingeniería de software asistida por computadora (CASE), incluyendo múltiples herramientas de modelado, diagramación y visualización de datos. Aquí hay varios ejemplos:
Utilice herramientas y soluciones de ciencia de datos para descubrir patrones y crear predicciones mediante el uso de datos, algoritmos, machine learning y técnicas de IA.
Presentamos Cognos Analytics 12.0: insights impulsados por IA para una mejor toma de decisiones.
Desbloquee el valor de los datos empresariales con IBM Consulting y cree una organización impulsada por insights que ofrezca ventajas empresariales.