¿Qué es el modelado de datos?

Oficinas privadas pequeñas y coloridas

¿Qué es el modelado de datos?

El modelado de datos es el proceso de crear una representación visual de todo un sistema de información o partes de él para comunicar conexiones entre puntos de datos y estructuras.

El objetivo del modelado de datos es ilustrar los tipos de datos utilizados y almacenados en el sistema, las relaciones entre estos tipos de datos, las formas en que pueden agruparse y organizarse y sus formatos y atributos.

Los modelos de datos se crean en función de las necesidades empresariales. Las reglas y los requisitos se definen con antelación a partir de los comentarios de los stakeholder de la empresa para poder incorporarlos al diseño de un nuevo sistema o adaptarlos a la iteración de uno ya existente.

Los datos se pueden modelar en varios niveles de abstracción. El proceso comienza con la recopilación de información sobre los requisitos empresariales de los stakeholders y los usuarios finales. A continuación, estas reglas empresariales se traducen en estructuras de datos para formular un diseño concreto de la base de datos. Un modelo de datos puede compararse con un mapa de carreteras, el plano de un arquitecto o cualquier otro diagrama formal que facilite una comprensión más profunda de lo que se está diseñando.

El modelado de datos utiliza esquemas estandarizados y técnicas formales. Esto proporciona una forma común, coherente y predecible de definir y gestionar los recursos de datos en toda una organización e incluso más allá.

Lo ideal es que los modelos de datos se conviertan en documentos vivos que evolucionen al ritmo de las cambiantes necesidades de la empresa. Son fundamentales para apoyar los procesos empresariales y planificar la arquitectura y la estrategia de TI. Los modelos de datos pueden compartirse con proveedores, socios y otros profesionales del sector.

Las últimas novedades sobre tecnología, respaldadas por conocimientos de expertos

Manténgase al día sobre las tendencias más importantes e intrigantes del sector en materia de IA, automatización, datos y mucho más con el boletín Think. Consulte la Declaración de privacidad de IBM.

¡Gracias! Se ha suscrito.

Su suscripción se enviará en inglés. Encontrará un enlace para darse de baja en cada boletín. Puede gestionar sus suscripciones o darse de baja aquí. Consulte nuestra Declaración de privacidad de IBM para obtener más información.

Tipos de modelos de datos

Como cualquier proceso de diseño, el diseño de bases de datos y sistemas de información comienza en un alto nivel de abstracción y se vuelve cada vez más concreto y específico. Los modelos de datos se pueden dividir generalmente en tres categorías, que varían según su grado de abstracción. El proceso comenzará con un modelo conceptual, progresará a un modelo lógico y concluirá con un modelo físico. Cada tipo de modelo de datos se analiza con más detalle en las secciones siguientes:

Modelos de datos conceptuales

Modelos de datos conceptuales: también se denominan modelos de dominio y ofrecen una visión general de lo que contendrá el sistema, cómo se organizará y qué reglas empresariales están involucradas. Los modelos conceptuales generalmente se crean como parte del proceso de recopilación de requisitos iniciales del proyecto. Por lo general, incluyen clases de entidades (que definen los tipos de elementos que la empresa debe representar en el modelo de datos), sus características y restricciones, las relaciones entre ellas y los requisitos pertinentes de seguridad e integridad de los datos. La notación suele ser sencilla.

Gráfico de modelado de datos conceptual

Modelos de datos lógicos

Modelos lógicos de datos: son menos abstractos y proporcionan más detalles sobre los conceptos y relaciones en el dominio en cuestión. Se sigue uno de los diversos sistemas formales de notación de modelado de datos. Indican atributos de datos, como tipos de datos y sus longitudes correspondientes, y muestran las relaciones entre entidades. Los modelos de datos lógicos no especifican ningún requisito técnico del sistema. Esta etapa se omite con frecuencia en las prácticas ágiles o DevOps. Los modelos de datos lógicos pueden ser útiles en entornos de implementación con muchos procedimientos o para proyectos que están orientados a los datos por naturaleza, como el diseño de  almacenes de datos o el desarrollo de sistemas de elaboración de informes.

Gráfico de modelado de datos lógicos

Modelos de datos físicos

Proporcionan un esquema de cómo se almacenarán físicamente los datos dentro de una base de datos. Por eso, son los menos abstractos de todos. Ofrecen un diseño finalizado que se puede implementar como una base de datos relacional, incluidas tablas asociativas que ilustran las relaciones entre las entidades, así como las claves principales y foráneas que se utilizarán para mantener dichas relaciones. Los modelos de datos físicos pueden incluir propiedades específicas del sistema de gestión de bases de datos (DBMS), incluido el ajuste del rendimiento.

Gráfico de modelado de datos físicos

Proceso de modelado de datos

Como disciplina, el modelado de datos invita a los stakeholders a evaluar el procesamiento y almacenamiento de datos con gran detalle. Las técnicas de modelado de datos utilizan diferentes convenciones para representar los datos, diseñar los modelos y transmitir los requisitos empresariales. Todos los enfoques proporcionan flujos de trabajo formalizados que incluyen una secuencia de tareas que deben realizarse de forma iterativa. Esos flujos de trabajo suelen tener el siguiente aspecto:

  1. Se identifican las entidades. El proceso de modelado de datos comienza con la identificación de las cosas, acontecimientos o conceptos que están representados en el conjunto de datos que se va a modelar. Cada entidad debe ser cohesiva y lógicamente discreta de todas las demás.
  2. Se identifican las propiedades clave de cada entidad. Cada tipo de entidad se puede diferenciar de todos los demás porque tiene una o más propiedades únicas, llamadas atributos. Por ejemplo, una entidad llamada "cliente" podría poseer atributos como nombre, apellido, número de teléfono y saludo, mientras que una entidad llamada "dirección" podría incluir el nombre y el número de una calle, una ciudad, un estado, un país y un código postal.
  3. Se identifican las relaciones entre entidades. El primer borrador de un modelo de datos especificará la naturaleza de las relaciones que cada entidad mantiene con las demás. En el ejemplo anterior, cada cliente "vive en" una dirección. Si ese modelo se ampliara para incluir una entidad llamada “pedidos”, cada pedido se enviaría y facturaría también a una dirección. Estas relaciones suelen documentarse mediante un lenguaje de modelado unificado (UML).
  4. Se asignan completamente los atributos a las entidades. Esto garantizará que el modelo refleje cómo utilizará los datos la empresa. Existen varios patrones formales de modelado de datos que se utilizan de forma generalizada. Los desarrolladores orientados a objetos suelen aplicar patrones de análisis o patrones de diseño, mientras que los stakeholders de otros ámbitos empresariales pueden recurrir a otros patrones.
  5. Se asignan claves según sea necesario y se decide un grado de normalización que equilibre la necesidad de reducir la redundancia con los requisitos de rendimiento. La normalización es una técnica para organizar modelos de datos (y las bases de datos que los representan) mediante la asignación de identificadores numéricos, denominados claves, a grupos de datos para representar las relaciones entre ellos sin necesidad de repetir la información. Por ejemplo, si se asigna una clave a cada cliente, esta se puede vincular tanto a su dirección como a su historial de pedidos, sin necesidad de repetir esta información en la tabla de nombres de clientes. La normalización tiende a reducir el espacio de almacenamiento necesario para una base de datos, pero puede afectar al rendimiento de las consultas.
  6. Se finaliza y valida el modelo de datos. El modelado de datos es un proceso iterativo que debe repetirse y perfeccionarse a medida que cambian las necesidades empresariales.
Mixture of Experts | 12 de diciembre, episodio 85

Descifrar la IA: resumen semanal de noticias

Únase a nuestro panel de ingenieros, investigadores, responsables de producto y otros profesionales de talla mundial que se abren paso entre el bullicio de la IA para ofrecerle las últimas noticias y conocimientos al respecto.

Tipos de modelado de datos

El modelado de datos ha evolucionado junto con los sistemas de gestión de bases de datos y, a medida que han aumentado las necesidades de almacenamiento de datos de las empresas, los tipos de modelos se han vuelto más complejos. A continuación se presentan varios tipos de modelos:

  • Los modelos de datos jerárquicos representan relaciones uno a muchos en un formato similar al de un árbol. En este modelo, cada registro tiene una única raíz o padre, que se asigna a una o más tablas hijas. Este modelo se implementó en el IBM Information Management System (IMS) de IBM, que se introdujo en 1966 y cuyo uso se generalizó rápidamente, especialmente en el sector bancario. Aunque este enfoque es menos eficiente que los modelos de bases de datos desarrollados más recientemente, todavía se utiliza en los sistemas de lenguaje de marcado extensible (XML) y en los sistemas de información geográfica (SIG).
  • Los modelos de datos relacionales fueron propuestos inicialmente por el investigador de IBM E. F. Codd en 1970. Todavía se implementan hoy en día en las numerosas bases de datos relacionales que se utilizan habitualmente en el ámbito empresarial. El modelado de datos relacionales no requiere una comprensión detallada de las propiedades físicas del almacenamiento de datos que se utiliza. En él, los segmentos de datos se unen explícitamente mediante el uso de tablas, lo que reduce la complejidad de la base de datos.

Las bases de datos relacionales suelen emplear lenguaje de consulta estructurado (SQL) para la gestión de datos. Estas bases de datos funcionan bien para mantener la integridad de los datos y minimizar la redundancia. Se utilizan a menudo en sistemas de punto de venta, así como para otros tipos de procesamiento de transacciones.

  • Los modelos de datos entidad-relación (ER) utilizan diagramas formales para representar las relaciones entre entidades en una base de datos. Los arquitectos de datos utilizan diversas herramientas de modelado ER para crear mapas visuales que transmiten los objetivos del diseño de las bases de datos.
  • Los modelos de datos orientados a objetos ganaron terreno como programación orientada a objetos y se hicieron populares a mediados de la década de 1990. Los "objetos" involucrados son abstracciones de entidades del mundo real. Los objetos se agrupan en jerarquías de clases y tienen características asociadas. Las bases de datos orientadas a objetos pueden incorporar tablas, pero también pueden admitir relaciones de datos más complejas. Este enfoque se utiliza en bases de datos multimedia e hipertexto, así como en otros casos de uso.
  • Los modelos de datos dimensionales fueron desarrollados por Ralph Kimball, y fueron diseñados para optimizar las velocidades de recuperación de datos con fines analíticos en un almacén de datos. Los modelos relacionales y ER se centran en el almacenamiento eficiente, mientras que los modelos dimensionales aumentan la redundancia para facilitar la localización de la información para la elaboración de informes y su recuperación. Este modelado se utiliza normalmente en todos los sistemas OLAP.

Dos modelos de datos dimensionales populares son el esquema en estrella, en el que los datos se organizan en hechos (elementos medibles) y dimensiones (información de referencia), y el esquema en copo de nieve, que se asemeja al esquema en estrella, pero incluye capas adicionales de dimensiones asociadas, lo que hace que el patrón de ramificación sea más complejo. El otro es el esquema en copo de nieve, similar al esquema en estrella, pero con capas adicionales de dimensiones asociadas, lo que hace que el patrón de ramificación sea más complejo.

Beneficios del modelado de datos

El modelado de datos permite a los desarrolladores, arquitectos de datos, analistas de negocios y otras partes interesadas ver y comprender las relaciones entre los datos de una base de datos o un almacén de datos. Además, permite:

  • Reducir los errores en el desarrollo de software y bases de datos.
  • Aumentar la coherencia en la documentación y el diseño del sistema en toda la empresa.
  • Mejorar el rendimiento de las aplicaciones y las bases de datos.
  • Facilitar el mapeo de datos en toda la organización.
  • Mejorar la comunicación entre los desarrolladores y los equipos de inteligencia empresarial.
  • Facilitar y acelere el proceso de diseño de bases de datos a nivel conceptual, lógico y físico.

Herramientas de modelado de datos

En la actualidad, se utilizan ampliamente numerosas soluciones comerciales y de código abierto de ingeniería de software asistida por ordenador (CASE), entre las que se incluyen múltiples herramientas de modelado de datos, diagramación y visualización. A continuación se muestran varios ejemplos:

  • erwin Data Modeler es una herramienta de modelado de datos basada en el lenguaje de modelado de datos Integration Definition for Information Modeling (IDEF1X), que ahora admite otras metodologías de notación, incluido un enfoque dimensional.
  • Enterprise Architect es una herramienta visual de modelado y diseño que permite modelar sistemas de información y arquitecturas empresariales, así como aplicaciones de software y bases de datos. Se basa en lenguajes y estándares orientados a objetos.
  • ER/Studio es un software de diseño de bases de datos compatible con varios de los sistemas de gestión de bases de datos más populares de la actualidad. Admite el modelado de datos tanto relacionales como dimensionales.
  • Las herramientas gratuitas de modelado de datos incluyen soluciones de código abierto como Open ModelSphere.
Soluciones relacionadas
Herramientas y soluciones de ciencia de datos

Utilice herramientas y soluciones de ciencia de datos para descubrir patrones y crear predicciones mediante el uso de datos, algoritmos, machine learning y técnicas de IA.

Explore las soluciones de ciencia de datos
IBM Cognos Analytics

Presentamos Cognos Analytics 12.0: conocimientos potenciados por IA para una mejor toma de decisiones.

Explore Cognos Analytics
Servicios de asesoramiento sobre datos y análisis

Desbloquee el valor de los datos empresariales con IBM Consulting y cree una organización impulsada por conocimientos que ofrezca ventajas empresariales.

Descubra los servicios de análisis
Dé el siguiente paso

Utilice herramientas y soluciones de ciencia de datos para descubrir patrones y crear predicciones mediante el uso de datos, algoritmos, machine learning y técnicas de IA.

Explore las soluciones de ciencia de datos Explore los servicios de análisis