O que é modelagem de dados?

Pequenos escritórios privados coloridos

O que é modelagem de dados?

Modelagem de dados é o processo de criar uma representação visual de um sistema de informação inteiro ou partes dele para comunicar as conexões entre pontos e estruturas de dados.

O objetivo da modelagem de dados é ilustrar os tipos de dados usados e armazenados dentro do sistema, as relações entre esses tipos de dados, as formas como os dados podem ser agrupados e organizados e seus formatos e atributos.

Os modelos de dados são construídos em torno das necessidades empresariais. As regras e requisitos são definidos antecipadamente por meio do feedback dos stakeholders para que possam ser incorporados ao projeto de um novo sistema ou adaptados na iteração de um sistema existente.

Os dados podem ser modelados em vários níveis de abstração. O processo começa coletando informações sobre os requisitos dos negócios dos stakeholders e dos usuários finais. Essas business rules são então traduzidas em estruturas de dados para formular um projeto concreto de banco de dados. Um modelo de dados pode ser comparado a um roteiro, um blueprint ou qualquer diagrama formal que facilite uma compreensão mais profunda do que está sendo projetado.

A modelagem de dados emprega esquemas padronizados e técnicas formais. Ela oferece uma maneira comum, consistente e previsível de definir e gerenciar recursos de dados em toda a organização, ou até mesmo para além dela.

Idealmente, os modelos de dados são documentos ativos que evoluem junto com as mudanças nas necessidades comerciais. Eles desempenham um papel importante na compatibilidade com os processos de negócios e no planejamento da arquitetura e estratégia de TI. Os modelos de dados podem ser compartilhados com fornecedores, parceiros e/ou colegas do setor.

As mais recentes notícias de tecnologia, corroboradas por insights de especialistas.

Mantenha-se atualizado sobre as tendências mais importantes (e intrigantes) do setor em IA, automação, dados e muito mais com o boletim informativo Think. Consulte a Declaração de privacidade da IBM.

Agradecemos sua inscrição!

Sua assinatura será entregue em inglês. Você pode encontrar um link para cancelar a assinatura em todos os boletins informativos. Você pode gerenciar suas inscrições ou cancelar a inscrição aqui. Consulte nossa Declaração de privacidade da IBM para obter mais informações.

Tipos de modelos de dados

Como qualquer processo de projeto, o projeto de bancos de dados e sistemas de informação começa em um alto nível de abstração e se torna cada vez mais concreto e específico. Os modelos de dados geralmente podem ser divididos em categorias, que variam de acordo com seu grau de abstração. O processo começará com um modelo conceitual, progredirá para um modelo lógico e será concluído com um modelo físico. Cada tipo de modelo de dados é discutido em mais detalhes nas seções subsequentes:

Modelos de dados conceituais

Modelos de dados conceituais: também chamados de modelos de domínio, oferecem uma visão geral do que o sistema conterá, como ele será organizado e quais business rules estão envolvidas. Os modelos conceituais geralmente são criados como parte do processo de coleta dos requisitos iniciais do projeto. Normalmente, eles incluem classes de entidades (que definem os tipos de elementos importantes para a empresa representar no modelo de dados), suas características e restrições, os relacionamentos entre elas e os requisitos de segurança e integridade de dados correspondentes. Normalmente, qualquer notação é simples.

Gráfico de modelagem de dados conceituais

Modelos de dados lógicos

Modelos de dados lógicos: eles são menos abstratos e oferecem mais detalhes sobre os conceitos e relacionamentos no domínio em análise. Adota-se um dos diversos sistemas formais de notação de modelagem de dados. Eles indicam atributos de dados, como tipos de dados e seus respectivos comprimentos, e mostram os relacionamentos entre as entidades. Modelos de dados lógicos não especificam requisitos técnicos de sistema. Essa etapa é frequentemente omitida nas práticas Ágeis ou de DevOps . Os modelos lógicos de dados podem ser úteis em ambientes de implementação altamente procedimentais ou para projetos que são orientados a dados por natureza, como o projeto de data warehouse ou o desenvolvimento de sistemas de relatórios.

Gráfico de modelagem de dados lógicos

Modelos de dados físicos

Eles fornecem um esquema de como os dados serão armazenados fisicamente em um banco de dados. Como tal, são os menos abstratos de todos. Eles oferecem um projeto finalizado que pode ser implementado como um banco de dados relacional, incluindo tabelas associativas que ilustram os relacionamentos entre as entidades, bem como as chaves primárias e estrangeiras que serão usadas para manter esses relacionamentos. Modelos de dados físicos podem incluir propriedades específicas do sistema de gerenciamento de banco de dados (DBMS), incluindo ajuste de desempenho.

Gráfico de modelagem de dados físicos

Processo de modelagem de dados

Como disciplina, modelagem de dados convida stakeholders a avaliar processamento de dados e armazenamento em detalhe. As técnicas de modelagem de dados têm diferentes convenções que ditam quais símbolos são usados para representar os dados, como os modelos são apresentados e como os requisitos do negócio são transmitidos. Todas as abordagens fornecem fluxos de trabalho formalizados que incluem uma sequência de tarefas a serem executadas de maneira iterativa. Esses fluxos de trabalho geralmente ficam assim:

  1. Identifique as entidades. O processo de modelagem de dados começa com a identificação das coisas, eventos ou conceitos que estão representados no conjunto de dados que deve ser modelado. Cada entidade deve ser coesivo e logicamente discreto de todas as outras.
  2. Identifique as principais propriedades de cada entidade. Cada tipo de entidade pode ser diferenciado de todos os outros porque tem uma ou mais propriedades exclusivas, chamadas atributos. Por exemplo, uma entidade chamada "cliente" pode possuir atributos como nome, sobrenome, número de telefone e saudação, enquanto uma entidade chamada "endereço" pode incluir nome e número de rua, cidade, estado, país e código postal .
  3. Identifique relações entre as entidades. O primeiro rascunho de um modelo de dados especificará a natureza das relações que cada entidade tem com as outras. No exemplo acima, cada cliente “mora em” um endereço. Se esse modelo fosse expandido para incluir uma entidade chamada "pedidos", cada pedido também seria enviado e cobrado em um endereço. Essas relações geralmente são documentadas por meio de linguagem de modelagem unificada (UML).
  4. Mapeie completamente os atributos para as entidades. Isso garantirá que o modelo reflita como a empresa usará os dados. Vários padrões formais de modelagem de dados estão em uso generalizado. Os desenvolvedores orientados a objetos frequentemente aplicam padrões de análise ou padrões de projeto, enquanto os stakeholders de outros domínios de negócios podem recorrer a outros padrões.
  5. Atribua chaves conforme necessário e decida sobre um grau de normalização que equilibre a necessidade de reduzir a redundância com os requisitos de desempenho. A normalização é uma técnica para organizar modelos de dados (e os bancos de dados que eles representam) na qual identificadores numéricos, chamados de chaves, são atribuídos a grupos de dados para representar relações entre eles sem repetir os dados. Por exemplo, se cada cliente receber uma chave, essa chave poderá ser vinculada ao endereço e ao histórico de pedidos sem a necessidade de repetir essas informações na tabela de nomes dos clientes. A normalização tende a reduzir a quantidade de espaço de armazenamento que um banco de dados exigirá, mas pode custar o desempenho da consulta.
  6. Finalize e valide o modelo de dados. A modelagem de dados é um processo iterativo que deve ser repetido e refinado à medida que as necessidades do negócio mudam.
Mixture of Experts | 12 de dezembro, episódio 85

Decodificando a IA: resumo semanal das notícias

Participe do nosso renomado painel de engenheiros, pesquisadores, líderes de produtos e outros enquanto filtram as informações sobre IA para trazerem a você as mais recentes notícias e insights sobre IA.

Tipos de modelagem de dados

A modelagem de dados evoluiu junto com os sistemas de gerenciamento de banco de dados, com tipos de modelos aumentando em complexidade à medida que as necessidades de armazenamento de dados das empresas cresceram. Aqui estão vários tipos de modelos:

  • Modelos de dados hierárquicos representam relacionamentos de um para muitos em um formato de árvore. Nesse tipo de modelo, cada registro tem uma única raiz ou pai que mapeia para uma ou mais tabelas filhas. Esse modelo foi implementado no IBM® Information Management System (IMS), que foi lançado em 1966 e rapidamente encontrou uso generalizado, especialmente no setor bancário. Embora essa abordagem seja menos eficiente do que os modelos de banco de dados desenvolvidos mais recentemente, ela ainda é usada em sistemas de Extensible Markup Language (XML) e sistemas de informações geográficas (GISs).
  • Os modelos de dados relacionais foram inicialmente propostos pelo pesquisador da IBM E.F. Codd em 1970. Eles ainda são implementodas atualmente nos diversos bancos de dados relacionais comumente usados na computação empresarial. A modelagem de dados relacionais não exige uma compreensão detalhada das propriedades físicas do armazenamento de dados que está sendo usado. Nela, os segmentos de dados são explicitamente unidos por meio do uso de tabelas, reduzindo a complexidade do banco de dados.

Bancos de dados relacionais frequentemente empregam linguagem de consulta estruturada (SQL) para gerenciamento de dados. Esses bancos de dados funcionam bem para manter a integridade dos dados e minimizar a redundância. Eles são frequentemente usados em sistemas de ponto de venda, bem como para outros tipos de processamento de transações.

  • Os modelos de dados de relacionamento de entidade (ER) utilizam diagramas formais para representar as relações entre entidades em um banco de dados. Várias ferramentas de modelagem ER são usadas por arquitetos de dados para criar mapas visuais que transmitem objetivos de projeto de banco de dados.
  • Modelos de dados orientados a objetos ganharam força como programação orientada a objetos e se tornaram populares em meados da década de 1990. Os "objetos" envolvidos são abstrações de entidades do mundo real. Os objetos são agrupados em hierarquias de classe e têm funcionalidades associadas. Bancos de dados orientados a objetos podem incorporar tabelas, mas também podem ser compatíveis com relacionamentos de dados mais complexos. Essa abordagem é empregada em bancos de dados multimídia e hipertexto, bem como em outros casos de uso.
  • Modelos de dados dimensionais foram desenvolvidos por Ralph Kimball e foram projetados para otimizar as velocidades de recuperação de dados para fins analíticos em um data warehouse. Enquanto os modelos relacionais e de ER enfatizam o armazenamento eficiente, os modelos dimensionais aumentam a redundância para facilitar a localização de informações para relatórios e recuperação. Essa modelagem é normalmente utilizada em sistemas  OLAP.

Dois modelos de dados dimensionais populares são o esquema estrela, no qual os dados são organizados em fatos (itens mensuráveis) e dimensões (informações de referência), onde cada fato é cercado por suas dimensões associadas em um padrão semelhante a uma estrela. O outro é o esquema floco de neve, que se assemelha ao esquema estrela, mas inclui camadas adicionais de dimensões associadas, tornando o padrão de ramificação mais complexo.

Benefícios da modelagem de dados

A modelagem de dados torna mais fácil para desenvolvedores, data architects, analistas de negócios e outros stakeholders visualizar e entender as relações entre os dados em um data warehouse ou banco de dados. Além disso, ela pode:

  • Reduzir erros no desenvolvimento de software e banco de dados.
  • Aumentar a consistência na documentação e no projeto do sistema em toda a empresa.
  • Melhorar o desempenho das aplicações e do banco de dados.
  • Facilitar o mapeamento de dados em toda a organização.
  • Melhorar a comunicação entre equipes de desenvolvedores e business intelligence.
  • Facilitar e acelerar o processo de projeto de banco de dados nos níveis conceituais, lógicos e físicos.

Ferramentas de modelagem de dados

Numerosas soluções comerciais e de código aberto de engenharia de software auxiliada por computador (CASE) são amplamente utilizadas atualmente, incluindo várias ferramentas de modelagem de dados, diagramação e visualização de dados. Aqui estão vários exemplos:

  • O erwin Data Modeler é uma ferramenta de modelagem de dados baseada na linguagem de modelagem de dados Integration DEFinition for information modeling (IDEF1X), que agora é compatível com outras metodologias de notação, incluindo uma abordagem dimensional.
  • O Enterprise Architect é uma ferramenta visual de modelagem e projeto compatível com a modelagem de sistemas e arquiteturas de informação corporativa, bem como aplicações de software e bancos de dados. É baseado em linguagens e padrões orientados a objetos.
  • O ER/Studio é um software de projeto de banco de dados compatível com vários dos sistemas de gerenciamento de banco de dados mais populares da atualidade. Ele é compatível com modelagem de dados relacional e dimensional.
  • As ferramentas de modelagem de dados gratuitas incluem soluções de código aberto, como o Open ModelSphere.
Soluções relacionadas
Ferramentas e soluções de ciência de dados

Use ferramentas e soluções de ciência de dados para descobrir padrões e fazer previsões utilizando dados, algoritmos, aprendizado de máquina e técnicas de IA.

Explore as soluções de ciência de dados
Análise de dados do IBM Cognos

Apresentamos o Cognos Analytics 12.0, insights impulsionados por IA para maior eficiácia na tomada de decisão.

Explore o IBM Cognos Analytics
Serviços de consultoria de dados e análise de dados

Libere o valor dos dados empresariais com a IBM® Consulting, construindo uma organização orientada por insights, que proporciona vantagem comercial.

Conheça os serviços de análise de dados
Dê o próximo passo

Use ferramentas e soluções de ciência de dados para descobrir padrões e fazer previsões utilizando dados, algoritmos, aprendizado de máquina e técnicas de IA.

Explore as soluções de ciência de dados Explore os serviços de análise de dados