A modelagem de dados é o processo de criação de uma representação visual de um sistema de informação inteiro ou de partes dele para comunicar conexões entre pontos de dados e estruturas. O objetivo é ilustrar os tipos de dados usados e armazenados no sistema, os relacionamentos entre eles, as formas como os dados podem ser agrupados e organizados e os respectivos formatos e atributos.
Os modelos de dados são criados com base em necessidades de negócios. Regras e requisitos são definidos antecipadamente por meio de feedback das partes interessadas nos negócios, para serem incorporados ao design de um novo sistema ou adaptados na iteração de um existente.
É possível modelar os dados em diversos níveis de abstração. O processo começa com a coleta de informações sobre os requisitos de negócios das partes interessadas e dos usuários finais. Em seguida, essas regras de negócios são traduzidas em estruturas de dados para formular um design de banco de dados concreto. Um modelo de dados pode ser comparado a um roteiro, uma planta de um arquiteto ou qualquer diagrama formal que facilite uma compreensão mais profunda do que está sendo elaborado.
A modelagem de dados emprega esquemas padronizados e técnicas formais. Isso fornece uma maneira comum, consistente e previsível de definir e gerenciar recursos de dados em uma organização ou até mesmo fora dela.
Idealmente, os modelos de dados são documentos dinâmicos que evoluem de acordo com as mudanças nas necessidades de negócios. Eles desempenham um papel importante no suporte aos processos de negócios e no planejamento da arquitetura e da estratégia de TI. Os modelos de dados podem ser compartilhados com fornecedores, parceiros e/ou colegas do mercado.
Como qualquer processo de design, o design de bancos de dados e sistemas de informação começa em um alto nível de abstração e se torna cada vez mais concreto e específico. Os modelos de dados geralmente podem ser divididos em três categorias, que variam de acordo com o grau de abstração. O processo começa com um modelo conceitual, progride para um modelo lógico e é concluído com um modelo físico. Cada tipo de modelo de dados é discutido em mais detalhes abaixo:
Como disciplina, a modelagem de dados convida as partes interessadas a avaliar o processamento e o armazenamento de dados em detalhes minuciosos. As técnicas de modelagem de dados têm diferentes convenções que determinam quais símbolos são usados para representar os dados, como os modelos são dispostos e como os requisitos de negócios são transmitidos. Todas as abordagens fornecem fluxos de trabalho formalizados que incluem uma sequência de tarefas a serem executadas de maneira iterativa. Geralmente, esses fluxos de trabalho são semelhantes ao seguinte:
A modelagem de dados evoluiu com os sistemas de gerenciamento de banco de dados, e a complexidade dos tipos de modelo aumenta de acordo com o aumento das necessidades de armazenamento de dados das empresas. Veja a seguir diversos tipos de modelo:
Bancos de dados relacionais frequentemente empregam SQL (Linguagem de Consulta Estruturada) para o gerenciamento de dados. Esses bancos de dados funcionam bem para manter a integridade dos dados e minimizar a redundância. Eles são frequentemente usados em sistemas de ponto de venda, bem como para outros tipos de processamento de transações.
Há dois modelos de dados dimensionais populares. No esquema em estrela, os dados são organizados em fatos (itens mensuráveis) e dimensões (informações de referência), e cada fato é cercado por suas dimensões associadas em um padrão semelhante a uma estrela. O esquema em floco de neve, que se assemelha ao esquema em estrela, inclui camadas adicionais de dimensões associadas, o que torna o padrão de ramificação mais complexo.
A modelagem de dados facilita a visualização e a compreensão dos relacionamentos entre os dados em um banco de dados ou data warehouse para desenvolvedores, arquitetos de dados, analistas de negócios e outras partes interessadas. Além disso, é possível:
Há diversas soluções comerciais e de software livre para engenharia de software assistida por computador (CASE) em uso atualmente, como diversas ferramentas de modelagem, diagramação e visualização de dados. Veja a seguir diversos exemplos:
