Modelagem de dados é o processo de criar uma representação visual de um sistema de informação inteiro ou partes dele para comunicar as conexões entre pontos e estruturas de dados.
O objetivo da modelagem de dados é ilustrar os tipos de dados usados e armazenados dentro do sistema, as relações entre esses tipos de dados, as formas como os dados podem ser agrupados e organizados e seus formatos e atributos.
Os modelos de dados são construídos em torno das necessidades empresariais. As regras e requisitos são definidos antecipadamente por meio do feedback dos stakeholders para que possam ser incorporados ao projeto de um novo sistema ou adaptados na iteração de um sistema existente.
Os dados podem ser modelados em vários níveis de abstração. O processo começa coletando informações sobre os requisitos dos negócios dos stakeholders e dos usuários finais. Essas business rules são então traduzidas em estruturas de dados para formular um projeto concreto de banco de dados. Um modelo de dados pode ser comparado a um roteiro, um blueprint ou qualquer diagrama formal que facilite uma compreensão mais profunda do que está sendo projetado.
A modelagem de dados emprega esquemas padronizados e técnicas formais. Ela oferece uma maneira comum, consistente e previsível de definir e gerenciar recursos de dados em toda a organização, ou até mesmo para além dela.
Idealmente, os modelos de dados são documentos ativos que evoluem junto com as mudanças nas necessidades comerciais. Eles desempenham um papel importante na compatibilidade com os processos de negócios e no planejamento da arquitetura e estratégia de TI. Os modelos de dados podem ser compartilhados com fornecedores, parceiros e/ou colegas do setor.
Boletim informativo do setor
Mantenha-se atualizado sobre as tendências mais importantes (e intrigantes) do setor em IA, automação, dados e muito mais com o boletim informativo Think. Consulte a Declaração de privacidade da IBM.
Sua assinatura será entregue em inglês. Você pode encontrar um link para cancelar a assinatura em todos os boletins informativos. Você pode gerenciar suas inscrições ou cancelar a inscrição aqui. Consulte nossa Declaração de privacidade da IBM para obter mais informações.
Como qualquer processo de projeto, o projeto de bancos de dados e sistemas de informação começa em um alto nível de abstração e se torna cada vez mais concreto e específico. Os modelos de dados geralmente podem ser divididos em categorias, que variam de acordo com seu grau de abstração. O processo começará com um modelo conceitual, progredirá para um modelo lógico e será concluído com um modelo físico. Cada tipo de modelo de dados é discutido em mais detalhes nas seções subsequentes:
Modelos de dados conceituais: também chamados de modelos de domínio, oferecem uma visão geral do que o sistema conterá, como ele será organizado e quais business rules estão envolvidas. Os modelos conceituais geralmente são criados como parte do processo de coleta dos requisitos iniciais do projeto. Normalmente, eles incluem classes de entidades (que definem os tipos de elementos importantes para a empresa representar no modelo de dados), suas características e restrições, os relacionamentos entre elas e os requisitos de segurança e integridade de dados correspondentes. Normalmente, qualquer notação é simples.
Modelos de dados lógicos: eles são menos abstratos e oferecem mais detalhes sobre os conceitos e relacionamentos no domínio em análise. Adota-se um dos diversos sistemas formais de notação de modelagem de dados. Eles indicam atributos de dados, como tipos de dados e seus respectivos comprimentos, e mostram os relacionamentos entre as entidades. Modelos de dados lógicos não especificam requisitos técnicos de sistema. Essa etapa é frequentemente omitida nas práticas Ágeis ou de DevOps . Os modelos lógicos de dados podem ser úteis em ambientes de implementação altamente procedimentais ou para projetos que são orientados a dados por natureza, como o projeto de data warehouse ou o desenvolvimento de sistemas de relatórios.
Eles fornecem um esquema de como os dados serão armazenados fisicamente em um banco de dados. Como tal, são os menos abstratos de todos. Eles oferecem um projeto finalizado que pode ser implementado como um banco de dados relacional, incluindo tabelas associativas que ilustram os relacionamentos entre as entidades, bem como as chaves primárias e estrangeiras que serão usadas para manter esses relacionamentos. Modelos de dados físicos podem incluir propriedades específicas do sistema de gerenciamento de banco de dados (DBMS), incluindo ajuste de desempenho.
Como disciplina, modelagem de dados convida stakeholders a avaliar processamento de dados e armazenamento em detalhe. As técnicas de modelagem de dados têm diferentes convenções que ditam quais símbolos são usados para representar os dados, como os modelos são apresentados e como os requisitos do negócio são transmitidos. Todas as abordagens fornecem fluxos de trabalho formalizados que incluem uma sequência de tarefas a serem executadas de maneira iterativa. Esses fluxos de trabalho geralmente ficam assim:
A modelagem de dados evoluiu junto com os sistemas de gerenciamento de banco de dados, com tipos de modelos aumentando em complexidade à medida que as necessidades de armazenamento de dados das empresas cresceram. Aqui estão vários tipos de modelos:
Bancos de dados relacionais frequentemente empregam linguagem de consulta estruturada (SQL) para gerenciamento de dados. Esses bancos de dados funcionam bem para manter a integridade dos dados e minimizar a redundância. Eles são frequentemente usados em sistemas de ponto de venda, bem como para outros tipos de processamento de transações.
Dois modelos de dados dimensionais populares são o esquema estrela, no qual os dados são organizados em fatos (itens mensuráveis) e dimensões (informações de referência), onde cada fato é cercado por suas dimensões associadas em um padrão semelhante a uma estrela. O outro é o esquema floco de neve, que se assemelha ao esquema estrela, mas inclui camadas adicionais de dimensões associadas, tornando o padrão de ramificação mais complexo.
A modelagem de dados torna mais fácil para desenvolvedores, data architects, analistas de negócios e outros stakeholders visualizar e entender as relações entre os dados em um data warehouse ou banco de dados. Além disso, ela pode:
Numerosas soluções comerciais e de código aberto de engenharia de software auxiliada por computador (CASE) são amplamente utilizadas atualmente, incluindo várias ferramentas de modelagem de dados, diagramação e visualização de dados. Aqui estão vários exemplos:
Use ferramentas e soluções de ciência de dados para descobrir padrões e fazer previsões utilizando dados, algoritmos, aprendizado de máquina e técnicas de IA.
Apresentamos o Cognos Analytics 12.0, insights impulsionados por IA para maior eficiácia na tomada de decisão.
Libere o valor dos dados empresariais com a IBM® Consulting, construindo uma organização orientada por insights, que proporciona vantagem comercial.