Antes de iniciar
Design de armazém de dados e modelagem de dados é uma mistura significativa de ciência da computação e TI. A tecnologia nasceu no início da década de 1990, usando várias abordagens desenvolvidas naquele tempo. Os métodos mais significativos foram definidos por Ralph Kimball (de cima para baixo) e por W. H. Inmon (de baixo para cima) (consulte Recursos ).
Produtos de modelagem de dados comerciais têm valor devido a seu conhecimento específico do conteúdo, que é baseado em experiência prática e conhecimento de negócios. A IBM oferece uma família de produtos de capital intelectual nesse espaço, chamada IBM Industry Models. Os produtos IBM Industry Models consistem em estruturas de padrão maduros e bem testados para modelagem de dados (relacionais e multidimensionais), com pacotes para vários segmentos de mercado. Este artigo apresenta uma visão geral do Information Insurance Warehouse (IIW), que é parte do produto IBM Industry Models definido para o segmento de mercado de seguros.
Este tutorial apresenta o método para desenvolver modelos de dados para armazém de dados (DWH) usando o IBM Industry Model IIW. O tutorial demonstra a abordagem para o desenvolvimento de modelos de core data warehouse (CDW) models (modelos de dados altamente normalizados que contêm os elementos de dados atômicos) e os modelos de data mart (DM) (modelos de dados não normalizados que implementam a estrutura de modelos de dados multidimensionais). Modelos de dados multidimensionais são caracterizados pela definição de medidas, que são armazenadas em tabelas de fatos, e pela definição de tabelas de dimensões, que definem os eixos ou dimensões da análise.
O método descrito neste tutorial é o roteiro do IIW para desenvolver modelos de dados. O roteiro do IIW baseia-se na abordagem de cima para baixo, que começa com a captura d requisitos de negócios e a definição do modelo de negócios (em termos de IIW, conhecido como modelo de dados de análise). Definir os requisitos de negócios é o pré-requisito para todo o trabalho posterior. O ideal é que esse trabalho seja realizado em conjunto pelo modelador de dados e especialistas dos departamentos de negócios. Quando os departamentos de negócios criam e aprovam o modelo, começa a fase para criar modelos lógicos.
O design de modelos lógicos consiste em duas etapas: design do modelo lógico de DWH (CDW) seguido pelo design do modelo lógico de DM. É importante seguir essa abordagem sequencial. Começar fases posteriores antes de concluir as fases anteriores pode ter resultados indesejados. Portanto a estrutura do roteiro do IIW e esse tutorial estão divididos nas quatro fases seguintes:
- Fase 1: Capturar requisitos de negócios de IIW
- Fase 2: Definir o modelo de dados de análise
- Fase 3: Projetar o modelo lógico do armazém de dados
- Fase 4: Projetar o data mart
Essas quatro fases completam objetivos diferentes e oferecem diferentes entregas:
- Fase 1: Capturar requisitos de negócios de IIW
- Uma descrição completa dos requisitos de negócios que o projeto de BI deve resolver. As entregas são um modelo conceitual e um modelo de requisitos analíticos.
- Modelo conceitual
- Um modelo de todos os conceitos e termos de negócios usados na organização
- Modelo de requisitos analíticos
- Modelos predefinidos de requisitos de negócios que lidam com questões específicas do segmento de mercado. Modelos são expressos como medidas e dimensões
- Fase 2: Definir o modelo de dados de análise
- Um modelo conceitual que representa uma imagem ideal dos conceitos de negócios e como esses conceitos se relacionam entre si. Esse modelo é independente de plataforma e não exige aspectos físicos da implementação. A entrega é o modelo de dados de análise.
- Modelo de dados de análise
- Um modelo de dados que especifica as estruturas de dados normalizadas exigidas para representar os conceitos definidos no modelo conceitual.
- Fases de design de DWH e DM
- Os conceitos de negócios mapeados em um modelo lógico (DWH) de entity-relationship (ER) e em um modelo lógico multidimensional (MD). Esses modelos são a base para a estrutura física dos dados no banco de dados. As entregas são modelos de dados de design de DW e modelos de dados de design de DM.
- Modelos de dados de design de DW
- Modelos de dados que representam o repositório corporativo de dados atômicos e analíticos usados para processamento de informações
- Modelos de dados de design de DM
- Modelos dimensionais que implementam requisitos analíticos e são estruturados para permitir análises dimensionais específicas
Figura 1 resume essas entregas.
Figura 1. Entregas das quatro fases do IIW
IIW também define três camadas de modelo:
- A camada de base contém os modelos de requisitos conceituais e analíticos.
- A camada de análise abrange o modelo de dados de análise.
- A camada de design contém os modelos de design do DW e do DM.
O diagrama da Figura 2 representa essas camadas.
Figura 2. Camadas do modelo do IIW
As seções a seguir do tutorial descrevem as quatro fases, com exemplos de cada fase usando InfoSphere™ Data Architect (IDA). Os exemplos usam o IBM IIW Model Versão 8.2. O conteúdo do modelo do IIW é importado para o IDA com a ajuda da ferramenta Enterprise Model Extender (EME). EME é um conjunto de extensões de plug-in do produto IBM InfoSphere Data Architect. Para acompanhar o tutorial, você precisará instalar esses produtos.

