Começando com o InfoSphere Data Architect V7.5.3, pode-se criar modelos de dados relacionais e modelo de dados multidimensionais. Esta série utiliza três cenários de usuários para demonstrar como ele ajuda a acelerar a modelagem de dados multidimensionais e como os usuários podem se beneficiar da adoção do InfoSphere Data Architect V7.5.3. Os três cenários do usuário são de modelagem de dados multidimensionais por meio de engenharia avançada, modelagem de dados por meio de engenharia reversa e transformações de modelos de dados entre o InfoSphere Data Warehouse e o Cognos® Framework Manager.
A empresa varejista está planejando desenvolver um sistema para gerenciar transações de venda e outro sistema para analisar os negócios. Agora ela criou modelos normalizados de dados, incluindo produtos, funcionários, clientes, lojas e vendas no sistema de transação. Para o sistema de análise de negócios, a empresa precisa criar modelos multidimensionais baseados no modelo normalizado de dados.
Para cumprir os requisitos de análise de negócios, um fluxo de trabalho típico será apresentado para mostrar como criar modelos de dados multidimensionais por meio de engenharia avançada usando o InfoSphere Data Architect.
As etapas principais do fluxo de trabalho incluem:
- Descoberta de informações multidimensionais baseadas em um modelo de dados normalizado
- Transformação do modelo normalizado de dados lógicos em um modelo não normalizado de dados lógicos dimensionais
- Transformação do modelo de dados lógicos dimensionais em modelo de dados físicos dimensionais
- Transformação do modelo de dados físicos dimensionais em modelo Cubing ou Cognos
A empresa de varejo criou um modelo lógico, conforme mostrado na Figura 1, onde teremos um entendimento básico do modelo. Supõe-se que tenha sido criado um projeto de design de dados e o modelo abaixo com sucesso usando o InfoSphere Data Architect V7.5.3 ou posterior.
Figura 1. Modelo de vendas de varejo
Arraste e solte todas as entidades para o diagrama. Veremos que as entidades contidas no modelo descrevem os seguintes relacionamentos:
- Funcionário e departamento correspondente, representados por:
- Employees
- Department
- Lojas individuais e sua localização, representados por:
- Store
- Store_Region
- Clientes e sua localização, representados por:
- Customers
- Customer_Type
- Region
- Territories
- Produtos e seus fornecedores, representados por:
- Products
- Brand
- Packaging
- Categories
- Supplier
- Supplier_Type
- Faturamento, representado por:
- Store_Billing
- Store_Billing_Details
Ativando a notação dimensional
O primeiro passo para ativar a notação dimensional é ativar o recurso dimensional no modelo de dados lógicos. Clique com o botão direito do mouse no modelo de dados e escolha o item de menu Use Dimensional Notation . Seu modelo agora pode conter propriedades dimensionais.
Figura 2. Ativando a notação dimensional
De maneira semelhante, pode-se remover os recursos dimensionais do modelo desmarcando a opção.
Observação: Depois de colocar algumas informações dimensionais nos modelos, desmarcar a opção só removeria as propriedades dimensionais da sua visualização. Internamente, as informações ainda persistiriam no modelo. Essa é uma remoção suave das propriedades dimensionais, que podem ser trazidas de volta ativando novamente as notações.
Criando um modelo normalizado de dados lógicos dimensionais
Dando uma olhada no modelo agora, provavelmente dá para entender que a entidade Store_Billing deve estar em uma entidade Fact. Pode-se alterar a propriedade dimensional dessa entidade da seguinte maneira:
- Selecione a entidade e abra a visualização Properties .
- Localize a guia Dimensional e selecione a caixa de opção Change the dimensional entity type .
- O painel Type é ativado e aparecerá como mostrado na figura abaixo.
- Selecione a opção Fact . A entidade Store_Billing agora estará em Fact.
Figura 3. Configurando propriedades dimensionais
Observação: como já deve ter imaginado, selecionar None tornaria a entidade uma entidade normal. Esta é uma remoção dura, visto que as informações dimensionais serão removidas no próprio nível do modelo.
Mas não é um modo mais lento? Não precisamos de um modo mais rápido de incluir propriedades dimensionais? Continue lendo.
Inclua propriedades dimensionais por meio da descoberta automatizada
O InfoSphere Data Architect fornece um recurso eficiente que automatiza a identificação das entidades em diferentes propriedades dimensionais. Isso pode ser feito da seguinte maneira:
- No Data Project Explorer, selecione o modelo de dados.
- Clique com o botão direito do mouse e, na janela pop-up que aparece, clique em Discover Facts and Dimensions.
Figura 4. Menu para descobrir fatos e dimensões
- Aparecerá uma caixa perguntando se deseja que seja gerada a hierarquia das entidades do tipo Dimension Escolha No. Pode-se aprender a usar mais hierarquias após o processo de transformação.
- Após a conclusão da descoberta, como mostrado na figura abaixo, haverá diferentes propriedades dimensionais sendo aplicadas às entidades.
Esse é um modelo lógico normalizado e dimensional.
- A entidade Brand foi descoberta como Outrigger.
- A entidade Products foi descoberta como Dimension.
- A entidade Store_Billing_Details foi descoberta como Fact. Os atributos Unit Price e Quantity foram descobertos como Measure.
- A entidade Territories foi deixada como estava.
Figura 5. Modelo normalizado de dados dimensionais após a descoberta
Observação: O processo de descoberta acima é apenas uma recomendação baseada na lógica do InfoSphere Data Architect e não é obrigatório. Usando o método manual descrito acima, ainda é possível alterar as propriedades, se desejado. Também vale ressaltar que a lógica da descoberta depende das propriedades dimensionais existentes do modelo. Assim, recomenda-se aplicar o máximo de informações dimensionais de que dispõe antes de iniciar o processo de descoberta. Sendo esse o caso, o modelo resultante estará mais alinhado aos seus requisitos.
Criando um modelo não normalizado de dados lógicos dimensionais
Após gerar o modelo normalizado, é preciso retirar a normalização dele para adaptá-lo às suas necessidades comerciais. Os mecanismos de transformação disponíveis no InfoSphere Data Architect nos ajudarão nisso:
- Clique no nó do modelo de dados lógicos.
- Escolha Data > Transform > New
Configuration.
Figura 6. Menu de transformação
- Isso abrirá a janela de opções de configuração de transformação.
- Especifique LDM2DLDM na configuração.
- Escolha a opção Logical Data Model to Dimensional-Logical Data
Model .
Figura 7. Opções de transformação — nome e tipo do arquivo
- Clique em Next.
- Escolha o modelo lógico de entrada e a pasta de saída como mostrado na captura de tela.
Figura 8. Opções de transformação — arquivo de entrada e pasta de saída
- Clique em Next.
- Escolha as seguintes opções na próxima tela.
- Crie um esquema em estrela.
- Crie a dimensão de data e hora se aplicável.
- Ative a opção de geração de rastreabilidade.
Figura 9. Opções de transformação — tipo de esquema, dimensão de data e rastreabilidade
- Clique em Finish.
- Na janela de configuração de transformação, clique em Run.
- Um novo arquivo, Package1_D.ldm, é criado. Essa é uma versão não normalizada do seu modelo lógico.
- Dê uma rápida olhada no arquivo e veja quê:
- Foram incluídas entidades de data e hora. Elas foram classificadas como entidades de Dimension.
- As diversas entidades no modelo normalizado foram não normalizadas para denotar dados com um número reduzido de tabelas.
- As entidades de dimensão foram retidas.
- A entidade de Fact chamada Billing_Details foi retida.
Figura 10. Modelo lógico dimensional e não normalizado
- As colunas numéricas da entidade Fact foram classificadas como Measure.
Figura 11.As medidas classificadas na entidade Fact
- Uma análise mais aprofundada sobre a entidade:
- Foram criadas duas hierarquias chamadas FiscalYear e Year.
- Elas têm níveis individuais definidos que correspondem a Year, Quarter, Month e Date.
- Na verdade, esses níveis estão relacionados a relatórios de drill-down. Em outras palavras, a consulta consegue responder a informações de vendas que ocorreram:
- com base no ano
- com base no trimestre
- com base no mês
- com base na data
Figura 12. As hierarquias na dimensão Date
- Clique no nível FiscalYear e verifique suas propriedades na visualização Properties .
- Cada nível deve ter exatamente um atributo de legenda. Vamos incluir isso no nosso modelo dimensional lógico e não normalizado nesse ponto do tempo.
- Verifique na caixa abaixo da coluna de legenda o nível FiscalYear.
Figura 13. Incluindo atributos de legenda a um nível
- Repita o processo acima em todos os níveis disponíveis nas hierarquias FiscalYear e Year.
- Dê uma olhada na entidade de Fact chamada Store Billing Details.
- Dá para notar que foram criados novos relacionamentos com as entidades recém-criadas Date eTime.
Figura 14. Referências a novas entidades — Date e Time
O processo de criação de um modelo lógico dimensional não normalizado foi agora concluído. Por enquanto, deve ser possível entender que Store Billing Details, em Fact, tem os dados reais de uma transação e está no centro. Os detalhes das transações individuais podem ser vistos nas entidades Dimension ao redor. Isso lembra um esquema em estrela? Continue na seção de diagrama abaixo.
Observação: Há três tipos de medidas: pes: não aditivas, aditivas e semiaditivas. A medida padrão classificada a partir da autodescoberta é aditiva, com SUM como função de agregação. Pode-se atualizar a medida aditiva para outra função de agregação e também classificar medidas não aditivas e semiaditivas.
Visualize o modelo dimensional
Depois de criado o modelo não normalizado, seria um bom momento para saber que é possível visualizá-los em diagramas específicos de dimensão:
- No Data Project Explorer, clique com o botão direito do mouse no nó Diagrams .
- Clique no item de menu New Dimensional Blank Diagram .
Figura 15. Criando um diagrama de dados dimensionais
- Pode-se ver que foi criado um diagrama (Diagram1), e o editor de diagramas é aberto à direita.
- Selecione todas as entidades no seu modelo dimensional normalizado e arraste-as e solte-as no editor de diagramas.
- Agora deve ser possível ver o modelo em toda a sua glória. Veja como agora se parece a uma estrela.
Figura 16. O esquema em estrela conforme mostrado no diagrama dimensional
Observação: Como exceção, pode-se incluir diretamente as entidades dimensionais no diagrama usando o widget Dimensional disponível à direita do editor de diagramas.
É sempre recomendável que o modelo seja revisado por pessoas da sua organização. Para facilitar isso, pode-se publicar o modelo atual em formato HTML e compartilhá-lo em toda a organização, conforme aplicável. Isso é feito da seguinte maneira:
- Clique com o botão direito do mouse em Package1 no Package1_D.ldm.
- Clique em Data >> Publish >> Web.
- Preencha as informações necessárias, conforme abaixo.
Figura 17. Publicação na web — Modelo de dados lógicos dimensionais
- Clique em OK.
- Abra index.html na pasta C:\MyDDLDMReport. Deve aparecer o modelo inteiro convertido em formato HTML. Ele já pode ser compartilhado na sua organização.
Na seção acima, temos o modelo de dados lógicos dimensional não normalizado revisado pelas partes interessadas. Antes de o modelo de dados lógicos dimensionais ser finalizado, pode-se atualizá-lo com base no feedback das partes interessadas e continuar com o processo de revisão.
Nesta seção, transformaremos o modelo de dados lógicos dimensionais não normalizados em modelo de dados físicos dimensionais.
- Clique com o botão direito do mouse no nó do modelo de dados lógicos dimensionais não normalizados e clique em Transform to Physical Data Model no menu de contexto.
Figura 18. Transformar em modelo de dados físico a partir do menu de contexto
- No assistente Transform To Physical Data Model, selecione Create new model e, em seguida, clique em Next.
Figura 19. Criar um modelo para transformar
- Mantenha Destination folder e File name com seus padrões. Visto que vamos transformar o modelo em DB2® para Linux®, UNIX® e Windows® V9.7, selecione Database como DB2 para Linux, UNIX e Windows, e Version como V9.7 e, em seguida, clique em Next.
Figura 20. Especificar banco de dados, versão e local para transformação
- Selecione Generate traceability, que pode ser usado para rastreio de objeto no futuro e atualize o nome do esquema como
RETAIL_SALES e, em seguida, clique em Next.
Figura 21. Especificar opções de transformação
- Na página Output, é exibido o status de transformação. Clique em Finish para gerar o modelo de dados físico dimensional.
Figura 22. Transformação concluída
Agora temos o modelo de dados físico dimensional gerado com as notações dimensionais incluídas no modelo de dados lógicos dimensional de origem. É possível incluir mais informações específicas do banco de dados no modelo de dados físico dimensional, mas não vamos introduzir muitas aqui.
Para garantir que o modelo de dados físico dimensional transformado é compatível com as normas da empresa, é sempre recomendável analisar o modelo. Podemos usar a função Analyze Model para analisar o modelo de dados físico dimensional transformado.
Analisar o modelo de dados físico dimensional transformado
- Clique com o botão direito do mouse no esquema RETAIL_SALES no modelo de dados físico dimensional transformado do Data Project Explorer e depois clique em Analyze Model.
Figura 23. Analisar o modelo de dados físico dimensional transformado
- No assistente Analyze Model, todas as regras de análise sob a categoria de modelo de dados físico são selecionadas por padrão. Sete regras são incluídas no InfoSphere Data Architect V7.5.3 pra validação de modelo de dados físico dimensional. Clique em Finish para executar o processo de análise de modelo.
Figura 24. Assistente Analyze Model e regras de análise para modelagem dimensional
- O resultado da análise é exibido na visualização Problems, similar à captura instantânea abaixo. Não é encontrada nenhuma mensagem de erro.
Figura 25. Resultado de análise do modelo de dados físico dimensional transformado
Gerar DDL a partir do modelo de dados físico dimensional
Agora, o usuário pode gerar DDL, que pode ser usado para a implementação de esquema dimensional posterior, a partir do modelo de dados físico dimensional:
- Clique com o botão direito do mouse no nó de esquema RETAIL_DETAILS no Data Project Explorer e depois clique no item do menu de contexto Generate DDL.
Figura 26. Item de menu Generate DDL para o objeto selecionado
- Customize as opções para gerar DDL e deixe as opções do assistente Generate DDL como no padrão, depois clique em Next.
Figura 27. Customizar opções para gerar DDL
- Customize os objetos para gerar DDL e deixe os objetos do assistente Generate DDL como no padrão, depois clique em Next.
Figura 28. Customizar objetos para gerar DDL
- Agora o DDL do esquema RETAIL_SALES é gerado e será salvo no arquivo especificado da pasta especificada. Pode-se executar o DDL no servidor especificado e abrir o arquivo DDL para edição após o processo Generate DDL ser concluído. Deixe as propriedades como no padrão e clique em Next.
Figura 29. Customizar as opções de salvamento e execução para gerar DDL
- A página de resumo do assistente Generate DDL lista os detalhes do processo de mesmo nome. Clique em Finish.
Figura 30. Resumo de Generate DDL
Agora, no arquivo DDL, Script1.sql, é gerado sob Retail_Sales. É possível usá-lo para atualização ou implementação adicional posterior. Não vamos entrar em mais detalhes sobre isso.
Transformação do modelo de dados físico dimensional em modelo Cubing/Cognos
Na seção acima, um modelo de dados físico dimensional válido é transformado a partir do modelo de dados lógicos dimensional não normalizado. Para certificar-se de que o modelo dimensional possa ser usado dentro de ferramentas de inteligência de negócios, precisamos transformar o modelo de dados físico dimensional em modelo do InfoSphere Warehouse Cubing ou do Cognos Framework Manager. No InfoSphere Data Architect V7.5.3, uma nova transformação foi incluída para transformar modelo de dados físico dimensional em modelo Cubing/Cognos.
Transformação do modelo de dados físico dimensional em modelo Cubing:
- Clique com o botão direito do mouse no nó do modelo de dados físico dimensional e clique no item do menu de contexto New > Transformation Configuration.
Figura 31. Criar uma configuração de transformação
- No assistente New Transformation Configuration, especifique o nome e o destino da configuração de transformação, selecione a transformação Dimensional-Physical Data Model to Cognos/Cubing Model e, em seguida, clique em Next.
Figura 32. Especificar o nome de configuração e as informações de transformação
- Selecione o esquema RETAIL_SALES como origem da árvore esquerda e o projeto de destino do modelo transformado e, em seguida, clique em Next.
Figura 33. Especificar a origem e o destino da transformação
- Estão disponíveis quatro propriedades para a transformação. As primeiras duas são úteis apenas quando Target dimensional model é selecionado como modelo Cognos. Selecione Name para a propriedade Name source of table and column for Logical/Dimensional View e Cubing Model como modelo de destino e, em seguida, clique em Finish.
Figura 34. Especificar as propriedades da transformação
- A configuração de transformação é aberta no editor. O usuário pode visualizar as propriedades da configuração de transformação e atualizá-las se necessário. Clique no botão da barra de ferramentas Validate the transformation configuration para validar a configuração de transformação criada acima, e não se espera nenhum erro de validação na visualização Console.
Figura 35. Validar a configuração de transformação
- Clique em Run para executar o processo de transformação. Depois que o processo for concluído, um modelo Cubing será gerado na pasta XML Schemas do projeto de destino.
Figura 36. Executar a configuração de transformação e gerar o modelo Cubing
O modelo Cognos pode ser transformado seguindo as etapas acima, mas há mais duas propriedades disponíveis para a transformação em Cognos. Para obter introduções detalhadas sobre propriedades, consulte o Centro de Informações.
Importar o modelo Cubing/Cognos transformado para o InfoSphere Warehouse/Cognos Framework Manager
Agora temos a modelos Cubing e Cognos da transformação na seção acima e podemos importar o modelo para produtos relacionados, para atualização e implementação adicionais. Nesta seção, importaremos o modelo Cubing gerado acima para o InfoSphere Warehouse Design Studio:
- Crie um projeto de design de dados no InfoSphere Warehouse Design Studio.
- Crie um modelo de dados físico com OLAP no projeto de design de dados acima.
Figura 37. Criar um modelo de dados físico com OLAP
- Clique com o botão direito do mouse no nó do modelo de dados físico e selecione Import no menu de contexto.
Figura 38. Importar o modelo Cubing
- No assistente Import, selecione Data Warehousing > OLAP
Metadata e, em seguida, clique em Next.
Figura 39. Selecione os metadados OLAP a importar
- Especifique o modelo Cubing gerado acima e o destino como nó de banco de dados do modelo de dados físico, depois clique em Next.
Figura 40. Especificar a origem e o destino para importar
- Os objetos OLAP a serem importados são listados. Clique em Finish.
Figura 41. Resumo dos objetos OLAP importados
- Clique em OK nas caixas de diálogo pop-up para concluir a importação. Os objetos OLAP são importados para o modelo de dados físico no Data Project Explorer.
Figura 42. Modelo de dados físico com objetos OLAP importados
No modelo Cubing, a maioria dos objetos OLAP é gerada a partir do modelo de dados físico dimensional do InfoSphere Data Architect, como modelos de cubo, fatos, dimensões, medidas, hierarquias e níveis. Mas não é gerado nenhum cubo. Por isso, é preciso incluir o cubo no modelo Cubing antes de ele poder ser implementado. Há algumas outras lacunas entre o modelo dimensional o InfoSphere Data Architect e o modelo InfoSphere Warehouse Cubing.
Concluímos o fluxo de trabalho para criação de modelos de dados multidimensionais por meio de engenharia avançada usando o InfoSphere Data Architect V7.5.3. A empresa de varejo pode usar o esquema dimensional para implementação de banco de dados e utilizar o modelo Cubing ou Cognos para implementação de inteligência de negócios.
O InfoSphere Data Architect pode ajudar a acelerar a modelagem de dados multidimensionais do projeto à implementação. É muitos benefícios nos recursos que o InfoSphere Data Architect fornece, como descoberta de informações dimensionais, desnormalização de modelo para esquema dimensional e transformação de modelo de dados físico dimensional em modelo do InfoSphere Warehouse Cubing model ou do IBM Cognos Framework Manager.
Gratos a Erin Wilson, Qi Yun Liu e Bo Yuan por revisarem este artigo.
| Descrição | Nome | Tamanho | Método de download |
|---|---|---|---|
| Source model | DMInIDA_FE_SourceModel.zip | 20KB | HTTP |
Informações sobre métodos de download
Aprender
-
Leia "Dimensional Modeling: In a Business Intelligence Environment", uma publicação da IBM Redbooks® que guia o usuário no projeto de modelagem dimensional em um ambiente de inteligência de negócios.
-
"Efficient multidimensional data modeling with InfoSphere Data
Architect" mostra como um arquiteto de dados em uma empresa fictícia usa o InfoSphere Data Architect para criar de forma eficiente modelos de dados multidimensionais de um novo datamart que pode ser usado para inteligência de negócios e relatórios analíticos.
- Na área InfoSphere Data Architect do developerWorks, obtenha os recursos necessários para melhorar suas qualificações em modelagem de dados.
- Saiba mais sobre Information Management na zona do
Information Management no developerWorks. Encontre documentação técnica, artigos de instruções, treinamento, downloads, informações de produtos, e muito mais.
- Fique por dentro doseventos técnicos e webcasts do developerWorks
.
- Siga o DeveloperWorks no Twitter.
Obter produtos e tecnologias
- Faça o download de uma versão teste do InfoSphere Data Architect V7.5.3 e aprenda a criar um modelo dimensional de forma eficiente.
- Crie seu próximo projeto de desenvolvimento com o software de teste da IBM, disponível para download diretamente do developerWorks.
Discutir
- Participar do fórum de discussão.
- Confira os
blogs do developerWorks
e participe da
comunidade do developerWorks.

Yun Feng Bai é engenheiro de software da equipe do China Development Lab, em Pequim, China. Atualmente ele se concentra na área de controle de qualidade do InfoSphere Data Architect. Antes, ele trabalhava em DB2 Data Warehouse (renomeado para InfoSphere Warehouse), com foco em modelagem OLAP e warehousing SQL.
