Definindo o escopo do IBM Industry Model para atividades bancárias usando o Enterprise Model Extender e o InfoSphere Data Architect

Adquira modelos de dados lógicos significativos

Aprenda como o processo de definição de escopo pode produzir objetos de negócios que lhe guiarão no desenvolvimento de um modelo de dados lógicos significativo. Este tutorial usa o IBM® Enterprise Model Extender com o IBM InfoSphere™ Data Architect para ilustrar o processo de definição de escopo.

Hermann Voellinger, Senior IT Architect, IBM

Hermann Voellinger é um arquiteto de TI senior do IBM Software Group Services. Ao longo dos últimos 12 anos, ele vem sendo o arquiteto de TI responsável pelos grandes projetos de armazém de dados (DWH) na Alemanha. Nos 10 anos anteriores, ele trabalhou no German Development Lab como o principal desenvolvedor e arquiteto para ferramentas e soluções de mineração de dados e texto. Suas habilidades essenciais e seu principal foco de trabalho são a arquitetura dos processos de preenchimento de dados (ETL), os conceitos de modelagem de dados e a estratégia e arquitetura das soluções DWH.



22/Mar/2010

Antes de começar

Sobre este tutorial

O IBM Industry Models consiste em estruturas de negócios compreensíveis de modelos de dados, processos e serviços, que foram criadas por vários segmentos do mercado. Elas aceleram o desenvolvimento de soluções de segmentos de mercado através da combinação das boas práticas do mercado e de conhecimentos para criar planos de desenvolvimento baseados em experiência.

Este tutorial trata especificamente da definição de escopo para um modelo de segmento de mercado. Definição de escopo é o processo de seleção de objetos de negócios em um modelo conceitual, um modelo de requisitos analítico (chamado modelo de requisitos) ou um modelo de dados a partir de um modelo de segmento de mercado, como o modelo Banking Data Warehouse (BDW). Em projetos de armazém de dados que usam o IBM Industry Models, é muito importante definir corretamente o escopo do modelo a fim de construir um modelo de dados lógicos significante. Por exemplo, é necessário definir o escopo corretamente para que seja possível adquirir as medidas necessárias em suas entidades de fato, ou adquirir atributos significativos nas entidades de dimensão. Para determinar isto, é necessário um entendimento básico das dependências entre todos os objetos no modelo de segmento de mercado e como elas são apresentadas no InfoSphere Data Architect. Neste tutorial, você irá selecionar os objetos de negócios a partir dos modelos de requisitos e conceitual.

O objetivo do tutorial é lhe ajudar a entender o processo de definição de escopo usando o IBM Enterprise Model Extender (EME) com o IBM InfoSphere Data Architect (IDA). O EME é o conjunto de extensões plug-in para o IDA. Tanto o EME quanto o IDA fornecem um único ambiente para a manipulação e o mapeamento de todos os modelos de dados da IBM. O EME também fornece a funcionalidade adicional necessária para gerenciar o conjunto completo do IBM Industry Data Models. Isto inclui:

  • Definição de escopo: Criação de um modelo filho "subconjunto" consistente e coerente
  • Harvesting: Propagação de customizações de um modelo filho para seu pai
  • Validação: Verificação da exatidão e da consistência do modelo
  • Análise de impacto: Entendendo como uma alteração em um modelo pode influenciar outros modelos relacionados

Você usará esta funcionalidade do EME com o IDA (denominados, em conjunto, como EME/IDA) para atingir o objetivo do tutorial. Uma grande porção de materiais educacionais já está disponível para a modelagem geral com o EME/IDA (veja a seção Recursos deste tutorial).

Este tutorial também fornece muitas dicas sobre modelagem, assim como aponta armadilhas que devem ser evitadas. Este tutorial concentra-se na definição de escopo do IBM Industry Model BDW 8.2. Seguindo as etapas fornecidas, é possível criar os mesmos modelos lógicos de dados como neste tutorial.

Roteiro

Aqui estão as quatro etapas que você irá seguir para definir o escopo do modelo Banking Data Warehouse (BDW) usando o EME/IDA:

Pré-requisitos

Para acompanhar este tutorial, instale os seguintes:

  • InfoSphere Data Architect 7.5.2 (veja Recursos para um link para fazer o download de uma versão de teste)
  • IBM Enterprise Model Extender (EME) 8.1.1
  • IBM Banking Data Warehouse Industry Model

O Centro de Informações para o InfoSphere Data Architect inclui instruções que cobrem a instalação do IBM Industry Models, EME e InfoSphere Data Architect (veja Recursos).


Definir um escopo

Esta etapa pressupõe que você tem o software necessário instalado. Nesta seção, você criará um projeto desenvolvimento onde fará sei trabalho e definirá um novo escopo no qual irá selecionar todos os objetos de negócios necessários para o modelo de dados inicial.

Configurar o projeto

  1. Inicie o InfoSphere Data Architect
  2. Selecione File > Import.
  3. No assistente de importação, expanda Industry Models.
  4. Selecione Packaged Content e clique em Next, como exibido na Figura 1:
    Figura 1. Importando conteúdos empacotados no IDA
    Screen capture of import wizard with Packaged Content selected
  5. Insira um nome para o projeto (por exemplo, MyDevProj-BDW V8.2) e clique em Next.
  6. Selecione o conteúdo empacotado para importar (neste caso, BDW V8.2) e clique em Finish, como exibido na Figura 2:
    Figura 2. Importando o modelo de segmento de mercado no IDA
    Screen capture of import wizard with BDW V8.2 selected

Definir o novo escopo

Agora é possível definir um novo escopo no projeto de desenvolvimento recém-criado.

  1. No explorador de projetos, navegue até seu projeto, MyDevproj-BDW V8.2.
  2. Vá para Scope, clique com o botão direito do mouse e selecione New, o que exibirá uma janela exibindo todos os escopos definidos em BDW V8.2.
  3. Clique no botão Add, que automaticamente cria um novo escopo com o nome "NewScope". Forneça um nome mais adequado para este escopo (por exemplo, 03_BDW-Campaign Analysis).
  4. Crie uma breve descrição para este escopo inserindo seus comentários em Properties/Documentation, como exibido na Figura 3:
    Figura 3. Definindo e documentando um novo escopo no IDA
    Screenshot of new scope properties with entered description; description: This is the special scope for our prototype data mart model, which we will build for a Campaign Analysis Project with BDW 8.2 under IDA.

Agora você está pronto para avançar para a próxima etapa.


Definir o escopo do modelo com o modelo conceitual e o modelo de requisitos analítico no EME/IDA

Nesta seção, você selecionará os objetos necessários para o seu modelo de data mart de análise de campanha. Os objetos que você irá usar estão em Conceptual Model e Analytical Requirements Model. Para mais ideias e dicas sobre a análise de campanha, você pode conferir os escopos predefinidos no modelo genérico MyDevProj-BDW V8.2. Por exemplo, confira o escopo predefinido "Campaign Analysis". Além disso, leia o material e os comentários em Properties/Documentation.

Figura 4. Escopo predefinido "Campaign Analysis"
Screenshot of scope screen with Campaign Analysis highlighted and 'Campaign Analysis' documentation shown

Além disso, é possível observar os modelos de dados lógicos genéricos no modelo genérico MyDevProj-BDW V8.1. Para fazer isso, siga as seguintes etapas:

  1. Vá para Data Models, na visualização Data Project Explorer.
  2. Vá para Banking Data Warehouse Model.
  3. Agora expanda IFW Summary and Analysis e vá para Analysis.
  4. Aqui você encontrará o Business Solution Template (BST) Campaign Analysis, na visualização do explorador, como exibido na Figura 5:
    Figura 5. Localizando BSTs no modelo BDW
    Screen capture of explorer, showing 'Diagrams' selected
  5. Selecione a entidade Campaign Analysis para ver uma lista de atributos.

    Ao selecionar um atributo (por exemplo, Advertising Spend), você verá uma descrição do atributo na visualização Properties, em Documentation. Você também obtém um diagrama deste BST.
  6. Clique com o botão direito do mouse em Diagrams.
  7. Selecione New Blank Diagram. Isto fará com que uma nova tela de diagrama vazia seja aberta.
  8. Use copiar e colar para selecionar os BTSs na visualização Data Project e mova-os para a visualização Diagrams. Ao fazer isso com o BST Campaign Analysis, você terá os seguintes resultados, como exibido na Figura 6:
    Figura 6. Modelo lógico predefinido para Campaign Analysis
    Screenshot, showing explorer on left with 'Advertising Spend' highlighted and diagrams pane on right with Campaign Analysis and Complain Analysis attributes listed

Após verificar os vários atributos e entender seus significados de negócios, é possível entender mais claramente o que é possível fazer com este BST genérico. Você precisará desta informação mais tarde para construir um modelo de dados lógico significante para o seu futuro data mart "Campaign Analysis".

O próximo passo necessário é selecionar o Business Solution Template (BST) e as medidas que você deseja ver sem seu modelo de data mart.

  1. Navegue até Analytical Requirements Model.
  2. Em Focus Area > Relationship Management, selecione o BST Campaign Analysis, e mova-o para a janela vazia em References.

    Ao selecionar o BST, você também seleciona todas as medidas e dimensões definidas para este BST. Você deverá ver agora que o BST está selecionado em seu escopo, como ilustrado na Figura 7:
    Figura 7. BST Campaign Analysis selecionado no escopo
    Screenshot of Data Project Explorer and Scopes window, with 'Campaign Analysis' selected
  3. Verifique as medidas e dimensões, que são definidas no BST Campaign Analysis. Você deverá encontrar as seguintes listas para medidas e dimensões:
    • Medidas do Campaign Analysis:
      • Campaign deliverable amount
      • Advertising spend
      • Campaign cost
      • Number of customers in target population
      • Number of customers contacted
      • Number of customers responding
      • Number of new arrangements from campaigns
      • Number of new customers
      • Total cost of outward customer communications
      • Profit generated by new customers
      • Response percentage
      • Total campaign promotion communications
      • Total employee compensation for campaign
      • Total income on new AR resulting from campaign
      • Total new funds from campaign
      • Total number of return responses
      • Total number of targeted persons
    • Dimensões do Campaign Analysis:
      • Campaign activity segment
      • Campaign
      • Campaign type
      • Scenario
      • Time period
      • Customer market segment
      • Channel
      • Organization unit geography
      • Household annual income segment
      • Advertising medium
      • Campaign trigger type
      • Communication response type
      • Competitive win status
      • Product type
      • Communication form
  4. Uma vez que você sabe que não todas as medidas são mapeadas em atributos no modelo lógico, é necessário procurar medidas que sejam suportadas. Para fazer isso, selecione uma medida e, a seguir, clique na propriedade Depended on by. Por exemplo, ao selecionar Number Of New Arrangements From Campaigns, você vê que esta medida é mapeada para um atributo na entidade "Campaign Analysis," como ilustrado na Figura 8:
    Figura 8. Dependência entre modelos de requisito e lógico para uma medida
    Screen capture showing number of new arrangements from campaigns

    É possível repetir este processo para todas as medidas listadas acima. Um modo melhor é selecionar todo o BST Campaign Analysis e, a seguir, clicar na propriedade Depended on by. Isto exibe os mapeamentos existentes entre os modelos de requisitos e lógico. O sinal de mais (+) indicam um mapeamento onde uma expansão adicional é possível. Veja a medida "Number Of New Arrangements From Campaigns" verificada anteriormente.

    A Figura 9 mostra todas as dependências entre os modelos de requisitos e lógico para medidas e dimensões da BST Campaign Analysis:

    Figura 9. Dependências entre modelos de requisitos e lógicos para todo o BST
    Screen capture showing list of dependencies with reason and qualified name

    Como resultado, você vê as medidas e dimensões suportadas. Para as dimensões, você vê que não existem dependências. Para as medidas, você obtém a seguinte lista. Aquelas marcadas com um asterisco (*) são suportadas.

    • Medidas do Campaign Analysis:
      • Campaign Deliverable Amount
      • Advertising Spend*
      • Campaign Cost*
      • Number of Customers in Target Population
      • Number of Customers Contacted
      • Number of Customers Responding
      • Number of New Arrangements From Campaigns*
      • Number of New Customers
      • Total Cost of Outward Customer Communications
      • Profit Generated by New Customers
      • Response Percentage
      • Total Campaign Promotion Communications*
      • Total Employee Compensations for Campaign
      • Total Income on New AR Resulting From Campaign
      • Total New Funds From Campaign
      • Total Number of Return Responses*
      • Total Number of Targeted Persons
  5. Selecione três destas medidas para o seu escopo (veja os itens marcados com um asterisco na lista abaixo). Observe que estas medidas também são selecionadas através da seleção de todo o BST. Mas, para uma melhor documentação do escopo, você irá, todavia, selecioná-las. Agora, recomenda-se que você encontre algumas medidas adicionais, que são usadas como atributos na entidade de resumo Campaign Summary. Para estas, vá para Conceptual Model > Aggregate Descriptors, e siga os seguintes descritores para o escopo:
    • Advertising Spend*
    • Campaign Costs*
    • Number of Channels Used
    • Number of New Arrangements From Campaign*
    • Opening Campaign Market Research Costs
    • Total Opening Campaign Cost
    Figura 10. Definindo medidas no novo escopo
    Screen capture showing pane where measures are defined for the scope

    Nota: Os descritores sem asterisco na lista acima serão mapeados para atributos na entidade Campaign Summary no modelo lógico.

  6. Agora é necessário incluir atributos existentes no escopo para as diferentes entidades de dimensão. Você precisa fazer isso, pois não há um mapeamento direto entre as dimensões e o modelo lógico, porém, uma dimensão é mapeada para um classificador, o qual por sua vez é mapeado para uma entidade de classificação no modelo de dados lógicos.

    A dimensão de tempo é representada pela entidade Measurement Period. Para selecionar atributos nesta dimensão, vá para Concepts > Classification > Classification Descriptor > Classification Descriptor Type, e selecione os seguintes atributos no seu escopo:

    • Calendar month
    • Calendar quarter
    • Calendar year
    • Day of calendar month
    • Day of calendar quarter
    • Day of calendar year
    • Day of fiscal month
    • Day of fiscal quarter
    • Day of fiscal year
    • Day of week
    • Fiscal month
    • Fiscal quarter
    • Fiscal year
    Figura 11. Selecionando atributos para Measurement Period
    Screen capture showing pane with attributes selected
  7. Para a dimensão da campanha, alguns atributos de suporte são necessários. Para isto, navegue para Concepts > Event > Event Descriptor > Event descriptor type, e selecione os seguintes:
    • Campaign activity description
    • Campaign code
    • Campaign description
    • Campaign segment activity name
    Figura 12. Atributos de suporte na dimensão Campaign
    Screen capture showing pane with attributes selected

Com isso, você completou a seleção de objetos no modelo conceitual e no modelo de requisitos analítico. Você pode seguir em frente selecionando atributos adicionais para outras entidades dimensionais. Mas, para uma demonstração do principal uso da definição de escopo, isto deve ser suficiente por enquanto.


Exportar o modelo com o escopo definido para um novo projeto de desenvolvimento

Nesta seção, você definirá um novo projeto de desenvolvimento de modelo de dados (um projeto "filho"), que será usado mais tarde para a modelagem lógica adicional, e, a seguir, exportará o seu modelo com escopo definido para este projeto.

  1. Navegue para Scopes, clique com o botão direito do mouse e selecione New, e, a seguir, selecione Project.
  2. No próximo assistente para novo projeto, selecione Industry Model Development Project, como exibido na Figura 13:
    Figura 13. Atributos de suporte em dimensão Campaign
    Screen capture showing New Project wizard with Industry Model Development Project selected
  3. Clique em Next.
  4. Após selecionar o seu escopo definido anteriormente, é possível definir um nome para o novo projeto (por exemplo, 03_BDW-Campaign Analysis).
  5. Clique no botão Submit, e um novo projeto filho é criado.

    Durante o processo de criação, todas as dependências dos objetos selecionados (objetos no modelo de data mart) para objetos em um modelo DWH principal são resolvidas. Uma tela é exibida, mostrando somente os objetos selecionados e os objetos dependentes no novo projeto filho, como exibido na Figura 14:

    Figura 14. O novo projeto de desenvolvimento de modelo de segmento de mercado
    Screen capture showing 03_BDW-Campaign Analysis project

Modelagem lógica no novo projeto de desenvolvimento

  1. Abra o novo projeto de desenvolvimento de modelo de segmento de mercado. Procure por Banking Data Warehouse model.ldm * > 09.Analysis Area. Você deverá ver somente os objetos que selecionou na seção "Scope the model with conceptual model and analytical requirements model in EME/IDA".
    Figura 15. Área de análise com escopo definido em novo projeto de desenvolvimento de modelo de segmento de mercado
    Screen capture showing selected objects
  2. Para ver um modelo completo de data mart, navegue até Banking Data Warehouse Model.idm * > Analysis > Diagrams, clique com o botão direito do mouse e selecione New Blank Diagram.
    Figura 16. Novo diagrama de modelo lógico em branco
    Screen capture showing selection of New Blank Diagram
  3. Agora, é possível selecionar todas as entidades necessárias para um modelo completo de data mart e movê-lo para o diagrama em branco. Comece pela entidade Campaign Analysis, localizada abaixo de Banking Data Warehouse Model > IFW Summary and Analysis > Analysis.
  4. A seguir, selecione as entidades de dimensão. Por exemplo, é possível selecionar a entidade dimensional Organization Unit Geography, localizada em Banking Data Warehouse Model > IFW System of Record > Classification, como exibido na Figura 17:
    Figura 17. Criação de diagrama de data mart para análise de campanha
    Screen capture showing the created diagram

    É possível fazer isso para todas as entidades dimensionais verificando as chaves estrangeiras na entidade de fato e procurando pelas entidades correspondentes.

  5. Após isso, observe as entradas Generalization e Classification. Por exemplo, você vê que a entidade Measurement Period Type classifica o Measurement Period. A entidade Measurement Period contém atributos como datas e registros de hora. Estes atributos são usados para construir o histórico para os atributos na tabela de fatos Campaign Analysis. O Measurement Period é modelado no BDW como um conceito especial (em outras palavras, uma entidade) com um conceito mais genérico. Logo, você percebe que o Time Period Type ("supertipo") é uma generalização de Measurement Period Type ("subtipo"). Além disso, Event é um supertipo para os subtipos Campaign e Communication. Estes conceitos são ilustrados no modelo de dados exibido na Figura 18. Esse é um bom ponto de partida para a modelagem adicional do modelo de dados lógico.
    Figura 18. Modelo de data mart lógico para análise de campanha
    Screen capture showing diagram of data mart model
  6. A seguir, você inclui a entidade de resumo Campaign Summary no seu modelo de data mart. Esta entidade de resumo contém atributos, que podem conter agregações e totais de medidas da entidade de fato Campaign Analysis. Assim, a Campaign Summary contém um número de medidas muito importantes, que têm valores de negócios para a tarefa de análise de campanha. É possível ver todas estas entidades no diagrama exibido na Figura 19:
    Figura 19. Modelo de data mart lógico para análise de campanha, incluindo Campaign Summary
    Screen capture showing diagram of data mart model, including campaign summary

    Além do Campaign Summary, há outras duas entidades de resumo criadas neste escopo:

    • Arrangement Activity Summary
    • Employee Summary

    Ao integrar estas entidades de resumo no diagrama de modelo lógico, você irá obter um modelo de data mart lógico com três entidades de resumo. Você também irá obter uma entidade de conexão chamada Summary Characteristic. Esta entidade exibe as relações entre as entidades de resumo. A entidade contém as chaves estrangeiras comuns de todas as três entidades de resumo (Measurement Period Id e Scenario Id). Assim, a Summary Characteristic funciona como uma entidade âncora. Além disso, é possível integrar entidades de informações técnicas (fornecidas pelo BDW), como Population Event With Unique Id Characteristic. Esta entidade agora contém vários atributos com informações técnicas, como o tempo do processo de preenchimento ou o identificador do sistema de origem. Esta informação de preenchimento é vinculada às entidades genéricas Involved Party e Arrangement. Realizando todas estas etapas, você chega ao diagrama exibido na Figura 20:

    Figura 20. Área de resumo para a análise de campanha, incluindo Campaign Summary
    Screen capture showing diagram of data mart model with Summary Characteristic relationships

    Para cada entidade e para cada atributo no diagrama do modelo lógico, é possível ver a documentação original do IBM Industry Model BDW 8.2. Na Figura 21, por exemplo, você pode ver a definição da entidade Measurement Period:

    Figura 21. Documentação da entidade Measurement Period
    Screen capture showing definition of entity Measurement Period

    A Figura 22 exibe a definição (em Properties > Documentation) do atributo Total New Funds From Campaign na entidade Campaign Summary:

    Figura 22. Documentação de um atributo no Campaign Summary
    Screen capture showing definition of Total New Funds From Campaign

Conclusão

Seguindo as etapas apresentadas neste tutorial, você aprendeu como obter um significante modelo de dados lógicos inicial para os requisitos de negócios de análise de campanha usando o InfoSphere Data Architect. Você também aprendeu como é possível reutilizar as dependências e relações predefinidas para você no modelo de segmento de mercado Banking Data Warehouse. Agora que você criou um modelo de dados lógicos significativo, pode usar o InfoSphere Data Architect para criar facilmente um modelo físico a partir do modelo de dados lógicos para sua plataforma de banco de dados de destino. A partir deste modelo físico no InfoSphere Data Architect, é possível executar o DDL para implementar o modelo no seu sistema de destino. Isto lhe dá um bom ponto de partida para a sua arquitetura DWH geral. Além disso, as dependências e relações conhecidas entre os modelos Core Warehouse e Data Mart podem ser usadas em uma próxima etapa para a definição de regras de transformação para o processo de preenchimento de dados (ETL). Ao usar o InfoSphere Integration Server para ETL, este processo pode ser automatizado.

Recursos

Aprender

Obter produtos e tecnologias

  • InfoSphere Data Architect: Adquira uma cópia de teste do InfoSphere Data Architect para se familiarizar com suas capacidades.
  • Elabore seu próximo projeto de desenvolvimento com o software de teste IBM, disponível para download diretamente no developerWorks.

Discutir

  • Fórum de discussão do InfoSphere Data Architect no developerWorks: Troque ideias e compartilhe soluções com seus colegas que usam o InfoSphere Data Architect para criar modelos de dados físicos e lógicos, descobrir a estrutura das fontes de dados, descobrir relações entre fontes de dados separadas ou analisar e impingir a conformidade com os padrões corporativos.
  • Participe dos blogs do developerWorks e envolva-se com a comunidade My developerWorks; com seu perfil pessoal e página inicial customizada, você pode adaptar o developerWorks aos seus interesses e interagir com outros usuários developerWorks.

Comentários

developerWorks: Conecte-se

Los campos obligatorios están marcados con un asterisco (*).


Precisa de um ID IBM?
Esqueceu seu ID IBM?


Esqueceu sua senha?
Alterar sua senha

Ao clicar em Enviar, você concorda com os termos e condições do developerWorks.

 


A primeira vez que você entrar no developerWorks, um perfil é criado para você. Informações no seu perfil (seu nome, país / região, e nome da empresa) é apresentado ao público e vai acompanhar qualquer conteúdo que você postar, a menos que você opte por esconder o nome da empresa. Você pode atualizar sua conta IBM a qualquer momento.

Todas as informações enviadas são seguras.

Elija su nombre para mostrar



Ao se conectar ao developerWorks pela primeira vez, é criado um perfil para você e é necessário selecionar um nome de exibição. O nome de exibição acompanhará o conteúdo que você postar no developerWorks.

Escolha um nome de exibição de 3 - 31 caracteres. Seu nome de exibição deve ser exclusivo na comunidade do developerWorks e não deve ser o seu endereço de email por motivo de privacidade.

Los campos obligatorios están marcados con un asterisco (*).

(Escolha um nome de exibição de 3 - 31 caracteres.)

Ao clicar em Enviar, você concorda com os termos e condições do developerWorks.

 


Todas as informações enviadas são seguras.


static.content.url=http://www.ibm.com/developerworks/js/artrating/
SITE_ID=80
Zone=Information Management
ArticleID=483968
ArticleTitle=Definindo o escopo do IBM Industry Model para atividades bancárias usando o Enterprise Model Extender e o InfoSphere Data Architect
publish-date=03222010