Avançar para a área de conteúdo

Ao clicar em Enviar, você concorda com os termos e condições do developerWorks.

A primeira vez que acessar o developerWorks, um perfil será criado para você. Informações do seu perfil (tais como: nome, país / região, e empresa) estarão disponíveis ao público, que poderá acompanhar qualquer conteúdo que você publicar. Seu perfil no developerWorks pode ser atualizado a qualquer momento.

Todas as informações enviadas são seguras.

  • Fechar [x]

Ao se conectar ao developerWorks pela primeira vez, é criado um perfil para você e é necessário selecionar um nome de exibição. O nome de exibição acompanhará o conteúdo que você postar no developerWorks.

Escolha um nome de exibição de 3 - 31 caracteres. Seu nome de exibição deve ser exclusivo na comunidade do developerWorks e não deve ser o seu endereço de email por motivo de privacidade.

Ao clicar em Enviar, você concorda com os termos e condições do developerWorks.

Todas as informações enviadas são seguras.

  • Fechar [x]

Use o IBM Industry Model Information Insurance Warehouse para definir modelos de dados inteligentes e maduros

Introdução ao método de desenvolvimento de data warehousing para seguros

Hermann Voellinger, Senior IT Architect, IBM
Hermann Voellinger photo
Hermann Voellinger é um arquiteto de TI senior do IBM Software Group Services. Ao longo dos últimos 12 anos, ele vem sendo o arquiteto de TI responsável pelos grandes projetos de armazém de dados (DWH) na Alemanha. Nos 10 anos anteriores, ele trabalhou no German Development Lab como o principal desenvolvedor e arquiteto para ferramentas e soluções de mineração de dados e texto. Suas habilidades essenciais e seu principal foco de trabalho são a arquitetura dos processos de preenchimento de dados (ETL), os conceitos de modelagem de dados e a estratégia e arquitetura das soluções DWH.
(Um autor Contribuidor do IBM developerWorks)
Alexander Tarabrin, Advisory IT Architect, IBM
Photo of Alexander Tarabrin
Alexander Tarabrin tem 14 anos de experiência profissional na área de TI. Ele é Advisory IT Architect no IBM Software Group Services na IBM Alemanha. Alexander está trabalhando nas áreas de modelagem de dados, gerenciamento de dados, modelos do segmento de mercado e integração de dados do cliente.

Resumo:  Neste tutorial, entenda o método para desenvolver modelos de dados para projetos de armazém de dados usando o IBM Industry Model Insurance Information Warehouse (IIW), que é parte do produto IBM Industry Models definido para o setor de seguros. O tutorial mostra a melhor abordagem para desenvolver modelos de core data warehouse (CDW) e modelos de data mart (DM). Também apresenta o data warehousing development method (DWDM) recomendado para lidar com a estrutura de padrão de modelo IIW para arquitetar soluções de DWH para empresas de seguro.

Data:  13/Jan/2011
Nível:  Intermediário

Atividade:  7592 visualizações

Fase 4: Projetar o data mart

Usuários de negócios concluem as fases descritas nas primeiras duas fases deste tutorial. Projetar um data mart é orientado para TI, e é mais adequado que usuários de TI (designers de dados) os concluam. A camada de design do IIW consiste na parte atômica (o modelo corporativo) e na parte analítica (modelo de dimensões e modelos de data mart conformados). Esta seção descreve a parte analítica.

O modelo dimensional conformado é o repositório corporativo de dados analíticos. Contém estruturas de dados dimensionais baseadas em entidades de fato que permitem distribuição fácil de dados analíticos para modelos analíticos de recebimento de dados, tais como data marts.

A estrutura e o conteúdo de negócios das dimensões no modelo dimensional conformado baseiam-se e reutilizam o modelo de armazém de dados. As medidas na tabela de fatos suportam as medidas definidas nos requisitos analíticos.

Além das estruturas de dados e conteúdo originados do modelo de armazém de dados, o modelo dimensionado conformado inclui o seguinte:

  • Relacionamentos adicionais para desenvolver caminhos de agregação nos quais medidas podem ser analisadas
  • Entidades adicionais para eficiência de armazenamento e análise, tais como perfil e entidades auxiliares

No InfoSphere Data Architect, há vários modelos lógicos de data marts predefinidos no IIW, como mostra a Figura 15.


Figura 15. Recorte de amostra da estrutura de data mart do IIW

Cada modelo de data mart em si pode consistir em um conjunto de subconjuntos analíticos. Figura 5 mostra que a análise de eficiência de solicitações consiste em quatro pacotes analíticos (contêm tipo de dado) e um pacote de associação (contém entidades de relacionamento). Essa é a estrutura padrão de modelos lógicos no IBM InfoSphere Data Architect.

Usando o modelo dimensional conformado

O modelo dimensional conformado é um como um super data mart. Entretanto, tenha cuidado com as consultas do usuário final, por estas razões:

  • As estruturas dimensionais do modelo dimensional conformado são organizadas como flocos de neve, o que torna as consultas mais complexas
  • Algumas entidades de fato podem ser genéricas demais, o que pode resultar em nomes de medidas de negócios que são pouco significativos.
  • O número de dimensões por fato pode ser alto demais. A granularidade de dimensões é o mais alto possível para permitir os requisitos analíticos mais granulares sem exigir manutenção do design. Isso pode resultar em fatos demais e tempos de resposta ruins nas consultas.

O modelo dimensional conformado é baseado nos dois principais princípios de design a seguir:

Dimensões conformadas
Uma dimensão conformada é uma dimensão principal com cujo conteúdo todos os grupos no empreendimento concordam. Dimensões conformadas permitem caminhos de agregação reutilizáveis para medidas em diversas tabelas de fatos.
Fatos conformados
Um fato conformado é uma medida com cuja definição de negócio todos os grupos no empreendimento concordam. O fato pode ser usado em cálculos analíticos em fontes de dados separadas e com outros fatos conformados.

Os dois princípios de design definem consistência nas tabelas de fato, melhoram a qualidade dos resultados analíticos e facilitam técnicas de análise, tais como drilling across.

O modelo dimensional conformado é parcialmente não normalizado para facilitar a extração de estruturas dimensionais para preencher modelos de data mart de recebimento de dados.

Artefatos do modelo dimensional conformado

Ao usar IBM Industry Models para desenvolver soluções de BI, o modelo dimensional conformado usa os seguintes artefatos:

Entidade de fato
Uma entidade agregada que reagrupa um conjunto de medidas (fatos) que compartilham todos as mesmas dimensões. A chave primária de uma entidade de fato é definida como a concatenação de todas as chaves estrangeiras das entidades que são usadas como suas dimensões. A entidade de fato é a entidade principal da estrutura de dados dimensional. Pode servir como base para criar subconjuntos da estrutura que são distribuídos para data marts.
Entidade auxiliar
Uma entidade auxiliar gerencia a análise de uma estrutura hierárquica complexa de profundidade variável de uma dimensão. Uma entidade auxiliar pode ser usada apenas se a estrutura hierárquica for uma árvore, e não uma rede. Essa entidade contém uma instância para cada caminho separado de cada nó na árvore hierárquica para si mesmo e para cada nó abaixo. Um exemplo é a entidade auxiliar geográfica.
Entidade de apoio
Uma entidade que é usada apenas para apoiar as estruturas de dados analíticas. Um exemplo é a entidade de data do calendário.
Entidade de grupo de valor
Uma entidade que agrupa atributos usados para realizar análise em uma entidade de fato. Cada atributo de uma entidade de grupo de valor tem um conjunto de valores discretos nos quais é ;possível agregar as medidas de uma entidade de fato. Um exemplo é a entidade de perfil do cliente.
Relacionamento de dimensão
Um relacionamento entre uma entidade de fato e uma entidade fundamental ou uma entidade de classificação no modelo de armazém de dados.
Atributo complexo
Uma medida que é calculada a partir de outras medidas. A definição inclui uma fórmula na qual os parâmetros são atributos.
Atributo derivado
Um atributo cujo valor é derivado do valor de um ou mais atributos no modelo de armazém de dados. Geralmente esse valor inclui medidas de entidade de fato que não são atributos complexos. Esse valor é calculado a partir de dados atômicos no modelo de armazém de dados.
Outros artefatos no modelo de armazém de dados
O modelo dimensional conformado reutiliza entidades do modelo de armazém de dados, geralmente para definir suas dimensões e seus atributos derivados. Consulte os artefatos do modelo corporativo na Fase 3. Alguns dos artefatos são:
  • Entidade fundamental
  • Entidade de classificação
  • Entidade de apoio
  • Atributo básico
  • Atributo de relacionamento

Customização do modelo dimensional conformado

Geralmente, a customização realizada nos requisitos analíticos no contexto do escopo do projeto conduz a customização do modelo dimensional conformado.

Graças aos mapeamentos dos requisitos analíticos, a customização do modelo dimensional conformado é bem simples para todos os elementos do Industry Model pré-existentes nos requisitos analíticos. Se um elemento pré-existente de requisitos analíticos for customizado no contexto do projeto com escopo definido, a customização deve se refletir de acordo no modelo dimensional conformado. Por exemplo, definições e exemplos de uma medida customizada com escopo definido precisam ser revistas e customizadas no modelo dimensional conformado.

Para elementos de modelo que precisam ser criados no modelo dimensional conformado, a descrição dessa tarefa pode ser encontrada em uma descrição de tarefa especial do Industry Model Data Warehouse Development Method.

As duas seções a seguir apresentam exemplos de regras para seguir ao criar novos elementos de modelo dimensional conformado.

Regra 1

Se uma nova entidade de fato for incluída no modelo dimensional conformado, a chave primária precisa ser incluída na lista de atributos (medidas) originários dos requisitos analíticos. Essa entidade é composta de todos os atributos de relacionamento que são as chaves estrangeiras nos relacionamentos dimensionais. As frases verbais são para dimensão ou é uma dimensão de.

Observações:

  • Para uma entidade de fato de captura instantânea, a dimensão de tempo é substituída por um atributo de chave de candidato, como uma data de referência.
  • Os atributos de relacionamento que compõem a chave primária devem ser nomeados de acordo com a dimensão que representam. Por exemplo: id de agente de vendas em um relacionamento de dimensão com a entidade fundamental de função de canal.
  • Isso irá gerar um atributo de chave primária do Explorador de Projetos de Dados do EME que deve ser renomeado como o nome da entidade com o sufixo PK"
  • Os seguintes atributos técnicos precisam ser incluídos no atributo da chave primária:
    • Um atributo de data válido a partir de, que representa o horário de transação para o início do período durante o qual os valores deste dado registrado são verdadeiros no sistema de origem. O atributo de data válido a partir de também é classificado como um atributo básico, e usa um registro de hora de tipo de dado de [TIMESTAMP].
    • Um atributo de dados válido até, que representa o horário de transação para o fim do período no qual os valores deste dado registrado são verdadeiros no sistema de origem. O atributo de data válido até também é classificado como um atributo básico, e usa um registro de hora de tipo de dado de [TIMESTAMP].
  • É preciso mapear a nova entidade de fato para os requisitos analíticos que ela suporta.

Regra 2

Se uma nova dimensão for incluída em uma entidade de fato no modelo dimensional conformado, a nova dimensão precisa ser definida como um relacionamento dimensional que vincula uma entidade fundamental ou de classificação do modelo de armazém de dados para a entidade de fato. As frases verbais são para dimensão ou o é uma dimensão de.

Observações:

  • Você deve definir o atributo de relacionamento que representa a dimensão recém-incluída na entidade de fato como um componente da chave primária da entidade de fato.
  • O nome do atributo de relacionamento deve refletir a dimensão que ele representa. Por exemplo: id de agente de vendas em um relacionamento de dimensão com a entidade fundamental de função de canal.

Figura 16 mostra um recorte de um diagrama de dados de exemplo para um modelo de dados dimensionais para uma tabela de fato de desempenho de tratamento de solicitações. Esta tabela de fato é uma tabela de fato predefinida no modelo dimensional conformado do aplicativo Claim Efficiency Analysis (CEA). Os atributos foram omitidos para melhorar a leitura.


Figura 16. Exemplo de modelo dimensional para desempenho de tratamento de solicitações

(Veja uma versão maior da Figura 16.)

O aplicativo Claim Efficiency Analysis (CEA) lida com os fatores que afetam a eficiência do tratamento de solicitações fazendo o seguinte:

  • Monitorando pagamentos de recuperação recebidos de terceiros e de resseguradoras
  • Avaliando a distribuição de solicitações entre intermediários e o carregamento dos manipuladores de solicitações
  • Reconciliando solicitações pendentes contra estimativas de solicitações
  • Realizando análise estatística que pode influenciar o desenvolvimento de produto
  • Analisando a distribuição de solicitações em todos os tipos de eventos de perda.

A solução CEA permite o desempenho do tratamento de solicitações da tabela de fato para monitorar e identificar ineficiências no processo de tratamento de solicitações. Os relatórios que resultam ajudam a otimizar redes de fornecedores e a melhorar eficiência operacional e satisfação do cliente.


Resumo da fase 4

Esta seção descreve o modelo dimensional conformado e como customizá-lo. Um modelo dimensional conformado pode ser transferido para o modelo físico usando o Assistente do InfoSphere Data Architect.

5 de 8 | Anterior | Próximo

static.content.url=http://www.ibm.com/developerworks/js/artrating/
SITE_ID=80
Zone=Information Management
ArticleID=608054
TutorialTitle=Use o IBM Industry Model Information Insurance Warehouse para definir modelos de dados inteligentes e maduros
publish-date=01132011
author1-email=VGR@de.ibm.com
author1-email-cc=
author2-email=tarabrin@de.ibm.com
author2-email-cc=