Para descobrir e analisar relacionamentos nos dados gerados pelo InfoSphere™ Information Server que são armazenados no Repositório de Metadados, os usuários tem a sua disposição o IBM® InfoSphere Metadata Workbench.
Com relatórios de linhagem e análise de impacto o IBM InfoSphere Metadata Workbench suporta os profissionais que são responsáveis por iniciativas de conformidade e governança corporativas que requerem linhagem dos dados (SOX ou Basileia II) e também questões de gerenciamento de mudanças do ambiente de Information Management.
Explore os Metadados do DataStage através do Metadata Workbench
O IBM Infosphere DataStage e QualityStage é uma solução que integra tanto a ferramenta para extrair, transformar e carregar dados como o módulo de qualidade dos dados.
Através do Metadata Workbench podemos editar a descrição dos metadados gerados pelo DataStage e pelo QualityStage e assim gerar relatórios de análise de impacto e linhagem de dados, além de definir outros atributos, como termos de negócio, responsável, etc.
Importando e compartilhando metadados de arquivos sequenciais
Vamos ver como podemos compartilhar informações geradas pelo DataStage para que analistas possam enxergar os metadados e assim completar com outros atributos.
Etapas para importar metadados de arquivos sequenciais:
- 1. No DataStage, clique em Import >Table Definitions >Sequencial Files Definitions
- Na caixa Directory selecione a pasta em que se localiza o arquivo;
- Selecione o arquivo;
- Repare na caixa “To folder:” para saber o destino das definições do arquivo
- Clique em “Import”
- Clique no box “First line is column names”
- Verifique que “Comma” está selecionado no campo “Delemited”
- Clique na aba “Define”
- Clique “Ok” para começar a importar
- Quando terminar, clique em “Close” para concluir
- Até o presente momento os metadados estão presentes apenas no projeto do DataStage
- Localize a definição de tabela no Repository window, na seguinte pasta – Table
Definitions>Sequential
- Clique com botão direito do mouse sobre a definição de tabela “Customers.txt” e então selecione “Shared Table Definition Creation Wizard”
- A janela do “Shared Table Definition Creation Wizard” se apresentará
- Clique em “Next”
- Selecione "Create New" da lista do campo "Select Assciation to Shared
Table". Assim aparecera a janela "Create New Table"
- Clique em "Ok" para retornar ao “Shared Table Definition Creation Wizard”. Então clique em "Next", depois em "Create" e por fim em “Close” para completar o processo
- Na janela principal do Designer, clique em Repository>Metadata Sharing>Management.
Localize a definição do arquivo na janela "Shared Repository"
- Selecione a definição da tabela "Customers" e então clique na aba
"Columns". Isto mostrará as definições das colunas do arquivo importado
Para vizualizar a figura acima em tamanho maior clique aqui.
Podemos agora acessar o Metadata Workbench que é uma solução web através do endereço http://servidor:porta/workbench/. Neste momento será possível enxergar a definição de tabela criada pelo wizard de import do DataStage and QualityStage Designer
- Após conectar-se no Metadata Workbench clique na aba “Discoverer” e depois clique em “Data Files” sob “Display Information”
- Clique em “Customers.txt”
Para vizualizar a figura acima em tamanho maior clique aqui. - Clique em “File Structure”
Para vizualizar a figura acima em tamanho maior clique aqui.
Agora é possível atribuir um atributo, por exemplo um termo de negócio, através do InfoSphere Business Glossary, associar um responsável pela tabela e analisar a linhagem e também o impacto que traria mudanças relacionadas a este objeto.
Os benefícios que conseguimos em ter um repositório de metadados integrado vem desde a resposta de uma simples pergunta – os dados deste relatório vem de onde? - Até saber quais seriam os efeitos se algo fosse mudado em um determinado objeto.
Veja como a empresa Boerse Stuttgart conseguiu atingir analises mais eficientes dos dados utilizando soluções IBM.
http://www-01.ibm.com/software/success/cssdb.nsf/CS/STRD-8LHE9S?OpenDocument&Site=corp&cty=en_us
Descrever quais versões dos softwares mencionados foram usadas.
IBM InfoSphere Information Server v8r5
IBM InfoSphere Metadata Workbench v8r5
