Согласование в масштабах всего предприятия единых определений терминов, таких как «чистые продажи» и «клиент», может быть непростым делом. Еще большей проблемой может быть достижение взаимопонимания между разными бизнес-подразделениями и между бизнес-подразделениями и ИТ-службой. В то же время такое взаимопонимание является критически важным для эффективного построения хранилищ данных и отчетов, для управления данными и консолидации активов после слияний и приобретений.
Бизнес-метаданные документируют значение информационных активов для бизнеса и их категоризацию. Они определяются на языке бизнеса и не зависят от технологии. InfoSphere Foundation Tools позволяет установить ответственность, подотчетность и отслеживаемость для каждого бизнес-понятия или категории и создать условия для взаимодействия бизнес-аналитиков, пользователей, специалистов по моделированию данных и других ИТ-профессионалов.
Инструментарий InfoSphere Foundation Tools включает следующие продукты:
- IBM InfoSphere Information Analyzer
- IBM InfoSphere Data Architect
- IBM InfoSphere FastTrack
- IBM InfoSphere Metadata Workbench
- IBM InfoSphere Business Glossary, включая Business Glossary Anywhere
Базовой инфраструктурой, обеспечивающей совместное активное использование метаданных в продуктах InfoSphere, является уровень Unified Metadata Management в InfoSphere. На рисунке 1 этот уровень представляют общие метаданные, расположенные в центре изображения.
Рисунок 1. Продукты InfoSphere Foundation Tools
Продукты InfoSphere Foundation Tools поддерживают три основных типа метаданных:
- Бизнес-метаданные критически важны для обеспечения контекста в проектах интеграции. Они определяют понятия на повседневном языке, независимо от их технической реализации. Бизнес-метаданные обычно содержат определения, понятия, аббревиатуры, глоссарии, классификацию, категории, примеры, распорядителей и владельцев, описанных на бизнес-языке. Например: "Что такое клиентский заказ? Как категоризировать клиентский заказ?" Аудиторией для метаданных этого типа являются бизнес-пользователи.
- Технические метаданные используются по большей части техническим персоналом, например, разработчиками. Технические метаданные – это хост-серверы, типы баз данных, схемы базы данных, названия таблиц, названия столбцов и типы данных, описываемые в технических подробностях. Эти объекты интенсивно используются главным образом в процессе разработки приложений. Аудиторией для метаданных данного типа являются пользователи специализированных средств, например средств интеллектуального бизнес-анализа, ETL, профилирования и моделирования.
- Оперативными метаданными называются метаданные, сгенерированные и собранные при выполнении процесса. Оперативные метаданные позволяют администраторам управлять системой, искать причины проблем и гарантировать корректное выполнение. К ним относятся название задания, время выполнения задания, число обработанных строк, состояние ошибки или успеха, время начала и время завершения, описываемых последовательно. Аудиторией для метаданных данного типа являются оперативный персонал, менеджмент и бизнес-пользователи.
Все эти типы метаданных могут быть связаны между собой для создания сквозных взаимосвязей, чтобы пользователи могли понять не только то, где информация хранится, но также понять бизнес-контекст этой информации.
Рисунок 2. Уровень унифицированного управления метаданными
Information Server подходит к управлению этими тремя типами метаданных через общую архитектуру для сохранения, улучшения и обмена метаданными, как показано на рисунке 2.
- Сохранение означает, что доступ к унифицированной основе метаданных платформы InfoSphere Information Server, обеспечивающей единый активный репозиторий для облегчения взаимопонимания между деловыми и техническими сферами для управляемой метаданными интеграции, осуществляется посредством уровня общих сервисов.
- Улучшение означает, что метаданные, сохраняемые в общем репозитории, можно улучшать путем создания ссылок на сторонние метаданные, а также расширять управляемым образом для учета дополнительных бизнес-требований.
- Обмен означает, что InfoSphere Information Server основан на концепции управляемых заданиями модулей. Нужные метаданные предоставляются каждой пользовательской роли для доступа и совместного использования через соответствующий интерфейс.
Уровень унифицированного управления метаданными поддерживает следующие цели:
- Все модули используют один и тот же активный репозиторий для совместного использования и обмена метаданными между пользовательскими ролями.
- Релевантные метаданные совместно используются и обмениваются пользовательскими ролями.
- К техническим метаданным добавляется бизнес-контекст.
- Обеспечивается улучшенное управление и повторное использование в различных интеграционных проектах.
- Интеграционный процесс исключает необходимость ручных действий и обслуживания метаданных.
- Повышается уровень доверия к корпоративной информации, поскольку понятно, откуда информация поступила и что она означает.
- Организации могут соблюдать требования к руководству, включая законодательные и нормативные требования.
Эти метаданные можно эффективно использовать совместно и повторно в проектах Rational, InfoSphere и Cognos®. Далее в данной статье рассказывается, как можно использовать некоторые из продуктов InfoSphere Foundation Tools для создания, поддержки и совместного использования ключевых бизнес-метаданных.
Вставка бизнес-метаданных в InfoSphere Business Glossary
Бизнес-метаданные можно создавать и загружать в глоссарий InfoSphere Business Glossary. В примерах данной статьи предполагается, что установлен Information Server, но это не является необходимым условием для использования InfoSphere Business Glossary. Если у вас установлен Information Server, вы можете обратиться к InfoSphere Business Glossary, используя вкладку Glossary в консоли Information Server Web. Для доступа к вкладке Glossary необходимо сначала зарегистрироваться в системе через консоль Information Server Web. После этого отобразится экран, показанный на рисунке 3.
Рисунок 3. Основной экран Web-консоли Information Server
Для доступа к бизнес-метаданным перейдите на вкладку Glossary, как показано на рисунке 3.
На вкладке Glossary можно просмотреть, изменить, импортировать и экспортировать бизнес-понятия, категории, распорядителей и специализированные атрибуты, как показано на рисунке 4.
Рисунок 4. Вкладка Glossary
- Категории используются для организации бизнес-понятий и других категорий в иерархические структуры.
- Бизнес-понятия определяют общий словарь для технических и бизнес-пользователей. Эти понятия, один раз определенные, проверенные и опубликованные, становятся стандартным корпоративным словарем. Можно включить описания, примеры, аббревиатуры, принципы предоставления в распоряжение, синонимы и связанные понятия.
- Распорядители - это люди, несущие ответственность за документирование и обслуживание бизнес-понятий и категорий, назначенных им.
- Специализированные атрибуты используются для настройки приложения под требования пользователя.
В Glossary имеется два варианта создания бизнес-понятий и категорий: вручную или путем импорта из файла (CSV или XML). Помимо этих двух вариантов, можно также экспортировать бизнес-понятия и категории из словаря и физических моделей, созданных в InfoSphere Data Architect, используя функцию экспорта.
Для создания новых категорий выберите пункт Categories в разделе Browse and Edit навигационной панели, как показано на рисунке 5.
Рисунок 5. Навигационная панель
Откроется окно Categories. В этом окне вы можете просматривать, искать, изменять, удалять и создавать новые категории или подкатегории. Нажмите кнопку New для создания новой категории, как показано на рисунке 6.
Рисунок 6. Окно Categories
После нажатия кнопки New можно определить новую категорию, как показано на рисунке 7.
Рисунок 7. Окно New category
Введите необходимую информацию:
- Name (название). Введите название категории. Например, можно использовать
General terms(общие понятия). Категории служат каталогами предметных областей, которые помогают конечным пользователям легко находить информацию. Для сред с несколькими языками каждая страна или язык должны быть категорией первого уровня. - Parent Category (родительская категория). Используйте этот пункт только в том случае, если категория является подкатегорией. Нажмите Select и выберите родительскую категорию. В данном примере она не выбирается. Категории более низкого уровня должны быть организованы согласно сферам бизнес-деятельности и так, чтобы конечные пользователи понимали, где искать информацию. Примером главной категории может быть
customer(клиент), а подкатегорий для клиентов -high-value(высокодоходные) иlow-value(низкодоходные). - Steward (распорядитель). Щелкните на пиктограмме и выберите идентификатор пользователя, назначаемого распорядителем. В данном примере он не выбирается.
- Short Description (краткое описание). Введите текст, описывающий категорию. В примере используется текст
General terms used over the enterprise(общие понятия, используемые на предприятии). - Long Description (полное описание). Введите полное описание для более подробного разъяснения категории. В данном примере это поле не заполняется.
При создании категорий можно задать специализированные атрибуты (custom attributes), содержащиеся понятия (contained terms) и другие параметры, используя раздел Custom Attributes. В нем можно определить специфичные для предприятия свойства категорий и понятий. Примерами Custom Attributes могут быть такие атрибуты, как HQ Approval Required, Basel II Term и Link to Legacy Data Dictionary. Для задания этой информации выберите ссылки в левой части экрана, как показано на рисунке 8.
Рисунок 8. Создание дополнительной информации для категорий
После завершения ввода информации для категории нажмите кнопку Save and Close. На рисунке 9 показана только что созданная вами категория (General terms) в списке.
Рисунок 9. Новая категория создана
Создание бизнес-понятий вручную
Для создания нового бизнес-понятия выберите ссылку Terms, расположенную в панели Navigation, как показано на рисунке 10.
Рисунок 10. Панель Navigation
Отобразится окно Terms. Нажмите кнопку New для добавления нового понятия, как показано на рисунке 11.
Рисунок 11. Окно Term
Определите новое бизнес-понятие. Основная часть информации не обязательна, но оптимальные методики рекомендуют указывать как можно больший объем информации для полного документирования бизнес-понятий. В данном примере добавляется понятие State Code, как показано на рисунке 12.
Рисунок 12. Новое бизнес-понятие
После завершения ввода информации о бизнес-понятии нажмите кнопку Save and Close.
Рисунок 13. Заполненное новое бизнес-понятие
Новое понятие добавляется в список Terms, как показано на рисунке 14.
Рисунок 14. Новое бизнес-понятие создано
Импорт бизнес-понятий и категорий из CSV-файла
Если у вас уже есть бизнес-понятия и категории, созданные в другом документе или программе, отличной от InfoSphere Foundation Tools, экспортируйте их в CSV-файл. Этот файл должен иметь формат, показанный в листинге 1. Для упражнений данной статьи можно использовать пример CSV-файла (см. раздел Загрузка).
Листинг 1. Пример CSV-файла для импорта бизнес-понятий и категорий
+++ Import Categories - Begin +++,,,,,,, Category Name,Parent Category,Steward,Short Description,Long Description,,, Customer,,,Captures information about customers,,,, +++ Import Categories - End +++,,,,,,, +++ Import Terms - Begin +++,,,,,,, Term Name,Parent Category,Steward,Short Description,Long Description,Usage,Example,Status Gender,Customer,,Gender,,,,Accepted +++ Import Terms - End +++,,,,,,, |
Пример CSV-файла имеет два основных раздела: Categories и Terms. Раздел Category имеет пять столбцов:
- Category Name (название категории)
- Parent Category (родительская категория)
- Steward (распорядитель)
- Short Description (краткое описание)
- Long Description (полное описание)
Раздел Terms имеет 12 столбцов:
- Term Name (название понятия)
- Parent Category (родительская категория)
- Steward (распорядитель)
- Short Description (краткое описание)
- Long Description (полное описание)
- Usage (правила использования)
- Example (пример)
- Status (состояние)
- Abbreviation 1 (аббревиатура 1)
- Abbreviation 2 (аббревиатура 2)
- Is Modifier (является ли модификатором)
- Type (тип)
Ниже приведено описание кода листинга 1.
+++ Import Categories - Begin +++,,,,,,,
Эта первая строка указывает начало разделов Categories.Category Name,Parent Category,Steward,Short Description,Long Description,,,
Вторая строка указывает названия столбцов, используемых в процессе импорта.Customer,,,Captures information about customers,,,,
Реальные импортируемые данные находятся в третьей строке каждого раздела, в данном случае раздела Categories. Данные каждого столбца отделяются от данных соседнего запятой.+++ Import Categories - End +++,,,,,,,
Последняя строка данного раздела указывает конец раздела Category.+++ Import Terms - Begin +++,,,,,,,
Данная строка указывает начало раздела Terms.Term Name,Parent Category,Steward,Short Description,Long Description,Usage,Example,Status
Вторая строка указывает названия столбцов, используемых в процессе импорта.Gender,Customer,,Gender,,,,Accepted
Реальные импортируемые данные находятся в третьей строке каждого раздела. Данные каждого столбца отделяются от данных соседнего запятой.+++ Import Terms - End +++,,,,,,,
Последняя строка данного раздела указывает конец раздела Terms.
Импорт бизнес-понятий и категорий выполняется легко и быстро. Выберите ссылку Import Terms and Categories, расположенную в навигационной панели, как показано на рисунке 15.
Рисунок 15. Навигационная панель
В окне Import Terms and Categories укажите имя файла и путь к файлу, содержащему понятия и категории, как показано на рисунке 16.
Рисунок 16. Окно Import Terms and Categories
Нажмите кнопку Import для начала процесса. На рисунке 17 показан пример результатов процесса импорта.
Рисунок 17. Результат процесса импорта
После возврата на вкладку Glossary вы увидите новые категории и бизнес-понятия. После импорта их можно отредактировать и сообщить членам технической группы о новых бизнес-понятиях.
Импорт метаданных из Metadata Server в InfoSphere Data Architect
InfoSphere Data Architect может выполнять импорт и экспорт метаданных из Metadata Server (сервер метаданных) и в него. Данная функциональность позволяет предприятию экспортировать отраслевую модель данных на сервер метаданных. Специалист по моделированию данных может импортировать бизнес-понятия и использовать их в модели глоссария для внедрения стандартов именования в моделях данных. Для импорта метаданных откройте InfoSphere Data Architect и выберите File > Import, как показано на рисунке 18.
Рисунок 18. Импорт метаданных
Выберите Import a Glossary Model from the Metadata Server (импортировать модель глоссария с сервера метаданных) под папкой Data и нажмите кнопку Next, как показано на рисунке 19.
Рисунок 19. Окно Import
Затем укажите проект, где хотите создать модель глоссария. Определите название новой модели или укажите, какую модель глоссария нужно обновить. Нажмите кнопку Next. В данном примере создается новая модель под названием Glossary Model.ndm.
Рисунок 20. Окно Import Model
Появляется экран Glossary Transformation Options, как показано на рисунке 21. При желании вы можете преобразовать эту новую модель глоссария в логическую модель данных, которую впоследствии можно преобразовать в физическую модель данных, установив соответствующий флажок.
Рисунок 21. Мастер Import Model
InfoSphere Data Architect требует ввода дополнительной информации перед подключением к серверу метаданных, например, имени хоста, номера порта, идентификатора пользователя и пароля, как показано на рисунке 22.
Рисунок 22. Окно выбора параметров
Введите необходимую информацию и нажмите кнопку OK.
На рисунке 23 показано результирующее окно состояния Metabroker.
Рисунок 23. Окно Status
При успешном подключении появляется окно metabroker Metadata Prefilter, как показано на рисунке 24.
Рисунок 24. Окно Prefilter
В окне metabroker Metadata Prefilter можно выполнить фильтрацию категорий, которые вы хотите импортировать с сервера метаданных. Выберите нужные категории и нажмите кнопку OK.
Окно metabroker Status window появляется снова, как показано на рисунке 25. Если все хорошо, нажмите кнопку Finish.
Рисунок 25. Окно Metabroker status
Новая модель глоссария появляется в InfoSphere Data Architect, как показано на рисунке 26.
Рисунок 26. Новая модель глоссария, импортированная из Business Glossary
Экспорт метаданных из InfoSphere Data Architect на Metadata Server
Процесс экспорта метаданных из InfoSphere Data Architect на Metadata Server почти аналогичен процессу импорта данных из Metadata Server в InfoSphere Data Architect. Из InfoSphere Data Architect можно экспортировать либо модель глоссария, либо физическую модель в InfoSphere Business Glossary.
Для демонстрации процесса экспорта модели глоссария на рисунке 27 показано, что в InfoSphere Data Architect открыта модель Glossary Model.
Рисунок 27. Открытая модель глоссария
Чтобы экспортировать глоссарий на сервер метаданных и сделать глоссарий доступным как InfoSphere Business Glossary, выберите File > Export. Откроется окно Export, как показано на рисунке 28.
Рисунок 28. Окно Export
В папке Data есть два варианта экспорта:
- Export a Glossary Model to the Metadata Server. Экспорт метаданных из модели глоссария в репозиторий метаданных, где метаданные появляются как категории и понятия. В InfoSphere Business Glossary эти понятия можно использовать для классификации объектов метаданных в репозитории.
- Export a Physical Model to the Metadata Server. Экспорт метаданных из физической модели в репозиторий метаданных, где метаданные могут использоваться инструментальными программами, взаимодействующими с репозиторием. Например, можно использовать импортированные определения таблиц в задании IBM InfoSphere DataStage и QualityStage Designer, анализировать столбцы в IBM InfoSphere Information Analyzer или назначать распорядителей для объектов метаданных, используя InfoSphere Business Glossary.
В данном примере выберите вариант Export a Glossary Model to the Metadata Server. Нажмите кнопку Next. Появится экран Export Model to Metadata Server, как показано на рисунке 29.
Рисунок 29. Окно Export Model
В окне Export Model выберите, из какой модели Glossary Model следует экспортировать информацию. После выбора модели (например, Corporate Glossary Model) укажите местоположение файла журнала и нажмите кнопку Finish. Появится экран metabroker, как показано на рисунке 30.
Рисунок 30. Окно Metabroker status
Окно Metabroker status позволяет выбрать экспорт на Metadata Server всей модели Glossary Model или только отфильтрованных элементов. Для данного примера экспортируйте весь словарь, потому что он небольшой.
Определив, что будет экспортироваться, на следующем экране можно указать информацию о доступе, как показано на рисунке 31.
Рисунок 31. Окно выбора параметров
После предоставления необходимой информации Data Architect подключается к Metadata Server и экспортирует выбранную вами информацию. Окно состояния Metabroker появляется снова и информирует вас об успешном завершении процесса, как показано на рисунке 32.
Рисунок 32. Окно состояния Metabroker, сообщающее об успешном завершении экспорта
Если вы хотите убедиться в успешности экспорта, можете перейти на вкладку Glossary в Information Server. Экспортированные понятия и категории должны отображаться на ней. В данном примере выделяются категории, как показано на рисунке 33.
Рисунок 33. Окно состояния Metabroker с выделенными категориями
Уровень Unified Metadata Management является базовой инфраструктурой, предназначенной для активного совместного использования метаданных в продуктах InfoSphere. Этот уровень обеспечивает интеграцию инструментальных средств (например, InfoSphere Data Architect), используемых бизнес-аналитиками, и инструментальных средств (например, Information Server), используемых техническими сотрудниками. Архитекторы данных могут использовать бизнес-метаданные для создания или обновления существующей модели глоссария или логической модели.
| Описание | Имя | Размер | Метод загрузки |
|---|---|---|---|
| Пример файла импорта для данной статьи | Corp_Terms.zip | 15 КБ | HTTP |
- Оригинал статьи Understanding leads to trust: Sharing a common vocabulary across InfoSphere Foundation Tools (EN).
- Дополнительная информация об IBM InfoSphere Data Architect (EN).
- В статье Миграция моделей ERwin Data в Rational Data Architect (developerWorks, сентябрь 2007 г.) рассматривается процесс миграции существующих моделей данных, созданных в CA ERwin Data Modeler, в RDA. Исследуйте функциональные возможности RDA, повседневно используемые архитекторами данных и специалистами по моделированию данных (EN).
- В статье Использование Rational Data Architect для определения и принудительного выполнения стандартов именования объектов данных (developerWorks, январь 2007 г.) исследуются функциональные возможности Rational Data Architect, позволяющие определить и реализовать стандарты именования объектов, рассматриваются примеры из реальной жизни (EN).
- В статье Использование Using Rational Data Architect для импорта и экспорта XML (developerWorks, ноябрь 2006 г.) в пошаговом режиме описывается, как создать XML-файлы из Rational Data Architect и модели данных из XML-файлов (EN).
Денис Васконселос (Denis Vasconcelos) специалист по работе с данными в службе IBM Global Business Services в Бразилии. Он является одним из авторов книги "Хранилище сервисов Tivoli Management и создание отчетов" и статьи "IBM Information Analyzer и оценка качества данных" в справочнике Redbook. Денис - квалифицированный специалист в области администрирования баз данных, моделирования данных, миграции разнородных баз данных и управления проектами. Он имеет степень бакалавра наук в области вычислительной техники, и, кроме того, закончил аспирантуру по специальности "Управление проектами".