跳转到主要内容

单击提交则表示您同意developerWorks 的条款和条件。 查看条款和条件.

这是您第一次登陆到 developerWorks,已经自动为您创建了您的概要文件。 选择您概要文件中可以公开的信息的信息(如姓名、国家/地区,以及公司),这些信息同时也会与您所发布的内容相关联。 您可以随时更新您的 IBM 账号。

所有提交的信息确保安全。

  • 关闭 [x]

当您初次登录到 developerWorks 时,将会为您创建一份概要信息,您需要指定一个昵称。您的昵称将和您在 developerWorks 发布的内容显示在一起。

昵称长度在 3 至 31 个字符之间。 您的昵称在 developerWorks 社区中必须是唯一的,并且出于隐私保护的原因,不能是您的电子邮件地址。

单击提交则表示您同意developerWorks 的条款和条件。 查看条款和条件.

所有提交的信息确保安全。

  • 关闭 [x]

利用 CSV 和 XML 导入方法来填充、更新与加强 InfoSphere Business Glossary 内容

Shlomit Becker, 质量保障工程师, IBM
Shlomit Becker 照片
Shlomit Becker 是设在 IBM Israel Software Lab 的 IBM InfoSphere Business Glossary 团队的一名 QA 工程师。Shlomit 于 2006 年作为 Unicorn Solutions 收购项目的一部分加入 IBM。她开发了针对 Business Glossary 导入导出特性的自动测试套件。
Yair Rinot, 软件开发人员, IBM
Yair Rinot 照片
Yair Rinot 是设在 IBM Israel Software Lab 的 IBM InfoSphere Business Glossary 团队的一名软件开发人员。Yair 拥有 Hebrew University of Jerusalem 的计算机科学学士学位。他开发了 Business Glossary CSV 与 XML 导入导出特性。

简介:  IBM InfoSphere™ Business Glossary 用于创建、管理以及共享企业词汇和分类系统。在版本 8.1.1 中,InfoSphere Business Glossary 引入了一些新的 CSV 和 XML 导入导出方法,来向业务术语库中填入数据。本教程提供了技术指导、技巧及示例,来帮助实现这些特性,从而高效地创建业务术语库。

发布日期:  2011 年 1 月 06 日
级别: 中级

访问情况 : 8053 次浏览

简介

InfoSphere Business Glossary(Business Glossary)实现了利用可控的术语库来创建、管理、以及共享业务与组织观念的标准定义。Business Glossary 产品采用了类别层次结构,来对包含的术语进行分类。可依据组织的需要,来利用术语对元数据库进行分类。

想使用业务术语库,首先要对其进行数据填充。在版本 8.1.1 中,Business Glossary 引入了一些新的、采用 CSV 与 XML 格式的导入导出方法,这样,术语库管理员就能够从这些类别的文件中进行术语库内容的导入导出。这些方法采用更加灵活的方式来创建术语库内容,使得用户能够更方便、更全面地填充其业务术语库。

本教程描述并解释了如何使用这些新的导入导出特性。教程包括了最佳实践、技巧、以及例子,帮助您高效地实现这些特性,来填充业务术语库。

本教程中的例子采用了来自 IBM Industry Models Telecom Business Glossary Content Pack 的数据。为包括银行、保险、电信、零售、以及医疗等行业提供的 InfoSphere Business Glossary 内容包。

选择导入方法

CSV 和 XML 是通用的导入方法。填充业务术语库的方法的选择,要根据几个因素,包括现有的术语库内容以及业务术语库管理人员的业务水平。

CSV
CSV 格式很简单。它具有利用其数据值来包含分类和术语的功能,比如描述、缩写和自定义属性值。它还用于定义管理员关系。
XML
XML 格式全面而复杂。它能够定义术语之间、类别之间、以及其他对象类型之间的每个可能的关系,包括,术语与其他术语的关系、指向术语的类型、连接到所分配资产的术语。

您可能已经拥有了某种格式的术语库,并希望利用这些内容来开始填充新的业务术语库。或者您可能希望从头开始构建一个业务术语表。因为这些场景的起点不同,所推荐的导入方法也会有所差别。

如果数据存储在电子表格中,可能需要将现有的电子表格转换成 Business Glossary CSV 格式。如果是从头开始,就可以基于所要导入的数据以及技术水平,来选择导入方法。

表 1 和表 2 描述了可以包含在 CSV 和 XML 文件中的值。


表 1. CSV 和 XML 文件中的类别值
类别属性CSV 文件XML 文件
名称如果仅为新的类别而增加,是;现有术语和类别的名称无法改变。
长描述
短描述
子类
父类如果仅为新的类别而增加,是;现有术语和类别的父类无法改变。
引用的术语
包含的术语
定制的属性
定制的属性值如果在目标元数据库中已经存在定制的属性,是。如果定制的属性不存在,导入失败。
连接到管理员如果该管理员已存在于目标元数据库中,是。如果管理员不存在,导入失败。如果用户或者用户组已存在于目标元数据库中,是。如果用户或者用户组不存在,就无法创建管理员关系,但其他内容会成功导入。

表 2. CSV 和 XML 文件中术语的值
术语属性CSV 文件XML 文件
名称如果只为新的术语而增加,是;现有术语或者类别的名称无法改变。
长描述
短描述
缩写
用法
示例
状态
相关术语
Attribute IsModifier
属性类型
同义词
含(父)类如果仅为新的术语而增加,是;现有术语或者类别的父类无法改变。
定制属性
定制属性值如果定制属性已经存在于目标元数据库,是。如果定制属性不存在,导入失败。
连接到管理员如果管理员已存在于目标元数据库中,是。如果管理员不存在,导入失败。如果用户或者用户组已存在于目标元数据库中,是。如果用户或者用户组不存在,无法创建管理员关系,但其他内容将成功导入。
链接到分配的资产(比如列、管理员、表)如果资产已存在于目标元数据库中,是。如果资产不存在,无法创建关系,但是其他内容将会成功导入。
引用分配的外部资产(比如业务流程模式或者 web 服务)

注意: 如果要从 8.1.1 以前版本的业务术语库将内容导入新的业务术语库实例,唯一有效的方法就是 Glossary Archive 导入与导出(格式为 XMI),该方法允许在不改变其内容的情况下,在术语库实例之间传输全部或者部分术语库数据。Business Glossary Version 8.1 中,如果想要仅传输类别以及具有基本属性的术语,也需要采用 CSV 导入与导出。

1 页,共 7 | 后一页

static.content.url=http://www.ibm.com/developerworks/js/artrating/
SITE_ID=10
Zone=Information Management, XML
ArticleID=606669
TutorialTitle=利用 CSV 和 XML 导入方法来填充、更新与加强 InfoSphere Business Glossary 内容
publish-date=01062011
author1-email=shlomitb@il.ibm.com
author1-email-cc=
author2-email=yairr@il.ibm.com
author2-email-cc=