|  | 级别: 初级 Sebastian Nelke , OmniFind 和 UIMA 开发人员, IBM
2008 年 7 月 30 日 IBM® OmniFind™ Enterprise Edition 提供了许多特性和功能,可以使用它们构建基于 IBM 企业搜索功能的强大、高价值的应用程序和解决方案。本系列的 第 1 部分 详细描述如何存储选择的文本分析结果以及它们在关系数据库中的关系。第 2 部分着重介绍如何将结构化数据库查询的结果与语义搜索的强大功能相结合。
目标 - 如何将 OmniFind
Search and Index API(SIAPI)提供的搜索结果与结构化数据库查询的结果结合起来。
- 通过将语义搜索与 SQL 查询相结合,可以构建一个功能强大的应用程序,从而将结构化信息与非结构化信息衔接起来。
预备知识
本教程的目标读者是希望基于 IBM OmniFind Enterprise Edition V8.4 构建定制解决方案的开发人员。要想理解本教程并获得最大的收益,您应该已经熟悉以下主题:
-
非结构化信息管理架构(Unstructured Information Management Architecture,UIMA):
您需要具备基本 UIMA 技能。您应该了解 UIMA 类型系统:
- 什么是 UIMA 类型系统?
- 它是什么样子的?
- 什么情况下需要它?
就本教程而言,您不需要了解 UIMA 标注器的内部工作原理,但是如果您大致了解标注器的工作方式以及它们的用途,那么会更容易理解本教程。
如果您已经基本了解了标注器,那么在学完本教程之后,可以看看本教程附带的示例标注器的源代码。
-
DB2®:
同样,只需要基本技能。您应该能够安装 DB2,并且知道如何创建数据库和一些示例表。运行本教程所需的数据库和所有的表将通过一个脚本来创建。
-
OmniFind:
只需基本技能。在本教程中,将使用 OmniFind 管理 GUI 创建 OmniFind 集合,并上传定制的标注器和文本分析结果的数据库映射文件。对于以上每个任务,本教程都会作详细的解释,并借助屏幕快照逐步加以描述。但是,您应该对
OmniFind 的工作原理和用法有基本的理解。同时强烈建议阅读 OmniFind 安装文档中附带的 Text Analysis Integration 一书。
-
Linux® 和 Windows®:
本教程是同时针对 Linux 和 Windows 平台编写的,您应该具备复制文件、创建目录、运行脚本以及更改文件和目录权限等方面的基本技能。在本教程的某些部分,您必须编辑下载小节中的文件。在将 XML 文件上传到 OmniFind 系统之前,建议使用一个 XML 编辑器处理和验证它们。OmniFind 系统将拒绝无效的 XML 文件,并返回错误消息,但是在一个良好的 XML 编辑器中查看这些错误会更容易一些(例如,XML 编辑器可以高亮显示受影响的 XML 元素)。
系统需求
要运行本教程,需要安装和运行 IBM OmniFind Enterprise Edition V8.4。一定要安装最新的补丁包。另外,还需要安装 DB2 Version 8.2 或更高版本(从 OmniFind 8.4 开始,可以在同一台计算机上安装)。
不建议在生产环境中运行本教程。本教程下载小节中的示例文档集包含大约 20 个文档,大概占 1MB 的空间。DB2 机器上的示例数据库大约占 20MB 的空间。
学习时间
2 至 3 小时
格式 html, pdf
学习内容
本教程演示如何将 OmniFind
Search and Index API(SIAPI)提供的搜索结果与结构化数据库查询的结果结合起来。通过将语义搜索与 SQL 查询相结合,可以构建一个功能强大的应用程序,从而将结构化信息与非结构化信息衔接起来。
参考资源
IBM 公司保留在 developerWorks 网站上发表的内容的著作权。未经IBM公司或原始作者的书面明确许可,请勿转载。如果您希望转载,请通过 提交转载请求表单 联系我们的编辑团队。 |  | |  |
|