级别: 中级 吴敏达, 信息管理软件高级技术顾问, IBM
2009 年 11 月 04 日 IBM InfoSphere Warehouse 9.5.1 开始提供 Cubing Services ODBO 接口 (IBM OLE DB Provider for OLAP),这意味着用户可以使用 Microsoft Excel 就可以直接访问 Cube Server 的多维数据,并通过把 Cube 的数据导入到 Excel 透视表 (Pivot Table)后,可以在 Excel 中进行复杂的多维分析,这无疑是极大方便了使用者。
引言
InfoSphere Warehouse 解决方案是一个完整的、多用途的平台,它允许用户访问、分析和操作任何类型的信息,不管是结构化数据还是非结构化数据、运营数据还是交易数据、实时数据还是历史数据。InfoSphere Warehouse 提供了用于帮助数据仓库架构师与管理员有效地设计和维护企业数据仓库所需的工具和基础设施。此外,它还是一个开放且基于标准的解决方案,包括数据库、管理和交付工具以及嵌入式分析,以帮助用户创建功能强大、灵活和经济高效的数据仓库解决方案。该解决方案允许用户更深入地分析所有业务数据,更深入地挖掘隐含的关系、模式和趋势,并且通过可靠的、实时的深入理解做出迅速响应。
在 InfoSphere Warehouse 中包含 OLAP 的多维立方体服务 Cubing Service,支持多维数据分析,从而允许您将多个业务变量链接到一起,以执行比以前更为深入的分析。从 图 1中可以看到,Cubing Service 支持多种访问接口:
- MDX 语言,Multidimensional Expressions 简称 MDX,是查询多维立方体的标准语言。InfoSphere Warehouse 企业版自带的报表工具 Aphablox 就是通过 MDX 来访问 Cubing Service。
- ODBO 接口,OLE DB for OLAP 简称 ODBO,是基于 MDX 的访问接口,用来多维服务器和 Windows 客户端的元数据交换。本文介绍的 Excel 就通过 ODBO 接口来访问 Cubing Service。
- XMLA 接口,XML for Analysis 简称 XMLA,是和 ODBO 并存的多维数据访问接口。很多报表工具比如 Cognos 就是通过这种接口访问 Cubing Service。
图 1. Cubing Service 架构图
本文将介绍利用 ODBO 接口来利用 Excel 查询分析 Cubing Service 中的多维数据,而不涉及立方体建模过程。但实际项目中,我们首先需要根据业务需求在 Cubing Service 中构建并运行多维立方体。整个多维立方体构建过程参见 图 2:
- 使用 Design Studio 来进行立方体模型的设计;
- 在 Design Studio 中启动 Cubing Services Advisor 来优化立方体,优化主要通过模型、数据分布、维度层次来创建物化查询表 MQT 来优化立方体查询性能;
- 在 Administration Console 中把立方体发布到 Cube Server 中;
- 最后在 Cube Server 中启动立方体。
图 2. Cubing Service 中多维立方体的生命周期
环境准备
根据 InfoSphere Warehouse 的架构,Excel 分析客户端不需要和 Cubing Services Cube Server 安装在一起。客户端在使用 Excel 做分析之前,首先要安装 Excel 2003 或 2007,因为这些版本的 Excel 包含了 Pivot Table 透视表服务。另外还需要事先安装 .Net Framework 2.0或者 .Net Framework 3.0,这是 ODBO 客户端的安装要求。
ODBO 客户端的安装可以通过 InfoSphere Warehouse 客户端的安装软件来进行安装 Cubing Services Client。如果这个客户端只需要用 Excel 来做分析,那只需要在 图 3中单选 Cubing Services Client。安装程序会检查 .NET 相应版本是否已经安装,如果没有则会报错。
图 3. Cubing Service 客户端的安装
另外,还可以通过一个不到 400K 轻量级的 Cubing Services ODBO 客户端安装程序 odboinstaller.exe来安装 ODBO 客户端。这是一个自解压的执行程序,解压到自定义目录后执行 ODBOINSTALLER.bat 就可以轻松完成 Cubing Services ODBO 的客户端安装。在本文的下载部分可以得到这个轻量级的客户端安装程序,更加容易简单地安装 ODBO 客户端。
连接 Cube Server
下面以 Excel 2003 为例来看如何来连接 Cube Server。
- 启动 Excel 2003。
- 在数据菜单项中选择导入外部数据,然后选择导入数据。
图 4. 导入外部数据
- 在选取数据源对话框中选取“连接到新数据源 .odc”,或者直接点击新建源。在这个对话框中可以看到以前连接并保存的数据源,连接过 Cube Server 后可以保存下来,如(默认) SalesCube.odc 就是以前保存的 Cube Server 数据源。
图 5. 选取数据源
- 在新数据源的连接向导中选择“其他 / 高级”。
图 6. 数据连接向导
- 然后会看到 IBM OLE DB Provider for OLAP,这说明已经正确安装了 Cubing Services 客户端,单击选择它。
图 7. 选择 IBM ODBO
- 很重要的就是要准确输入 ODBO 的连接属性,包括 InfoSphere Warehouse 的 Cube Server 的主机名和端口号,中间用冒号隔开;以及用户名和密码。为了验证连接属性的正确性,可以点击测试数据源连接,根据弹出对话框的内容可以知道是否成功连接。
图 8. ODBO 的连接属性
本质上 Cube Server 的配置决定了 ODBO 的连接属性,图 9是从 InfoSphere Warehouse 的管理控制台中看到 Cube Server 的定义。
图 9. Cube Server 的属性
- 连接上 Cube Server 之后,就能看到活动的多维数据集,也就是常说的 Cube。在 图 10中看到的是有两个正在运行的多维数据集,可以根据需求选择需要连接的 Cube,然后点击下一步。
图 10. 选择多维数据集
-
为了方便以后使用多维数据集,可以选择把这个数据源保存下来,如 SalesCube.odc,这样就可以在 图 5中打开已经保存的 SalesCube.odc 数据源了。此外,保存数据源的时候可以选择是否保存密码。
图 11. 保存数据连接
分析多维数据
用 Excel 成功连接 Cube Server 后连接后,就需要利用 Excel 来分析多维数据来解决业务问题了。Excel 2003 或 2007 访问 Cube Server 是通过用户在透视表中的简单拖拽维度和度量来实现 MDX 查询。用户不需要关心 MDX 查询语句,只需要关注业务问题,这就是 Excel 分析 InfoSphere Warehouse 多维数据的优势。
总结
Excel 的电子表格提供了直观和强大的展现和操纵业务数据的前端,但是 Excel 却很难和后台关系型数据库(如 DB2)做无缝整合。因此很多企业客户很难在数据仓库项目中使用 Excel,或者需要编写大量的宏,使得难以维护和使用。
IBM InfoSphere Warehouse 从 9.5.1 版本开始提供了 Cubing Services ODBO provider,即 IBM OLE DB Provider for OLAP,让业务人员用 Excel 来和 Cube Server 进行交互。从而可以把多维数据集导入透视表中进行复杂的多维分析。
本文用 Excel 2003 为例介绍了用 Excel 连接 Cube Server,创建多维报表进行业务分析的方法。
下载 | 描述 | 名字 | 大小 | 下载方法 |
|---|
| 轻量级的 Cubing Services ODBO 客户端安装程序 | odboinstaller.zip | 400KB | HTTP |
|---|
参考资料 学习
获得产品和技术
讨论
关于作者  | 
|  | 吴敏达现在是 IBM 中国软件部 DB2 pureXML 卓越中心成员,专长是 pureXML、数据仓库相关技术。此前他曾经在 Sybase 中国工作过多年,具有丰富的信息管理软件经验,是经过认证的 DB2 数据库、DB2 数据仓库、WebSphere 应用服务器、WebSphere DataStage 企业版、Sybase ASE 数据库和 Sybase IQ 数据仓库的解决方案专家。 |
对本文的评价
|