IBM®
跳转到主要内容
    中国 [选择]    使用条款
 
 
Select a scope: Search for:    
    首页    产品    服务与解决方案     支持与下载    个性化服务    
跳转到主要内容

developerWorks 中国  >  Information Management  >

使用 Excel 分析 InfoSphere Warehouse 多维数据

developerWorks
文档选项

未显示需要 JavaScript 的文档选项


级别: 中级

吴敏达, 信息管理软件高级技术顾问, IBM

2009 年 11 月 04 日

IBM InfoSphere Warehouse 9.5.1 开始提供 Cubing Services ODBO 接口 (IBM OLE DB Provider for OLAP),这意味着用户可以使用 Microsoft Excel 就可以直接访问 Cube Server 的多维数据,并通过把 Cube 的数据导入到 Excel 透视表 (Pivot Table)后,可以在 Excel 中进行复杂的多维分析,这无疑是极大方便了使用者。

引言

InfoSphere Warehouse 解决方案是一个完整的、多用途的平台,它允许用户访问、分析和操作任何类型的信息,不管是结构化数据还是非结构化数据、运营数据还是交易数据、实时数据还是历史数据。InfoSphere Warehouse 提供了用于帮助数据仓库架构师与管理员有效地设计和维护企业数据仓库所需的工具和基础设施。此外,它还是一个开放且基于标准的解决方案,包括数据库、管理和交付工具以及嵌入式分析,以帮助用户创建功能强大、灵活和经济高效的数据仓库解决方案。该解决方案允许用户更深入地分析所有业务数据,更深入地挖掘隐含的关系、模式和趋势,并且通过可靠的、实时的深入理解做出迅速响应。

在 InfoSphere Warehouse 中包含 OLAP 的多维立方体服务 Cubing Service,支持多维数据分析,从而允许您将多个业务变量链接到一起,以执行比以前更为深入的分析。从 图 1中可以看到,Cubing Service 支持多种访问接口:

  • MDX 语言,Multidimensional Expressions 简称 MDX,是查询多维立方体的标准语言。InfoSphere Warehouse 企业版自带的报表工具 Aphablox 就是通过 MDX 来访问 Cubing Service。
  • ODBO 接口,OLE DB for OLAP 简称 ODBO,是基于 MDX 的访问接口,用来多维服务器和 Windows 客户端的元数据交换。本文介绍的 Excel 就通过 ODBO 接口来访问 Cubing Service。
  • XMLA 接口,XML for Analysis 简称 XMLA,是和 ODBO 并存的多维数据访问接口。很多报表工具比如 Cognos 就是通过这种接口访问 Cubing Service。

图 1. Cubing Service 架构图
Cubing Service 架构图

本文将介绍利用 ODBO 接口来利用 Excel 查询分析 Cubing Service 中的多维数据,而不涉及立方体建模过程。但实际项目中,我们首先需要根据业务需求在 Cubing Service 中构建并运行多维立方体。整个多维立方体构建过程参见 图 2

  • 使用 Design Studio 来进行立方体模型的设计;
  • 在 Design Studio 中启动 Cubing Services Advisor 来优化立方体,优化主要通过模型、数据分布、维度层次来创建物化查询表 MQT 来优化立方体查询性能;
  • 在 Administration Console 中把立方体发布到 Cube Server 中;
  • 最后在 Cube Server 中启动立方体。

图 2. Cubing Service 中多维立方体的生命周期
Cubing Service 中多维立方体的生命周期

环境准备

根据 InfoSphere Warehouse 的架构,Excel 分析客户端不需要和 Cubing Services Cube Server 安装在一起。客户端在使用 Excel 做分析之前,首先要安装 Excel 2003 或 2007,因为这些版本的 Excel 包含了 Pivot Table 透视表服务。另外还需要事先安装 .Net Framework 2.0或者 .Net Framework 3.0,这是 ODBO 客户端的安装要求。

ODBO 客户端的安装可以通过 InfoSphere Warehouse 客户端的安装软件来进行安装 Cubing Services Client。如果这个客户端只需要用 Excel 来做分析,那只需要在 图 3中单选 Cubing Services Client。安装程序会检查 .NET 相应版本是否已经安装,如果没有则会报错。


图 3. Cubing Service 客户端的安装
Cubing Service 客户端的安装

另外,还可以通过一个不到 400K 轻量级的 Cubing Services ODBO 客户端安装程序 odboinstaller.exe来安装 ODBO 客户端。这是一个自解压的执行程序,解压到自定义目录后执行 ODBOINSTALLER.bat 就可以轻松完成 Cubing Services ODBO 的客户端安装。在本文的下载部分可以得到这个轻量级的客户端安装程序,更加容易简单地安装 ODBO 客户端。

连接 Cube Server

下面以 Excel 2003 为例来看如何来连接 Cube Server。

  • 启动 Excel 2003。
  • 在数据菜单项中选择导入外部数据,然后选择导入数据。

    图 4. 导入外部数据
    导入外部数据

  • 在选取数据源对话框中选取“连接到新数据源 .odc”,或者直接点击新建源。在这个对话框中可以看到以前连接并保存的数据源,连接过 Cube Server 后可以保存下来,如(默认) SalesCube.odc 就是以前保存的 Cube Server 数据源。

    图 5. 选取数据源
    选取数据源

  • 在新数据源的连接向导中选择“其他 / 高级”。

    图 6. 数据连接向导
    数据连接向导

  • 然后会看到 IBM OLE DB Provider for OLAP,这说明已经正确安装了 Cubing Services 客户端,单击选择它。

    图 7. 选择 IBM ODBO
    选择 IBM ODBO

  • 很重要的就是要准确输入 ODBO 的连接属性,包括 InfoSphere Warehouse 的 Cube Server 的主机名和端口号,中间用冒号隔开;以及用户名和密码。为了验证连接属性的正确性,可以点击测试数据源连接,根据弹出对话框的内容可以知道是否成功连接。

    图 8. ODBO 的连接属性
    ODBO 的连接属性

    本质上 Cube Server 的配置决定了 ODBO 的连接属性,图 9是从 InfoSphere Warehouse 的管理控制台中看到 Cube Server 的定义。

    图 9. Cube Server 的属性
    Cube Server 的属性

  • 连接上 Cube Server 之后,就能看到活动的多维数据集,也就是常说的 Cube。在 图 10中看到的是有两个正在运行的多维数据集,可以根据需求选择需要连接的 Cube,然后点击下一步。

    图 10. 选择多维数据集
    选择多维数据集

  • 为了方便以后使用多维数据集,可以选择把这个数据源保存下来,如 SalesCube.odc,这样就可以在 图 5中打开已经保存的 SalesCube.odc 数据源了。此外,保存数据源的时候可以选择是否保存密码。

    图 11. 保存数据连接
    保存数据连接

分析多维数据

用 Excel 成功连接 Cube Server 后连接后,就需要利用 Excel 来分析多维数据来解决业务问题了。Excel 2003 或 2007 访问 Cube Server 是通过用户在透视表中的简单拖拽维度和度量来实现 MDX 查询。用户不需要关心 MDX 查询语句,只需要关注业务问题,这就是 Excel 分析 InfoSphere Warehouse 多维数据的优势。

  • 在创建好多维数据源后,就可以选取需要的多维数据源并打开。

    图 12. 选取数据源
    选取数据源

  • 可以选择新的工作表或者已有的工作表,然后点击完成关闭透视表和透视图的向导。

    图 13. 透视表向导
    透视表向导

  • 构建根据业务需求的透视表,只需要把从 InfoSphere Warehouse 多维立方体的维度和度量自由拖拽到行、列、页或者数据项的区域。

    图 14. 数据透视表字段列表显示 Cube 元数据
    数据透视表字段列表显示 Cube 元数据

  • 例如想了解各门店不同产品在相应时间段的销售额,就可以通过下面的步骤轻松获得多维报表。
    • Sales 销售额作为数据项
    • Store 门店作为行字段
    • Product 产品作为列字段
    • Time 时间作为页字段


    图 15. Excel 透视表访问多维数据示例
    Excel 透视表访问多维数据示例

  • 如果需要执行钻入操作,只需要双击维度字段,比如双击门店 Store 的 East 和产品 Product 的 Chocolate Mix 就可以更细层次的数据。

    图 16. 维度钻入
    维度钻入

  • 另外可以方便的选择维度数据,比如选择时间 Time 的不同层次和内容。

    图 17. 维度选择
    维度选择

  • 图 13中选择布局可以重新调整多维报表,把右边的多维立方体字段自由拖拽就可以得到全新的多维报表。

    图 18. 透视表布局
    透视表布局

  • 如果需要更直观的多维透视图,可以通过透视表上方的透视图向导更直观的展现多维数据。

    图 19. 透视图
    透视图

总结

Excel 的电子表格提供了直观和强大的展现和操纵业务数据的前端,但是 Excel 却很难和后台关系型数据库(如 DB2)做无缝整合。因此很多企业客户很难在数据仓库项目中使用 Excel,或者需要编写大量的宏,使得难以维护和使用。 IBM InfoSphere Warehouse 从 9.5.1 版本开始提供了 Cubing Services ODBO provider,即 IBM OLE DB Provider for OLAP,让业务人员用 Excel 来和 Cube Server 进行交互。从而可以把多维数据集导入透视表中进行复杂的多维分析。 本文用 Excel 2003 为例介绍了用 Excel 连接 Cube Server,创建多维报表进行业务分析的方法。






回页首


下载

描述名字大小下载方法
轻量级的 Cubing Services ODBO 客户端安装程序odboinstaller.zip400KBHTTP
关于下载方法的信息


参考资料

学习

获得产品和技术

讨论


关于作者

吴敏达的照片

吴敏达现在是 IBM 中国软件部 DB2 pureXML 卓越中心成员,专长是 pureXML、数据仓库相关技术。此前他曾经在 Sybase 中国工作过多年,具有丰富的信息管理软件经验,是经过认证的 DB2 数据库、DB2 数据仓库、WebSphere 应用服务器、WebSphere DataStage 企业版、Sybase ASE 数据库和 Sybase IQ 数据仓库的解决方案专家。




对本文的评价










回页首


IBM 公司保留在 developerWorks 网站上发表的内容的著作权。未经IBM公司或原始作者的书面明确许可,请勿转载。如果您希望转载,请通过 提交转载请求表单 联系我们的编辑团队。
    关于 IBM 隐私条约 联系 IBM 使用条款