IBM®
跳转到主要内容
    中国 [选择]    使用条款
 
 
Select a scope:Search for:    
    首页    产品    服务与解决方案     支持与下载    个性化服务    
跳转到主要内容

developerWorks 中国  >  Information Management | Open source  >

新时代的曙光

IBM 的伟大梦想

developerWorks
文档选项

未显示需要 JavaScript 的文档选项


Cynthia Harvey (ckharvey@velocitus.net), 自由撰稿人

2008 年 4 月 17 日

在从创建到销毁的整个数据生命周期中,数据会在不同的部门之间移动。在每个阶段,会遇到不同的工具集,由 IT 部门的不同部分来处理,会遇到集成问题,可能还会应用不一致的策略。但是,数据管理的新时代就要到来了。
来自 IBM Database Magazine

为企业数据管理创建一个单一工具集,它能够管理数据生命周期的每个方面。这个工具集符合法律法规的要求,能够与其他 IBM 工具轻松地集成。另外,它能够适应 IBM 数据服务器(包括 DB2 和 Informix Dynamic Server)以及 Oracle、Microsoft、Sybase 和其他主流厂商提供的数据管理技术。


IBM Data Studio 客户的反馈


据 Anjul Bhambhri(IBM 的数据服务器工具和合作伙伴推广主管)所说,客户对 Data Studio 的三个方面表现出了最浓厚的兴趣:它的端到端性质,pureQuery,以及为 SQL、XML 和 Java 提供的集成应用程序开发环境。



Jean-Marc Blaise,IDB Consulting:
IDB Consulting 的 Jean-Marc Blaise 也参与了 beta 测试。他告诉 IBM Database Magazine,他已经开始在客户站点上使用 Data Studio。Blaise 对应用程序开发环境中的通用调试器尤其印象深刻。Blaise 解释道,“以前,如果要对过程进行调试,会非常费时间。但是,通过使用 Data Studio 中的通用调试器和检查工具,可以快速找到错误的 SQL 语句。这会使调试速度提高 40%。”

David Beulke,Pragmatic Solutions Inc.
IBM Gold Consultant(还是本杂志的撰稿人)
Pragmatic Solutions 的 Dave Beulke 强调了 pureQuery 的重要性。他参与了 Data Studio 的 beta 测试,而且已经开始让他的一些客户测试这个产品。

在与 IBM Database Magazine 的会谈中,Beulke 高度赞扬了 pureQuery 使用静态 SQL 的能力,认为这会改进性能和可审计性。“能够通过 pureQuery 使用静态 SQL,这太棒了,”Beulke 说。“最近,我的一位客户通过采用这个特性,把 CPU 使用率降低了 7%。”

在 2007 年 10 月,IBM 向实现这个梦想迈出了重要的一步:它在 Las Vegas 的 IBM Information On Demand 会议上发布了 IBM Data Studio 1.1。这个软件的免费下载版支持 DB2 和 Informix Dynamic Server,包含实体关系图、SQL 构建器、XML 编辑器、pureQuery for Java、安全访问工具、数据管理工具和其他特性。但是,这仅仅是第一步。IBM 计划扩展 Data Studio 系列产品,包含在数据生命周期的每个阶段需要的所有工具。

当然,目前存在单独针对各个领域的工具。既然组织已经可以选用不同厂商提供的数据管理工具,那么为什么还会对新的工具集感兴趣?参与数据生命周期(从设计到开发、部署、管理,直至治理)的各类人员对于把他们习惯的工具替换为新工具集会有什么反应?

Curt Cotner(IBM 副总裁和 IBM Data Servers 的首席技术官)承认存在这些难题,但是他认为把 IBM Data Studio 的各个组件集成在一起会非常有好处:“我们的目标是通过一套组件完成所有工作。”因为所有组件在幕后都是相关的,因此不再需要对不同厂商提供的工具进行集成,从而改进协作并减少成本。

最重要的是,数据治理和合法性会得到简化和改进。为什么呢?因为集成的组件使我们能够只设置一次规则(例如,在设计阶段设置),就让数据在整个生命周期中都符合规则。不管在任何时候由哪个团队负责数据,都可以确保应用一致的规则。

定义的数据生命周期

为了理解完整工具集的好处,我们需要把数据生命周期作为一个整体研究一下。按照 IBM 的观点,数据在其生命周期中会经历五个阶段:设计、开发、部署、管理和治理(见图 1)。

在设计阶段,业务分析师和数据库架构师创建数据模型,以后将使用这些数据模型开发满足组织需要的应用程序和数据库。针对这个阶段的 IBM Data Studio 工具当前包括逻辑建模和实体关系图,以后会增加物理建模功能。

后两个阶段(开发和部署)是紧密相连的,与这两个阶段相关联的任务常常由开发人员执行。按照 IBM 的框架,开发阶段特指应用程序开发,常常涉及 Java、.Net、PHP、Ruby 或 COBOL 编程。部署阶段涉及数据库部署,常常采用 SQL 或其他查询语言。

管理阶段包含通常由 DBA 执行的任务。这些任务包括日常管理、配置、性能调优、更改管理、备份和恢复等等。

如果所有人都说相同的语言,使用相同的工具,协作会容易得多。

在最后一个阶段(治理),安全管理员负责管理组织的数据资源的安全性,确保组织遵守所有相关法律的要求。这个领域还包括审计、加密、存档,最后在数据生命周期结束时销毁数据。

Cotner 指出这是一个迭代式的周期,而不是一次性的过程:“通常,在经历这个生命周期时,会发现需要做一些修改。所以需要再次经历这个生命周期,做出修改。这是一个反复改进的循环过程。”





回页首


Data Studio 和协作

据 Cotner 所说,与现在的情况相比,应用程序专家和数据库专家以前的协作要紧密得多:“如果时间倒退 15 年,DBA 通常非常了解 COBOL 编程语言,足以给应用程序开发人员当顾问。他们帮助开发人员以高效的方式设计应用程序和编写 SQL,并为获得最好的吞吐量提供建议。”

IBM 认为数据生命周期分为五个阶段:设计、开发、部署、管理和治理。

在这个过程中,数据会交由许多不同的团队成员处理。


图 1:数据生命周期
数据生命周期

与之相反,当今的大多数应用程序开发工作采用 Java,常常使用 Hibernate 和 OpenJPA 等非常复杂的框架。大多数数据库开发人员和 DBA 不熟悉这些工具,因此他们无法为优化数据库提供建议。

“这实际上是一个文化问题,”Cotner 说。“这些 Java 框架对数据库概念做了充分的抽象,所以当 DBA 与开发人员交谈时,他们实际上说的不是同一种语言。当 DBA 看到开发人员编写的代码时,无法看出这些指令序列会对数据库产生什么效果。”

Data Studio 克服这个文化壁垒的方法是提供一个新的数据访问解决方案 —— pureQuery,应用程序开发人员和数据库专家都很容易理解 pureQuery。为了帮助应用程序开发人员,pureQuery 会在 Java 编辑器中自动创建所需的所有 SQL 语句,因此开发人员不必成为 SQL 专家。另外,pureQuery 会突出显示 Java 代码中的 SQL 命令,让数据库专家能够轻松地判断代码对数据库的影响。更重要的是,pureQuery 是标准 Eclipse Java 编辑器的扩展,所以熟悉这种编辑器的任何人都可以非常轻松地掌握 pureQuery。(关于 pureQuery 的更多信息,请参考 DB2 Magazine 2007 年第三期上的“The Easy Way to Quick Data Access”。)

由于采用了一种通用语言,Data Studio 为在整个数据生命周期中使用的工具提供统一的外观和感觉。由于所有人都说相同的语言,都可以轻松地学会使用相同的工具,因此协作会容易得多。

另外,这便于改变 IT 人员的工作岗位,使 CIO 能够更灵活地安排人员。





回页首


保证合法性的关键

与过去任何时候相比,组织现在必须满足更多法律法规的要求。HIPAA、Sarbanes-Oxley、GLBA、PCI 标准、各州和地方的法规以及国际法规,这些法规都对企业数据管理提出了要求,因此在整个生命周期中确保合法性是一个难题。

Cotner 以 PCI 标准为例解释了这个问题。任何处理 Visa 或

MasterCard 交易的组织都必须遵守这个标准。PCI 要求对信用卡号和 PIN 进行加密,而且只允许那些需要查看这些号码的人拥有这一权力。另外,如果用信用卡信息执行测试,那么必须对信息进行匿名化处理。当 DBA 执行备份和恢复操作时,以及在开发人员把记录从生产环境复制到测试环境时,很难确保遵守所有规则,尤其是在使用不同厂商提供的不同工具的情况下。





回页首


IBM Data Studio 产品系列

IBM Data Studio 产品系列包含一个免费下载包,以及付费版本中的额外特性和支持

目前的 IBM Data Studio


IBM Data Studio 会在六个方面节省时间
1. 新的 pureQuery 语言可以使编程时间最多减少 50%。
2. 基于 Web 的监视工具使 DBA 能够在任何地点任何时间监视数据库。
3. 集成的行业相关 XML 标准可以简化开发。
4. 通过拖放操作创建 Web 服务,可以快速开发 SOA 和 Web 2.0 项目。
5. 对静态 SQL 的支持可以提供更快的数据库访问,简化寻找和解决 bug 的过程,提高可审计性。
6. 基于 Eclipse 的环境使用户能够更快地进行开发。

可以免费下载 IBM Data Studio。下载文件包含:

  • Entity Relationship(ER)Diagramming
  • Data Distribution Viewer
  • Integrated Query Editor
  • SQL Builder
  • SQL Routine Debugger
  • Java Routine Debugger
  • XML Editor
  • XML Schema Editor
  • Data Web Services
  • Object Management
  • Data Management
  • Update Statistics
  • Visual Explain
  • Security Access Control
  • Project Management
  • pureQuery for Java(不包含静态 SQL 特性)

IBM Data Studio Developer

要想使用高级 pureQuery 特性并获得 IBM 对 pureQuery 的支持,需要购买 IBM Data Studio Developer 和 IBM Data Studio pureQuery Runtime。IBM Data Studio Developer 是一个具有完全支持的产品,它扩展了 Data Studio 的功能,能够用来开发和测试 pureQuery 应用程序。如果准备部署 pureQuery 应用程序,就需要使用 IBM Data Studio pureQuery Runtime 扩展 Java 应用服务器的功能。

IBM Data Studio Developer 包含:

  • 免费的 IBM Data Studio 提供的所有功能
  • 用于 pureQuery 的静态 SQL 支持;但是,不包含部署带静态 SQL 的 pureQuery 所需的运行时
  • pureQuery 工具,包括绑定静态 SQL 的功能

如果要部署使用静态 SQL 的 pureQuery 应用程序,就需要 IBM Data Studio pureQuery Runtime,其中包含完全许可的 pureQuery 运行时和 IBM 提供的支持。





回页首


未来的 Data Studio

在新的一年中,将在 IBM Data Studio 管理的各个生命周期阶段中集成更多的组件。一些组件可以免费下载,其他组件需要付费。下面给出最近可能添加的特性:

  • Rational Data Architect 将成为完全集成的 Data Studio 建模组件,它仍然是付费特性。
  • Data Studio Administration Console 提供监视功能,这是一个免费组件,目前可以通过技术预览获得它。
  • 在 2008 年,可能添加用于性能管理、更改管理、查询调优、使用 pureQuery 判断问题的付费特性,以及一个测试数据生成器。

文本框: 所有 CIO 都一直处于必须减少 IT 成本的压力之下。Data Studio 可以显著减少与数据生命周期的每个阶段相关联的工作量,从而帮助解决这个难题。

Data Studio 的所有组件会协同工作。当安全管理员建立策略时,所有组件都会实施这些规则。Cotner 解释道,“当您配置系统的软件时,它会了解到哪些列包含信用卡号,哪些列包含社会保险号,哪些列包含不应该用于推销的电话号码。由于它了解这些信息,在数据生命周期的后续阶段就不必重新配置和重新建立治理策略,因此更容易管理这些阶段。

Data Studio 的 pureQuery 还可以帮助组织提高合法性。当今的许多产品使用大量动态 SQL,但是几乎不可能对动态 SQL 进行审计。与之相反,pureQuery 高度依赖于静态 SQL,这会固定访问路径并把每个 SQL 语句与特定的业务应用程序清晰地关联起来,使审计人员能够准确地判断发生了哪些操作及其原因。





回页首


降低人员成本

所有 CIO 都一直处于必须减少 IT 成本的压力之下。Data Studio 可以显著减少与数据生命周期的每个阶段相关联的工作量,从而帮助解决这个难题。

Cotner 引述行业分析师的话说,大多数组织把 IT 预算的 70% 花费在人员成本上,只有 30% 花在硬件和软件上。“如果要把不同厂商提供的硬件和软件解决方案集成在一起,就需要进行非常多的人工工作。”Cotner 说,“如果能够显著减少人工工作(我们的目标是把这些活动减少 50%),就会帮助客户节省大量成本。”

公司应该如何减少这些人工活动呢?Cotner 认为,主要的方法是让人员从事更有价值的项目。“如果能够减少与这些活动相关联的人工工作,IT 组织就可以把节省下来的人力资源用在对业务有帮助的新项目上,而不是通过单调乏味工作配置所有工具并让它们相互通信。”





回页首


未来的发展

尽管 Data Studio 已经提供了许多重要的优势,但是它仍然处于发展阶段。“我们还没有实现最终目标,”Cotner 说。“包括我们在内,还没有任何厂商能够提供覆盖整个数据生命周期的企业数据管理解决方案。我们会向这个目标继续努力。”

目前,Data Studio 1.1 是一个免费的解决方案,它可以为使用 DB2 和 IDS 的客户解决每个数据生命周期阶段的一部分需求,而对其他数据库的兼容性还很有限。在不远的将来,IBM 会把现有的其他数据管理工具集成到 Data Studio 中。IBM 会继续提供 DBA 目前喜欢的功能,并通过与 Data Studio 集成进一步改进它们。

Cotner 及其团队计划最终实现一个非常丰富的工具集,其中一些工具是免费的,其他工具需要升级费用。他们希望 Data Studio 最终能够向客户提供一个真正覆盖整个数据生命周期的企业数据管理解决方案。





回页首


参考资源



关于作者

Cynthia Harvey 是爱达荷博伊西的一名自由撰稿人,专长领域是科学和技术。




对本文的评价

太差! (1)
需提高 (2)
一般;尚可 (3)
好文章 (4)
真棒!(5)

建议?







回页首


IBM 公司保留在 developerWorks 网站上发表的内容的著作权。未经IBM公司或原始作者的书面明确许可,请勿转载。如果您希望转载,请通过 提交转载请求表单 联系我们的编辑团队。
    关于 IBM 隐私条约 联系 IBM 使用条款