IBM®
跳转到主要内容
    中国 [选择]    使用条款
 
 
Select a scope:Search for:    
    首页    产品    服务与解决方案     支持与下载    个性化服务    
跳转到主要内容

developerWorks 中国  >  Information Management  >

DB2 Magazine:Blade 时代即将到来

developerWorks
文档选项

未显示需要 JavaScript 的文档选项


Vincent McBurney, 数据仓库专家

2008 年 1 月 18 日

一种成功的软件和硬件组合为 IBM Information Server Blade 赋予了力量。

欢迎参加企业数据集成全能大赛,在这里,运动员要进行十米冲刺,安装企业 ETL(提取、转换和加载)或 ELT(提取、加载和转换)工具,配置并测试,然后处理来自多个数据源的TB级数据。

这一切都已经过去!令人惊讶的是,IBM Information Server Blade 已准备好随时运行!看上去,只需插好并供电即可。ELT 会迅速安装,因为在高级 ETL 检查先决条件时,它将在现有数据库内运行转换。

Information Server Blade 已经过配置和测试,团队正在设计数据集成作业。ELT 的安装和数据库的配置都考虑了海量数据。高级 ETL 内嵌于安装向导之中。

Information Server Blade 已进入数据集成阶段,可跨多个刀片处理数据。除非我犯了严重的错误,否则这就表示,它们已能连接两个以上的刀片服务器,并且随时可以处理数据集成作业。ELT 将集成作业外推至数据库引擎,高级 ETL 现已安装。

至此,Information Server Blade 可跨十几个 CPU 处理单一数据源。ELT 正常运行,但根据统计数据,它们尚未提供足够大的数据库——尚未为额外的数据集成负载调整大小。高级 ETL 现进入安装后配置状态。

Information Server Blade 到达了终点——可能创造了新纪录。ELT 正经历着某些锁定问题,因而寻求 DBA 的支持。重要 ETL 最终得到了安装和配置,可及时启动,从而使 Information Server 赢得这场竞赛。

这是全新的记录!Information Server Blade 怎样做到如此快速地开始运行并使用大量并行进程?

IBM 数据集成

IBM Information Server Blade 组件(第一版)

  • 三个 IBM BladeCenter HS21 刀片,各带两个双核 Intel Xeon 处理器、4GB RAM 和 60GB 的磁盘空间
  • Linux Red Hat v4 操作系统
  • 在一个 DB2 存储库上运行的 IBM Metadata Server 和 WebSphere Application Server
  • 两个运行 DataStage for ETL 和/或 QualityStage for data quality 的刀片
  • 管理网格内作业执行的 Tivoli Workload 调度器

IBM 已为其 IBM Information Server Blade 组织起一支可伸缩数据集成产品的梦幻组合。硬件、操作系统和集成软件全部专为处理高可伸缩性并行架构上的数据而设计。

IBM Information Server i是异构数据集成软件工具的套件。核心是元数据服务器;用于分析、ETL、数据质量和元数据报告的产品均使用元数据服务。所有产品都可在对数据进行分区、运行并行进程以实现更快处理速度的并行框架上运行。

Information Server 软件对硬件要求很高,因而由带有两个双核 CPU 和 4GB RAM 的 IBM HS21 Blades 提供动力。简约、模块化的设计使您可以随时添加额外的刀片,而不会占用过多的服务器空间(如果有闲暇时间,不妨将刀片像多米诺骨牌那样排成一列,再推倒,拍摄一份很酷的 YouTube 视频)。

如果安装的不是 Tivoli LoadLeveler 免费版,软件加上硬件带来的配置任务可能会使一名管理员早衰。我曾经向 IBM 的产品经理 Aarti Borkar 询问过 LoadLeveler 的角色,他这样告诉我。DataStage 和 QualityStage 并行引擎使用动态配置。Tivoli LoadLeveler 提供有多少刀片空闲的信息,随后将基于 LoadLeveler 提供的信息为所有新作业生成配置。这种方法能在新作业启动时利用任意空闲处理器,从而确保硬件得到充分利用。

Information Server Blade 操作系统是带有 IBM 支持的 Linux Red Hat;事实上,仅需为整个 Information Server Blade(包括硬件和软件)准备一个客户支持电话号码。Tolkien 的追随者可能会这样说:以一驭众,以一系众。如果有哪些内容无法在 Information Server Blade 上正常工作,IBM 会负责修复问题。





回页首


Information Server Blade 与自行构建

就像本文开头处提到的全能大赛,使重要数据集成工具开始运行也涉及许多步骤。安装软件或许是最简单的,为网格进行优化则需要精深的技能和透彻的测试。即便您使正确的人员组合运行了 Information Server,很可能在一至两年内还需要进行扩展,以处理增加的数据量。谁会知道负责安装的人员是否依然能够正确设置新服务器?使用 Information Server Blades,新增的刀片服务器只需使用现有刀片的相同配置加入网格即可。

Information Server Blade 的第一个版本附带 DataStage 和/或 QualityStage,还可添加其他产品。Information Analyzer 分析工具可在相同的网格上很好地运行,Metadata Workbench 将为 Metadata Server 添加元数据报告和可视化功能。这些产品安装起来非常简单,因为它们使用的是现有 Metadata Server。





回页首


零压力升级

Information Server 套件

  • 用于管理、保护、报告和为应用程序提供元数据服务的 IBM Metadata Server
  • DataStage 客户机/服务器 ETL 工具
  • 带有附加阶段的 QualityStage,用于 DataStage Designer 中交付的数据标准化、匹配和授权
  • Information Analyzer 基于 Web 的工具,用于分析数据源
  • 全新的 IBM Metadata Workbench,用于元数据的浏览和可视化
  • 用于联邦数据查询的 Federation Server

Information Server Blade 提供了一种从旧版本的 DataStage 升级到 DataStage 8 的零压力方法:从旧服务器中导出所有 DataStage 项目,然后将其导入新的 Information Server Blade 之中。

旧硬件至此即可光荣隐退。它们不如新的 HS21 刀片服务器那样高速、节能或紧凑。将基于 DataStage CPU 的许可置于速度更快的双核 CPU 服务器时,即可使这些许可创造更大的经济价值。

使用 DataStage 6.x 或 7.x 以及处于维护协议下的现有 DataStage Enterprise Edition 客户无需支付任何 DataStage 许可费用便可升级到 Information Server Blade。

尚无并行作业许可的现有 DataStage Server Edition 客户将需要支付一定的 DataStage 许可升级费用,之后才能开始在 Information Server Blade 上使用并行作业。Information Server Blade 将继续运行现有服务器作业,可采用增量式方法将其迁移为并行作业。由于 DataStage Server Edition 出现较早,可伸缩性较 Enterprise Edition 差,某些 DataStage 站点将发现陈旧的服务器正努力跟上不断增长的数据量。





回页首


未来的 Information Server Blade

IBM 有着针对 Information Server Blade 的宏伟蓝图。在 IBM Information on Demand 研讨会上,我们将了解有关产品路线图和用于 Information Server 的 IBM 新产品,还有即将迁移到 Metadata Server 和并行框架的现有产品。

我依然在寻找这一产品的缺点,某些出版物声称 Information Server Blade 并非即插即用式产品。但迄今为止,获得适用 Information Server 的成本依然低于单独购买各部件的成本。





回页首


参考资料



关于作者

Vincent McBurney [vincent.mcburney@bearingpoint.com] 是与 Bearingpoint 合作的一名 IT 顾问,Bearingpoint致力于全球各地的各种大型项目。目前,他正在澳大利亚的墨尔本从事数据仓库项目,还为 Tooling Around on the IBM Information Server(tooling.notlong.com)撰稿。




对本文的评价

太差! (1)
需提高 (2)
一般;尚可 (3)
好文章 (4)
真棒!(5)

建议?




回页首


IBM 公司保留在 developerWorks 网站上发表的内容的著作权。未经IBM公司或原始作者的书面明确许可,请勿转载。如果您希望转载,请通过 提交转载请求表单 联系我们的编辑团队。
    关于 IBM 隐私条约 联系 IBM 使用条款