IBM®
跳转到主要内容
    中国 [选择]    使用条款
 
 
Select a scope:Search for:    
    首页    产品    服务与解决方案     支持与下载    个性化服务    
跳转到主要内容

developerWorks 中国  >  Information Management | Architecture  >

DB2 Magazine:Info 2.0

Web 2.0 新动向

developerWorks
文档选项

未显示需要 JavaScript 的文档选项


Nelson King, 自由撰稿人

2008 年 1 月 18 日

网络社区、博客、维基、RSS 提要、mashup 和其他 Web 2.0 技术像一场风暴正席卷着全球企业。不久之前,IBM 启动了 Info 2.0 计划,目的就是抓住机遇,关注并掌控这种力量。这项计划最终要汇聚各方的聪明才智——客户、合作伙伴,甚至可能包括竞争对手(这多少有些令人惊讶)。

Web 2.0 也许已成为推动 Internet 发展的盛行风。但是,就像风一样,它难以捉摸、不易定义。许多企业都已经认识到需要抓住这一潮流,IBM 也不例外。社会计算、参与架构、通过装配组件得到的软件,这些 Web 2.0 概念正冲击着各种各样的企业,这促使 IBM 为其客户和自己的业务加速寻找“最佳匹配”。

IBM Data Servers and Information Management Development 的副总裁 Arvind Krishna 提到,IBM 确实正在那样做,他们追问自己,如此引人注目的 Web 2.0 应该是什么样的——客户想解决的最大的问题是什么?

“前几代计算采用的基础设施和应用程序需要很多人为的工作,有些呆板。” Krishna 解释道,“Web 2.0 真正吸引人的地方是,它可以使您很快地将不同的东西组合起来,而且不必再进行测试。”

人们希望从 Web 2.0 中得到的,是能够按照自己认为有用的方式来访问和组合信息—— 其中有些方式是 IT 部门没有预料到的,IT 部门也没有提供相应的应用程序。为支持这种快速访问,IBM 在六月份引入了一组技术,帮助企业用户快速创建可定制的 mashup 或不同应用程序的混合体。这组技术包含的 3 个主要的组件(目前被称作 Mashup Hub、DAMIA 和 QEDWiki)主要用于清理和转换结构化及非结构化的数据,以便能够在“情景(situational)”应用程序(通常指由终端用户构建或直接使用的应用程序的简称)的 feed(Atom、XML 等)中使用这些数据。

Mashup Hub、DAMIA 和 QEDWiki 显示了 IBM 的发展方向。在 Web 2.0 模式中,这些技术被当作不断增强的 beta 版或功能原型,将动态地添加更多的元件。

从事 IBM Info 2.0 宣传的 Anant Jhingran(同时也是杰出的工程师、信息管理部门副总裁和 CTO)解释到,这个过程太快了,甚至来不及把它们看作“产品”——现在,它们更像是一个技术预览。然而,这些技术又可以供下载并使用。Jhingran 的博客(jhingran.typepad.com)最近几个月都在谈论 Info 2.0,并提供了这些产品在 alphaWorks 上的位置、视频演示和相关信息的链接。

为何这么早就公布未完成的技术呢?Krishna 说,有两种引入新产品的可行方法。“一种方法是在内部再三试用,然后推向市场。但是可能存在一些小小的错误,这时就不得不回过头来对它进行改进。”另一种方法是,首先完成足够多的、感兴趣的功能,获得反馈,然后在继续构建其余的基础设施的同时改善它。在 Web 2.0 中,IBM 选择了后一种方法,预先推出预览版本,接受反馈意见。Jhingran 说,根据日程安排,他们将在 2008 年第一季度发布 Info 2.0 产品的首个版本。

探索创新

Tim O'Reilly 曾发起过广泛认可的 Web 2.0 相关规范,他说:“……数据将成为 Web 2.0 的推动力量。”IBM 从 Web 2.0 中看到了机会,这个机会正好可以充分发挥 IBM 在数据管理方面的丰富经验以及在数据集成、信息随需应变和数据分析等领域数十年的研究成果。

换句话说,这不是父辈使用的传统数据管理。Web 2.0 数据也许包括传统的 IT 数据,但是它的范围要更广泛,它还包括公共的和个人的、结构化的和非结构化的信息。这种混合体——或者 mashup——在很多方面都是新的。人们希望快速创建新的混合体——访问和组合来自多个源的信息(包括内部的和外部的信息),这种需求推动着 mashup 的发展。而 Info 2.0 的目的正是满足这种需求。

这三个产品可以理解为是处理和打包数据的不同层,最终是为 Web 2.0 应用程序(例如 mashup)提供结构化的数据。 Mashup Hub 是基础层,用于建立连接,执行初始的数据分析、验证和格式化。接下来的一层是 DAMIA(Data Mashup Fabric for Intranet Applications),它是一个 Web 应用程序,用于将数据装配成新的联合 feed。最后一层是 QEDWiki,它是基于 Web 的开发人员工具,用于以类 wiki 的方法从数据 feed 构建应用程序 mashup。

在 QEDWiki 层,一个重要的目标是能够快速、轻松地产生特定用途或相对短期用途的情景应用程序。一个例子就是飓风保险分析,这需要利用风险计算 Excel 电子表格、天气预报服务和地理基本地图构建一个 mashup。





回页首


说易行难?

“情景应用程序”说起来也许容易,但做起来却没那么容易。这种应用程序存在一些基本的挑战。首先,对于 Info 2.0,IBM 在追求一个古老的计算目标:将较小的数据块通过组合和编程变成功能完备的应用程序。现在,在面向服务架构中,Internet 是平台,小块是 Web 服务,框架是作为服务的信息。Info 2.0 解决底层的数据管理,这正是在这种环境下使 mashup 应用程序变得“容易”所需要的。





回页首


刚好适合 IBM

IBM 了解这个环境的基础。IBM 通过实践获得了这样的认识,因为它的大部分企业客户都深入涉足 SOA 和 Internet 应用程序,IBM 也从研究中得到了一定的认识,因为研究中涉及到的问题早已成为热点话题。例如,Jhingran 指出,Web 2.0 还没有包含将软件分为多个操作层(例如数据层、处理层和呈现层)的概念。而数十年来 IT 都使用这个概念来实施软件开发的组织和纪律。IBM 看到将这一思想引入到 Web 2.0 应用程序的实践中的机会。正如 Jhingran 所说的:“分离的思想是信息管理的原则系统,我们希望从中获得大量的创新,而它也应该会带来大量的创新。”

很多 IBM 创新都将体现在 Info 2.0 之中。例如,Info 2.0 建立在 DB2 pureXML 的研究的基础上,并加以扩展,围绕 DB2 的 pureXML 功能和 XML 处理创建了 feed 的概念,以集成、混合和匹配诸如 RSS 和 Atom 之类的 feed。另一个重要的创新思想将来自语义研究,它能够解决像“理解”不同类型的数据和信息源,并适当地处理它们这样的复杂任务。





回页首


关于控制

“……适当地处理它们”是否考虑一些典型的 IT 问题,例如数据验证、用户认证、用户隐私或常规安全性呢?对于 Web 2.0 和 Info 2.0,并不是所有数据(甚至不是大部分数据)都来自受 IT 控制的领域。

Info 2.0 将根据良好的数据管理策略和原则(毕竟是 IBM)来处理数据。“那是 Info 2.0 最有趣的一个挑战:在创造性与控制性这两种需求之间寻找平衡。”Jhingran 说道。Krishna 指出,虽然 Info 2.0 中的产品将处理一些管理方面的负载,但是必须与参与系统——数据库、Web 服务和网络共享控制。与信息的 mashup 一样,安全性与控制是协作的关系。这种方法需要新的基础设施和接口,它们将被逐渐加入到 Info 2.0 产品当中。





回页首


关于工作负载

Krishna 强调,从数据库服务器的角度看,也许 Web 2.0 最惊人的挑战在于负载的急剧增加。“信息正在变得民主化,而管理负载将大得难以想象。”原因之一是急剧膨胀的问题。现在需要实时地供应比以前多得多的数据;在很多情况下,数据可能是动态的,可能来自集中的数据库。查询会更多,并且更复杂。正如 Krishna 所说,还需要更多的缓存——“没有各种缓存根本无法实现 mashup。”

Web 2.0 在数据量和数据流的复杂性上都将有巨大的增长,因此,为了理解 Web 2.0 并为之做好准备,数据管理的重要性以及对参与者(数据库管理者、设计者和开发人员)的要求也随之增加。





回页首


开放创新

Info 2.0 是一系列技术,是信息管理领域中正在进行的尝试。对 Web 2.0 功能及其提供的信息访问的生态系统的需求(来自客户和竞争对手)将成为推动因素;为满足这些需求,Info 2.0 将在 mashup 应用程序(现在)和将来更高级的应用程序(不管到时候叫什么名字)中提供信息管理功能。

可以理解,这些开发并不会到处受到热烈的追捧。对于 Info 2.0 的实验也不会总是得到完美的结果。Web 2.0 最令人感兴趣(可能也最令人费解)的一个方面是,所有信息都参与其中。信息天生是自由、开放和杂乱的。在某些方面,精确和控制不得不面临快速和杂乱的挑战。正如 Jhingran 所说的:“见好就收”。

当然,对于传统 IT 数据管理,这样的思想是一种创新。但是,沿着创新与控制之间的平衡这条主线,也许可以找到革新的机会。它也是一个协作环境,是 Web 2.0 可以论证的基础。IBM 的定位是,Info 2.0 是开放的创造性的、实验性的工作,应该在整个数据管理社区共享,接受批评,并获得增强。





回页首


附录:您与 Info 2.0

Web 2.0 和 Info 2.0 的影响很快就会波及到使用数据库系统的人。DB2 和 Informix 将深入涉足其中,为 Info 2.0 产品提供数据,并管理工作负载。IBM 的 Anant Jhingran 和 Arvind Krishna 建议数据库专业人员应该做一些事情,以做好准备:

  • 理解 Web 2.0,特别是用于 RSS feed 等的新协议。
  • 掌握 XQuery。
  • 学习如何有效地监控服务器、网络和客户机负载。
  • 准备扩展带宽管理。
  • 学习如何为 Web 2.0/Info 2.0 应用程序优化数据。
  • 准备迎接新的安全性和隐私方面的需求。




回页首


附录:产品抢先看

IBM 已有的数据服务器产品如何满足 Info 2.0 需求?来看看现在有什么产品,将来还会有什么产品。

  • DB2 9:其混合的关系-XML 能力在 XML 驱动的 feed 领域中风光无比。“Viper 2”中的工作负载管理和审计方面的增强(请参阅第 26 页的文章)将处理 Info 2.0 带来的新需求(例如即时查询和跟踪信息访问)。
  • Web 2.0 Starter Toolkit for IBM DB2:通过这个可下载的产品、技术和教程包,可以使用 PHP技术快速创建 DB2 Web 服务和 feed。
  • Informix Dynamic Server:即开即用的适配器将把 IDS 连接到 Info 2.0 数据 hub,从而提供更多以 XML 的形式表达数据库内容的能力。
  • 工具:看看有助于表达 Info 2.0 结构的工具,它们对于数据库意味着什么。如果您通过Web 服务或存储过程表达了很多的查询或数据,那么新的工具最终将帮助 mashup 构建器发现它们。




回页首


附录:新旧并存

Anant Jhingran 在 IBM 领导 Info 2.0 行动,他集中精力关注全景。在他看来,一切只不过是为用户提供他其所需,同时不牺牲 IT 的传统优势。在这次的访谈摘录中, Jhingran 分享了他在新与旧(传统 IT 优势)的结合方面的见解。

DB2 Magazine:

对于 Web 2.0,别人都关注 Ajax 和其他热点技术,IBM 为什么要采取以数据或信息为中心的方法呢?

Jhingran:

人们常利用 Web 2.0 来使用数据,但是他们需要一种机制,以便能够集中、混合和聚合信息等等。人们收集的某些信息常常不在 IT 控制之下(它可能来自 Web、桌面、部门服务器等)。我们正在解决一项挑战:将信息作为服务(information-as-a-service)的概念推广到所有信息,而不仅仅是 IT 控制之下的信息。

DB2 Magazine:

您提到了 Info 2.0 可以作为一种方式,用于提交对 mashup 等有用的数据包。那么,您如何看待这种打包方式的创新之处?

Jhingran:

我们在考虑什么样的小块信息可以进入到信息应用程序当中。但是,这不仅仅是小块信息的问题;这还关系到我们混合、匹配和聚合的能力,即进行适当的、有原则的整合,以便能够组合和重组信息。

DB2 Magazine:

对于数据,您强调分层。安全性、验证和访问对企业都很重要。但是如果 mashup 是松散的,这些方面就难以做到。

Jhingran:

正如我对客户所说的,我常听到 IT 与企业之间的有趣争执。Web 2.0 终结了这样的争执。它带来了如此开放的创新;即使没有 IT 的准许,人们照样可以做很多事情,并且可以避开由于某些原因一度存在的 IT 环节。这是创新与控制的交叉点。我想这就是 IBM 与众不同之处。很多人都可以提供工具。我们理解这对于提供安全性、认证、伸缩和其他能力意味着什么。

DB2 Magazine:

IBM 将引入信息管理方面的知识。

Jhingran:

这是我们为这个环境引入的最重要的一样东西。企业架构是分离的(数据、处理、呈现等等)。通常,新的并不会代替旧的,而是与之并存。仅仅因为您想处理不在 IT 控制之下的信息,或者更轻松地混合和聚合信息,并不意味着问题就解决了。数据的整合并非易事。如果混合和聚合的是垃圾,那么得到的也只能是垃圾。

如何真正在简单性与价值之间取舍?我们在语义、分析、集成、数据库和 XML 方面有很深的经验可以利用。Info 2.0 将意味着企业可以轻松地做这些聚合,但是他们将有一个良好的底层系统。





回页首


附录:试水

鉴于 IBM 和其他大型供应商都将资源投放到各种不同的用于企业的 Web 2.0 技术上,我们请 IBM Data Servers 副总裁 Arvind Krishna 谈谈他在与客户的讨论当中得到的见解。

DB2 Magazine:

您的客户对 Info 2.0 是一种怎样的态度?

Krishna:

我认为他们很感兴趣。当向他们谈到更容易的开发和更容易的可维护性时,大多数人都感兴趣。有所怀疑?那是肯定的。我们行业常常提出承诺,但是并没有完全兑现。回头看看 Internet。在 1993 年,也许只有 20% 的人知道 Internet。但是到了 1994-95 年,每个人都知道 Internet,有些人已经用上了 Internet,而有些人则静观其变。我不会说后一种人是愤世嫉俗,他们只是在等等看。而现在的情景其实差不多。

DB2 Magazine:

数据库社区的大多数人都知道 Info 2.0 即将到来吗?

Krishna:

他们知道。有些人已经在花时间观察如何从中受益。而剩下一些人则自顾不暇,他们没有精力为之做任何事情。想想看:每个人有 70% 到 80% 的精力都花在当前环境的操作和维护上。大家并没有多少时间可以用来尝试新事物。

DB2 Magazine:

在将 Web 2.0 推广到企业的过程当中,有没有遇到什么障碍?

Krishna:

他们担心失控,不是这样吗?这是对开放所有这些系统的担忧。我是不是再也不能负责我的 SLA 了?我公布信息的时候,是否要承担责任?这些都是实际的担忧。

我们必须与客户合作,确保 SLA 能得到满足。我 100% 地相信,技术上的进步足以消除那些担忧。当然,如果没有合适的服务器或软件,再它加上很重的负载,那么最终的响应时间会很长,这会让你感到沮丧。但是那个问题是可以解决的。

还有对控制方面的担忧,例如谁可以看到什么数据、哪些数据可以流入流出、谁可以使用数据、以何种方式使用数据等等。对于此类问题,我认为我们已经有了合适的基础设施。如何将其利用起来,这是我们在今后几年中要决定的。

请在 DB2mag.com 上阅读更多 Arvind Krishna 访谈摘录。





回页首


参考资源



关于作者

Nelson King [nelsonking@earthlink.net] 担任软件开发人员已经超过 25 年,专攻学校和政府的大型项目。他还是计算机行业分析师,博客写手,产品评论家,并著有 9 本关于数据库编程的书籍。




对本文的评价

太差! (1)
需提高 (2)
一般;尚可 (3)
好文章 (4)
真棒!(5)

建议?




回页首


IBM 公司保留在 developerWorks 网站上发表的内容的著作权。未经IBM公司或原始作者的书面明确许可,请勿转载。如果您希望转载,请通过 提交转载请求表单 联系我们的编辑团队。
    关于 IBM 隐私条约 联系 IBM 使用条款