级别: 初级 Ken North, 顾问和行业分析家
2008 年 12 月 01 日 为了适应企业 2.0 和 Web 3.0 的需求,学生和专业人员正在努力提高 XML 技能。在新的竞争环境中,他们的努力会得到回报和认可。 来自IBM Database Magazine中文版。
企业和政府机构正在推动新的软件潮流,即所谓的 “企业 2.0 ” 或 “ Web 3.0 ”。这种新型的软件采用基于标准的独立于平台的技术,包括 XML、SQL、TCP/IP 以及集成和语义技术。这些技术在企业和 Web 开发项目中发挥重要作用,促进了分布式数据、服务和 mashup 等协作型应用程序的发展。
在这些技术中,XML(以及基于 XML 的标记语言和词汇表)是许多应用程序和服务中绝对必需的组成部分。 XML 已经成为电子商务和电子政务首选的通信格式。随着企业计算、Web 计算、网格和云计算的发展,XML 越来越重要了。
由于看到了这种发展趋势,IBM 已经启动了与行业相关的 XML 解决方案项目,并为世界各地的大学和学术机构的项目提供支持,以培养下一代面向 XML 环境方面的业务技术专家。
Amjad Umar 博士是宾夕法尼亚大学的电子和系统工程学副教授,他把 XML 看作下一代企业 (NGE) 应用程序的关键。实际上,Umar 在他的创业公司 NGE Solutions 开发了一个基于 XML 的应用程序。这个应用程序名为 PISA (Planning, Integration, Security, and Administration),它的设计目的是通过 “服务型软件” 模型提供咨询服务。
“ XML 在表示信息方面的灵活性非常强,” Umar 说,“我预计会有更多 PISA 那样的应用程序出现,在这些应用程序中所有用户输入、输出和数据库都采用 XML 格式。” 作为 International DB2 Users Group (IDUG) 发起的 XML 竞赛的现任冠军,Umar 预计 XQuery 的使用量总有一天会超过 SQL 。
XML 的增长趋势
近来的发展趋势支持 Umar 的观点。在 World Wide Web Consortium (W3C) 发布 XML 1.0 规范之后的十年里,接受 XML 的开发人员和用户(包括企业、政府等等领域)急剧增加。每天都会出现针对特定用途的基于 XML 的新型标记语言 —— 这还仅仅是 XML Schema 和 XQuery 出现之前的情况。开发人员热衷于开发新的 XML 词汇表,这充分证明各个行业已经认识到以 XML 作为集成和数据交换的基础技术的价值。
目前,XML 广泛用于应用程序构建和部署、信息集成以及 B2B 数据交换。 XML 是数据集成、应用程序集成和其他企业计算需求的首选解决方案。 XML 在 Web 环境中也得到了广泛应用,包括 RSS 和 Atom feed、站点地图、XHTML、XAML、WADL 和 WSDL 服务描述。
XML 还改变了以文档为中心的系统(比如内容管理系统和数字图书馆)。 Sarbanes-Oxley、Basel II 和 HIPAA 等法律法规的规定促进了存储库开发和 XML 的使用。例如,美国政府对医疗保健行业的规定大大推进了 ANSI HL7 电子数据交换协议的开发,目前美国的医疗保健机构已经广泛采用此协议交换临床和管理数据。实际上,HL7 Version 3.0 只使用 XML 编码。
金融、制造、旅游和医疗保健等行业目前都依赖于基于 XML 的应用程序词汇表。在语音、无线通信、元数据交换、化学、数学、音乐和其他领域,也出现了相关的标记语言。在保险业,ACORD Life, Health and Annuity 数据模型和 XML Schema 已经成为业务伙伴之间的通信标准;在全球范围,十大保险公司中的七家和前 25 家保险公司中的 60% 已经采用了 ACORD XML 。
由于认识到 XML 消息传递具有独立于平台和可互操作的优点,技术提供商和系统架构师非常喜欢 Web 服务和面向服务体系结构 (SOA) 。 XML 在开发工具以及 Java 和 .Net 等软件平台中得到了广泛应用。 XML over TCP/IP and HTTP 已经成为替代重型分布式组件技术的首选技术。
筒仓和混合型引擎
在企业中,XML 有助于在 SOA 和分析等方面使用数据资产,由此促进了性能管理、数据挖掘和业务智能化功能的发展。在 Web 和企业环境中,使用 RDF(一种基于 XML 的标记语言)解锁数据筒仓中信息、发布相互链接的数据,以及支持语义搜索。 XML 对于 mashup 和社交网络也很重要,可以表达结构化数据和非结构化数据的显式链接。 IBM 提供 IBM Mashup Center 等工具,支持包含 REST 式服务以及 RSS、Atom 和 XML 数据 feed 的企业 mashup 。
XML 数据常常通过文件系统以特定的方式存储。例如,请考虑一个媒体播放器的播放列表的存储。个人播放列表是一个 XML 文档实例,很容易作为一个文件处理;但是数千个网站访问者的播放列表集合就会带来数据管理难题。政府需要处理立法提案和报税表等用 XML 编码的文档,这促使政府寻找管理 XML 文档的解决方案。企业架构师和系统架构师很快就认识到数据库是处理大型 XML 文档集合的最佳解决方案。
IBM 是最早认识到 XML 的重要性的大型软件公司之一。 IBM 在 2000 年引入了基于 XML 的 Web 服务范式,并向 XML 和 SQL 之间的紧密集成发展。在 1997 年发布的 DB2 UDB 5.0 中,IBM 推出了对象 - 关系数据库技术,这说明 DB2 正在努力应对文档处理和 SOA 提出的新需求。 SQL:2003 标准包含 SQL/XML 函数并把 XML 作为第一类数据类型。目前,可以创建包含 XML 列的表、通过存储过程使用 XML 以及使用 XQuery 查询 XML 。
XML 数据库的支持者们一直认为,由于 SQL 数据和层次化 XML 数据的性质差异很大,XML 数据库需要一个原生 XML 存储引擎,但是,许多查询和 mashup 同时需要这两类数据,而不只是 XML 文档。使用单独的服务器分别存储 XML 和 SQL 数据会造成性能问题,除非为分布式查询提供优化器。如果为了执行集成任务,一个应用程序或服务必须分别查询不同的数据源,那么它必须了解如何优化对分布式数据的数据访问。
在 DB2 9 数据库中能够同时存储 XML 和表数据,这使 DBA 和开发人员能够利用 DB2 的混合型存储引擎和 pureXML 技术,而查询优化器能够决定对 SQL 和 XML 数据执行查询的最佳方式。
XML Superstar 竞赛
IDUG 发起的 XML 竞赛(正式名称为 “ Search for the XML Superstar ”)的目的是推广 DB2 的 XML 功能。这次竞赛于今年年初首先在亚洲开始;当时,印度的 40,000 名学生以及中国的 9,000 名学生和专业人员报名参加了竞赛。美国竞赛在 10 月开始。
学生和专业人员可以在几个参赛项目中做出选择。一个竞赛项目是创建一段关于 DB2 的简短视频;获胜的视频将在 ChannelDB2.com 上展示。参赛者可以在竞赛期间通过 xmlchallenge.com 每个月提交一段视频。
竞赛的软件开发项目提供几个开发主题:
- 把一个现有的应用程序迁移到 DB2 XQuery 或 pureXML 技术
- 创建用来迁移到 DB2 的实用程序
- 创建 DB2 工具
参赛者要在两个月内完成一个编程项目。获胜的程序将作为开放源码软件发布。参赛程序可以是基于 pureXML 技术的几类应用程序或服务之一,包括分析程序、SOA、事务处理、社交网络和 mashup 。
IDUG 和 IBM 还希望参赛者提交用于 DB2 的 “小部件”,比如小型实用程序或数据库扩展。小部件通常是用 Java 或 SQL 编写的;文本和代码的总大小必须不超过 10MB 。参赛者在四个月的竞赛时间内每个月可以提交一个小部件。各个竞赛项目的获胜者将进入大奖赛。
最后一个竞赛项目是 24 小时查询挑战。 IBM 将提供数据库模式和任务描述,参赛者要在一天内用 SQL 或 XQuery 开发五个查询。在 xmlchallenge.com、ChannelDB2.com 和 Facebook 上的 Search for the XML Superstar 组中可以找到更多信息。
XML 潮流
在各种与 XML 相关的编程技术会议上,我的目标是为内容发布、企业计算和 Web 服务领域的用户提供帮助。这些用户试图通过 XML 实现不同的目标。
目前,文档处理已经成为企业计算的重要组成部分。随着越来越多的企业发布网站和新的 feed,不应该再孤立地看待用于业务的 XML 和用于发布的 XML 。 XML 已经成为主要的集成解决方案,并且是用于开发和部署新应用程序和服务的平台的重要部分。
附录
1. 学生展示他们的 XML
IBM 把 2007 年的 Faculty Award 授予 Amjad Umar 博士。他的视频(youtube.com/watch?v=K0fuXJuH7SY)展现了今年夏天他在 Fordham University's Graduate School of Business 的教学成果。在这段视频中,学生们解释了什么是 XML 以及为什么 XML 对业务非常重要。
2. 推进行业 XML
几乎每个行业都有用于在伙伴、供应商或政府机构之间交换数据的 XML 标准。 IBM 在 alphaWorks 站点上提供了许多 XML 标准的演示程序 (services.alphaworks.ibm.com/DB2pureXMLDemo/Demo.html) 以及示例数据和演示脚本 (www.alphaworks.ibm.com/tech/purexml/download) 。涉及的标准包括 ACORD、FIXML、FpML 等。
3. XML、安全性、语义和企业 2.0
除了在宾夕法尼亚大学和 NGE Solutions 工作之外,Amjad Umar 博士还撰写了六本书和几十篇研究论文,获得了多个奖项,包括 IBM Faculty Award 以及 Fordham 大学和密歇根大学的教学奖。他是 United Nations ICT for Developing Countries Initiative 的资深顾问和 U.S. Council of International Exchange of Scholars 的 Fulbright 资深专家。
Ken North 有幸与 Umar 见面,一起探讨企业系统的未来。 Umar 谈到了 XML 对建模的影响、信息安全性、语义技术以及下一代企业应用程序的特点和挑战。在 ibmdatabasemag.com 上可以找到完整的访谈内容。
4. Information On Demand Conference 上的 DB2 pureXML 讲座
如果您参加在拉斯维加斯举行的 IBM Information On Demand Global Conference(10 月 26 日至 31 日),就可以听到用户对 pureXML 的看法。在 Native XML Databases 博客上最近的一篇文章中,Conor O'Mahony 详细列举了此次会议上关于 pureXML 的讲座。还可以通过 nativexmldatabase.com 了解讲座的详细信息:
Session 1197: DB2 pureXML Production Experiences at UCLA
Session 1438: How Verizon Streamlined its Order System
Session 1622: Top 10 Best Practices for DB2 pureXML
Session 1659: Implementing an Effective Electronic Government Solution
- New York State Department of Taxation and Finance
Session 1660: Using XML for Effective Cross-Agency Shared Services in Public Safety
-Shandong Public Security
Session 1661: Streamline Government Processing Through Electronic Forms and DB2 pureXML
Session 1677: Improving Health Care in China with a DB2 pureXML
Electronic Medical Record Solution
Session 1678: DB2 pureXML Customers - Trends and Successes
Session 1712: Introduction to XML and DB2 pureXML for Dummies |
5. 首字母缩写词和缩写词
原称:
ACORD Association for Cooperative Operations Research and Development
ANSI American National Standards Institute
ESB Enterprise Service Bus
FIXML Markup Language for the FIX Application Message Layer
FpML Financial Products Markup Language
HIPAA Health Insurance Portability and Accountability Act
HTTP Hypertext Transfer Protocol
OWL Web Ontology Language
RDF Resource Description Framework
REST Representational State Transfer
RSS Rich Site Syndication
WADL Web Application Description Language
WSDL Web Services Description Language
XAML Extensible Application Markup Language
XHTML Extensible Hypertext Markup Language
XML Extensible Markup Language |
参考资料 学习
获得产品和技术
讨论
关于作者  | |  | Ken North 是一名顾问和行业分析家,同时还是 www.SQLSummit.com 的编辑。他为 Expert Series 研究班授课,经常在各种会议上发表演讲。他还是 XML DevCon 200x 会议的主席。 |
对本文的评价
|