可扩展标记语言(Extensible Markup Language, XML)

使用针对 Web 设计的语言表示结构化标记

可扩展标记语言(Extensible Markup Language, XML)基于标准通用标记语言(Standard Generalized Markup Language,SGML),具有严格的语法规则和一种定义结构约束的语言(Document Type Definition,DTD)。通过本文了解 XML 1.0 及其 Unicode 基础,以及 XML 1.1 所提供的所有新特性,以及围绕该最新版本产生的争议。

投稿者: W3C

2007 年 8 月 28 日

可扩展标记语言(Extensible Markup Language, XML)基于标准通用标记语言(Standard Generalized Markup Language,SGML),具有严格的语法规则和一种定义结构约束的语言(Document Type Definition,DTD)。通过本文了解 XML 1.0 及其 Unicode 基础,以及 XML 1.1 所提供的所有新特性,以及围绕该最新版本产生的争议。

可扩展标记语言 (XML) 1.0(第 4 版)[W3C 推荐标准] 当然是衍生出 XML 技术大树的主干。它构建于Unicode [Unicode Consortium 技术报告和 ISO 标准] 基础之上,可定义严格的文本格式规则以及 DTD 验证语言。该规范的当前版本(第 4 版)包含了规范的历次修订,并进行了相应的更新以适应最新版本的 Unicode。它被广泛 翻译 为多种语言,但英语版规范是惟一标准的版本,就是说只有这个版本被认为具有标准的效力。

XML 1.1

XML 1.1(第 2 版)[处于开发阶段] 是对之前版本的首次修订,更改了格式良好 的 XML 文档的定义。其中的主要更改是修正了 XML 规范中的字符处理,因此您始终能够引用最新版的 Unicode(而不是固定的版本)。通过引用 Character Model for the World Wide Web 1.0: Fundamentals [W3C 推荐标准],它还规定了可跨各个 Unicode 版本使用的的字符标准。XML 1.1 还增加了行结束字符列表,新增加的 NEL 用于在 IBM 大型机系统中表示行结束(EOL)。这一改动备受争议,因为有人认为大型机用户获得的利益不值得做出这种根本改变。还有一些其他的争论,因为一些评论者发现所有的修改都太稳妥了,在 XML 版本变换中不会造成各种可能的互操作性问题。

XML 基于 Standard Generalized Markup Language (SGML),后者由 ISO 8879:1986 [ISO 标准] 定义。XML 代表对 SGML 的重大简化,它包含了一些调整,使它更加适合 Web 环境。

参考资料

static.content.url=http://www.ibm.com/developerworks/js/artrating/
SITE_ID=10
Zone=XML
ArticleID=254315
SummaryTitle=可扩展标记语言(Extensible Markup Language, XML)
publish-date=08282007