内容


Thinking XML

学习对象元数据

XML 知识管理在学习技术萌芽中茁壮成长

Comments

系列内容:

此内容是该系列 # 部分中的第 # 部分: Thinking XML

敬请期待该系列的后续内容。

此内容是该系列的一部分:Thinking XML

敬请期待该系列的后续内容。

计算机辅助教育学科一直充当知识管理技术的急先锋,而且一般而言也一直是大范围学习环境的最早用户——从小学教育到职业培训再到企业学习资源。这个领域的实践者最先认识到个人计算机的重要性:他们很快把多媒体光盘投入实际应用,在 XML 元数据技术的实际应用方面他们也首开先河。

围绕着如何将 XML 内容格式和基于 XML 的元数据系统用于支持学习和教育技术,已经出现了一个实践的温床。在这些萌芽中,关注的基本单位是 学习对象。根据电气和电子工程师协会(IEEE)学习技术标准化委员会(Learning Technology Standards Committee,LTSC)的定义和描述,学习对象是指:

[学习对象是]任意的实体,可以是数字化的也可以是非数字化的,可以在技术支持的学习期间使用、重用或引用。技术支持的学习例子包括:基于计算机的培训系统、交互式学习环境、计算机辅助的智能教育系统、远程学习系统、协同学习环境等等。学习对象的例子包括:多媒体内容、教育性内容、学习目标、教育型软件和软件工具,以及在技术支持的学习期间所涉及的人、组织和事件等等。

学习对象也被称为 学习资源,其中的“资源”和资源描述框架(Resource Description Framework,RDF)中的“资源”具有类似的含义。这个行业冒然地采用 XML 作为学习对象的关键技术,而且在某些方面,有关学习对象的研究已经为语义 Web 技术开拓了全新的领地。教育技术领域从来都不被认为是富有魅力的,也没有受到外界的很大关注,但是在这一领域发生的许多事情将会引起阅读本专栏的许多人的兴趣。在本文中,我将介绍这个领域以及学习与教育知识管理的重大进展,重点放在学习对象的元数据上。

多种标准,非凡的一致性

本专栏的读者肯定会清楚,在一些领域存在多种竞争性的 标准,彼此独立而又针对相同的问题空间。学习对象也经历了自身的标准纷争,但大部分研究已经逐渐走向协调和一致。学习对象的标准化先驱,是由欧洲远程教育创作和分布式网络联盟(Alliance of Remote Instructional Authoring and Distribution Networks for Europe,ARIADNE)开发的,90 年代中期它完成了教育元数据和学习对象索引系统。教育管理系统项目(Instructional Management Systems,IMS)和高级分布式学习(Advanced Distributed Learning,ADL)计划 1997 年在美国出现,致力于开发分布式学习技术的标准。前者已经发展成为 IMS 全球学习协会,主要的工作也转向学习对象的词汇表和元数据(IMS 学习资源元数据规范)。后者是 可共享内容对象参考模型(Sharable Content Object Reference Model,SCORM)的大本营,这是一个面向 Web 的内容聚合数据模型,关注学习对象的结构和运行时环境(请参阅 参考资料)。

SCORM 大量使用 XML,尤其是在 课程结构格式(Course Structure Format)的定义中,这是表示课程结构的一个系统,使教育资料能够跨平台、跨系统进行交互。作为教育内容管理的标准,SCORM 被广泛地接受,它的对手是一个教育内容元数据管理标准——IEEE LTSC 的 学习对象元数据(Learning Object Metadata,LOM)。LOM 源于 ARIADNE 的元数据研究以及 IMS 元数据,和世界上绝大多数主要教育技术组织一样,这两个组织都已经向 LOM 看齐。LOM 与 SCORM 都非常灵活且易于扩展,因此尽管学习对象有许多不同的推建标准,但在很大程度上有一个共同的基础。

LOM 基础

LOM 定义了一个 基本模式,这个模式为学习对象元数据定义了数据元素的层次结构。层次结构的最高层有9个范畴,这里引用 LOM 规范自身的明确定义加以描述:

  1. 一般(General)范畴包含描述整个学习对象的一般信息。”
  2. 生命期(Lifecycle)范畴包含与该学习对象的历史和当前状态有关的特性,以及在其演化过程中发挥作用的那些特性。”
  3. 元-元数据(Meta-Metadata)范畴包括关于元数据实例自身的信息(而不是元数据实例所描述的学习对象)。”
  4. 技术(Technical)范畴包括学习对象的技术需求和技术特征。”
  5. 教育(Educational)范畴包括学习对象的教育性和教育学特征。”
  6. 版权(Rights)范畴包括使用学习对象的知识产权和条件。”
  7. 关系(Relation)范畴包括定义学习对象和其他相关学习对象之间的关系的特性。”
  8. 注解(Annotation)范畴提供学习对象的教育性应用的注释,并提供何时何人创建该注释的信息。”
  9. 分类(Classification)范畴描述该学习对象和特定分类系统的关系。”

对于每个数据元素,LOM 都规定了名称、说明、大小、示例值、数据类型以及其他重要细节。下面列出了一些有趣的数据元素例子。在列表中,我使用了一般的约定,在各层的名称之间用点号表示层次关系,比如,“General.Identifier.Catalog”表示“Catalog 是 General 范畴中的一种 Identifier”。

  • General.Title:学习对象的名称。
  • General.Language:主要的人类语言,或者该学习对象中与预期用户交流所用的语言。
  • Life Cycle.Version:该学习对象的版本。
  • Technical.Location:用于访问该学习对象的字符串(比如可能是一个 URL)。
  • Educational.Typical Learning Time:一般预期目标受众使用或完成该学习对象所花费的大约时间或通常时间。
  • Annotation.Classification:该学习对象是否符合特定的分类系统。

一些数据元素必须使用一组约束的值(程序员称之为 枚举类型)。在本体论(ontology)和 LOM 之类的元数据技术中,这种固定的、已充分理解的值的集合称为 词汇表(vocabularies)。在 LOM 以及基于 LOM 的规范中,词汇表是一个重要的概念。IMS 开发了 Vocabulary Definition Exchange(词汇表定义交换,VDEX),一种可供机器和人类阅读的词汇表交换格式。

XML 中的 LOM

受 IEEE LTSC 特许的一项活动是为 LOM 开发 XML 绑定。这项活动仍在进行之中,但是标准的 XML 绑定还没有被批准和发布。我确实找到了一份关于绑定的建议(从 google 搜索“IEEE 1484.12.3” ——该规范的正式名称要到完成的时候才会产生)。我看到建议的绑定是基于 W3C XML Schema(WXS)。我本来希望最后的规范支持 RELAX NG,我认为 RELAX NG 是一种优秀的 XML 模式定义语言,但我猜想之所以选择 WXS,可能是因为规范的大部分涉及到把 LOM 数据元素映射到 WXS 类型系统;RELAX NG 没有自己的类型系统,而是借用了 WXS 的类型系统。当然,如果能够在 LOM 的内容模型方面(比如哪个属性、元素和文本放在哪里)看到标准的 RELAX NG 模块,那就更好了。

清单 1 是一个例子,根据我所找到的建议,LOM XML 绑定实例可能是这个样子。

清单 1. 一种可能的 LOM XML 格式
<lom xmlns="http://ltsc.ieee.org/xsd/LOMv1p0">
  <general>
    <title>
      <string xml:lang="en">Ecologues</string>
      <string xml:lang="la">BUCOLICA</string>
    </title>
    <language>la</language>
  </general>
  <technical>
    <location type="URI">
      http://classics.mit.edu/Virgil/eclogue.html
    </location>
  </technical>
</lom>

在 XML 绑定标准化之前,可能还会考虑到其他的 XML 设计问题。 有一个问题吸引了我:我曾经仔细考虑过在 XML 属性而不是内容中表示 URL,因为它们实际上是提供给机器阅读的;但是定位元素的字符数据是 URL。这可能是因为这个数据已经受到 type 属性的限制。这种情况下通常可以选择方法是,用另一个嵌套的元素以 URL 作为属性,而把供人类阅读的标题放在元素内容中。

LOM 世界和 RDF 世界

大量有意义的工作还刚刚开始,主要是为了协调 LOM 与其他元数据标准。每个 LOM 数据元素都有类似的 Dublin Core 元数据元素,两者之间存在重叠。非常灵活的 Dublin Core 元数据编辑器工具(请参阅 参考资料),能够从任何网页中提取 Dublin Core 元数据,并把结果转化成 LOM 或 IMS 元数据。这是一个很好的暗示,LOM 之类的元数据项目可以很快在其直接领域之外得到应用。我对 IBM developerWorksXML 专区的主页进行这种处理,结果得到了如下的 LOM XML 文档(根据草案标准):

清单 2. 从 XML 专区主页提取的 LOM 元数据
<?xml version="1.0" encoding="UTF-8" ?>
<lom xmlns="http://ltsc.ieee.org/xsd/LOMv1p0"
     xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
     xsi:schemaLocation="http://ltsc.ieee.org/xsd/LOMv1p0
                         http://www.rdn.ac.uk/oai/lom/lom.xsd">
  <general>
    <title>
      <string>developerWorks : XML</string>
    </title>
    <description>
      <string>
        The XML zone on the developerWorks Web site is designed for
        developers. You'll find tools, samples, standards information,
        education, news and events, and links to XML community forums
        and Web sites.
      </string>
    </description>
    <!-- Many other keywords snipped -->
    <keyword>
      <string>xml resources</string>
    </keyword>
    <keyword>
      <string>xml programming</string>
    </keyword>
  </general>
  <lifeCycle>
  </lifeCycle>
  <technical>
    <format>text/html</format>
    <location>http://www.ibm.com/developerworks/xml/</location>
  </technical>
  <educational>
    <learningResourceType>
      <source>DCMIType</source>
      <value>Text</value>
    </learningResourceType>
  </educational>
</lom>

为 LOM 开发 RDF 绑定的正式研究计划(IEEE 1484.12.4)正在进行之中。对于 XML 绑定,还没有任何正式的标准发布,只有一个开发草案可用。一个积极的信号表明,列出的主要贡献者中有 Eric Miller,他为 Dublin Core 做了开创性的工作,目前工作于 W3C。看到不同的元数据研究互相结合是一件好事。

结束语

重复一次,即使那些与教育技术无关的人,也会对 LOM 及相关标准感兴趣。许多这方面的研究推动了数据建模、与应用程序无关的数据分类、基于 XML 的元数据以及其他技术的不断发展。教育技术的供应商对这些元数据技术的采用率如此之高,也给我留下了深刻的印象。尽管学习对象的各个方面还没有到位,开发人员却已经有足够的工具和例子可以尝试。该领域的许多方面仍在不断发展之中,许多工作仍然非常活跃,如果我遗漏了什么,或者您有什么新的想法,请参与 Thinking XML 讨论论坛


相关主题


评论

添加或订阅评论,请先登录注册

static.content.url=http://www.ibm.com/developerworks/js/artrating/
SITE_ID=10
Zone=XML
ArticleID=54755
ArticleTitle=Thinking XML: 学习对象元数据
publish-date=12012003