XML 解析器步骤

使用 XML 解析器步骤来解析一个或多个具有相同结构的文档。

XML 源

对于 XML 数据源，请指定下列其中一个选项:

字符串集: 选择包含文档字符串的输入模式项。只有字符串、 normalizedString, byteString, 或 XML 数据类型的项目才可用于选择。

单个文件: 输入路径和文件名，或者单击插入参数，然后选择参数的名称。可用的参数是您之前在任务中定义的参数，以及......中的内置宏。 IBM® InfoSphere® DataStage®.只有字符串、 normalizedString, 或 byteString 数据类型的项目才可用于选择。
文件集: 文件集选项用于读取基于同一 xsd 的多个 xml 文件。选择将在运行时包含 XML 文件的绝对路径 (例如， c:\test.xml) 的输入模式项。只有具有字符串、 normalizedString, 或 byteString 数据类型的项目才可用于选择。

启用过滤: 启用过滤以在解析文档之前将 XSLT 样式表应用于该文档。文档根必须反映从 XSLT 变换结果创建的文档。建议不要对大型文档使用此选项，因为整个处理是在内存中完成的。对于大型文档，请使用变换步骤。

文档根

选择用于描述要解析的文档的顶级元素。在库的名称空间下显示的类型是顶级元素定义。遵循 XML 模式标准，只有顶级元素才能描述文档。您选择的元素的名称必须与实例文档中的顶级元素名称相匹配。例如，如果要解析 "订单" 文档，请选择 "订单" 元素。选择元素时，可以查看其结构，并验证该结构对于要解析的文档是否正确。

注: 从中选择文档根的元素来自先前导入到模式库中的资源。如果需要导入包含 XML 解析器步骤的文档根的资源，请单击打开库并导入所需的资源。然后，返回到组合件编辑器并配置文档根目录。

验证

缺省情况下，当 XML 解析器步骤运行时，它使用最少的验证，这将禁用所有验证规则并提供比严格验证更好的性能。初始配置了严格验证，以便将每个验证规则设置为 "致命" ，并且作业在解析第一次出现的无效数据时立即停止。要定制验证，请指定发生违例时要执行的操作。

有关验证规则的更多信息，请参阅 XML 解析器验证规则。