XML 解析器步骤

使用 XML 解析器步骤来解析一个或多个具有相同结构的文档。

XML 源

对于 XML 数据源,请指定下列其中一个选项:
字符串集
选择包含文档字符串的输入模式项。 只有字符串、 normalizedString, byteString, 或 XML 数据类型的项目才可用于选择。
单个文件
输入路径和文件名,或者单击 插入参数 ,然后选择参数的名称。 可用的参数是您之前在任务中定义的参数,以及......中的内置宏。 IBM® InfoSphere® DataStage®.只有字符串、 normalizedString, 或 byteString 数据类型的项目才可用于选择。
文件集
文件集选项用于读取基于同一 xsd 的多个 xml 文件。 选择将在运行时包含 XML 文件的绝对路径 (例如, c:\test.xml) 的输入模式项。 只有具有字符串、 normalizedString, 或 byteString 数据类型的项目才可用于选择。
启用过滤
启用过滤以在解析文档之前将 XSLT 样式表应用于该文档。 文档根必须反映从 XSLT 变换结果创建的文档。 建议不要对大型文档使用此选项,因为整个处理是在内存中完成的。 对于大型文档,请使用变换步骤。

文档根

选择用于描述要解析的文档的顶级元素。 在库的名称空间下显示的类型是顶级元素定义。 遵循 XML 模式标准,只有顶级元素才能描述文档。 您选择的元素的名称必须与实例文档中的顶级元素名称相匹配。 例如,如果要解析 "订单" 文档,请选择 "订单" 元素。 选择元素时,可以查看其结构,并验证该结构对于要解析的文档是否正确。
注: 从中选择文档根的元素来自先前导入到模式库中的资源。 如果需要导入包含 XML 解析器步骤的文档根的资源,请单击 打开库 并导入所需的资源。 然后,返回到组合件编辑器并配置文档根目录。

验证

缺省情况下,当 XML 解析器步骤运行时,它使用最少的验证,这将禁用所有验证规则并提供比严格验证更好的性能。 初始配置了严格验证,以便将每个验证规则设置为 "致命" ,并且作业在解析第一次出现的无效数据时立即停止。 要定制验证,请指定发生违例时要执行的操作。

有关验证规则的更多信息,请参阅 XML 解析器验证规则