处理文档内容

要处理文档的内容,可以使用 ECMContentStream 数据类型来合并内容流,并返回有关流的信息。内容流是包含文档(例如,字处理文档或图像)内容的数据流。

ECMContentStream 数据类型用于以下四种 Enterprise Content Management (ECM) 操作:

可在主题Enterprise Content Management 操作中的数据映射中找到有关这些操作的信息。

下表描述了 ECMContentStream 数据类型的属性:

表 1. ECMContentStream 属性
属性名 描述
contentLength 原始(非编码)内容长度(以字节为单位)。如果设置该属性,长度必须为正数。如果长度未知,那么不得设置该属性。
mimeType 内容流的 MIME 介质类型。对于文档的主要内容,MIME 介质类型应与属性 cmis:contentStreamMimeType 的值相匹配。例如,application/pdf。
fileName 内容流的文件名。对于文档的主要内容,文件名应与属性 cmis:contentStreamFileName 的值相匹配。
内容 (content) 文档的值。其类型必须为 String Base64,并且它采用 UTF-8 进行编码。
可在脚本活动中使用以下示例代码段来获取和设置值:
// Script sample code to set and encode the document content
var value = "abc";
var bytesValue = new Packages.java.lang.String(value).getBytes("UTF-8");
var content64 = Packages.org.apache.commons.codec.binary.Base64.encodeBase64(bytesValue);
tw.local.contentStream = new tw.object.ECMContentStream();
tw.local.contentStream.contentLength = value.length;
tw.local.contentStream.mimeType = "text/plain";
tw.local.contentStream.content = new Packages.java.lang.String(content64, "UTF-8");

// Script sample code to get and decode the document content
var byteValue = Packages.java.lang.String(tw.local.contentStream.content).getBytes();
var content64 = Packages.org.apache.commons.codec.binary.Base64.decodeBase64(byteValue);
var value = new java.lang.String(content64, "UTF-8");