字符串的处理

有许多可用于字符串的操作。

  • 将字符串转换为大写或小写-uppertolower(CHAR)
  • 消除某个字符串变量中指定的字符(例如 `ID_``$`)- stripchar(CHAR,STRING)
  • 确定字符串变量的长度(字符数)- length(STRING).
  • 检查字符串值的字母顺序 - alphabefore(STRING1, STRING2)
  • 移除值中的前端或尾部空格 - trim(STRING)trim_start(STRING)trimend(STRING)
  • 从字符串中抽取开头或末尾的 n 个字符 - startstring(LENGTH, STRING)endstring(LENGTH, STRING)。 例如,假设您有一个名为的字段,该字段将产品名称与四位数的标识代码 (ACME CAMERA-D109) 组合在一起。要创建仅包含四位数代码的新字段,请在“派生”节点中指定以下公式:
    endstring(4, item)
  • 与特定模式匹配 - STRING matches PATTERN。例如,要选择职位中任何位置包含“市场”二字的人员,您可以在“选择”节点中指定以下内容:
    job_title matches "*market*"
  • 替换字符串replace(SUBSTRING, NEWSUBSTRING, STRING)中子串的所有实例。 例如,要在文本挖掘之前将不受支持的字符 (例如垂直管道 ( | )) 的所有实例替换为分号,请在 Filler 节点中使用 replace 函数。 在节点属性中的 填写字段 下,选择可能出现字符的所有字段。 对于 替换 条件,选择 始终,并在 替换为下指定以下条件。
    replace('|',';',@FIELD)
  • 根据特定子串的存在与否,导出标志字段。 例如,可以在“派生”节点中使用字符串函数,针对每个响应生成单独的标志字段,使用的表达式如下所示:
hassubstring(museums,"museum_of_design")

请参阅 字符串函数 以获取更多信息。