字符串的处理

有很多可用于字符串的运算,包括:

  • 将字符串转换为大写或小写 - uppertolower(CHAR)
  • 消除某个字符串变量中指定的字符(例如 `ID_``$`)- stripchar(CHAR,STRING)
  • 确定字符串变量的长度(字符的数量)- length(STRING)
  • 检查字符串值的字母顺序 - alphabefore(STRING1, STRING2)
  • 移除值中的前端或尾部空格 - trim(STRING)trim_start(STRING)trimend(STRING)
  • 从字符串中抽取开头或末尾的 n 个字符 - startstring(LENGTH, STRING)endstring(LENGTH, STRING)。例如,假设有名为 item 的字段,它将产品名称与 4 位的标识代码组合在一起(如 ACME CAMERA-D109)。要创建仅含 4 位代码的新字段,请在“派生”节点中指定以下公式:
    endstring(4, item)
  • 匹配特定的模式 - STRING matches PATTERN。例如,要选择职位中任意子串与“market”匹配的人员,可以在“选择”节点中指定以下内容:
    job_title matches "*market*"
  • 替换字符串中某个子串的所有实例 - replace(SUBSTRING, NEWSUBSTRING, STRING)。例如,要在执行文本挖掘之前,以分号替换不受支持的字符(如竖线 (|))的所有实例,请在“填充”节点中使用 replace 函数。在填入字段:下,选中可能出现该字符的所有字段。对于替换:条件,请选择始终,并在替换为:中指定以下条件:
    replace('|',';',@FIELD)
  • 根据特定子串的存在与否,导出标志字段。例如,可以在“派生”节点中使用字符串函数,针对每个响应生成单独的标志字段,使用的表达式如下所示:
hassubstring(museums,"museum_of_design")

有关更多信息,请参阅字符串函数主题。