文字列の処理

文字列に対しては、次のような操作を行うことができます。

  • 大文字または小文字への文字列の変換 — uppertolower(CHAR)
  • 文字列変数からの `ID_``$` などの指定された文字の削除 — stripchar(CHAR,STRING)
  • 文字列変数の長さ (文字数) の判別 — length(STRING)
  • 文字列値のアルファベット順のチェック — alphabefore(STRING1, STRING2)
  • 値からの先頭または末尾の空白文字の削除 — trim(STRING)trim_start(STRING)、または trimend(STRING)
  • 文字列からの最初または最後の n 文字の抽出 — startstring(LENGTH, STRING) または endstring(LENGTH, STRING)。例えば、製品名と 4 桁の ID コードを結合する (ACME CAMERA-D109) フィールド名 item があるとします。4 桁のコードのみを含む新規フィールドを作成するには、フィールド作成ノードで次の式を指定します。
    endstring(4, item)
  • 特定のパターンの一致 — STRING matches PATTERN。例えば、職名に「market」が付いている人を選択するには、条件抽出ノードで次のように指定します。
    job_title matches "*market*"
  • 文字列内のサブ文字列のすべてのインスタンスの置換 — replace(SUBSTRING, NEWSUBSTRING, STRING)。垂直線 ( | ) など、サポートされていない文字のすべてのインスタンスを、テキスト・マイニングを行う前にセミコロンと置き換えるには、置換ノードの replace 関数を使用します。「対象フィールド」 で、サポートされていない文字のあるすべてのフィールドを選択します。Replace: 条件の場合、「常時」 を選択し、「置換値」
     の下で以下の条件を指定します。replace('|',';',@FIELD)
  • 特定のサブ文字列の有無に基づいた、フラグ型フィールドの作成。例えば、それぞれの回答に次のような式を使用して個別のフラグ型フィールドを生成するために、フィールド作成ノードの文字列関数を使用できます。
hassubstring(museums,"museum_of_design")

詳しくは、文字列関数のトピックを参照してください。