REGEXP_COUNT

REGEXP_COUNT 関数は、ストリングで正規表現パターンが一致した回数を戻します。

構文図を読む構文図をスキップする
>>-REGEXP_COUNT--(--source-string--,--pattern-expression-------->

>--+----------+--+----------+--)-------------------------------><
   '-,--start-'  '-,--flags-'      

source-string
その中で検索が行われるストリングを指定する式。 式は、組み込み文字ストリング、グラフィック・ストリング、数値、日時のいずれかのデータ・タイプの値を戻す必要があります。 値が UTF-16 DBCLOB ではない場合、正規表現パターンを検索する前に、暗黙的に UTF-16 DBCLOB にキャストされます。 FOR BIT DATA 属性の文字ストリングと、バイナリー・ストリングはサポートされません。 ストリングの長さが 1 GB を超えてはなりません。
pattern-expression
検索パターンの正規表現ストリングを指定する式。 式は、組み込み文字ストリング、グラフィック・ストリング、数値、日時のいずれかのデータ・タイプの値を戻す必要があります。 値が UTF-16 DBCLOB ではない場合、正規表現パターンを検索する前に、暗黙的に UTF-16 DBCLOB にキャストされます。 FOR BIT DATA 属性の文字ストリングと、バイナリー・ストリングはサポートされません。 ストリングの長さが 32K を超えてはなりません。

有効な pattern-expression は、検索のパターンを記述する文字および制御文字のセットで構成されます。 有効な制御文字の説明については、正規表現の制御文字 を参照してください。

start
検索が開始される source-string 内の位置を指定する式。 式は任意の組み込み数値、文字ストリング、またはグラフィック・ストリングのデータ・タイプの値を戻す必要があります。 引数は、関数を評価する前に INTEGER にキャストされます。INTEGER への変換について詳しくは、INTEGER または INTを参照してください。 整数の値は、1 以上でなければなりません。 整数の値が source-string の実際の長さより大きい場合、結果は 0 になります。
flags
パターン・マッチングの特性を制御するフラグを指定する式。式は、組み込み文字ストリングまたはグラフィック・ストリングのいずれかのデータ・タイプの値を戻す必要があります。FOR BIT DATA 属性の文字ストリングと、バイナリー・ストリングはサポートされません。 このストリングには、1 つ以上の有効なフラグ値を含めることができます。 フラグ値の組み合わせは有効でなければなりません。 空ストリングは、値「c」と同じです。

有効なフラグ文字の説明については、正規表現のフラグ値 を参照してください。

この関数の結果は、source-string での pattern-expression の出現回数を表す INTEGER になります。 pattern-expression が見つからず、どの引数も NULL でない場合、結果は 0 になります。

REGEXP_COUNT 関数の引数のいずれかが NULL になる可能性がある場合、結果も NULL になる可能性があります。引数のいずれかが NULL の場合、その結果は NULL 値です。

前提条件: REGEXP_COUNT 関数を使用するには、 International Components for Unicode (ICU) オプションがインストールされていなければなりません。

処理: 正規表現の処理は、 International Components for Unicode (ICU) 正規表現インターフェースを使用して行われます。 詳しくは、http://userguide.icu-project.org/strings/regexp を参照してください。

3 つの引数のみが指定された場合、 3 番目の引数は、start 引数または flags 引数の可能性があります。 3 番目の引数がストリングの場合は、flags 引数として解釈されます。 それ以外の場合は、start 引数として解釈されます。

代替構文: REGEXP_MATCH_COUNT は REGEXP_COUNT の同義語です。

  • ストリング「Steven Jones and Stephen Smith are the best players」での「Steven」または「Stephen」の出現回数を数えます。
    SELECT REGEXP_COUNT( 
      'Steven Jones and Stephen Smith are the best players',
      'Ste(v|ph)en')
    FROM sysibm.sysdummy1
    結果は 2 です。