rephrase

概念的に、クラスタリングされた入力に対する「検索して置換」のようなものです。

説明

警告: 概念的には、rephrase ルールは「検索して置換」のようなものですが、実際にはテキストは変更されません。代わりに、クラスタリングに使用されるテキストの表現が変更されます。

検索ステップでは、この this 要素を HTML (タグ付き) 入力として扱い、相当するすべてのテキスト・シーケンスと突き合わせます、例えば、<rephrase this="rephrase" as="re-phrase" /> の場合、「rephrase」に加え、(選択したステマーに応じて)「rephrasing」なども変更されます。as は、オプションとして、抽象ステム・クラスにすることができます。

属性

  • async (ブール デフォルト: true) - 非同期処理。解析タグの場合、次の兄弟の前に要求をエンキューするのか (false)、処理するのか。 他の要素の場合、要素を処理する前に処理する必要がある非同期要求が含まれている場合にのみ、この属性は意味を持ちます。 その際、false の場合、要素の次の兄弟は、現行要素の後にのみ処理されます。true の場合、Watson™ Explorer は現行要素が処理されるのを待たずに、次の兄弟を処理します。
  • elt-id (整数) - 使用法: 内部
  • max-elt-id (整数) - 使用法: 内部
  • execute-acl (テキスト)
  • process (テキスト) - 処理される属性または子、あるいはその両方を決定する XPath。現在、「」、「*」、「@*」、および「*|@*」のみがサポートされます。
  • modified-date (整数)
  • stemmer (テキスト)
  • user (テキスト)
  • word-stem (テキスト)
  • as-stem
  • this-stem
  • this (rephrase ルールの this 部分および evoke の when 部分は、HTML テキストのように処理されます。また、以下のワイルドカード・パターンを含めることができます。%word%: 任意の単一の単語または数値。%num%: 任意の単一の数値。%punct%: サポートされる任意の句読点記号 (supported_punctuation を参照)。%tag%: 入力内の任意のタグ。%any%: 上記の任意のもの。%first%: 入力の先頭文字。%query%: ワイルドカードが一致したときに照会内に出現している任意の単語。「%n%」によって n 番目に一致したワイルドカードを使用して、結果ストリング (rephraseの as 、evoke の new) に入れることができます。 xs:string の制限形式) - 変更するテキスト (これは、HTML テキストとして解析されます)。 使用法: すべての子要素が処理された後に指定する必要があります
  • as (以下のタイプのいずれか: テキスト xs:string の制限形式: パターン #¥c+) - クラスタリング用にオリジナルの代わりに使用するテキスト。 使用法: すべての子要素が処理された後に指定する必要があります
  • weight (10 進数 デフォルト: 1) - すべての単語の重みをこの値で乗算します。
  • content (NMToken) - この名前のコンテンツにのみルールを適用します。
  • no-segment (以下のみが可能: no-segment) - この知識ベース内のすべてのルールのセグメンテーションを無効にします。 使用法: 後続のリリースで正式にサポートされる可能性がある実験的機能

入力例:

<rephrase this="freeware" as="free software"/>
<rephrase this="color" as="colour"/>
<rephrase this="ngo" as="non-governmental organization"/>
<rephrase this="config" as="configuration"/>

出力例:

<rephrase this="freeware" as="free software"/>
<rephrase this="color" as="colour"/>
<rephrase this="ngo" as="non-governmental organization"/>
<rephrase this="config" as="configuration"/>