add-content

正規表現パーサーで、含まれている state/match に入るときに content 要素を XML 出力に追加します。

説明

content 要素の値は、以下の順序で決定されます。

  • サブノードがある場合はそのテキスト値
  • 現在の「アクティブな」ストリング

属性

  • async (ブール デフォルト: true) - 非同期処理。解析タグの場合、次の兄弟の前に要求をエンキューするのか (false)、処理するのか。 他の要素の場合、要素を処理する前に処理する必要がある非同期要求が含まれている場合にのみ、この属性は意味を持ちます。 その際、false の場合、要素の次の兄弟は、現行要素の後にのみ処理されます。true の場合、Watson™ Explorer は現行要素が処理されるのを待たずに、次の兄弟を処理します。
  • elt-id (整数) - 使用法: 内部
  • max-elt-id (整数) - 使用法: 内部
  • execute-acl (テキスト)
  • process (テキスト) - 処理される属性または子、あるいはその両方を決定する XPath。現在、「」、「*」、「@*」、および「*|@*」のみがサポートされます。
  • name (テキスト) - コンテンツの名前 (匿名コンテンツの場合、未指定にすることができます)。
  • count (整数) - コンテンツの出現回数 (メタデータで使用されます)。
  • type (以下のいずれか: html、text 非推奨値: title、snippet、token デフォルト: html) - コンテンツのタイプ (結果として、適用されるトークン化) を指定します。
    • html: HTML (タグ付き) テキスト。
    • text: プレーン・テキスト。
    • token: 単一トークンとして扱う必要があるプレーン・テキスト。例えば、ソース名など。これにより、「#」が前に付加されたコンテンツのフルテキストであるトークンが生成されます。コンテンツの最大長は 499 バイトです。499 バイトを超えるデータは切り捨てられます。
    使用法: すべての子要素が処理された後に指定する必要があります
  • action (以下のいずれか: none、cluster、discard、index-only 非推奨値: cluster-bold、cluster-summarize デフォルト: cluster) - このコンテンツの処理動作を設定します。
    • none: 単に出力にコピーします
    • cluster: コンテンツをクラスタリングしてから出力にコピーします
    • cluster-bold: 代わりに、action="cluster" output-action="bold" を使用してください。
    • cluster-summarize: 代わりに、action="cluster" output-action="summarize" を使用してください。
    • discard: これは、処理時に単に除去する必要がある生成コンテンツでした。
    • index-only: index-only のマークが付けられたコンテンツは、文書が照会に一致するかどうかを判別するためにのみ使用され、結果では返されません。コンテンツのテキストは索引に保管されないため、索引で必要なスペースが削減されます。このようなコンテンツは、高速索引付けでは使用できません。負の重みとともに指定された場合、または属性 indexed が false に設定されている場合、データは索引付け時に破棄されます。
  • output-action (以下のいずれか: bold、bold-preserve-tags、summarize、summarize-discard、discard、subsearch、none) - このコンテンツの出力動作を設定します。
    • bold: このコンテンツを HTML に変換し、太字化アルゴリズムを適用して、照会語またはそのツリー・ラベル、あるいはその両方を太字化します。コンテンツが HTML の場合、太字化時にすべてのタグが除去されます。
    • bold-preserve-tags: このコンテンツを HTML に変換し、太字化アルゴリズムを適用して、照会語またはそのツリー・ラベル、あるいはその両方を太字化します。コンテンツが HTML の場合、太字化時にコンテンツのすべてのタグが保持されます。
    • summarize: スニペット・コンテンツで要約および太字化します。
    • summarize-discard: スニペット・コンテンツで要約および太字化します。
    • discard: 可能な場合、出力から削除します。
    • subsearch: コンテンツの複製バージョンが、同じファイルに対して複数のサブ検索を可能にするために保存されます。
    • none: このコンテンツが表示されないように、デフォルト・レンダリングによって使用されます。
    使用法: この機能は非推奨です
  • weight (10 進数 デフォルト: 1) - このコンテンツの重みの乗数。action が none の場合、クラスタリング時に暗黙的に 0 に設定されます。この場合でも、検索およびスコアリング時には、デフォルトの重みの 1 が使用されます。
  • indexed (ブール デフォルト: true) - true に設定した場合、データは索引に保管され、全文検索で使用可能になります (重みが負の場合は除く)。false に設定した場合、テキストは索引に保管されますが、全文検索では使用不可になります。 false に設定し、action が index-only に設定されている場合、データは完全に破棄されます。使用法: 検索エンジン・モジュール専用
  • matches (テキスト) - このコンテンツ内で太字化する必要がある文字範囲 (0 ベース) を示すペア「開始-終了」のスペース区切りのリスト。このデータは、search-engine に太字化照会が渡されたときに生成されます。使用法: 検索エンジン・モジュール専用
  • max-size (テキスト) - このコンテンツで索引付けする最大バイト数。
  • add-to (xs:string の制限形式: パターン [^"]+) - このコンテンツを追加する文書の ID。 使用法: 検索エンジン・モジュール専用
  • acl (テキスト) - このコンテンツに適用する ACL。 使用法: 検索エンジン・モジュール専用
  • vse-had-acl (テキスト) - 取得時に使用可能になる ACL とともにコンテンツが索引付けされたことを示します。この属性はユーザーが設定してはならず、ユーザーに表示されることもありません。使用法: 検索エンジン・モジュール専用。内部
  • vse-add-to-normalized (以下のみが可能: vse-add-to-normalized) - 検索エンジンで、この属性を使用して、add-to が既に絶対 URL であり、正規化してはならないというマークを付けます。この属性が指定されていない場合、add-to は相対 URL として扱われ、クロールされた URL を基準として正規化されます。使用法: 検索エンジン・モジュール専用
  • vse-add-to-check (以下のみが可能: crawlable) - この属性は、検索エンジンの場合にのみ意味を持ちます。検索エンジンで、この属性を設定すると、インデクサーは、キーが現行構成でクロール可能な URL である場合にのみこのコンテンツを索引付けするようになります。使用法: 検索エンジン・モジュール専用。後続のリリースで正式にサポートされる可能性がある実験的機能
  • la-score-multiplier (10 進数) - search-engine で文書を索引付けする際における、生成された la-score に対する乗数を指定します。他のコンテキストで指定された場合、効果はありません。使用法: 検索エンジン・モジュール専用
  • u (整数) - 検索エンジンによって報告されます。これは、索引付けされた文書内におけるこのコンテンツの相対開始オフセットです。 使用法: 検索エンジン・モジュール専用
  • fast-index (以下のいずれか: number、double、float、int、date、set、checked-number、checked-double、checked-float、checked-int、checked-date、checked-set) - 指定した場合、search-engine は、指定されたタイプを使用してこのコンテンツを高速索引付けします (search-engine の高速索引構成を参照してください)。fast-index のタイプと同時に action に index-only を指定するのは無効です。使用法: 検索エンジン・モジュール専用
  • indexed-fast-index (以下のいずれか: number、double、float、int、date、set、checked-number、checked-double、checked-float、checked-int、checked-date、checked-set) - このコンテンツを高速索引に追加し、さらに追加の従来型の索引トークンを生成して、高速索引/ビン分割条件の高速アプリケーションを可能にします。fast-index のタイプと indexed-fast-index のタイプの両方が指定された場合、indexed-fast-index のタイプが優先されます。使用法: 検索エンジン・モジュール専用
  • fast-index-base (整数 デフォルト: 10) - 使用法: 検索エンジン・モジュール専用
  • fast-index-min-exponent (整数 デフォルト: 10) - 使用法: 検索エンジン・モジュール専用
  • to (結果の XML 要素を追加する場所。以下のいずれか: document、scope デフォルト: document)
  • no-merge (以下のみが可能: no-merge) -
    • no-merge: このコンテンツを、同じ属性を共有する前のコンテンツとマージしません。