XML テキスト検索
XML テキスト検索では、XPath 言語のサブセットをテキスト検索用の拡張機能と共に使用することにより、XML 文書に索引付けをして検索することができます。そのようにすると、構造的エレメントは、個別に使用することも、照会内のフリー・テキストと結合することもできます。
構造的エレメントとは、タグ名、属性名、および属性値のことです。
以下のリストは、XML 検索の主要な機能について取り上げています。
- XML 構造的検索
- 特殊なあいまい条件を照会に含めることにより、XML 文書内で、構造的エレメント (タグ名、属性名、および属性値) を、およびそれらのエレメントによって範囲限定されるテキストを検索できます。
- XML 照会のトークン化
- XML 照会用語のフリー・テキストは、非 XML 照会用語のテキストがトークン化されるのと同じ方法でトークン化されます。ただし、ネストされたあいまい条件はサポートされません。同義語、ワイルドカード文字、句、および見出し語化はサポートされます。
- 数値
- 属性値を、数値、日付、日時のデータ・タイプと比較する述部はサポートされます。
- 完全一致
- 述部にストリング引数がある = (等号) 演算子は、ストリング内のすべてのトークンと、指定されたテキスト・スパン内のすべてのトークンとの完全一致を要求します。 順序は、重要ではありません。
- UIMA アクセス不可
- Unstructured Information Management Architecture (UIMA) は、XML 検索内でのトークン化に使用されますが、ユーザー作成のアノテーターはサポートされません。