Cómo un modelo de documento describe documentos estructurados

Los documentos en formato HTML o XML son ejemplos de documentos estructurados; contienen etiquetas que identifican campos de texto y atributos de documento. Los campos de texto pueden contener información como el título, el autor o una descripción del documento.

Los siguiente es un extracto de un documento estructurado de texto plano. Contiene texto que está delimitado por etiquetas de tipo HTML.

[head]Handling structured documents
[/head]

[abstract]This document describes the concept of structured documents
and the use of document models to...
[/abstract]
:
:

Cuando Net Search Extender indexa documentos estructurados, tiene que reconocer la estructura para que pueda indexar el campo de texto y los atributos, y almacenarlos junto con un nombre exclusivo. Esto permite a Net Search Extender buscar de forma selectiva en un campo de texto determinado o buscar documentos que tienen un atributo determinado utilizando la cláusula SECTION o ATTRIBUTE.

Para que Net Search Extender pueda comprender la estructura de un determinado formato de documento, debe pasar a Net Search Extender una definición de la estructura en un modelo de documento. De forma alternativa, puede utilizar los modelos de documento predeterminados proporcionados por Net Search Extender.

Especifique el nombre del modelo de documento como argumento cuando llame al mandato CREATE INDEX para indexar los documentos. Por ejemplo: CREATE INDEX i1 FOR TEXT ON t1(c2) DOCUMENT MODEL GPPModel IN mymodel.xld CONNECT TO db

El parámetro GPPModel representa el tipo de modelo de documento que está utilizando.

Para indexar documentos utilizando un modelo de documento, primero debe definir un modelo de documento y luego hacer que el índice reconozca el modelo de documento.

Nota: Si los documentos XML utilizan índices que no están bien formados, el proceso de indexación se detendrá en el punto en el que se encuentre el problema en el documento. Esto significa que sólo se indexará una parte del documento. Si no corrige el documento, sólo podrá realizar búsquedas en las partes del documento que se hayan indexado. Esto sólo ocurrirá si el tipo de columna de tabla no es XML.