API NLP en tiempo real

La API de proceso de lenguaje natural (NLP) en tiempo real permite a los usuarios realizar análisis de texto ad-hoc en los documentos.

El análisis de texto en tiempo real utiliza los recursos de análisis de texto existentes definidos para una colección, pero analiza los documentos sin añadirlos al índice. Los usuarios pueden comprobar inmediatamente los resultados del análisis sin esperar a que se haya creado o actualizado el índice.

Requisitos

Se requiere la siguiente configuración del sistema para utilizar la API NLP en tiempo real:
  • NLP en tiempo real requiere una colección de análisis de contenido que aloja recursos de análisis de texto. La colección no debe estar habilitada para utilizar IBM® InfoSphere BigInsights.
  • Los administradores configuran la colección para el NLP en tiempo real configurando el árbol de facetas, los diccionarios y los patrones para la extracción de texto, tal como lo haría para las colecciones de análisis de contenido típicas. El resultado de NLP de tiempo real refleja la configuración de esa colección.
  • Las sesiones de análisis e índice para la colección deben estar en ejecución porque estas sesiones proporcionan el motor de proceso de documentos para la API NLP en tiempo real.
  • Las sesiones de búsqueda para la colección deben estar en ejecución porque estas sesiones sirven de pasarela para la API NLP en tiempo real.

Uso típico

En los siguientes pasos se muestra un resumen del flujo de trabajo típico para utilizar el NLP en tiempo real:
  • Un desarrollador de diccionarios crea una colección de Content Analytics con diccionarios para comprobar los resultados y utiliza la API NLP en tiempo real para examinar cómo los diccionarios adjuntan facetas para distintos documentos de entrada.
  • Un sistema de flujo de trabajo utiliza NLP en tiempo real para determinar cómo procesar documentos basándose en las facetas adjuntadas a los documentos.
  • Un sistema de alertas procesa constantemente documentos de entrada, tales como registros de chat o transferencias de noticias, y envía inmediatamente un correo electrónico a los gestores si una faceta concreta se ha adjuntado a un documento de entrada.

Una llamada de la API NLP en tiempo real podría requerir más tiempo si la llamada necesita inicializar un procesador de documentos. Los procesadores de documentos se inicializan cuando se inician los procesadores de documentos, análisis o índice, o se despliegan los recursos de análisis. Los procesadores de documentos también se inicializan después de cambiar la configuración de análisis e índice. Las solicitudes de API NLP en tiempo real y el proceso de documentos normal, como la compilación del índice, comparten los recursos de los procesadores de documentos. Por lo tanto, la creación del índice podría afectar al rendimiento del NLP en tiempo real. De forma parecida, las solicitudes de API NLP en tiempo real podrían afectar al rendimiento de la creación del índice.

Se proporcionan tanto las versiones de API SIAPI como REST de la API NLP en tiempo real. La API REST NLP acepta el contenido de texto y binario, pero la versión SIAPI solo acepta contenido en formato de texto.
Restricción: La versión SIAPI de la API NLP en tiempo real está en desuso y no estará soportada en releases futuros. Utilice la versión de la API REST en lugar de la versión de SIAPI para crear aplicaciones personalizadas.

La API NLP en tiempo real también está soportada con las colecciones de Enterprise Search para usuarios avanzados.

En el directorio ES_INSTALL_ROOT/docs/api/rest hay disponible información sobre la utilización de la API REST NLP. Para obtener más información sobre la versión SIAPI de la API NLP, consulte el programa de ejemplo ES_INSTALL_ROOT/samples/siapi/RealtimeNLPExample.java.