Nodo Lista de archivos

Para leer texto de documentos sin estructura guardados en formatos como Microsoft Word, Microsoft Excel y Microsoft PowerPoint, así como Adobe PDF, XML, HTML, y otros, el nodo Lista de archivos puede utilizarse para generar una lista de documentos o carpetas como entrada al proceso de minería de textos. Esto es necesario porque los documentos de texto sin estructura no pueden ser representados por campos ni registros (filas y columnas) de la misma forma en que lo son otros datos utilizados por IBM® SPSS Modeler.

El nodo Lista de archivos funciona como un nodo de origen.

Puede encontrar este nodo en la pestaña IBM SPSS Modeler Text Analytics de la paleta de nodos, en la parte inferior de la ventana de IBM SPSS Modeler. Consulte Nodos de IBM SPSS Modeler Text Analytics para obtener más información.

Importante: No se admite ningún nombre de directorio ni de archivo que contenga caracteres no incluidos en la codificación local de la máquina. Al intentar ejecutar una ruta que contiene un nodo de lista de archivos, los nombres de archivo o directorio que contienen estos caracteres harán que la ejecución de la ruta falle. Esto se puede producir con nombres de directorio o nombres de archivo en un idioma extranjero como, por ejemplo, un nombre de archivo en alemán en un entorno local francés.

Soporte de datos locales. Si está conectado a un IBM SPSS Modeler Text Analytics Server remoto y tiene una ruta con un nodo de lista de archivos, los datos deberían residir en la misma máquina que el IBM SPSS Modeler Text Analytics Server – o debería asegurarse de que la máquina del servidor tiene acceso a la carpeta donde los datos de origen están almacenados en el nodo de lista de archivos.

Nota: No se puede utilizar el nodo Lista de archivos para la puntuación dentro de una configuración de IBM SPSS Collaboration and Deployment Services - Puntuación.