Nodo Lista de archivos
Para leer texto de documentos sin estructura guardados en formatos como Microsoft Word, Microsoft Excel y Microsoft PowerPoint, así como Adobe PDF, XML, HTML, y otros, el nodo Lista de archivos puede utilizarse para generar una lista de documentos o carpetas como entrada al proceso de minería de textos. Esto es necesario porque los documentos de texto sin estructura no pueden ser representados por campos ni registros (filas y columnas) de la misma forma en que lo son otros datos utilizados por IBM® SPSS Modeler.
El nodo Lista de archivos funciona como un nodo de origen.
Puede encontrar este nodo en la pestaña IBM SPSS Modeler Text Analytics de la paleta de nodos, en la parte inferior de la ventana de IBM SPSS Modeler. Consulte Nodos de IBM SPSS Modeler Text Analytics para obtener más información.
Soporte de datos locales. Si está conectado a un IBM SPSS Modeler Text Analytics Server remoto y tiene una ruta con un nodo de lista de archivos, los datos deberían residir en la misma máquina que el IBM SPSS Modeler Text Analytics Server – o debería asegurarse de que la máquina del servidor tiene acceso a la carpeta donde los datos de origen están almacenados en el nodo de lista de archivos.