Gestión del almacén de documentos
Puede gestionar el almacén de documentos para gestionar todos los archivos de entrada y salida, incluidos las entradas de datos masivas, los scripts, los informes y las especificaciones.
- archives
- public_html
- eventprocessor
- schedule_logs
- feed_files
- scripts
- FTP
- tmp
- params
- users
<mnt doc_path="/public_html/" real_path="$supplier_base_dir/" inbound="yes"/>
<mnt doc_path="/ftp/" real_path="$supplier_ftp_dir/" inbound="yes"/>
- Detalles del archivo
- Información del registro de auditoría sobre quién tiene acceso al archivo y cuándo han accedido a él
Puede utilizar el almacén de documentos como motor de copia de seguridad porque cada archivo que pasa por el sistema se copia y se almacena en el almacén de datos.
- Controlar el acceso a los archivos
- Comprimir el tamaño de los archivos
- Suprimir archivos
- Desfragmentar el almacén de documentos
La arquitectura de la base de datos del almacén de documentos incluye espacios de tabla diseñados para todos los archivos almacenados en dicho almacén de documentos. Cuando se almacena un archivo en el almacén de documentos, se crea un registro nuevo en la base de datos. La base de datos almacena el archivo como un archivo BLOB (gran objeto binario). Un archivo BLOB se refiere a grandes bloques aleatorios de bits de memoria que están almacenados en una base de datos y se utilizan para ocultar información específica acerca de un archivo. La información está oculta porque un BLOB es un objeto que no se puede interpretar como un tipo de objeto específico desde dentro de la base de datos, por lo que cada objeto se ve como un archivo BLOB sin distintivo. La base de datos almacena los archivos BLOB dentro de uno de los espacios de tabla de la base de datos. La ventaja de utilizar archivos BLOB y espacios de tabla consiste en que la base de datos puede proteger los datos de la tabla utilizando mecanismos de servidor de base de datos, incluidos mecanismos de copia de seguridad y recuperación, y seguridad.
Si utiliza dos instancias del servidor de aplicaciones y comparte la base de datos, es posible que algunos documentos hayan desaparecido. Cuando se cargan documentos a través del portal a la carpeta public_html, los documentos parecen haber desaparecido del almacén de documentos. En los archivos de registro de ambos servidores de aplicaciones podrá ver que los archivos se suprimen. El gestor de montaje de cada instancia sondea y sincroniza periódicamente la base de datos con su sistema de archivos. Cuando el gestor de montaje de la segunda instancia sincroniza la base de datos con su sistema de archivos, elimina la entrada del almacén de documentos añadida por la primera instancia, puesto que el archivo no existe en su sistema de archivos.
La solución a este problema es un montaje NFS compartido. El archivo $TOP/public_html debe estar compartido con NFS para que el clúster funcione. El archivo docstore_mount.xml contiene la configuración del gestor de montaje. El atributo inbound de este archivo de configuración debe tener el valor "yes" para que el proceso de sincronización se lleve a cabo.
La gestión del espacio de tabla es una tarea continua. El tamaño de la tabla de almacenamiento de documentos crece y disminuye según el uso. Debe asegurarse de que se utilice el espacio en disco de forma eficiente y de que haya espacio en disco disponible para dar soporte a los grandes archivos binarios sin interrupciones.
Para mantener el rendimiento del almacén de documentos, debe desfragmentar regularmente los archivos. La desfragmentación agrupa todos los archivos que hay en el almacén de documentos en un clúster continuo y mejora el tiempo de duración de la importación de archivos.