Bearbeiten Sie Einstellungen in der Datei search-config.xml, um die Suche für Dateianhänge zu konfigurieren.
Vorbereitende Schritte
Um Konfigurationsdateien zu bearbeiten, müssen Sie den
wsadmin-Client von IBM®
WebSphere Application Server verwenden.
Weitere Informationen finden Sie im Abschnitt
wsadmin-Client starten.
Informationen zu diesem Vorgang
Die Suche stellt einen dedizierten Service zur Dokumentkonvertierung bereit. Wenn eine Dateiindexierungstask ausgeführt wird, lädt der Service zur Dokumentkonvertierung Dateien herunter,
wandelt sie in einfachen Text um und indexiert anschließend den Inhalt. Im Verlauf dieses
Prozesses wird der Inhalt von unterschiedlichen MIME-Typen indexiert: Eine Liste mit den durch die Suche unterstützten MIME-Typen
finden Sie unter Unterstützte MIME-Typen.Das
Verhalten des Dokumentkonvertierungsservice kann durch das Ändern verschiedener
Einstellungen modifiziert werden. Diese Einstellungen ermöglichen es Administratoren, den
Indexierungsprozess von Dateiinhalten zu steuern.
IBM Connections unterstützt die
Indexierung von Dateianhangsinhalten in den Anwendungen "Dateien", "Wikis", "Bibliothek" (Enterprise Content Manager-Dateien),
"Aktivitäten" und "Foren". Inhalt aus Dateianhängen in "Blogs" wird nicht durchsucht.
Achtung: Wenn die
Indexierung von Dateien aktiviert ist, wird der Inhalt von Dateien nicht beim ersten
Ausführen des Index indexiert. Der erste Index startet das Abrufen des Dateiinhalts. Das tatsächliche Indexieren des Inhalts wird
erst vorgenommen, wenn der Index zum zweiten Mal ausgeführt wird.
Vorgehensweise
Gehen Sie wie folgt vor, um die Einstellungen für die
Indexierung von Dateianhängen zu konfigurieren.
- Starten Sie den wsadmin-Client aus einem der folgenden Verzeichnisse in dem System, in dem Sie den Deployment Manager installiert haben:
Linux: app_server_root\profiles\dm_profile_root\bin
Windows:
app_server_root/profiles/dm_profile_root/bin
Dabei steht app_server_root für das
WebSphere Application
Server-Installationsverzeichnis und dm_profile_root
für das Deployment Manager-Profilverzeichnis; in der Regel handelt es sich dabei um
"dmgr01".
Sie müssen den Client von diesem Verzeichnis aus starten. Andernfalls werden die von Ihnen eingegebenen Befehle nicht ordnungsgemäß ausgeführt.
- Geben Sie nach der Initialisierung der wsadmin-Befehlsumgebung den folgenden
Befehl ein, um die Suchumgebung zu initialisieren und den
Such-Script-Interpreter zu starten:
execfile("searchAdmin.py")
Wenn Sie zur Angabe eines Services aufgefordert werden, zu dem eine Verbindung
hergestellt werden soll, geben Sie "1" ein, um den ersten Knoten in der Liste
auszuwählen. Die meisten Befehle können auf jedem beliebigen Knoten ausgeführt werden. Wenn der
Befehl Informationen über einen lokalen Dateipfad in eine Datei schreibt oder aus einer
Datei liest, müssen Sie den Knoten auswählen, auf dem die Datei gespeichert ist.
Bei
erfolgreichem Ausführen des Befehls wird die folgende Nachricht angezeigt:
Search Administration initialized
- Checken Sie die Konfigurationsdatei für die Suche auf Zellenebene (search-config.xml) mithilfe des
folgenden Befehls aus:
SearchCellConfig.checkOutConfig("working_dir",
"cellName")
Dabei gilt Folgendes:
Zum Beispiel:
SearchCellConfig.checkOutConfig("c:/search_temp", "SearchServerNode01Cell")
- Verwenden Sie die folgenden Befehle, um den Indexierungsprozess für Dateiinhalte zu
steuern:
- SearchCellConfig.enableAttachmentHandling()
Aktiviert die Indexierung von Dateianhängen in den Anwendungen "Dateien" und "Wikis".
Anmerkung: Wenn Sie die Bearbeitung von Dateianhängen bereits während des letzten Indexierens inaktiviert haben, müssen Sie den
Index erneut erstellen, nachdem die Bearbeitung von Anhängen aktiviert wurde. Andernfalls wird dieser Befehl nicht wirksam.
Dieser
Befehl erfordert keine Eingabeparameter.
- SearchCellConfig.disableAttachmentHandling()
Inaktiviert die Indexierung von Dateiinhalten in den Anwendungen "Dateien", "Wikis", "Bibliothek" (Enterprise Content
Manager-Dateien), "Aktivitäten" und "Foren".
Dieser
Befehl erfordert keine Eingabeparameter.
- SearchCellConfig.setMaximumAttachmentSize(int
maxAttachmentSize)
Legt den Grenzwert für die Größe von Dateien fest, die zur Indexierung heruntergeladen werden
können. Dateien, die die konfigurierte maximale Anhangsgröße überschreiten, werden nicht
heruntergeladen oder für die Inhaltsindexierung verarbeitet. Standardmäßig wird der Grenzwert auf 50 MB festgelegt, d. h., dass Dateien mit mehr als 50 MB nicht indexiert werden.
Dateien, deren Größe kleiner als die angegebene Größe ist, werden in ein temporäres Verzeichnis heruntergeladen, das sich im
Indexverzeichnis befindet, in dem Text aus diesen Dateien extrahiert wird. Der extrahierte Text wird anschließend indexiert.
Die verfügbare Größe des temporären Verzeichnisses
muss die maximale Dateigröße überschreiten, die zur Inhaltsindexierung zulässig ist.
Dieser Befehl akzeptiert ein
Argument:
- maxAttachmentSize. Die maximale Dateigröße in Byte des für die Indexierung
auswählbaren Dateianhangs. maxAttachmentSize ist ein ganzzahliger Wert.
Zum Beispiel:
SearchCellConfig.setMaximumAttachmentSize("52428800")
- SearchCellConfig.setMaximumConcurrentDownloads(int
maxConcurrentDownloads)
Legt die maximale Anzahl an Threads fest, die Dateien auf einen Suchserver herunterladen.
Dieser Befehl erfordert nur ein Argument, das die maximale Anzahl der Threads
angibt. Das Argument muss eine positive ganze Zahl sein, die größer als null ist. Der
Standardwert ist 3. Der Wert des Arguments "maxConcurrentDownloads" darf nicht größer als
die maximale Anzahl der Threads sein, die für die DefaultWorkManager-Ressourcen auf dem
Geltungsbereich des Suchservers festgelegt ist.
Vorsicht:
Wenn dieser Wert erhöht wird, wird die Last auf dem Dateien-Server erhöht.
Zum Beispiel:
SearchCellConfig.setMaximumConcurrentDownloads("10")
- SearchCellConfig.setMaximumTempDirSize(int maxTempDirSize)
Legt die maximale Größe eines temporären Verzeichnisses fest, das von einem Suchserver für den Dateikonvertierungsprozess
verwendet wird.
Dieser
Befehl erfordert nur ein Argument, das die maximale Größe in Byte angibt. Das Argument muss eine positive ganze Zahl sein, die größer als null ist. Der Standardwert
ist 100 MB.
Die Dateien werden in ein temporäres Verzeichnis heruntergeladen, das sich im Indexverzeichnis befindet. Die verfügbare Größe des temporären Verzeichnisses
muss die maximale Dateigröße überschreiten, die zur Inhaltsindexierung zulässig ist.
Zum Beispiel:
SearchCellConfig.setMaximumTempDirSize("51200")
- SearchCellConfig.setDownloadThrottle(long downloadThrottle)
Legt die Dauer der Pause zwischen den
aufeinanderfolgenden Dateidownloads in einem einzigen Thread zum Herunterladen von
Dateien fest.
Dieser Befehl erfordert nur ein Argument, das die Länge der
Downloadpause in Millisekunden angibt.
Für die Downloadpause ist in der Standardeinstellung der Wert 500 festgelegt.
Vorsicht:
Wenn dieser Wert erhöht wird, wird die Last auf dem Dateien-Server erhöht.
Zum Beispiel:
SearchCellConfig.setDownloadThrottle("500")
- Checken Sie die aktualisierte Konfigurationsdatei search-config.xml mithilfe des folgenden wsadmin-Clientbefehls ein:
SearchCellConfig.checkInConfig()
- Geben Sie an der Eingabeaufforderung exit ein, um den wsadmin-Client zu verlassen.
- Stoppen Sie die Server, die als Host für die Suchanwendung dienen, und starten Sie anschließend die Suchserver erneut. Beim nächsten Ausführen der geplanten Task werden als persistent definierte Basislisten nach Beenden der Indexierung beibehalten.