Indexierungseinstellungen für Dateianhänge konfigurieren

Bearbeiten Sie Einstellungen in der Datei search-config.xml, um die Suche für Dateianhänge zu konfigurieren.

Vorbereitende Schritte

Um Konfigurationsdateien zu bearbeiten, müssen Sie den wsadmin-Client von IBM® WebSphere Application Server verwenden. Weitere Informationen finden Sie im Abschnitt wsadmin-Client starten.

Informationen zu diesem Vorgang

Die Suche stellt einen dedizierten Service zur Dokumentkonvertierung bereit. Wenn eine Dateiindexierungstask ausgeführt wird, lädt der Service zur Dokumentkonvertierung Dateien herunter, wandelt sie in einfachen Text um und indexiert anschließend den Inhalt. Im Verlauf dieses Prozesses wird der Inhalt von unterschiedlichen MIME-Typen indexiert: Eine Liste mit den durch die Suche unterstützten MIME-Typen finden Sie unter Unterstützte MIME-Typen.

Das Verhalten des Dokumentkonvertierungsservice kann durch das Ändern verschiedener Einstellungen modifiziert werden. Diese Einstellungen ermöglichen es Administratoren, den Indexierungsprozess von Dateiinhalten zu steuern.

IBM Connections unterstützt die Indexierung von Dateianhangsinhalten in den Anwendungen "Dateien", "Wikis", "Bibliothek" (Enterprise Content Manager-Dateien), "Aktivitäten" und "Foren". Inhalt aus Dateianhängen in "Blogs" wird nicht durchsucht.

Achtung: Wenn die Indexierung von Dateien aktiviert ist, wird der Inhalt von Dateien nicht beim ersten Ausführen des Index indexiert. Der erste Index startet das Abrufen des Dateiinhalts. Das tatsächliche Indexieren des Inhalts wird erst vorgenommen, wenn der Index zum zweiten Mal ausgeführt wird.

Vorgehensweise

Gehen Sie wie folgt vor, um die Einstellungen für die Indexierung von Dateianhängen zu konfigurieren.

  1. Starten Sie den wsadmin-Client aus einem der folgenden Verzeichnisse in dem System, in dem Sie den Deployment Manager installiert haben:

    Linux: app_server_root\profiles\dm_profile_root\bin

    Windows: app_server_root/profiles/dm_profile_root/bin

    Dabei steht app_server_root für das WebSphere Application Server-Installationsverzeichnis und dm_profile_root für das Deployment Manager-Profilverzeichnis; in der Regel handelt es sich dabei um "dmgr01".

    Sie müssen den Client von diesem Verzeichnis aus starten. Andernfalls werden die von Ihnen eingegebenen Befehle nicht ordnungsgemäß ausgeführt.

  2. Geben Sie nach der Initialisierung der wsadmin-Befehlsumgebung den folgenden Befehl ein, um die Suchumgebung zu initialisieren und den Such-Script-Interpreter zu starten:
    execfile("searchAdmin.py")
    Wenn Sie zur Angabe eines Services aufgefordert werden, zu dem eine Verbindung hergestellt werden soll, geben Sie "1" ein, um den ersten Knoten in der Liste auszuwählen. Die meisten Befehle können auf jedem beliebigen Knoten ausgeführt werden. Wenn der Befehl Informationen über einen lokalen Dateipfad in eine Datei schreibt oder aus einer Datei liest, müssen Sie den Knoten auswählen, auf dem die Datei gespeichert ist.
    Bei erfolgreichem Ausführen des Befehls wird die folgende Nachricht angezeigt:
    Search Administration initialized
  3. Checken Sie die Konfigurationsdatei für die Suche auf Zellenebene (search-config.xml) mithilfe des folgenden Befehls aus:

    SearchCellConfig.checkOutConfig("working_dir", "cellName")

    Dabei gilt Folgendes:
    • working_dir ist das temporäre Verzeichnis, in das Sie die Konfigurationsdatei auf Zellenebene auschecken möchten. Dieses Verzeichnis muss auf dem Server, auf dem Sie den wsadmin-Client ausführen, vorhanden sein. Verwenden Sie normale Schrägstriche, um Verzeichnisse im Dateipfad zu trennen, auch wenn Sie das Microsoft Windows-Betriebssystem verwenden.
      Anmerkung: Nur AIX und Linux: Das Verzeichnis muss Schreibberechtigungen erteilen. Andernfalls wird der Befehl nicht erfolgreich ausgeführt.
    • cellName ist der Name der Zelle, zu der der Suchknoten gehört. Bei diesem Befehl müssen Sie die Groß-/Kleinschreibung beachten. Wenn Ihnen der Zellenname nicht bekannt ist, geben Sie den folgenden Befehl im wsadmin-Befehlsprozessor ein, um ihn zu bestimmen.

      print AdminControl.getCell()

    Zum Beispiel:
    SearchCellConfig.checkOutConfig("c:/search_temp", "SearchServerNode01Cell")
  4. Verwenden Sie die folgenden Befehle, um den Indexierungsprozess für Dateiinhalte zu steuern:
    SearchCellConfig.enableAttachmentHandling()

    Aktiviert die Indexierung von Dateianhängen in den Anwendungen "Dateien" und "Wikis".

    Anmerkung: Wenn Sie die Bearbeitung von Dateianhängen bereits während des letzten Indexierens inaktiviert haben, müssen Sie den Index erneut erstellen, nachdem die Bearbeitung von Anhängen aktiviert wurde. Andernfalls wird dieser Befehl nicht wirksam.

    Dieser Befehl erfordert keine Eingabeparameter.

    SearchCellConfig.disableAttachmentHandling()

    Inaktiviert die Indexierung von Dateiinhalten in den Anwendungen "Dateien", "Wikis", "Bibliothek" (Enterprise Content Manager-Dateien), "Aktivitäten" und "Foren".

    Dieser Befehl erfordert keine Eingabeparameter.

    SearchCellConfig.setMaximumAttachmentSize(int maxAttachmentSize)

    Legt den Grenzwert für die Größe von Dateien fest, die zur Indexierung heruntergeladen werden können. Dateien, die die konfigurierte maximale Anhangsgröße überschreiten, werden nicht heruntergeladen oder für die Inhaltsindexierung verarbeitet. Standardmäßig wird der Grenzwert auf 50 MB festgelegt, d. h., dass Dateien mit mehr als 50 MB nicht indexiert werden.

    Dateien, deren Größe kleiner als die angegebene Größe ist, werden in ein temporäres Verzeichnis heruntergeladen, das sich im Indexverzeichnis befindet, in dem Text aus diesen Dateien extrahiert wird. Der extrahierte Text wird anschließend indexiert. Die verfügbare Größe des temporären Verzeichnisses muss die maximale Dateigröße überschreiten, die zur Inhaltsindexierung zulässig ist.

    Dieser Befehl akzeptiert ein Argument:
    • maxAttachmentSize. Die maximale Dateigröße in Byte des für die Indexierung auswählbaren Dateianhangs. maxAttachmentSize ist ein ganzzahliger Wert.
    Zum Beispiel:
    SearchCellConfig.setMaximumAttachmentSize("52428800")
    SearchCellConfig.setMaximumConcurrentDownloads(int maxConcurrentDownloads)

    Legt die maximale Anzahl an Threads fest, die Dateien auf einen Suchserver herunterladen.

    Dieser Befehl erfordert nur ein Argument, das die maximale Anzahl der Threads angibt. Das Argument muss eine positive ganze Zahl sein, die größer als null ist. Der Standardwert ist 3. Der Wert des Arguments "maxConcurrentDownloads" darf nicht größer als die maximale Anzahl der Threads sein, die für die DefaultWorkManager-Ressourcen auf dem Geltungsbereich des Suchservers festgelegt ist.
    Vorsicht:
    Wenn dieser Wert erhöht wird, wird die Last auf dem Dateien-Server erhöht.
    Zum Beispiel:
    SearchCellConfig.setMaximumConcurrentDownloads("10")
    SearchCellConfig.setMaximumTempDirSize(int maxTempDirSize)

    Legt die maximale Größe eines temporären Verzeichnisses fest, das von einem Suchserver für den Dateikonvertierungsprozess verwendet wird.

    Dieser Befehl erfordert nur ein Argument, das die maximale Größe in Byte angibt. Das Argument muss eine positive ganze Zahl sein, die größer als null ist. Der Standardwert ist 100 MB.

    Die Dateien werden in ein temporäres Verzeichnis heruntergeladen, das sich im Indexverzeichnis befindet. Die verfügbare Größe des temporären Verzeichnisses muss die maximale Dateigröße überschreiten, die zur Inhaltsindexierung zulässig ist.

    Zum Beispiel:
    SearchCellConfig.setMaximumTempDirSize("51200")
    SearchCellConfig.setDownloadThrottle(long downloadThrottle)

    Legt die Dauer der Pause zwischen den aufeinanderfolgenden Dateidownloads in einem einzigen Thread zum Herunterladen von Dateien fest.

    Dieser Befehl erfordert nur ein Argument, das die Länge der Downloadpause in Millisekunden angibt. Für die Downloadpause ist in der Standardeinstellung der Wert 500 festgelegt.
    Vorsicht:
    Wenn dieser Wert erhöht wird, wird die Last auf dem Dateien-Server erhöht.
    Zum Beispiel:
    SearchCellConfig.setDownloadThrottle("500")
  5. Checken Sie die aktualisierte Konfigurationsdatei search-config.xml mithilfe des folgenden wsadmin-Clientbefehls ein:

    SearchCellConfig.checkInConfig()

  6. Geben Sie an der Eingabeaufforderung exit ein, um den wsadmin-Client zu verlassen.
  7. Stoppen Sie die Server, die als Host für die Suchanwendung dienen, und starten Sie anschließend die Suchserver erneut. Beim nächsten Ausführen der geplanten Task werden als persistent definierte Basislisten nach Beenden der Indexierung beibehalten.