Crawlersuche im Hintergrund durchführen

Mithilfe eines SearchService-Befehls können Sie für die Basislisten der Anwendung "Suche" im Hintergrund eine Crawlersuche durchführen, ohne dabei einen Suchindex zu erstellen.

Vorbereitende Schritte

Informationen zum Starten des wsadmin-Befehlszeilentools finden Sie im Abschnitt wsadmin-Client starten.

Informationen zu diesem Vorgang

Mit dem Befehl "SearchService.startBackgroundCrawl" können Sie die Anwendungsbasislisten durchsuchen und diese Basislisten an einer angegebenen Position speichern. Sie können diesen Befehl verwenden, wenn Probleme bei der Crawlersuche auftreten und Sie prüfen möchten, ob die Crawlersuche erfolgreich abgeschlossen wird.

Vorgehensweise

Gehen Sie wie folgt vor, um für die Basislisten der Anwendung "Suche" im Hintergrund eine Crawlersuche durchzuführen:

  1. Starten Sie den wsadmin-Client aus einem der folgenden Verzeichnisse in dem System, in dem Sie den Deployment Manager installiert haben:

    Linux: app_server_root\profiles\dm_profile_root\bin

    Windows: app_server_root/profiles/dm_profile_root/bin

    Dabei steht app_server_root für das WebSphere Application Server-Installationsverzeichnis und dm_profile_root für das Deployment Manager-Profilverzeichnis; in der Regel handelt es sich dabei um "dmgr01".

    Sie müssen den Client von diesem Verzeichnis aus starten. Andernfalls werden die von Ihnen eingegebenen Befehle nicht ordnungsgemäß ausgeführt.

  2. Geben Sie nach der Initialisierung der wsadmin-Befehlsumgebung den folgenden Befehl ein, um die Suchumgebung zu initialisieren und den Such-Script-Interpreter zu starten:
    execfile("searchAdmin.py")
    Wenn Sie zur Angabe eines Services aufgefordert werden, zu dem eine Verbindung hergestellt werden soll, geben Sie "1" ein, um den ersten Knoten in der Liste auszuwählen. Die meisten Befehle können auf jedem beliebigen Knoten ausgeführt werden. Wenn der Befehl Informationen über einen lokalen Dateipfad in eine Datei schreibt oder aus einer Datei liest, müssen Sie den Knoten auswählen, auf dem die Datei gespeichert ist.
    Bei erfolgreichem Ausführen des Befehls wird die folgende Nachricht angezeigt:
    Search Administration initialized
  3. Geben Sie den folgenden Befehl ein:
    SearchService.startBackgroundCrawl(String persistenceLocation, String components)

    Durchsucht die Basislisten der angegebenen Anwendungen und speichert die Basislisten anschließend an der angegebenen Position. Dieser Befehl erstellt keinen Index.

    Der Befehl erfordert die folgenden Parameter:
    persistenceLocation
    Eine Zeichenfolge, die den Pfad angibt, unter dem die Basislisten gespeichert werden sollen.
    components
    Eine Zeichenfolge, die die Anwendungen angibt, deren Basislisten durchsucht werden sollen. Die folgenden Werte sind gültig:
    • activities
    • all_configured
    • blogs
    • calendar
    • communities
    • dogear
    • ecm_files
    • files
    • forums
    • people_finder
    • profiles
    • status_updates
    • wikis
    Verwenden Sie "all_configured", anstatt alle indexierbaren Services aufzulisten, wenn Sie alle Anwendungen durchsuchen möchten.
    Zum Beispiel:
    SearchService.startBackgroundCrawl("/opt/IBM/Connections/backgroundCrawl", "Aktivitäten, Foren, Communitys, Wikis")

Nächste Schritte

Führen Sie nach Abschluss der im Hintergrund durchgeführten Crawlersuche eine der folgenden Aktionen aus:
  • Extrahieren Sie Dateiinhalte. Weitere Informationen hierzu finden Sie unter Dateiinhalt extrahieren.
  • Erstellen Sie einen Hintergrundindex. Weitere Informationen hierzu finden Sie unter Hintergrundindex erstellen.
  • Erstellen Sie einen Vordergrundindex. Weitere Informationen hierzu finden Sie unter Suchindex erneut erstellen.

    Wenn Sie einen Vordergrundindex erstellen möchten, kopieren Sie die als persistent definierten Basislisten von der Persistenzposition, die Sie bei der Verwendung des Befehls "startBackgroundIndex" angegeben haben, in das durch "CRAWLER_PAGE_PERSISTENCE_DIR" angegebene Verzeichnis auf dem Knoten, auf dem die Indexierung ausgeführt wird.

    In einem System mit mehreren Knoten sollten Sie die Basislisten in das durch "CRAWLER_PAGE_PERSISTENCE_DIR" angegebene Verzeichnis auf allen Knoten kopieren. Alternativ können Sie für die Variable "CRAWLER_PAGE_PERSISTENCE_DIR" einen Netzspeicherort angeben und die als persistent definierten Basislisten von der angegebenen Persistenzposition an diese Position kopieren.