IBM Spectrum Scale-Aktiv/Aktiv-Implementierung konfigurieren
Sie können eine primäre IBM Spectrum Scale-Instanz implementieren und eine implementierte IBM Spectrum Scale-Spiegel- und IBM Spectrum Scale-Tiebreakerinstanz zuordnen, um eine hoch verfügbare IBM Spectrum Scale-Aktiv/Aktiv-Konfiguration zu erstellen.
Informationen zu dieser Task
failureDetectionTime und leaseRecoveryWait ab und ob sich der primäre Server, der sekundäre Server, der Cluster-Manager oder der Dateisystemmanager auf der Seite befinden, die inaktiv wird. Das Zeitlimit kann einen Wert bis zu der Summe aus
failureDetectionTime + leaseRecoveryWait haben. Führen Sie diesen Befehl über die Befehlszeile von einem beliebigen IBM Spectrum Scale-Serverknoten aus, um die Werte für diese Parameter zu ermitteln:su - gpfsprod -c '/usr/lpp/mmfs/bin/mmlsconfig leaseRecoveryWait'
su - gpfsprod -c '/usr/lpp/mmfs/bin/mmlsconfig failureDetectionTime'Führen Sie die Operation Clusterstatus abrufen aus, um die Werte für diese Eigenschaften aufzulisten.leaseRecoveryWait und failureDetectionTime ist 10 Sekunden. Der Standardwert ist 35 Sekunden. Aktualisieren Sie diese Eigenschaften mit Bedacht, da niedrigere Werte zu Datenverlust führen können, wenn Knoten im Cluster inaktiv sind. Wenden Sie sich an das IBM Spectrum Scale-Service-Team und lesen Sie die Dokumentation zu IBM, um die Auswirkungen zu verstehen, bevor Sie diese Werte ändern.su - gpfsprod -c 'sudo /usr/lpp/mmfs/bin/mmchmgr -c nodeIP', d. h., nodeIP wird zum Cluster-Manager.
su - gpfsprod -c 'sudo /usr/lpp/mmfs/bin/mmchmgr fileSystemName nodeIP', d. h., nodeIP wird zum Manager von fileSystemName.
- Teil einer Aktiv/Aktiv-Konfiguration sein und synchrone IBM Spectrum Scale-Replikation mit einer aktiven Spiegelreplik verwenden, oder
- Teil einer Aktiv/Passiv-Replikation und Verwendung der Datenträgerreplikation mit einer passiven IBM Spectrum Scale -Seite, die für die Übernahme bereit ist
Die folgende Prozedur zeigt die allgemeinen Schritte, die Sie ausführen können, um eine Aktiv/Aktiv- IBM Spectrum Scale -Implementierung für Hochverfügbarkeit zu konfigurieren. In dieser Konfiguration wird eine primäre IBM Spectrum Scale -Instanz in einem Rack implementiert (dies wird als primäres Rackbezeichnet). Eine IBM Spectrum Scale -Spiegelinstanz und eine IBM Spectrum Scale -Tiebreakerinstanz werden jeweils in separaten Racks implementiert (als Spiegelrack und Tiebreakerrackbezeichnet), vorzugsweise an separaten Positionen. In der Regel wird dieser Konfigurationstyp nur für Standorte unterstützt, die weniger als 300 km voneinander entfernt liegen, um Latenzprobleme bei der Datenübertragung zu vermeiden.
Wenn Sie drei Systeme mit IBM Cloud Pak® -Produkten (entweder Cloud Pak- Software oder Cloud Pak System Software) in verschiedenen Rechenzentren oder in verschiedenen Zonen eines einzelnen Rechenzentrums installiert haben, müssen Sie diese drei IBM Spectrum Scale -Serverkonfigurationen jeweils in einem separaten System implementieren.
Wenn Sie zwei Systeme haben, auf denen IBM Cloud Pak -Produkte installiert sind, anstatt eine IBM Spectrum Scale -Tiebreakerkonfiguration zu implementieren, Sie können einen externen Tiebreakerknoten auf einem separaten System installieren und diesen separaten Knoten Ihrem IBM Spectrum Scale -Cluster zuordnen. Weitere Informationen zur Einrichtung dieses externen Tiebreakerknotens als Alternativlösung können Sie über die zugehörigen Links aufrufen.
Wenn Sie eine IBM Spectrum Scale -Tiebreakerkonfiguration implementieren und auf zwei Systeme beschränkt sind, auf denen IBM Cloud Pak -Produkte installiert sind, Sie können die IBM Spectrum Scale -Tiebreakerkonfiguration auf demselben System wie die primäre Konfiguration oder die Spiegelkonfiguration lokalisieren. Zur Sicherstellung höchster Verfügbarkeit ordnen Sie jede Konfiguration separaten Cloudgruppen zu, die die Rechenknoten nicht gemeinsam verwenden. Mit dieser Konfiguration befindet sich der Tiebreakerknoten nicht auf demselben Rechenknoten wie der primäre Knoten oder der Spiegelknoten und jeder Ausfall eines der beiden Rechenknoten kann nicht zu einem Ausfall von zwei IBM Spectrum Scale-Instanzen gleichzeitig führen.
Wenn die IBM Spectrum Scale -Tiebreakerkonfiguration auf demselben System wie die primäre Konfiguration oder die Spiegelkonfiguration lokalisiert wird und ein System mit IBM Cloud Pak -Produkten größer als das andere System ist, ist Folgendes zu beachten: Sie können die primäre Konfiguration und die Tiebreakerkonfiguration von IBM Spectrum Scale auf Ihrem größten System und die IBM Spectrum Scale -Spiegelkonfiguration auf dem kleineren System suchen.
Vorgehensweise
Ergebnisse
Mit dieser Prozedur werden die Spiegel- und Tiebreakerkonfigurationen der primären Konfiguration zugeordnet und die Aktiv/Aktiv-Umgebung wird erstellt.
Nächste Schritte
Falls noch nicht geschehen, können Sie eine Instanz des gemeinsam genutzten IBM® -Service für IBM Spectrum Scale implementieren und für die Verwendung Ihres neuen Clusters konfigurieren. Als Alternative zur Verwendung des gemeinsam genutzten Service IBM Spectrum Scaleab MusterIBM Spectrum Scale V1.2.5.0 Die Clients können die IBM Spectrum Scale -Serververbindungsinformationen direkt zur Implementierungszeit bereitstellen.
Implementieren Sie weitere Workloadmuster, die die Clientrichtlinie von IBM Spectrum Scale enthalten (oder alternativ die Scriptpakete von IBM Spectrum Scale Client ). Hiermit ist dann der Zugriff auf die Datenträger möglich, die von Ihrem IBM Spectrum Scale-Cluster zur Verfügung gestellt werden.
Je nach Art des Problems gibt es unterschiedliche Möglichkeiten, Failover-Situationen zu beheben. In der Regel sollten Sie bei Ausfällen der primären oder der Spiegelkonfiguration in der Lage sein, den IBM Spectrum Scale-Cluster wiederherzustellen. Wenn jedoch die primäre Konfiguration oder die Spiegelkonfiguration gemeinsam mit der Tiebreakerkonfiguration ausfällt, funktioniert der IBM Spectrum Scale-Cluster nicht mehr.
- Sie können die Operation Als einziges Rack festlegen in der verbleibenden primären oder Spiegelkonfiguration ausführen.
- Nachdem Sie das Problem in der fehlerhaften Konfiguration behoben haben, können Sie die Operation Als replizierten Cluster festlegen ausführen.
- Sie können die Operation Member entfernen in der verbleibenden Instanz ausführen und auf die fehlerhafte Instanz verweisen, um diese aus dem Cluster zu entfernen. Wenn beispielsweise die fehlgeschlagene Instanz eine Spiegelinstanz ist, führen Sie die Operation Member entfernen aus und wählen Sie anschließend die Option Spiegel aus. Wenn Sie die primäre Konfiguration entfernen müssen, führen Sie die Operation Member entfernen aus und wählen Sie anschließend die Option Primär aus. Warten Sie, bis die Ausführung der Operation erfolgreich abgeschlossen wurde. Führen Sie die Operation Clusterstatus abrufen aus, um sicherzustellen, dass die Knoten und Platten für die fehlgeschlagene Instanz nicht mehr Teil des Clusters sind.
- Wenn die im vorherigen Schritt entfernte Instanz noch aktiv ist, löschen Sie sie, um die zugeordneten Datenträger wiederverwenden zu können.
- Implementieren Sie eine neue Instanz mit demselben Typ wie die, die sie im vorherigen Schritt entfernt haben. Sofern möglich, ordnen Sie dieselben Datenträger zu, die von der gelöschten Instanz verwendet wurden. Wenn diese Datenträger nicht verfügbar sind, d. h., die Datenträger sind nicht in einwandfreiem Zustand oder Ihre neue Instanz wird in einer Cloudgruppe oder in einem anderen Rack als das der gelöschten Instanz implementiert, können Sie neue Datenträger verwenden.
- Fügen Sie die neue Instanz der verbleibenden primären bzw. der verbleibenden Spiegelinstanz hinzu, indem Sie die Operation Member hinzufügen verwenden.
- Wenn in der verbleibenden Instanz mehr als ein Dateisystem verfügbar ist, fügen Sie all diesen Dateisystemen in der neuen Implementierung Datenträger hinzu.Hinweis: Wenn Sie den Cluster mit neuen Knoten erweitern, werden Daten auf den primären Datenträgern beibehalten, wenn Sie der primären Instanz eine Spiegel-oder Tiebreakerinstanz zuordnen. Die Daten werden auch beibehalten, wenn Sie ein Member aus einem vorhandenen Cluster entfernen, sofern wenigstens eine der Instanzen (Spiegelinstanz oder primäre Instanz) aktiv ist. Es gibt keine Betriebsunterbrechungen bei vorhandenen Clients, wenn der Cluster erweitert wird. Es kann möglicherweise eine temporäre Betriebsunterbrechung auftreten, wenn ein Member aus dem Cluster entfernt wird, bis die Operation abgeschlossen ist.
Wenn die Server und Platten des Cluster-Members gestoppt werden (aus Wartungsgründen oder durch einen manuellen Eingriff), können Sie die Platten und Server in diesem Member erneut starten, indem Sie die Operation Getrennte Verbindung wiederherstellen ausführen.