![[UNIX, Linux, Windows, IBM i]](ngmulti.gif)
Änderungen an der Fehlerbehebung für Cluster auf Servern auf Multiplatforms
Der Warteschlangenmanager führt Operationen, die Probleme verursacht haben, erneut aus, bis die Probleme behoben sind. Wenn die Probleme nach fünf Tagen nicht gelöst sind, schaltet sich der Warteschlangenmanager ab, um zu verhindern, dass der Cache noch mehr veraltet.
Der Warteschlangenmanager führt Operationen, die Probleme verursacht haben, erneut aus, bis die Probleme behoben sind. Wenn die Probleme nach fünf Tagen nicht gelöst sind, schaltet sich der Warteschlangenmanager ab, um zu verhindern, dass der Cache noch mehr veraltet. Je mehr der Cache veraltet, desto mehr Probleme treten auf.
Jeder Aspekt der Clusterverwaltung wird für einen Warteschlangenmanager durch den lokalen Repository-Manager-Prozess amqrrmfa behandelt. Der Prozess wird auf allen Warteschlangenmanagern ausgeführt, selbst wenn keine Clusterdefinitionen vorhanden sind.
IBM® MQ, anstatt den Repository-Manager zu stoppen und ohne ihn weiter zu fahren, führt der Repository-Manager fehlgeschlagene Operationen erneut aus. Wenn der Warteschlangenmanager ein Problem mit dem Repository-Manager feststellt, kann er auf zwei Arten vorgehen.
- Wenn der Fehler die Operation des Warteschlangenmanagers nicht beeinträchtigt, schreibt dieser eine Nachricht in das Fehlerprotokoll. Die fehlgeschlagene Operation wird alle 10 Minuten ausgeführt, bis sie erfolgreich ist. Standardmäßig muss der Fehler innerhalb von fünf Tagen behoben sein; gelingt dies nicht, schreibt der Warteschlangenmanager eine Nachricht in das Fehlerprotokoll und wird beendet. Die Beendigung nach fünf Tagen kann zurückgestellt werden.
- Wenn die Operation des Warteschlangenmanagers durch den Fehler beeinträchtigt wird, schreibt dieser eine Nachricht in das Fehlerprotokoll und wird sofort beendet.
Ein Fehler, der die Operation des Warteschlangenmanagers beeinträchtigt, kann vom Warteschlangenmanager nicht diagnostiziert werden oder hat möglicherweise nicht vorhersehbare Folgen. Dieser Fehlertyp führt häufig dazu, dass der Warteschlangenmanager eine FFST -Datei schreibt. Fehler, die den Betrieb des Warteschlangenmanagers beeinträchtigen, können durch einen Programmfehler in IBM MQ, durch einen Administrator oder durch ein Programm verursacht werden, wodurch unerwartete Aktionen wie das Beenden eines IBM MQ -Prozesses ausgeführt werden.
Durch die Änderung des Verhaltens bei der Fehlerbehebung soll die Zeit beschränkt werden, während der der Warteschlangenmanager weiterhin mit einer zunehmenden Anzahl inkonsistenter Clusterdefinitionen ausgeführt wird. Da die Anzahl der Inkonsistenzen in Clusterdefinitionen zunimmt, nimmt auch die Wahrscheinlichkeit eines unnormalen Anwendungsverhaltens zu.
Die Standardauswahl, den Warteschlangenmanager nach fünf Tagen zu beenden, ist ein Kompromiss zwischen dem Begrenzen der Anzahl an Inkonsistenzen und dem Verfügbarmachen des Warteschlangenmanagers, bis die Probleme ermittelt und behoben sind.
Sie können die Dauer, bis der Warteschlangenmanager beendet wird, unbegrenzt erweitern und zwischenzeitlich das Problem beheben oder auf das geplante Beenden des Warteschlangenmanagers warten. Die Wartedauer von fünf Tagen ermöglicht es, dass der Warteschlangenmanager über ein langes Wochenende ausgeführt wird und Sie die Möglichkeit haben, auf Probleme zu reagieren oder die Zeitspanne zu verlängern, bevor der Warteschlangenmanager erneut gestartet wird.
Korrekturmaßnahmen
Sie haben verschiedene Möglichkeiten, um Probleme in Clustern zu beheben. Die erste Möglichkeit besteht darin, das Problem zu überwachen und zu beheben und die zweite Möglichkeit, das Problem zu überwachen und zu verschieben.
- Überwachen Sie das Fehlerprotokoll des Warteschlangenmanagers auf die Fehlernachrichten AMQ9448 und AMQ5008und beheben Sie das Problem.
- AMQ9448 gibt an, dass der Repository-Manager nach der Ausführung eines Befehls einen Fehler zurückgegeben hat. Dieser Fehler markiert den Anfang des Versuchs, den Befehl alle 10 Minuten erneut auszuführen und den Warteschlangenmanager schließlich nach fünf Tagen zu beenden, es sei denn, Sie stellen das Herunterfahren zurück.
- AMQ5008 gibt an, dass der Warteschlangenmanager gestoppt wurde, weil ein IBM MQ -Prozess fehlt. AMQ5008 wird angezeigt, wenn der Repository-Manager nach fünf Tagen gestoppt wird. Wenn der Repository-Manager gestoppt wird, wird auch der Warteschlangenmanager gestoppt.
- Überwachen Sie das Fehlerprotokoll des Warteschlangenmanagers auf die Fehlernachricht AMQ9448und stellen Sie die Fehlerbehebung zurück.
- Wenn Sie den Abruf von Nachrichten aus
SYSTEM.CLUSTER.COMMAND.QUEUEinaktivieren, stoppt der Repository-Manager den Versuch, Befehle auszuführen, und setzt die Ausführung im Leerlauf, also ohne Arbeiten zu verrichten, unbegrenzt fort. Dabei werden jedoch alle vom Repository-Manager belegten Warteschlangenkennungen freigegeben. Da der Repository-Manager nicht gestoppt wird, wird auch der Warteschlangenmanager nach fünf Tagen nicht gestoppt. - Führen Sie einen MQSC-Befehl aus, um den Abruf von Nachrichten aus
SYSTEM.CLUSTER.COMMAND.QUEUEzu inaktivieren: ALTER QLOCAL(SYSTEM.CLUSTER.COMMAND.QUEUE) GET(DISABLED)- Zur Wiederaufnahme des Nachrichtenempfangs aus
SYSTEM.CLUSTER.COMMAND.QUEUEführen Sie den entsprechenden WebSphere MQ-Scriptbefehl aus: ALTER QLOCAL(SYSTEM.CLUSTER.COMMAND.QUEUE) GET(ENABLED)
- Wenn Sie den Abruf von Nachrichten aus
Besondere Hinweise
Wenn Sie amqrrmfa in IBM MQ stoppen, wird der Warteschlangenmanager gestoppt, da er als Warteschlangenmanagerfehler betrachtet wird. Sie dürfen den Prozess amqrrmfa nur stoppen, wenn Sie den Optimierungsparameter TolerateRepositoryFailurefür den Warteschlangenmanager festgelegt haben.
Beispiel
TolerateRepositoryFailure in der Datei 'qm.ini' auf TRUETuningParameters:
TolerateRepositoryFailure=TRUE