Problèmes de mise en réseau
Une liste de tous les problèmes de dépannage et des problèmes connus qui existent dans la mise en réseau de IBM Fusion HCI.
Configuration de l'équilibreur de charge F5
- Instruction d'incident
- Vous pouvez utiliser un équilibreur de charge externe à la place de l'équilibreur de charge par défaut pour accéder à la base de données de l Red Hat® OpenShift® cluster après l'installation de IBM Fusion HCI.
- Résolution
- Vous pouvez utiliser le placement et la tolérance des noeuds pour placer des pods
router-defaultsur les noeuds d'infrastructure de votre environnement, puis vous pouvez configurer un équilibreur de charge externe pour acheminer le trafic vers les noeuds d'infrastructure.- Exécutez la commande suivante pour étiqueter les noeuds worker en tant que noeuds d'infrastructure. Utilisez les noeuds de traitement appropriés pour votre environnement.
oc label nodes compute-1-ru5.rackd.mydomain.com node-role.kubernetes.io/infra='' oc label nodes compute-1-ru6.rackd.mydomain.com node-role.kubernetes.io/infra='' - Créez un fichier
default.yamlpour placer des podsrouter-defaultsur les noeuds d'infrastructure.apiVersion: operator.openshift.io/v1 kind: IngressController metadata: name: default namespace: openshift-ingress-operator spec: nodePlacement: nodeSelector: matchLabels: node-role.kubernetes.io/infra: "" tolerations: - effect: NoSchedule operator: Exists replicas: 2 status: {} - Exécutez la commande suivante pour appliquer la modification.
oc apply -f default.yaml - Exécutez la commande suivante pour vérifier que les pods
router-defaultsont en cours d'exécution sur les noeuds d'infrastructure.oc -n openshift-ingress get pod -o wideRésultat de l'exemple :NOM PRET STATUT REDÉMARRAGES AGE AGE IP NOEUD NOMINÉ NOEUD PRET JALONS router-default-6c8f978c-9bd9j 1/1 Exécution de 0 23m 172.20.240.29 compute-1-ru6.rackd.mydomain.com < none> < none> router-default-6c8f978c-zglxz 1/1 Exécution de 0 23m 172.20.240.28 compute-1-ru5.rackd.mydomain.com < none> < none>
- Configurez votre équilibreur de charge externe. Pour plus d'informations, voir Configuration d'un équilibreur de charge externe.
- Exécutez la commande suivante pour étiqueter les noeuds worker en tant que noeuds d'infrastructure. Utilisez les noeuds de traitement appropriés pour votre environnement.
Evénements réseau manquants émis lors de l'arrêt ou de la mise en service d'un port sur un commutateur de gestion
- Instruction d'incident
- Si un événement
cumulusLinkDownest observé sur l'interface utilisateur de IBM Fusion HCI pour tout commutateur à grande vitesse ou de gestion, suivez les étapes mentionnées dans la section de résolution suivante.
- Résolution
- Effectuez les étapes de contournement suivantes:
- Accédez à .
- Dans le menu des points de suspension du commutateur, cliquez sur Exécuter la commande.
- Sélectionnez net show interface all dans la liste et cliquez sur Exécuter.
- Vérifiez si l'état du port est
UP,DNouADMDN.- Si l'état du port est
UP, le port est récupéré et est opérationnel. Dans ce scénario, l'événement n'est pas une nouvelle entrée et peut être ignoré. - Si l'état du port est
DNouADMDN, contactez le supportIBM pour vérifier le commutateur.
- Si l'état du port est
Indisponibilité du commutateur de gestion
- Instruction d'incident
- Aucun commutateur de gestion n'est disponible.
- Résolution
- Procédez comme suit pour vous connecter au commutateur de gestion et résoudre le problème.
- Exécutez la commande suivante
ocpour obtenir l'adresse du commutateur correspondant IPv6 ou IPv4.oc get switches <switchName> -o yaml | grep switchIpadressPar exemple :
Si le nom du commutateur est mgmt1-rackc, exécutez la commande suivante:oc get switches mgmt1-rackc -o yaml | grep switchIpadress - Exécutez la commande
ocsuivante pour obtenir les données d'identification de connexion du commutateur à partir du secret du commutateur.oc get secrets <switchName>-secret -oyaml | grep defaultUserName oc get secrets <switchName>-secret -oyaml | grep defaultUserPasswrdPar exemple :oc get secrets mgmt1-rackc-secret -oyaml | grep defaultUserName oc get secrets mgmt1-rackc-secret -oyaml | grep defaultUserPasswrd - Exécutez la commande suivante pour décoder à la fois le nom d'utilisateur et le mot de passe, obtenus à l'étape précédente.
echo <username/password> | base64 -d - Utilisez le nom d'utilisateur et le mot de passe décodés à l'étape précédente pour vous connecter au commutateur à partir de l'un des noeuds de traitement. A partir de l'interface utilisateur Red Hat OpenShift , accédez à l'un des terminaux de noeud de traitement.
ssh `<username>@<switchIpadress>` - SSH pour se connecter au commutateur et accéder à l'utilisateur root.
sudo su - Vérifiez les valeurs de
ClientAliveIntervaletClientAliveCountMaxdanssshd_config.root@mgmt1-rackc:mgmt:~$ cat /etc/ssh/sshd_config | egrep "ClientAliveInterval|ClientAliveCountMax" #ClientAliveInterval 0 #ClientAliveCountMax 3 - Mettez à jour le fichier /etc/ssh/sshd_config avec
ClientAliveIntervalà 600 etClientAliveCountMaxà 0, puis sauvegardez le fichier.vi /etc/ssh/sshd_config "Remove "#" on both lines and change the values as given below and Save the file(Press Esc to enter Command mode, and then type :wq to write and quit the file)" ClientAliveInterval 600 ClientAliveCountMax 0 - Vérifiez que les valeurs de
ClientAliveIntervalet deClientAliveCountMaxsont correctement définies.root@mgmt1-rackc:mgmt:~$ cat /etc/ssh/sshd_config | egrep "ClientAliveInterval|ClientAliveCountMax" ClientAliveInterval 600 ClientAliveCountMax 0 root@mgmt1-rackc:mgmt:~$ - Redémarrez le service
sshd.root@mgmt1-rackc:mgmt:~$ sudo systemctl restart sshd - Exécutez la commande suivante pour effacer les sessions SSH qui appartiennent à ISFUSER (la plupart des sessions SSH appartiennent à ISFUSER).
for i in `ps -aef | grep ssh | grep ISFUSER | awk {'print $2'}`; do echo $i; kill -9 $i; done
- Exécutez la commande suivante
Les commutateurs sont passés à l'état critique après la mise hors tension de TOR
- Instruction d'incident
- Les commutateurs sont dans un état critique car la connectivité du cluster à haute disponibilité se rompt entre les armoires.
- Cause
- Les commutateurs d'une armoire ne partagent pas d'adresse IP de bouclage Anycast avec la colonne vertébrale et d'autres commutateurs.
- Résolution
- Important: Ce problème et ses étapes de contournement ne s'appliquent qu'à un cluster à haute disponibilité.
- Connexion à tous les commutateurs à haut débit
- Exécutez la commande suivante
ocpour obtenir l'adresse du commutateur correspondant IPv6 ou IPv4.oc get switches <switchName> -o yaml | grep switchIpadressPar exemple, si le nom du commutateur est hspeed1-rackc, exécutez la commande suivante:oc get switches hspeed1-rackc -o yaml | grep switchIpadress - Exécutez la commande
ocsuivante pour obtenir les données d'identification de connexion du commutateur à partir du secret du commutateur.oc get secrets <switchName>-secret -oyaml | grep defaultUserName oc get secrets <switchName>-secret -oyaml | grep defaultUserPasswrdPar exemple, si le nom du commutateur est hspeed1-rackc, exécutez la commande suivante:oc get secrets hspeed1-rackc-secret -oyaml | grep defaultUserName oc get secrets hspeed1-rackc-secret -oyaml | grep defaultUserPasswrd - Exécutez la commande suivante pour décoder à la fois le nom d'utilisateur et le mot de passe, obtenus à l'étape précédente.
echo <username/password> | base64 -d - Utilisez le nom d'utilisateur et le mot de passe décodés de l'étape précédente pour vous connecter au commutateur à partir de l'un des noeuds de traitement. A partir de l'interface utilisateur Red Hat OpenShift , accédez à l'un des terminaux de noeud de traitement.
ssh `<username>@<switchIpadress>` - Exécutez la commande suivante pour redémarrer le service
frrsur le commutateur.sudo systemctl restart frr
Echec de l'ajout d'un réseau local virtuel sur une configuration d'armoire d'extension
- Instruction d'incident
- L'ajout d'un réseau local virtuel échoue sur une configuration d'armoire d'extension avec la combinaison d'armoires gen1 et gen2 .
- Résolution
- Si vous rencontrez des problèmes lors de l'ajout d'un réseau local virtuel sur une configuration d'armoire d'extension, contactez le supportIBM .
Échec de la validation des adaptateurs réseau
- Instruction d'incident
- La validation de la carte réseau échoue lors du remplacement d'une carte réseau.
- Résolution
- Pour résoudre ce problème, veillez à mettre à jour le fichier kickstart chaque fois que vous remplacez une carte réseau. Mettez également à jour le kickstart avec l'adresse MAC de la carte réseau remplacée.
Réseau d'administration dans un état critique
- Instruction d'incident
- Le réseau d'administration est dans un état critique, affichant une erreur sur l'interface utilisateur IBM Fusion HCI parce que les pods ne peuvent pas communiquer entre les sites.
- Cause
- Les pods de passerelle de sous-marin ne parviennent pas à établir une connexion après la récupération de Site1, ce qui empêche le sous-marin de se connecter avec succès.
- Diagnostic
- Suivez les étapes pour établir un diagnostic à l'aide de l'interface utilisateur :
- Connectez-vous à l'interface utilisateur site2 OpenShift Container Platform.
- Allez dans .
- Recherchez MetroDR et sélectionnez MetroDR dans la liste.
- Allez dans l'onglet Instances et sélectionnez metrodrsite.
- Allez dans l'onglet YAML et cochez
submarinerMonitoringCommandOutputsousmetroDRSiteStatus. - Vérifiez si l'erreur suivante s'affiche pour le nœud.
control-1-ru4.rackae1.mydomain actif 0 connexions sur 1 sont établies
- Notez le nom du nœud.
- Résolution
- Suivez les étapes pour résoudre le problème via l'interface utilisateur :
- Connectez-vous à l'interface OpenShift Container Platform l'interface utilisateur du site site2.
- Accéder à
- Sélectionnez sous-marinier-opérateur dans la liste déroulante Projet.
- Cliquez sur l'icône Gérer les colonnes qui se trouve à côté de la barre de recherche.
- Sélectionnez Nœud dans les colonnes supplémentaires.
Les détails des pods s'affichent.
- Redémarrez ou supprimez le pod submariner-gateway qui se trouve sur le nom de nœud que vous avez noté dans les étapes de diagnostic.
- L'erreur se résout automatiquement après l'application des étapes de résolution. Si le problème persiste, contactez l'assistance IBM.