ECS : Le système a détecté un problème de commutateur
Summary: Que puis-je vérifier si je reçois une alerte par e-mail m’informant que le système a détecté un problème de commutateur ?
Instructions
Si le commutateur signalé dans l’alerte est un commutateur Dell par défaut qui a été remplacé par un commutateur personnalisé : Répondez au formulaire de l’e-mail indiquant qu’une assistance est requise pour filtrer le commutateur remplacé hors des alertes xDoctor.
Les commutateurs Gen2 par défaut sont Turtle, Rabbit et Hare.
Les commutateurs Gen3 par défaut sont Rabbit, Hare, Fox et Hound.
Si ce n’est pas le cas, procédez aux quatre vérifications suivantes.
-
Essayez d’envoyer une commande ping au commutateur signalé dans l’alerte. Nous devrions voir ping réussir. Toutefois, dans l’exemple ci-dessous, le ping ne fonctionne pas.
admin@node1:~> ping -c 1 rabbit.rack PING rabbit.rack (xxx.xxx.xxx.xxx) 56(84) bytes of data. From provo.rack (xxx.xxx.xxx.xxx) icmp_seq=1 Destination Host Unreachable --- rabbit.rack ping statistics --- 1 packets transmitted, 0 received, +1 errors, 100% packet loss, time 0ms
-
Essayez d’utiliser une connexion SSH sur le commutateur de l’alerte. Nous devrions parvenir à une invite de mot de passe si ssh fonctionne. Dans l’exemple ci-dessous, cependant, ssh ne fonctionne pas.
admin@node1:~> ssh rabbit.rack ssh: connect to host rabbit.rack port 22: No route to host
-
Vérifiez la connexion dans le protocole LLDP (Link Layer Discovery Protocol).
En supposant qu’il n’y a pas de commutateurs personnalisés :
Un système Gen 2 doit comporter des commutateurs Turtle, Rabbit et Rabbit.
Un système Gen 3 doit avoir des commutateurs Rabbit, Hare, Fox et Hound.Exemple ci-dessous pour un système Gen2 où le lapin est manquant.
admin@node1:~> sudo lldpcli show neighbors ------------------------------------------------------------------------------- LLDP neighbors: ------------------------------------------------------------------------------- Interface: private, via: LLDP, RID: 1, Time: 35 days, 16:09:52 Chassis: ChassisID: mac xx:xx:xx:xx:xx:xx SysName: turtle SysDescr: Arista Networks EOS version 4.15.6M running on an Arista Networks DCS-7048T-A MgmtIP: xxx.xxx.xxx.xxx Capability: Bridge, on Capability: Router, off Port: PortID: ifname Ethernet1 PortDescr: Nile Node01 (Data) TTL: 120 ------------------------------------------------------------------------------- Interface: slave-1, via: LLDP, RID: 2, Time: 35 days, 16:09:48 Chassis: ChassisID: mac xx:xx:xx:xx:xx:xx SysName: hare SysDescr: Arista Networks EOS version 4.16.6M running on an Arista Networks DCS-7150S-24 MgmtIP: xxx.xxx.xxx.xxx Capability: Bridge, on Capability: Router, off Port: PortID: ifname Ethernet9 PortDescr: MLAG group 1 TTL: 120 ------------------------------------------------------------------------------- -
-
Sur les systèmes Gen2, turtle est le commutateur de gestion. S’il est possible d’utiliser une session ssh sur turtle, vérifiez l’état de la connexion aux commutateurs rabbit et hare en exécutant les trois commandes ci-dessous.
# ssh turtle.rack # en # show interfaces status | grep Mgmt
Nous devrions voir que les deux commutateurs marqués comme connectent. Toutefois, dans l’exemple ci-dessous, nous pouvons voir que l’une des connexions est marquée comme notconnect.
admin@node1:~> ssh turtle.rack Password: Last login: Wed Nov 27 23:08:48 2019 from xxx.xxx.xxx.xxx turtle>en turtle#show interfaces status | grep Mgmt Et49 Mgmt Port-Secondary 10Ge switch connected 2 a-full a-1G 1000BASE-T Et50 Mgmt Port-Primary 10Gbe switch notconnect 2 auto auto 1000BASE-T
-
Sur les systèmes Gen3, fox et hound sont tous deux des commutateurs de gestion, mais fox gère les liens de gestion avec rabbit et rabbit. S’il est possible d’utiliser ssh to fox, vérifiez l’état de la connexion aux commutateurs rabbit et hare en exécutant les deux commandes ci-dessous.
# ssh fox.rack # show interfaces status | grep MGMT
Nous devrions voir que les deux commutateurs sont marqués comme actifs. Toutefois, dans l’exemple ci-dessous, nous pouvons voir que la connexion Hare est interrompue.
admin@node1:~> ssh fox.rack fox# show interface status | grep MGMT Eth 1/1/33 Rabbit MGMT up 1000M full A 2 - Eth 1/1/35 Hare MGMT down 0 full A 2 -
-
-
Si l’une des vérifications ci-dessus échoue, répondez au formulaire de l’e-mail indiquant qu’une assistance est requise, y compris les résultats rassemblés ci-dessus.
Les états d’échec de ces vérifications sont les suivants :
- Le ping ne fonctionne pas.
- SSH ne fonctionne pas.
- Le commutateur est manquant dans LLDP.
- Le commutateur de gestion signale une connexion notconnect/down.
Si toutes les vérifications réussissent, il peut s’agir d’une fausse alerte ou être causée par quelque chose comme une maintenance attendue du site. Si cette alerte se répète et que toutes les vérifications aboutissent, répondez au formulaire de l’e-mail indiquant qu’une assistance est requise en envoyant une alerte de commutateur intermittent.