ECS: El sistema detectó un problema de switch
Summary: ¿Qué puedo comprobar si recibo una alerta por correo electrónico en la que se me informa que el sistema ha detectado un problema con el switch?
Instructions
Si el switch informado en la alerta es un switch predeterminado de Dell que se reemplazó por un switch personalizado: Responda en el formulario del correo electrónico que se requiere ayuda para filtrar el switch reemplazado fuera de las alertas de xDoctor.
Los switches predeterminados de Gen2 son Turtle, Rabbit y Hare.
Los switches predeterminados de Gen3 son Rabbit, Hare, Fox y Hound.
Si no es así, continúe con las siguientes cuatro comprobaciones.
-
Intente hacer ping al switch informado en la alerta. Deberíamos ver que ping tiene éxito. Sin embargo, en el siguiente ejemplo, el ping no funciona.
admin@node1:~> ping -c 1 rabbit.rack PING rabbit.rack (xxx.xxx.xxx.xxx) 56(84) bytes of data. From provo.rack (xxx.xxx.xxx.xxx) icmp_seq=1 Destination Host Unreachable --- rabbit.rack ping statistics --- 1 packets transmitted, 0 received, +1 errors, 100% packet loss, time 0ms
-
Intente acceder mediante SSH al switch en la alerta. Deberíamos aparecer un mensaje de contraseña si ssh funciona. Sin embargo, en el siguiente ejemplo, ssh no funciona.
admin@node1:~> ssh rabbit.rack ssh: connect to host rabbit.rack port 22: No route to host
-
Compruebe la conexión en el protocolo de detección de capa de enlace (LLDP).
Suponiendo que no hay switches personalizados:
Un sistema de 2.ª generación debe tener switches Turtle, Rabbit y Hare.
Un sistema de 3.ª generación debe tener switches Rabbit, Hare, Fox y Hound.A continuación, se muestra un ejemplo de un sistema Gen2 en el que falta el conejo.
admin@node1:~> sudo lldpcli show neighbors ------------------------------------------------------------------------------- LLDP neighbors: ------------------------------------------------------------------------------- Interface: private, via: LLDP, RID: 1, Time: 35 days, 16:09:52 Chassis: ChassisID: mac xx:xx:xx:xx:xx:xx SysName: turtle SysDescr: Arista Networks EOS version 4.15.6M running on an Arista Networks DCS-7048T-A MgmtIP: xxx.xxx.xxx.xxx Capability: Bridge, on Capability: Router, off Port: PortID: ifname Ethernet1 PortDescr: Nile Node01 (Data) TTL: 120 ------------------------------------------------------------------------------- Interface: slave-1, via: LLDP, RID: 2, Time: 35 days, 16:09:48 Chassis: ChassisID: mac xx:xx:xx:xx:xx:xx SysName: hare SysDescr: Arista Networks EOS version 4.16.6M running on an Arista Networks DCS-7150S-24 MgmtIP: xxx.xxx.xxx.xxx Capability: Bridge, on Capability: Router, off Port: PortID: ifname Ethernet9 PortDescr: MLAG group 1 TTL: 120 ------------------------------------------------------------------------------- -
-
En los sistemas Gen2, turtle es el switch de administración. Si es posible utilizar el protocolo SSH a Turtle, compruebe el estado de conexión a los switches Rabbit y Hare mediante la ejecución de los siguientes tres comandos.
# ssh turtle.rack # en # show interfaces status | grep Mgmt
Deberíamos ver que ambos switches están marcados como connect. Sin embargo, en el siguiente ejemplo, podemos ver que una de las conexiones está marcada como notconnect.
admin@node1:~> ssh turtle.rack Password: Last login: Wed Nov 27 23:08:48 2019 from xxx.xxx.xxx.xxx turtle>en turtle#show interfaces status | grep Mgmt Et49 Mgmt Port-Secondary 10Ge switch connected 2 a-full a-1G 1000BASE-T Et50 Mgmt Port-Primary 10Gbe switch notconnect 2 auto auto 1000BASE-T
-
En los sistemas Gen3, fox y hound son switches de administración, pero fox administra los enlaces de administración a rabbit y hare. Si es posible utilizar el protocolo SSH a fox, compruebe el estado de conexión a los switches rabbit y hare mediante la ejecución de los dos comandos siguientes.
# ssh fox.rack # show interfaces status | grep MGMT
Deberíamos ver que ambos switches están marcados como activos. Sin embargo, en el siguiente ejemplo, podemos ver que la conexión Hare está inactiva.
admin@node1:~> ssh fox.rack fox# show interface status | grep MGMT Eth 1/1/33 Rabbit MGMT up 1000M full A 2 - Eth 1/1/35 Hare MGMT down 0 full A 2 -
-
-
Si alguna de las comprobaciones anteriores falla, responda al formulario en el correo electrónico que se requiere asistencia, incluidos los resultados recopilados anteriormente.
Los estados de falla para estas comprobaciones son los siguientes:
- El ping no funciona.
- SSH no funciona.
- Falta el switch en LLDP.
- El switch de administración informa una conexión no conectada/inactiva.
Si se superan todas las comprobaciones, puede tratarse de una falsa alerta o de algo como el mantenimiento previsto del sitio. Si esta alerta se repite y todas las comprobaciones continúan sin problemas, responda al formulario en el correo electrónico que indica que se requiere asistencia con una alerta de switch intermitente.