ECS. Система обнаружила проблему с коммутатором
Summary: Что можно проверить, если я получу по электронной почте оповещение о том, что система обнаружила проблему с коммутатором?
Instructions
Если коммутатор, указанный в оповещении, является коммутатором Dell по умолчанию, который был заменен пользовательским коммутатором: Ответьте на форму в электронном письме, что требуется помощь в фильтрации замененного коммутатора из оповещений xDoctor.
Коммутаторы 2-го поколения по умолчанию: Turtle, Rabbit и Hare.
Коммутаторы 3-го поколения по умолчанию: Rabbit, Hare, Fox и Hound.
Если нет, выполните следующие четыре проверки.
-
Попытайтесь проверить связь с коммутатором, указанная в оповещении. Мы увидим, что ping выполнен успешно. Однако в приведенном ниже примере команда ping не работает.
admin@node1:~> ping -c 1 rabbit.rack PING rabbit.rack (xxx.xxx.xxx.xxx) 56(84) bytes of data. From provo.rack (xxx.xxx.xxx.xxx) icmp_seq=1 Destination Host Unreachable --- rabbit.rack ping statistics --- 1 packets transmitted, 0 received, +1 errors, 100% packet loss, time 0ms
-
Попытайтесь подключиться по SSH к коммутатору в оповещении. Если SSH работает, должен появиться запрос пароля. Однако в приведенном ниже примере SSH не работает.
admin@node1:~> ssh rabbit.rack ssh: connect to host rabbit.rack port 22: No route to host
-
Проверьте наличие подключения в протоколе обнаружения канального уровня (LLDP).
При условии отсутствия пользовательских параметров:
Система 2-го поколения должна иметь коммутаторы Turtle, Rabbit и Hare.
Система Gen 3 должна иметь переключатели Rabbit, Hare, Fox и Hound.Приведенный ниже пример для системы Gen2, в которой отсутствует кролик.
admin@node1:~> sudo lldpcli show neighbors ------------------------------------------------------------------------------- LLDP neighbors: ------------------------------------------------------------------------------- Interface: private, via: LLDP, RID: 1, Time: 35 days, 16:09:52 Chassis: ChassisID: mac xx:xx:xx:xx:xx:xx SysName: turtle SysDescr: Arista Networks EOS version 4.15.6M running on an Arista Networks DCS-7048T-A MgmtIP: xxx.xxx.xxx.xxx Capability: Bridge, on Capability: Router, off Port: PortID: ifname Ethernet1 PortDescr: Nile Node01 (Data) TTL: 120 ------------------------------------------------------------------------------- Interface: slave-1, via: LLDP, RID: 2, Time: 35 days, 16:09:48 Chassis: ChassisID: mac xx:xx:xx:xx:xx:xx SysName: hare SysDescr: Arista Networks EOS version 4.16.6M running on an Arista Networks DCS-7150S-24 MgmtIP: xxx.xxx.xxx.xxx Capability: Bridge, on Capability: Router, off Port: PortID: ifname Ethernet9 PortDescr: MLAG group 1 TTL: 120 ------------------------------------------------------------------------------- -
-
В системах 2-го поколения Turtle — это управляющий коммутатор. Если есть возможность подключиться через SSH к Turtle, проверьте состояние подключения к коммутаторам rabbit и Hare, выполнив три команды, указанные ниже.
# ssh turtle.rack # en # show interfaces status | grep Mgmt
Мы увидим, что оба коммутатора помечены как подключенные. Однако в приведенном ниже примере мы видим, что одно из соединений помечено как notconnect.
admin@node1:~> ssh turtle.rack Password: Last login: Wed Nov 27 23:08:48 2019 from xxx.xxx.xxx.xxx turtle>en turtle#show interfaces status | grep Mgmt Et49 Mgmt Port-Secondary 10Ge switch connected 2 a-full a-1G 1000BASE-T Et50 Mgmt Port-Primary 10Gbe switch notconnect 2 auto auto 1000BASE-T
-
В системах Gen3 fox и hound являются управляющими коммутаторами, но fox управляет каналами управления с кроликом и зайцем. Если есть возможность подключиться по SSH к fox, проверьте состояние подключения к коммутаторам rabbit и Hare, выполнив две следующие команды.
# ssh fox.rack # show interfaces status | grep MGMT
Мы увидим, что оба коммутатора помечены как включенные. Однако в приведенном ниже примере мы видим, что соединение с зайцем не работает.
admin@node1:~> ssh fox.rack fox# show interface status | grep MGMT Eth 1/1/33 Rabbit MGMT up 1000M full A 2 - Eth 1/1/35 Hare MGMT down 0 full A 2 -
-
-
Если какая-либо из указанных выше проверок не пройдена, ответьте в форме по электронной почте, что требуется помощь, включая выводы, собранные выше.
Состояния сбоя для этих проверок:
- Пинг не работает.
- SSH не работает.
- Коммутатор отсутствует в LLDP.
- Управляющий коммутатор сообщает о том, что подключение не подключено/не установлено.
Если все проверки пройдены, то это может быть ложное оповещение или вызвано чем-то, например, ожидаемым обслуживанием сайта. Если это оповещение повторяется и все проверки все еще выполняются, ответьте в форме в электронном письме, что требуется помощь, с периодическим оповещением коммутатора.