ECS:システムでスイッチの問題が検出されました
Summary: システムがスイッチの問題を検出したことを知らせるEメール アラートを受信した場合、どうすればよいですか?
Instructions
アラートで報告されたスイッチが、カスタム スイッチに置き換えられたデフォルトのDellスイッチである場合: 交換したスイッチをxDoctorアラートからフィルタリングするためのサポートが必要であることをEメールのフォームに返信します。
Gen2のデフォルト スイッチは、Turtle、Rabbit、Hareです
Gen3のデフォルト スイッチは、Rabbit、Hare、Fox、Houndです。
そうでない場合は、次の4つのチェックに進みます。
-
アラートで報告されたスイッチにpingを試行します。pingが成功したことを確認できます。ただし、次の例では、pingは機能しません。
admin@node1:~> ping -c 1 rabbit.rack PING rabbit.rack (xxx.xxx.xxx.xxx) 56(84) bytes of data. From provo.rack (xxx.xxx.xxx.xxx) icmp_seq=1 Destination Host Unreachable --- rabbit.rack ping statistics --- 1 packets transmitted, 0 received, +1 errors, 100% packet loss, time 0ms
-
アラートでスイッチにSSH接続してみます。sshが機能する場合は、パスワードプロンプトが表示されます。ただし、以下の例では、sshは機能しません。
admin@node1:~> ssh rabbit.rack ssh: connect to host rabbit.rack port 22: No route to host
-
Link Layer Discovery Protocol (LLDP)で接続を確認します。
カスタム スイッチがないと仮定:
Gen 2システムには、Turtle、Rabbit、Hareの各スイッチが必要です。
Gen 3システムには、Rabbit、Hare、Fox、Houndの各スイッチが必要です。Rabbitが欠落しているGen2システムの次の例。
admin@node1:~> sudo lldpcli show neighbors ------------------------------------------------------------------------------- LLDP neighbors: ------------------------------------------------------------------------------- Interface: private, via: LLDP, RID: 1, Time: 35 days, 16:09:52 Chassis: ChassisID: mac xx:xx:xx:xx:xx:xx SysName: turtle SysDescr: Arista Networks EOS version 4.15.6M running on an Arista Networks DCS-7048T-A MgmtIP: xxx.xxx.xxx.xxx Capability: Bridge, on Capability: Router, off Port: PortID: ifname Ethernet1 PortDescr: Nile Node01 (Data) TTL: 120 ------------------------------------------------------------------------------- Interface: slave-1, via: LLDP, RID: 2, Time: 35 days, 16:09:48 Chassis: ChassisID: mac xx:xx:xx:xx:xx:xx SysName: hare SysDescr: Arista Networks EOS version 4.16.6M running on an Arista Networks DCS-7150S-24 MgmtIP: xxx.xxx.xxx.xxx Capability: Bridge, on Capability: Router, off Port: PortID: ifname Ethernet9 PortDescr: MLAG group 1 TTL: 120 ------------------------------------------------------------------------------- -
-
Gen2システムでは、turtleが管理スイッチです。タートルにSSHで接続できる場合は、次の3つのコマンドを実行して、rabbitスイッチとhareスイッチへの接続ステータスを確認します。
# ssh turtle.rack # en # show interfaces status | grep Mgmt
両方のスイッチが接続としてマークされている必要があります。ただし、次の例では、接続の 1 つが notconnect としてマークされていることがわかります。
admin@node1:~> ssh turtle.rack Password: Last login: Wed Nov 27 23:08:48 2019 from xxx.xxx.xxx.xxx turtle>en turtle#show interfaces status | grep Mgmt Et49 Mgmt Port-Secondary 10Ge switch connected 2 a-full a-1G 1000BASE-T Et50 Mgmt Port-Primary 10Gbe switch notconnect 2 auto auto 1000BASE-T
-
Gen3システムでは、foxとhoundはどちらも管理スイッチですが、rabbitとhareへの管理リンクはfoxが管理します。FoxにSSHで接続できる場合は、次の2つのコマンドを実行して、rabbitスイッチとhareスイッチへの接続ステータスを確認します。
# ssh fox.rack # show interfaces status | grep MGMT
両方のスイッチが稼働中とマークされているはずです。ただし、以下の例では、hare接続がダウンしていることがわかります。
admin@node1:~> ssh fox.rack fox# show interface status | grep MGMT Eth 1/1/33 Rabbit MGMT up 1000M full A 2 - Eth 1/1/35 Hare MGMT down 0 full A 2 -
-
-
上記のチェックのいずれかが失敗した場合は、上記で収集した出力を含め、サポートが必要であることをEメールのフォームに返信します。
これらのチェックの失敗状態は次のとおりです。
- Pingが機能しない。
- SSHが機能しません。
- スイッチがLLDPに存在しません。
- 管理スイッチがnotconnect/down接続を報告します。
すべてのチェックに合格した場合、これは誤ったアラートであるか、予想されるサイトメンテナンスなどが原因である可能性があります。このアラートが繰り返し発生し、すべてのチェックにまだ合格している場合は、断続的なスイッチ アラートについてサポートが必要であることをEメールのフォームに応答してください。