ECS:系統偵測到交換器問題
Summary: 如果我收到電子郵件警示,通知我系統偵測到交換器問題,該檢查什麼?
Instructions
如果警示中回報的交換器是預設的 Dell 交換器,且已更換為自訂交換器:回復電子郵件中的表單,說明需要協助從 xDoctor 警示中篩選出更換的交換器。
Gen2 的預設交換器為 Turtle、Rabbit 和 Hare。
Gen3 的預設交換器為 Rabbit、Hare、Fox 和 Hound。
否則,請繼續執行下列四項檢查。
-
嘗試 Ping 警示中報告的交換器。我們應該看到ping成功。但是,在下面的示例中,ping 不起作用。
admin@node1:~> ping -c 1 rabbit.rack PING rabbit.rack (xxx.xxx.xxx.xxx) 56(84) bytes of data. From provo.rack (xxx.xxx.xxx.xxx) icmp_seq=1 Destination Host Unreachable --- rabbit.rack ping statistics --- 1 packets transmitted, 0 received, +1 errors, 100% packet loss, time 0ms
-
嘗試執行 SSH 至警示中的交換器。如果 ssh 有效,我們應該會收到密碼提示。但是,在以下範例中,ssh 無法運作。
admin@node1:~> ssh rabbit.rack ssh: connect to host rabbit.rack port 22: No route to host
-
檢查連結層探索通訊協定 (LLDP) 中的連線。
假設沒有自訂交換器:
第二代系統應配備 Turtle、Rabbit 和 Hare 交換器。
Gen 3 系統應具有 Rabbit、Hare、Fox 和 Hound 交換器。以下範例為遺失兔子的 Gen2 系統。
admin@node1:~> sudo lldpcli show neighbors ------------------------------------------------------------------------------- LLDP neighbors: ------------------------------------------------------------------------------- Interface: private, via: LLDP, RID: 1, Time: 35 days, 16:09:52 Chassis: ChassisID: mac xx:xx:xx:xx:xx:xx SysName: turtle SysDescr: Arista Networks EOS version 4.15.6M running on an Arista Networks DCS-7048T-A MgmtIP: xxx.xxx.xxx.xxx Capability: Bridge, on Capability: Router, off Port: PortID: ifname Ethernet1 PortDescr: Nile Node01 (Data) TTL: 120 ------------------------------------------------------------------------------- Interface: slave-1, via: LLDP, RID: 2, Time: 35 days, 16:09:48 Chassis: ChassisID: mac xx:xx:xx:xx:xx:xx SysName: hare SysDescr: Arista Networks EOS version 4.16.6M running on an Arista Networks DCS-7150S-24 MgmtIP: xxx.xxx.xxx.xxx Capability: Bridge, on Capability: Router, off Port: PortID: ifname Ethernet9 PortDescr: MLAG group 1 TTL: 120 ------------------------------------------------------------------------------- -
-
在第 2 代系統上,turtle 是管理交換器。如果可以透過 ssh 連線至 turtle,則請執行以下三個命令,檢查 rabbit 和 hare 交換器的連線狀態。
# ssh turtle.rack # en # show interfaces status | grep Mgmt
我們應會看到兩個交換器都標示為連線但是,在下面的示例中,我們可以看到其中一個連接被標記為 notconnect。
admin@node1:~> ssh turtle.rack Password: Last login: Wed Nov 27 23:08:48 2019 from xxx.xxx.xxx.xxx turtle>en turtle#show interfaces status | grep Mgmt Et49 Mgmt Port-Secondary 10Ge switch connected 2 a-full a-1G 1000BASE-T Et50 Mgmt Port-Primary 10Gbe switch notconnect 2 auto auto 1000BASE-T
-
在第 3 代系統上,狐狸和獵犬都是管理交換器,但 fox 管理兔子和野兔的管理連結。如果可以 ssh 至 fox,則執行以下兩個命令,檢查 rabbit 和 hare 交換器的連線狀態。
# ssh fox.rack # show interfaces status | grep MGMT
我們應會看到兩個交換器都標示為正常。但是,在以下範例中,我們可以看到 hare 的連線已中斷。
admin@node1:~> ssh fox.rack fox# show interface status | grep MGMT Eth 1/1/33 Rabbit MGMT up 1000M full A 2 - Eth 1/1/35 Hare MGMT down 0 full A 2 -
-
-
如果上述任何檢查失敗,請回覆電子郵件中的表單,說明需要協助,包括上面收集的輸出結果。
這些檢查的失敗狀態包括:
- Ping 無法運作。
- SSH 無法運作。
- LLDP 中缺少交換器。
- 管理交換器回報連線無法連線/中斷。
如果所有檢查都通過,則這可能是誤報警示或由預期網站維護之類的原因引起的。如果此警示重複,且所有檢查仍通過,請回覆電子郵件中的表單,說明需要間歇換器警示的協助。