ECS: Systemet har upptäckt ett switchproblem
Summary: Vad kan jag kontrollera om jag får ett mejl om att systemet har upptäckt ett switchproblem?
Instructions
Om switchen som rapporteras i varningen är en standardswitch från Dell som har ersatts med en anpassad switch: Svara på formuläret i e-postmeddelandet om att hjälp krävs med att filtrera bort den utbytta switchen från xDoctor-varningar.
Gen2-standardswitchar är Turtle, Rabbit och Hare.
Gen3-standardswitchar är Rabbit, Hare, Fox och Hound.
Om inte, fortsätt med följande fyra kontroller.
-
Försök att pinga switchen som rapporteras i varningen. Vi bör se ping lyckas. I exemplet nedan fungerar dock inte ping.
admin@node1:~> ping -c 1 rabbit.rack PING rabbit.rack (xxx.xxx.xxx.xxx) 56(84) bytes of data. From provo.rack (xxx.xxx.xxx.xxx) icmp_seq=1 Destination Host Unreachable --- rabbit.rack ping statistics --- 1 packets transmitted, 0 received, +1 errors, 100% packet loss, time 0ms
-
Försök att ssh till switchen i varningen. Vi bör kontakta en lösenordsfråga om ssh fungerar. I exemplet nedan fungerar dock inte ssh.
admin@node1:~> ssh rabbit.rack ssh: connect to host rabbit.rack port 22: No route to host
-
Sök efter anslutning i LLDP (Link Layer Discovery Protocol).
Förutsatt att det inte finns några anpassade switchar:
Ett Gen 2-system bör ha Turtle-, Rabbit- och Hare-switchar.
Ett Gen 3-system bör ha switchar för kanin, hare, räv och hund.Exempel nedan för ett Gen2-system där kaninen saknas.
admin@node1:~> sudo lldpcli show neighbors ------------------------------------------------------------------------------- LLDP neighbors: ------------------------------------------------------------------------------- Interface: private, via: LLDP, RID: 1, Time: 35 days, 16:09:52 Chassis: ChassisID: mac xx:xx:xx:xx:xx:xx SysName: turtle SysDescr: Arista Networks EOS version 4.15.6M running on an Arista Networks DCS-7048T-A MgmtIP: xxx.xxx.xxx.xxx Capability: Bridge, on Capability: Router, off Port: PortID: ifname Ethernet1 PortDescr: Nile Node01 (Data) TTL: 120 ------------------------------------------------------------------------------- Interface: slave-1, via: LLDP, RID: 2, Time: 35 days, 16:09:48 Chassis: ChassisID: mac xx:xx:xx:xx:xx:xx SysName: hare SysDescr: Arista Networks EOS version 4.16.6M running on an Arista Networks DCS-7150S-24 MgmtIP: xxx.xxx.xxx.xxx Capability: Bridge, on Capability: Router, off Port: PortID: ifname Ethernet9 PortDescr: MLAG group 1 TTL: 120 ------------------------------------------------------------------------------- -
-
På Gen2-system är turtle hanteringsswitchen. Om det är möjligt att ssh till sköldpadda, kontrollera sedan anslutningsstatus till kanin- och haromkopplare genom att köra nedanstående tre kommandon.
# ssh turtle.rack # en # show interfaces status | grep Mgmt
Vi bör se att båda switcharna är markerade som anslutna. I exemplet nedan kan vi dock se att en av anslutningarna är markerad som inteansluta.
admin@node1:~> ssh turtle.rack Password: Last login: Wed Nov 27 23:08:48 2019 from xxx.xxx.xxx.xxx turtle>en turtle#show interfaces status | grep Mgmt Et49 Mgmt Port-Secondary 10Ge switch connected 2 a-full a-1G 1000BASE-T Et50 Mgmt Port-Primary 10Gbe switch notconnect 2 auto auto 1000BASE-T
-
På Gen3-system är både räv och hund hanteringsväxlar, men räv hanterar hanteringslänkarna till kanin och hare. Om det är möjligt att ssh till räv, kontrollera sedan anslutningsstatus till kanin- och haromkopplare genom att köra nedanstående två kommandon.
# ssh fox.rack # show interfaces status | grep MGMT
Vi bör se att båda switcharna är markerade som upp. I exemplet nedan kan vi dock se att haranslutningen är nere.
admin@node1:~> ssh fox.rack fox# show interface status | grep MGMT Eth 1/1/33 Rabbit MGMT up 1000M full A 2 - Eth 1/1/35 Hare MGMT down 0 full A 2 -
-
-
Om någon av ovanstående kontroller misslyckas svarar du på formuläret i e-postmeddelandet om att hjälp krävs, inklusive de resultat som samlats in ovan.
Feltillstånd för dessa kontroller är:
- Ping fungerar inte.
- SSH fungerar inte.
- Switchen saknas i LLDP.
- Hanteringsswitchen rapporterar en notconnect/down-anslutning.
Om alla kontroller godkänns kan detta vara en falsk varning eller orsakas av något som förväntat webbplatsunderhåll. Om den här aviseringen upprepas och alla kontroller fortfarande skickas svarar du på formuläret i e-postmeddelandet om att hjälp krävs med en tillfällig växelavisering.