ECS: Het systeem heeft een switchprobleem gedetecteerd
Summary: Wat kan ik controleren als ik een e-mailwaarschuwing ontvang met de melding dat het systeem een switchprobleem heeft gedetecteerd.
Instructions
Als de switch die in de waarschuwing wordt gemeld een standaard Dell switch is die is vervangen door een aangepaste switch: Reageer op het formulier in de e-mail dat hulp nodig is bij het filteren van de vervangen schakelaar uit de xDoctor-waarschuwing.
Gen2 standaardschakelaars zijn Turtle, Rabbit en Hare.
Gen3 standaardswitches zijn Konijn, Haas, Vos en Hond.
Zo niet, ga dan verder met de volgende vier controles.
-
Poging om de switch te pingen die wordt gemeld in de waarschuwing. We zouden moeten zien dat ping slaagt. In het onderstaande voorbeeld werkt ping echter niet.
admin@node1:~> ping -c 1 rabbit.rack PING rabbit.rack (xxx.xxx.xxx.xxx) 56(84) bytes of data. From provo.rack (xxx.xxx.xxx.xxx) icmp_seq=1 Destination Host Unreachable --- rabbit.rack ping statistics --- 1 packets transmitted, 0 received, +1 errors, 100% packet loss, time 0ms
-
Probeer ssh naar de switch in de waarschuwing te sturen. We zouden een wachtwoordprompt moeten bereiken als ssh werkt. In het onderstaande voorbeeld werkt ssh echter niet.
admin@node1:~> ssh rabbit.rack ssh: connect to host rabbit.rack port 22: No route to host
-
Controleer op verbindingen in het Link Layer Discovery Protocol (LLDP).
Ervan uitgaande dat er geen aangepaste switches zijn:
Een Gen 2-systeem moet schildpad-, konijn- en hazenswitches hebben.
Een Gen 3-systeem moet Rabbit-, Hare-, Fox- en Hound-switches hebben.Voorbeeld hieronder voor een Gen2 systeem waarbij het konijn ontbreekt.
admin@node1:~> sudo lldpcli show neighbors ------------------------------------------------------------------------------- LLDP neighbors: ------------------------------------------------------------------------------- Interface: private, via: LLDP, RID: 1, Time: 35 days, 16:09:52 Chassis: ChassisID: mac xx:xx:xx:xx:xx:xx SysName: turtle SysDescr: Arista Networks EOS version 4.15.6M running on an Arista Networks DCS-7048T-A MgmtIP: xxx.xxx.xxx.xxx Capability: Bridge, on Capability: Router, off Port: PortID: ifname Ethernet1 PortDescr: Nile Node01 (Data) TTL: 120 ------------------------------------------------------------------------------- Interface: slave-1, via: LLDP, RID: 2, Time: 35 days, 16:09:48 Chassis: ChassisID: mac xx:xx:xx:xx:xx:xx SysName: hare SysDescr: Arista Networks EOS version 4.16.6M running on an Arista Networks DCS-7150S-24 MgmtIP: xxx.xxx.xxx.xxx Capability: Bridge, on Capability: Router, off Port: PortID: ifname Ethernet9 PortDescr: MLAG group 1 TTL: 120 ------------------------------------------------------------------------------- -
-
Op Gen2-systemen is turtle de managementswitch. Als het mogelijk is om ssh naar schildpad te sturen, controleer dan de verbindingsstatus met konijnen- en haasschakelaars door de onderstaande drie commando's uit te voeren.
# ssh turtle.rack # en # show interfaces status | grep Mgmt
We zouden moeten zien dat beide switches gemarkeerd als verbinden. In het onderstaande voorbeeld kunnen we echter zien dat een van de verbindingen is gemarkeerd als notconnect.
admin@node1:~> ssh turtle.rack Password: Last login: Wed Nov 27 23:08:48 2019 from xxx.xxx.xxx.xxx turtle>en turtle#show interfaces status | grep Mgmt Et49 Mgmt Port-Secondary 10Ge switch connected 2 a-full a-1G 1000BASE-T Et50 Mgmt Port-Primary 10Gbe switch notconnect 2 auto auto 1000BASE-T
-
Op Gen3-systemen zijn vos en hond beide managementswitches, maar fox beheert de managementlinks naar konijn en haas. Als het mogelijk is om te ssh naar fox, controleer dan de verbindingsstatus met konijnen- en hazenschakelaars door de onderstaande twee opdrachten uit te voeren.
# ssh fox.rack # show interfaces status | grep MGMT
We zouden moeten zien dat beide schakelaars als omhoog zijn gemarkeerd. In het onderstaande voorbeeld kunnen we echter zien dat de haasverbinding is verbroken.
admin@node1:~> ssh fox.rack fox# show interface status | grep MGMT Eth 1/1/33 Rabbit MGMT up 1000M full A 2 - Eth 1/1/35 Hare MGMT down 0 full A 2 -
-
-
Als een van de bovenstaande controles mislukt, reageer dan op het formulier in de e-mail dat assistentie vereist is, inclusief de hierboven verzamelde output.
Foutstatussen voor deze controles zijn:
- Ping werkt niet.
- SSH werkt niet.
- De switch ontbreekt in LLDP.
- De managementswitch meldt een notconnect/down-verbinding.
Als alle controles slagen, kan dit een valse waarschuwing zijn of worden veroorzaakt door bijvoorbeeld verwacht onderhoud op de locatie. Als deze waarschuwing wordt herhaald en alle controles nog steeds worden uitgevoerd, reageer dan op het formulier in de e-mail dat hulp nodig is bij een intermitterende switch-waarschuwing.