ECS: Systemet har oppdaget et svitsjproblem
Summary: Hva kan jeg kontrollere hvis jeg mottar et e-postvarsel som informerer meg om at systemet har oppdaget et bytteproblem?
Instructions
Hvis svitsjen som er rapportert i varslet, er en standard Dell-svitsj som er erstattet med en egendefinert svitsj: Svar på skjemaet i e-posten at hjelp er nødvendig med å filtrere erstattet bryteren ut av xDoctor varsling.
Gen2 standardbrytere er skilpadde, kanin og hare.
Gen3 standardbrytere er Rabbit, Hare, Fox og Hound.
Hvis ikke, fortsett med følgende fire kontroller.
-
Forsøk å pinge bryteren som er rapportert i varselet. Vi bør se ping lykkes. I eksemplet nedenfor fungerer imidlertid ikke ping.
admin@node1:~> ping -c 1 rabbit.rack PING rabbit.rack (xxx.xxx.xxx.xxx) 56(84) bytes of data. From provo.rack (xxx.xxx.xxx.xxx) icmp_seq=1 Destination Host Unreachable --- rabbit.rack ping statistics --- 1 packets transmitted, 0 received, +1 errors, 100% packet loss, time 0ms
-
Forsøk å ssh til bryteren i varselet. Vi bør nå en passordmelding hvis ssh fungerer. I eksemplet nedenfor fungerer imidlertid ikke ssh.
admin@node1:~> ssh rabbit.rack ssh: connect to host rabbit.rack port 22: No route to host
-
Se etter tilkobling i Link Layer Discovery Protocol (LLDP).
Forutsatt at det ikke er noen tilpassede brytere:
Et Gen 2-system bør ha skilpadde-, kanin- og harebrytere.
Et Gen 3-system bør ha Rabbit-, Hare-, Fox- og Hound-brytere.Eksempel nedenfor for et Gen2-system der kaninen mangler.
admin@node1:~> sudo lldpcli show neighbors ------------------------------------------------------------------------------- LLDP neighbors: ------------------------------------------------------------------------------- Interface: private, via: LLDP, RID: 1, Time: 35 days, 16:09:52 Chassis: ChassisID: mac xx:xx:xx:xx:xx:xx SysName: turtle SysDescr: Arista Networks EOS version 4.15.6M running on an Arista Networks DCS-7048T-A MgmtIP: xxx.xxx.xxx.xxx Capability: Bridge, on Capability: Router, off Port: PortID: ifname Ethernet1 PortDescr: Nile Node01 (Data) TTL: 120 ------------------------------------------------------------------------------- Interface: slave-1, via: LLDP, RID: 2, Time: 35 days, 16:09:48 Chassis: ChassisID: mac xx:xx:xx:xx:xx:xx SysName: hare SysDescr: Arista Networks EOS version 4.16.6M running on an Arista Networks DCS-7150S-24 MgmtIP: xxx.xxx.xxx.xxx Capability: Bridge, on Capability: Router, off Port: PortID: ifname Ethernet9 PortDescr: MLAG group 1 TTL: 120 ------------------------------------------------------------------------------- -
-
På Gen2-systemer er skilpadde administrasjonsbryteren. Hvis det er mulig å ssh til skilpadde, så sjekk tilkoblingsstatus til kanin- og harebrytere ved å kjøre de tre kommandoene nedenfor.
# ssh turtle.rack # en # show interfaces status | grep Mgmt
Vi skal se at begge bryterne er merket som koble til. I eksemplet nedenfor kan vi imidlertid se at en av tilkoblingene er merket som ikkekoble til.
admin@node1:~> ssh turtle.rack Password: Last login: Wed Nov 27 23:08:48 2019 from xxx.xxx.xxx.xxx turtle>en turtle#show interfaces status | grep Mgmt Et49 Mgmt Port-Secondary 10Ge switch connected 2 a-full a-1G 1000BASE-T Et50 Mgmt Port-Primary 10Gbe switch notconnect 2 auto auto 1000BASE-T
-
På Gen3-systemer er rev og hund begge ledelsesbrytere, men rev administrerer ledelsesforbindelsene til kanin og hare. Hvis det er mulig å ssh til rev, så sjekk tilkoblingsstatus til kanin- og harebrytere ved å kjøre de to kommandoene nedenfor.
# ssh fox.rack # show interfaces status | grep MGMT
Vi skal se at begge bryterne er merket som oppe. I eksemplet nedenfor kan vi imidlertid se at hareforbindelsen er nede.
admin@node1:~> ssh fox.rack fox# show interface status | grep MGMT Eth 1/1/33 Rabbit MGMT up 1000M full A 2 - Eth 1/1/35 Hare MGMT down 0 full A 2 -
-
-
Hvis noen av kontrollene ovenfor mislykkes, svarer du på skjemaet i e-posten om at hjelp er nødvendig, inkludert utdataene som er samlet inn ovenfor.
Feiltilstander for disse kontrollene er:
- Ping fungerer ikke.
- SSH fungerer ikke.
- Bryteren mangler fra LLDP.
- Administrasjonssvitsjen rapporterer en tilkobling som ikke er tilkoblet/nede.
Hvis alle kontroller passerer, kan dette være et falskt varsel eller forårsaket av noe som forventet vedlikehold av nettstedet. Hvis dette varselet gjentas og alle kontrollene fremdeles bestås, svarer du på skjemaet i e-postmeldingen om at hjelp er nødvendig med et midlertidig svitsjvarsel.