ECS: Systemet har registreret et switchproblem
Summary: Hvad kan jeg kontrollere, hvis jeg modtager en e-mailadvarsel om, at systemet har registreret et switchproblem.
Instructions
Hvis den switch, der rapporteres i advarslen, er en Dell-standardswitch, som er blevet erstattet med en brugerdefineret switch: Svar på formularen i e-mailen, at der er behov for hjælp til at filtrere den udskiftede switch ud af xDoctor-alarmering.
Gen2-standardswitche er skildpadde, kanin og hare.
Gen3-standardswitche er kanin, hare, ræv og hund.
Hvis ikke, skal du fortsætte med følgende fire kontroller.
-
Forsøg at pinge den switch, der er rapporteret i advarslen. Vi bør se ping lykkes. I nedenstående eksempel fungerer ping dog ikke.
admin@node1:~> ping -c 1 rabbit.rack PING rabbit.rack (xxx.xxx.xxx.xxx) 56(84) bytes of data. From provo.rack (xxx.xxx.xxx.xxx) icmp_seq=1 Destination Host Unreachable --- rabbit.rack ping statistics --- 1 packets transmitted, 0 received, +1 errors, 100% packet loss, time 0ms
-
Forsøg at ssh til kontakten i advarslen. Vi skal nå en adgangskodeprompt, hvis ssh fungerer. I nedenstående eksempel fungerer ssh dog ikke.
admin@node1:~> ssh rabbit.rack ssh: connect to host rabbit.rack port 22: No route to host
-
Kontrollér, om der er forbindelse i LLDP (Link Layer Discovery Protocol).
Forudsat at der ikke er nogen brugerdefinerede switche:
Et Gen 2-system skal have skildpadde-, kanin- og hareswitche.
Et Gen 3-system skal have kanin-, hare-, ræve- og hundekontakter.Eksempel nedenfor for et Gen2-system, hvor kaninen mangler.
admin@node1:~> sudo lldpcli show neighbors ------------------------------------------------------------------------------- LLDP neighbors: ------------------------------------------------------------------------------- Interface: private, via: LLDP, RID: 1, Time: 35 days, 16:09:52 Chassis: ChassisID: mac xx:xx:xx:xx:xx:xx SysName: turtle SysDescr: Arista Networks EOS version 4.15.6M running on an Arista Networks DCS-7048T-A MgmtIP: xxx.xxx.xxx.xxx Capability: Bridge, on Capability: Router, off Port: PortID: ifname Ethernet1 PortDescr: Nile Node01 (Data) TTL: 120 ------------------------------------------------------------------------------- Interface: slave-1, via: LLDP, RID: 2, Time: 35 days, 16:09:48 Chassis: ChassisID: mac xx:xx:xx:xx:xx:xx SysName: hare SysDescr: Arista Networks EOS version 4.16.6M running on an Arista Networks DCS-7150S-24 MgmtIP: xxx.xxx.xxx.xxx Capability: Bridge, on Capability: Router, off Port: PortID: ifname Ethernet9 PortDescr: MLAG group 1 TTL: 120 ------------------------------------------------------------------------------- -
-
På Gen2-systemer er skildpadden styringskontakten. Hvis det er muligt at ssh til skildpadde, skal du kontrollere forbindelsesstatus til kanin- og harekontakter ved at køre nedenstående tre kommandoer.
# ssh turtle.rack # en # show interfaces status | grep Mgmt
Vi skal se, at begge switche er markeret som tilsluttede. I eksemplet nedenfor kan vi dog se, at en af forbindelserne er markeret som notconnect.
admin@node1:~> ssh turtle.rack Password: Last login: Wed Nov 27 23:08:48 2019 from xxx.xxx.xxx.xxx turtle>en turtle#show interfaces status | grep Mgmt Et49 Mgmt Port-Secondary 10Ge switch connected 2 a-full a-1G 1000BASE-T Et50 Mgmt Port-Primary 10Gbe switch notconnect 2 auto auto 1000BASE-T
-
På Gen3-systemer er ræv og hund begge ledelseskontakter, men ræv administrerer ledelsesforbindelserne til kanin og hare. Hvis det er muligt at ssh til ræv, skal du kontrollere forbindelsesstatus til kanin- og harekontakter ved at køre nedenstående to kommandoer.
# ssh fox.rack # show interfaces status | grep MGMT
Vi skal se, at begge kontakter er markeret som op. I eksemplet nedenfor kan vi dog se, at hareforbindelsen er nede.
admin@node1:~> ssh fox.rack fox# show interface status | grep MGMT Eth 1/1/33 Rabbit MGMT up 1000M full A 2 - Eth 1/1/35 Hare MGMT down 0 full A 2 -
-
-
Hvis nogen af ovenstående kontroller mislykkes, skal du svare på formularen i e-mailen, at der kræves hjælp, herunder de output, der er samlet ovenfor.
Fejltilstande for disse kontroller er:
- Ping virker ikke.
- SSH fungerer ikke.
- Switchen mangler fra LLDP.
- Administrationsswitch rapporterer en notconnect/down-forbindelse.
Hvis alle kontroller består, kan dette være en falsk alarm eller forårsaget af noget som forventet vedligeholdelse af webstedet. Hvis denne advarsel gentages, og alle kontroller stadig er bestået, skal du svare på formularen i e-mailen, at der er behov for hjælp, med en periodisk switch-advarsel.