PowerEdge: iDRAC9: SWC5008: Kan ikke få adgang til front-LED-panelet på grund af hardwaretilstand
Summary: Denne artikel beskriver et problem, der berører PowerEdge-servere, der kører iDRAC9, hvor fejlen SWC5008 opstår flere gange i SEL.
Symptoms
Dell PowerEdge-servere, der kører iDRAC9, kan udvise for stor SWC5008 fejl, når de refererer til den forreste LED i systemets hændelseslogfiler (SEL). SWC5008-hændelser kan også forekomme i iDRAC9 Lifecycle-logfilen. Disse fejl opstår af forskellige årsager. Artiklen indeholder baggrundsinformation om LED-controllerkortet og metoder til diagnosticering af fejlobservationer.
Beskrivelse:
Den SWC5008 fejl vises som nedenfor i figur 1 og tabel 1 og 2.
Figur 1: Eksempel på kritisk systemtilstand for iDRAC9-dashboard
Tabel 1: Eksempel på systemhændelseslogfil (SEL)
|
2020-06-02 07:08:15 |
2 |
Kan ikke få adgang til lysdiode i frontpanel pga. en hardwarefejltilstand. |
Tabel 2: Eksempel på Lifecycle-logfil
|
2020-06-02 07:08:15 |
677 |
SWC5008 |
Kan ikke få adgang til lysdiode i frontpanel pga. en hardwarefejltilstand. |
Cause
Lysdioden i venstre side af frontkontrolpanelet overvåges og styres af iDRAC-controlleren (BMC), der er indbygget i PowerEdge-servere. Der foretages regelmæssige statusforespørgsler hvert femte sekund for at kontrollere tilstedeværelsen og den aktuelle tilstand af det forreste LED-panel. iDRAC vedligeholder også den installerede firmware på dette controllerkort. Hvis der er en relevant opdatering i iDRAC-firmwaren, forsøger iDRAC at skubbe LED-firmwareopdateringen under iDRAC-startcyklusser. I en af disse sekvenser bruger iDRAC et i2c-kredsløb til at kommunikere med lysdiodens controllerkort. Timeout under kommunikationen mellem iDRAC og kontrolpanelet i venstre side under disse sekvenser fører til de SWC5008-fejlhændelser, der logføres i SEL og i Lifecycle-logfilen.

Figur 2: LED-frontpanel PowerEdge R740XD
Det venstre kontrolpanel (LCP) er beregnet til at understøtte gendannelse ved kassen eller systemtilstand på et øjeblik. Det er placeret øverst i venstre hjørne på kabinettet set forfra på systemet.
På de fleste PowerEdge-servere fås LCP i to udgaver:
- Knap til hurtig synkronisering 2
- Knap til statuslysdiode 1
I en af disse konfigurationer af kontrolpanelet er der fem statuslysdiodeindikatorer, der angiver en hardwarefejl, som påvirker serveren, i realtid direkte på kabinettet. Du kan se en forklaring af disse lysdiodeindikatorer i Figur 3 nedenfor.

Figur 3: Lysdiodetilstandsstatusindikatorer på PowerEdge
Under normale serversundhedsforhold vises disse fem LED'er slukket.
Når der registreres en hardwarefejl på et af de undersystemer, der er justeret med disse LED-indikatorer, lyser baggrundsbelysningen konstant gult.Disse lysdioder styres af iDRAC-controlleren (BMC) via kommunikation på i2c-kredsløbet. Lysbjælkerne for både hurtig synkronisering og system-id styres ikke via dette samme i2c-kredsløb og fungerer uafhængigt af statuslysdioderne.
Resolution
iDRAC9-firmwareversion 4.22.00.53 introducerede mekanismer til gendannelse af frontpanelets LED-controllere fra en blød låsningstilstand. Disse ændringer er i alle iDRAC9-udgivelser fra og med 4.32.10.00. Ændringerne i denne version dækker ikke over ægte hardwarefejl på LED-frontpanelet. Hvis der stadig er fejl, når denne firmware er implementeret, skal du fortsætte med fejlfinding af hardwaren.
Hvis SWC5008-hændelser fortsat registreres efter anvendelse af iDRAC9 4.22.00.53- eller 4.32.10.00-firmware, skal lysdioden i frontpanelet undersøges for mulig hardwarefejl. Følgende fejlfindingstrin bør som udgangspunkt overvejes:
- Kontroller, om der er skader på kablet til styrekortet til lysdioden på frontpanelet.
- Sæt kablet til styrekortet til lysdioden på frontpanelet i igen for at se, om der er forbindelsesproblemer.
- Udskift styrekortet til lysdioden i frontpanelet for at se, om lysdioden er defekt.
- Udskift bundkortet ved eventuelle vedvarende problemer.