Article Number: 000181333
Dell EMC PowerEdge 執行 iDRAC9 的伺服器,可能會出現在系統事件記錄(SEL)中參照前 LED 的過度 SWC5008 錯誤。SWC5008 事件也可能出現在 iDRAC9 生命週期記錄檔中。發生這些錯誤的原因有多種。本文將提供有關 LED 控制板的背景資訊,以及診斷錯誤 sightings 的方法。
SWC5008 錯誤如下圖1所示,表1和2顯示。
圖1: IDRAC9 儀表板嚴重系統健全狀況範例
表 1:系統事件記錄(SEL)範例
2020-06-02 07:08:15 |
2 |
由於硬體錯誤狀況,無法存取前面的 LED 面板。 |
表 2:生命週期記錄範例
2020-06-02 07:08:15 |
677 |
SWC5008 |
由於硬體錯誤狀況,無法存取前面的 LED 面板。 |
由嵌入式 PowerEdge 伺服器上的 iDRAC (BMC)控制器監視和管理左前方 LED 控制台。定期狀態查詢每五秒執行一次,以驗證前 LED 面板的狀態和目前健全狀況。IDRAC 也能維持本控制板上目前安裝的固件。如果 iDRAC 的固件中有適用的更新,iDRAC 會在 iDRAC 開機週期中嘗試推送 LED 固件更新。在上述任一順序中,iDRAC 使用 i2c 電路與此 LED 控制板通訊。這些順序中 iDRAC 和左側控制台之間的通訊超時,會導致 SEL 和生命週期記錄中記錄的 SWC5008 錯誤事件。
圖 2:前 LED 面板 PowerEdge R740XD
左側控制台(LCP)旨在提供主機殼管理或系統健全狀況的概覽。它位於主機殼的左側,從系統正面查看。
在大多數 PowerEdge 伺服器上,LCP 的提供方式有兩個選項:
在上述任一控制台配置中,有五個狀態 LED 指示燈可提供即時的主機殼指示,代表影響伺服器的硬體故障。如圖3所示,會顯示這些指示燈 Led 的說明。
圖 3:LED 健全狀況狀態指示燈 PowerEdge
這些 Led 由 iDRAC (BMC)控制器透過 i2c 電路上的通訊控制。快速同步和系統 ID 的指示燈不受此相同的 i2c 電路管理,且獨立于狀態 Led 運作。
iDRAC9 固件版本4.22.00.53 推出的機制,可從軟鎖定情況中復原前面板 LED 控制器。這些變更將包含在所有以4.32.10.00 開頭的 iDRAC9 版本中。此版本所包含的變更將不會遮罩真正的前 LED 面板硬體故障。如果在執行此固件後,錯誤仍然存在,請繼續為硬體進行故障排除。
Dell EMC 建議升級至最新的 iDRAC9 固件,以解決此問題。請參閱適用于您系統的最新 iDRAC9 固件的 IDRAC9 版本和版本 資訊。注:每個系統的固件可能會有所不同。如果在套用 iDRAC9 4.22.00.53 或4.32.10.00 固件後,繼續記錄 SWC5008 事件,則應調查前 LED 面板是否可能發生硬體故障。下列故障排除步驟應視為起始點:
iDRAC9 - 3.0x Series, iDRAC9 - 3.1x Series, iDRAC9 - 3.2x Series, iDRAC9 - 3.3x Series, iDRAC9 - 3.4x Series, iDRAC9 - 4.xx Series
30 Jun 2021
6
Solution