PowerEdge:iDRAC9:SWC5008:由於硬體狀況,無法存取前 LED 面板
Summary: 本文說明影響執行 iDRAC9 的 PowerEdge 伺服器的問題,其中錯誤SWC5008在 SEL 中多次出現。
Symptoms
執行 iDRAC9 的 Dell PowerEdge 伺服器在參照系統事件記錄 (SEL) 的前 LED 時,可能會出現過多的SWC5008錯誤。SWC5008事件也可能出現在 iDRAC9 生命週期記錄中。發生這些錯誤的原因多種多樣。本文提供有關 LED 控制器板的背景資訊,以及診斷錯誤狀況的方法。
Description:
SWC5008錯誤如下圖 1 和表 1 和 2 所示。
圖 1: iDRAC9 儀表板嚴重系統健全狀況範例
表 1:系統事件記錄 (SEL) 範例
|
2020-06-02 07:08:15 |
2 |
由於硬體錯誤狀況,無法存取前 LED 面板。 |
表 2:生命週期記錄範例
|
2020-06-02 07:08:15 |
677 |
SWC5008 |
由於硬體錯誤狀況,無法存取前 LED 面板。 |
Cause
左前 LED 控制面板由內嵌於 PowerEdge 伺服器的 iDRAC (BMC) 控制器監控和管理。每五秒進行一次定期狀態查詢,以驗證前 LED 面板是否存在和當前運行狀況。iDRAC 也會維護此控制器板上目前已安裝的韌體。如果 iDRAC 韌體中有適用的更新,iDRAC 會在 iDRAC 開機週期期間嘗試推送 LED 韌體更新。在上述任一順序中,iDRAC 會使用 i2c 電路與此 LED 控制器板通訊。在這些序列中,iDRAC 和左側控制面板之間的通訊逾時會導致 SEL 和生命週期記錄中記錄SWC5008錯誤事件。

圖 2:PowerEdge R740XD
前 LED 面板 左側控制面板 (LCP) 旨在支援現有管理功能或系統健全狀況一覽。從系統正面檢視時,它位於機箱的左側掛耳上。
在大多數 PowerEdge 伺服器上,LCP 提供兩種選項:
- Quick Sync 2 按鈕或
- 狀態 LED 1 按鈕
在上述任一種控制面板配置中,有五個狀態 LED 指示燈可即時指示影響伺服器的硬體故障。這些指示燈 LED 的說明如下圖 3 所示。

圖 3:LED 健全狀況指示燈 PowerEdge
在正常的伺服器健全狀況下,這五個 LED 會顯示為熄滅。
當在對準這些 LED 的其中一個子系統上偵測到硬體故障時,背光將以恆亮琥珀色狀態亮起。這些 LED 是由 iDRAC (BMC) 控制器透過 i2c 電路上的通訊加以控制。Quick Sync 和系統 ID 的指示燈條不是透過相同的 i2c 電路管理,而是獨立於狀態 LED 運作。
Resolution
iDRAC9 韌體版本 4.22.00.53 導入機制,可將前面板 LED 控制器從軟鎖定狀態復原。從 4.32.10.00 開始,所有 iDRAC9 版本皆有這些變更。此版本中的變更不會遮蔽真正的前 LED 面板硬體故障。如果在實作此韌體後仍出現錯誤,請繼續對硬體進行故障診斷。
如果在套用 iDRAC9 4.22.00.53 或 4.32.10.00 韌體後仍持續記錄SWC5008事件,則應調查前 LED 面板是否可能發生硬體故障。應以下列故障診斷步驟作為起點:
- 檢查前 LED 控制板纜線是否受損。
- 若發生連線問題,請重新插上前 LED 控制板纜線。
- 如果 LED 故障,請更換前 LED 控制板。
- 更換系統主機板,以免任何問題持續存在。