PowerVault ME4、ME5:調查電源供應器故障
Summary: PowerVault 系統管理員必須檢查並確認 PCM 或 PSU 可使用電源,且每個 PSU 或 PCM 上的搖桿開關已設為開啟位置,再聯絡 Dell 技術支援部門以回報故障的電源供應器。
Instructions
PowerVault 系統管理員可能會觀察到與電源冷卻模組 (PCM) 或電源供應單元 (PSU) 未運作、提供冗餘或回報故障相關的事件。PCM 或 PSU 可能沒有故障。
如果電源供應器斷電,PowerVault ME5 系列陣列會在 PowerVault Manager 中回報下列警示。
- 電源供應器未接收到任何輸入電源
- 電源供應器未提供 DC 電壓。
調查 PCM 或 PSU 警示背後的原因時,請考慮下列可能的原因:
1.PowerVault ME 裝置所在位置最近是否發生停電?
- 機架中的多個裝置是否受到停電影響?
- 來自機架內其他裝置的事件記錄 (例如 Dell PowerEdge iDRAC 事件記錄) 可能會指出機架中其他裝置對應的斷電。檢查其他裝置是否可使用電源。
- 如果 PowerVault ME 具有連接至備援乙太網路或光纖通道交換器的纜線連接,當交換器或直接連接主機使用的相同電力來源中斷時,系統管理員可能會發現管理或主機連接埠關閉。
- 如果使用不斷電系統 (UPS) 或備用發電機,則可繼續為一個 PCM/PSU 供電,但另一個則無法供電。
- 洽詢現場人員,確認該處是否確實發生過停電,或者現場裝置是否在後備發電機或備用 UPS 上執行。
2.使用機架配電裝置 (PDU) 時,請確認 PDU 正常運作並接收電力。
- 由於備援或站台電源負載平衡要求,部分站台會使用 3 相電源,或將機架中的每個 PDU 連接至不同的電力供應商或發電機來源。確認 PowerVault ME 的所有電力來源均正常運作。
- 在可遠端管理機架 PDU 的地方,請使用 PDU 監控記錄,確認 PDU 並未故障,且 PowerVault ME 裝置使用的插座已啟用電源。
- 確認機架 PDU 的載入並未超過製造商的評等。請查看 PDU 廠商說明文件,如果懷疑超載,請與現場的電氣技師合作測量,並採取措施重新分配負載。
- 網站管理員可使用 Dell Enterprise Infrastructure Planning Tool 來計算電力與冷卻需求。
3.如果機架內最近進行過現場維護,或使用 PowerVault ME 陣列進行維護,請確定電源供應器仍然連接至已知良好的電源,且每個電源供應器上的搖桿開關均設於開啟的位置。
4.請想想 PowerVault ME 機櫃所在位置的現場環境條件如何?
- 如果此故障是由於資料中心或伺服器機房的火災、水患或其他故障而發生,則管理員必須先解決這些問題再繼續。
- 操作 PowerVault ME 的環境需求列於下方連結擁有者指南手冊中的「技術規格」一節。
5.每個電源供應器都有 LED,可協助現場人員判斷問題來源。
6.更換故障的電源供應器時,請更換為與原本相同的 80 PLUS® 額定效率。
- 如果出現不相符的情況,PowerVault ME 會在更換後回報 PSU 或 PCM 處於降級狀態。
- 若要判斷正在使用的 PSU 類型,請開啟連接至 ME 陣列的 SSH 工作階段並執行命令,
show power-supplies然後使用下表尋找零件編號,或者在實體電源供應單元上尋找 80 PLUS® 標籤。
# show power-supplies Encl Id Serial Number Part Number Name Firmware Version Health ------------------------------------------------------------------------------------------ 0 0 CN03PD98FCG0015J00NIA00 3PD98 PSU 0, Left 033D OK 0 1 CN03PD98FCG0015J00OMA00 3PD98 PSU 1, Right 033D OK ------------------------------------------------------------------------------------------ Success: Command completed successfully. (2024-03-13 08:58:43) #
此表列出電源供應器零件編號,以及 PowerVault ME 系列所使用的對應 80 PLUS® 電源效率。由於實施歐盟 ErP Lot 9 法規,部分地區會出現差異。在法規實施前出貨的系統,在更換故障零件時會繼續使用原始規格的 PCM/PSU。
-
PowerVault ME 機櫃類型
Dell 零件編號 80 PLUS® 零件說明 註解 2U 機箱 DYJW5 
電源供應器,580 瓦,白金級,含 LED,2U,版本 3 請勿與黃金級額定功率冷卻模組 (PCM) 混用。 NKVWF 
580 瓦,含 LED,電源供應器,2U 0VMRF 
580 瓦,含 LED,電源供應器,2U 3PD98 
580 瓦,含 LED,版本 2,電源供應器,2U 5U 84 機箱 0R4C4 
電源供應器,2200 瓦,鈦金級,5U84,版本 4 請勿與白金級電源供應器 (PSU) 混用。 KG1JH 
電源供應器,2.2KW,5U84,V2 6JN28 
2200 瓦,5U84,版本 3,電源供應器
Dell 擁有者手冊包含更換 PowerVault ME 陣列零件的指示。若要更換電源供應器,請尋找「客戶可更換組件 (CRU)」一節
ME5012、ME5024、ME4012、ME4024、ME412 和 ME424 機櫃的電源冷卻模組 (PCM) 狀態 LED 位置

圖 1. ME4 系列後側 2U 機箱 PCM 位置和方向。

圖 2 - 2U 機箱 PowerVault ME 系列的 AC 電源冷卻模組
-
電源冷卻模組 LED 狀態 (2U 機箱) PCM 正常
(綠色)風扇故障
(琥珀色)AC 故障
(紅色)DC 故障
(琥珀色)狀態 關閉 關閉 關閉 關閉 所有 PCM 均無 AC 電源 關閉 關閉 開啟 開啟 僅此 PCM 上沒有 AC 電源 開啟 關閉 關閉 關閉 存在 AC;PCM 正常運作 開啟 關閉 關閉 開啟 PCM 風扇速度超過可接受限制 關閉 開啟 關閉 關閉 PCM 風扇故障 關閉 開啟 開啟 開啟 PCM 故障 (溫度過高、電壓過高、電流過大) 關閉 閃爍 閃爍 閃爍 PCM 韌體正在下載中 閃爍 關閉 關閉 關閉 兩個控制器模組皆遺失。
ME5084、ME4084 和 M484 機櫃的電源供應單元 (PSU) 狀態 LED 位置
圖 3. 顯示 PSU 位置的 5U84 機箱後視圖
圖 4。 5U84 機箱電源供應器近視圖
-
5U84 機箱 PSU LED 狀態 CRU 故障
(琥珀色)AC 遺失
(琥珀色)電源
(綠色)狀態 開啟 關閉 關閉 兩個 PSU 均無 AC 電源。 開啟 開啟 關閉 存在 PSU,但未供電或 PSU 處於警示狀態。(通常是由於臨界溫度) 關閉 關閉 開啟 存在主要 AC,且已開啟。此 PSU 正在供電。 關閉 關閉 閃爍 存在 AC 電源,PSU 處於待機狀態 (其他 PSU 正在供電)。 閃爍 閃爍 關閉 PSU 韌體正在下載中。 關閉 開啟 關閉 AC 電源遺失,PSU 處於待機狀態 (其他 PSU 正在供電)。 開啟 開啟 開啟 韌體失去與 PSU 模組的通訊。 開啟 — 關閉 PSU 故障。按照擁有者手冊中「更換 PSU」的程序操作。
若要聯絡 Dell 技術支援部門,請使用下列 URL:https://www.dell.com/support/incidents-online/ContactUs
1.列出故障診斷步驟的結果,或為了隔離故障而已經執行的檢查結果。
2.盡可能從 PowerVault ME 陣列收集支援套裝