PowerVault ME4、ME5:调查电源装置故障
Summary: PowerVault 管理员必须检查并确认 PCM 或 PSU 有电源供应,并且每个 PSU 或 PCM 上的翘板开关已设置为打开位置,然后再联系戴尔技术支持,报告出故障的电源装置。
Instructions
PowerVault 管理员可能会观察到与电源冷却模块 (PCM) 或电源装置 (PSU) 未运行、提供冗余或报告故障相关的事件。PCM 或 PSU 可能没有故障。
在电源装置断电的情况下,PowerVault ME5 系列阵列将在 PowerVault Manager 中报告以下警报。
- 电源装置未接收到任何输入电源
- 电源装置未提供直流电压。
在调查引起 PCM 或 PSU 警报的原因时,请考虑以下可能的原因:
1.PowerVault ME 设备所在地点最近是否发生过停电?
- 停电是否影响了机架中的多个设备?
- 机架内其他设备的事件日志(例如 Dell PowerEdge iDRAC 事件日志)可能指示机架中其他设备出现相应的断电情况。检查其他设备是否有电源供应。
- 如果 PowerVault ME 通过线缆连接到冗余以太网或光纤通道交换机,则当交换机或直连的主机所使用的同一电源中断时,管理员可能会观察到管理端口或主机端口关闭。
- 在使用不间断电源 (UPS) 或备用发电机的情况下,其中一个 PCM/PSU 可能继续有电源供应,但另一个则没有电源供应。
- 与现场人员核实该地点是否确实发生过停电,或者该地点的设备是否使用后备发电机或备用 UPS 来运行。
2.在使用机架配电装置 (PDU) 的情况下,确认 PDU 正常工作并已接通电源。
- 由于冗余或场所电源负载平衡的要求,某些地点会使用三相电源或将机架中的每个 PDU 连接到不同的电力供应商或发电机来源。确认 PowerVault ME 的所有电源都正常工作。
- 在可远程管理机架 PDU 的情况下,使用 PDU 监控日志来确认 PDU 未出现故障,并确认已为 PowerVault ME 装置使用的插座开启电源。
- 确认机架 PDU 的负载没有超出制造商的额定值。查看 PDU 供应商文档,如果怀疑过载,请与您所在地点的电工合作,测量并采取措施来重新分配负载。
- 站点管理员可以使用戴尔的企业基础设施规划工具来计算电源和冷却要求。
3.如果最近进行过场地维护或在装有 PowerVault ME 阵列的机架内进行过维护,请确保电源装置仍连接到已知良好的电源,并且每个电源装置上的翘板开关均已设置到打开位置。
4.考虑 PowerVault ME 机柜所在位置的场地环境条件如何?
- 如果此故障是由于数据中心或服务器机房发生火灾、水灾或其他故障所致,管理员必须解决这些情况,然后才能继续操作。
- 下面链接的用户指南手册的“技术规格”部分中列出了运行 PowerVault ME 的环境要求。
5.每个电源装置都有 LED 指示灯,可帮助现场人员确定问题根源。
6.在更换故障的电源装置时,请更换为与原始电源装置一样具有相同 80 PLUS® 效率等级的电源装置。
- 如果效率等级不匹配,PowerVault ME 将在更换完成后报告 PSU 或 PCM 处于降级状态。
- 要确定正在使用的 PSU 类型,请打开与 ME 阵列的 SSH 会话,运行命令
show power-supplies并使用下表查找部件编号,或者寻找物理电源装置上的 80 PLUS® 标签。
# show power-supplies Encl Id Serial Number Part Number Name Firmware Version Health ------------------------------------------------------------------------------------------ 0 0 CN03PD98FCG0015J00NIA00 3PD98 PSU 0, Left 033D OK 0 1 CN03PD98FCG0015J00OMA00 3PD98 PSU 1, Right 033D OK ------------------------------------------------------------------------------------------ Success: Command completed successfully. (2024-03-13 08:58:43) #
此表列出了 PowerVault ME 系列使用的电源部件编号和相应的 80 PLUS® 电源效率。由于欧盟 ErP Lot 9 法规的实施,在某些区域会出现差异。法规实施之前发货的系统在更换故障部件时仍继续使用 PCM/PSU 的原始规格。
-
PowerVault ME 机柜类型
戴尔部件编号 80 PLUS® 部件说明 备注 2U 机柜 DYJW5 
电源装置,580 瓦,白金级,带 LED 指示灯,2U,版本 3 请勿与黄金级电源冷却模块 (PCM) 混用。 NKVWF 
580 瓦,带 LED 指示灯,电源装置,2U 0VMRF 
580 瓦,带 LED 指示灯,电源装置,2U 3PD98 
580 瓦,带 LED 指示灯,版本 2,电源装置,2U 5U 84 机柜 0R4C4 
电源装置,2200 瓦,钛金级,5U84,版本 4 请勿与白金级电源装置 (PSU) 混用。 KG1JH 
电源装置,2.2 千瓦,5U84,版本 2 6JN28 
2200 瓦,5U84,版本 3,电源装置
戴尔用户手册包含用于更换 PowerVault ME 阵列上的部件的说明。要更换电源装置,请寻找“客户可更换部件 (CRU)”部分
ME5012、ME5024、ME4012、ME4024、ME412 和 ME424 机柜的电源冷却模块 (PCM) 状态 LED 指示灯位置

图 1. ME4 系列背面 2U 机柜 PCM 位置和方向。

图 2 - 2U 机柜 PowerVault ME 系列的交流电电源冷却模块
-
电源冷却模块 LED 指示灯状态(2U 机柜) PCM 正常
(绿色)风扇故障
(琥珀色)交流电故障
(红色)直流电故障
(琥珀色)状态 熄灭 熄灭 熄灭 熄灭 任何 PCM 上都没有交流电源 熄灭 熄灭 亮 亮 仅此 PCM 上没有交流电源 亮 熄灭 熄灭 熄灭 存在交流电源;PCM 工作正常 亮 熄灭 熄灭 亮 PCM 风扇速度超出可接受范围 熄灭 亮 熄灭 熄灭 PCM 风扇出现故障 熄灭 亮 亮 亮 PCM 故障(温度过高、电压过高、电流过高) 熄灭 闪烁 闪烁 闪烁 PCM 固件下载正在进行中 闪烁 熄灭 熄灭 熄灭 两个控制器模块均缺失。
ME5084、ME4084 和 M484 机柜的电源装置 (PSU) 状态 LED 指示灯位置
图 3. 显示 PSU 位置的 5U84 机柜后视图
图 4. 5U84 机柜电源装置的特写视图
-
5U84 机柜 PSU LED 指示灯状态 CRU 故障
(琥珀色)交流电源缺失
(琥珀色)电源
(绿色)状态 亮 熄灭 熄灭 无交流电源供应给任何一个 PSU。 亮 亮 熄灭 PSU 存在,但未供电或 PSU 处于警报状态。(通常是由于临界温度造成的) 熄灭 熄灭 亮 主交流电源存在,已开启。此 PSU 正在供电。 熄灭 熄灭 闪烁 交流电源存在,PSU 处于待机状态(其他 PSU 正在供电)。 闪烁 闪烁 熄灭 PSU 固件下载正在进行中。 熄灭 亮 熄灭 交流电源缺失,PSU 处于待机状态(其他 PSU 正在供电)。 亮 亮 亮 固件与 PSU 模块失去通信。 亮 — 熄灭 PSU 出现故障。按照用户手册的“更换 PSU”部分的步骤进行操作。
要联系戴尔技术支持,请使用以下 URL:https://www.dell.com/support/incidents-online/ContactUs
1.列出为隔离故障而执行的故障排除步骤或检查的结果。
2.在可能的情况下,从 PowerVault ME 阵列中收集支持包