VPLEX:SymptomCode 0x8a4830dc,UPS 负载功率低于预期
摘要: 本文讨论确认报告的 Call Home 是真实事件还是误报事件(可以忽略)所采取的步骤。本文适用于所有 VPLEX 平台。
症状
在 Call home 消息的 CDATA 中指示的 UPS 报告了低于预期的电源问题,如下例所示。
只有双引擎和四引擎群集包含不间断电源 (UPS)。
在 VS2 上,UPS-A 用于光纤通道交换机 A 和管理服务器的备用电池电源,UPS-B 用于光纤通道交换机 B。
在 VS6 上,UPS-A 和 B 仅用于无限频带 (IB) 交换机。
针对此问题发送的呼叫总部示例:
VS2:
SymptomCode : 0x8a4830dc
Category : Status
Severity : Warning
Status : Warning
Component : DIRECTOR
ComponentID : director-1-2-B << component reporting the issue
SubComponent : ZPEM
CallHome : Yes
FirstTime : 20xx-05-07T01:45:58.048Z
LastTime : 20xx-05-07T01:45:58.048Z
Count : x
CDATA[ups@UPS-B: PartNo 078-000-052/SerialNo QS1303140800 /RevNo 1XE1 :UPS load power is lower than expected [Versions:MS{x.x.x.x}, Director{x.x.x.x.x}]
RCA: The fibre channel switch and/or management server are not plugged in to the UPS.
在此 dial home 输出示例中,问题报告群集 1 的 UPS-B 上的 UPS 负载功率低于预期。
原因
报告这些呼叫总部低于预期负载功率的原因可能如下:
VS2:
用于 UPS-A
UPS 看不到管理服务器和/或内部机架安装式光纤通道交换机 A。
适用于 UPS-B
对于内部机架安装的光纤通道交换机 B,UPS 看不到。
VS6:
用于 UPS-A
UPS 看不到内置机架安装式 (IB) 交换机 A 一个或两个电源连接。
适用于 UPS-B
对于内部机架安装的无限 (IB) 交换机 B,UPS 看不到一个或两个电源连接。
解决方案
永久修复:
戴尔 VPLEX 工程部门目前正在调查此问题。修复程序可用后,本文将更新。
本文的目的是验证报告“低于预期功率级别”的任何 UPS 的状态。
要了解如何确定针对此问题报告哪些 UPS 以及来自哪个群集,请查看上面“问题”部分中显示的 Call Home 消息中的 ComponentID。在致电总部消息示例中,它显示“director-1-2-B”报告了问题。记下的第一个值是“1”,这是 cluster-id,在本例中是 cluster-1。由于报告来自“B”控制器“director-1-2-B”,因此这表示报告的是 UPS-B。此外,CDATA 还会告诉您 Call Home 报告针对的是哪个 UPS,“ups@UPS-B”。“UPS”始终连接到任何群集上的引擎 2。
Director-1-2-B
\ \ \------------这表示它是 UPS-B(UPS-A 连接到“A”控制器)
\\--------------这表示控制器位于引擎 2 中。
\--------------- 这表示它是 cluster-1。
要检查此问题是真实的还是误报,请执行以下作:
VS2:
- 验证两根光纤通道交换机电源线是否已插入相应的 UPS,并且 UPS 已插入位于机架安装导轨上的每个配电装置 (PDU)。
- 如果报告了 UPS-A 的事件,请验证管理服务器和 FC COM SWITCH A(位于管理服务器上方)电源线是否已插入 UPS-A。
- 如果报告了 UPS-B 事件,请验证 FC COM SWITCH B 的电源线是否已插入 UPS-B。
- 检查 FC COM 交换机和管理服务器的电源线是否松动。
- 检查每个UPS的串行电缆是否已牢固连接。
- 请参阅本文所附的相应配置、串行和电源布线图。
VS6:
- 验证两个 Infini-Band (IB) 交换机电源线是否已插入相应的 UPS,并且 UPS 已插入每个 PDS 设备。
- 如果报告了 UPS-A 事件,请验证 Infini-Band 交换机 A 电源线是否已插入 UPS-A。
- 如果报告了 UPS-B 的事件,请验证 Infini-Band 交换机 B 电源线是否已插入 UPS-B。
- 检查 IB 交换机的电源线是否松动。
- 检查每个UPS的串行电缆是否已牢固连接。
- 请参阅本文所附的相应配置、串行和电源布线图。
要检查 UPS 是否恢复到正常运行状态,在下面的示例中,将使用 cluster-1:
-
登录到报告呼叫总部的 VPLEX 群集的管理服务器
输出示例:
login as: service Using keyboard-interactive authentication. Password: Last login: Day Month Date HH:MM:SS Year from x.x.x.x < IP Address the login is from service@ManagementServer:~>
-
接下来,使用用于访问管理服务器的相同凭据访问 VPlexcli
运行低于 6.x 版本的 VPLEX VS2 上的输出示例,对于 6.x 版本,不需要第二次登录即可访问 VPlexcli:
service@ ManagementServer:~> vplexcli Trying ::1... Connected to localhost. Escape character is '^]'. Enter User Name: service Password: Creating logfile:/var/log/VPlex/cli/session.log_service_localhost_Logfile_T24531_YYYYMMDDHHMMSS VPlexcli:/>
-
将目录 (cd) 更改为 UPS 上下文并列出 UPS 的
输出示例:
VPlexcli:/> cd /clusters/cluster-1/uninterruptible-power-supplies VPlexcli:/clusters/cluster-1/uninterruptible-power-supplies> ll Name ------- ups-2-a ups-2-b
-
浏览到 Call Home 警报所针对的 UPS 上下文级别,并列出详细信息。在此示例中,如果您回顾 Issue 部分中的 call home 消息示例并查看 CDATA。您会看到 ups@UPS-B,再看上方的“ComponentID”,可以看到“director-1-2-B”。第一个数字表示群集,在本例中,“1”表示群集-1。转至 cluster-1,然后深入查看“uniterruptible-power-supplies”上下文,然后查看 ups-2-b,如下所示。
输出示例:
VPlexcli:/clusters/cluster-1/uninterruptible-power-supplies> cd ups-2-b VPlexcli:/clusters/cluster-1/uninterruptible-power-supplies/ups-2-b> ll
VS2:
Name Value ------------------------ ------------- battery-replacement-date 03/23/10 < date battery was installed in the UPS, if more than 3 years old the UPS must be replaced battery-status fully-charged << check this value battery-time-remaining 5min operational-status online << check this value part-number 078-000-052 << note the part number of the UPS revision-number 1XE1 serial-number <UPS Serial Number>
VS6:
Name Value ------------------------ ------------- battery-replacement-date 09/21/15 battery-status fully-charged << check this value battery-time-remaining 5min operational-status online << check this value part-number 078-000-079 << note the part number of the UPS revision-number FFF serial-number <UPS Serial Number>
检查误报事件:
-
如果“battery-status”显示为 fully charge ,并且“operational-status”显示为 online,则可以忽略该问题。该警报很可能是误报。此问题可能是在UPS执行的电池测试/充电周期期间报告的。这可以通过检查固件日志和 call home 日期的日期来确认这一点,这可以从“问题”部分中列出的 call home 消息示例中注意到,查找“LastTime”日期,然后搜索固件日志中 Call Home 的 CDATA 中列出的 UPS“序列号”。
固件日志中报告的UPS电池测试/充电周期示例:
VS2:
负载功率低于预期的报告:128.221.253.38/xmmg/log:5988:W/"154559":109:<4>20xx/11/04 10:36:26.54: ZPEM/220 ups@UPS-B: PartNo 078-000-052 /SerialNo QS1322142106 /RevNo 1XE1 : UPS load power is lower than expected.
ups出现故障的报告:
128.221.253.38/xmmg/log:5988:W/"154559":110:<3>20xx/11/04 10:36:26.54: ZPEM/471 ups@UPS-B: PartNo 078-000-052 /SerialNo QS1322142106 /RevNo 1XE1 : The operational state of the specified fru is Faulted.
UPS电池正在充电的报告:
128.221.252.38/xmmg/log:5988:W/"154559":111:<4>20xx/11/04 10:36:38.40: ZPEM/211 ups@UPS-B: PartNo 078-000-052 /SerialNo QS1322142106 /RevNo 1XE1 : battery-status is Charging <<< this tells us the UPS is in battery test or charging mode
UPS的报告现在正在工作,不再被视为有故障:
128.221.252.70/xmmg/log:5988:W/"154559":112:<6>20xx/11/04 10:36:38.40: ZPEM/87 ups@UPS-B: PartNo 078-000-052 /SerialNo QS1322142106 /RevNo 1XE1 : The operational state of the specified fru has changed to Working. << this says the battery test/charging phase is over and the UPS is back on AC
检查UPS是否真的有故障:
-
如果“battery-status”显示 为“Voltage ”且“operational-status”显示 为联机,请在大约 5 分钟后再次检查,因为电池测试/充电模式可能仍在进行中。如果五分钟后,“battery-status”显示 “enginging ”,并且“operational-status”显示 “offline ”或 “failure”,这可能表明UPS有问题,您必须更换出现故障的UPS。
-
对于 UPS 更换,您必须联系 VPLEX 支持,让他们知道您的发现以及必须更换 UPS。提及这篇文章。
如何使用聊天联系戴尔 VPLEX 支持:
要获得支持,请首先转至 Dell Support.com。在“欢迎使用戴尔支持”页面的顶部看到“搜索戴尔或识别您的产品”时,输入 VPLEX 系列、VPLEX VS2 或 VPLEX VS6,然后向下滚动并在右侧查看并查找“联系技术支持”。如果您有有效服务合同,请登录。如果您没有有效服务合同,请联系您当地的戴尔代表以获得进一步的帮助。使用有效服务合同后,您应该会看到 Technical Issues页面,在这里您可以看到有关如何联系 VPLEX 支持的选项。
其他信息
- VS2 FC COM 交换机、管理服务器和 PDU
- VS6 无限频段 (IB) 交换机和 PDU