PowerStore:数据收集失败且 PowerStore Manager 用户界面报告异常信息

Summary: PowerStore Manager 用户界面报告不正确的值、错误或作业失败。支持材料或支持数据收集 (DC) 无法运行或卡在运行状态。

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

症状包括:

  • 支持材料或支持数据收集 (DC) 无法运行,或在 PowerStore Manager 用户界面 (UI) 中卡在运行状态。通过 CLI 运行 DC (svc_dc run) 失败,并显示: 
    • FAILURE, Running too long
    • Timed out receiving service data bundle command response from container
  • 卷显示容量为 0 GB。  
  • 无法创建或删除任何对象(例如卷等)。  
  • 无法扩展卷 - 错误 0xE0A080030019。
  • 保护策略不再起作用(未创建新快照且旧快照未过期),并且复制验证失败。
  • 无法或查看或更改 SSH 状态。错误:There was an error retrieving this information.Unknown property is_ssh_enabled requested.(0xE04040020002)
  • LDAP 域连接错误
  • 根分区已满或空间不足警报。不会从辅助节点上的 /cyc_var/cyc_service/tmp 清理临时 DC 文件,这可能会导致根分区空间用尽。系统生成警告:Root partition usage of node X has exceeded Y% (codes: 0x00400601 or 0x00400602)
  • 在一些极端情况下,没有及时采取措施解决根分区空间问题,辅助节点可能会进入服务模式。
  • 监视 > 系统检查 > 运行系统检查失败,Fireman 命令失败。(0xE0F010200004)



PowerStore Manager 中显示的 DC 问题的示例:

image.png


从 PowerStore Manager 中看到的系统检查失败的示例:

image.png


 

Cause

许多泄漏的 systemd 登录会话会导致服务容器中的内存泄漏。由于内存不足,服务容器中的 fireman 服务在 DC 收集期间终止。

如果在 fireman 服务终止后系统未检测到其失败情况,fireman 服务将保持停止运行状态。

Resolution

修复

用于防止此问题发生的修复程序在 PowerStoreOS 2.1.1.0-1649887 中。建议升级。

此修复程序列示在 PowerStoreOS 版本 2.1.1.0 发行说明修订版 A03 或更高版本中:
问题 ID 功能领域 描述
MDT-361718  PowerStore Manager(GUI) 由于控制路径或管理资源方面的问题,PowerStore 系统用户界面随着时间的推移可能会性能下降。性能下降可能会导致响应缓慢或 PowerStore Manager (UI) 无法收集数据。

解决方法


提醒:此解决方法仅适用于 PowerStore T 型号。PowerStore X 具有在重新启动任何服务之前必须执行的更多要求和步骤。

如果问题已经存在,请联系 戴尔技术支持 或您的授权服务代表,并在尝试升级之前引用此知识库文章 ID。

要在此问题已经存在的情况下解决此问题,必须重新启动两个服务。
  • 受影响节点上的服务容器。
    • 服务容器需要大约 10 分钟才能重新启动。
    • 除了短暂失去对受影响节点的服务容器(SSH 或 CLI)的访问权限外,对系统没有影响。
  • 控制路径 (CP) 或管理服务。
    • 重新启动大约需要五分钟。
    • 除了短暂失去对 PowerStore Manager 用户界面的访问权限外,对系统没有任何影响。

几分钟后,辅助节点根分区上的空间会下降到正常水平。

如果 /cyc_cfs 分区超过 85%,请从 PowerStore Manager 用户界面中删除旧 DC。

重新启动服务后,您可能会看到一些警报,例如:
  • SupportAssist 连接警报。
  • 复制 RPO 未满足警报。
  • 快照自动删除警报。
这些都应在行动计划之后自行清除。给它足够的时间,因为有些人可能需要等到下一个 RPO 周期(复制)或快照计划才能开始。

Additional Information

发现问题

检查是否有大量泄露的登录会话(如果数字大于 5000,则存在问题):
[SVC:service@xxxxxxx-A ~]$ ll /run/systemd/system/ | wc -l  
23251


DC 失败并显示错误 FAILURE, Running too long:
[SVC:service@xxxxxxx-A user]$ svc_dc list e62c17be-7716-49ef-a0b0-7365db383e6e
start_timestamp            2022-01-19 04:42:46
end_timestamp              2022-01-19 04:59:46
status                     FAILURE
status_message             FAILURE, Running too long.
state                      OFFLINE
description
profiles                   Essential
creator_type               Manual
compressed_size
uncompressed_size
uploaded                   Never
downloaded                 Never
id                         e62c17be-7716-49ef-a0b0-7365db383e6e


如果主节点上不再存在 fireman 进程,DC 会失败并显示错误“Timed out receiving service data bundle command response from container”:
[SVC:service@xxxxxxx-B user]$ svc_dc list 7ad948cb-5029-422f-b4dc-5bf2f9abf512
start_timestamp            2021-10-21 06:03:11
end_timestamp              2021-10-21 06:03:11
status                     FAILURE
status_message             Timed out receiving service data bundle command response from container  
state                      OFFLINE
description                2021-10-21 Daily Data Collection
profiles                   Essential
creator_type               Scheduled
compressed_size
uncompressed_size
uploaded                   Never
downloaded                 Never
id                         7ad948cb-5029-422f-b4dc-5bf2f9abf512

Affected Products

PowerStore

Products

Storage, Entry Level & Midrange, PowerStore, PowerStore 1000X, PowerStore 1000T, PowerStore 3000X, PowerStore 3000T, PowerStore 5000X, PowerStore 5000T, PowerStore 500T, PowerStore 7000X, PowerStore 7000T, PowerStore 9000X, PowerStore 9000T
Article Properties
Article Number: 000193605
Article Type: Solution
Last Modified: 29 May 2024
Version:  21
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.