PowerStore:数据收集失败且 PowerStore Manager 用户界面报告异常信息

Сводка: PowerStore Manager 用户界面报告不正确的值、错误或作业失败。支持材料或支持数据收集 (DC) 无法运行或卡在运行状态。

Данная статья применяется к Данная статья не применяется к Эта статья не привязана к какому-либо конкретному продукту. В этой статье указаны не все версии продуктов.

Симптомы

症状包括:

  • 支持材料或支持数据收集 (DC) 无法运行,或在 PowerStore Manager 用户界面 (UI) 中卡在运行状态。通过 CLI 运行 DC (svc_dc run) 失败,并显示: 
    • FAILURE, Running too long
    • Timed out receiving service data bundle command response from container
  • 卷显示容量为 0 GB。  
  • 无法创建或删除任何对象(例如卷等)。  
  • 无法扩展卷 - 错误 0xE0A080030019。
  • 保护策略不再起作用(未创建新快照且旧快照未过期),并且复制验证失败。
  • 无法或查看或更改 SSH 状态。错误:There was an error retrieving this information.Unknown property is_ssh_enabled requested.(0xE04040020002)
  • LDAP 域连接错误
  • 根分区已满或空间不足警报。不会从辅助节点上的 /cyc_var/cyc_service/tmp 清理临时 DC 文件,这可能会导致根分区空间用尽。系统生成警告:Root partition usage of node X has exceeded Y% (codes: 0x00400601 or 0x00400602)
  • 在一些极端情况下,没有及时采取措施解决根分区空间问题,辅助节点可能会进入服务模式。
  • 监视 > 系统检查 > 运行系统检查失败,Fireman 命令失败。(0xE0F010200004)



PowerStore Manager 中显示的 DC 问题的示例:

image.png


从 PowerStore Manager 中看到的系统检查失败的示例:

image.png


 

Причина

许多泄漏的 systemd 登录会话会导致服务容器中的内存泄漏。由于内存不足,服务容器中的 fireman 服务在 DC 收集期间终止。

如果在 fireman 服务终止后系统未检测到其失败情况,fireman 服务将保持停止运行状态。

Разрешение

修复

用于防止此问题发生的修复程序在 PowerStoreOS 2.1.1.0-1649887 中。建议升级。

此修复程序列示在 PowerStoreOS 版本 2.1.1.0 发行说明修订版 A03 或更高版本中:
问题 ID 功能领域 描述
MDT-361718  PowerStore Manager(GUI) 由于控制路径或管理资源方面的问题,PowerStore 系统用户界面随着时间的推移可能会性能下降。性能下降可能会导致响应缓慢或 PowerStore Manager (UI) 无法收集数据。

解决方法


提醒:此解决方法仅适用于 PowerStore T 型号。PowerStore X 具有在重新启动任何服务之前必须执行的更多要求和步骤。

如果问题已经存在,请联系 戴尔技术支持 或您的授权服务代表,并在尝试升级之前引用此知识库文章 ID。

要在此问题已经存在的情况下解决此问题,必须重新启动两个服务。
  • 受影响节点上的服务容器。
    • 服务容器需要大约 10 分钟才能重新启动。
    • 除了短暂失去对受影响节点的服务容器(SSH 或 CLI)的访问权限外,对系统没有影响。
  • 控制路径 (CP) 或管理服务。
    • 重新启动大约需要五分钟。
    • 除了短暂失去对 PowerStore Manager 用户界面的访问权限外,对系统没有任何影响。

几分钟后,辅助节点根分区上的空间会下降到正常水平。

如果 /cyc_cfs 分区超过 85%,请从 PowerStore Manager 用户界面中删除旧 DC。

重新启动服务后,您可能会看到一些警报,例如:
  • SupportAssist 连接警报。
  • 复制 RPO 未满足警报。
  • 快照自动删除警报。
这些都应在行动计划之后自行清除。给它足够的时间,因为有些人可能需要等到下一个 RPO 周期(复制)或快照计划才能开始。

Дополнительная информация

发现问题

检查是否有大量泄露的登录会话(如果数字大于 5000,则存在问题):
[SVC:service@xxxxxxx-A ~]$ ll /run/systemd/system/ | wc -l  
23251


DC 失败并显示错误 FAILURE, Running too long:
[SVC:service@xxxxxxx-A user]$ svc_dc list e62c17be-7716-49ef-a0b0-7365db383e6e
start_timestamp            2022-01-19 04:42:46
end_timestamp              2022-01-19 04:59:46
status                     FAILURE
status_message             FAILURE, Running too long.
state                      OFFLINE
description
profiles                   Essential
creator_type               Manual
compressed_size
uncompressed_size
uploaded                   Never
downloaded                 Never
id                         e62c17be-7716-49ef-a0b0-7365db383e6e


如果主节点上不再存在 fireman 进程,DC 会失败并显示错误“Timed out receiving service data bundle command response from container”:
[SVC:service@xxxxxxx-B user]$ svc_dc list 7ad948cb-5029-422f-b4dc-5bf2f9abf512
start_timestamp            2021-10-21 06:03:11
end_timestamp              2021-10-21 06:03:11
status                     FAILURE
status_message             Timed out receiving service data bundle command response from container  
state                      OFFLINE
description                2021-10-21 Daily Data Collection
profiles                   Essential
creator_type               Scheduled
compressed_size
uncompressed_size
uploaded                   Never
downloaded                 Never
id                         7ad948cb-5029-422f-b4dc-5bf2f9abf512

Затронутые продукты

PowerStore

Продукты

Storage, Entry Level & Midrange, PowerStore, PowerStore 1000X, PowerStore 1000T, PowerStore 3000X, PowerStore 3000T, PowerStore 5000X, PowerStore 5000T, PowerStore 500T, PowerStore 7000X, PowerStore 7000T, PowerStore 9000X, PowerStore 9000T
Свойства статьи
Номер статьи: 000193605
Тип статьи: Solution
Последнее изменение: 29 May 2024
Версия:  21
Получите ответы на свои вопросы от других пользователей Dell
Услуги технической поддержки
Проверьте, распространяются ли на ваше устройство услуги технической поддержки.