PowerFlex:使用复制时的客户端 IO 错误

Summary: 客户端/服务器遇到针对 PowerFlex 支持的设备 IO 错误。整体后端 (MDM/SDS) 似乎运行良好。正在使用 PowerFlex 复制,并且针对 1 个或多个 RCG 存在一些 RPO 错误。

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

  • 无降级或故障容量
  • 没有分离的 SDS 或报告错误的 SDS 设备。
  • 没有断开连接的 MDM

正在使用复制功能。
UI 中的一个或多个警报报告以下错误:

Major - The RCG consistent image is too large to be consumed by the destination in one piece.

Minor - Remote Consistency Group RPO Exceeded
MDM 事件日志可能会报告以下内容:
2024-06-11 15:55:56.592000:0001566:RPL_PD_CAP_UTILIZATION_MINOR     WARNING  Protection Domain ID <pd_id> Replication journal capacity is at MINOR utilization level
2024-06-11 16:20:12.848000:0001567:RPL_PD_CAP_UTILIZATION_MAJOR     ERROR    Protection Domain ID <pd_id> Replication journal capacity is at MAJOR utilization level
2024-06-11 17:19:57.272000:0001584:RPL_PD_CAP_UTILIZATION_CRITICAL  CRITICAL Protection Domain ID <pd_id> Replication journal capacity is at VERY_HIGH utilization level
2024-06-11 17:52:26.352000:0001585:RPL_PD_CAP_UTILIZATION_CRITICAL  CRITICAL Protection Domain ID <pd_id> Replication journal capacity is at CRITICAL utilization level
...
2024-06-11 16:25:14.381000:0001576:RPL_CG_MOVED_TO_SLIM_MODE        INFO     Replication Consistency Group ID <rcg_id> entered slim mode
2024-06-11 18:27:29.738000:0001586:SDR_CRITICAL_CAP_CHANGE          ERROR    SDR ID <sdr_id>) handling user data changed discarded old user data and stopped to accumulate new user data due critical capacity
 

影响 

客户端无法访问截获用于复制的卷。


Cause

如果 MDM 和 SDR 组件在与日志容量相关的内部计数器上存在分歧,则可能会发生罕见的软件缺陷。当 SDR 的容量已满时,此差异可能会导致 MDM 取消分配额外的日志容量,从而可能导致使用 PowerFlex 支持的设备的客户端/服务器上出现 IO 错误。

Resolution

需要滚动重新启动所有 SDR 组件,并且必须切换源系统上的 MDM 所有权才能解决问题。

重新启动 SDR 组件:

1) 识别所有 SDR:

scli --query_all_sdr

2) 在 SDR 上进入维护模式:

scli --enter_sdr_maintenance_mode --sdr_name <name>

3) 通过运行步骤 1 中的命令,验证 SDR 是否完全处于维护模式。

4) 重新启动 SDR 组件。

pkill sdr

5) 对源站点上的所有 SDR 重复此作。
 

重新启动所有 SDR 后,切换 MDM 所有权:

#3.x
scli --switch_mdm_ownership --new_master_mdm_name <name>
 
#4.x
scli --switch_mdm_ownership --new_primary_mdm_name <name>

*如果需要,可以将所有权转移回原始 MDM 服务器。

验证不再报告客户端/服务器上的 IO 错误。如果客户端已进入只读文件系统,则客户端/服务器可能需要重新启动。

在确定原因之前,还建议终止源系统上的所有 RCG。

如果应用上述步骤后 IO 错误仍然存在,请联系 PowerFlex 工程部门。

Additional Information

受影响的版本

PowerFlex 3.x

PowerFlex 4.x

已修复问题的版本

PFMP 4.5.3

Affected Products

PowerFlex Software
Article Properties
Article Number: 000227849
Article Type: Solution
Last Modified: 17 Nov 2025
Version:  6
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.