PowerFlex:使用复制时的客户端 IO 错误

Resumen: 客户端/服务器遇到针对 PowerFlex 支持的设备 IO 错误。整体后端 (MDM/SDS) 似乎运行良好。正在使用 PowerFlex 复制,并且针对 1 个或多个 RCG 存在一些 RPO 错误。

Este artículo se aplica a Este artículo no se aplica a Este artículo no está vinculado a ningún producto específico. No se identifican todas las versiones del producto en este artículo.

Síntomas

  • 无降级或故障容量
  • 没有分离的 SDS 或报告错误的 SDS 设备。
  • 没有断开连接的 MDM

正在使用复制功能。
UI 中的一个或多个警报报告以下错误:

Major - The RCG consistent image is too large to be consumed by the destination in one piece.

Minor - Remote Consistency Group RPO Exceeded
MDM 事件日志可能会报告以下内容:
2024-06-11 15:55:56.592000:0001566:RPL_PD_CAP_UTILIZATION_MINOR     WARNING  Protection Domain ID <pd_id> Replication journal capacity is at MINOR utilization level
2024-06-11 16:20:12.848000:0001567:RPL_PD_CAP_UTILIZATION_MAJOR     ERROR    Protection Domain ID <pd_id> Replication journal capacity is at MAJOR utilization level
2024-06-11 17:19:57.272000:0001584:RPL_PD_CAP_UTILIZATION_CRITICAL  CRITICAL Protection Domain ID <pd_id> Replication journal capacity is at VERY_HIGH utilization level
2024-06-11 17:52:26.352000:0001585:RPL_PD_CAP_UTILIZATION_CRITICAL  CRITICAL Protection Domain ID <pd_id> Replication journal capacity is at CRITICAL utilization level
...
2024-06-11 16:25:14.381000:0001576:RPL_CG_MOVED_TO_SLIM_MODE        INFO     Replication Consistency Group ID <rcg_id> entered slim mode
2024-06-11 18:27:29.738000:0001586:SDR_CRITICAL_CAP_CHANGE          ERROR    SDR ID <sdr_id>) handling user data changed discarded old user data and stopped to accumulate new user data due critical capacity
 

影响 

客户端无法访问截获用于复制的卷。


Causa

如果 MDM 和 SDR 组件在与日志容量相关的内部计数器上存在分歧,则可能会发生罕见的软件缺陷。当 SDR 的容量已满时,此差异可能会导致 MDM 取消分配额外的日志容量,从而可能导致使用 PowerFlex 支持的设备的客户端/服务器上出现 IO 错误。

Resolución

需要滚动重新启动所有 SDR 组件,并且必须切换源系统上的 MDM 所有权才能解决问题。

重新启动 SDR 组件:

1) 识别所有 SDR:

scli --query_all_sdr

2) 在 SDR 上进入维护模式:

scli --enter_sdr_maintenance_mode --sdr_name <name>

3) 通过运行步骤 1 中的命令,验证 SDR 是否完全处于维护模式。

4) 重新启动 SDR 组件。

pkill sdr

5) 对源站点上的所有 SDR 重复此作。

重新启动所有 SDR 后,切换 MDM 所有权:

#3.x
scli --switch_mdm_ownership --new_master_mdm_name <name>
 
#4.x
scli --switch_mdm_ownership --new_primary_mdm_name <name>

*如果需要,可以将所有权转移回原始 MDM 服务器。

验证不再报告客户端/服务器上的 IO 错误。如果客户端已进入只读文件系统,则客户端/服务器可能需要重新启动。

在确定原因之前,还建议终止源系统上的所有 RCG。

如果应用上述步骤后 IO 错误仍然存在,请联系 PowerFlex 工程部门。

Información adicional

受影响的版本

PowerFlex 3.x

PowerFlex 4.x

已修复问题的版本

PowerFlex 4.5.3
PowerFlex 4.5.4 — 升级到 4.5.4 HF1
PowerFlex 4.5.5 — 无可用修复。
PowerFlex 4.5.6 及更高版本

Productos afectados

PowerFlex Software
Propiedades del artículo
Número del artículo: 000227849
Tipo de artículo: Solution
Última modificación: 02 mar 2026
Versión:  10
Encuentre respuestas a sus preguntas de otros usuarios de Dell
Servicios de soporte
Compruebe si el dispositivo está cubierto por los servicios de soporte.