PowerFlex 3.x 性能问题,在向后重建期间可能出现 I/O 错误

摘要: 在向后重建事件期间可能会报告 I/O 错误。 在严重的情况下,卷可能变为只读状态并导致数据不可用。 在向后重建期间,将切换梳子角色(主/辅助)。当 SDS 1) 从维护模式中删除,或 2) SDS 发生故障并立即恢复时,可能会发生向后重建。

本文适用于 本文不适用于 本文并非针对某种特定的产品。 本文并非包含所有产品版本。

症状

场景
MDM 在重建期间向 SDS 发送许多控制命令,但 SDS 无法及时处理这些命令。

症状
在以下条目中,MDM 尝试执行 Comb 角色切换,但 SDS 需要 30 秒才能完成作。在此示例中,此 30 秒延迟足以使卷变为只读。

15/06 04:18:18.362502 0x7f3cc590ddb0:multiHeadMgr_HandleNetRPCResponse:02653: TgtId: 5ce02d7e00000003 RC: TIMEOUT CombID: 71e0000480e3 msgType: TGT_MSG_TYPE__SET_COMB_STATE
15/06 04:18:23.364575 0x7f3cc5904db0:multiHeadMgr_HandleNetRPCResponse:02653: TgtId: 5ce02d7e00000003 RC: TIMEOUT CombID: 71e0000480e3 msgType: TGT_MSG_TYPE__SET_COMB_STATE
15/06 04:18:28.370493 0x7f3cc5928db0:multiHeadMgr_HandleNetRPCResponse:02653: TgtId: 5ce02d7e00000003 RC: TIMEOUT CombID: 71e0000480e3 msgType: TGT_MSG_TYPE__SET_COMB_STATE
15/06 04:18:33.379554 0x7f3cc5928db0:multiHeadMgr_HandleNetRPCResponse:02653: TgtId: 5ce02d7e00000003 RC: TIMEOUT CombID: 71e0000480e3 msgType: TGT_MSG_TYPE__SET_COMB_STATE
15/06 04:18:38.380498 0x7f3cc5955db0:multiHeadMgr_HandleNetRPCResponse:02653: TgtId: 5ce02d7e00000003 RC: TIMEOUT CombID: 71e0000480e3 msgType: TGT_MSG_TYPE__SET_COMB_STATE
15/06 04:18:43.380564 0x7f3cc590ddb0:multiHeadMgr_HandleNetRPCResponse:02653: TgtId: 5ce02d7e00000003 RC: TIMEOUT CombID: 71e0000480e3 msgType: TGT_MSG_TYPE__SET_COMB_STATE 
(...)
15/06 04:18:43.380573 0x7f3cc590ddb0:mdmTgtMsg_SendAsyncSetCombState:06228: devId: ff7fb6fc00030006 CombId: 71e0000480e3 CombState: PRI->SEC RaidState: 0x1->0x1 ProtType: SECONDARY Switch roles (subtask) GenNums: Primary: 71707 Cmd: 9 MH: 71746 Connection: 1357
15/06 04:18:46.920989 0x7f3cc5943db0:mdmTgtMsg_SendAsyncSetCombState:06228: devId: ffd7690d00070009 CombId: 71e0000480e3 CombState: SEC->PRI RaidState: 0x21->0x1 ProtType: SECONDARY Switch roles (subtask) GenNums: Primary: 71707 Cmd: 11 MH: 71758 Connection: 1353
15/06 04:18:46.921312 0x7f3cc5955db0:multiHeadRow_MoveState_Inner:03054: [multiHead_HandleNormStateFlow:1359]: MultiHead: e3c00009 Row: 227  NORMAL->NORMAL (NORM2NORM_ROLE_BALANCE) 

要检查此条件(第 2 列和第 3 列应相同并设置为 100):

scli --query_performance_parameters --all_sds --print_all | grep SDS_NUMBER_SDS_CONTROL_UMT
        SDS_NUMBER_SDS_CONTROL_UMT                                   10               100
        SDS_NUMBER_SDS_CONTROL_UMT                                   10               100
        SDS_NUMBER_SDS_CONTROL_UMT                                   10               100 

这也将在 query_all 输出中报告,如下所示:

grep CONTROL_UMT query_all.txt
        SDS_NUMBER_SDS_CONTROL_UMT                                    10               100
        SDS_NUMBER_SDS_CONTROL_UMT                                    10               100
        SDS_NUMBER_SDS_CONTROL_UMT                                    10               100
        SDS_NUMBER_SDS_CONTROL_UMT                                    10               100
        SDS_NUMBER_SDS_CONTROL_UMT                                    10               100
        SDS_NUMBER_SDS_CONTROL_UMT                                    10               100
        SDS_NUMBER_SDS_CONTROL_UMT                                    10               100

 

影响

 可能会报告 I/O 错误,并且在严重的情况下卷可能会变为只读状态。

原因

SDS 无法处理大量控制命令,因为SDS_NUMBER_SDS_CONTROL_UMT仅设置为 10。当 SDS 性能配置文件设置为紧凑或设置为高性能,但系统已从 PowerFlex 2.x 升级到 3.x 时,可能会发生这种情况。

high_performance配置文件将 SDS_NUMBER_SDS_CONTROL_UMT 设置为 100;但是,从任何 2.x 版本升级到低于 3.0.1.5/3.5.1.3 的任何 3.x 版本时,此值可能会错误地更改为 10。

设置 紧凑性能配置文件时,10 是SDS_NUMBER_SDS_CONTROL_UMT的预期设置(在版本 3.x 中,high_performance配置文件是默认值)。

 

解决方案

如果使用high_performance SDS 配置文件,请运行以下命令以更正此问题:

scli --set_performance_parameters --tech --all_sds --sds_number_sds_control_umt 100 

如果使用紧凑的 SDS 配置文件,请更改为high_performance。

受影响的版本
低于 3.0.1.5 和 3.5.1.3 的所有 3.x 版本

已修复问题的版本
3.0.1.5 和 3.5.1.3

受影响的产品

PowerFlex Software
文章属性
文章编号: 000195572
文章类型: Solution
上次修改时间: 13 5月 2026
版本:  5
从其他戴尔用户那里查找问题的答案
支持服务
检查您的设备是否在支持服务涵盖的范围内。