在回溯重建期間可能發生的 I/O 錯誤的 PowerFlex 3.x 效能問題

摘要: 在回溯重建事件期間,可能會回報 I/O 錯誤。 在嚴重的情況下,卷可能會變為唯讀,並導致數據不可用。 在回溯重建期間,將切換梳子角色(主要/次要)。當 SDS 1) 從維護模式移除,或 2) SDS 關閉並立即恢復時,可能會發生回溯重建。

本文章適用於 本文章不適用於 本文無關於任何特定產品。 本文未識別所有產品版本。

症狀

劇本
MDM 會在重建期間將許多控制命令傳送至 SDS,但 SDS 無法及時處理這些命令。

症狀
在以下項目中,MDM 嘗試執行組合角色切換,但 SDS 需要 30 秒才能完成操作。在此範例中,此 30 秒的延遲足以讓磁碟區變成唯讀。

15/06 04:18:18.362502 0x7f3cc590ddb0:multiHeadMgr_HandleNetRPCResponse:02653: TgtId: 5ce02d7e00000003 RC: TIMEOUT CombID: 71e0000480e3 msgType: TGT_MSG_TYPE__SET_COMB_STATE
15/06 04:18:23.364575 0x7f3cc5904db0:multiHeadMgr_HandleNetRPCResponse:02653: TgtId: 5ce02d7e00000003 RC: TIMEOUT CombID: 71e0000480e3 msgType: TGT_MSG_TYPE__SET_COMB_STATE
15/06 04:18:28.370493 0x7f3cc5928db0:multiHeadMgr_HandleNetRPCResponse:02653: TgtId: 5ce02d7e00000003 RC: TIMEOUT CombID: 71e0000480e3 msgType: TGT_MSG_TYPE__SET_COMB_STATE
15/06 04:18:33.379554 0x7f3cc5928db0:multiHeadMgr_HandleNetRPCResponse:02653: TgtId: 5ce02d7e00000003 RC: TIMEOUT CombID: 71e0000480e3 msgType: TGT_MSG_TYPE__SET_COMB_STATE
15/06 04:18:38.380498 0x7f3cc5955db0:multiHeadMgr_HandleNetRPCResponse:02653: TgtId: 5ce02d7e00000003 RC: TIMEOUT CombID: 71e0000480e3 msgType: TGT_MSG_TYPE__SET_COMB_STATE
15/06 04:18:43.380564 0x7f3cc590ddb0:multiHeadMgr_HandleNetRPCResponse:02653: TgtId: 5ce02d7e00000003 RC: TIMEOUT CombID: 71e0000480e3 msgType: TGT_MSG_TYPE__SET_COMB_STATE 
(...)
15/06 04:18:43.380573 0x7f3cc590ddb0:mdmTgtMsg_SendAsyncSetCombState:06228: devId: ff7fb6fc00030006 CombId: 71e0000480e3 CombState: PRI->SEC RaidState: 0x1->0x1 ProtType: SECONDARY Switch roles (subtask) GenNums: Primary: 71707 Cmd: 9 MH: 71746 Connection: 1357
15/06 04:18:46.920989 0x7f3cc5943db0:mdmTgtMsg_SendAsyncSetCombState:06228: devId: ffd7690d00070009 CombId: 71e0000480e3 CombState: SEC->PRI RaidState: 0x21->0x1 ProtType: SECONDARY Switch roles (subtask) GenNums: Primary: 71707 Cmd: 11 MH: 71758 Connection: 1353
15/06 04:18:46.921312 0x7f3cc5955db0:multiHeadRow_MoveState_Inner:03054: [multiHead_HandleNormStateFlow:1359]: MultiHead: e3c00009 Row: 227  NORMAL->NORMAL (NORM2NORM_ROLE_BALANCE) 

若要檢查此狀況 (第 2 欄和第 3 欄應相同,並設定為 100):

scli --query_performance_parameters --all_sds --print_all | grep SDS_NUMBER_SDS_CONTROL_UMT
        SDS_NUMBER_SDS_CONTROL_UMT                                   10               100
        SDS_NUMBER_SDS_CONTROL_UMT                                   10               100
        SDS_NUMBER_SDS_CONTROL_UMT                                   10               100 

這也會報告在 query_all 輸出中,如下所示:

grep CONTROL_UMT query_all.txt
        SDS_NUMBER_SDS_CONTROL_UMT                                    10               100
        SDS_NUMBER_SDS_CONTROL_UMT                                    10               100
        SDS_NUMBER_SDS_CONTROL_UMT                                    10               100
        SDS_NUMBER_SDS_CONTROL_UMT                                    10               100
        SDS_NUMBER_SDS_CONTROL_UMT                                    10               100
        SDS_NUMBER_SDS_CONTROL_UMT                                    10               100
        SDS_NUMBER_SDS_CONTROL_UMT                                    10               100

 

影響

 可能會報告 I/O 錯誤,在嚴重的情況下,磁碟區可能會變成唯讀。

原因

SDS 無法處理大量的控制命令,因為SDS_NUMBER_SDS_CONTROL_UMT僅設置為 10。當 SDS 效能設定檔設為「精巧」或設為「高效能」,但系統已從 PowerFlex 2.x 升級至 3.x 時,可能會發生這種情況。

high_performance配置檔將SDS_NUMBER_SDS_CONTROL_UMT設置為 100;但是,從任何 2.x 版本升級至 3.0.1.5/3.5.1.3 以下的任何 3.x 版本時,可能會錯誤地將其變更為 10。

若已設定精簡型效能設定檔,則 SDS_NUMBER_SDS_CONTROL_UMT 的預期設定為 10 (在版本 3.x 中,high_performance 設定檔為預設)。

 

解析度

如果使用 high_performance SDS 設定檔,請執行下列命令來修正此問題:

scli --set_performance_parameters --tech --all_sds --sds_number_sds_control_umt 100 

如果使用精簡型 SDS 設定檔,請變更為 high_performance。

受影響的版本
3.0.1.5 和 3.5.1.3 以下的所有 3.x 版本

已修正問題的版本
3.0.1.5 和 3.5.1.3

受影響的產品

PowerFlex Software
文章屬性
文章編號: 000195572
文章類型: Solution
上次修改時間: 13 5月 2026
版本:  5
向其他 Dell 使用者尋求您問題的答案
支援服務
檢查您的裝置是否在支援服務的涵蓋範圍內。