PowerFlex 3.x:MDM 在功能 rpl_transmit_mgr.c 時發生錯誤

Summary: 行動裝置管理 (MDM) 程序會因為複寫而持續發生錯誤

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

在這種情況下,複製網站代碼級別為 3.x,目標網站代碼級別為 4.x,但是,此問題可能會影響任何 3.x 系統。

儲存端未進行任何變更。

MDM 程序持續發生錯誤,並顯示下列堆疊追蹤:

2024/11/24 05:51:06.186359 Panic in file /data/build/workspace/ScaleIO-Common-Job/src/mdm/replication/consistency_engine/rpl_transmit_mgr.c, line 833, function rplTransmitManager_ProcessRequestsForTimelinesRFD, PID 19477.Panic Expression ALWAYS_ASSERT .
/opt/emc/scaleio/mdm/bin/mdm-3.6.400.107(mosDbg_PanicPrepare+0x13a) [0xabf1ba]
/opt/emc/scaleio/mdm/bin/mdm-3.6.400.107(rplTransmitManager_ProcessRequestsForTimelinesRFD+0x1f0) [0x880da0]
/opt/emc/scaleio/mdm/bin/mdm-3.6.400.107(consistencyEngine_AnalyzeTimelines+0x7b) [0x7f2ebb]
/opt/emc/scaleio/mdm/bin/mdm-3.6.400.107(consistencyEngine_AnalayzerUmtIteration+0x3c) [0x60d96c]
/opt/emc/scaleio/mdm/bin/mdm-3.6.400.107(consistencyEngine_AnalayzerUmtRoutine+0x33) [0x60da43]
/opt/emc/scaleio/mdm/bin/mdm-3.6.400.107(mosUmt_StartFunc+0x7a) [0x69a9fa] /lib64/libc.so.6(+0x48190) [0x7ff82e834190]
/opt/emc/scaleio/mdm/bin/mdm-3.6.400.107(mosUmt_Init+0x129) [0x8f5e89]
[(nil)]

影響:
MDM 叢集已關閉,導致資料無法使用 (DU)。

Cause

此問題在版本 3.x 中識別為軟體程式碼瑕疵,導致 MDM 發生錯誤。由於此缺陷,傳輸的數據在複製期間超過了 200 GiB 的強制限制。由於請求過多,MDM 難以處理它們,導致不穩定並最終導致恐慌。

在此特定情況下,高度傳輸的資料是 Windows SDC 修整命令所致,但是,由於任何大型資料傳輸,都可能會出現此問題。

Resolution

此軟體問題已在最新版本中解決。若要永久解決此問題,建議升級至 4.5.x 或更新版本,以確保恢復複製前的穩定性:

  1. 停止所有節點上的 SDR。
    這會暫時解決當機。
  2. 暫停或停止所有複寫一致性群組 (RCG) 和複寫配對。
  3. 將系統升級至最新的 4.5.x 版或更新版本。
  4. 完成升級後再繼續複寫。

受影響的版本:
PowerFlex 3.x

修正版本:
PowerFlex 4.5

Products

PowerFlex rack RCM Software
Article Properties
Article Number: 000278514
Article Type: Solution
Last Modified: 29 Jul 2025
Version:  2
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.