PowerFlex 3.6 SDS 崩溃并出现崩溃意外状态:NO_RESOURCES
摘要: PowerFlex SDS 崩溃并显示死机表情FEIO_RECOVERY__IN_PROGRESS并继续崩溃并显示死机表情ALWAYS_ASSERT意外状态:NO_RESOURCES,或者只是出现恐慌表情ALWAYS_ASSERT意外状态:NO_RESOURCES
本文适用于
本文不适用于
本文并非针对某种特定的产品。
本文并非包含所有产品版本。
症状
场景
在 PowerFlex 群集正常运行期间,具有相同堆栈跟踪的一个或多个 SDS 崩溃
症状
- 在使用精细粒度 (FG) 池时,这可能会在正常 I/O作期间发生。
- 在将新卷数据写入精细粒度 (FG) 池时,更有可能在 vtree 迁移期间发生。
可能会出现以下情形:
堆栈跟踪在崩溃的 SDS 上邻近显示:
2022/04/05 12:01:30.816177 Panic in file /data/build/workspace/ScaleIO-Common-Job/src/tgt/spef/frontend/fe_io.c, line 3214, function feIo_L2PGatewayUpdate, PID 3682104.Panic Expression FEIO_RECOVERY__IN_PROGRESS == pFeIoDev->recoveryState || 2004 == rc || 20 == rc PANIC_ID_tgt_feio_11. /opt/emc/scaleio/sds/bin/sds-3.6.200.105(mosDbg_PanicPrepare+0x131) [0x5cba01] /opt/emc/scaleio/sds/bin/sds-3.6.200.105(feIo_L2PGatewayUpdate+0xb5b) [0x85612b] /opt/emc/scaleio/sds/bin/sds-3.6.200.105(spef_WriteDo+0x1ec) [0x85631c] /opt/emc/scaleio/sds/bin/sds-3.6.200.105(spefStorageRegion_CompressedWrite+0xb4) [0x95ad14] /opt/emc/scaleio/sds/bin/sds-3.6.200.105() [0x929d0d] /opt/emc/scaleio/sds/bin/sds-3.6.200.105() [0x92ab53] /opt/emc/scaleio/sds/bin/sds-3.6.200.105(raidComb_Write+0xd0) [0x92be30] /opt/emc/scaleio/sds/bin/sds-3.6.200.105(iohComb_WriteSecondary+0x251) [0x9a7d11] /opt/emc/scaleio/sds/bin/sds-3.6.200.105(ioh_Write+0x3e0) [0x9a9dd0] /opt/emc/scaleio/sds/bin/sds-3.6.200.105(ioh_NewRequest+0x2bba) [0x9af92a] ... 2022/04/05 12:01:36.642447 [CHOKE_POINT] Panic in file /data/build/workspace/ScaleIO-Common-Job/src/tgt/storage/spef_impl/spef_storage.c, line 415, function spefStorage_AttachDeviceCK, PID 2102550.Panic Expression ALWAYS_ASSERT Unexpected status: NO_RESOURCES. /opt/emc/scaleio/sds/bin/sds-3.6.200.105(mosDbg_PanicPrepare+0x131) [0x5cba01] /opt/emc/scaleio/sds/bin/sds-3.6.200.105(spefStorage_AttachDeviceCK+0x29a) [0x96bb5a] /opt/emc/scaleio/sds/bin/sds-3.6.200.105(spef_AttachDeviceUmtMainFunc+0x369) [0x87e769] /opt/emc/scaleio/sds/bin/sds-3.6.200.105(mosUmt_StartFunc+0x9c) [0x5b8c5c] /lib64/libc.so.6(+0x4d3d0) [0x7fa54857f3d0]
单个堆栈跟踪显示在崩溃的 SDS 上:
2022/04/05 12:01:36.642447 [CHOKE_POINT] Panic in file /data/build/workspace/ScaleIO-Common-Job/src/tgt/storage/spef_impl/spef_storage.c, line 415, function spefStorage_AttachDeviceCK, PID 2102550.Panic Expression ALWAYS_ASSERT Unexpected status: NO_RESOURCES. /opt/emc/scaleio/sds/bin/sds-3.6.200.105(mosDbg_PanicPrepare+0x131) [0x5cba01] /opt/emc/scaleio/sds/bin/sds-3.6.200.105(spefStorage_AttachDeviceCK+0x29a) [0x96bb5a] /opt/emc/scaleio/sds/bin/sds-3.6.200.105(spef_AttachDeviceUmtMainFunc+0x369) [0x87e769] /opt/emc/scaleio/sds/bin/sds-3.6.200.105(mosUmt_StartFunc+0x9c) [0x5b8c5c] /lib64/libc.so.6(+0x4d3d0) [0x7fa54857f3d0]
影响
SDS 在崩溃时分离,导致重建。如果有足够多的 SDS 崩溃并从群集并行分离,则会导致数据不可用。
原因
在正常 I/O作期间以及在 vtree 迁移到 FG 存储池期间,均可能发生这种情况。某些 IO 必须进行拆分才能适合 FG 池的 4k 页面。新的写入 I/O 以及一些拆分的 IO 正在写入缓冲区空间,并导致缓冲区溢出,最终导致 SDS 崩溃。
解决方案
虽然这种情况很少见,但在 vtree 迁移期间,请在其他源的 I/O 压力较小的时间运行迁移。虽然这可以减少发生这种崩溃的几率,但不能保证。
受影响的版本
PowerFlex v3.6.x
已修复问题的版本
PowerFlex v3.6.0.5
其他信息
受影响的版本
PowerFlex v3.6.x
已修复问题的版本
PowerFlex v3.6.0.5
受影响的产品
PowerFlex rack, VxFlex Ready Nodes, PowerFlex custom node, PowerFlex appliance R650, PowerFlex appliance R6525, PowerFlex appliance R660, PowerFlex appliance R6625, Powerflex appliance R750, PowerFlex appliance R760, PowerFlex appliance R7625
, PowerFlex Software, PowerFlex appliance R640, PowerFlex appliance R740XD, PowerFlex appliance R7525, PowerFlex appliance R840
...
文章属性
文章编号: 000199576
文章类型: Solution
上次修改时间: 03 4月 2025
版本: 5
从其他戴尔用户那里查找问题的答案
支持服务
检查您的设备是否在支持服务涵盖的范围内。