Selhání úložiště PowerFlex 3.6 SDS s neočekávaným stavem paniky: NO_RESOURCES

Summary: Selhání úložiště PowerFlex SDS s projevem paniky FEIO_RECOVERY__IN_PROGRESS nadále selhává kvůli výrazu paniky ALWAYS_ASSERT neočekávanému stavu: NO_RESOURCES nebo jen se stavem Panic Expression ALWAYS_ASSERT Neočekávané: NO_RESOURCES ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Scénář
Během normálního provozu clusteru PowerFlex dojde k selhání softwarově definovaného disku nebo více disků SDS se stejným trasováním zásobníku

Symptomy
 K tomu může dojít během normální vstupně-výstupní operace při použití fondů jemné členitosti (FG).
 - Pravděpodobnější, že k tomu dojde během migrace vtree při zápisu dat nového svazku do fondu jemné členitosti (FG).

Mohou nastat následující scénáře:

Trasování zásobníku se zobrazí v blízkosti na úložišti SDS, u kterého došlo k chybě:

 2022/04/05 12:01:30.816177 Panic in file /data/build/workspace/ScaleIO-Common-Job/src/tgt/spef/frontend/fe_io.c, line 3214, function feIo_L2PGatewayUpdate, PID 3682104.Panic Expression FEIO_RECOVERY__IN_PROGRESS == pFeIoDev->recoveryState || 2004 == rc || 20 == rc PANIC_ID_tgt_feio_11.
/opt/emc/scaleio/sds/bin/sds-3.6.200.105(mosDbg_PanicPrepare+0x131) [0x5cba01]
/opt/emc/scaleio/sds/bin/sds-3.6.200.105(feIo_L2PGatewayUpdate+0xb5b) [0x85612b]
/opt/emc/scaleio/sds/bin/sds-3.6.200.105(spef_WriteDo+0x1ec) [0x85631c]
/opt/emc/scaleio/sds/bin/sds-3.6.200.105(spefStorageRegion_CompressedWrite+0xb4) [0x95ad14]
/opt/emc/scaleio/sds/bin/sds-3.6.200.105() [0x929d0d]
/opt/emc/scaleio/sds/bin/sds-3.6.200.105() [0x92ab53]
/opt/emc/scaleio/sds/bin/sds-3.6.200.105(raidComb_Write+0xd0) [0x92be30]
/opt/emc/scaleio/sds/bin/sds-3.6.200.105(iohComb_WriteSecondary+0x251) [0x9a7d11]
/opt/emc/scaleio/sds/bin/sds-3.6.200.105(ioh_Write+0x3e0) [0x9a9dd0]
/opt/emc/scaleio/sds/bin/sds-3.6.200.105(ioh_NewRequest+0x2bba) [0x9af92a]
...
2022/04/05 12:01:36.642447 [CHOKE_POINT] Panic in file /data/build/workspace/ScaleIO-Common-Job/src/tgt/storage/spef_impl/spef_storage.c, line 415, function spefStorage_AttachDeviceCK, PID 2102550.Panic Expression ALWAYS_ASSERT Unexpected status: NO_RESOURCES.
/opt/emc/scaleio/sds/bin/sds-3.6.200.105(mosDbg_PanicPrepare+0x131) [0x5cba01]
/opt/emc/scaleio/sds/bin/sds-3.6.200.105(spefStorage_AttachDeviceCK+0x29a) [0x96bb5a]
/opt/emc/scaleio/sds/bin/sds-3.6.200.105(spef_AttachDeviceUmtMainFunc+0x369) [0x87e769]
/opt/emc/scaleio/sds/bin/sds-3.6.200.105(mosUmt_StartFunc+0x9c) [0x5b8c5c]
/lib64/libc.so.6(+0x4d3d0) [0x7fa54857f3d0]

Na softwarovém listu, který selhal, se zobrazí trasování jednoho stohu:

 2022/04/05 12:01:36.642447 [CHOKE_POINT] Panic in file /data/build/workspace/ScaleIO-Common-Job/src/tgt/storage/spef_impl/spef_storage.c, line 415, function spefStorage_AttachDeviceCK, PID 2102550.Panic Expression ALWAYS_ASSERT Unexpected status: NO_RESOURCES.
/opt/emc/scaleio/sds/bin/sds-3.6.200.105(mosDbg_PanicPrepare+0x131) [0x5cba01]
/opt/emc/scaleio/sds/bin/sds-3.6.200.105(spefStorage_AttachDeviceCK+0x29a) [0x96bb5a]
/opt/emc/scaleio/sds/bin/sds-3.6.200.105(spef_AttachDeviceUmtMainFunc+0x369) [0x87e769]
/opt/emc/scaleio/sds/bin/sds-3.6.200.105(mosUmt_StartFunc+0x9c) [0x5b8c5c]
/lib64/libc.so.6(+0x4d3d0) [0x7fa54857f3d0]

 

Důsledky

SDS se v okamžiku havárie odpojí, což způsobí opětovné vytvoření. Pokud dojde k selhání a paralelnímu odpojení dostatečného počtu úložišť SDS od clusteru, dojde k nedostupnosti dat.

Cause

K tomu může dojít jak během normálních vstupně-výstupních operací, tak během migrace vtree do fondu úložiště FG. Část vstupně-výstupních operací je nutné rozdělit, aby se vešly na 4k stránky fondu FG. Nový zápis I/O spolu s částí rozdělených vstupně-výstupních operací se zapisuje do prostoru vyrovnávací paměti a způsobuje přetečení vyrovnávací paměti a následné zhroucení úložiště SDS.

Resolution

I když se jedná o vzácný stav, během migrace vtree spusťte migraci v době menšího tlaku na vstupně-výstupní operace z jiných zdrojů. I když to může snížit pravděpodobnost, že k této havárii dojde, není to zaručeno.

Dotčené verze

PowerFlex v3.6.x

Opraveno ve verzi

PowerFlex v3.6.0.5

Additional Information

Dotčené verze

PowerFlex v3.6.x


Opraveno ve verzi

PowerFlex v3.6.0.5

Affected Products

PowerFlex rack, VxFlex Ready Nodes, PowerFlex custom node, PowerFlex appliance R650, PowerFlex appliance R6525, PowerFlex appliance R660, PowerFlex appliance R6625, Powerflex appliance R750, PowerFlex appliance R760, PowerFlex appliance R7625 , PowerFlex Software, PowerFlex appliance R640, PowerFlex appliance R740XD, PowerFlex appliance R7525, PowerFlex appliance R840 ...
Article Properties
Article Number: 000199576
Article Type: Solution
Last Modified: 03 Apr 2025
Version:  5
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.