PowerFlex 3.6 SDS's crashen met panic unexpected status: NO_RESOURCES
Summary: PowerFlex SDS's crash met Panic Expression FEIO_RECOVERY__IN_PROGRESS blijft crashen met Panic Expression ALWAYS_ASSERT onverwachte status: NO_RESOURCES, of gewoon met de status Panic Expression ALWAYS_ASSERT Onverwacht: NO_RESOURCES ...
Symptoms
Scenario
Tijdens een normale werking van een PowerFlex-cluster crasht een SDS of meerdere SDS met dezelfde stacktrace
Symptomen
- Dit kan gebeuren tijdens een normale I/O-bewerking tijdens het gebruik van FG-pools (Fine Granularity).
- Is waarschijnlijker tijdens een vtree-migratie tijdens het schrijven van nieuwe volumegegevens naar een FG-pool (Fine Granularity).
De volgende scenario's kunnen zich voordoen:
Stack traces worden in de buurt weergegeven op een SDS die is gecrasht:
2022/04/05 12:01:30.816177 Panic in file /data/build/workspace/ScaleIO-Common-Job/src/tgt/spef/frontend/fe_io.c, line 3214, function feIo_L2PGatewayUpdate, PID 3682104.Panic Expression FEIO_RECOVERY__IN_PROGRESS == pFeIoDev->recoveryState || 2004 == rc || 20 == rc PANIC_ID_tgt_feio_11. /opt/emc/scaleio/sds/bin/sds-3.6.200.105(mosDbg_PanicPrepare+0x131) [0x5cba01] /opt/emc/scaleio/sds/bin/sds-3.6.200.105(feIo_L2PGatewayUpdate+0xb5b) [0x85612b] /opt/emc/scaleio/sds/bin/sds-3.6.200.105(spef_WriteDo+0x1ec) [0x85631c] /opt/emc/scaleio/sds/bin/sds-3.6.200.105(spefStorageRegion_CompressedWrite+0xb4) [0x95ad14] /opt/emc/scaleio/sds/bin/sds-3.6.200.105() [0x929d0d] /opt/emc/scaleio/sds/bin/sds-3.6.200.105() [0x92ab53] /opt/emc/scaleio/sds/bin/sds-3.6.200.105(raidComb_Write+0xd0) [0x92be30] /opt/emc/scaleio/sds/bin/sds-3.6.200.105(iohComb_WriteSecondary+0x251) [0x9a7d11] /opt/emc/scaleio/sds/bin/sds-3.6.200.105(ioh_Write+0x3e0) [0x9a9dd0] /opt/emc/scaleio/sds/bin/sds-3.6.200.105(ioh_NewRequest+0x2bba) [0x9af92a] ... 2022/04/05 12:01:36.642447 [CHOKE_POINT] Panic in file /data/build/workspace/ScaleIO-Common-Job/src/tgt/storage/spef_impl/spef_storage.c, line 415, function spefStorage_AttachDeviceCK, PID 2102550.Panic Expression ALWAYS_ASSERT Unexpected status: NO_RESOURCES. /opt/emc/scaleio/sds/bin/sds-3.6.200.105(mosDbg_PanicPrepare+0x131) [0x5cba01] /opt/emc/scaleio/sds/bin/sds-3.6.200.105(spefStorage_AttachDeviceCK+0x29a) [0x96bb5a] /opt/emc/scaleio/sds/bin/sds-3.6.200.105(spef_AttachDeviceUmtMainFunc+0x369) [0x87e769] /opt/emc/scaleio/sds/bin/sds-3.6.200.105(mosUmt_StartFunc+0x9c) [0x5b8c5c] /lib64/libc.so.6(+0x4d3d0) [0x7fa54857f3d0]
Er wordt een enkele stack-tacktrace weergegeven op een SDS die is gecrasht:
2022/04/05 12:01:36.642447 [CHOKE_POINT] Panic in file /data/build/workspace/ScaleIO-Common-Job/src/tgt/storage/spef_impl/spef_storage.c, line 415, function spefStorage_AttachDeviceCK, PID 2102550.Panic Expression ALWAYS_ASSERT Unexpected status: NO_RESOURCES. /opt/emc/scaleio/sds/bin/sds-3.6.200.105(mosDbg_PanicPrepare+0x131) [0x5cba01] /opt/emc/scaleio/sds/bin/sds-3.6.200.105(spefStorage_AttachDeviceCK+0x29a) [0x96bb5a] /opt/emc/scaleio/sds/bin/sds-3.6.200.105(spef_AttachDeviceUmtMainFunc+0x369) [0x87e769] /opt/emc/scaleio/sds/bin/sds-3.6.200.105(mosUmt_StartFunc+0x9c) [0x5b8c5c] /lib64/libc.so.6(+0x4d3d0) [0x7fa54857f3d0]
Impact
SDS ontkoppelt op het moment van de crash, waardoor rebuilds ontstaan. Als voldoende SDS-servers crashen en parallel loskoppelen van het cluster, zijn data niet beschikbaar.
Cause
Dit kan zowel gebeuren tijdens normale I/O-bewerkingen als tijdens een vtree-migratie naar een FG-storagepool. Een deel van de IO moet worden gesplitst om in de 4k-pagina's van een FG-pool te passen. Een nieuwe schrijf-I/O wordt samen met een deel van de gesplitste IO naar de bufferruimte geschreven en veroorzaakt een bufferoverflow, waardoor de SDS uiteindelijk crasht.
Resolution
Hoewel dit een zeldzame voorwaarde is, moet u tijdens een vtree-migratie de migratie uitvoeren op een tijdstip met minder I/O-druk van andere bronnen. Hoewel dit de kans op een crash kan verkleinen, is dit niet gegarandeerd.
Versies waarop dit van toepassing is
PowerFlex v3.6.x
Opgelost in versie
PowerFlex v3.6.0.5
Additional Information
Versies waarop dit van toepassing is
PowerFlex v3.6.x
Opgelost in versie
PowerFlex v3.6.0.5