PowerFlex SDS-paniek veroorzaakt door Linux-kernelbug
Summary: Het probleem heeft alleen invloed op Intel Haswell CPU SDS-paniek Niet-beschikbaarheid van data (DU) veroorzaakt door één SDS-paniek Lange I/O-serving veroorzaakt een SDC I/O-fout. Linux Kernel bug ...
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Symptoms
Scenario
- Intel Haswell CPU wordt gebruikt.
- Een van de SDS-servers meldt de status "data degraded" en de SDC's verbroken verbinding met volumes, zonder duidelijke reden
- SDS-paniek
Symptomen
- ScaleIO system events report "data degraded":
ScaleIO system events report "data degraded": 205466 2015-12-10 08:11:49.450 MDM_DATA_DEGRADED ERROR The system is now in DEGRADED state. 205468 2015-12-10 08:12:04.688 MDM_DATA_DEGRADED ERROR The system is now in DEGRADED state. 205470 2015-12-10 08:12:06.699 MDM_DATA_DEGRADED ERROR The system is now in DEGRADED state. 205472 2015-12-10 08:12:16.931 MDM_DATA_DEGRADED ERROR The system is now in DEGRADED state.
SDS exp.0:
10/12 02:13:14.134144 Panic in file /emc/svc_flashbld/workspace/ScaleIO-SLES12/src/tgt/ioh/ioh.c, line 70, function iohIo_TimerExpired, PID 22333.Panic Expression !(1). /opt/emc/scaleio/sds/bin/sds-1.32.3455.5(mosDbg_BackTrace+0x22) [0x479ba9] /opt/emc/scaleio/sds/bin/sds-1.32.3455.5(mosDbg_Panic+0xf0) [0x4740ad] /opt/emc/scaleio/sds/bin/sds-1.32.3455.5(iohIo_TimerExpired+0x5d) [0x43d92d] /opt/emc/scaleio/sds/bin/sds-1.32.3455.5(mosTimerQ_PollUnlocked+0x1b4) [0x46f6e3] /opt/emc/scaleio/sds/bin/sds-1.32.3455.5(mosTimer_PollQRange+0x83) [0x46fa6c] /opt/emc/scaleio/sds/bin/sds-1.32.3455.5(netPoll_StartIntr+0x2ef) [0x465808] /opt/emc/scaleio/sds/bin/sds-1.32.3455.5(mosUmt_StartFunc+0xbe) [0x47f07d] /opt/emc/scaleio/sds/bin/sds-1.32.3455.5(mosUmt_SignalHandler+0x4a) [0x47fa3a]
Impact
- Data niet beschikbaar
- SDC verbroken verbinding met volumes.
- I/O-fout
- Lange I/O-service-/prestatievermindering
Cause
Vanwege de Linux-kernelbug gedroeg het SDS-proces zich abnormaal, vanwege deze toestand stond het SDS-proces onder druk en was het gedrag onvoorspelbaar.
Bij het beantwoorden van 'keep alive'-aanvragen was de SDS niet volledig functioneel en reageerde deze niet op SDC I/O-aanvragen.
Een dergelijke voorwaarde stond ScaleIO niet toe om de SDS als mislukt te markeren, wat er uiteindelijk toe leidde dat gegevens niet beschikbaar waren.
- Linux Kernel bug informatie:
Futex: Oplossing voor een racevoorwaarde tussen REQUEUE_PI en taakdood (bcn #851603 (futex-schaalbaarheidsserie).
Futex: Zorg ervoor dat get_futex_key_refs() altijd een barrière impliceert (bcn #851603 (futex schaalbaarheidsreeks)).
- Zie de volgende koppelingen voor meer informatie:
Suse:SUSE-SU-2015:0068-1
Red Hat: Ernstige Red Hat Linux-bug treft op Haswell gebaseerde servers - InfoQ
Resolution
Tijdelijke oplossing
- Upgrade de Linux-kernelversie.
Affected Products
PowerFlex rack, ScaleIOArticle Properties
Article Number: 000281636
Article Type: Solution
Last Modified: 06 Feb 2025
Version: 1
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.