Panique du SDS PowerFlex causée par un bug du noyau Linux
Summary: Le problème affecte uniquement le processeur Intel Haswell Panique SDS Indisponibilité des données (DU) causée par un fonctionnement inattendu du SDS unique Longue durée de service d’E/S provoquant une défaillance des E/S SDC. Bug du noyau Linux ...
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Symptoms
Scénario
- Intel Haswell Le processeur est en cours d’utilisation.
- L’un des SDS signale l’état « données dégradées » et la perte de connexion du SDC aux volumes, sans raison apparente
- Panique SDS
Symptômes
- Rapport d’événements système ScaleIO « données dégradées » :
ScaleIO system events report "data degraded": 205466 2015-12-10 08:11:49.450 MDM_DATA_DEGRADED ERROR The system is now in DEGRADED state. 205468 2015-12-10 08:12:04.688 MDM_DATA_DEGRADED ERROR The system is now in DEGRADED state. 205470 2015-12-10 08:12:06.699 MDM_DATA_DEGRADED ERROR The system is now in DEGRADED state. 205472 2015-12-10 08:12:16.931 MDM_DATA_DEGRADED ERROR The system is now in DEGRADED state.
SDS exp.0 :
10/12 02:13:14.134144 Panic in file /emc/svc_flashbld/workspace/ScaleIO-SLES12/src/tgt/ioh/ioh.c, line 70, function iohIo_TimerExpired, PID 22333.Panic Expression !(1). /opt/emc/scaleio/sds/bin/sds-1.32.3455.5(mosDbg_BackTrace+0x22) [0x479ba9] /opt/emc/scaleio/sds/bin/sds-1.32.3455.5(mosDbg_Panic+0xf0) [0x4740ad] /opt/emc/scaleio/sds/bin/sds-1.32.3455.5(iohIo_TimerExpired+0x5d) [0x43d92d] /opt/emc/scaleio/sds/bin/sds-1.32.3455.5(mosTimerQ_PollUnlocked+0x1b4) [0x46f6e3] /opt/emc/scaleio/sds/bin/sds-1.32.3455.5(mosTimer_PollQRange+0x83) [0x46fa6c] /opt/emc/scaleio/sds/bin/sds-1.32.3455.5(netPoll_StartIntr+0x2ef) [0x465808] /opt/emc/scaleio/sds/bin/sds-1.32.3455.5(mosUmt_StartFunc+0xbe) [0x47f07d] /opt/emc/scaleio/sds/bin/sds-1.32.3455.5(mosUmt_SignalHandler+0x4a) [0x47fa3a]
Impact
- Données indisponibles
- Le SDC a perdu la connexion aux volumes.
- Défaillance d’E/S
- Dégradation des services/performances des E/S longues
Cause
En raison du bug du noyau Linux, le processus SDS s’est comporté de manière anormale. En raison de cette condition, le processus SDS était en contrainte et le comportement était imprévisible.
Lors de la réponse aux demandes de connexion persistante, le SDS n’était pas entièrement fonctionnel et ne répondait pas aux demandes d’E/S SDC.
Une telle condition ne permettait pas à ScaleIO de marquer le SDS comme étant en échec, ce qui a finalement conduit à l’indisponibilité des données.
- Informations sur les bogues du noyau Linux :
Futex : Correction d’une condition de concurrence entre REQUEUE_PI et la mort de la tâche (bcn #851603 (série d’évolutivité futex).
Futex : Assurez-vous que get_futex_key_refs() implique toujours une barrière (bcn #851603 (série d’évolutivité futex)).
- Pour plus d’informations, consultez les liens suivants :
Suse :SUSE-SU-2015:0068-1
Red Hat : Un bogue grave de Red Hat Linux affecte les serveurs basés sur Haswell - InfoQ
Resolution
Solution
- Mettez à niveau la version du noyau Linux.
Affected Products
PowerFlex rack, ScaleIOArticle Properties
Article Number: 000281636
Article Type: Solution
Last Modified: 06 Feb 2025
Version: 1
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.