Критическая ошибка PowerFlex SDS, вызванная ошибкой ядра Linux
Summary: Проблема затрагивает только процессор Intel Haswell Паника SDS Недоступность данных (DU), вызванная ошибкой одного SDS Длительное обслуживание ввода-вывода, приводящее к сбою ввода-вывода SDC. Ошибка ядра Linux ...
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Symptoms
Сценарий
- Intel Haswell ЦП используется.
- Один из SDS сообщает о состоянии «ухудшение производительности данных» и потере подключения SDC к томам без очевидной причины
- Паника SDS
Симптомы
- Отчет о системных событиях ScaleIO "data degraded":
ScaleIO system events report "data degraded": 205466 2015-12-10 08:11:49.450 MDM_DATA_DEGRADED ERROR The system is now in DEGRADED state. 205468 2015-12-10 08:12:04.688 MDM_DATA_DEGRADED ERROR The system is now in DEGRADED state. 205470 2015-12-10 08:12:06.699 MDM_DATA_DEGRADED ERROR The system is now in DEGRADED state. 205472 2015-12-10 08:12:16.931 MDM_DATA_DEGRADED ERROR The system is now in DEGRADED state.
SDS exp.0:
10/12 02:13:14.134144 Panic in file /emc/svc_flashbld/workspace/ScaleIO-SLES12/src/tgt/ioh/ioh.c, line 70, function iohIo_TimerExpired, PID 22333.Panic Expression !(1). /opt/emc/scaleio/sds/bin/sds-1.32.3455.5(mosDbg_BackTrace+0x22) [0x479ba9] /opt/emc/scaleio/sds/bin/sds-1.32.3455.5(mosDbg_Panic+0xf0) [0x4740ad] /opt/emc/scaleio/sds/bin/sds-1.32.3455.5(iohIo_TimerExpired+0x5d) [0x43d92d] /opt/emc/scaleio/sds/bin/sds-1.32.3455.5(mosTimerQ_PollUnlocked+0x1b4) [0x46f6e3] /opt/emc/scaleio/sds/bin/sds-1.32.3455.5(mosTimer_PollQRange+0x83) [0x46fa6c] /opt/emc/scaleio/sds/bin/sds-1.32.3455.5(netPoll_StartIntr+0x2ef) [0x465808] /opt/emc/scaleio/sds/bin/sds-1.32.3455.5(mosUmt_StartFunc+0xbe) [0x47f07d] /opt/emc/scaleio/sds/bin/sds-1.32.3455.5(mosUmt_SignalHandler+0x4a) [0x47fa3a]
Воздействие
- Данные недоступны
- SDC потерял подключение к томам.
- Сбой ввода-вывода
- Длительное обслуживание ввода-вывода/снижение производительности
Cause
Из-за ошибки ядра Linux процесс SDS вел себя ненормально. Из-за этого он находился в стрессовом состоянии и его поведение было непредсказуемым.
При ответе на запросы на поддержание активности SDS не всегда функционировало и не отвечало на запросы ввода-вывода SDC.
Такое условие не позволяло ScaleIO пометить SDS как неисправный, что в конечном итоге приводило к недоступности данных.
- Информация об ошибке в ядре Linux:
Фьютекс: Исправлено состояние гонки между REQUEUE_PI и смертью задачи (bcn #851603 (futex scalability series).
Фьютекс: Убедитесь, что get_futex_key_refs() всегда подразумевает барьер (bcn #851603 (futex scalability series)).
- Для получения дополнительной информации см. следующие ссылки:
Suse:SUSE-SU-2015:0068-1
Красная шляпа: Серьезная ошибка Red Hat Linux влияет на серверы на базе Haswell - InfoQ
Resolution
Временное решение
- Обновите версию ядра Linux.
Affected Products
PowerFlex rack, ScaleIOArticle Properties
Article Number: 000281636
Article Type: Solution
Last Modified: 06 Feb 2025
Version: 1
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.