Panika PowerFlex SDS spowodowana błędem jądra systemu Linux
Summary: Problem dotyczy tylko procesora Intel Haswell Panika SDS Niedostępność danych (DU) spowodowana błędem pojedynczego serwera SDS Długa obsługa we/wy powoduje awarię operacji we/wy SDC. Błąd jądra Linuksa ...
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Symptoms
Scenariusz
- Intel Haswell Procesor jest używany.
- Jeden z SDS-ów zgłasza stan "obniżonej jakości danych" i utracone połączenie SDC z woluminami bez wyraźnej przyczyny
- Panika SDS
Objawy
- Zdarzenia systemowe ScaleIO zgłaszają "data degraded":
ScaleIO system events report "data degraded": 205466 2015-12-10 08:11:49.450 MDM_DATA_DEGRADED ERROR The system is now in DEGRADED state. 205468 2015-12-10 08:12:04.688 MDM_DATA_DEGRADED ERROR The system is now in DEGRADED state. 205470 2015-12-10 08:12:06.699 MDM_DATA_DEGRADED ERROR The system is now in DEGRADED state. 205472 2015-12-10 08:12:16.931 MDM_DATA_DEGRADED ERROR The system is now in DEGRADED state.
SDS exp.0:
10/12 02:13:14.134144 Panic in file /emc/svc_flashbld/workspace/ScaleIO-SLES12/src/tgt/ioh/ioh.c, line 70, function iohIo_TimerExpired, PID 22333.Panic Expression !(1). /opt/emc/scaleio/sds/bin/sds-1.32.3455.5(mosDbg_BackTrace+0x22) [0x479ba9] /opt/emc/scaleio/sds/bin/sds-1.32.3455.5(mosDbg_Panic+0xf0) [0x4740ad] /opt/emc/scaleio/sds/bin/sds-1.32.3455.5(iohIo_TimerExpired+0x5d) [0x43d92d] /opt/emc/scaleio/sds/bin/sds-1.32.3455.5(mosTimerQ_PollUnlocked+0x1b4) [0x46f6e3] /opt/emc/scaleio/sds/bin/sds-1.32.3455.5(mosTimer_PollQRange+0x83) [0x46fa6c] /opt/emc/scaleio/sds/bin/sds-1.32.3455.5(netPoll_StartIntr+0x2ef) [0x465808] /opt/emc/scaleio/sds/bin/sds-1.32.3455.5(mosUmt_StartFunc+0xbe) [0x47f07d] /opt/emc/scaleio/sds/bin/sds-1.32.3455.5(mosUmt_SignalHandler+0x4a) [0x47fa3a]
Wpływ
- Dane niedostępne
- Klient SDC utracił połączenie z woluminami.
- Błąd we/wy
- Długi okres eksploatacji we/wy / pogorszenie wydajności
Cause
Z powodu błędu jądra Linuksa proces SDS zachowywał się nieprawidłowo, z tego powodu proces SDS był w stresie, a zachowanie było nieprzewidywalne.
Podczas odpowiadania na żądania utrzymania aktywności serwer SDS nie był w pełni funkcjonalny i nie odpowiadał na żądania we/wy SDC.
Taki warunek nie pozwalał ScaleIO oznaczyć SDS jako uszkodzonego, co ostatecznie doprowadziło do niedostępności danych.
- Informacje o błędzie jądra Linuksa:
Futex: Rozwiązano problem z sytuacją wyścigu między REQUEUE_PI a śmiercią zadania (bcn #851603 (seria skalowalności futex).
Futex: Upewnij się, że get_futex_key_refs() zawsze oznacza barierę (bcn #851603 (seria skalowalności futex)).
- Aby uzyskać więcej informacji, skorzystaj z poniższych łączy:
Suse:SUSE-SU-2015:0068-1
Red Hat: Poważny błąd Red Hat Linux dotyczy serwerów opartych na Haswell - InfoQ
Resolution
Obejście problemu
- Uaktualnij jądro systemu Linux.
Affected Products
PowerFlex rack, ScaleIOArticle Properties
Article Number: 000281636
Article Type: Solution
Last Modified: 06 Feb 2025
Version: 1
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.