Panika PowerFlex SDS spowodowana błędem jądra systemu Linux

Summary: Problem dotyczy tylko procesora Intel Haswell Panika SDS Niedostępność danych (DU) spowodowana błędem pojedynczego serwera SDS Długa obsługa we/wy powoduje awarię operacji we/wy SDC. Błąd jądra Linuksa ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Scenariusz

  • Intel Haswell Procesor jest używany.
  • Jeden z SDS-ów zgłasza stan "obniżonej jakości danych" i utracone połączenie SDC z woluminami bez wyraźnej przyczyny
  • Panika SDS
     

Objawy

  • Zdarzenia systemowe ScaleIO zgłaszają "data degraded":
ScaleIO system events report "data degraded":
205466 2015-12-10 08:11:49.450 MDM_DATA_DEGRADED ERROR The system is now in DEGRADED state.
205468 2015-12-10 08:12:04.688 MDM_DATA_DEGRADED ERROR The system is now in DEGRADED state.
205470 2015-12-10 08:12:06.699 MDM_DATA_DEGRADED ERROR The system is now in DEGRADED state.
205472 2015-12-10 08:12:16.931 MDM_DATA_DEGRADED ERROR The system is now in DEGRADED state.

SDS exp.0:

10/12 02:13:14.134144 Panic in file /emc/svc_flashbld/workspace/ScaleIO-SLES12/src/tgt/ioh/ioh.c, line 70, function iohIo_TimerExpired, PID 22333.Panic Expression !(1).
/opt/emc/scaleio/sds/bin/sds-1.32.3455.5(mosDbg_BackTrace+0x22) [0x479ba9]
/opt/emc/scaleio/sds/bin/sds-1.32.3455.5(mosDbg_Panic+0xf0) [0x4740ad]
/opt/emc/scaleio/sds/bin/sds-1.32.3455.5(iohIo_TimerExpired+0x5d) [0x43d92d]
/opt/emc/scaleio/sds/bin/sds-1.32.3455.5(mosTimerQ_PollUnlocked+0x1b4) [0x46f6e3]
/opt/emc/scaleio/sds/bin/sds-1.32.3455.5(mosTimer_PollQRange+0x83) [0x46fa6c]
/opt/emc/scaleio/sds/bin/sds-1.32.3455.5(netPoll_StartIntr+0x2ef) [0x465808]
/opt/emc/scaleio/sds/bin/sds-1.32.3455.5(mosUmt_StartFunc+0xbe) [0x47f07d]
/opt/emc/scaleio/sds/bin/sds-1.32.3455.5(mosUmt_SignalHandler+0x4a) [0x47fa3a]

 

Wpływ

  • Dane niedostępne
  • Klient SDC utracił połączenie z woluminami.
  • Błąd we/wy
  • Długi okres eksploatacji we/wy / pogorszenie wydajności

Cause

Z powodu błędu jądra Linuksa proces SDS zachowywał się nieprawidłowo, z tego powodu proces SDS był w stresie, a zachowanie było nieprzewidywalne.
Podczas odpowiadania na żądania utrzymania aktywności serwer SDS nie był w pełni funkcjonalny i nie odpowiadał na żądania we/wy SDC.
Taki warunek nie pozwalał ScaleIO oznaczyć SDS jako uszkodzonego, co ostatecznie doprowadziło do niedostępności danych.

 

Resolution

Obejście problemu

  • Uaktualnij jądro systemu Linux.

Affected Products

PowerFlex rack, ScaleIO
Article Properties
Article Number: 000281636
Article Type: Solution
Last Modified: 06 Feb 2025
Version:  1
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.