Panika PowerFlex SDS způsobená chybou jádra systému Linux

Summary: Problém se týká pouze procesoru Intel Haswell Panika SDS Nedostupnost dat (DU) způsobená jednou panikou SDS Dlouhá obsluha I/O způsobuje selhání SDC I/O. Chyba linuxového jádra

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Scénář

  • Intel Haswell Procesor je používán.
  • Jeden z úložišť SDS hlásí stav "data degraded" a SDC ztratil připojení ke svazkům, a to bez zjevného důvodu.
  • Panika SDS
     

Příznaky

  • Systémové události ScaleIO hlásí "data degraded":
ScaleIO system events report "data degraded":
205466 2015-12-10 08:11:49.450 MDM_DATA_DEGRADED ERROR The system is now in DEGRADED state.
205468 2015-12-10 08:12:04.688 MDM_DATA_DEGRADED ERROR The system is now in DEGRADED state.
205470 2015-12-10 08:12:06.699 MDM_DATA_DEGRADED ERROR The system is now in DEGRADED state.
205472 2015-12-10 08:12:16.931 MDM_DATA_DEGRADED ERROR The system is now in DEGRADED state.

SDS exp.0:

10/12 02:13:14.134144 Panic in file /emc/svc_flashbld/workspace/ScaleIO-SLES12/src/tgt/ioh/ioh.c, line 70, function iohIo_TimerExpired, PID 22333.Panic Expression !(1).
/opt/emc/scaleio/sds/bin/sds-1.32.3455.5(mosDbg_BackTrace+0x22) [0x479ba9]
/opt/emc/scaleio/sds/bin/sds-1.32.3455.5(mosDbg_Panic+0xf0) [0x4740ad]
/opt/emc/scaleio/sds/bin/sds-1.32.3455.5(iohIo_TimerExpired+0x5d) [0x43d92d]
/opt/emc/scaleio/sds/bin/sds-1.32.3455.5(mosTimerQ_PollUnlocked+0x1b4) [0x46f6e3]
/opt/emc/scaleio/sds/bin/sds-1.32.3455.5(mosTimer_PollQRange+0x83) [0x46fa6c]
/opt/emc/scaleio/sds/bin/sds-1.32.3455.5(netPoll_StartIntr+0x2ef) [0x465808]
/opt/emc/scaleio/sds/bin/sds-1.32.3455.5(mosUmt_StartFunc+0xbe) [0x47f07d]
/opt/emc/scaleio/sds/bin/sds-1.32.3455.5(mosUmt_SignalHandler+0x4a) [0x47fa3a]

 

Důsledky

  • Data nejsou k dispozici.
  • SDC ztratilo připojení ke svazkům.
  • Selhání I/O
  • Dlouhé I/O snížení služby/výkonu

Cause

Kvůli chybě linuxového jádra se proces SDS choval abnormálně, kvůli tomuto stavu byl proces SDS ve stresu a chování bylo nepředvídatelné.
Při odpovídání na požadavky Keep Alive nebyl SDS plně funkční a nereagoval na požadavky SDC I/O.
Taková podmínka neumožňovala společnosti ScaleIO označit SDS jako nefunkční, což nakonec vedlo k nedostupnosti dat.

 

  • Informace o chybě linuxového jádra:
    Futex: Oprava konfliktu časování mezi REQUEUE_PI a smrtí úlohy (bcn #851603 (řada škálovatelnosti futex).
    Futex: Ujistěte se, že get_futex_key_refs() vždy implikuje překážku (bcn #851603 (řada škálovatelnosti futex)).
     
  • Další informace naleznete na následujících odkazech:
    Suse:SUSE-SU-2015:0068-1
    Red Hat: Závažná chyba Red Hat Linuxu postihuje servery Haswell - InfoQ

Resolution

Zástupné řešení

  • Aktualizace verze linuxového jádra.

Affected Products

PowerFlex rack, ScaleIO
Article Properties
Article Number: 000281636
Article Type: Solution
Last Modified: 06 Feb 2025
Version:  1
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.