PowerFlex SDS-panikk forårsaket av Linux-kjernefeil
Summary: Problemet berører bare Intel Haswell CPU SDS-panikk Datautilgjengelighet (DU) forårsaket av en enkelt SDS-panikk Lang I/O-servering forårsaker feil på SDC I/O. Linux-kjernefeil
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Symptoms
Scenario
- Intel Haswell CPU brukes.
- En av SDS-ene rapporterer "data degradert" tilstand og SDCs tapte tilkobling til volumer, uten åpenbar grunn
- SDS-panikk
Symptomer
- ScaleIO-systemhendelser rapporterer "data degradert":
ScaleIO system events report "data degraded": 205466 2015-12-10 08:11:49.450 MDM_DATA_DEGRADED ERROR The system is now in DEGRADED state. 205468 2015-12-10 08:12:04.688 MDM_DATA_DEGRADED ERROR The system is now in DEGRADED state. 205470 2015-12-10 08:12:06.699 MDM_DATA_DEGRADED ERROR The system is now in DEGRADED state. 205472 2015-12-10 08:12:16.931 MDM_DATA_DEGRADED ERROR The system is now in DEGRADED state.
SDS exp.0:
10/12 02:13:14.134144 Panic in file /emc/svc_flashbld/workspace/ScaleIO-SLES12/src/tgt/ioh/ioh.c, line 70, function iohIo_TimerExpired, PID 22333.Panic Expression !(1). /opt/emc/scaleio/sds/bin/sds-1.32.3455.5(mosDbg_BackTrace+0x22) [0x479ba9] /opt/emc/scaleio/sds/bin/sds-1.32.3455.5(mosDbg_Panic+0xf0) [0x4740ad] /opt/emc/scaleio/sds/bin/sds-1.32.3455.5(iohIo_TimerExpired+0x5d) [0x43d92d] /opt/emc/scaleio/sds/bin/sds-1.32.3455.5(mosTimerQ_PollUnlocked+0x1b4) [0x46f6e3] /opt/emc/scaleio/sds/bin/sds-1.32.3455.5(mosTimer_PollQRange+0x83) [0x46fa6c] /opt/emc/scaleio/sds/bin/sds-1.32.3455.5(netPoll_StartIntr+0x2ef) [0x465808] /opt/emc/scaleio/sds/bin/sds-1.32.3455.5(mosUmt_StartFunc+0xbe) [0x47f07d] /opt/emc/scaleio/sds/bin/sds-1.32.3455.5(mosUmt_SignalHandler+0x4a) [0x47fa3a]
Innvirkning
- Data utilgjengelig
- SDC mistet tilkoblingen til volumer.
- I/O-feil
- Lang I/O-service/redusert ytelse
Cause
På grunn av Linux-kjernefeilen oppførte SDS-prosessen seg unormalt, på grunn av denne tilstanden var SDS-prosessen i stress og oppførselen var uforutsigbar.
SDS svarte på forespørsler om å holde i gang og svarte ikke på SDC I/O-forespørsler.
En slik tilstand tillot ikke ScaleIO å merke SDS som mislykket, noe som til slutt førte til at data ikke var tilgjengelige.
- Informasjon om feil i Linux-kjernen:
Futex: Fiks en kappløpssituasjon mellom REQUEUE_PI og oppgavedød (bcn #851603 (futex-skalerbarhetsserie).
Futex: Sørg for at get_futex_key_refs() alltid innebærer en barriere (bcn #851603 (futex scalability series)).
- Hvis du vil ha mer informasjon, kan du se følgende koblinger:
Suse:SUSE-SU-2015:0068-1
Red Hat: Alvorlig Red Hat Linux-feil påvirker Haswell-baserte servere - InfoQ
Resolution
Omgåelse av problemet
- Oppgrader Linux Kernel-versjonen.
Affected Products
PowerFlex rack, ScaleIOArticle Properties
Article Number: 000281636
Article Type: Solution
Last Modified: 06 Feb 2025
Version: 1
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.