Durch Linux-Kernel-Fehler verursachter PowerFlex-SDS-Fehler
Summary: Das Problem betrifft nur die Intel Haswell CPU SDS-Fehler Nichtverfügbarkeit von Daten (DU) aufgrund eines einzelnen SDS-Fehlers Lange I/O-Bereitstellung führt zu SDC-I/O-Fehlern. Linux-Kernel-Fehler ...
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Symptoms
Beispiel
- Intel Haswell CPU wird verwendet.
- Einer der SDSs meldet den Status "Daten heruntergestuft" und SDCs sind ohne ersichtlichen Grund nicht mehr mit Volumes verbunden
- SDS-Fehler
Problem
- ScaleIO-Systemereignisse melden "Daten heruntergestuft":
ScaleIO system events report "data degraded": 205466 2015-12-10 08:11:49.450 MDM_DATA_DEGRADED ERROR The system is now in DEGRADED state. 205468 2015-12-10 08:12:04.688 MDM_DATA_DEGRADED ERROR The system is now in DEGRADED state. 205470 2015-12-10 08:12:06.699 MDM_DATA_DEGRADED ERROR The system is now in DEGRADED state. 205472 2015-12-10 08:12:16.931 MDM_DATA_DEGRADED ERROR The system is now in DEGRADED state.
SDS exp.0:
10/12 02:13:14.134144 Panic in file /emc/svc_flashbld/workspace/ScaleIO-SLES12/src/tgt/ioh/ioh.c, line 70, function iohIo_TimerExpired, PID 22333.Panic Expression !(1). /opt/emc/scaleio/sds/bin/sds-1.32.3455.5(mosDbg_BackTrace+0x22) [0x479ba9] /opt/emc/scaleio/sds/bin/sds-1.32.3455.5(mosDbg_Panic+0xf0) [0x4740ad] /opt/emc/scaleio/sds/bin/sds-1.32.3455.5(iohIo_TimerExpired+0x5d) [0x43d92d] /opt/emc/scaleio/sds/bin/sds-1.32.3455.5(mosTimerQ_PollUnlocked+0x1b4) [0x46f6e3] /opt/emc/scaleio/sds/bin/sds-1.32.3455.5(mosTimer_PollQRange+0x83) [0x46fa6c] /opt/emc/scaleio/sds/bin/sds-1.32.3455.5(netPoll_StartIntr+0x2ef) [0x465808] /opt/emc/scaleio/sds/bin/sds-1.32.3455.5(mosUmt_StartFunc+0xbe) [0x47f07d] /opt/emc/scaleio/sds/bin/sds-1.32.3455.5(mosUmt_SignalHandler+0x4a) [0x47fa3a]
Auswirkungen
- Daten nicht verfügbar
- SDC hat Verbindung zu Volumes verloren.
- I/O-Fehler
- Lange I/O-Service-/Performanceverschlechterung
Cause
Aufgrund des Linux-Kernel-Fehlers verhielt sich der SDS-Prozess abnormal, aufgrund dieser Bedingung befand sich der SDS-Prozess in Stress und das Verhalten war unvorhersehbar.
Während der Antwort auf Keep-Alive-Anforderungen war der SDS nicht voll funktionsfähig und reagierte nicht auf SDC-I/O-Anforderungen.
Eine solche Bedingung erlaubte es ScaleIO nicht, den SDS als fehlgeschlagen zu markieren, was schließlich dazu führte, dass Daten nicht verfügbar waren.
- Informationen zu Linux-Kernel-Fehlern:
Futex: Behebung einer Racebedingung zwischen REQUEUE_PI und dem Aufgabentod (bcn #851603 (Futex-Skalierbarkeitsserie).
Futex: Stellen Sie sicher, dass get_futex_key_refs() immer eine Barriere impliziert (bcn #851603 (futex scalability series)).
- Weitere Informationen finden Sie unter den folgenden Links:
SUSE:SUSE-SU-2015:0068-1
Red Hat: Schwerwiegender Red Hat Linux-Fehler betrifft Haswell-basierte Server - InfoQ
Resolution
Problemumgehung
- Aktualisieren Sie die Linux Kernel-Version.
Affected Products
PowerFlex rack, ScaleIOArticle Properties
Article Number: 000281636
Article Type: Solution
Last Modified: 06 Feb 2025
Version: 1
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.