Dell EMC Unity: Laufwerksfehler, die zu Laufwerksausfällen oder Leistungsproblemen führen (von Dell EMC korrigierbar)
Summary: Schwerwiegende Leistungsprobleme, nachdem einige Flash-Festplatten Fehler protokollieren, aber nicht automatisch vom System fehlgeschlagen werden.
Symptoms
Überblick:
Bei den folgenden Teilenummern von Laufwerken wurden zwei separate Probleme beobachtet:
005052377, 005052378, 005052379, 005052380, 005051739, 005051740, 005052154, 005052155
Ausgabe # 1.
Laufwerke ausfallen (EOL, Ende der Nutzungsdauer), nachdem das Laufwerk viele Soft-SCSI-Bus-Fehler gemeldet hat, begleitet von UNGÜLTIGER SENSE-PUFFER
Laufwerke mit den aufgeführten Teilenummern und auf denen die Firmware PC09, PC0B, PC0D, PC10, PC42 oder PC47
ausgeführt wird Beispiel für SP-Protokolle (/EMC/backend/log_shared/EMCSystemLogFile.log) ähnlich wie unten:
29.01.18 05:41:00.121 Bus0 Enc0 Dsk19 11c4003 [WARN] System: Fehler beim Laufwerks-Soft-SCSI-Bus. DrvErrExtStat:0x1 SRT 349ms ST 0xcd51723a571 ET 0xcd517285579 . [REQUEST SENSE-Befehl fehlgeschlagen]
29.01.18 05:41:00.131 Bus0 Enc0 dsk19 11c0006 [INFO] System: Festplatte UNGÜLTIGER SENSE-PUFFER OP 0x28, LBA 0x37d8e000, SZ 0x800
Ausgabe # 2.
Der Systemadministrator beobachtet schwerwiegende Leistungsprobleme auf dem System, nachdem ein Laufwerk beginnt, Fehler zu protokollieren: Soft-Media-Fehler und 01|18|ff
Laufwerke mit den aufgeführten Teilenummern und Firmware PC13 oder PC4A. Möglicherweise meldet das System Fehler "Soft-Media-Fehler".
Das Laufwerk meldet möglicherweise, dass es das Ende der Nutzungsdauer (EOL) erreicht hat, bleibt jedoch Teil des Pools und beeinträchtigt die Performance aller LUNs/FSs im betroffenen Pool.
Das Problem wurde hauptsächlich bei dynamischen All-Flash-Pools beobachtet, kann aber möglicherweise auch herkömmliche Pools umfassen, die Flash-Festplatten mit den betroffenen Teilenummern enthalten.
27.04.18 21:52:52.909 Bus1 Enc0 DSK02 11C4004 [WARN] System: Festplatte 1_0_2 Weicher Medienfehler. DrvErrExtStat:0x22 SRT 69ms ST 0x5eae3254c6d ET 0x5eae32659fa . [Wiederhergestellter Fehler (ECC auf dem Laufwerk)]
27.04.18 21:52:52.921 Bus1 Enc0 dsk02 11c0006 [INFO] System: Festplatte 1_0_2 01|18|ff BLBA 0x127fedd0 OP 0x2f, LBA
Cause
Ausgabe # 1: Laufwerk meldet Soft-SCSI-Bus-Fehler mit UNGÜLTIGEM ERKENNUNGSPUFFER
Die Ursache für die Fehler ist eine falsche Datenerkennungsfeldlänge, die vom Laufwerk zurückgegeben wird: Obwohl in den Dell EMC Anforderungen angegeben ist, dass die maximal zulässige Größe für Erkennungsdaten im Deskriptorformat 48 Byte beträgt, erzeugt die Firmware Erkennungsdaten im Deskriptorformat, die größer als 48 Byte sind.
Ausgabe # 2: Laufwerk meldet Soft-Media-Fehler und 01|18|ff
Die Ursache für die Soft-Media-Fehler ist, dass Unity-Code die vom Laufwerk zurückgegebenen Fehler falsch erkennt. In beiden Fällen werden die vom Laufwerk zurückgegebenen Fehler vom Unity-Code nicht korrekt erkannt, während die Fehlerrate für gute IOs weiterhin niedrig ist, was dazu führt, dass das Laufwerk über einen längeren Zeitraum in einem nicht optimalen Zustand betrieben wird und die Performance aller LUNs/FSs im Pool beeinträchtigt wird.
Resolution
Ausgabe # 1:
Dell EMC Unity OE 4.2.1.9535982 und höher behebt dieses Problem und es wird empfohlen, die Arraysoftware auf die neueste Version zu aktualisieren.
Darüber hinaus wird dringend empfohlen, die Laufwerksfirmware zu aktualisieren, um zukünftige Probleme zu vermeiden. Siehe unten.
Ausgabe # 2: Laufwerk meldet Soft-Media-Fehler und 01|18|ff
Zur sofortigen Behebung des Leistungsproblems sollte das fehlerhafte Laufwerk aus dem Pool entfernt werden. Sobald das Laufwerk aus dem Pool entfernt ist, sollte sich die Leistung sofort verbessern.
- Wenn physischer Zugriff auf das System verfügbar ist, entfernen Sie das problematische Laufwerk aus dem Steckplatz und wenden Sie sich an den technischen Support von Dell EMC, um den Austausch des Laufwerks anzufordern.
- Wenn kein physischer Zugriff auf das System unmittelbar verfügbar ist, und um andere mögliche Workarounds zu besprechen, wenden Sie sich an den technischen Support von Dell EMC oder Ihren autorisierten Servicevertreter und geben Sie diese Wissensdatenbank-Artikel-ID an.
Empfehlungen:
Um Problem #1 und #2 zu beheben, wird empfohlen, die Laufwerksfirmware auf die unten aufgeführten Versionen oder höher zu aktualisieren. Das am 27. Februar 2019 veröffentlichte Unity-Laufwerksfirmware-Bundle V9 enthält Firmware für die folgenden Teilenummern und die entsprechenden Firmwareversionen
: 005052377 – QC4E
005052378 – QC4E
005052379 – QC4E
005052380 – QC4E
005051739 PC16
005051740 PC16
005052154 PC16
005052155 PC16
Anweisungen zum Aktualisieren der Laufwerksfirmware finden Sie in KB 490700 https://support.emc.com/kb/490700 .
Das neueste Unity-Laufwerksfirmwarepaket steht auf der Supportseite zum Download zur Verfügung und kann durch Suchen nach "Unity_Drive_Firmware_Package"
gefunden werden.
Siehe DTA-528178: Dell EMC Unity: Laufwerk-Soft-Media-Fehler können zu Leistungsproblemen und Nichtverfügbarkeit von Daten führen (von NutzerInnen korrigierbar)für Laufwerke 005052377 005052378 005052379 und 005052380
Additional Information
| https://downloads.dell.com/TranslatedPDF/ES_KB521649.pdf |
| https://downloads.dell.com/TranslatedPDF/DE_KB521649.pdf |
| https://downloads.dell.com/TranslatedPDF/FR_KB521649.pdf |
| https://downloads.dell.com/TranslatedPDF/IT_KB521649.pdf |
| https://downloads.dell.com/TranslatedPDF/JA_KB521649.pdf |
| https://downloads.dell.com/TranslatedPDF/KO_KB521649.pdf |