Dell Unity: Timeout-Fehler bei Laufwerksbefehlen können zu Leistungsproblemen und nicht verfügbaren Daten führen (vom Nutzer korrigierbar).
Summary: Beschreibung der Auswirkungen: Schwerwiegende Leistungsprobleme, nachdem Flash-Festplatten Fehler protokollieren, die nicht automatisch vom Array behoben werden.
Symptoms
Potenzielle Nichtverfügbarkeit von Daten
Schweregrad: Kritisch Der Systemadministrator beobachtet schwerwiegende Leistungsprobleme auf dem Array, nachdem ein Laufwerk beginnt, Fehler zu protokollieren: Soft-Media-Fehler und 01|18|ff, gefolgt von versehentlichen Abbrüchen, Auswahl-Timeouts und Befehls-Timeouts.
Laufwerke mit den aufgeführten Teilenummern und der Firmware. Das Array meldet möglicherweise Fehler als "Soft media error" und 01|18|ff gefolgt von Soft-SCSI-Bus-Fehlern “[IncidentalAbort]", “[Select timeout]", and “[Command timeout]". Das Laufwerk kann auf einem SP offline geschaltet werden, bleibt jedoch auf dem zweiten SP aktiv und meldet ähnliche Fehler.
Beispiel für SP-Protokolle:
>>> drive repeatedly reports 01/18/ff B 11/15/20 18:05:31.994 Bus0 Enc0 Dsk02 11c4004 [WARN] System: Disk 0_0_2 Soft media error. DrvErrExtStat:0x22 SRT 35ms ST 0x767fd102672 ET 0x767fd10b014 . [Recovered error (on-drive ECC)] B 11/15/20 18:05:32.009 Bus0 Enc0 Dsk02 11c0006 [INFO] System: Disk 0_0_2 01|18|ff BLBA 0x32d948218 OP 0x88, LBA 0x32d948200, SZ 0x80 . A 11/15/20 18:06:18.548 Bus0 Enc0 Dsk02 11c4004 [WARN] System: Disk 0_0_2 Soft media error. DrvErrExtStat:0x22 SRT 66ms ST 0x7680628d0f1 ET 0x7680629d1c6 . [Recovered error (on-drive ECC)] A 11/15/20 18:06:18.566 Bus0 Enc0 Dsk02 11c0006 [INFO] System: Disk 0_0_2 01|18|ff BLBA 0x2d6cce4d8 OP 0x88, LBA 0x2d6cce4d0, SZ 0x10 . >>> followed by Soft SCSI bus errors (Incidental abort and selection timeout) A 11/15/20 18:17:33.877 Bus0 Enc0 Dsk02 11c4003 [WARN] System: Disk 0_0_2 Soft SCSI bus error. DrvErrExtStat:0xdd SRT 522ms ST 0x7682e5dd934 ET 0x7682e65cf8b . [IncidentalAbort] B 11/15/20 18:17:33.892 Bus0 Enc0 Dsk02 11c4003 [WARN] System: Disk 0_0_2 Soft SCSI bus error. DrvErrExtStat:0xdd SRT 535ms ST 0x768280ad284 ET 0x7682812faab . [IncidentalAbort] A 11/15/20 18:17:33.910 Bus0 Enc0 Dsk02 11c4003 [WARN] System: Disk 0_0_2 Soft SCSI bus error. DrvErrExtStat:0x7 SRT 537ms ST 0x7682e5d9c09 ET 0x7682e65cfc5 . [Select timeout] >>> followed by repeated command timeout. A 11/15/20 20:44:30.049 Bus0 Enc0 Dsk02 11c4003 [WARN] System: Disk 0_0_2 Soft SCSI bus error. DrvErrExtStat:0x6 SRT 4340ms ST 0x76a3b63f4df ET 0x76a3ba4175c . [Command timeout] A 11/15/20 20:44:30.069 Bus0 Enc0 Dsk02 11c4003 [WARN] System: Disk 0_0_2 Soft SCSI bus error. DrvErrExtStat:0x6 SRT 4201ms ST 0x76a3b641f27 ET 0x76a3ba41b53 . [Command timeout] A 11/15/20 20:44:30.090 Bus0 Enc0 Dsk02 11c4003 [WARN] System: Disk 0_0_2 Soft SCSI bus error. DrvErrExtStat:0x6 SRT 4210ms ST 0x76a3b63e5a2 ET 0x76a3ba41f97 . [Command timeout] >>> drive reported too many port errors and was logged out, then it could not log in again. It failed on SPB with the Activate timer expired. B 11/16/20 05:52:47.360 Bus0 Enc0 LccB 1678052 [ERROR] System: LCC is faulted. This failure may be caused by a component other than the LCC (Drive, Cable, Connector, ...). B 11/16/20 05:54:42.263 Bus0 Enc0 Dsk02 60258 [CRIT] User: Disk 0_0_2 has failed (Part Number 005053578, Serial Number 50L0A01FTT2F) B 11/16/20 05:54:42.879 Bus0 Enc0 LccB 602bc [CRIT] User: LCC has faulted (Part Number 303-396-000B-00, Serial Number CF2DD201400245) B 11/16/20 05:55:23.571 Bus0 Enc0 Dsk02 1678058 [ERROR] System: Disk 0_0_2 taken offline. Escalate to support. SN:50L0A01FTT2F TLA:005053578 Rev:PA5H (0x2030001) Reason:Expired.
Möglicherweise betroffene Systeme:
| Produkt (und Version) | Dell Unity 300F, Dell Unity 350F, Dell Unity XT 380F, Dell Unity 400F, Dell Unity 450F, Dell Unity XT 480F, Dell Unity 600F, Dell Unity 650F, Dell Unity XT 680F, Dell Unity XT 880F, Dell Unity Produktreihe |Dell Unity All-Flash |
| Ausführen dieser Core-Software (Betriebssystem (BS) oder Betriebsumgebung (OE)) |
Alle Betriebsumgebungen |
| Wenn diese Bedingung erfüllt ist | Das Array enthält beliebige der folgenden Teilenummern von Laufwerken mit Firmware PA5H 005052867, 005052866, 005052869, 005052868, 005052871, 005052870, 005053573, 005053572, 005053577, 005053576, 005053579, 005053578, 005052859, 005052858, 005052861, 005052860, 005052863, 005052862, 005053583, 005053582, 005053596, 005053595, 005053598, 005053597, 005053575, 005053574 |
Cause
Die integrierte Fehlerbehebung der Laufwerke reagiert in der Regel innerhalb eines akzeptablen Zeitrahmens, gelegentlich kann jedoch aufgrund eines NAND-Fehlers die Anzahl der für die Wiederherstellung erforderlichen Blöcke sehr groß sein. In Kombination mit einer langen Einstellung für das Befehls-Timeout können diese übermäßig häufig auftreten und die Leistung des Arrays beeinträchtigen.
Resolution
| Maßnahmentyp | Auflösung |
| Erforderliche Maßnahmen | Aktualisieren Sie die Laufwerksfirmware auf PA5L, um das Problem zu beheben. |
| Wer kann die Maßnahme durchführen? | Kunde |
| Problem wurde in diesem BS, dieser OE oder dieser Software behoben |
Firmware PA5L ist auf www.dell.com/support im Unity-Laufwerksfirmware-Bundle V18 oder höher verfügbar.
|
| Lösungsverfahren für SolVe-Kunden | Weitere Informationen zum Upgrade der Laufwerksfirmware erhalten Sie, indem Sie in SolVe für Dell Unity "Softwareupgradeverfahren" auswählen. oder folgen Sie den Anweisungen und Informationen im Artikel Anweisungen und Informationen zum Upgrade der Laufwerksfirmware |
| Auflösungsdetails | Arrays, bei denen derzeit Leistungsprobleme auftreten: Um die Leistungsprobleme sofort zu beheben, nehmen Sie das fehlerhafte Laufwerk aus dem Pool. Sobald das Laufwerk aus dem Pool entfernt ist, sollte sich die Leistung sofort verbessern. Um dies zu erreichen, gehen Sie wie folgt vor: Wenn physischer Zugriff auf das System verfügbar ist: Entfernen Sie das Laufwerk, das einen Soft-SCSI-Bus-Fehler meldet, und tauschen Sie das entfernte Laufwerk gegen ein entsprechendes Ersatzlaufwerk aus. Setzen Sie das Ersatzlaufwerk erst nach 5 Minuten ein, damit das System es vom Paritätslaufwerk aus neu erstellen kann. Wenden Sie sich nach Bedarf an den technischen Support von Dell, um einen Laufwerksaustausch für das Laufwerk anzufordern, das die Leistungsprobleme verursacht. Wenn kein physischer Zugriff auf das System unmittelbar verfügbar ist und andere mögliche Workarounds besprechen möchten, wenden Sie sich an den technischen Support von Dell oder einen autorisierten Servicemitarbeiter und geben Sie diese DTA-Artikelnummer an. Führen Sie ein Upgrade der Laufwerksfirmware auf PA5L durch. Sicherstellen, dass das neue Array ein Upgrade auf die Laufwerksfirmware PA5L durchführt HINWEIS: Die PA5L-Firmware dient dazu, Laufwerke mit übermäßigen 01/18/ff- und Befehls-Timeout-Fehler früher zu ersetzen. Beachten Sie, dass während eines Laufwerkaustauschs, einer Neuerstellung oder eines Neumischen/Neuausgleichs in dynamischen Pools sekundäre Leistungseinbußen auftreten können. LKB-000055614 werden entsprechend aktualisiert, sobald dieses Problem behoben ist. Anweisungen zum Aktualisieren der Laufwerksfirmware finden Sie im LKB-000021322. Firmware-Bundles für Unity-Laufwerke stehen zum Herunterladen über www.dell.com/support zur Verfügung. Sie finden sie, indem Sie nach „Unity Drive Firmware Package“ suchen. |