Dell Unity:驱动器命令超时错误可能导致性能问题和数据不可用(用户可纠正)

Summary: 影响描述:闪存驱动器开始记录错误后出现严重性能问题,阵列不会自动解决这些错误。

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

潜在的数据不可用
严重级别:严重:

在驱动器开始记录错误(软介质错误和 01|18|ff,然后意外中止、选择超时和命令超时)后,系统管理员观察到阵列上出现严重的性能问题。

列出部件号和固件的驱动器。阵列可能会报告错误,因为 "Soft media error"  01|18|ff 后跟软 SCSI 总线错误 “[IncidentalAbort]", “[Select timeout]", and “[Command timeout]". 驱动器可以在一个 SP 上离线,但在第二个 SP 上保持活动状态,报告类似的错误。


SP 日志示例

>>> drive repeatedly reports 01/18/ff
B       11/15/20 18:05:31.994 Bus0 Enc0 Dsk02   11c4004 [WARN] System: Disk 0_0_2 Soft media error. DrvErrExtStat:0x22 SRT 35ms ST 0x767fd102672 ET 0x767fd10b014 . [Recovered error (on-drive ECC)]
B       11/15/20 18:05:32.009 Bus0 Enc0 Dsk02   11c0006 [INFO] System: Disk 0_0_2 01|18|ff BLBA 0x32d948218 OP 0x88, LBA 0x32d948200, SZ 0x80 .
A       11/15/20 18:06:18.548 Bus0 Enc0 Dsk02   11c4004 [WARN] System: Disk 0_0_2 Soft media error. DrvErrExtStat:0x22 SRT 66ms ST 0x7680628d0f1 ET 0x7680629d1c6 . [Recovered error (on-drive ECC)]
A       11/15/20 18:06:18.566 Bus0 Enc0 Dsk02   11c0006 [INFO] System: Disk 0_0_2 01|18|ff BLBA 0x2d6cce4d8 OP 0x88, LBA 0x2d6cce4d0, SZ 0x10 .

>>> followed by Soft SCSI bus errors (Incidental abort and selection timeout)
A       11/15/20 18:17:33.877 Bus0 Enc0 Dsk02   11c4003 [WARN] System: Disk 0_0_2 Soft SCSI bus error. DrvErrExtStat:0xdd SRT 522ms ST 0x7682e5dd934 ET 0x7682e65cf8b . [IncidentalAbort]
B       11/15/20 18:17:33.892 Bus0 Enc0 Dsk02   11c4003 [WARN] System: Disk 0_0_2 Soft SCSI bus error. DrvErrExtStat:0xdd SRT 535ms ST 0x768280ad284 ET 0x7682812faab . [IncidentalAbort]
A       11/15/20 18:17:33.910 Bus0 Enc0 Dsk02   11c4003 [WARN] System: Disk 0_0_2 Soft SCSI bus error. DrvErrExtStat:0x7 SRT 537ms ST 0x7682e5d9c09 ET 0x7682e65cfc5 . [Select timeout]

>>> followed by repeated command timeout.
A       11/15/20 20:44:30.049 Bus0 Enc0 Dsk02   11c4003 [WARN] System: Disk 0_0_2 Soft SCSI bus error. DrvErrExtStat:0x6 SRT 4340ms ST 0x76a3b63f4df ET 0x76a3ba4175c . [Command timeout]
A       11/15/20 20:44:30.069 Bus0 Enc0 Dsk02   11c4003 [WARN] System: Disk 0_0_2 Soft SCSI bus error. DrvErrExtStat:0x6 SRT 4201ms ST 0x76a3b641f27 ET 0x76a3ba41b53 . [Command timeout]
A       11/15/20 20:44:30.090 Bus0 Enc0 Dsk02   11c4003 [WARN] System: Disk 0_0_2 Soft SCSI bus error. DrvErrExtStat:0x6 SRT 4210ms ST 0x76a3b63e5a2 ET 0x76a3ba41f97 . [Command timeout]

>>> drive reported too many port errors and was logged out, then it could not log in again. It failed on SPB with the Activate timer expired.
B       11/16/20 05:52:47.360 Bus0 Enc0 LccB    1678052 [ERROR] System: LCC is faulted. This failure may be caused by a component other than the LCC (Drive, Cable, Connector, ...).
B       11/16/20 05:54:42.263 Bus0 Enc0 Dsk02     60258 [CRIT] User: Disk 0_0_2 has failed (Part Number 005053578, Serial Number 50L0A01FTT2F)
B       11/16/20 05:54:42.879 Bus0 Enc0 LccB      602bc [CRIT] User: LCC has faulted (Part Number 303-396-000B-00, Serial Number CF2DD201400245)
B       11/16/20 05:55:23.571 Bus0 Enc0 Dsk02   1678058 [ERROR] System: Disk 0_0_2 taken offline. Escalate to support. SN:50L0A01FTT2F TLA:005053578 Rev:PA5H (0x2030001) Reason:Expired.




可能受影响的系统:

产品(和版本) 戴尔 Unity 300F、戴尔 Unity 350F、戴尔 Unity XT 380F、戴尔 Unity 400F、戴尔 Unity 450F、戴尔 Unity XT 480F、戴尔 Unity 600F、戴尔 Unity 650F、戴尔 Unity XT 680F、戴尔 Unity XT 880F、戴尔 Unity 系列 |戴尔 Unity 全闪存
运行此核心软件
(作系统 (OS) 或作环境 (OE))
所有操作环境
当此条件为真时 阵列包含以下任何驱动器部件编号和固件 PA5H
005052867、005052866、005052869、005052868、005052871、005052870、005053573、005053572、005053577、005053576、005053579、005053578、005052859、005052858、005052861、005052860、005052863、005052862、005053583、005053582、005053596、005053595、005053598、005053597、005053575、005053574

 

Cause

具有许多数据错误的驱动器将连同固件中的长命令超时设置一起运行内部错误恢复,这可能会导致驱动器出现性能问题

驱动器内置错误恢复通常在可接受的时间限制内响应,但是有时由于 NAND 缺陷,恢复所需的数据块数量可能非常大,再加上长命令,超时设置可能会导致过多的命令超时并影响阵列的性能。

Resolution

操作类型 解决方法
需要的操作 将驱动器固件升级到 PA5L 以解决此问题。
谁可以完成操作 客户
此 OS、OE 或软件中解决的问题

固件 PA5L 可用于 Unity 驱动器 固件 捆绑包 V18 或更高版本中的 www.dell.com/support。

 

SolVe 客户解决步骤 有关升级驱动器固件的其他信息,请在 SolVe for Dell Unity 中选择“Software Upgrade Procedures”。

或按照文章驱动器固件升级说明和信息进行作
解决方案详细信息 当前遇到性能问题的阵列:  要立即缓解性能问题,请将有问题的驱动器从池中取出。驱动器退出池后,性能应立即提高。  为此,请执行以下操作:
如果可以实际接触系统:
卸下标识为报告软 SCSI 总线错误的驱动器,并且 [命令超时]
用同等备件换掉已卸下的驱动器。  不要插入更换驱动器,等待 5 分钟,以使系统从奇偶校验重建到备用驱动器。
如有必要,请联系戴尔技术支持,请求更换导致性能问题的驱动器。
如果无法立即实际接触系统,并且要讨论其他可能的解决方法,请联系戴尔技术支持或授权服务代表,并引用此 DTA 文章编号。
将驱动器固件升级到 PA5L。
确保新阵列安装并升级到驱动器固件 PA5L
提醒:
PA5L 固件旨在更快地替换报告过多 01/18/ff 和 Command Timeout(命令超时)错误的驱动器。请注意,在动态池中执行驱动器更换重建或重新调整/重新平衡作期间,可能会遇到继发的性能影响。此问题得到解决后,LKB 000055614将相应地更新。

有关更新驱动器固件的说明,请参阅 LKB 000021322
Unity 驱动器固件捆绑包可从 www.dell.com/support 下载,可通过搜索“Unity 驱动器固件程序包”找到。

Affected Products

Dell EMC Unity Family
Article Properties
Article Number: 000190983
Article Type: Solution
Last Modified: 27 Mar 2025
Version:  5
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.