Dell Unity:磁碟機命令逾時錯誤可能導致效能問題和資料不可用性 (使用者可修正)

Summary: 影響描述:快閃記憶體磁碟開始記錄陣列無法自動解決的錯誤後,會出現嚴重的效能問題。

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

可能導致資料不可用性
嚴重性:嚴重

在磁碟機開始記錄錯誤 - 軟體媒體錯誤和 01|18|ff 後,系統管理員觀察到陣列上出現嚴重的效能問題,隨後會中止、選取逾時和命令逾時。

列出零件編號和韌體的磁碟機。陣列可能會將錯誤報告為 "Soft media error"  01|18|ff 隨後發生軟體 SCSI 匯流排錯誤 “[IncidentalAbort]", “[Select timeout]", and “[Command timeout]". 磁碟機可能會在一個 SP 上離線,但在第二個回報類似錯誤的 SP 上保持作用中狀態。


範例 SP 記錄

>>> drive repeatedly reports 01/18/ff
B       11/15/20 18:05:31.994 Bus0 Enc0 Dsk02   11c4004 [WARN] System: Disk 0_0_2 Soft media error. DrvErrExtStat:0x22 SRT 35ms ST 0x767fd102672 ET 0x767fd10b014 . [Recovered error (on-drive ECC)]
B       11/15/20 18:05:32.009 Bus0 Enc0 Dsk02   11c0006 [INFO] System: Disk 0_0_2 01|18|ff BLBA 0x32d948218 OP 0x88, LBA 0x32d948200, SZ 0x80 .
A       11/15/20 18:06:18.548 Bus0 Enc0 Dsk02   11c4004 [WARN] System: Disk 0_0_2 Soft media error. DrvErrExtStat:0x22 SRT 66ms ST 0x7680628d0f1 ET 0x7680629d1c6 . [Recovered error (on-drive ECC)]
A       11/15/20 18:06:18.566 Bus0 Enc0 Dsk02   11c0006 [INFO] System: Disk 0_0_2 01|18|ff BLBA 0x2d6cce4d8 OP 0x88, LBA 0x2d6cce4d0, SZ 0x10 .

>>> followed by Soft SCSI bus errors (Incidental abort and selection timeout)
A       11/15/20 18:17:33.877 Bus0 Enc0 Dsk02   11c4003 [WARN] System: Disk 0_0_2 Soft SCSI bus error. DrvErrExtStat:0xdd SRT 522ms ST 0x7682e5dd934 ET 0x7682e65cf8b . [IncidentalAbort]
B       11/15/20 18:17:33.892 Bus0 Enc0 Dsk02   11c4003 [WARN] System: Disk 0_0_2 Soft SCSI bus error. DrvErrExtStat:0xdd SRT 535ms ST 0x768280ad284 ET 0x7682812faab . [IncidentalAbort]
A       11/15/20 18:17:33.910 Bus0 Enc0 Dsk02   11c4003 [WARN] System: Disk 0_0_2 Soft SCSI bus error. DrvErrExtStat:0x7 SRT 537ms ST 0x7682e5d9c09 ET 0x7682e65cfc5 . [Select timeout]

>>> followed by repeated command timeout.
A       11/15/20 20:44:30.049 Bus0 Enc0 Dsk02   11c4003 [WARN] System: Disk 0_0_2 Soft SCSI bus error. DrvErrExtStat:0x6 SRT 4340ms ST 0x76a3b63f4df ET 0x76a3ba4175c . [Command timeout]
A       11/15/20 20:44:30.069 Bus0 Enc0 Dsk02   11c4003 [WARN] System: Disk 0_0_2 Soft SCSI bus error. DrvErrExtStat:0x6 SRT 4201ms ST 0x76a3b641f27 ET 0x76a3ba41b53 . [Command timeout]
A       11/15/20 20:44:30.090 Bus0 Enc0 Dsk02   11c4003 [WARN] System: Disk 0_0_2 Soft SCSI bus error. DrvErrExtStat:0x6 SRT 4210ms ST 0x76a3b63e5a2 ET 0x76a3ba41f97 . [Command timeout]

>>> drive reported too many port errors and was logged out, then it could not log in again. It failed on SPB with the Activate timer expired.
B       11/16/20 05:52:47.360 Bus0 Enc0 LccB    1678052 [ERROR] System: LCC is faulted. This failure may be caused by a component other than the LCC (Drive, Cable, Connector, ...).
B       11/16/20 05:54:42.263 Bus0 Enc0 Dsk02     60258 [CRIT] User: Disk 0_0_2 has failed (Part Number 005053578, Serial Number 50L0A01FTT2F)
B       11/16/20 05:54:42.879 Bus0 Enc0 LccB      602bc [CRIT] User: LCC has faulted (Part Number 303-396-000B-00, Serial Number CF2DD201400245)
B       11/16/20 05:55:23.571 Bus0 Enc0 Dsk02   1678058 [ERROR] System: Disk 0_0_2 taken offline. Escalate to support. SN:50L0A01FTT2F TLA:005053578 Rev:PA5H (0x2030001) Reason:Expired.




可能會受到影響的系統:

產品 (與版本) Dell Unity 300F、Dell Unity 350F、Dell Unity XT 380F、Dell Unity 400F、Dell Unity 450F、Dell Unity XT 480F、Dell Unity 600F、Dell Unity 650F、Dell Unity XT 680F、Dell Unity XT 880F、Dell Unity 系列 |Dell Unity 全快閃式記憶體
執行此核心軟體
(作業系統 (OS) 或作業環境 (OE))
所有作業環境
當確認發生此狀況時 陣列包含以下任何帶有韌體 PA5H
的磁碟機零件編號 005052867、005052866、005052869、005052868、005052871、005052870、005053573、005053572、005053577、005053576、005053579、005053578、005052859、005052858、005052861、005052860、005052863、005052862、005053583、005053582、005053596、005053595、005053598、005053597、005053575 005053574

 

Cause

發生大量資料錯誤的磁碟機會以韌體內的較長命令逾時設定執行內部錯誤復原,這可能會導致磁碟機發生效能問題

磁碟機內建的錯誤復原功能通常會在可接受的時間限制內回應,但有時由於 NAND 的瑕疵,需要復原的區塊數量可能很大,再加上長命令,逾時設定可能會導致命令逾時過長,並影響陣列的效能。

Resolution

動作類型 解析度
需要執行的動作 將磁碟機韌體升級到 PA5L 以解決此問題。
誰可以完成此動作 客戶
問題已在此 OS、OE 或軟體中獲得解決

韌體 PA5L 在 Unity 磁碟機 韌體 套件 V18 或更高版本中的 www.dell.com/support 上可用。

 

SolVe 客戶解決步驟 如需升級磁碟機韌體的其他資訊,請在 Dell Unity 的 SolVe 中選取「軟體升級程序」。

或依照文章磁碟機韌體升級指示和資訊
解決方案詳細資料 若陣列目前發生效能問題:  若要立即緩解效能問題,請將有問題的磁碟機從集區內取出。從集區取出該磁碟機後,效能應會立即改善。  若要完成此操作:
如果可以實體存取系統:
卸下已識別為報告 Soft SCSI 匯流排錯誤和 [命令逾時]
的磁碟機,將移除的磁碟機替換為同等的備援磁碟機。  請勿在 5 分鐘內插入替換磁碟機,讓系統從同位檢查重新建置備援磁碟機。
如有必要,請聯絡 Dell 技術支援部門,要求更換導致效能問題的磁碟機。
如果無法立即實體存取系統,並需要研討其他可行的因應措施,請聯絡 Dell 技術支援部門或授權服務代表,並引用此 DTA 文章編號。
將磁碟機韌體升級到 PA5L。
確保新陣列已安裝升級至磁碟機韌體 PA5L
注意:
PA5L 韌體的目的是更快取代回報過多 01/18/ff 和命令逾時錯誤的磁碟機。請注意,在磁碟機更換重新建置或重新切換/重新平衡作業期間,可能會在動態集區中遇到次要效能影響。解決此問題後,LKB 000055614會隨之更新。

如需有關更新磁碟機韌體的指示,請參閱 LKB 000021322
您可以從 www.dell.com/support 下載 Unity 磁碟機韌體套件,搜尋「Unity Drive Firmware Package」即可找到。

Affected Products

Dell EMC Unity Family
Article Properties
Article Number: 000190983
Article Type: Solution
Last Modified: 27 Mar 2025
Version:  5
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.