Dell Unity:ドライブのコマンド タイムアウト エラーにより、パフォーマンスの問題およびデータ欠損が発生する場合がある(ユーザー修正可能)

Summary: 影響の説明:フラッシュ ドライブが、アレイによって自動的に対処されないエラーのログ記録を開始すると、重大なパフォーマンスの問題が発生します。

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

潜在的なデータ欠損
重大度:Critical

システム管理者は、ドライブがエラー(ソフト メディア エラーと01|18|ff)のログ記録を開始した後、アレイで重大なパフォーマンスの問題が発生し、その後に偶発的な中止、選択タイムアウト、およびコマンド タイムアウトが発生することを確認しました

パーツ ナンバーとファームウェアがリストされているドライブ。アレイは次のようにエラーを報告することがあります。 "Soft media error"  01|18|ff ソフトSCSIバス エラーが続く “[IncidentalAbort]", “[Select timeout]", and “[Command timeout]". 一方のSPでドライブがオフラインになっても、2つ目のSPでアクティブなままになり、同様のエラーが報告されます。


SPログの例:

>>> drive repeatedly reports 01/18/ff
B       11/15/20 18:05:31.994 Bus0 Enc0 Dsk02   11c4004 [WARN] System: Disk 0_0_2 Soft media error. DrvErrExtStat:0x22 SRT 35ms ST 0x767fd102672 ET 0x767fd10b014 . [Recovered error (on-drive ECC)]
B       11/15/20 18:05:32.009 Bus0 Enc0 Dsk02   11c0006 [INFO] System: Disk 0_0_2 01|18|ff BLBA 0x32d948218 OP 0x88, LBA 0x32d948200, SZ 0x80 .
A       11/15/20 18:06:18.548 Bus0 Enc0 Dsk02   11c4004 [WARN] System: Disk 0_0_2 Soft media error. DrvErrExtStat:0x22 SRT 66ms ST 0x7680628d0f1 ET 0x7680629d1c6 . [Recovered error (on-drive ECC)]
A       11/15/20 18:06:18.566 Bus0 Enc0 Dsk02   11c0006 [INFO] System: Disk 0_0_2 01|18|ff BLBA 0x2d6cce4d8 OP 0x88, LBA 0x2d6cce4d0, SZ 0x10 .

>>> followed by Soft SCSI bus errors (Incidental abort and selection timeout)
A       11/15/20 18:17:33.877 Bus0 Enc0 Dsk02   11c4003 [WARN] System: Disk 0_0_2 Soft SCSI bus error. DrvErrExtStat:0xdd SRT 522ms ST 0x7682e5dd934 ET 0x7682e65cf8b . [IncidentalAbort]
B       11/15/20 18:17:33.892 Bus0 Enc0 Dsk02   11c4003 [WARN] System: Disk 0_0_2 Soft SCSI bus error. DrvErrExtStat:0xdd SRT 535ms ST 0x768280ad284 ET 0x7682812faab . [IncidentalAbort]
A       11/15/20 18:17:33.910 Bus0 Enc0 Dsk02   11c4003 [WARN] System: Disk 0_0_2 Soft SCSI bus error. DrvErrExtStat:0x7 SRT 537ms ST 0x7682e5d9c09 ET 0x7682e65cfc5 . [Select timeout]

>>> followed by repeated command timeout.
A       11/15/20 20:44:30.049 Bus0 Enc0 Dsk02   11c4003 [WARN] System: Disk 0_0_2 Soft SCSI bus error. DrvErrExtStat:0x6 SRT 4340ms ST 0x76a3b63f4df ET 0x76a3ba4175c . [Command timeout]
A       11/15/20 20:44:30.069 Bus0 Enc0 Dsk02   11c4003 [WARN] System: Disk 0_0_2 Soft SCSI bus error. DrvErrExtStat:0x6 SRT 4201ms ST 0x76a3b641f27 ET 0x76a3ba41b53 . [Command timeout]
A       11/15/20 20:44:30.090 Bus0 Enc0 Dsk02   11c4003 [WARN] System: Disk 0_0_2 Soft SCSI bus error. DrvErrExtStat:0x6 SRT 4210ms ST 0x76a3b63e5a2 ET 0x76a3ba41f97 . [Command timeout]

>>> drive reported too many port errors and was logged out, then it could not log in again. It failed on SPB with the Activate timer expired.
B       11/16/20 05:52:47.360 Bus0 Enc0 LccB    1678052 [ERROR] System: LCC is faulted. This failure may be caused by a component other than the LCC (Drive, Cable, Connector, ...).
B       11/16/20 05:54:42.263 Bus0 Enc0 Dsk02     60258 [CRIT] User: Disk 0_0_2 has failed (Part Number 005053578, Serial Number 50L0A01FTT2F)
B       11/16/20 05:54:42.879 Bus0 Enc0 LccB      602bc [CRIT] User: LCC has faulted (Part Number 303-396-000B-00, Serial Number CF2DD201400245)
B       11/16/20 05:55:23.571 Bus0 Enc0 Dsk02   1678058 [ERROR] System: Disk 0_0_2 taken offline. Escalate to support. SN:50L0A01FTT2F TLA:005053578 Rev:PA5H (0x2030001) Reason:Expired.




影響を受ける可能性のあるシステム:

製品(およびバージョン) Dell Unity 300F、Dell Unity 350F、Dell Unity XT 380F、Dell Unity 400F、Dell Unity 450F、Dell Unity XT 480F、Dell Unity 600F、Dell Unity 650F、Dell Unity XT 680F、Dell Unity XT 880F、Dell Unityファミリー |Dell Unityオールフラッシュ
このコア ソフトウェアを実行している
(オペレーティング システム(OS)または操作環境(OE))
すべての動作環境
この条件が該当する場合 アレイには、ファームウェアPA5H
005052867、005052866、005052869、005052868、005052871、005052870、005053573、005053572、005053577、005053576、005053579、005053578、005052859、005052858、005052861、005052860、005052863、005052862、005053583、005053582、005053596、005053595、005053598、005053597、005053575、005053574

 

Cause

多くのデータ エラーがあるドライブは内部エラー リカバリーを実行します。それと組み合わせて、ファームウェアのコマンド タイムアウト設定が長いと、ドライブにパフォーマンスの問題が発生する可能性があります。

ドライブの組み込みエラー リカバリーは通常、許容可能な時間制限内で応答しますが、NANDの欠陥により、リカバリーに必要なブロックの数が非常に多く、長いコマンドと組み合わせて、タイムアウト設定によって過剰なコマンド タイムアウトが発生し、アレイのパフォーマンスに影響を与える可能性があります。

Resolution

アクションの種類 解決策
必要なアクション この問題に対処するには、ドライブ ファームウェアをPA5Lにアップグレードします。
アクションを実行できるユーザー お客様
このOS、OE、またはソフトウェアで解決される問題

ファームウェアPA5Lは、Unityドライブ ファームウェア バンドルV18以降の www.dell.com/support で利用できます。

 

SolVeお客様の解決手順 ドライブ ファームウェアのアップグレードの詳細については、 SolVe for Dell Unityで[Software Upgrade Procedures]を選択してください。

または、「ドライブ ファームウェアのアップグレード手順と情報」の記事に従ってください。
対処法の詳細 現在パフォーマンスの問題が発生しているアレイ:  パフォーマンスの問題を迅速に軽減するために、問題のあるドライブをプールから取り出します。ドライブがプールから外れると、すぐにパフォーマンスが向上します。  これを実現するには、次を行います。
システムへの物理的なアクセスが可能な場合は、次の手順を実行します。
ソフトSCSIバス エラーおよび[コマンド タイムアウト]を報告しているドライブを取り外します
取り外したドライブを同等のスペアと交換します。  5分間待ってから交換用ドライブを挿入します。この間に、システムがパリティーからスペアに再構築されます。
必要に応じてDellテクニカル サポートに連絡し、パフォーマンスの問題の原因となっているドライブの交換を依頼します。
システムにすぐに物理的にアクセスできない場合、およびその他の可能な回避策について話し合うには、Dellテクニカル サポートまたは認定サービス担当者に連絡して、このDTA記事番号を伝えてください。
ドライブ ファームウェアをPA5Lにアップグレードします。
新しいアレイがドライブ ファームウェアPA5Lへのアップグレードをインストールすることを確認します
メモ:
PA5Lファームウェアは、過剰な01/18/ffおよびコマンド タイムアウト エラーを報告するドライブを、より早く交換することを目的としています。Dynamic Poolでのドライブ交換、再構築、または再調整/再バランシング操作中に、2次的なパフォーマンス インパクトが発生する可能性があることに注意してください。この問題が解決されると、LKB 000055614が適宜更新されます。

ドライブ ファームウェアのアップデート手順については LKB 000021322を参照してください。
Unityドライブ ファームウェア バンドルは、www.dell.com/supportからダウンロードできます。見つけるには「Unityドライブ ファームウェア パッケージ」を検索してください。

Affected Products

Dell EMC Unity Family
Article Properties
Article Number: 000190983
Article Type: Solution
Last Modified: 27 Mar 2025
Version:  5
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.