Dell Unity: 드라이브 명령 시간 초과 오류는 성능 문제와 데이터 가용성 손실을 초래할 수 있음(사용자 수정 가능)

Summary: 영향 설명: 플래시 드라이브가 어레이에서 자동으로 해결되지 않는 오류를 기록하기 시작한 후 심각한 성능 문제가 발생합니다.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

잠재적인 데이터 가용성 손실
심각도: 위험

시스템 관리자는 드라이브가 소프트 미디어 오류, 01|18|ff 등의 오류 로깅을 시작한 후 어레이에서 심각한 성능 문제와 우발적 중단, 선택 시간 초과 및 명령 시간 초과를 관찰합니다.

파트 번호 및 펌웨어가 나열된 드라이브 어레이에서 다음과 같은 오류를 보고할 수 있습니다. "Soft media error"  01|18|ff 소프트 SCSI 버스 오류가 뒤따릅니다. “[IncidentalAbort]", “[Select timeout]", and “[Command timeout]". 한 SP에서는 드라이브가 오프라인으로 전환될 수 있지만 두 번째 SP에서는 활성 상태를 유지하며 유사한 오류가 보고됩니다.


SP 로그의 예:

>>> drive repeatedly reports 01/18/ff
B       11/15/20 18:05:31.994 Bus0 Enc0 Dsk02   11c4004 [WARN] System: Disk 0_0_2 Soft media error. DrvErrExtStat:0x22 SRT 35ms ST 0x767fd102672 ET 0x767fd10b014 . [Recovered error (on-drive ECC)]
B       11/15/20 18:05:32.009 Bus0 Enc0 Dsk02   11c0006 [INFO] System: Disk 0_0_2 01|18|ff BLBA 0x32d948218 OP 0x88, LBA 0x32d948200, SZ 0x80 .
A       11/15/20 18:06:18.548 Bus0 Enc0 Dsk02   11c4004 [WARN] System: Disk 0_0_2 Soft media error. DrvErrExtStat:0x22 SRT 66ms ST 0x7680628d0f1 ET 0x7680629d1c6 . [Recovered error (on-drive ECC)]
A       11/15/20 18:06:18.566 Bus0 Enc0 Dsk02   11c0006 [INFO] System: Disk 0_0_2 01|18|ff BLBA 0x2d6cce4d8 OP 0x88, LBA 0x2d6cce4d0, SZ 0x10 .

>>> followed by Soft SCSI bus errors (Incidental abort and selection timeout)
A       11/15/20 18:17:33.877 Bus0 Enc0 Dsk02   11c4003 [WARN] System: Disk 0_0_2 Soft SCSI bus error. DrvErrExtStat:0xdd SRT 522ms ST 0x7682e5dd934 ET 0x7682e65cf8b . [IncidentalAbort]
B       11/15/20 18:17:33.892 Bus0 Enc0 Dsk02   11c4003 [WARN] System: Disk 0_0_2 Soft SCSI bus error. DrvErrExtStat:0xdd SRT 535ms ST 0x768280ad284 ET 0x7682812faab . [IncidentalAbort]
A       11/15/20 18:17:33.910 Bus0 Enc0 Dsk02   11c4003 [WARN] System: Disk 0_0_2 Soft SCSI bus error. DrvErrExtStat:0x7 SRT 537ms ST 0x7682e5d9c09 ET 0x7682e65cfc5 . [Select timeout]

>>> followed by repeated command timeout.
A       11/15/20 20:44:30.049 Bus0 Enc0 Dsk02   11c4003 [WARN] System: Disk 0_0_2 Soft SCSI bus error. DrvErrExtStat:0x6 SRT 4340ms ST 0x76a3b63f4df ET 0x76a3ba4175c . [Command timeout]
A       11/15/20 20:44:30.069 Bus0 Enc0 Dsk02   11c4003 [WARN] System: Disk 0_0_2 Soft SCSI bus error. DrvErrExtStat:0x6 SRT 4201ms ST 0x76a3b641f27 ET 0x76a3ba41b53 . [Command timeout]
A       11/15/20 20:44:30.090 Bus0 Enc0 Dsk02   11c4003 [WARN] System: Disk 0_0_2 Soft SCSI bus error. DrvErrExtStat:0x6 SRT 4210ms ST 0x76a3b63e5a2 ET 0x76a3ba41f97 . [Command timeout]

>>> drive reported too many port errors and was logged out, then it could not log in again. It failed on SPB with the Activate timer expired.
B       11/16/20 05:52:47.360 Bus0 Enc0 LccB    1678052 [ERROR] System: LCC is faulted. This failure may be caused by a component other than the LCC (Drive, Cable, Connector, ...).
B       11/16/20 05:54:42.263 Bus0 Enc0 Dsk02     60258 [CRIT] User: Disk 0_0_2 has failed (Part Number 005053578, Serial Number 50L0A01FTT2F)
B       11/16/20 05:54:42.879 Bus0 Enc0 LccB      602bc [CRIT] User: LCC has faulted (Part Number 303-396-000B-00, Serial Number CF2DD201400245)
B       11/16/20 05:55:23.571 Bus0 Enc0 Dsk02   1678058 [ERROR] System: Disk 0_0_2 taken offline. Escalate to support. SN:50L0A01FTT2F TLA:005053578 Rev:PA5H (0x2030001) Reason:Expired.




영향을 받을 수 있는 시스템:

제품(및 버전) Dell Unity 300F, Dell Unity 350F, Dell Unity XT 380F, Dell Unity 400F, Dell Unity 450F, Dell Unity XT 480F, Dell Unity 600F, Dell Unity 650F, Dell Unity XT 680F, Dell Unity XT 880F, Dell Unity 제품군 |Dell Unity 올플래시
이 핵심 소프트웨어
실행(OS(Operating System) 또는 OE(Operating Environment))
모든 운영 환경
이 조건이 참인 경우 어레이에는 펌웨어 PA5H
005052867, 005052866, 005052869, 005052868, 005052871, 005052870, 005053573, 005053572, 005053577, 005053576, 005053579, 005053578, 005052859, 005052858, 005052861, 005052860, 005052863, 005052862, 005053583, 005053582, 005053596, 005053595, 005053598, 005053597, 005053575, 005053574 드라이브 파트 번호가 포함되어 있습니다.

 

Cause

데이터 오류가 많은 드라이브는 내부 오류 복구를 실행할 수 있으며 펌웨어의 긴 명령 시간 초과 설정과 함께 사용하면 드라이브에 성능 문제가 발생할 수 있습니다.

드라이브 내장 오류 복구는 일반적으로 허용 시간 제한 내에 응답합니다. 그러나 경우에 따라 NAND 결함으로 인해 복구에 필요한 블록 수가 많을 수 있으며, 긴 명령과 함께 시간 초과가 설정되면 과도한 명령 시간 초과가 발생하여 어레이 성능에 영향을 줄 수 있습니다.

Resolution

작업 유형 해석
필요한 조치 문제를 해결하려면 드라이브 펌웨어를 PA5L로 업그레이드하십시오.
작업을 완료할 수 있는 사람 고객
이 OS, OE 또는 소프트웨어에서 해결된 문제

펌웨어 PA5L은 Unity 드라이브 펌웨어 번들 V18 이상의 www.dell.com/support 에서 사용할 수 있습니다.

 

SolVe 고객 해결 절차 드라이브 펌웨어 업그레이드에 대한 자세한 내용은 Dell Unity용 SolVe 에서 "소프트웨어 업그레이드 절차"를 선택하십시오. 

또는 드라이브 펌웨어 업그레이드 지침 및 정보 문서를 따르십시오.
해결 방법 세부 정보 현재 성능 문제가 발생한 어레이:  성능 문제를 즉시 해결하려면 문제가 있는 드라이브를 풀에서 꺼냅니다. 드라이브를 풀에서 꺼내면 즉시 성능이 향상합니다.  이 작업을 수행하려면 다음을 따릅니다.
시스템에 물리적으로 액세스할 수 있는 경우:
소프트 SCSI 버스 오류 및 [명령 시간 초과]
를 보고하는 것으로 확인된 드라이브를 제거합니다. 제거된 드라이브를 동등한 예비 드라이브로 교체하십시오.  시스템이 패리티에서 스페어로 재구축될 수 있도록 5분 동안 교체 드라이브를 삽입하지 마십시오.
필요에 따라 Dell 기술 지원 부서에 문의하여 성능 문제를 일으키는 드라이브의 교체를 요청합니다.
시스템에 물리적으로 즉시 액세스할 수 없는 경우 가능한 다른 해결 방법을 논의하려면 Dell 기술 지원 부서 또는 공인 서비스 담당자에게 문의하고 이 DTA 문서 번호를 인용하십시오.
드라이브 펌웨어를 PA5L로 업그레이드합니다.
새 어레이가 드라이브 펌웨어 PA5L
에 업그레이드를 설치하는지 확인 참고:
PA5L 펌웨어는 과도한 01/18/ff 및 Command Timeout 오류를 보고하는 드라이브를 조속히 교체하기 위해 제공됩니다. 동적 풀에서 드라이브 교체, 재구축 또는 재조정/재조정 작업 중에 성능에 2차 영향을 미칠 수 있습니다. 이 문제가 해결되면 LKB 000055614도 그에 맞춰 업데이트됩니다.

드라이브 펌웨어 업데이트에 대한 지침은 LKB 000021322 를 참조하십시오.
Unity 드라이브 펌웨어 번들은 www.dell.com/support에서 다운로드할 수 있으며 "Unity 드라이브 펌웨어 패키지"를 검색하여 찾을 수 있습니다.

Affected Products

Dell EMC Unity Family
Article Properties
Article Number: 000190983
Article Type: Solution
Last Modified: 27 Mar 2025
Version:  5
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.