Dell EMC Unity: 드라이브 오류로 인해 드라이브 장애 또는 성능 문제가 발생함(Dell EMC에서 수정 가능)
Summary: 일부 플래시 드라이브에서 오류 로깅을 시작하지만 시스템에서 자동으로 장애가 발생하지 않은 후 심각한 성능 문제가 발생합니다.
Symptoms
개요:
다음 드라이브 파트 번호에 대해 두 가지 개별 문제가 관찰되었습니다.
005052377, 005052378, 005052379, 005052380, 005051739, 005051740, 005052154, 005052155
문제 # 1.
드라이브가 잘못된 감지 버퍼와 함께 많은 Soft SCSI 버스 오류를 보고한 후 드라이브 실패(EOL로 설정, 수명 종료) 파트 번호가 나열되어 있고 펌웨어 PC09, PC0B, PC0D, PC10, PC42 또는 PC47
을 실행하는 드라이브 아래와 유사한 SP 로그(/EMC/backend/log_shared/EMCSystemLogFile.log)의 예:
01/29/18 05:41:00.121 Bus0 Enc0 Dsk19 11c4003 [WARN] 시스템:
디스크 소프트 SCSI 버스 오류입니다. DrvErrExtStat:0x1 SRT 349ms ST 0xcd51723a571 ET 0xcd517285579. [REQUEST SENSE 명령 실패]
01/29/18 05:41:00.131 Bus0 Enc0 Dsk19 11c0006 [INFO] 시스템: 디스크 잘못된 감지 버퍼 OP 0x28, LBA 0x37d8e000, SZ 0x800
문제 # 2.
시스템 관리자는 드라이브가 오류 로깅을 시작한 후 시스템에서 심각한 성능 문제(소프트 미디어 오류 및 01|18|ff)를 관찰합니다.
파트 번호가 나열되어 있고 펌웨어 PC13 또는 PC4A를 실행하는 드라이브 오류는 "소프트 미디어 오류" 시스템에 의해 보고될 수 있습니다.
드라이브가 수명 종료(EOL)에 도달했다고 보고할 수 있지만 여전히 풀의 일부로 남아 영향을 받는 풀에 있는 모든 LUN/FS의 성능이 저하됩니다.
이 문제는 대부분 올플래시 동적 풀에서 발견되었지만, 영향을 받는 파트 번호의 플래시 드라이브가 포함된 기존 풀과 관련이 있을 수 있습니다.
04/27/18 21:52:52.909 Bus1 Enc0 Dsk02 11c4004 [WARN] 시스템: 디스크 1_0_2 소프트 미디어 오류입니다. DrvErrExtStat:0x22 SRT 69ms ST 0x5eae3254c6d ET 0x5eae32659fa. [복구된 오류(온드라이브 ECC)]
04/27/18 21:52:52.921 Bus1 Enc0 Dsk02 11c0006 [INFO] 시스템: 디스크 1_0_2 01|18|ff BLBA 0x127fedd0 OP 0x2f, LBA
Cause
문제 # 1: 드라이브가 잘못된 감지 버퍼와 함께 소프트 SCSI 버스 오류를 보고함
오류의 원인은 드라이브에서 반환된 잘못된 데이터 감지 필드 길이입니다. Dell EMC 요구 사항에 따라 설명자 형식 감지 데이터에 허용되는 최대 크기가 48바이트로 지정되어 있지만 펌웨어는 48바이트보다 큰 설명자 형식 감지 데이터를 생성합니다.
문제 # 2: 드라이브에서 소프트 미디어 오류 및 01|18|ff
를 보고함소프트 미디어 오류의 원인은 Unity 코드가 드라이브에서 반환된 오류를 잘못 인식했기 때문입니다. 두 경우 모두 정상 IO에 대한 오류 비율이 낮게 유지되는 동안 드라이브에서 반환된 오류가 Unity 코드에서 올바르게 승인되지 않아 드라이브가 오랫동안 최적이 아닌 상태로 계속 작동하고 풀에 있는 모든 LUN/FS의 성능에 영향을 미칩니다.
Resolution
문제 # 1:
Dell EMC Unity OE 4.2.1.9535982 이상에서 이 문제를 해결 합니다. 어레이 소프트웨어를 최신 릴리스로 업데이트하는 것이 좋습니다.
또한 향후 문제를 방지하기 위해 드라이브 펌웨어 업데이트를 강력히 권장합니다. 아래를 참조하십시오.
문제 # 2: 드라이브에서 소프트 미디어 오류 및 01|18|ff
를 보고함성능 문제를 즉시 해결하려면 문제가 되는 드라이브를 풀에서 제거해야 합니다. 드라이브를 풀에서 꺼내면 즉시 성능이 향상합니다.
- 시스템에 물리적으로 액세스할 수 있는 경우 슬롯에서 문제가 있는 드라이브를 제거하고 Dell EMC 기술 지원 부서에 문의하여 드라이브 교체를 요청합니다.
- 시스템에 물리적으로 즉시 액세스할 수 없는 경우와 가능한 다른 해결 방법을 논의하려면 Dell EMC 기술 지원 또는 공인 서비스 담당자에게 문의하고 이 기술 자료 문서 ID를 인용하십시오.
권장 사항:
문제 #1 및 #2를 해결하려면 드라이브 펌웨어를 아래 나열된 버전 이상으로 업데이트하는 것이 좋습니다. 2019년 2월 27일에 릴리스된 Unity Drive 펌웨어 번들 V9에는 파트 번호와 해당하는 펌웨어 버전이
포함되어 있습니다. 005052377 - QC4E
005052378 - QC4E
005052379 - QC4E
005052380 - QC4E
005051739 PC16
005051740 PC16
005052154 PC16
005052155 PC16
드라이브 펌웨어 업데이트에 대한 지침은 KB 490700 https://support.emc.com/kb/490700 를 참조하십시오.
최신 Unity 드라이브 펌웨어 번들은 지원 페이지에서 다운로드할 수 있으며 "Unity_Drive_Firmware_Package"를 검색하여 찾을 수 있습니다.
자세한 내용은 DTA 528178: Dell EMC Unity: 드라이브 소프트 미디어 오류로 인해 성능 문제 및 데이터 가용성 손실이 발생할 수 있음(사용자가 수정 가능)드라이브 005052377 005052378 005052379 및 005052380 대해 릴리스됨
Additional Information
| https://downloads.dell.com/TranslatedPDF/ES_KB521649.pdf |
| https://downloads.dell.com/TranslatedPDF/DE_KB521649.pdf |
| https://downloads.dell.com/TranslatedPDF/FR_KB521649.pdf |
| https://downloads.dell.com/TranslatedPDF/IT_KB521649.pdf |
| https://downloads.dell.com/TranslatedPDF/JA_KB521649.pdf |
| https://downloads.dell.com/TranslatedPDF/KO_KB521649.pdf |