Dell EMC Unity: Błędy dysku powodujące awarie dysku lub problemy z wydajnością (z możliwością naprawienia przez firmę Dell)
Summary: Poważne problemy z wydajnością, gdy niektóre dyski flash zaczynają rejestrować błędy, ale nie są automatycznie awariowane przez system.
Symptoms
Przegląd:
Zaobserwowano dwa oddzielne problemy dla następujących numerów części dysków:
005052377, 005052378, 005052379, 005052380, 005051739, 005051740, 005052154 005052155
Problem # 1.
Awaria napędów (ustawienie EOL, koniec żywotności) po tym, jak dysk zgłasza wiele błędów miękkiej magistrali SCSI, którym towarzyszy NIEPRAWIDŁOWY BUFOR
WYKRYWANIA Dyski z wymienionymi numerami części i z oprogramowaniem wewnętrznym PC09, PC0B, PC0D, PC10, PC42 lub PC47
Przykładowe dzienniki SP (/EMC/backend/log_shared/EMCSystemLogFile.log) podobne jak poniżej:
01/29/18 05:41:00.121 Bus0 Enc0 DSK19 11C4003 [WARN] System: Błąd miękkiej magistrali SCSI dysku. DrvErrExtStat:0x1 SRT 349ms ST 0xcd51723a571 ET 0xcd517285579 . [Polecenie REQUEST SENSE nie powiodło się]
01/29/18 05:41:00.131 bus0 enc0 dsk19 11c0006 [INFO] System: Dysk INVALID SENSE BUFFER OP 0x28, LBA 0x37d8e000, SZ 0x800
Problem # 2.
Administrator systemu zauważa poważne problemy z wydajnością systemu po tym, jak dysk zaczyna rejestrować błędy — błędy nośnika programowego i 01|18|ff
Dyski z wymienionymi numerami części z oprogramowaniem wewnętrznym PC13 lub PC4A. System może zgłaszać błędy "Soft media error".
Dysk może zgłaszać koniec żywotności (EOL), ale pozostaje częścią puli, pogarszając wydajność wszystkich jednostek LUN/FS w puli, której dotyczy problem.
Problem zaobserwowano głównie w pulach dynamicznych All-Flash, ale potencjalnie może dotyczyć tradycyjnych pul zawierających dyski flash o numerach części, których dotyczy problem.
04/27/18 21:52:52.909 Bus1 Enc0 DSK02 11C4004 [WARN] System: Błąd nośnika programowego dysku 1_0_2. DrvErrExtStat:0x22 SRT 69ms ST 0x5eae3254c6d ET 0x5eae32659fa . [Naprawiony błąd (ECC na dysku)]
04/27/18 21:52:52.921 bus1 enc0 dsk02 11c0006 [INFO] System: Dysk 1_0_2 01|18|ff BLBA 0x127fedd0 OP 0x2f, LBA
Cause
Problem # 1: Dysk zgłasza miękkie błędy magistrali SCSI, którym towarzyszy INVALID SENSE BUFFER
Przyczyną błędów jest nieprawidłowa długość pola wykrywania danych zwracana przez dysk: Mimo że wymagania firmy Dell EMC określają, że maksymalny dozwolony rozmiar danych wykrywania formatu deskryptora wynosi 48 bajtów, oprogramowanie wewnętrzne generuje dane wykrywania formatu deskryptora większe niż 48 bajtów.
Problem # 2: Dysk zgłasza błędy nośnika i 01|18|ff
Przyczyną błędów nośnika programowego jest nieprawidłowe potwierdzenie błędów zwracanych przez dysk przez kod Unity. W obu przypadkach błędy zwracane przez dysk nie są prawidłowo potwierdzane przez kod Unity, a liczba błędów dobrych operacji we/wy jest nadal niska, co powoduje, że dysk działa przez długi czas w nieoptymalnym stanie i wpływa na wydajność wszystkich jednostek LUN/FS w puli.
Resolution
Problem # 1:
Dell EMC Unity OE 4.2.1.9535982 i nowsze wersje rozwiązują ten problem i zalecane jest zaktualizowanie oprogramowania macierzy do najnowszej wersji.
Ponadto zdecydowanie zaleca się aktualizowanie oprogramowania układowego dysków, aby uniknąć problemów w przyszłości. Zobacz poniżej.
Problem # 2: Dysk zgłasza błędy nośnika i 01|18|ff
Aby natychmiast rozwiązać problem z wydajnością, dysk, który powoduje problem, należy wyjąć z puli. Gdy dysk jest poza pulą, wydajność powinna natychmiast ulec poprawie.
- Jeśli możliwy jest fizyczny dostęp do systemu, wyjmij problematyczny dysk z gniazda i skontaktuj się z działem pomocy technicznej firmy Dell EMC, aby poprosić o jego wymianę.
- W przypadku braku natychmiastowego fizycznego dostępu do systemu i omówienia innych możliwych obejść tego problemu należy skontaktować się z działem pomocy technicznej firmy Dell EMC lub z autoryzowanym przedstawicielem serwisu i podać identyfikator tego artykułu z bazy wiedzy.
Zalecenia:
Aby rozwiązać problemy #1 i #2, zaleca się aktualizację oprogramowania wewnętrznego dysku do wersji poniższej lub nowszej. Pakiet oprogramowania wewnętrznego napędu Unity V9 wydany 27 lutego 2019 r. zawiera oprogramowanie wewnętrzne dla następujących numerów części i odpowiadających im wersji
oprogramowania wewnętrznego 005052377 — QC4E
005052378 — QC4E
005052379 — QC4E
005052380 — QC4E
005051739 PC16
005051740 PC16
005052154 PC16
005052155 PC16
Instrukcje dotyczące aktualizacji oprogramowania wewnętrznego dysku można znaleźć w artykule KB 490700 https://support.emc.com/kb/490700 .
Najnowszy pakiet oprogramowania wewnętrznego dysku Unity jest dostępny do pobrania ze strony pomocy technicznej i można go znaleźć, wyszukując "Unity_Drive_Firmware_Package".
Zapoznaj się z 528178 DTA: Dell EMC Unity: Niskiej wagi błędów nośnika dysku mogą powodować problemy z wydajnością i niedostępność danych (możliwość naprawienia przez użytkownika)zwalnianych dla dysków 005052377 005052378 005052379 i 005052380
Additional Information
| https://downloads.dell.com/TranslatedPDF/ES_KB521649.pdf |
| https://downloads.dell.com/TranslatedPDF/DE_KB521649.pdf |
| https://downloads.dell.com/TranslatedPDF/FR_KB521649.pdf |
| https://downloads.dell.com/TranslatedPDF/IT_KB521649.pdf |
| https://downloads.dell.com/TranslatedPDF/JA_KB521649.pdf |
| https://downloads.dell.com/TranslatedPDF/KO_KB521649.pdf |