Dell EMC Unity: Errori dell'unità che causano guasti o problemi di prestazioni dell'unità (correggibile da Dell EMC)
Summary: Gravi problemi di prestazioni dopo che alcune unità Flash iniziano a registrare gli errori, ma non vengono automaticamente interrotti dal sistema.
Symptoms
Panoramica:
Sono stati osservati due problemi separati per i seguenti numeri parte di unità:
005052377, 005052378, 005052379, 005052380, 005051739, 005051740, 005052154, 005052155
Problema # 1.
Le unità si guastano (impostate su EOL, fine del ciclo di vita) dopo che l'unità segnala molti errori del bus Soft SCSI accompagnati da BUFFER
DI RILEVAMENTO NON VALIDO Unità con i numeri parte elencati e firmware PC09, PC0B, PC0D, PC10, PC42 o PC47
Registri di esempio di SP (/EMC/backend/log_shared/EMCSystemLogFile.log) simili ai seguenti:
29/01/18 05:41:00.121 Bus0 Enc0 Dsk19 11c4003 [WARN] Sistema: Errore del bus SCSI di Disk Soft. DrvErrExtStat:0x1 SRT 349ms ST 0xcd51723a571 ET 0xcd517285579 . [Comando REQUEST SENSE non riuscito]
29/01/18 05:41:00.131 Bus0 Enc0 Dsk19 11c0006 [INFO] Sistema: Disco BUFFER SENSE NON VALIDO OP 0x28, LBA 0x37d8e000, SZ 0x800
Problema # 2.
Il System Administrator osserva gravi problemi di prestazioni sul sistema dopo che un unità inizia a registrare errori: errori di supporti software e 01|18|ff
Unità con i numeri parte elencati e che eseguono il firmware PC13 o PC4A. Gli errori possono essere segnalati dal sistema come errore "Soft media".
L'unità può segnalare di aver raggiunto la fine del ciclo di vita (EOL), ma rimane parte del pool, riducendo le prestazioni di tutte le LUN/FS nel pool interessato.
Il problema è stato osservato principalmente sui pool dinamici All-Flash, ma potrebbe potenzialmente coinvolgere i pool tradizionali contenenti unità Flash dei numeri parte interessati.
27/04/18 21:52:52.909 Bus1 Enc0 Dsk02 11c4004 [WARN] Sistema: Disco 1_0_2 Errore del supporto software. DrvErrExtStat:0x22 SRT 69ms ST 0x5eae3254c6d ET 0x5eae32659fa . [Errore ripristinato (ECC on-drive)]
27/04/18 21:52:52.921 Bus1 Enc0 Dsk02 11c0006 [INFO] Sistema: Disco 1_0_2 01|18|ff BLBA 0x127fedd0 OP 0x2f, LBA
Cause
Problema # 1: L'unità segnala errori soft del bus SCSI accompagnati da BUFFER
DI RILEVAMENTO NON VALIDOLa causa degli errori è una lunghezza errata del campo data sense restituita dall'unità: Sebbene i requisiti Dell EMC specifichino che la dimensione massima consentita per i dati di rilevamento del formato del descrittore è di 48 byte, il firmware genera dati di rilevamento del formato del descrittore di dimensioni superiori a 48 byte.
Problema # 2: L'unità segnala errori Soft Media e 01|18|ff
La causa degli errori dei supporti software è il codice Unity che riconosce erroneamente gli errori restituiti dall'unità. In entrambi i casi, gli errori restituiti dall'unità non vengono riconosciuti correttamente dal codice Unity, mentre il tasso di errori relativi a I/O corretti continua a essere basso, facendo sì che l'unità continui a funzionare in uno stato non ottimale per molto tempo e influisca sulle prestazioni di tutte le LUN/FS nel pool.
Resolution
Problema # 1:
Dell EMC Unity OE 4.2.1.9535982 e versioni successive risolvono questo problema e si consiglia di aggiornare il software dell'array alla versione più recente.
Inoltre, si consiglia vivamente di aggiornare il firmware dell'unità per evitare problemi futuri. Vedere di seguito.
Problema # 2: L'unità segnala errori Soft Media e 01|18|ff
Per ovviare immediatamente al problema di prestazioni, l'unità con errori deve essere estratta dal pool. Una volta estratta l'unità dal pool, le prestazioni dovrebbero migliorare immediatamente.
- Se è disponibile l'accesso fisico al sistema, rimuovere l'unità problematica dallo slot e contattare il supporto tecnico Dell EMC per richiedere la sostituzione dell'unità.
- Se non è immediatamente disponibile alcun accesso fisico al sistema, e per discutere altre possibili soluzioni alternative, contattare il supporto tecnico Dell EMC o il responsabile dell'assistenza autorizzato e citare l'ID di questo articolo della Knowledge Base.
Consigli:
Per risolvere i problemi #1 e #2, si consiglia di aggiornare il firmware dell'unità alle versioni elencate di seguito o superiori. Il pacchetto firmware V9 per unità Unity rilasciato il 27 febbraio 2019 contiene firmware per i seguenti numeri parte e versioni
firmware corrispondenti: 005052377 - QC4E
005052378 - QC4E
005052379 - QC4E
005052380 - QC4E
005051739 PC16
005051740 PC16
005052154 PC16
005052155 PC16
Fare riferimento al https://support.emc.com/kb/490700 KB 490700 per istruzioni sull'aggiornamento del firmware dell'unità.
Il pacchetto più recente del firmware dell'unità Unity è disponibile per il download dalla pagina del supporto ed è possibile trovarlo cercando "Unity_Drive_Firmware_Package".
Fare riferimento alla DTA 528178: Dell EMC Unity: Gli errori dei supporti software delle unità possono causare problemi di prestazioni e la non disponibilità dei dati (correggibile dall'utente)rilasciata per le unità 005052377 005052378 005052379 e 005052380
Additional Information
| https://downloads.dell.com/TranslatedPDF/ES_KB521649.pdf |
| https://downloads.dell.com/TranslatedPDF/DE_KB521649.pdf |
| https://downloads.dell.com/TranslatedPDF/FR_KB521649.pdf |
| https://downloads.dell.com/TranslatedPDF/IT_KB521649.pdf |
| https://downloads.dell.com/TranslatedPDF/JA_KB521649.pdf |
| https://downloads.dell.com/TranslatedPDF/KO_KB521649.pdf |