Data Domain: Problema di aggiornamento del firmware dell'unità su DDOS versioni 7.13, 8.1 e 8.2
Summary: Nelle versioni DDOS 7.13, 8.1 e 8.2, i Data Domain Restorer (DDR) con gli aggiornamenti del firmware dell'unità abilitati potrebbero riscontrare falsi guasti imprevisti del disco. In particolare, due dispositivi per gruppo di dischi (DG) possono passare a uno stato di guasto a causa di un problema di conteggio dei riferimenti dei moduli RAID nel kernel. Ciò può causare instabilità del sistema e potenziali rischi per l'availability dei dati. Una correzione è stata integrata in DDOS versioni 7.13.1.40, 8.3.1.10 e successive. ...
Symptoms
- Due dispositivi per gruppo di dispositivi (DG) entrano in modo imprevisto in uno stato di errore
- Se si tenta di guastare un terzo dispositivo sull'unità principale, si verifica un errore irreversibile del sistema (stato Total Fail)
- Eccessivo
kern.infoVoci del registro WARN - Stato di un gruppo di dischi danneggiato
- Notevole riduzione delle prestazioni sul DDR
Sistemi interessati:
- Sistemi DD con storage esterno che eseguono versioni precedenti di DDOS 7.13.x.x | 8.1.x.x | 8.2x.x
- È stato eseguito il backporting di una correzione a >=7.13.1.40
- I clienti che eseguono la versione 8.1 o 8.2 devono eseguire l'aggiornamento a >=8.3.1.10.
Cause
Durante il processo di aggiornamento del firmware dell'unità, il comando RAID check scan Può essere eseguito più volte in base al numero di dispositivi nel sistema. Ogni esecuzione aumenta il numero di riferimenti del modulo RAID nel kernel Linux. Sulla versione 5.5 del kernel (utilizzata in DDOS 7.13, 8.1 e 8.2), questo conteggio dei riferimenti non diminuisce. Se il conteggio viene impostato su zero, il kernel impedisce al RAID di accedere ai componenti gendisk facendo sì che i dispositivi vengano contrassegnati come illeggibili e spostati in uno stato di errore. Ogni DG tollera solo due dispositivi guasti; un terzo guasto sull'unità principale genera un errore irreversibile del sistema.
Resolution
Una correzione permanente è stata integrata nelle seguenti versioni di DDOS:
- DD OS >= 7.13.1.40
- DD OS >= 8.3.1.10
Soluzione alternativa:
- Inviare una Service Request al supporto tecnico Dell e fare riferimento a questo articolo della Knowledge Base (#000331892) per accelerare la risoluzione.
- Supporto tecnico Dell:
- Modificare lo script di upgrade del firmware unità in modo che venga ripristinato immediatamente dopo l'esecuzione, riducendo al minimo l'aumento del numero di riferimenti del modulo RAID.
- Supporto tecnico Dell: