Data Domain: Problema de actualización de firmware de unidad en DDOS versiones 7.13, 8.1 y 8.2
Summary: En las versiones 7.13, 8.1 y 8.2 de DDOS, los restauradores de Data Domain (DDR) con actualizaciones de firmware de unidad habilitadas pueden experimentar fallas de disco falsas e inesperadas. Específicamente, dos dispositivos por grupo de discos (DG) pueden pasar a un estado fallido debido a un problema de conteo de referencias del módulo RAID en el kernel. Esto puede provocar inestabilidad en el sistema y posibles riesgos de disponibilidad de datos. Se integró una corrección en las versiones 7.13.1.40, 8.3.1.10 y posteriores de DDOS. ...
Symptoms
- Dos dispositivos por grupo de dispositivos (DG) entran inesperadamente en un estado fallido
- El intento de hacer fallar un tercer dispositivo en la unidad principal provoca un estado de alarma del sistema (estado de falla total)
- Excesivo
kern.infoEntradas de registro de WARN - Estado del grupo de discos degradado
- Degradación notable del rendimiento en la DDR
Sistemas afectados:
- Sistemas DD con almacenamiento externo que ejecutan versiones tempranas de DDOS 7.13.x.x | 8.1.x.x | 8.2x.x
- Se ha adaptado una corrección a >= 7.13.1.40
- Los clientes que ejecutan 8.1 u 8.2 deben actualizar a >= 8.3.1.10
Cause
Durante el proceso de actualización del firmware de unidad, el comando RAID check scan Puede ejecutarse varias veces según la cantidad de dispositivos en el sistema. Cada ejecución aumenta el conteo de referencias del módulo RAID en el kernel de Linux. En la versión 5.5 del kernel (utilizada en DDOS 7.13, 8.1 y 8.2), este recuento de referencias no disminuye. Si el conteo se revierte a cero, el kernel bloquea el acceso de RAID a la parte interna gendisk estructuras, lo que hace que los dispositivos se marquen como ilegibles y pasen a un estado fallido. Cada DG tolera solo dos dispositivos fallidos; una tercera falla en la unidad principal desencadena un estado de alarma del sistema.
Resolution
Se integró una corrección permanente en las siguientes versiones de DDOS:
- DDOS >= 7.13.1.40
- DDOS >= 8.3.1.10
Solución alternativa:
- Envíe una solicitud de servicio al soporte técnico de Dell y consulte este artículo de la base de conocimientos (#000331892) para acelerar la resolución.
- Soporte técnico de Dell:
- Modifique el script de actualización del firmware de la unidad para que vuelva inmediatamente después de la ejecución, lo que minimiza el aumento en el conteo de referencias del módulo RAID.
- Soporte técnico de Dell: