Data Domain: Se detectó una falla de NVRAM | Error o condición defectuosa
Summary: La NVRAM y su batería de reserva (BBU) son componentes críticos de la arquitectura de invulnerabilidad de datos de Data Domain. El sistema operativo Data Domain (DDOS) monitorea estos componentes. Si se produce una falla de hardware, DDOS genera una alerta que se debe abordar de inmediato para mantener la integridad del sistema. ...
Symptoms
⚠️ Importante: No reemplace una tarjeta NVRAM o BBU, a menos que DDOS haya publicado una alerta que indique una falla. No se recomienda el reemplazo proactivo.
Se aplica a:
- Todos los sistemas Data Domain
- Todas las versiones de software de DDOS
Posibles alertas:
NVRAM-00001: File system is disabled due to a problem with the NVRAM subsystemNVRAM-00002: Battery at low charge and not chargingNVRAM-00003: Excessive PCI or memory errorsNVRAM-00201: Hardware fault detected with NVRAM cardNVRAM-00202: Hardware fault detected with NVRAM remote batteryNVRAM-00204: Invalid condition detected with NVRAM battery
Cause
DDOS monitorea el subsistema NVRAM continuamente. Cuando detecta una falla en la tarjeta NVRAM o BBU, publica una alerta.
Por lo general, la alerta incluye detalles de diagnóstico, pero es posible que se requiera una investigación más profunda si el reemplazo del componente no resuelve el problema.
Resolution
Por lo general, la resolución de la alerta implica reemplazar la tarjeta NVRAM o la BBU (si no están integradas). Siga estos pasos:
- Generar un paquete de soporte
- Envíe una solicitud de servicio al proveedor de soporte.
Comandos útiles de la CLI:
-
# alerts show current # Check for active NVRAM or battery alerts # system show nvram # Review card errors and battery status # system show hardware # Confirm NVRAM card presence
Additional Information
Ejemplo:
- Aquí vemos una buena NVRAM: cero "errores" y todos los estados de la batería están "bien" (aunque la carga es de ~ 96%)
sysadmin@itsaDD# system show nvram
NVRAM Cards:
Card Component Value
---- ------------------- -----------------------------------------------
1 Slot 10
Firmware version 2.0.4
Memory size 3.93 GiB
Errors 0 memory (0 uncorrectable), 0 PCI, 0 controller
Board temperature 35 C
CPU temperature 41 C
Number of batteries 4
Card model no 313-163-100A-02
Card serial no FLA011301nnnnn
Battery model no 313-164-100A-01
Battery serial no FLA021242nnnnn
---- ------------------- -----------------------------------------------
NVRAM Batteries:
Card Battery Status Charge Charging Time To Temperature Voltage
Status Full Charge
---- ------- ------ ------ -------- ----------- ----------- -------
1 1 ok 96 % enabled 0 mins 26 C 8.088 V
2 ok 95 % enabled 0 mins 27 C 8.082 V
3 ok 97 % enabled 0 mins 25 C 8.084 V
4 ok 95 % enabled 0 mins 26 C 8.072 V
---- ------- ------ ------ -------- ----------- ----------- -------