Data Domain: DD9800 - a tensão está com defeito - alerta
Summary: Data Domain DD9800 Revisão2 — Alerta de solução de problemas: A controladora de armazenamento falhou - a tensão está com defeito.
Symptoms
Devido a uma entrada de bitmap sobreposta, o DD9800 revisão 2 pode indiciar uma SP devido a "A tensão está com defeito", quando o problema real é um IERR externo da CPU.
Quando os dois eventos (IERR externo da CPU e "A tensão está com defeito") ocorrem simultaneamente, é seguro ignorar o alerta de tensão e focar a solução de problemas no motivo pelo qual a CPU encontrou um IERR. Para obter mais detalhes sobre como solucionar problemas de erros de IERR da CPU em plataformas DD9800, entre em contato com seu provedor de suporte para obter assistência.
Sistemas afetados:
- DD9800 Rev 2
- DDOS 5.7.x / 6.0.x / <6.1.3.0
Sintomas:
Postado Alerta
=========
Time: Tue Mar 27 07:19:53 2018 Alert Id: p0-57 Event Id: EVT-ENVIRONMENT-00032 Event Message: The storage processor has failed Object: Enclosure=1 Additional Information: Cause=Voltage is faulty "Voltage is faulty" event found in messages.engineering log =============================================== Mar 15 05:48:27 platmon: CRITICAL: The storage processor has failed. Enclosure=1 Cause="Voltage is faulty" Mar 15 05:48:28 platmon: INFO: Event posted: p0-275 (11000113:28521xxxx): EVT-ENVIRONMENT-00032: The storage processor has failed EVT-OBJ::Enclosure=1 EVT-INFO::Cause=Voltage is faulty Mar 15 05:48:28 platmon: INFO: _ems_post_pubsub_event: Publishing event for alert EVT-ENVIRONMENT-00032
CPU IERR event found in bios.txt log =============================== 1 | 03/15/2018 | 05:33:39 | SMI Critical Interrupt Events Enter_SMI | SMI Critical Interrupt | Asserted | Used AUX Log (LSB 0x0) Used AUX Log (MSB 0x0) 2 | 03/15/2018 | 05:33:41 | CPU Status Events CPU2_Status | CPU IERR | Asserted | CPU External IERR 3 | 03/15/2018 | 05:33:41 | Entering IERR Interrupt Events Enter_SMI | IERR Interrupt | Asserted | Used AUX Log (LSB 0x24) Used AUX Log (MSB 0x0) 4 | 03/15/2018 | 05:33:42 | BMC Chassis Ctrl Events BMC_Chassis_Ctrl | Reset through BMC | Asserted 5 | 03/15/2018 | 05:34:04 | Power Unit DC_State | State Asserted | Deasserted
Cause
Esse problema é encontrado nas versões 5.7 , 6.0, & 6.1 do DDOS
A causa raiz é que o bitmap de falha da SP está sobreposto, portanto, quando ocorre um evento de IERR, a mensagem de aviso exibe incorretamente "a tensão está com defeito"
#define APL_FRU_FAULT_SP_CPUMISC (1 << 17)#define APL_FRU_FAILEDMAP_VOLTFAULT_SP (1 << 17)