Data Domain: DD9800 – Spannung ist fehlerhaft – Warnmeldung
Summary: Data Domain DD9800 Revision2 – Troubleshooting-Warnmeldung: Der Storage-Prozessor (SP) ist ausgefallen – Die Spannung ist fehlerhaft.
Symptoms
Aufgrund eines überlappenden Bitmap-Eintrags kann DD9800 Revision 2 einen SP aufgrund von "Voltage is Faulty" anklagen, obwohl das eigentliche Problem ein externer CPU-IERR ist.
Wenn beide Ereignisse (CPU External IERR und "Voltage is faulty") gleichzeitig auftreten, können Sie die Spannungswarnung ignorieren und sich auf das Troubleshooting darauf konzentrieren, warum die CPU auf einen CPU-IERR gestoßen ist. Weitere Informationen zum Troubleshooting von CPU-IERR-Fehlern auf DD9800-Plattformen erhalten Sie von Ihrem Supportanbieter.
Betroffene Systeme:
- DD9800 Rev 2
– DDOS 5.7.x/6.0.x/ <6.1.3.0
Symptome:
Gepostete Warnmeldung
=========
Time: Tue Mar 27 07:19:53 2018 Alert Id: p0-57 Event Id: EVT-ENVIRONMENT-00032 Event Message: The storage processor has failed Object: Enclosure=1 Additional Information: Cause=Voltage is faulty "Voltage is faulty" event found in messages.engineering log =============================================== Mar 15 05:48:27 platmon: CRITICAL: The storage processor has failed. Enclosure=1 Cause="Voltage is faulty" Mar 15 05:48:28 platmon: INFO: Event posted: p0-275 (11000113:28521xxxx): EVT-ENVIRONMENT-00032: The storage processor has failed EVT-OBJ::Enclosure=1 EVT-INFO::Cause=Voltage is faulty Mar 15 05:48:28 platmon: INFO: _ems_post_pubsub_event: Publishing event for alert EVT-ENVIRONMENT-00032
CPU IERR event found in bios.txt log =============================== 1 | 03/15/2018 | 05:33:39 | SMI Critical Interrupt Events Enter_SMI | SMI Critical Interrupt | Asserted | Used AUX Log (LSB 0x0) Used AUX Log (MSB 0x0) 2 | 03/15/2018 | 05:33:41 | CPU Status Events CPU2_Status | CPU IERR | Asserted | CPU External IERR 3 | 03/15/2018 | 05:33:41 | Entering IERR Interrupt Events Enter_SMI | IERR Interrupt | Asserted | Used AUX Log (LSB 0x24) Used AUX Log (MSB 0x0) 4 | 03/15/2018 | 05:33:42 | BMC Chassis Ctrl Events BMC_Chassis_Ctrl | Reset through BMC | Asserted 5 | 03/15/2018 | 05:34:04 | Power Unit DC_State | State Asserted | Deasserted
Cause
Dieses Problem tritt in den DDOS-Versionen 5.7, 6.0 und 6.1 auf
Die Hauptursache ist SP-Fehler Bitmap ist überlappend, sodass bei einem IERR-Ereignis die Warnmeldung fälschlicherweise "Spannung ist fehlerhaft" anzeigt
#define APL_FRU_FAULT_SP_CPUMISC (1 << 17)#define APL_FRU_FAILEDMAP_VOLTFAULT_SP (1 << 17)