Data Domain. DD9800 — напряжение неисправно — оповещение
Summary: Data Domain DD9800, версия 2. Предупреждение об устранении неисправностей: Произошел сбой процессора СХД (SP) — неисправен напряжение.
Symptoms
Из-за наложения записей растровых изображений DD9800 версии 2 может предъявить процессору СХД обвинение из-за ошибки «Voltage is Faulty», если реальная проблема заключается во внешнем IERR ЦП.
Если оба события («CPU External IERR» и «Voltage is faulty») происходят одновременно, можно игнорировать оповещение о напряжении и сосредоточиться на поиске и устранении неисправностей процессора, из-за которого произошел IERR ЦП. Для получения дополнительной информации о поиске и устранении неисправностей ошибок IERR ЦП на платформах DD9800 обратитесь за помощью к поставщику услуг поддержки.
Затронутые системы:
- DD9800 Rev 2
- DDOS 5.7.x / 6.0.x / <6.1.3.0
Симптомы:
Опубликовано оповещение
=========
Time: Tue Mar 27 07:19:53 2018 Alert Id: p0-57 Event Id: EVT-ENVIRONMENT-00032 Event Message: The storage processor has failed Object: Enclosure=1 Additional Information: Cause=Voltage is faulty "Voltage is faulty" event found in messages.engineering log =============================================== Mar 15 05:48:27 platmon: CRITICAL: The storage processor has failed. Enclosure=1 Cause="Voltage is faulty" Mar 15 05:48:28 platmon: INFO: Event posted: p0-275 (11000113:28521xxxx): EVT-ENVIRONMENT-00032: The storage processor has failed EVT-OBJ::Enclosure=1 EVT-INFO::Cause=Voltage is faulty Mar 15 05:48:28 platmon: INFO: _ems_post_pubsub_event: Publishing event for alert EVT-ENVIRONMENT-00032
CPU IERR event found in bios.txt log =============================== 1 | 03/15/2018 | 05:33:39 | SMI Critical Interrupt Events Enter_SMI | SMI Critical Interrupt | Asserted | Used AUX Log (LSB 0x0) Used AUX Log (MSB 0x0) 2 | 03/15/2018 | 05:33:41 | CPU Status Events CPU2_Status | CPU IERR | Asserted | CPU External IERR 3 | 03/15/2018 | 05:33:41 | Entering IERR Interrupt Events Enter_SMI | IERR Interrupt | Asserted | Used AUX Log (LSB 0x24) Used AUX Log (MSB 0x0) 4 | 03/15/2018 | 05:33:42 | BMC Chassis Ctrl Events BMC_Chassis_Ctrl | Reset through BMC | Asserted 5 | 03/15/2018 | 05:34:04 | Power Unit DC_State | State Asserted | Deasserted
Cause
Эта проблема встречается в DDOS версий 5.7, 6.0 и 6.1
Основная причина заключается в том, что битовая карта неисправности процессора СХД перекрывается, поэтому при наступлении события IERR в предупреждающем сообщении неправильно отображается «Voltage is faulty»
#define APL_FRU_FAULT_SP_CPUMISC (1 << 17)#define APL_FRU_FAILEDMAP_VOLTFAULT_SP (1 << 17)