VPLEX: Dial Home "0x8a4861d6" para FRU no presente y "0x8a4861d7" para FRU con errores, generado para unidades de batería de reserva (BBU) VS6

Resumen: En este artículo, se habla sobre la llamada a casa de VS6 para DH Events 0x8a4861d6 y 0x8a4861d7 informar problemas con las BBU. Hay una solución para los problemas y una solución alternativa con acciones que se deben realizar para comprobar el estado de las BBU. ...

Este artículo se aplica a Este artículo no se aplica a Este artículo no está vinculado a ningún producto específico. No se identifican todas las versiones del producto en este artículo.

Síntomas

En los sistemas VS6, las llamadas a casa "0x8a4861d6" (FRU no presente) y "0x8a4861d7" (FRU con fallas) se llamarán a casa diariamente, donde se informará la BBU (unidad de reserva de batería) o la fuente de alimentación (psa/b) con "La FRU especificada no está presente" y, más adelante, el director puede indicar "El estado de la FRU especificada tiene fallas" (informado por el director par) de la siguiente manera:

Ejemplo:

<EventData><![ CDATA[/engine/hyperion@a: :La FRU especificada no está presente. [Versiones:MS{x.x.x.x.x, x.x.x.x, x.x.x.x}, Director:{x.x.x.x.x}, ClusterWitnessServer:{x.x.x.x}] RCA: La FRU especificada no está presente. Remedio: Compruebe si se insertó la FRU correcta en la ranura. Si el problema persiste, póngase en contacto con el servicio al cliente de EMC.

<¡Datos de>< eventos![ CDATA[/engine/bbu-a0: N.º de pieza 078-000-123-05 /N.º de serie ACPHxxxxxx0168 /N.º de referencia FFF: El estado operativo de la fru especificada es Faulted. [Versiones:MS{x.x.x.x.x, x.x.x.x, x.x.x.x}, Director:{x.x.x.x.x}, ClusterWitnessServer:{x.x.x.x}] RCA: El estado de la FRU especificada es defectuoso Remedio: Póngase en contacto con el servicio al cliente de EMC.

 
Los directores zpem.logs pueden registrar los siguientes tipos de eventos que indican que las BBU o las fuentes de alimentación tienen fallas y requieren reemplazo; aunque el hardware no tenga fallas, este es un evento de falso positivo.  El reemplazo del hardware no resolverá los eventos ni las notificaciones de Call Home en este caso.

Ejemplo:

Service@ManagementServer:~> ssh root@128.221.252.38
Last login: Day Month Date HH:MM:SS Year from 128.221.252.38 < IP Address the login was from
VPLEX
director-1-1-a:~ # less zpem.logs
Mar 28 08:54:08 director-1-1-a zpem[4709]: CRITICAL: /engine/psa1 (AC7Nxxxxxx0633): output-over-voltage-fault is true
Mar 28 08:54:08 director-1-1-a zpem[4709]: CRITICAL: /engine/psa1 (AC7Nxxxxxx0633): output-under-voltage-fault is true
Mar 28 08:54:08 director-1-1-a zpem[4709]: CRITICAL: /engine/psa1 (AC7Nxxxxxx0633): general-fault is true
Mar 28 08:54:08 director-1-1-a zpem[4709]: CRITICAL: /engine/psa1 (AC7Nxxxxxx0633): SMS ERR: The operational state of the specified fru is Faulted.
Mar 28 08:54:21 director-1-1-a zpem[4709]: CRITICAL: /engine/bbu-a0 (ACPTxxxxxx0236): internal-fault is true
Mar 28 08:54:21 director-1-1-a zpem[4709]: CRITICAL: /engine/bbu-a0 (ACPTxxxxxx0236): SMS ERR: The operational state of the specified fru is Faulted.
Mar 28 08:54:56 director-1-1-a zpem[4709]: CRITICAL: /engine/bbu-a0 (ACPTxxxxxx0236): internal-fault is true
Mar 28 08:54:56 director-1-1-a zpem[4709]: CRITICAL: /engine/bbu-a0 (ACPTxxxxxx0236): SMS ERR: The operational state of the specified fru is Faulted.
Mar 28 08:55:18 director-1-1-a zpem[4709]: CRITICAL: /engine/bbu-a1 (ACPTxxxxxx0351): battery-ready is false
Mar 29 09:06:13 director-1-1-a zpem[4759]: CRITICAL: /engine/bbu-a0 (ACPTxxxxxx0236): battery-enabled is false
Mar 29 09:06:13 director-1-1-a zpem[4759]: CRITICAL: /engine/bbu-a0 (ACPTxxxxxx0236): battery-ready is false
Mar 29 09:06:14 director-1-1-a zpem[4759]: CRITICAL: /engine/bbu-a1 (ACPTxxxxxx0351): battery-enabled is false
Mar 29 09:06:14 director-1-1-a zpem[4759]: CRITICAL: /engine/bbu-a1 (ACPTxxxxxx0351): battery-ready is false
Mar 29 09:06:14 director-1-1-a zpem[4759]: CRITICAL: /engine/bbu-a1 (ACPTxxxxxx0351): requires-replacement is True
Mar 29 09:06:14 director-1-1-a zpem[4759]: CRITICAL: /engine/bbu-a1 (ACPTxxxxxx0351): SMS ERR: The operational state of the specified fru is Faulted.


Los siguientes eventos también se pueden ver con frecuencia en los registros del firmware del servidor de administración y los registros zpem del director en relación con la carga frecuente de la batería:  
 

128.221.252.68/xmmg/log:5988:W/"0060167328a822200":14548:<4>20xx/03/12 18:28:16.81: ZPEM/210 /engine/bbu-b0: PartNo 078-000-123-05 /SerialNo ACPHxxxxxx0206 /RevNo FFF :battery-charging is true
128.221.253.68/xmmg/log:5988:W/"0060167328a822200":14549:<6>20xx/03/12 18:31:34.45: ZPEM/66 /engine/bbu-b0: PartNo 078-000-123-05 /SerialNo ACPHxxxxxx0206 /RevNo FFF :battery-fully-charged is true


NOTA:
Con respecto a estos eventos, se espera que la BBU pase de estar cargada a cargarse con frecuencia. Esto se ve en todos los VS6.  Consulte el 000167060 de KBA:  VPLEX: Las BBU están constantemente en ciclos de "Cargando" a "Completamente cargado" para obtener más información sobre este evento.

 

Causa

El componente zpem interno del código de GeoSynchrony es responsable de monitorear el hardware de FRU y lo hace a través de sondeos regulares.  Parte del monitoreo de hardware que involucraba sondeo remoto entre los pares de directores A/B se realizaba mediante un enlace muy lento, lo que contribuía a que se perdieran algunos ciclos de sondeo. 

Los ciclos de sondeo perdidos dieron como resultado que el componente percibiera que se había perdido el contacto con el hardware y que faltaba (cuando no era así).  Esto desencadenó el evento de falso positivo, es decir, la FRU no está presente y el estado de la FRU especificada tiene errores. 

Resolución

Resolución permanente:   
Este problema se corrigió de forma permanente en GeoSynchrony 6.1 parche 1 y versiones posteriores.

En la corrección anterior, se eliminó parte del monitoreo de hardware que involucraba sondeo remoto entre pares de directores A/B (la información que se elimina aún se recopila localmente y no se consideraba necesario tenerla en el director remoto), lo que evita que se pierdan los ciclos de sondeo y se activen estos eventos de falsos positivos. Sin embargo, aún podemos obtener algunos informes de falsos positivos si la parte zpem del código captura un estado operativo de BBU offline durante un ciclo de carga.

Solución alternativa:   

  1. Desde el servidor de administración, acceda a VPlexcli y ejecute el siguiente comando para confirmar que el estado "operational-status" de las BBU se encuentre en el estado "online", lo que indica que no hay fallas de hardware de la siguiente manera:   
login as: service
Using keyboard-interactive authentication.
Password:
Last login: Day Month date HH:MM:SS Year from x.x.x.x < Dirección IP desde la que se produjo el inicio de sesión
service@ ManagementServer:~> vplexcli

VPlexcli:/> ll **/engines/engine-1-1/battery-backup-units/*
/engines/engine-1-1/battery-backup-units/battery-backup-unit-A0: 
Name                    Value 
----------------------  -------------- 
battery-fully-charged   true <-- Tenga en cuenta este valor      
battery-test-result     passed 
battery-time-remaining  65535 
family-fru-id           0x0015000e 
marker-led              off 
on-battery              false 
operational-status      online <-- Tenga en cuenta este valor
part-number             078-000-123-05 
revision-number         FFF 
serial-number           ACPTxxxxxx0319 

/engines/engine-1-1/battery-backup-units/battery-backup-unit-A1: 
Name                    Value 
----------------------  -------------- 
battery-fully-charged   true 
battery-test-result     passed 
battery-time-remaining  65535 
family-fru-id           0x0015000e 
marker-led              off 
on-battery              false 
operational-status      online 
part-number             078-000-123-05 
revision-number         FFF 
serial-number           ACPTxxxxxx0097 

/engines/engine-1-1/battery-backup-units/battery-backup-unit-B0: 
Name                    Value 
----------------------  -------------- 
battery-fully-charged   true 
battery-test-result     passed 
battery-time-remaining  65535 
family-fru-id           0x0015000e 
marker-led              off 
on-battery              false 
operational-status      online 
part-number             078-000-123-05 
revision-number         FFF 
serial-number           ACPTxxxxxx0093 

/engines/engine-1-1/battery-backup-units/battery-backup-unit-B1: 
Name                    Value 
----------------------  -------------- 
battery-fully-charged   true 
battery-test-result     passed 
battery-time-remaining  65535 
family-fru-id           0x0015000e 
marker-led              off 
on-battery              false 
operational-status      online 
part-number             078-000-123-05 
revision-number         FFF 
serial-number           ACPTxxxxxx1075

 
  1. Si el "estado de la batería" se muestra como "completamente cargada" y el "estado operativo" se muestra como "en línea", este problema se puede ignorar. Lo más probable es que la alerta haya sido un falso positivo, ya que la prueba de batería pudo haber ocurrido cuando la parte del monitor FRU del código ejecutó su comprobación de los estados de FRU.
  2. Si en "estado de la batería" se muestra "cargando " y en "estado operativo" aparece "en línea", vuelva a verificar en aproximadamente 5 minutos, ya que es posible que la prueba de la batería aún esté en curso. Si después de cinco minutos la verificación muestra el mismo estado, comuníquese con el servicio al cliente de VPLEX para obtener más ayuda. 
  3. Si en el "estado de la batería" se muestra "cargando " y en "estado operativo" aparece offline o fallando, esto podría indicar un problema. Póngase en contacto con el servicio al cliente de VPLEX para obtener más ayuda.
  4. Si se reemplazó una BBU y el estado comienza a variar entre "con errores" y "funcionando". , póngase en contacto con el soporte al cliente de VPLEX y mencione este artículo.


 

Información adicional

Este contenido está traducido en otros idiomas: 
https://downloads.dell.com/TranslatedPDF/PT-BR_KB533159.pdf
https://downloads.dell.com/TranslatedPDF/ZH-CN_KB533159.pdf
https://downloads.dell.com/TranslatedPDF/AR-EG_KB533159.pdf
https://downloads.dell.com/TranslatedPDF/DE_KB533159.pdf
https://downloads.dell.com/TranslatedPDF/ES_KB533159.pdf
https://downloads.dell.com/TranslatedPDF/FR_KB533159.pdf
https://downloads.dell.com/TranslatedPDF/KO_KB533159.pdf
https://downloads.dell.com/TranslatedPDF/JA_KB533159.pdf
https://downloads.dell.com/TranslatedPDF/IT_KB533159.pdf
https://downloads.dell.com/TranslatedPDF/NL_KB533159.pdf
https://downloads.dell.com/TranslatedPDF/PT_KB533159.pdf
https://downloads.dell.com/TranslatedPDF/RU_KB533159.pdf
https://downloads.dell.com/TranslatedPDF/SV_KB533159.pdf

Productos afectados

VPLEX VS6
Propiedades del artículo
Número del artículo: 000167061
Tipo de artículo: Solution
Última modificación: 18 abr 2025
Versión:  6
Encuentre respuestas a sus preguntas de otros usuarios de Dell
Servicios de soporte
Compruebe si el dispositivo está cubierto por los servicios de soporte.