Hardware Avamar Gen4S: Timeout del ciclo di apprendimento
Summary: Il ciclo di apprendimento ha esito negativo sull hardware Avamar Gen4S.
Symptoms
Nell'interfaccia utente di Avamar o nei registri viene visualizzato il seguente errore:
<MRMON154> Controller ID: 0 Battery relearn timed out Cause
Il fornitore sta esaminando la richiesta.
Resolution
1. Accedere all'Avamar Server come admin, elevare il livello root e caricare il SSH .
Per istruzioni sul caricamento delle chiavi, consultare Avamar: Come accedere a un Avamar Server e caricare varie chiavi. (In inglese)
2. Utilizzando le informazioni dell'evento dell'interfaccia utente o della richiesta di servizio Dial Home:
un. Determinare il nodo che ha generato il messaggio di errore.
b. Connettersi a tale nodo come root:
ssn 0.# --user=root
(dove 0.# è il numero del nodo fisico)
3. Estrazione /var/log/messages utilizzando il comando applicabile riportato di seguito:
bunzip2 /var/log/messages*
gunzip /var/log/messages*
xz --decompress /var/log/messages*
4. Esaminare il registro dei messaggi (/var/log/messages) per gli eventi di riapprendimento della batteria :
grep -i "battery relearn" /var/log/messages
Jul 29 13:37:12 AVATPCKVS41N05 MR_MONITOR[8625]: <MRMON157> Controller ID: 0 Battery relearn will start in 4 days Jul 31 13:37:48 AVATPCKVS41N05 MR_MONITOR[8625]: <MRMON158> Controller ID: 0 Battery relearn will start in 2 days Aug 1 13:37:33 AVATPCKVS41N05 MR_MONITOR[8625]: <MRMON159> Controller ID: 0 Battery relearn will start in 1 day Aug 2 08:37:13 AVATPCKVS41N05 MR_MONITOR[8625]: <MRMON160> Controller ID: 0 Battery relearn will start in 5 hours Aug 2 13:38:24 AVATPCKVS41N05 MR_MONITOR[8625]: <MRMON155> Controller ID: 0 Battery relearn pending: Battery is under charge Aug 2 13:39:28 AVATPCKVS41N05 MR_MONITOR[8625]: <MRMON151> Controller ID: 0 Battery relearn started Aug 2 13:40:36 AVATPCKVS41N05 MR_MONITOR[8625]: <MRMON152> Controller ID: 0 Battery relearn in progress Aug 2 13:40:36 AVATPCKVS41N05 MR_MONITOR[8625]: <MRMON153> Controller ID: 0 Battery relearn completed Aug 13 16:32:15 AVATPCKVS41N05 MR_MONITOR[8625]: <MRMON155> Controller ID: 0 Battery relearn pending: Battery is under charge Aug 13 16:44:10 AVATPCKVS41N05 MR_MONITOR[8625]: <MRMON151> Controller ID: 0 Battery relearn started Aug 13 16:45:15 AVATPCKVS41N05 MR_MONITOR[8625]: <MRMON152> Controller ID: 0 Battery relearn in progress Aug 13 16:48:30 AVATPCKVS41N05 MR_MONITOR[8625]: <MRMON154> Controller ID: 0 Battery relearn timed out
5. Confermare utilizzando CmdTool2 che l'apprendimento non è riuscito, ma che la batteria non visualizza 0 Volt:
CmdTool2 -AdpBbuCmd -GetBbuStatus -a0
BBU status for Adapter: 0
BatteryType: CVPM02
Voltage: 9563 mV
Current: 0 mA
Temperature: 30 C
BBU Firmware Status:
Charging Status : None
Voltage : OK
Temperature : OK
Learn Cycle Requested : No
Learn Cycle Active : No
Learn Cycle Status : Failed
Learn Cycle Timeout : Yes
I2c Errors Detected : No
Battery Pack Missing : No
Battery Replacementrequired : No
Remaining CapacityLow : No
Periodic Learn Required : No
Transparent Learn : No
No space to cache offload : No
Pack is about to fail & should be replaced : No
Cache Offload premium feature required : No
Module microcode update required : No
GasGuageStatus:
Fully Discharged : No
FullyCharged : Yes
Discharging : Yes
Initialized : No
Remaining Time Alarm : No
Remaining Capacity Alarm: No
Discharge Terminated : No
OverTemperature : No
Charging Terminated : Yes
Over Charged : No
Pack energy : 96 J
Capacitance : 100
Remaining reserve space : 93
Exit Code: 0x00
6. Avviare un ciclo di apprendimento manuale:
sudo CmdTool2 -AdpBbuCmd -BbuLearn -a0
7. Esaminare il registro dei messaggi per verificare se il ciclo di apprendimento è iniziato e terminato.
Esempio 1:
Aug 26 12:15:01 AVAMAR-GRID-VAR-LOG-MESSAGE syslog-ng[3170]: Configuration reload request received, reloading configuration;
Aug 26 12:15:01 AVAMAR-GRID-VAR-LOG-MESSAGE syslog-ng[3170]: New configuration initialized;
Aug 26 12:15:11 AVAMAR-GRID-VAR-LOG-MESSAGE sudo: admin : TTY=pts/0 ; PWD=/data01/home/admin ; USER=root ; COMMAND=/opt/MegaRAID/CmdTool2/CmdTool2 -pdlist -a0 -nolog
Aug 26 12:16:10 AVAMAR-GRID-VAR-LOG-MESSAGE sudo: admin : TTY=pts/0 ; PWD=/data01/home/admin ; USER=root ; COMMAND=/opt/MegaRAID/CmdTool2/CmdTool2 -AdpBbuCmd -GetBbuStatus -a0
Aug 26 12:18:28 AVAMAR-GRID-VAR-LOG-MESSAGE sudo: admin : TTY=pts/0 ; PWD=/data01/home/admin ; USER=root ; COMMAND=/opt/MegaRAID/CmdTool2/CmdTool2 -AdpBbuCmd -BbuLearn -a0
Aug 26 12:18:31 AVAMAR-GRID-VAR-LOG-MESSAGE MR_MONITOR[5742]: Controller ID: 0 Battery relearn pending: Battery is under charge
Aug 26 12:19:36 AVAMAR-GRID-VAR-LOG-MESSAGE MR_MONITOR[5742]: Controller ID: 0 Battery relearn started
Aug 26 12:20:02 AVAMAR-GRID-VAR-LOG-MESSAGE sudo: admin : TTY=pts/0 ; PWD=/data01/home/admin ; USER=root ; COMMAND=/opt/MegaRAID/CmdTool2/CmdTool2 -AdpBbuCmd -GetBbuStatus -a0
Aug 26 12:20:44 AVAMAR-GRID-VAR-LOG-MESSAGE MR_MONITOR[5742]: Controller ID: 0 Battery relearn in progress
Aug 26 12:20:44 AVAMAR-GRID-VAR-LOG-MESSAGE MR_MONITOR[5742]: Controller ID: 0 Battery relearn completed
Aug 26 12:22:25 AVAMAR-GRID-VAR-LOG-MESSAGE sudo: admin : TTY=pts/0 ; PWD=/data01/home/admin ; USER=root ; COMMAND=/opt/MegaRAID/CmdTool2/CmdTool2 -AdpBbuCmd -GetBbuStatus -a0
Anche se il nuovo apprendimento sembra essere terminato, il tempo per completarlo è minimo (il che non è normale).
Esempio 2:
Aug 26 01:30:23 AVATPCKVS41N05 sudo: root : TTY=pts/0 ; PWD=/root ; USER=root ; COMMAND=/opt/MegaRAID/CmdTool2/CmdTool2 -AdpBbuCmd -BbuLearn -a0
Aug 26 01:31:12 AVATPCKVS41N05 MR_MONITOR[8625]: <MRMON155> Controller ID: 0 Battery relearn pending: Battery is under charge
Aug 26 16:44:10 AVATPCKVS41N05 MR_MONITOR[8625]: <MRMON151> Controller ID: 0 Battery relearn started
Aug 26 16:45:15 AVATPCKVS41N05 MR_MONITOR[8625]: <MRMON152> Controller ID: 0 Battery relearn in progress
Aug 26 16:48:30 AVATPCKVS41N05 MR_MONITOR[8625]: <MRMON154> Controller ID: 0 Battery relearn timed out
In questo caso, il "reapprendimento" è scaduto.
8. Ricontrollare lo stato della batteria:
CmdTool2 -AdpBbuCmd -GetBbuStatus -a0
Se lo stato è OK e non vi è alcun timeout (come mostrato di seguito), non sono necessarie ulteriori azioni.
BBU status for Adapter: 0
BatteryType: CVPM02
Voltage: 9563 mV
Current: 0 mA
Temperature: 30 C
BBU Firmware Status:
Charging Status : None
Voltage : OK
Temperature : OK
Learn Cycle Requested : No
Learn Cycle Active : No
Learn Cycle Status : OK
Learn Cycle Timeout : No
I2c Errors Detected : No
...
Se il problema persiste come mostrato di seguito, creare una Service Request fornendo l'output precedente per determinare se è necessaria la sostituzione di un nodo.
BBU status for Adapter: 0
BatteryType: CVPM02
Voltage: 9563 mV
Current: 0 mA
Temperature: 30 C
BBU Firmware Status:
Charging Status : None
Voltage : OK
Temperature : OK
Learn Cycle Requested : No
Learn Cycle Active : No
Learn Cycle Status : Failed
Learn Cycle Timeout : Yes
I2c Errors Detected : No
...