Matériel Avamar Gen4S : Expiration du cycle d’apprentissage
Summary: Le cycle de charge/décharge échoue sur le matériel Avamar Gen4S.
Symptoms
Le message d’erreur suivant s’affiche dans l’interface utilisateur d’Avamar ou dans les journaux :
<MRMON154> Controller ID: 0 Battery relearn timed out Cause
Le fournisseur est en cours d’examen.
Resolution
1. Connectez-vous à l’instance d’Avamar Server en tant qu’administrateur, accédez à root et chargez le SSH .
Pour obtenir des instructions sur le chargement des clés, reportez-vous à la section Avamar : Connexion à un serveur Avamar et chargement de différentes clés.
2. À l’aide des informations de l’événement de l’interface utilisateur ou de la demande de service Dial Home :
un. Déterminez le nœud qui a généré le message d’erreur.
b. Connectez-vous à ce nœud en tant qu’utilisateur root :
ssn 0.# --user=root
(0.# étant le numéro du nœud physique)
3. Extraire /var/log/messages à l’aide de la commande applicable ci-dessous :
bunzip2 /var/log/messages*
gunzip /var/log/messages*
xz --decompress /var/log/messages*
4. Consultez le journal des messages (/var/log/messages) pour connaître les événements de réapprentissage de la batterie :
grep -i "battery relearn" /var/log/messages
Jul 29 13:37:12 AVATPCKVS41N05 MR_MONITOR[8625]: <MRMON157> Controller ID: 0 Battery relearn will start in 4 days Jul 31 13:37:48 AVATPCKVS41N05 MR_MONITOR[8625]: <MRMON158> Controller ID: 0 Battery relearn will start in 2 days Aug 1 13:37:33 AVATPCKVS41N05 MR_MONITOR[8625]: <MRMON159> Controller ID: 0 Battery relearn will start in 1 day Aug 2 08:37:13 AVATPCKVS41N05 MR_MONITOR[8625]: <MRMON160> Controller ID: 0 Battery relearn will start in 5 hours Aug 2 13:38:24 AVATPCKVS41N05 MR_MONITOR[8625]: <MRMON155> Controller ID: 0 Battery relearn pending: Battery is under charge Aug 2 13:39:28 AVATPCKVS41N05 MR_MONITOR[8625]: <MRMON151> Controller ID: 0 Battery relearn started Aug 2 13:40:36 AVATPCKVS41N05 MR_MONITOR[8625]: <MRMON152> Controller ID: 0 Battery relearn in progress Aug 2 13:40:36 AVATPCKVS41N05 MR_MONITOR[8625]: <MRMON153> Controller ID: 0 Battery relearn completed Aug 13 16:32:15 AVATPCKVS41N05 MR_MONITOR[8625]: <MRMON155> Controller ID: 0 Battery relearn pending: Battery is under charge Aug 13 16:44:10 AVATPCKVS41N05 MR_MONITOR[8625]: <MRMON151> Controller ID: 0 Battery relearn started Aug 13 16:45:15 AVATPCKVS41N05 MR_MONITOR[8625]: <MRMON152> Controller ID: 0 Battery relearn in progress Aug 13 16:48:30 AVATPCKVS41N05 MR_MONITOR[8625]: <MRMON154> Controller ID: 0 Battery relearn timed out
5. Confirmez à l’aide de CmdTool2 que l’apprentissage a échoué, mais que la batterie n’affiche pas 0 Volts :
CmdTool2 -AdpBbuCmd -GetBbuStatus -a0
BBU status for Adapter: 0
BatteryType: CVPM02
Voltage: 9563 mV
Current: 0 mA
Temperature: 30 C
BBU Firmware Status:
Charging Status : None
Voltage : OK
Temperature : OK
Learn Cycle Requested : No
Learn Cycle Active : No
Learn Cycle Status : Failed
Learn Cycle Timeout : Yes
I2c Errors Detected : No
Battery Pack Missing : No
Battery Replacementrequired : No
Remaining CapacityLow : No
Periodic Learn Required : No
Transparent Learn : No
No space to cache offload : No
Pack is about to fail & should be replaced : No
Cache Offload premium feature required : No
Module microcode update required : No
GasGuageStatus:
Fully Discharged : No
FullyCharged : Yes
Discharging : Yes
Initialized : No
Remaining Time Alarm : No
Remaining Capacity Alarm: No
Discharge Terminated : No
OverTemperature : No
Charging Terminated : Yes
Over Charged : No
Pack energy : 96 J
Capacitance : 100
Remaining reserve space : 93
Exit Code: 0x00
6. Démarrez un cycle de charge/décharge manuel :
sudo CmdTool2 -AdpBbuCmd -BbuLearn -a0
7. Consultez le journal des messages pour voir si le cycle de charge/décharge a démarré et s’est terminé.
Exemple 1 :
Aug 26 12:15:01 AVAMAR-GRID-VAR-LOG-MESSAGE syslog-ng[3170]: Configuration reload request received, reloading configuration;
Aug 26 12:15:01 AVAMAR-GRID-VAR-LOG-MESSAGE syslog-ng[3170]: New configuration initialized;
Aug 26 12:15:11 AVAMAR-GRID-VAR-LOG-MESSAGE sudo: admin : TTY=pts/0 ; PWD=/data01/home/admin ; USER=root ; COMMAND=/opt/MegaRAID/CmdTool2/CmdTool2 -pdlist -a0 -nolog
Aug 26 12:16:10 AVAMAR-GRID-VAR-LOG-MESSAGE sudo: admin : TTY=pts/0 ; PWD=/data01/home/admin ; USER=root ; COMMAND=/opt/MegaRAID/CmdTool2/CmdTool2 -AdpBbuCmd -GetBbuStatus -a0
Aug 26 12:18:28 AVAMAR-GRID-VAR-LOG-MESSAGE sudo: admin : TTY=pts/0 ; PWD=/data01/home/admin ; USER=root ; COMMAND=/opt/MegaRAID/CmdTool2/CmdTool2 -AdpBbuCmd -BbuLearn -a0
Aug 26 12:18:31 AVAMAR-GRID-VAR-LOG-MESSAGE MR_MONITOR[5742]: Controller ID: 0 Battery relearn pending: Battery is under charge
Aug 26 12:19:36 AVAMAR-GRID-VAR-LOG-MESSAGE MR_MONITOR[5742]: Controller ID: 0 Battery relearn started
Aug 26 12:20:02 AVAMAR-GRID-VAR-LOG-MESSAGE sudo: admin : TTY=pts/0 ; PWD=/data01/home/admin ; USER=root ; COMMAND=/opt/MegaRAID/CmdTool2/CmdTool2 -AdpBbuCmd -GetBbuStatus -a0
Aug 26 12:20:44 AVAMAR-GRID-VAR-LOG-MESSAGE MR_MONITOR[5742]: Controller ID: 0 Battery relearn in progress
Aug 26 12:20:44 AVAMAR-GRID-VAR-LOG-MESSAGE MR_MONITOR[5742]: Controller ID: 0 Battery relearn completed
Aug 26 12:22:25 AVAMAR-GRID-VAR-LOG-MESSAGE sudo: admin : TTY=pts/0 ; PWD=/data01/home/admin ; USER=root ; COMMAND=/opt/MegaRAID/CmdTool2/CmdTool2 -AdpBbuCmd -GetBbuStatus -a0
Bien que le réapprentissage semble terminé, le temps nécessaire pour terminer est minime (ce qui n’est pas normal).
Exemple 2 :
Aug 26 01:30:23 AVATPCKVS41N05 sudo: root : TTY=pts/0 ; PWD=/root ; USER=root ; COMMAND=/opt/MegaRAID/CmdTool2/CmdTool2 -AdpBbuCmd -BbuLearn -a0
Aug 26 01:31:12 AVATPCKVS41N05 MR_MONITOR[8625]: <MRMON155> Controller ID: 0 Battery relearn pending: Battery is under charge
Aug 26 16:44:10 AVATPCKVS41N05 MR_MONITOR[8625]: <MRMON151> Controller ID: 0 Battery relearn started
Aug 26 16:45:15 AVATPCKVS41N05 MR_MONITOR[8625]: <MRMON152> Controller ID: 0 Battery relearn in progress
Aug 26 16:48:30 AVATPCKVS41N05 MR_MONITOR[8625]: <MRMON154> Controller ID: 0 Battery relearn timed out
Ici, le « réapprentissage » a expiré.
8. Vérifiez à nouveau l’état de la batterie :
CmdTool2 -AdpBbuCmd -GetBbuStatus -a0
Si l’état est OK et qu’il n’y a pas de délai d’expiration (comme indiqué ci-dessous), aucune autre action n’est requise.
BBU status for Adapter: 0
BatteryType: CVPM02
Voltage: 9563 mV
Current: 0 mA
Temperature: 30 C
BBU Firmware Status:
Charging Status : None
Voltage : OK
Temperature : OK
Learn Cycle Requested : No
Learn Cycle Active : No
Learn Cycle Status : OK
Learn Cycle Timeout : No
I2c Errors Detected : No
...
Si le problème persiste comme indiqué ci-dessous, créez une demande de service en fournissant le résultat ci-dessus pour déterminer si un remplacement de nœud est nécessaire.
BBU status for Adapter: 0
BatteryType: CVPM02
Voltage: 9563 mV
Current: 0 mA
Temperature: 30 C
BBU Firmware Status:
Charging Status : None
Voltage : OK
Temperature : OK
Learn Cycle Requested : No
Learn Cycle Active : No
Learn Cycle Status : Failed
Learn Cycle Timeout : Yes
I2c Errors Detected : No
...