Hardware Avamar Gen4S: Časový limit cyklu učení
Summary: Na hardwaru Avamar Gen4S cyklus učení selhává.
Symptoms
V uživatelském rozhraní Avamar nebo v protokolech se zobrazí následující chyba:
<MRMON154> Controller ID: 0 Battery relearn timed out Cause
Dodavatel tuto informaci momentálně kontroluje.
Resolution
1. Přihlaste se k serveru Avamar jako správce, zvyšte oprávnění na uživatele root a načtěte SSH .
Pokyny k načtení klíčů naleznete v článku Avamar: Jak se přihlásit k serveru Avamar a načíst různé klíče
2. Použití informací z události uživatelského rozhraní nebo požadavku na službu Dial Home:
a. Určete uzel, který chybovou zprávu vygeneroval.
b. Připojte se k tomuto uzlu jako uživatel root:
ssn 0.# --user=root
(kde 0.# je číslo fyzického uzlu)
3. Extract /var/log/messages pomocí příslušného příkazu níže:
bunzip2 /var/log/messages*
gunzip /var/log/messages*
xz --decompress /var/log/messages*
4. Zkontrolujte protokol zpráv (/var/log/messages) pro události opětovného učení baterie :
grep -i "battery relearn" /var/log/messages
Jul 29 13:37:12 AVATPCKVS41N05 MR_MONITOR[8625]: <MRMON157> Controller ID: 0 Battery relearn will start in 4 days Jul 31 13:37:48 AVATPCKVS41N05 MR_MONITOR[8625]: <MRMON158> Controller ID: 0 Battery relearn will start in 2 days Aug 1 13:37:33 AVATPCKVS41N05 MR_MONITOR[8625]: <MRMON159> Controller ID: 0 Battery relearn will start in 1 day Aug 2 08:37:13 AVATPCKVS41N05 MR_MONITOR[8625]: <MRMON160> Controller ID: 0 Battery relearn will start in 5 hours Aug 2 13:38:24 AVATPCKVS41N05 MR_MONITOR[8625]: <MRMON155> Controller ID: 0 Battery relearn pending: Battery is under charge Aug 2 13:39:28 AVATPCKVS41N05 MR_MONITOR[8625]: <MRMON151> Controller ID: 0 Battery relearn started Aug 2 13:40:36 AVATPCKVS41N05 MR_MONITOR[8625]: <MRMON152> Controller ID: 0 Battery relearn in progress Aug 2 13:40:36 AVATPCKVS41N05 MR_MONITOR[8625]: <MRMON153> Controller ID: 0 Battery relearn completed Aug 13 16:32:15 AVATPCKVS41N05 MR_MONITOR[8625]: <MRMON155> Controller ID: 0 Battery relearn pending: Battery is under charge Aug 13 16:44:10 AVATPCKVS41N05 MR_MONITOR[8625]: <MRMON151> Controller ID: 0 Battery relearn started Aug 13 16:45:15 AVATPCKVS41N05 MR_MONITOR[8625]: <MRMON152> Controller ID: 0 Battery relearn in progress Aug 13 16:48:30 AVATPCKVS41N05 MR_MONITOR[8625]: <MRMON154> Controller ID: 0 Battery relearn timed out
5. Potvrďte použitím CmdTool2 že učení selhalo, ale že baterie nezobrazuje 0 voltů:
CmdTool2 -AdpBbuCmd -GetBbuStatus -a0
BBU status for Adapter: 0
BatteryType: CVPM02
Voltage: 9563 mV
Current: 0 mA
Temperature: 30 C
BBU Firmware Status:
Charging Status : None
Voltage : OK
Temperature : OK
Learn Cycle Requested : No
Learn Cycle Active : No
Learn Cycle Status : Failed
Learn Cycle Timeout : Yes
I2c Errors Detected : No
Battery Pack Missing : No
Battery Replacementrequired : No
Remaining CapacityLow : No
Periodic Learn Required : No
Transparent Learn : No
No space to cache offload : No
Pack is about to fail & should be replaced : No
Cache Offload premium feature required : No
Module microcode update required : No
GasGuageStatus:
Fully Discharged : No
FullyCharged : Yes
Discharging : Yes
Initialized : No
Remaining Time Alarm : No
Remaining Capacity Alarm: No
Discharge Terminated : No
OverTemperature : No
Charging Terminated : Yes
Over Charged : No
Pack energy : 96 J
Capacitance : 100
Remaining reserve space : 93
Exit Code: 0x00
6. Spusťte ruční cyklus učení:
sudo CmdTool2 -AdpBbuCmd -BbuLearn -a0
7. Zkontrolujte protokol zpráv a zjistěte, jestli se cyklus učení spustil a dokončil.
Příklad 1:
Aug 26 12:15:01 AVAMAR-GRID-VAR-LOG-MESSAGE syslog-ng[3170]: Configuration reload request received, reloading configuration;
Aug 26 12:15:01 AVAMAR-GRID-VAR-LOG-MESSAGE syslog-ng[3170]: New configuration initialized;
Aug 26 12:15:11 AVAMAR-GRID-VAR-LOG-MESSAGE sudo: admin : TTY=pts/0 ; PWD=/data01/home/admin ; USER=root ; COMMAND=/opt/MegaRAID/CmdTool2/CmdTool2 -pdlist -a0 -nolog
Aug 26 12:16:10 AVAMAR-GRID-VAR-LOG-MESSAGE sudo: admin : TTY=pts/0 ; PWD=/data01/home/admin ; USER=root ; COMMAND=/opt/MegaRAID/CmdTool2/CmdTool2 -AdpBbuCmd -GetBbuStatus -a0
Aug 26 12:18:28 AVAMAR-GRID-VAR-LOG-MESSAGE sudo: admin : TTY=pts/0 ; PWD=/data01/home/admin ; USER=root ; COMMAND=/opt/MegaRAID/CmdTool2/CmdTool2 -AdpBbuCmd -BbuLearn -a0
Aug 26 12:18:31 AVAMAR-GRID-VAR-LOG-MESSAGE MR_MONITOR[5742]: Controller ID: 0 Battery relearn pending: Battery is under charge
Aug 26 12:19:36 AVAMAR-GRID-VAR-LOG-MESSAGE MR_MONITOR[5742]: Controller ID: 0 Battery relearn started
Aug 26 12:20:02 AVAMAR-GRID-VAR-LOG-MESSAGE sudo: admin : TTY=pts/0 ; PWD=/data01/home/admin ; USER=root ; COMMAND=/opt/MegaRAID/CmdTool2/CmdTool2 -AdpBbuCmd -GetBbuStatus -a0
Aug 26 12:20:44 AVAMAR-GRID-VAR-LOG-MESSAGE MR_MONITOR[5742]: Controller ID: 0 Battery relearn in progress
Aug 26 12:20:44 AVAMAR-GRID-VAR-LOG-MESSAGE MR_MONITOR[5742]: Controller ID: 0 Battery relearn completed
Aug 26 12:22:25 AVAMAR-GRID-VAR-LOG-MESSAGE sudo: admin : TTY=pts/0 ; PWD=/data01/home/admin ; USER=root ; COMMAND=/opt/MegaRAID/CmdTool2/CmdTool2 -AdpBbuCmd -GetBbuStatus -a0
I když se zdá, že přeučení skončilo, doba potřebná k dokončení je minimální (což není normální).
Příklad 2:
Aug 26 01:30:23 AVATPCKVS41N05 sudo: root : TTY=pts/0 ; PWD=/root ; USER=root ; COMMAND=/opt/MegaRAID/CmdTool2/CmdTool2 -AdpBbuCmd -BbuLearn -a0
Aug 26 01:31:12 AVATPCKVS41N05 MR_MONITOR[8625]: <MRMON155> Controller ID: 0 Battery relearn pending: Battery is under charge
Aug 26 16:44:10 AVATPCKVS41N05 MR_MONITOR[8625]: <MRMON151> Controller ID: 0 Battery relearn started
Aug 26 16:45:15 AVATPCKVS41N05 MR_MONITOR[8625]: <MRMON152> Controller ID: 0 Battery relearn in progress
Aug 26 16:48:30 AVATPCKVS41N05 MR_MONITOR[8625]: <MRMON154> Controller ID: 0 Battery relearn timed out
Zde vypršel časový limit "opětovného učení".
8. Zkontrolujte stav baterie:
CmdTool2 -AdpBbuCmd -GetBbuStatus -a0
Pokud je stav OK a není k dispozici žádný časový limit (jak je uvedeno níže), není nutná žádná další akce.
BBU status for Adapter: 0
BatteryType: CVPM02
Voltage: 9563 mV
Current: 0 mA
Temperature: 30 C
BBU Firmware Status:
Charging Status : None
Voltage : OK
Temperature : OK
Learn Cycle Requested : No
Learn Cycle Active : No
Learn Cycle Status : OK
Learn Cycle Timeout : No
I2c Errors Detected : No
...
Pokud problém přetrvává, jak je uvedeno níže, vytvořte servisní požadavek s výše uvedeným výstupem, abyste zjistili, zda je nutná výměna uzlu.
BBU status for Adapter: 0
BatteryType: CVPM02
Voltage: 9563 mV
Current: 0 mA
Temperature: 30 C
BBU Firmware Status:
Charging Status : None
Voltage : OK
Temperature : OK
Learn Cycle Requested : No
Learn Cycle Active : No
Learn Cycle Status : Failed
Learn Cycle Timeout : Yes
I2c Errors Detected : No
...