VPLEX: O backup automatizado de metadados falha porque "o dispositivo de metadados ativo não está íntegro"

Summary: Este artigo aborda o problema em que o backup automatizado de metadados falha devido a "O dispositivo de metadados ativo não está íntegro". Este artigo fornece as etapas de correção para resolver esse erro. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Questão:
O backup automatizado de metadados está falhando com o erro abaixo: 

The active metadata device is not healthy

Nos logs do Client:

2017-12-08 23:30:11,225 WARN [DefaultCommandHandler-Thread-7977]MetadataBackupManager: The automated backup of the meta-volume could not be completed: Evaluation of <<meta-volume backup -c /clusters/cluster-2 --storage-volumes VPD83T3:600601601b003e008a7a68464d8ce511 --force>> failed.
Failed to backup the active meta-volume.
The meta-volume is unable to accept I/O.
Firmware command error.
The active metadata device is not healthy.

Nos logs do firmware: 

localhost:5988:null:1:<3>2018/01/12 23:59:12.776: sms/6 The automated backup of the meta-volume could not be  completed.
localhost:5988:null:1:<3>2018/01/15 23:59:19.268: sms/6 The automated backup of the meta-volume could not be  completed.
localhost:5988:null:1:<3>2018/01/16 23:59:13.657: sms/6 The automated backup of the meta-volume could not be  completed.
localhost:5988:null:1:<3>2018/01/17 23:59:18.336: sms/6 The automated backup of the meta-volume could not be  completed.

O cliente está usando o mesmo nome para o metavolume em ambos os clusters: 

Cluster cluster-1:

Name                              Volume Type     Operational  Health  Active  Ready  Geometry  Component  Block     Block  Capacity  Slots
--------------------------------  --------------  Status       State   ------  -----  --------  Count      Count     Size   --------  -----
--------------------------------  --------------  -----------  ------  ------  -----  --------  ---------  --------  -----  --------  -----
Log-Vol_vol                 logging-volume  ok           ok      -       -      raid-1    2          5243040   4K     20G       -
Metadatavol                          meta-volume     ok           ok      true    true   raid-1    2          20971424  4K     80G       64000
metadatavol_backup_2018Jan16_235913  meta-volume     ok           ok      false   true   raid-1    1          20971424  4K     80G       64000
Metadatavol_backup_2018Jan17_235918  meta-volume     ok           ok      false   true   raid-1    1          20971424  4K     80G       64000


Cluster cluster-2:
Name                              Volume Type     Operational  Health  Active  Ready  Geometry  Component  Block     Block  Capacity  Slots
--------------------------------  --------------  Status       State   ------  -----  --------  Count      Count     Size   --------  -----
--------------------------------  --------------  -----------  ------  ------  -----  --------  ---------  --------  -----  --------  -----
Log-Vol_vol                 logging-volume  ok           ok      -       -      raid-1    2          5243040   4K     20G       -
Metadatavol                          meta-volume     ok           ok      true    true   raid-1    2          20971424  4K     80G       64000
metadatavol_backup_2018Jan16_235913  meta-volume     ok           ok      false   true   raid-1    1          20971424  4K     80G       64000
Metadatavol_backup_2018Jan17_235918  meta-volume     ok           ok      false   true   raid-1    1          20971424  4K     80G       64000

Cause

O código da interface do usuário usa o nome do volume para filtrar o evento. Nesse caso, o metavolume no cluster-2 tem o mesmo nome do metavolume cluster-1, o que confundiu o cluster-2. 

Como os volumes de metadados ativos têm o mesmo nome em ambos os clusters e os backups automatizados são agendados simultaneamente em ambos os clusters (23:30 no horário do VPLEX), o cluster-2 erroneamente pensa que seu amf meta restore é concluída ao receber o cluster-1 amf/203 event, quando na realidade é o fato de que o cluster-1 amf meta restore está feito.

Resolution

Solução temporária:
Para evitar esse problema, use um nome exclusivo para cada metavolume em cada cluster. (Cluster-1 e Cluster-2)

Additional Information

Esse problema também pode se manifestar com o desaparecimento do metavolume de backup e/ou datas de backup ausentes.
VPlexcli:/> ll /clusters/*/system-volumes/

/clusters/cluster-1/system-volumes:
Name                             Volume Type     Operational  Health  Active  Ready  Geometry  Component  Block     Block  Capacity  Slots
-------------------------------  --------------  Status       State   ------  -----  --------  Count      Count     Size   --------  -----
-------------------------------  --------------  -----------  ------  ------  -----  --------  ---------  --------  -----  --------  -----
LOGVOL_01_vol                    logging-volume  ok           ok      -       -      raid-1    2          5242880   4K     20G       -
META_01                          meta-volume     ok           ok      true    true   raid-1    2          20446976  4K     78G       64000
META_01_backup_2018Jul28_203712  meta-volume     ok           ok      false   true   raid-1    1          20446976  4K     78G       64000
META_01_backup_2018Jul30_203854  meta-volume     ok           ok      false   true   raid-1    1          20446976  4K     78G       64000    <--- Note that the Jul29 backup was skipped.


/clusters/cluster-2/system-volumes:
Name                             Volume Type     Operational  Health  Active  Ready  Geometry  Component  Block     Block  Capacity  Slots
-------------------------------  --------------  Status       State   ------  -----  --------  Count      Count     Size   --------  -----
-------------------------------  --------------  -----------  ------  ------  -----  --------  ---------  --------  -----  --------  -----
LOGVOL_01_vol                    logging-volume  ok           ok      -       -      raid-1    2          5242880   4K     20G       -
META_01                          meta-volume     ok           ok      true    true   raid-1    2          20446976  4K     78G       64000
META_01_backup_2018Jul29_010011  meta-volume     ok           ok      false   true   raid-1    1          20446976  4K     78G       64000    <--- Note a meta-data backup volume is missing.

Affected Products

VPLEX, VPLEX GeoSynchrony

Products

VPLEX VS2, VPLEX VS6
Article Properties
Article Number: 000167982
Article Type: Solution
Last Modified: 12 Dec 2025
Version:  4
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.