VPLEX: Automatyczna kopia zapasowa metadanych nie powiodła się, ponieważ "urządzenie aktywnych metadanych nie jest w dobrej kondycji"

Summary: W tym artykule omówiono problem polegający na tym, że automatyczna kopia zapasowa metadanych kończy się niepowodzeniem z powodu błędu "Aktywne urządzenie metadanych nie jest w dobrej kondycji". Ten artykuł zawiera czynności naprawcze w celu rozwiązania tego błędu. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Problem:
Automatyczny powrót metadanych kończy się niepowodzeniem z poniższym błędem: 

The active metadata device is not healthy

Z poziomu dzienników klienta:

2017-12-08 23:30:11,225 WARN [DefaultCommandHandler-Thread-7977]MetadataBackupManager: The automated backup of the meta-volume could not be completed: Evaluation of <<meta-volume backup -c /clusters/cluster-2 --storage-volumes VPD83T3:600601601b003e008a7a68464d8ce511 --force>> failed.
Failed to backup the active meta-volume.
The meta-volume is unable to accept I/O.
Firmware command error.
The active metadata device is not healthy.

Z dzienników oprogramowania wewnętrznego: 

localhost:5988:null:1:<3>2018/01/12 23:59:12.776: sms/6 The automated backup of the meta-volume could not be  completed.
localhost:5988:null:1:<3>2018/01/15 23:59:19.268: sms/6 The automated backup of the meta-volume could not be  completed.
localhost:5988:null:1:<3>2018/01/16 23:59:13.657: sms/6 The automated backup of the meta-volume could not be  completed.
localhost:5988:null:1:<3>2018/01/17 23:59:18.336: sms/6 The automated backup of the meta-volume could not be  completed.

Klient używa tej samej nazwy metawoluminu w obu klastrach: 

Cluster cluster-1:

Name                              Volume Type     Operational  Health  Active  Ready  Geometry  Component  Block     Block  Capacity  Slots
--------------------------------  --------------  Status       State   ------  -----  --------  Count      Count     Size   --------  -----
--------------------------------  --------------  -----------  ------  ------  -----  --------  ---------  --------  -----  --------  -----
Log-Vol_vol                 logging-volume  ok           ok      -       -      raid-1    2          5243040   4K     20G       -
Metadatavol                          meta-volume     ok           ok      true    true   raid-1    2          20971424  4K     80G       64000
metadatavol_backup_2018Jan16_235913  meta-volume     ok           ok      false   true   raid-1    1          20971424  4K     80G       64000
Metadatavol_backup_2018Jan17_235918  meta-volume     ok           ok      false   true   raid-1    1          20971424  4K     80G       64000


Cluster cluster-2:
Name                              Volume Type     Operational  Health  Active  Ready  Geometry  Component  Block     Block  Capacity  Slots
--------------------------------  --------------  Status       State   ------  -----  --------  Count      Count     Size   --------  -----
--------------------------------  --------------  -----------  ------  ------  -----  --------  ---------  --------  -----  --------  -----
Log-Vol_vol                 logging-volume  ok           ok      -       -      raid-1    2          5243040   4K     20G       -
Metadatavol                          meta-volume     ok           ok      true    true   raid-1    2          20971424  4K     80G       64000
metadatavol_backup_2018Jan16_235913  meta-volume     ok           ok      false   true   raid-1    1          20971424  4K     80G       64000
Metadatavol_backup_2018Jan17_235918  meta-volume     ok           ok      false   true   raid-1    1          20971424  4K     80G       64000

Cause

Kod interfejsu użytkownika używa nazwy woluminu do odfiltrowania zdarzenia. W tym przypadku metawolumin w klastrze 2 ma taką samą nazwę jak metawolumin klastra 1, co zmyliło klaster-2. 

Ponieważ woluminy aktywnych metadanych mają tę samą nazwę w obu klastrach, a automatyczne kopie zapasowe są planowane jednocześnie w obu klastrach (23:30 czasu VPLEX), dlatego klaster 2 błędnie uważa, że jego amf meta restore jest wykonywana po odebraniu klastra 1 amf/203 event, podczas gdy w rzeczywistości jest to fakt, że klaster-1 amf meta restore jest zrobione.

Resolution

Obejście problemu:
Aby uniknąć tego problemu, należy użyć unikatowej nazwy dla każdego metawoluminu w każdym klastrze. (Klaster-1 i Klaster-2)

Additional Information

Ten problem może również objawiać się znikającym metawoluminem kopii zapasowej i/lub brakującymi datami kopii zapasowych.
VPlexcli:/> ll /clusters/*/system-volumes/

/clusters/cluster-1/system-volumes:
Name                             Volume Type     Operational  Health  Active  Ready  Geometry  Component  Block     Block  Capacity  Slots
-------------------------------  --------------  Status       State   ------  -----  --------  Count      Count     Size   --------  -----
-------------------------------  --------------  -----------  ------  ------  -----  --------  ---------  --------  -----  --------  -----
LOGVOL_01_vol                    logging-volume  ok           ok      -       -      raid-1    2          5242880   4K     20G       -
META_01                          meta-volume     ok           ok      true    true   raid-1    2          20446976  4K     78G       64000
META_01_backup_2018Jul28_203712  meta-volume     ok           ok      false   true   raid-1    1          20446976  4K     78G       64000
META_01_backup_2018Jul30_203854  meta-volume     ok           ok      false   true   raid-1    1          20446976  4K     78G       64000    <--- Note that the Jul29 backup was skipped.


/clusters/cluster-2/system-volumes:
Name                             Volume Type     Operational  Health  Active  Ready  Geometry  Component  Block     Block  Capacity  Slots
-------------------------------  --------------  Status       State   ------  -----  --------  Count      Count     Size   --------  -----
-------------------------------  --------------  -----------  ------  ------  -----  --------  ---------  --------  -----  --------  -----
LOGVOL_01_vol                    logging-volume  ok           ok      -       -      raid-1    2          5242880   4K     20G       -
META_01                          meta-volume     ok           ok      true    true   raid-1    2          20446976  4K     78G       64000
META_01_backup_2018Jul29_010011  meta-volume     ok           ok      false   true   raid-1    1          20446976  4K     78G       64000    <--- Note a meta-data backup volume is missing.

Affected Products

VPLEX, VPLEX GeoSynchrony

Products

VPLEX VS2, VPLEX VS6
Article Properties
Article Number: 000167982
Article Type: Solution
Last Modified: 12 Dec 2025
Version:  4
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.