VPLEX. Сбой автоматического резервного копирования метаданных из-за ошибки «Активное устройство метаданных не работоспособно»

Summary: В этой статье описывается проблема, при которой автоматическое резервное копирование метаданных завершается сбоем из-за ошибки «Активное устройство метаданных не работоспособно». В этой статье описаны шаги по исправлению этой ошибки. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Выпуск:
Происходит сбой автоматизированного возврата метаданных со следующей ошибкой: 

The active metadata device is not healthy

Из журналов клиента:

2017-12-08 23:30:11,225 WARN [DefaultCommandHandler-Thread-7977]MetadataBackupManager: The automated backup of the meta-volume could not be completed: Evaluation of <<meta-volume backup -c /clusters/cluster-2 --storage-volumes VPD83T3:600601601b003e008a7a68464d8ce511 --force>> failed.
Failed to backup the active meta-volume.
The meta-volume is unable to accept I/O.
Firmware command error.
The active metadata device is not healthy.

Из журналов микропрограммы: 

localhost:5988:null:1:<3>2018/01/12 23:59:12.776: sms/6 The automated backup of the meta-volume could not be  completed.
localhost:5988:null:1:<3>2018/01/15 23:59:19.268: sms/6 The automated backup of the meta-volume could not be  completed.
localhost:5988:null:1:<3>2018/01/16 23:59:13.657: sms/6 The automated backup of the meta-volume could not be  completed.
localhost:5988:null:1:<3>2018/01/17 23:59:18.336: sms/6 The automated backup of the meta-volume could not be  completed.

Заказчик использует одно и то же имя для метатома в обоих кластерах: 

Cluster cluster-1:

Name                              Volume Type     Operational  Health  Active  Ready  Geometry  Component  Block     Block  Capacity  Slots
--------------------------------  --------------  Status       State   ------  -----  --------  Count      Count     Size   --------  -----
--------------------------------  --------------  -----------  ------  ------  -----  --------  ---------  --------  -----  --------  -----
Log-Vol_vol                 logging-volume  ok           ok      -       -      raid-1    2          5243040   4K     20G       -
Metadatavol                          meta-volume     ok           ok      true    true   raid-1    2          20971424  4K     80G       64000
metadatavol_backup_2018Jan16_235913  meta-volume     ok           ok      false   true   raid-1    1          20971424  4K     80G       64000
Metadatavol_backup_2018Jan17_235918  meta-volume     ok           ok      false   true   raid-1    1          20971424  4K     80G       64000


Cluster cluster-2:
Name                              Volume Type     Operational  Health  Active  Ready  Geometry  Component  Block     Block  Capacity  Slots
--------------------------------  --------------  Status       State   ------  -----  --------  Count      Count     Size   --------  -----
--------------------------------  --------------  -----------  ------  ------  -----  --------  ---------  --------  -----  --------  -----
Log-Vol_vol                 logging-volume  ok           ok      -       -      raid-1    2          5243040   4K     20G       -
Metadatavol                          meta-volume     ok           ok      true    true   raid-1    2          20971424  4K     80G       64000
metadatavol_backup_2018Jan16_235913  meta-volume     ok           ok      false   true   raid-1    1          20971424  4K     80G       64000
Metadatavol_backup_2018Jan17_235918  meta-volume     ok           ok      false   true   raid-1    1          20971424  4K     80G       64000

Cause

Код пользовательского интерфейса использует имя тома для фильтрации события. В этом случае метатом в кластере 2 имеет то же имя, что и метатом кластера 1, что привело к путанице в кластере 2. 

Поскольку тома активных метаданных имеют одинаковые имена в обоих кластерах и автоматическое резервное копирование запланировано одновременно в обоих кластерах (23:30 по времени VPLEX), кластер 2 ошибочно полагает, что его amf meta restore завершается при получении Кластера-1 amf/203 event, когда на самом деле дело в том, что кластер-1 amf meta restore сделано.

Resolution

Временное решение.
Чтобы избежать этой проблемы, используйте уникальное имя для каждого метатома в каждом кластере. (кластер 1 и кластер 2)

Additional Information

Эта проблема также может проявляться в исчезновении метатома резервного копирования и/или пропуске дат резервного копирования.
VPlexcli:/> ll /clusters/*/system-volumes/

/clusters/cluster-1/system-volumes:
Name                             Volume Type     Operational  Health  Active  Ready  Geometry  Component  Block     Block  Capacity  Slots
-------------------------------  --------------  Status       State   ------  -----  --------  Count      Count     Size   --------  -----
-------------------------------  --------------  -----------  ------  ------  -----  --------  ---------  --------  -----  --------  -----
LOGVOL_01_vol                    logging-volume  ok           ok      -       -      raid-1    2          5242880   4K     20G       -
META_01                          meta-volume     ok           ok      true    true   raid-1    2          20446976  4K     78G       64000
META_01_backup_2018Jul28_203712  meta-volume     ok           ok      false   true   raid-1    1          20446976  4K     78G       64000
META_01_backup_2018Jul30_203854  meta-volume     ok           ok      false   true   raid-1    1          20446976  4K     78G       64000    <--- Note that the Jul29 backup was skipped.


/clusters/cluster-2/system-volumes:
Name                             Volume Type     Operational  Health  Active  Ready  Geometry  Component  Block     Block  Capacity  Slots
-------------------------------  --------------  Status       State   ------  -----  --------  Count      Count     Size   --------  -----
-------------------------------  --------------  -----------  ------  ------  -----  --------  ---------  --------  -----  --------  -----
LOGVOL_01_vol                    logging-volume  ok           ok      -       -      raid-1    2          5242880   4K     20G       -
META_01                          meta-volume     ok           ok      true    true   raid-1    2          20446976  4K     78G       64000
META_01_backup_2018Jul29_010011  meta-volume     ok           ok      false   true   raid-1    1          20446976  4K     78G       64000    <--- Note a meta-data backup volume is missing.

Affected Products

VPLEX, VPLEX GeoSynchrony

Products

VPLEX VS2, VPLEX VS6
Article Properties
Article Number: 000167982
Article Type: Solution
Last Modified: 12 Dec 2025
Version:  4
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.