VPLEX: Nelze dokončit automatické zálohování svazku metadat
Résumé: Tento článek pojednává o tom, jak postupovat při opětovném vytvoření záloh metadat VPLEX, když závada Call Home 0x8a4a6006 hlásí „The automated backup of the metavolume could not be completed“, nebo 0x8a4a6003 hlásí „no valid backup metavolume exist“ nebo 0x8a4a6005 hlásí „Metadata Backup does not create new backups every day“. ...
Symptômes
Co je zálohování metadat?
- Zálohy metadat jsou zálohy aktivních metadat. Zahrnují všechna nastavení konfigurace systému, která jsou v aktivních metadatech. Záložní svazky metadat představují systémový svazek v zařízení VPLEX, který je vytvořen při počáteční konfiguraci clusteru VPLEX.
- Zálohy metadat jsou snímky aktuálního aktivního svazku metadat k určitému bodu v čase. Časový bod zálohování svazku metadat se provádí na základě plánu, který byl nastaven při počáteční konfiguraci. Lze je aktivovat pouze v případě, že dojde k selhání aktuálního aktivního svazku metadat nebo jedné větve aktivního svazku metadat. Jsou určeny k tomu, aby poskytovaly dodatečnou ochranu při velkých změnách konfigurace, aktualizacích nebo migraci.
- Kdykoli se koncový uživatel setká s nedostupností dat (DU) kvůli problémům s backendovým polem, zálohy svazku metadat hrají v případě potřeby zásadní roli při obnově konfigurace VPLEX.
- Z důvodu redundance má zařízení VPLEX dva záložní svazky metadat, které se mají vytvořit ve dvou různých polích, stejně jako každá větev aktivních metadat umístěných ve dvou různých polích. Tyto dvě zálohy metadat se denně střídají podle plánu. Vždy byste měli vidět jedno datum před druhým. Pokud se zobrazují dny, které uplynuly, znamená to, že došlo k problému se spuštěním zálohovacího skriptu nebo že skript nemohl být dokončen z důvodu problému, takže zálohy nebyly provedeny.
Například: Záloha svazku metadat (A) se aktualizuje dnes, následující den se aktualizuje záloha svazku metadat (B) atd. Podrobnější informace naleznete ve výstupu níže:
VPlexcli:/clusters/cluster-1/system-volumes> ll
Name Volume Type Operational Health Active Ready Geometry Component Block Block Capacity Slots
---------------------------- ----------- Status State ------ ----- -------- Count Count Size -------- -----
---------------------------- ----------- ----------- ------ ------ ----- -------- --------- -------- ----- -------- -----
meta meta-volume ok ok true true raid-1 2 20971264 4K 80G 32000
meta_backup_2021Jul09_040009 ( A ) meta-volume ok ok false true raid-1 1 20971264 4K 80G 64000
meta_backup_2021Jul10_040007 ( B ) meta-volume ok ok false true raid-1 1 20971264 4K 80G 64000
Pokud se plánovaná záloha metadat nezdaří, vygeneruje se požadavek Dial-Home, jak je znázorněno níže:
Ukázka požadavku Dial-Home, který je odeslán v případě tohoto problému:
1. <SymptomCode>0x8a4a6006</SymptomCode>
<Category>Status</Category>
<Severity>Error</Severity>
<Status>Failed</Status>
<Component>CLUSTER</Component>
<ComponentID>SMS</ComponentID>
<SubComponent>CLUSTER-1</SubComponent>
<SubComponentID></SubComponentID>
<CallHome>Yes</CallHome>
<FirstTime>2012-07-10T00:00:01.334Z</FirstTime>
<LastTime>2012-07-09T00:00:01.334Z</LastTime>
<Count>1</Count>
<EventData><![CDATA[The automated backup of the meta-volume could not be completed.
[Versions:<code formats listed>] RCA: The automated backup of the meta-volume could not be completed.]]>
</EventData>
<Description>
The automated backup of the meta-volume could not be completed.
2. <SymptomCode>0x8a4a6003</SymptomCode>
<Severity>Error</Severity>
<Status>Failed</Status>
<Component>CLUSTER</Component>
<ComponentID>SMS</ComponentID>
<SubComponent>CLUSTER-1</SubComponent>
<SubComponentID></SubComponentID>
<CallHome>Yes</CallHome>
<FirstTime>2021-09-07T03:00:12.191Z</FirstTime>
<LastTime>2021-09-07T03:00:12.191Z</LastTime>
<Count>1</Count>
<EventData><![CDATA[No valid backup meta-volumes exist. [Versions:[code formats listed] RCA: The automated backup of metadata cannot identify the devices to be used. This is because existing backups cannot be located. The backups are rotated through being destroyed in order to be re-used.]]>
</EventData>
<Description>No valid backup meta-volumes exist.
<Status>Failed</Status>
3. <SymptomCode>0x8a4a6005</SymptomCode>
<Severity>Error</Severity>
<Status>Failed</Status>
<Component>CLUSTER</Component>
<ComponentID>unknown</ComponentID>
<SubComponent>sms</SubComponent>
<SubComponentID></SubComponentID>
<CallHome>Yes</CallHome>
<FirstTime>2017-12-04T00:00:35.420Z</FirstTime>
<LastTime>2018-09-06T23:59:02.813Z</LastTime>
<Count>1</Count>
<EventData><![CDATA[A meta-volume backup could not be destroyed. Důvod: The meta-volume backup "<name of the affected metadata backup>" could not be destroyed: A meta-volume backup "<name of the affected metadata backup>" is not healthy enough to be destroyed. [Versions:[code formats listed>] RCA: Backup meta-volume could not be destroyed. Remedy: Confirm that the volumes configured to be used for the backup are in a healthy state. If the volumes are unhealthy, create new automated metavolume backups by: 1. Destroy the existing backups using the 'meta-volume destroy' command. 2. Unclaim those volumes if they are to be re-used with the 'storage-volume unclaim' command. 3. Use the 'configuration metadata-backup' command to reconfigure the backups. If the previous volumes used were not healthy enough to destroy, create the backups with new healthy devices.
]]></EventData>
<Description><![CDATA[A meta-volume backup could not be destroyed.
Cause
Zálohování metadat se nemusí podařit zachytit kopii k určitému bodu v čase kvůli tomu, že svazek používaný neúspěšnou zálohou metadat není v pořádku v backendovém poli, nebo pokud došlo k možnému problému
s připojením mezi zařízením VPLEX a backendovým polem, kde se nachází záložní svazek.
2. Kód příznaku 0x8a4a6003:
Přejmenování součástí záložního svazku metadat není povoleno.
/clusters/cluster-1/system-volumes:
Name Volume Type Operational Health Active Ready Geometry Component Block Block Capacity Slots
------------------------------- ----------- Status State ------ ----- -------- Count Count Size -------- -----
------------------------------- ----------- ----------- ------ ------ ----- -------- --------- -------- ----- -------- -----
C1_Meta meta-volume ok ok true true raid-1 2 20971264 4K 80G 64000
META_VOLUME_backup_2021Jun11_044501 meta-volume ok ok false true raid-1 1 20971264 4K 80G 64000
META_VOLUME_backup_2021Jun12_044501 meta-volume ok ok false true raid-1 1 20971264 4K 80G 64000
Zde je příklad správného záložního svazku metadat. Všimněte si, že komponenta stále používá ID
VPD83T3: na úrovni kontextu komponenty záložního svazku metadat:
Name Slot Type Operational Health Capacity
---------------------------------------- Number -------------- Status State --------
---------------------------------------- ------ -------------- ----------- ------ --------
VPD83T3:60000970000xxxxxxxxxxxxxxxxx3030 0 storage-volume ok ok 120G
/--------------------------------------------------------\
Měl by se zobrazit tento identifikátor systémového svazku
Zde je příklad chybného záložního svazku metadat, kdy bylo ID systémového svazku na úrovni kontextu komponenty změněno z ID systému VPD83T3 na srozumitelný název „C1_MetaBackup_1“:
VPlexcli:/clusters/cluster-1/system-volumes/META_VOLUME_backup_2018Jun11_044501/components> ll
Name Slot Type Operational Health Capacity
------------------ Number -------------- Status State --------
------------------ -------- -------------- ------------- -------- --------
C1_MetaBackup_1 0 storage-volume ok ok 120G
/--------------------------\
Na úrovni komponent nejsou povoleny srozumitelné názvy,
skript správce záloh nezná záložní svazek metadat
s tímto názvem, pouze systémové ID použité
při nastavení záložního svazku.
3. Kód příznaku 0x8a4a6005:
Při kontrole záloh metadat se může stát, že datum zálohy není aktuální.
Příklad kontroly aktuálního data v zařízení VPLEX:
VPlexcli:/> date
Fri Sep 7 13:30:43 UTC YYYY <<<<všimněte si, že aktuální datum v tomto příkladu je 7. září
Dále zkontrolujte data, kdy byly jednotlivé záložní svazky naposledy spuštěny pod systémovými svazky.
Porovnejte data uvedená v názvech záložních svazků s výše uvedeným datem
(datum bylo pro příklad zvětšeno):
VPlexcli:/> ll /clusters/cluster-1/system-volumes/
/clusters/cluster-1/system-volumes:
Name Volume Type Operational Health Active Ready Geometry Block Block Capacity Slots
------------------------------- -------------- Status State ------ ----- -------- Count Size -------- -----
------------------------------- -------------- ----------- ------ ------ ----- -------- -------- ----- -------- -----
c1_meta meta-volume ok ok true true raid-1 20971264 4K 80G 32000
c1_meta_backup_2018Aug01_030002 meta-volume ok ok false true raid-1 20971264 4K 80G 32000
c1_meta_backup_2018Aug02_030003 meta-volume ok ok false true raid-1 20971264 4K 80G 32000
Při pohledu na úroveň kontextu úložného pole VPLEX jsou v úložném poli, které hostuje záložní svazek, jednotky LUN, které vykazují „visibility“ jako „none“ a „cennectivity-status“ jako „error“.
/clusters/cluster-1/storage-elements/storage-arrays/EMC-CLARiiON-CKM00000000000/logical
units/VPD83T3:6006016099xxxxxxxxxxxxxxxxx1e111:
Name Value
---------------------- --------------------
active-aao-controller [CKM00000000000.SPB]
active-aao-visibility []
alua-support none
connectivity-status error <<<< problém s komunikací/připojením mezi zařízením VPLEX a polem
luns []
passive-aan-controller [CKM00000000000.SPA]
passive-aan-visibility []
storage-volume -
visibility none <<<<< nezobrazuje backendový svazek
To znamená, že došlo k problému s připojením mezi diskovým polem a zařízením VPLEX, což by způsobilo problém, pokud by k němu došlo během spuštění skriptu automatického zálohování, protože by kvůli problému s připojením nebylo možné zobrazit svazek úložiště z pole.
Résolution
A. Kód příznaku 0x8a4a6003 a 0x8a4a6006:
POZNÁMKA: Pokus o přejmenování komponenty pomocí VPD83T3: ID má problémy s dvojtečkou „:“ a nefunguje.
Problém vyřešíte pomocí postupu v zástupném řešení:
Zástupné řešení:
- Pokud má zařízení VPLEX konfiguraci Metro, ujistěte se, že jste provedli zástupné řešení na clusteru, který problém nahlásil, pro případ, že byste potřebovali odstranit záložní svazky metadat.
(viz ukázkové podrobnosti funkce Call Home v části Problém).
ll /clusters/cluster-<id>/system-volumes,
POZNÁMKA: Příkaz můžete zadat jako „ll /clusters/*/system-volumes“ a zobrazí se podrobnosti o systémových svazcích pro všechny clustery v konfiguraci. Pokud se jedná o zařízení VPLEX-Local,
zobrazí se informace pouze pro cluster-1.
Ukázkový výstup pomocí clusteru-1:
Name Volume Type Operational Health Active Ready Geometry Component Block Block Capacity Slots
------------------------------- ----------- Status State ------ ----- -------- Count Count Size -------- -----
------------------------------- ----------- ----------- ------ ------ ----- -------- --------- -------- ----- -------- -----
C1_Meta meta-volume ok ok true true raid-1 2 20971264 4K 80G 64000
Meta_backup_2018Sep07_154626 meta-volume ok ok false true raid-1 1 20971264 4K 80G 64000
Meta_backup_2018Sep07_154649 meta-volume ok ok false true raid-1 1 20971264 4K 80G 64000
které splňují požadavek na zálohování metadat:
VPlexcli:/> configuration show-meta-volume-candidates
Name Capacity Vendor IO Status Type Array Name
---------------------------------------- -------- -------- --------- ----------- ---------------------
VPD83T3:60000970000XXXXXXXXXXXXXXXXXXXXX 187G EMC alive traditional EMC-SYMMETRIX-XXXXXXXXX
VPD83T3:60000970000XXXXXXXXXXXXXXXXXXXXX 98.5G EMC alive traditional EMC-SYMMETRIX-XXXXXXXXX
Například:
VPlexcli:/clusters/cluster-1/system-volumes> meta-volume destroy Meta_backup_2018Sep07_154649
3. Spusťte příkaz „schedule list“ z rozhraní VPlexcli pro zobrazení aktuálního plánu „metadata backup local“
a čísla úlohy s ním spojeného.
Například:
VPlexcli:/> schedule list
[0] 30 13 * * 3 syrcollect
[2] 23 30 * * * metadata backup local
4. Odstraňte plán „metadata backup local“ spuštěním příkazu „schedule remove [job ID]“ uvedeného
v kroku (3).
Removed scheduled job 2.
5. Uvolněte oba dřívější záložní svazky metadat pomocí níže uvedeného příkazu.
Například s názvem zálohy metadat:
VPlexcli: clusters/cluster-1/storage-elements/storage-volumes> unclaim Meta_backup_2018Sep07_154649
Příklad čísla VPD:
VPD83T3:60000970000292XXXXXXXXXXXXXXXXXXXXX
VPlexcli: clusters/cluster-1/storage-elements/storage-volumes> unclaim VPD83T3:60000970000284XXXXXXXXXXXXXXXXXXXXX
*Poznámka: Můžete vidět, že naplánovaný čas je již nastaven, pokud chcete tento naplánovaný čas zachovat,
zadejte „Y“, pokud ne, zadejte „N“ a později ve skriptu budete vyzváni k zadání nového času, kdy chcete
spustit zálohy metadat.
Příklad konfigurace zálohování metadat:
VPlexcli:/clusters/cluster-1/system-volumes> configuration metadata-backup
A back up of the meta-data is already scheduled to occur everyday at
4:45 (UTC).
Do you want change the existing schedule? (Y/N): Y <<< Pomocí Y zachováte aktuální čas
Configuring Meta-data Backups
To configure meta-data backups you will need to select two unclaimed
volumes (78G or greater), preferably on two different arrays. Backups
will occur automatically each day, at a time you specify. Poznámka:
All times are UTC and are not based on the local time.
VPLEX is currently configured to backup metadata on the following
volumes:
VPD83T3:6000097000029XXXXXXXXXXXXXXXXXXXXX,VPD83T3:6006048000029030XXXXXXXXXXXXXXXXXXXXX
Would you like to change the volumes on which to backup the metadata? [no]: Yes
Available Volumes for Meta-data Backup
Name Capacity Vendor IO Status Type Array Name
---------------------------------------- -------- -------- --------- ----------- -----------------------
VPD83T3:6000097000029XXXXXXXXXXXXXXXXXXXXX 120G EMC alive traditional EMC-SYMMETRIX-<serial number>
VPD83T3:6006048000029030XXXXXXXXXXXXXXXXXX 120G EMC alive traditional EMC-SYMMETRIX-<serial number>
Please select volumes for meta-data backup, preferably from two
different arrays (volume1,volume2):VPD83T3:6006048000029030XXXXXXXXXXXXXXXXXXXXX,VPD83T3:6006048000029030XXXXXXXXXXXXXXXXXXXXX
VPLEX is configured to back up meta-data every day at 04:45 (UTC).
Would you like to change the time the meta-data is backed up? [no]: N
You have chosen to configure the backup of the meta-data. Poznámka:
All times are UTC and are not based on the local time.
Review and Finish
Would you like to run the setup process now? [yes]: yes
Scheduling the backup of metadata...
Performing metadata backup (This will take a few minutes)
Successfully performed the initial backing up of metadata
Successfully scheduled the backing up of metadata
Successfully scheduled the metadata backup
The metadata backup has been successfully scheduled.
7. Chcete-li zjistit, zda byly vytvořeny nové zálohy metadat
a jak je systém pojmenoval, spusťte v příkazovém řádku VPlexcli příkaz „ll clusters/cluster-<id>/system-volumes“.
Ukázkový výstup:
VPlexcli:/> ll /clusters/cluster-1/system-volumes/
/clusters/cluster-1/system-volumes:
Name Volume Type Operational Health Active Ready Geometry Component Block Block Capacity Slots
------------------------------- ----------- Status State ------ ----- -------- Count Count Size -------- -----
------------------------------- ----------- ----------- ------ ------ ----- -------- --------- -------- ----- -------- -----
C1_Meta meta-volume ok ok true true raid-1 2 20971264 4K 80G 64000
C1_Meta_backup_2018Oct07_123208 meta-volume ok ok false true raid-1 1 20971264 4K 80G 64000
C1_Meta_backup_2018Oct07_123208 meta-volume ok ok false true raid-1 1 20971264 4K 80G 64000
8. Poté znovu spusťte příkaz schedule list a ověřte, že je část „metadatabackup local“ uvedena
se správným časem, který jste nastavili pro spuštění každý den.
VPlexcli:/> schedule list
[0] 56 18 * * * syrcollect
[1] 45 4* * * metadatabackup local
9. Nyní, když jste odebrali staré svazky záloh metadat a znovu vytvořili nové,
sledujte zálohy několik dní, abyste měli jistotu, že běží podle plánu. Skript se bude střídat
mezi dvěma záložními svazky při každém spuštění záložního skriptu, takže by se měla zobrazit jedna záloha
s datem připadajícím na následující den. Čas, po který se zálohování spustí, je připojen k názvu zálohy a je v pořádku,
pokud není přesně v nastaveném čase, může se trochu lišit, to je normální. Pokud nové zálohy spouštíte poprvé, měli byste vidět, že alespoň
jeden záložní svazek má nové datum.
Příklad:
VPlexcli:/> ll /clusters/*/system-volumes/
/clusters/cluster-1/system-volumes:
Name Volume Type Operational Health Active Ready Geometry Component Block Block Capacity Slots
------------------------------- -------------- Status State ------ ----- -------- Count Count Size -------- -----
------------------------------- -------------- ----------- ------ ------ ----- -------- --------- -------- ----- -------- -----
C1Logging_vol logging-volume ok ok - - raid-0 1 2621440 4K 10G -
C1_Meta meta-volume ok ok true true raid-1 2 20971264 4K 80G 64000
C1_Meta_backup_2018Oct08_044532 meta-volume ok ok false true raid-1 1 20971264 4K 80G 64000
C1_Meta_backup_2018Oct07_123208 meta-volume ok ok false true raid-1 1 20971264 4K 80G 64000
|
Informations supplémentaires
Ukázka výstupu, abyste viděli, jaké svazky byly k dispozici pro použití k vytvoření záložních svazků metadat
VPlexcli:/clusters/cluster-1/storage-elements/storage-volumes> configuration show-meta-volume-candidates
Name Capacity Vendor IO Status Type Array Name
---------------------------------------- -------- -------- --------- ----------- ---------------------------
VPD83T3:60060160c9c02cXXXXXXXXXXXX 80G DGC alive traditional EMC-CLARiiON-<serial number>
VPD83T3:60060160c9c02c0XXXXXXXXXXX 80G DGC alive traditional EMC-CLARiiON-<serial number>
Sample output when you want to change the time the backups will run:
VPlexcli:/> configuration metadata-backup
A back up of the meta-data is already scheduled to occur everyday at 4:15 (UTC). Do you want change the existing schedule? (Y/N): y
Configuring Meta-data Backups
To configure meta-data backups you will need to select two unclaimed
volumes (78G or greater), preferably on two different arrays. Backups will occur automatically each day, at a time you specify. Poznámka: All times are UTC and are not based on the local time.
Available Volumes for Meta-data Backup
Name Capacity Vendor IO Status Type Array Name
---------------------------------------- -------- -------- --------- ----------- ---------------------------
VPD83T3:60060160c9c02cXXXXXXXXXXXX 80G DGC alive traditional EMC-CLARiiON-<serial number>
VPD83T3:60060160c9c02c0XXXXXXXXXXXX 80G DGC alive traditional EMC-CLARiiON-<serial number>
Please select volumes for meta-data backup, preferably from two different arrays (volume1,volume2):VPD83T3:60060160c9c02c00XXXXXXXXXXXX,VPD83T3:60060160c9c02c0058XXXXXXXXXXXX
VPLEX is configured to back up meta-data every day at 04:15 (UTC).
Would you like to change the time the meta-data is backed up? [no]: yes << [Here is where you're asked again if want to change the time the backups will run]
What hour of the day (UTC) should the meta-data be backed up? (0..23): 23
What minute of the hour should the meta-data be backed up? (0..59): 00
VPLEX is configured to back up meta-data every day at 23:00 (UTC).
Would you like to change the time the meta-data is backed up? [no]: <<
[use the default selection this time to keep the newly set time by pressing the Enter/Return key]
You have chosen to configure the backup of the meta-data. Poznámka:
All times are UTC and are not based on the local time.
Review and Finish
Review the configuration information below. If the values are correct,
enter yes (or simply accept the default and press Enter) to start the
setup process. If the values are not correct, enter no to go back and
make changes or to exit the setup.
Meta-data Backups
Meta-data will be backed up every day at 23:00.
The following volumes will be used for the backup
:VPD83T3:60060160c9c02XXXXXXXXXXXX,VPD83T3:60060160c9c02c005XXXXXXXXXXXX
Would you like to run the setup process now? [yes]: <<
use the default selection, just press the Enter/Return key
Scheduling the backup of metadata...
Performing metadata backup (This will take a few minutes)
Successfully performed the initial backing up of metadata
Successfully scheduled the backing up of metadata
Successfully scheduled the metadata backup
The metadata backup has been successfully scheduled.