PowerFlex: Opětovná inicializace replikace po přerušení replikace
Summary: Skupina konzistence replikace může být odstraněna z různých důvodů a replikace mezi zdrojovou a cílovou lokalitou se zastaví. Společným důvodem pro všechny případy je ukončení kapacity Žurnálu. ...
Symptoms
V příkazovém řádku se zobrazí varovné zprávy "svazky ve skupinách s přerušenou konzistencí replikace".
# scli --query_all_replication_pairs
query_all_replication_pairs returned 0 Replication Pairs.
WARNING: The System contains 2 volumes in broken replication consistency groups
# scli --query_all_replication_consistency_groups
Protection Domain aef4ce8300000000 Name: RHEL7-PD
WARNING: The Protection Domain contains 2 volumes in broken replication consistency groups
V uživatelském rozhraní se u stavu skupin konzistence replikace (RCG) zobrazuje následující chyba "RCG byly odstraněny systémem".

Účelem těchto souborů protokolu je umožnit plynulou opětovnou inicializaci replikace mezi lokalitami. Soubory protokolu se používají k rychlému restartování procesu replikace po vyřešení příčiny přerušení.
Cause
Příklady důvodů, které mohou způsobit přerušení replikace:
a. Dlouhé selhání sítě mezi zdrojovou a cílovou lokalitou
b. Náhlé snížení kapacity ve zdrojové nebo cílové lokalitě – například ve scénáři nedostupnosti dat (DU)
Po přerušení replikace MDM automaticky odstraní všechny skupiny konzistence replikace (RCG) mezi zdrojovým a cílovým umístěním. A generuje soubory protokolů replikace, které obsahují všechny informace související se smazanými RCG.
Resolution
a. Vyhledejte automaticky generované soubory protokolu přerušení replikace v primárním MDM v následujícím formátu:
Automaticky DeletedOnEndOfJournalCapacityRplCg_<RCG_ID>_<RCG_name>
Příklad:
# cd /opt/emc/scaleio/mdm/logs
# ls -l AutoDelete*
-rw-r--r-- 1 root root 953 Apr 14 12:15 AutoDeletedOnEndOfJournalCapacityRplCg_4ca1bc9600000000_Rep_Beta1
b. Ověřte, zda je opraven problém, který způsobil přerušení replikace.
c. Znovu inicializujte replikaci jednou z následujících dvou metod: Pomocí skriptu nebo ručně.
Pomocí skriptu:
-
Vygenerujte jeden soubor, který obsahuje všechny relevantní příkazy z automaticky generovaných souborů protokolu, aby bylo možné replikaci znovu inicializovat
Příklad:
for i in `ls /opt/emc/scaleio/mdm/logs/AutoDeletedOnEndOfJournalCapacity*`;do sed -e '1,/Recreation CLIs/d' $i >> full_replication_restore_$(date +%s); done -
Ověřte, že byl soubor úspěšně vytvořen a jeho obsah
Příklad:
[root@112AX-7 logs]# cat full_replication_restore_1587387678 scli --add_replication_consistency_group --replication_consistency_group_name rcg_sanity --destination_system_object_id 416af83800000000 --protection_domain_id b3dd0a5900000000 --remote_protection_domain_id 4ff0744e00000000 --rpo 60 --target_volume_access_mode no_access scli --add_replication_pair --replication_consistency_group_name rcg_sanity --source_volume_id 0da61f0d00000003 --destination_volume_id 1981bbaf00000005 --copy_type full scli --add_replication_consistency_group --replication_consistency_group_name rcg_SANITY2 --destination_system_object_id 416af83800000000 --protection_domain_id b3dd0a5900000000 --remote_protection_domain_id 4ff0744e00000000 --rpo 60 --target_volume_access_mode no_access scli --add_replication_pair --replication_consistency_group_name rcg_SANITY2 --source_volume_id 0da61f2500000000 --destination_volume_id 1981bbb000000006 --copy_type full scli --add_replication_consistency_group --replication_consistency_group_name rcg_sanity3 --destination_system_object_id 416af83800000000 --protection_domain_id b3dd0a5900000000 --remote_protection_domain_id 4ff0744e00000000 --rpo 60 --target_volume_access_mode no_access scli --add_replication_pair --replication_consistency_group_name rcg_sanity3 --source_volume_id 0da61f2600000001 --destination_volume_id 1981bbb100000007 --copy_type full [root@112AX-7 logs]# -
Nastavte vygenerovaný soubor jako spustitelný, poté se přihlaste jako správce k primárnímu uzlu MDM a vytvořený soubor spusťte.
Příklad:
# scli --login --username admin --password xxxxxxxxxx Logged in. User role is SuperUser. System ID is xxxxxxxxxxxxxxx # # chmod +x full_replication_restore_1587387678 ; ./full_replication_restore_1587387678 Successfully created Replication Consistency Group rcg_sanity. Object ID 357a6c4f00000001 Successfully created the Pair, ID = a1f1819900000001 Successfully created Replication Consistency Group rcg_SANITY2. Object ID 357a6c5300000003 Successfully created the Pair, ID = a1f1819a00000002 Successfully created Replication Consistency Group rcg_sanity3. Object ID 357a6c5500000005 Successfully created the Pair, ID = a1f1819b00000003 - Ověřte, zda byla replikace úspěšně vytvořena, spuštěním příkazu
-
scli --query_all_replication_consistency_groups scli --query_all_replication_pairs
-
Ručně:
-
Zkontrolujte, že každý RCG, který byl automaticky odstraněn, má automaticky generovaný soubor protokolu:
Příklad:
# ls /opt/emc/scaleio/mdm/logs/AutoDeletedOnEndOfJournalCapacity* /opt/emc/scaleio/mdm/logs/AutoDeletedOnEndOfJournalCapacityRplCg_357a454600000001_rcg_sanity /opt/emc/scaleio/mdm/logs/AutoDeletedOnEndOfJournalCapacityRplCg_357a6c4b00000002_rcg_SANITY2 /opt/emc/scaleio/mdm/logs/AutoDeletedOnEndOfJournalCapacityRplCg_357a6c4c00000003_rcg_sanity3 -
Opakujte další kroky pro každý soubor v seznamu v kroku 1 výše
a. Zkontrolujte, že byly vygenerovány příkazy CLI, a ověřte, že jsou k dispozici relevantní informace v části Recreation CLIsPříklad:
#cat AutoDeletedOnEndOfJournalCapacityRplCg_357a6c4900000001_rcg_sanity REPLICATION CONSISTENCY GROUP LocalId:357a6c4900000001 RemoteId:4ca1e3ab00000001 Name:rcg_sanity PeerMdmId:416af83800000000 RpoSeconds:60 Direction:LOCAL_TO_REMOTE DRState:NONE DeletionDecisionTime:20/04 08:37:35 DeletionReason:AUTOMATIC_ON_END_OF_CAPACITY FailureDomainId:b3dd0a5900000000 RemoteFailureDomainId:4ff0744e00000000 PAIR 0 LocalId:a1f1819600000001 RemoteId:2dfad1c100000001 LocalVolumeId:0da61f0d00000003 LocalVolumeName:test1 RemoteVolumeId:1981bbaf00000005 RemoteVolumeName:test1 Recreation CLIs: scli --add_replication_consistency_group --replication_consistency_group_name rcg_sanity --destination_system_object_id 416af83800000000 --protection_domain_id b3dd0a5900000000 --remote_protection_domain_id 4ff0744e00000000 --rpo 60 --target_volume_access_mode no_access scli --add_replication_pair --replication_consistency_group_name rcg_sanity --source_volume_id 0da61f0d00000003 --destination_volume_id 1981bbaf00000005 --copy_type fullb. Spusťte všechny příkazy, které se zobrazí v části "Recreation CLIs"
Příklad:
# scli --add_replication_consistency_group --replication_consistency_group_name rcg_sanity --destination_system_object_id 416af83800000000 --protection_domain_id b3dd0a5900000000 --remote_protection_domain_id 4ff0744e00000000 --rpo 60 --target_volume_access_mode no_access Successfully created Replication Consistency Group rcg_sanity. Object ID 357a6c4f00000001 [root@112AX-7 logs]# scli --add_replication_pair --replication_consistency_group_name rcg_sanity --source_volume_id 0da61f0d00000003 --destination_volume_id 1981bbaf00000005 --copy_type full Successfully created the Pair, ID = a1f1819900000001 [root@112AX-7 logs]# -
Ověřte, zda byla replikace úspěšně vytvořena, spuštěním příkazu
-
scli --query_all_replication_consistency_groups scli --query_all_replication_pairs
-