PowerFlex: Reinizializzazione della replica dopo l'interruzione della replica
Summary: Il consistency group di replica potrebbe essere eliminato per vari motivi e la replica tra i siti di origine e di destinazione potrebbe interrompersi. Il terreno comune per tutti i casi è la fine della capacità del giornale. ...
Symptoms
Dalla riga di comando, è possibile trovare messaggi di avvertenza che indicano "volumes in broken replication consistency groups".
# scli --query_all_replication_pairs
query_all_replication_pairs returned 0 Replication Pairs.
WARNING: The System contains 2 volumes in broken replication consistency groups
# scli --query_all_replication_consistency_groups
Protection Domain aef4ce8300000000 Name: RHEL7-PD
WARNING: The Protection Domain contains 2 volumes in broken replication consistency groups
Dall'interfaccia utente, lo stato dei consistency group di replica (RCG) presenta il seguente errore: "RCGs were deleted by the system".

Lo scopo di questi file di log è quello di consentire una reinizializzazione fluida della replica tra i siti. I file di registro vengono utilizzati per riavviare rapidamente il processo di replica dopo aver risolto la causa dell'interruzione.
Cause
Esempi di motivi che potrebbero causare l'interruzione della replica:
a. Errore di rete lungo tra i siti
di origine e di destinazioneb. Riduzione improvvisa della capacità nei siti di origine o di destinazione, ad esempio in uno scenario di non disponibilità dei dati (DU)
Una volta interrotta la replica, MDM eliminerà automaticamente tutti i consistency group di replica (RCG) tra i siti di origine e di destinazione. Inoltre, genera file di registro di replica che contengono tutte le informazioni relative ai consistency group di replica eliminati.
Resolution
un. Individuare i file di registro di interruzione della replica di generazione automatica sotto l MDM primario con il formato seguente:
DeletedOnEndOfJournalCapacityRplCg_< automatica RCG_ID>_<RCG_name>
Esempio:
# cd /opt/emc/scaleio/mdm/logs
# ls -l AutoDelete*
-rw-r--r-- 1 root root 953 Apr 14 12:15 AutoDeletedOnEndOfJournalCapacityRplCg_4ca1bc9600000000_Rep_Beta1
b. Verificare che il problema che causava l'interruzione della replica sia stato risolto.
c. Reinizializzare la replica con uno dei due metodi seguenti: Tramite script o manualmente.
Mediante script:
-
Generare un file con tutti i comandi pertinenti dai file di registro generati automaticamente al fine di reinizializzare la replica
Esempio:
for i in `ls /opt/emc/scaleio/mdm/logs/AutoDeletedOnEndOfJournalCapacity*`;do sed -e '1,/Recreation CLIs/d' $i >> full_replication_restore_$(date +%s); done -
Verificare che il file sia stato creato correttamente e il relativo contenuto
Esempio:
[root@112AX-7 logs]# cat full_replication_restore_1587387678 scli --add_replication_consistency_group --replication_consistency_group_name rcg_sanity --destination_system_object_id 416af83800000000 --protection_domain_id b3dd0a5900000000 --remote_protection_domain_id 4ff0744e00000000 --rpo 60 --target_volume_access_mode no_access scli --add_replication_pair --replication_consistency_group_name rcg_sanity --source_volume_id 0da61f0d00000003 --destination_volume_id 1981bbaf00000005 --copy_type full scli --add_replication_consistency_group --replication_consistency_group_name rcg_SANITY2 --destination_system_object_id 416af83800000000 --protection_domain_id b3dd0a5900000000 --remote_protection_domain_id 4ff0744e00000000 --rpo 60 --target_volume_access_mode no_access scli --add_replication_pair --replication_consistency_group_name rcg_SANITY2 --source_volume_id 0da61f2500000000 --destination_volume_id 1981bbb000000006 --copy_type full scli --add_replication_consistency_group --replication_consistency_group_name rcg_sanity3 --destination_system_object_id 416af83800000000 --protection_domain_id b3dd0a5900000000 --remote_protection_domain_id 4ff0744e00000000 --rpo 60 --target_volume_access_mode no_access scli --add_replication_pair --replication_consistency_group_name rcg_sanity3 --source_volume_id 0da61f2600000001 --destination_volume_id 1981bbb100000007 --copy_type full [root@112AX-7 logs]# -
Rendere eseguibile il file generato, quindi accedere come amministratore all MDM primario ed eseguire il file creato.
Esempio:
# scli --login --username admin --password xxxxxxxxxx Logged in. User role is SuperUser. System ID is xxxxxxxxxxxxxxx # # chmod +x full_replication_restore_1587387678 ; ./full_replication_restore_1587387678 Successfully created Replication Consistency Group rcg_sanity. Object ID 357a6c4f00000001 Successfully created the Pair, ID = a1f1819900000001 Successfully created Replication Consistency Group rcg_SANITY2. Object ID 357a6c5300000003 Successfully created the Pair, ID = a1f1819a00000002 Successfully created Replication Consistency Group rcg_sanity3. Object ID 357a6c5500000005 Successfully created the Pair, ID = a1f1819b00000003 - Verificare che la replica sia stata creata correttamente eseguendo
-
scli --query_all_replication_consistency_groups scli --query_all_replication_pairs
-
Manualmente:
-
Verificare che ogni RCG eliminato automaticamente disponga di un file di log generato automaticamente:
Esempio:
# ls /opt/emc/scaleio/mdm/logs/AutoDeletedOnEndOfJournalCapacity* /opt/emc/scaleio/mdm/logs/AutoDeletedOnEndOfJournalCapacityRplCg_357a454600000001_rcg_sanity /opt/emc/scaleio/mdm/logs/AutoDeletedOnEndOfJournalCapacityRplCg_357a6c4b00000002_rcg_SANITY2 /opt/emc/scaleio/mdm/logs/AutoDeletedOnEndOfJournalCapacityRplCg_357a6c4c00000003_rcg_sanity3 -
Ripetere i passaggi successivi per ciascun file nell'elenco al passaggio 1 sopra
a. Verificare che siano stati generati i comandi CLI e verificare che siano presenti le informazioni pertinenti in CLI di ricreazioneEsempio:
#cat AutoDeletedOnEndOfJournalCapacityRplCg_357a6c4900000001_rcg_sanity REPLICATION CONSISTENCY GROUP LocalId:357a6c4900000001 RemoteId:4ca1e3ab00000001 Name:rcg_sanity PeerMdmId:416af83800000000 RpoSeconds:60 Direction:LOCAL_TO_REMOTE DRState:NONE DeletionDecisionTime:20/04 08:37:35 DeletionReason:AUTOMATIC_ON_END_OF_CAPACITY FailureDomainId:b3dd0a5900000000 RemoteFailureDomainId:4ff0744e00000000 PAIR 0 LocalId:a1f1819600000001 RemoteId:2dfad1c100000001 LocalVolumeId:0da61f0d00000003 LocalVolumeName:test1 RemoteVolumeId:1981bbaf00000005 RemoteVolumeName:test1 Recreation CLIs: scli --add_replication_consistency_group --replication_consistency_group_name rcg_sanity --destination_system_object_id 416af83800000000 --protection_domain_id b3dd0a5900000000 --remote_protection_domain_id 4ff0744e00000000 --rpo 60 --target_volume_access_mode no_access scli --add_replication_pair --replication_consistency_group_name rcg_sanity --source_volume_id 0da61f0d00000003 --destination_volume_id 1981bbaf00000005 --copy_type fullb. Eseguire tutti i comandi visualizzati nella sezione "CLI di ricreazione"
Esempio:
# scli --add_replication_consistency_group --replication_consistency_group_name rcg_sanity --destination_system_object_id 416af83800000000 --protection_domain_id b3dd0a5900000000 --remote_protection_domain_id 4ff0744e00000000 --rpo 60 --target_volume_access_mode no_access Successfully created Replication Consistency Group rcg_sanity. Object ID 357a6c4f00000001 [root@112AX-7 logs]# scli --add_replication_pair --replication_consistency_group_name rcg_sanity --source_volume_id 0da61f0d00000003 --destination_volume_id 1981bbaf00000005 --copy_type full Successfully created the Pair, ID = a1f1819900000001 [root@112AX-7 logs]# -
Verificare che la replica sia stata creata correttamente eseguendo
-
scli --query_all_replication_consistency_groups scli --query_all_replication_pairs
-