PowerFlex. Повторная инициализация репликации после прерывания репликации
Summary: Группа консистентности репликации может быть удалена по разным причинам, и репликация между исходной и целевой площадками будет остановлена. Общим основанием для всех случаев является исчерпание емкости журнала. ...
Symptoms
В командной строке можно найти предупреждения «тома в нарушенных группах консистентности репликации».
# scli --query_all_replication_pairs
query_all_replication_pairs returned 0 Replication Pairs.
WARNING: The System contains 2 volumes in broken replication consistency groups
# scli --query_all_replication_consistency_groups
Protection Domain aef4ce8300000000 Name: RHEL7-PD
WARNING: The Protection Domain contains 2 volumes in broken replication consistency groups
В пользовательском интерфейсе состояние групп консистентности репликации (RCG) имеет следующую ошибку: «RCG были удалены системой».

Назначение этих файлов журналов — обеспечить беспроблемную повторную инициализацию репликации между площадками. Файлы журналов используются для быстрого перезапуска процесса репликации после устранения причины прерывания.
Cause
Примеры причин, которые могут привести к прерыванию репликации:
a. Продолжительный сбой сети между исходной и целевой площадками
В. Внезапное уменьшение емкости на исходной или целевой площадках, например в сценарии недоступности данных (DU).
После нарушения репликации MDM автоматически удаляет все группы консистентности репликации (RCG) между исходной и целевой площадками. При этом создаются файлы журналов репликации, содержащие всю информацию, относящуюся к удаленным RCG.
Resolution
a. Найдите автоматически созданные файлы журналов прерываний репликации в основном MDM в следующем формате:
Авто DeletedOnEndOfJournalCapacityRplCg_<RCG_ID>_<RCG_name>
Пример.
# cd /opt/emc/scaleio/mdm/logs
# ls -l AutoDelete*
-rw-r--r-- 1 root root 953 Apr 14 12:15 AutoDeletedOnEndOfJournalCapacityRplCg_4ca1bc9600000000_Rep_Beta1
b. Убедитесь, что проблема, вызвавшая нарушение репликации, устранена.
c. Повторная инициализация репликации одним из следующих двух способов: С помощью скрипта или вручную.
Использование сценария.
-
Создайте один файл, содержащий все соответствующие команды из автоматически созданных файлов журнала для повторной инициализации репликации
Пример.
for i in `ls /opt/emc/scaleio/mdm/logs/AutoDeletedOnEndOfJournalCapacity*`;do sed -e '1,/Recreation CLIs/d' $i >> full_replication_restore_$(date +%s); done -
Убедитесь, что файл был успешно создан, и убедитесь, что его содержимое успешно создано.
Пример.
[root@112AX-7 logs]# cat full_replication_restore_1587387678 scli --add_replication_consistency_group --replication_consistency_group_name rcg_sanity --destination_system_object_id 416af83800000000 --protection_domain_id b3dd0a5900000000 --remote_protection_domain_id 4ff0744e00000000 --rpo 60 --target_volume_access_mode no_access scli --add_replication_pair --replication_consistency_group_name rcg_sanity --source_volume_id 0da61f0d00000003 --destination_volume_id 1981bbaf00000005 --copy_type full scli --add_replication_consistency_group --replication_consistency_group_name rcg_SANITY2 --destination_system_object_id 416af83800000000 --protection_domain_id b3dd0a5900000000 --remote_protection_domain_id 4ff0744e00000000 --rpo 60 --target_volume_access_mode no_access scli --add_replication_pair --replication_consistency_group_name rcg_SANITY2 --source_volume_id 0da61f2500000000 --destination_volume_id 1981bbb000000006 --copy_type full scli --add_replication_consistency_group --replication_consistency_group_name rcg_sanity3 --destination_system_object_id 416af83800000000 --protection_domain_id b3dd0a5900000000 --remote_protection_domain_id 4ff0744e00000000 --rpo 60 --target_volume_access_mode no_access scli --add_replication_pair --replication_consistency_group_name rcg_sanity3 --source_volume_id 0da61f2600000001 --destination_volume_id 1981bbb100000007 --copy_type full [root@112AX-7 logs]# -
Сделайте созданный файл исполняемым, затем войдите в качестве администратора в основном MDM и запустите созданный файл.
Пример.
# scli --login --username admin --password xxxxxxxxxx Logged in. User role is SuperUser. System ID is xxxxxxxxxxxxxxx # # chmod +x full_replication_restore_1587387678 ; ./full_replication_restore_1587387678 Successfully created Replication Consistency Group rcg_sanity. Object ID 357a6c4f00000001 Successfully created the Pair, ID = a1f1819900000001 Successfully created Replication Consistency Group rcg_SANITY2. Object ID 357a6c5300000003 Successfully created the Pair, ID = a1f1819a00000002 Successfully created Replication Consistency Group rcg_sanity3. Object ID 357a6c5500000005 Successfully created the Pair, ID = a1f1819b00000003 - Убедитесь, что репликация была успешно создана, выполнив команду
-
scli --query_all_replication_consistency_groups scli --query_all_replication_pairs
-
Вручную:
-
Убедитесь, что каждый автоматически удаленный RCG имеет автоматически созданный файл журнала:
Пример.
# ls /opt/emc/scaleio/mdm/logs/AutoDeletedOnEndOfJournalCapacity* /opt/emc/scaleio/mdm/logs/AutoDeletedOnEndOfJournalCapacityRplCg_357a454600000001_rcg_sanity /opt/emc/scaleio/mdm/logs/AutoDeletedOnEndOfJournalCapacityRplCg_357a6c4b00000002_rcg_SANITY2 /opt/emc/scaleio/mdm/logs/AutoDeletedOnEndOfJournalCapacityRplCg_357a6c4c00000003_rcg_sanity3 -
Повторите следующие шаги для каждого файла в списке на шаге 1 выше
, а. Убедитесь, что команды интерфейса командной строки были созданы, и подтвердите, что в разделе «Recreation CLIs» содержится соответствующая информация.Пример.
#cat AutoDeletedOnEndOfJournalCapacityRplCg_357a6c4900000001_rcg_sanity REPLICATION CONSISTENCY GROUP LocalId:357a6c4900000001 RemoteId:4ca1e3ab00000001 Name:rcg_sanity PeerMdmId:416af83800000000 RpoSeconds:60 Direction:LOCAL_TO_REMOTE DRState:NONE DeletionDecisionTime:20/04 08:37:35 DeletionReason:AUTOMATIC_ON_END_OF_CAPACITY FailureDomainId:b3dd0a5900000000 RemoteFailureDomainId:4ff0744e00000000 PAIR 0 LocalId:a1f1819600000001 RemoteId:2dfad1c100000001 LocalVolumeId:0da61f0d00000003 LocalVolumeName:test1 RemoteVolumeId:1981bbaf00000005 RemoteVolumeName:test1 Recreation CLIs: scli --add_replication_consistency_group --replication_consistency_group_name rcg_sanity --destination_system_object_id 416af83800000000 --protection_domain_id b3dd0a5900000000 --remote_protection_domain_id 4ff0744e00000000 --rpo 60 --target_volume_access_mode no_access scli --add_replication_pair --replication_consistency_group_name rcg_sanity --source_volume_id 0da61f0d00000003 --destination_volume_id 1981bbaf00000005 --copy_type fullb. Выполните все команды, которые отображаются в разделе «Recreation CLIs»
Пример.
# scli --add_replication_consistency_group --replication_consistency_group_name rcg_sanity --destination_system_object_id 416af83800000000 --protection_domain_id b3dd0a5900000000 --remote_protection_domain_id 4ff0744e00000000 --rpo 60 --target_volume_access_mode no_access Successfully created Replication Consistency Group rcg_sanity. Object ID 357a6c4f00000001 [root@112AX-7 logs]# scli --add_replication_pair --replication_consistency_group_name rcg_sanity --source_volume_id 0da61f0d00000003 --destination_volume_id 1981bbaf00000005 --copy_type full Successfully created the Pair, ID = a1f1819900000001 [root@112AX-7 logs]# -
Убедитесь, что репликация была успешно создана, выполнив команду
-
scli --query_all_replication_consistency_groups scli --query_all_replication_pairs
-