Dell Unity. Как асинхронная репликация и высвобождение пространства влияют на производительность массива
Summary: В этой статье рассматривается влияние асинхронной репликации на производительность массива во время высвобождения пространства из больших виртуальных машин (ВМ).
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Symptoms
При воспроизведении следующих действий можно заметить огромную задержку во ВСЕХ ресурсах хранилища (во всем массиве).
1. Виртуальные машины (ВМ) на хосте не используются и находятся в автономном режиме — без операций ввода-вывода — полностью простаивают (предназначены для удаления).
2. Выполняется удаление виртуальной машины с хоста (высвобождение пространства).
3. Все работает отлично. Ожидаемое время отклика для всех LUN и хостов в дисковом массиве.
4. [Триггер] Репликация запускается вручную или с использованием целевой точки восстановления (RPO). Увеличение задержки на ВСЕХ LUN и хостах — данные стали недоступны.
2. Выполняется удаление виртуальной машины с хоста (высвобождение пространства).
3. Все работает отлично. Ожидаемое время отклика для всех LUN и хостов в дисковом массиве.
4. [Триггер] Репликация запускается вручную или с использованием целевой точки восстановления (RPO). Увеличение задержки на ВСЕХ LUN и хостах — данные стали недоступны.
Cause
Асинхронная репликация:
- Когда сессия репликации приостановлена, скорость освобождения не останавливается и не замедляется.
- Пока сессия репликации приостановлена, работа накапливается в массиве.
- После возобновления сессии репликации (вручную или автоматически) накопленная работа будет отправлена с момента ее приостановки.
- В зависимости от объема накопленной работы, это может вызвать задержку, в данном случае серьезную.
- Это функция как дизайн.
Высвобождение пространства:
- В соответствии с передовыми подходами, 64 Тбайт не рекомендуется использовать для блочных LUN ESXi, особенно в сочетании с асинхронной репликацией.
- Когда массив запрашивает 40 ТБ пустого пространства, чтобы найти блоки с картой переменной длины для чтения, это большая работа, не добавляющая ценности.
- Пока это происходит, нагрузка увеличивается и влияет как на LUN, так и на массив (все ресурсы).
- Когда сессия репликации приостановлена, скорость освобождения не останавливается и не замедляется.
- Пока сессия репликации приостановлена, работа накапливается в массиве.
- После возобновления сессии репликации (вручную или автоматически) накопленная работа будет отправлена с момента ее приостановки.
- В зависимости от объема накопленной работы, это может вызвать задержку, в данном случае серьезную.
- Это функция как дизайн.
Высвобождение пространства:
- В соответствии с передовыми подходами, 64 Тбайт не рекомендуется использовать для блочных LUN ESXi, особенно в сочетании с асинхронной репликацией.
- Когда массив запрашивает 40 ТБ пустого пространства, чтобы найти блоки с картой переменной длины для чтения, это большая работа, не добавляющая ценности.
- Пока это происходит, нагрузка увеличивается и влияет как на LUN, так и на массив (все ресурсы).
Resolution
Чтобы избежать большой задержки при выполнении этих условий, рекомендуется выполнить следующие действия.
1. Остановите и удалите сессию репликации.
2. Очистите неиспользуемое, тонкое и незадействованное пространство (при миграции данных) в LUN меньшего размера.
3. Вместо этого создайте новую сессию репликации из LUN меньшего размера.
2. Очистите неиспользуемое, тонкое и незадействованное пространство (при миграции данных) в LUN меньшего размера.
3. Вместо этого создайте новую сессию репликации из LUN меньшего размера.
Кроме того, если хранилище данных для миграции устарело и его необходимо удалить, мы рекомендуем следующее.
1. Удалите сессию репликации.
2. Удалите затронутый LUN.
3. В будущем создайте LUN меньшего размера в соответствии с передовыми подходами.
2. Удалите затронутый LUN.
3. В будущем создайте LUN меньшего размера в соответствии с передовыми подходами.
Дополнительные соображения:
- Неправильная настройка LUN, хостов/виртуальных машин ESXi и репликации может привести к неясным последствиям даже при наличии передовых подходов.
- В данном случае, в частности, это то, что вызывало задержку в таком огромном масштабе.
- Согласно разработке, это ожидаемое поведение, и Unity функционирует так, как задумано.
Справочная документация:
- Dell EMC Unity: Передовые практики VMware vSphere
- vSphere Storage Appliance (сообщество — внешняя ссылка)
Additional Information
Чтобы убедиться в одинаковом поведении, проверьте, запущена ли или была запущена репликация. Просмотрите следующие файлы, находящиеся в массиве:
Live on Array:/EMC/backend/log/shared/EMCSystemLogFile.log
- /EMC/C4Core/log/c4_safe_ktrace.log
Запускается вручную пользователем-администратором:
14:10:21 service@spb:~/user# tailf 00_emc_backend_log_shared/EMCSystemLogFile.log | grep -i "refresh the replication"
B 05/04/21 14:10:48.405 ReplicPlugin 610021 [INFO] Audit: User Admin started to refresh the replication session rep_sess_res_xx_res_xx_CKM00xxxxxxxxx_CKM00xxxxxxxxx.
Автоматически по целевой точке восстановления (RPO):
B 05/04/21 14:45:33.687 std ddf1a70d c4_safe_ktrace SASPMC 0 (BE99) API INFO set_dynamic_int_coalescing: nr_busy_ports=1 ict=100 icc=16
B 05/04/21 14:45:33.708 sade 9f3f70f c4_safe_ktrace DIC: 6:[SVDM_B] Handle request /dic_s/DicXmlAsyncMsgService/async=4=302002=503370607
B 05/04/21 14:45:33.708 sade 9f3f70f c4_safe_ktrace DIC: 6:[SVDM_B] Send back /dic_s/DicXmlAsyncMsgService/async=4=302002=503370607 response (200 OK)
B 05/04/21 14:45:33.708 sade 9f3f70f c4_safe_ktrace DIC: 6:[SVDM_B] Response for /dic_s/DicXmlAsyncMsgService/async=4=302002=503370607 sent
B 05/04/21 14:45:33.708 sade e5243708 c4_safe_ktrace XML: 6:[core]
B 05/04/21 14:52:07.605 mlu 16d001c [INFO] System: Snapshot 81604378643_CKM00201901039_0000.ckpt000_3275157210146496.2_684 has been created for LUN 23.
B 05/04/21 14:52:07.710 mlu 12d0003 [INFO] System: Operation Create Replica started by 900002a4a on 9000000fd.
B 05/04/21 14:52:07.724 mlu 16d0027 [INFO] System: The new name for snapshot being destroyed is Destroying_20210106115207.694+00-000.
B 05/04/21 14:52:07.738 mlu 16d0027 [INFO] System: The new name for snapshot being destroyed is Destroying_20210106115207.694+00-001.
Примечание. Каждый раз, когда достигается целевая точка восстановления или запускается обновление вручную, происходит обновление моментального снимка. Обновление одного снимка может рассматриваться как уничтожение или повторное создание.
Affected Products
Dell EMC Unity, Dell EMC Unity Family |Dell EMC Unity All Flash, Dell EMC Unity HybridArticle Properties
Article Number: 000184863
Article Type: Solution
Last Modified: 21 Oct 2025
Version: 5
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.