RecoverPoint для віртуальної машини: Цикл групи узгодженості між init і станом помилки в масштабному середовищі
Summary: RecoverPoint для віртуальної машини: Цикл групи узгодженості між init і станом помилки в масштабному середовищі
Symptoms
Група узгодженості, що циклує між init і станом помилки в масштабному середовищі
, що призводить до недоступності реплікації даних (DRU).
Симптоми, виявлені в журналах :
ESX splitter logs:
Нижче наведені логи вказують, що читання /vmfs/volumes/vsan:5xxxxxxxxxxxxx-dxxxxxx не вдалося, тому всі томи RPVS у VSAN будуть видалені.
spl_esx_discover_RPvStorage_clusters_in_datastore: не вдалося прочитати каталог /vmfs/volumes/vsan:5xxxxxxxxx-dxxxxxxx, повернулося зі статусом Timeout
update_rpvs_db: lun 1 не був відсканований при останньому оновленні
пристрою RPVS_ClusterLuns_removeLunInfo: викликали lun=1 (ім'я RPVS_Lun00001.vmdk). Ідентифікатор кластера=2xxxxxxxxxxxx
update_rpvs_db: lun 12 не був сканований під час останнього оновлення
вигляду пристрою RPVS_ClusterLuns_removeLunInfo: викликав lun=12 (ім'я RPVS_Lun00012.vmdk). Ідентифікатор кластера=2xxxxxxxxxxx
update_rpvs_db: lun 13 не просканувався під час останнього оновлення перегляду пристрою ...
* Процес виявлення RPVS успішний, тому всі томи RPVS додаються назад:
parse_vmdk_file: викликано з файлом /vmfs/volumes/vsan:5xxxxxxxxxx/RPvStorage/4xxxxxxxxxxx/RPVS_Lun00001.vmdk
parse_vmdk_file: capacity=120000000, thinLun=0, flat_filename=RPVS_Lun00001-flat.vmdk, rawguid=0x6xxxxxxxxx
RPVS_ClusterLuns_addLunInfo: додано Lun 1, кластер 4xxxxxxx parse_vmdk_file: викликаний файлом /vmfs/volumes/VSAN:5xxxxxxxxxxxxxx-dxxxxxxx/RPvStorage_23d5fb88838940xxx_010/RPVS_Lun00012.vmdk parse_vmdk_file: capacity=524288000, thinLun=0, flat_filename=RPVS_Lun00012-flat.vmdk, rawguid=0x6xxxxxx RPVS_ClusterLuns_addLunInfo: додано lun 12, кластер 2xxxxxxxxx
* Журнал, що вказує, що процес виявлення RPVS триває довго
CommandExecuterBase_v_handleCommands_i: cmd 0x417fdde35040, cmd-execute>(CommandRPVSDiscovery), час виконання 32585607 мікросекунд, команди num у черзі: 11 CommandExecuterBase_v_handleCommands_i: cmd 0x417fdde35040, cmd-execute> (CommandRPVSDiscovery), час виконання 33277695 мікросекунди, команди num у черзі: 11 CommandExecuterBase_v_handleCommands_i: cmd 0x417fdde35040, cmd-execute> (CommandRPVSDiscovery), час виконання 35834242 мікросекунди, команди num у черзі: 11 CommandExecuterBase_v_handleCommands_i: cmd 0x417fdde35040, cmd-execute> (CommandRPVSDiscovery), час виконання 36488014 мікросекунди, num команди в черзі: 11 CommandExecuterBase_v_handleCommands_i: cmd 0x417fdde35040, cmd-execute> (CommandRPVSDiscovery), час виконання 37767728 мікросекунди, команди num у черзі: 11 CommandExecuterBase_v_handleCommands_i: cmd 0x417fdde35040, cmd-execute> (CommandRPVSDiscovery), час виконання 49355575 мікросекунди, команди num у черзі: 11 CommandExecuterBase_v_handleCommands_i: cmd 0x417fdde35040, cmd-execute> (CommandRPVSDiscovery), час виконання 109257427 мікросекунди, num команди в черзі: 19
Вплинуло на всі версії RP4VM
Cause
ESX-спліттер сканує RPVS том (журнал і репозиторій) кожні t_rpvsDiscoveryPeriodicTimerInterval (за замовчуванням: 30) секунд.
Сканування здійснюється шляхом читання /vmfs/volumes/ і перегляду кожного каталогу всередині нього, шукаючи RPVS_LunXXXXX.vmdk
Том RPVS знаходиться у /vmfs/volumes/<datastore>/<cluster=id>/. У VSAN-середовищі він розміщуватиметься у /vmfs/volumes/vsan:<vsan-id>/<cluster=id>/
Якщо читання будь-якого каталогу всередині /vmfs/volumes/ не працює (тайм-аут, тимчасова помилка тощо), це призведе до видалення всіх томів RPVS у несправному каталозі.
У будь-якому наступному запуску, якщо процес відкриття rpvs успішно прочитає і знайде RPVS_LunXXXXX.vmdk, відповідні томи RPVS будуть додані назад.
Ось чому CG циклуються між Error та Init.
Проблема посилюється, коли велика кількість хостів у VSAN одночасно читає каталоги під /vmfs/volumes/.
Resolution
У кожному ESX-хості кластера оновіть значення налаштування сплітера t_rpvsDiscoveryPeriodicTimerInterval
до випадкового значення між 180 і 600 секундами та перезапустіть kdriver
.ESX Splitter Tweak можна знайти за адресою
/etc/kdriver/tweak/tweak.params.splitter або /etc/config/emc/rp/kdriver/tweak/tweak.params.splitter.
Резолюція:
Інженерна компанія Dell EMC наразі розслідує цю проблему. Постійне вирішення ще триває. Зверніться до Центру підтримки клієнтів Dell EMC або до свого представника для допомоги та зверніться до цього ідентифікатора рішення.