Dell EMC VxRail. Виртуальная машина (ВМ) недоступна во время тестирования расширения узла кластера vSAN

Résumé: Во время выполнения задачи расширения узла кластера vSAN производственная виртуальная машина становилась недоступной на несколько часов, что приводило к недоступности данных.

Cet article concerne Cet article ne concerne pas Cet article n’est associé à aucun produit spécifique. Toutes les versions du produit ne sont pas identifiées dans cet article.

Symptômes

Во время выполнения задачи расширения узла кластера vSAN производственная виртуальная машина становилась недоступной на несколько часов, что приводило к недоступности данных.

Во время тестирования расширения узлов три узла выводятся из режима обслуживания после выполнения задачи расширения VxRail. На эти узлы переносятся непроизводственные виртуальные машины. 
Одновременно с этим служба DRS (для которой было установлено значение «Полностью автоматизировано») начала перемещать рабочие нагрузки.
Также возникла проблема с конфигурацией сети на этих перенесенных виртуальных машинах.
Для решения проблемы с конфигурацией сети на виртуальных машинах непроизводственные виртуальные машины были перенесены обратно на существующие узлы.
В это время заказчик наблюдал, что виртуальные машины становятся недоступными, что приводит к недоступности данных (DU).

2021-08-23T16:46:03.444+08:00 INFO vsan-mgmt[08861] [VsanHealthSummaryLogUtil::P rintHealthResult opID=noOpId] Общее состояние кластера VxRail-Virtual-SAN-Cluster : красный
   Работоспособность групповых данных : красный
Работоспособность тестового объекта: красный
Обзор: Health/Objects ObjectCount
(healthy, 413), (datamove, 13), (reduced availability-with-no-rebuild-delay-timer, 84),

2021-08-23T16:50:23.911+08:00 INFO vsan-mgmt[08861] [VsanHealthSummaryLogUtil::P rintHealthResult opID=noOpId] Общее состояние кластера VxRail-Virtual-SAN-Cluster : красный
Работоспособность групповых данных : красный
Работоспособность объекта теста : красный
Обзор: Health/Objects ObjectCount
(healthy, 364), (datamove, 4), (reduced availability-with-active-rebuild, 1), (reduced availability-with-no-rebuild-delay-timer, 131), (inavailable, 11),

2021-08-23T16:53:41.081+08:00 INFO vsan-mgmt[08861] [VsanHealthSummaryLogUtil::P rintHealthResult opID=noOpId] Общее состояние кластера VxRail-Virtual-SAN-Cluster : красный
Работоспособность групповых данных : красный
Работоспособность тестового объекта: красный Обзор работоспособности объекта: красный
Обзор: Работоспособность/Objects ObjectCount
(Healthy, 318), (Datamove, 2), (Reduced Availability-With-Active-Rebuild, 3), (Reduced Availability-With-No-Rebuild-Delay-Timer, 158), (Inavailableible, 29),


Тестовые узлы переводятся в режим обслуживания без миграции
данных2021-08-23T07:14:28.848Z: [UserLevelCorrelator] 12121590652us: [esx.audit.maintenancemode.exited] Хост вышел из режима обслуживания.
2021-08-23T08:52:28.717Z: [UserLevelCorrelator] 18001459300us: [esx.audit.maintenancemode.entering] Хост начал вход в режим обслуживания.
2021-08-23T08:52:30.346Z: [UserLevelCorrelator] 18003088181us: [esx.audit.maintenancemode.entered] Хост перешел в режим обслуживания.
2021-08-23T11:48:19Z bootstop: Хост перезагружается
2021-08-23T11:52:22.478Z: [UserLevelCorrelator] 28795220410us: [esx.audit.maintenancemode.exited] Хост вышел из режима обслуживания.
режим 0
2021-08-23T08:52:18.681Z info clomd[2167677] [Originator@6876] CLOMWhatIfEntityDecom: Запуск decom на объекте 611fefdd-3160-e572-eb47-78ac444cf5b0, режим 0, ensureDurability 0 wipeDisk 0, тип объекта — CdbObjectNode, использовать статическое dedupRatio 1,000000, причина «что, если» 0, dedupScope 0, шифрование 0



Недоступная к рабочей среде виртуальная машина не вернется до тех пор, пока все эти недавно добавленные узлы не будут выведены из режима обслуживания.
2021-08-23T19:52:45.831+08:00 INFO vsan-mgmt[08861] [VsanHealthSummaryLogUtil::P rintHealthResult opID=noOpId] Кластер VxRail-Virtual-SAN-Cluster
Общее состояние : красный
Работоспособность групповых данных : красный
Работоспособность тестового объекта : красный
Обзор: Работоспособность/Objects ObjectCount
(Healthy, 474), (Datamove, 10), (Reduced Availability-With-Active-Rebuild, 14), (Reduced Availability-With-No-Rebuild, 3), (Inaccessible, 11),

Cause

Это происходило из-за того, что узлы переводились в режим обслуживания с состоянием «No data migration». 

Производственные ВМ во время тестирования были перенесены на новые узлы в рамках RAID 5. Когда узлы переводились в режим обслуживания для корректировки сетевой конфигурации виртуальных машин, существующие узлы кластера теряли контроль над блоками данных производственных виртуальных машин.

Résolution

Если используется режим защиты RAID 5, при переводе узла в режим обслуживания используйте параметр «Ensure accessibility». 
Убедитесь, что в настоящее время не выполняется никаких действий по данным повторной синхронизации vSAN и что DRS не выполняется.
Если используется vSphere 7.x, проверьте Skyline Health и Data и/или vSAN Object Health. При наличии ошибок не выполняйте никаких действий.

Produits concernés

VMware VSAN
Propriétés de l’article
Numéro d’article: 000191096
Type d’article: Solution
Dernière modification: 16 Feb 2026
Version:  3
Trouvez des réponses à vos questions auprès d’autres utilisateurs Dell
Services de support
Vérifiez si votre appareil est couvert par les services de support.