Dell EMC VxRail: Віртуальна машина (VM) недоступна під час тестування розширення вузла кластеру VSAN

Résumé: Під час завдання розширення вузла кластеру VSAN виробнича віртуальна машина ставала недоступною на кілька годин, внаслідок чого дані стали недоступними.

Cet article concerne Cet article ne concerne pas Cet article n’est associé à aucun produit spécifique. Toutes les versions du produit ne sont pas identifiées dans cet article.

Symptômes

Під час завдання розширення вузла кластеру VSAN виробнича віртуальна машина ставала недоступною на кілька годин, внаслідок чого дані стали недоступними.

Під час тесту розширення вузла три вузли видаляються з режиму обслуговування після завдання розширення VxRail. Невиробничі віртуальні машини мігрують на ці вузли. 
Одночасно DRS (який був налаштований на повністю автоматизований) почав переміщувати навантаження
.Також виникла проблема з конфігурацією мережі на цій мігрованій віртуальній машині.
Для вирішення конфігурації мережі на VM невиробничі VM мігрували назад на існуючі вузли.
У цей час клієнт спостерігав, як віртуальні машини ставали недоступними, що спричинило недоступність даних (DU).

2021-08-23T16:46:03.444+08:00 INFO vsan-mgmt[08861] [VsanHealthSummaryLogUtil::P rintHealthResult opID=noOpId] Кластер VxRail-Virtual-SAN-Cluster Загальний стан : червоний
   Стан даних групи: червоний
Стан об'єктного здоров'я : червоний
Огляд: Health/Objects ObjectCount
(Здоровий, 413), (Datamove, 13), (Зменшена доступність-без відновлення-затримки-таймер, 84),

2021-08-23T16:50:23.911+08:00 INFO vsan-mgmt[08861] [VsanHealthSummaryLogUtil::P rintHealthResult opID=noOpId] Cluster VxRail-Virtual-SAN-Cluster Загальний стан стану : червоний
Стан даних групи : червоний
Стан об'єктів : червоний Стан об'єктів : червоний
Огляд: Health/Objects ObjectCount
(Здоровий, 364), (Datamove, 4), (Зменшена доступність-з активним відновленням, 1), (Зменшена-доступність-без таймера затримки відновлення, 131), (Недоступний, 11),

2021-08-23T16:53:41.081+08:00 INFO vsan-mgmt[08861] [VsanHealthSummaryLogUtil::P rintHealthResult opID=noOpId] Кластер VxRail-Virtual-SAN-Cluster Загальний стан здоров'я : червоний
Стан даних групи : червоний
Стан об'єктів здоров'я : червоний Стан об'єкта : червоний
Огляд: Health/Object Count
(Здоровий, 318), (Datamove, 2), (Зменшена доступність-з активним відновленням, 3), (Зменшена-доступність-без таймера затримки відновлення, 158), (Недоступний, 29),


Тестові вузли переходять у режим обслуговування без режиму міграції
даних2021-08-23T07:14:28.848Z: [UserLevelCorrelator] 12121590652us: [esx.audit.maintenancemode.exited] Хост вийшов з режиму
обслуговування.2021-08-23T08:52:28.717Z: [UserLevelCorrelator] 18001459300us: [esx.audit.maintenancemode.entering] Хост почав переходити в режим
обслуговування.2021-08-23T08:52:30.346Z: [UserLevelCorrelator] 18003088181us: [esx.audit.maintenancemode.entered] Хост перейшов у режим
обслуговування.2021-08-23T11:48:19Z Зупинка завантаження: Ведучий перезавантажується
2021-08-23T11:52:22.478Z: [UserLevelCorrelator] 28795220410us: [esx.audit.maintenancemode.exited] Хост вийшов з режиму
обслуговування.mode 0
2021-08-23T08:52:18.681Z info clomd[2167677] [Originator@6876] CLOMWщоЯкIfEntityDecom: Починаю декомацію з сутності 611fefdd-3160-e572-eb47-78ac444cf5b0, режим 0, ensureDurability 0 wipeDisk 0, тип сутності CdbObjectNode, використовуйте статичне dedupRatio 1.000000, what-if-reason 0, dedupScope 0, шифрування 0



Виробнича недоступна віртуальна машина не повернеться, доки всі ці нові вузли не будуть виведені з режиму
обслуговування.2021-08-23T19:52:45.831+08:00 INFO vsan-mgmt[08861] [VsanHealthSummaryLogUtil::P rintHealthResult opID=noOpId] Cluster VxRail-Virtual-SAN-Cluster
Загальний стан здоров'я: червоний
Груповий стан даних: червоний
Тест об'єктного здоров'я : червоний
Огляд: Health/Object Count
(здорові, 474), (Datamove, 10), (Зменшена доступність з активним відновленням, 14), (Зменшена доступність без відновлення, 3), (Недоступна, 11),

Cause

Це сталося через те, що вузли були переведені в режим обслуговування з режимом «Без міграції даних». 

Виробничі VMS під час тесту були мігровані на нові вузли в рамках RAID 5. Коли вузли були переведені в режим обслуговування для налаштування конфігурації мережі ВМ, існуючі вузли кластера втрачали контроль над блоками даних виробничих VM.

Résolution

При використанні режиму захисту RAID 5 використовуйте «Гарантувати доступність» при переведенні вузла в режим обслуговування. 
Перевірте, чи немає активності даних ресинхронізації VSAN, і що DRS не працює.
Якщо використовуєте vSphere 7.x, перевірте Skyline Health and Data або VSAN Object Health. Не продовжуйте жодної активності, якщо є помилки.

Produits concernés

VMware VSAN
Propriétés de l’article
Numéro d’article: 000191096
Type d’article: Solution
Dernière modification: 16 Feb 2026
Version:  3
Trouvez des réponses à vos questions auprès d’autres utilisateurs Dell
Services de support
Vérifiez si votre appareil est couvert par les services de support.