Dell EMC VxRail : La machine virtuelle (VM) est inaccessible pendant le test d’extension des nœuds du cluster VSAN

Résumé: Lors d’une tâche d’extension de nœud de cluster VSAN, une machine virtuelle de production devenait inaccessible pendant plusieurs heures, entraînant l’indisponibilité des données.

Cet article concerne Cet article ne concerne pas Cet article n’est associé à aucun produit spécifique. Toutes les versions du produit ne sont pas identifiées dans cet article.

Symptômes

Lors d’une tâche d’extension de nœud de cluster VSAN, une machine virtuelle de production devenait inaccessible pendant plusieurs heures, entraînant l’indisponibilité des données.

Lors du test d’extension de nœud, trois nœuds sont retirés du mode maintenance après la tâche d’extension VxRail. Les machines virtuelles hors production sont migrées vers ces nœuds. 
Dans le même temps, DRS (qui était défini sur Fully Automated) a commencé à déplacer la charge applicative.
Un problème de configuration réseau s’est également produit sur les machines virtuelles migrées.
Pour résoudre la configuration réseau sur les machines virtuelles, les machines virtuelles hors production ont été migrées vers les nœuds existants.
Pendant ce temps, le client a constaté que les machines virtuelles devenaient inaccessibles, ce qui provoquait une indisponibilité des données (DU).

2021-08-23T16:46:03.444+08:00 INFO vsan-mgmt[08861] [VsanHealthSummaryLogUtil ::P rintHealthResult opID=noOpId] Cluster VxRail-Virtual-SAN-Cluster Overall Health : red
   Group data health : red
Test objecthealth health : red
Vue d’ensemble : Health/Objects ObjectCount
(Healthy, 413), (Datamove, 13), (Reduced-Availability-With-No-Rebuild-Delay-Timer, 84),

2021-08-23T16:50:23.911+08:00 INFO vsan-mgmt[08861] [VsanHealthSummaryLogUtil ::P rintHealthResult opID=noOpId] Cluster VxRail-Virtual-SAN-Cluster Overall Health : red
Group data health : red
Test objecthealth health : red
Overview : Health/Objects ObjectCount
(Healthy, 364), (Datamove, 4), (Reduced-Availability-With-Active-Rebuild, 1), (Reduced-Availability-With-No-Rebuild-Delay-Timer, 131), (Inaccessible, 11),

2021-08-23T16:53:41.081+08:00 INFO vsan-mgmt[08861] [VsanHealthSummaryLogUtil ::P rintHealthResult opID=noOpId] Cluster VxRail-Virtual-SAN-Cluster Overall Health : red
Group data health : red
Test objecthealth health : red
Overview : Health/Objects ObjectCount
(Healthy, 318), (Datamove, 2), (Reduced-Availability-With-Active-Rebuild, 3), (Reduced-Availability-With-No-Rebuild-Delay-Timer, 158), (Inaccessible, 29),


Test nodes are put into maintenance mode by no data migration mode
2021-08-23T07:14:28.848Z : [UserLevelCorrelator] 12121590652us : [esx.audit.maintenancemode.exited] L’hôte a quitté le mode maintenance.
2021-08-23T08:52:28.717Z : [UserLevelCorrelator] 18001459300us : [esx.audit.maintenancemode.entering] L’hôte a commencé à passer en mode maintenance.
2021-08-23T08:52:30.346Z : [UserLevelCorrelator] 18003088181us : [esx.audit.maintenancemode.entered] L’hôte est passé en mode maintenance.
2021-08-23T11:48:19Z bootstop : L’hôte redémarre
2021-08-23T11:52:22.478Z : [UserLevelCorrelator] 28795220410us : [esx.audit.maintenancemode.exited] L’hôte a quitté le mode maintenance.
mode 0
2021-08-23T08:52:18.681Z info clomd[2167677] [Originator@6876] CLOMWhatIfEntityDecom : Starting decom on entity 611fefdd-3160-e572-eb47-78ac444cf5b0, mode 0, ensureDurability 0 wipeDisk 0, entity type is CdbObjectNode, use static dedupRatio 1.000000, what-if reason 0, dedupScope 0, encryption 0



La machine virtuelle inaccessible à la production ne reviendra pas tant que tous ces nœuds nouvellement ajoutés ne seront pas sortis du mode maintenance.
2021-08-23T19:52:45.831+08:00 INFO vsan-mgmt[08861] [VsanHealthSummaryLogUtil ::P rintHealthResult opID=noOpId] Cluster VxRail-Virtual-SAN-Cluster
Overall Health : red
Group data health : red
Test objecthealth health : red
Présentation : Health/Objects ObjectCount
(Healthy, 474), (Datamove, 10), (Reduced-Availability-With-Active-Rebuild, 14), (Reduced-Availability-With-No-Rebuild, 3), (Inaccessible, 11),

Cause

Cela s’est produit en raison du placement des nœuds en mode maintenance avec l’option « Aucune migration de données ». 

Les machines virtuelles de production pendant le test ont été migrées vers de nouveaux nœuds sous RAID 5. Lorsque les nœuds ont été placés en mode maintenance pour ajuster la configuration réseau des machines virtuelles, les nœuds de cluster existants ont perdu le contrôle sur les blocs de données des machines virtuelles de production.

Résolution

Lorsque vous utilisez le mode de protection RAID 5, utilisez l’option « Ensure accessibility » lorsque vous placez le nœud en mode maintenance. 
Vérifiez qu’il n’existe aucune activité de données de resynchronisation VSAN et que DRS n’est pas en cours d’exécution.
Si vous utilisez vSphere 7.x, vérifiez l’intégrité et les données Skyline et/ou l’intégrité de l’objet VSAN. Ne poursuivez aucune activité en cas d’erreurs.

Produits concernés

VMware VSAN
Propriétés de l’article
Numéro d’article: 000191096
Type d’article: Solution
Dernière modification: 16 Feb 2026
Version:  3
Trouvez des réponses à vos questions auprès d’autres utilisateurs Dell
Services de support
Vérifiez si votre appareil est couvert par les services de support.