Dell EMC VxRail: A máquina virtual (VM) fica inacessível durante o teste de expansão do nó do cluster do VSAN
Résumé: Durante uma tarefa de expansão de nó de cluster do VSAN, uma VM de produção ficava inacessível por várias horas, resultando em dados indisponíveis.
Cet article concerne
Cet article ne concerne pas
Cet article n’est associé à aucun produit spécifique.
Toutes les versions du produit ne sont pas identifiées dans cet article.
Symptômes
Durante uma tarefa de expansão de nó de cluster do VSAN, uma VM de produção ficava inacessível por várias horas, resultando em dados indisponíveis.
Durante o teste de expansão de nó, três nós são removidos do modo de manutenção após a tarefa de expansão do VxRail. As VMs que não são de produção são migradas para esses nós.
Simultaneamente, o DRS (que foi definido como totalmente automatizado) começou a mover a carga de trabalho.
Também houve um problema de configuração de rede nessas VMs migradas.
Para resolver a configuração de rede nas VMs, as VMs que não são de produção foram migradas de volta para os nós existentes.
Durante esse período, o cliente observou VMs se tornando inacessíveis, o que causou indisponibilidade de dados (DU).
2021-08-23T16:46:03.444+08:00 INFO vsan-mgmt[08861] [VsanHealthSummaryLogUtil::P rintHealthResult opID=noOpId] Cluster VxRail-Virtual-SAN-Cluster Integridade geral: vermelho
Integridade dos dados do grupo: vermelho
Testar a integridade do objeto: vermelho
Visão geral: Health/Objects ObjectCount
(Healthy, 413), (Datamove, 13), (Reduced-Availability-With-No-Rebuild-Delay-Timer, 84),
2021-08-23T16:50:23.911+08:00 INFO vsan-mgmt[08861] [VsanHealthSummaryLogUtil::P rintHealthResult opID=noOpId] Cluster VxRail-Virtual-SAN-Cluster Integridade geral : vermelho
Integridade dos dados do grupo: vermelho
Testar integridade do objeto: vermelho
Visão geral: Health/Objects ObjectCount
(íntegro, 364), (Datamove, 4), (disponibilidade reduzida com recriação ativa, 1), (disponibilidade reduzida com temporizador de atraso sem reconstrução, 131), (inacessível, 11),
2021-08-23T16:53:41.081+08:00 INFO vsan-mgmt[08861] [VsanHealthSummaryLogUtil::P rintHealthResult opID=noOpId] Cluster VxRail-Virtual-SAN-Cluster Integridade geral : vermelho
Integridade de dados do grupo: vermelho
Testar integridade objecthealth: vermelho Visão geral: vermelho
Visão geral: Health/Objects ObjectCount
(íntegro, 318), (Datamove, 2), (disponibilidade reduzida com recriação ativa, 3), (disponibilidade reduzida com temporizador de atraso sem recriação, 158), (inacessível, 29),
Os nós de teste são colocados no modo de manutenção por Sem modo
de migração de dados2021-08-23T07:14:28.848Z: [UserLevelCorrelator] 12121590652us: [esx.audit.maintenancemode.exited] O host saiu do modo de manutenção.
2021-08-23T08:52:28.717Z: [UserLevelCorrelator] 18001459300us: [esx.audit.maintenancemode.entering] O host começou a entrar no modo de manutenção.
2021-08-23T08:52:30.346Z: [UserLevelCorrelator] 18003088181us: [esx.audit.maintenancemode.entered] O host entrou no modo de manutenção.
Bootstop 2021-08-23T11:48:19Z: O host está reinicializando
2021-08-23T11:52:22.478Z: [UserLevelCorrelator] 28795220410us: [esx.audit.maintenancemode.exited] O host saiu do modo de manutenção.
modo 0
2021-08-23T08:52:18.681Z info clomd[2167677] [Originator@6876] CLOMWhatIfEntityDecom: Iniciando a decom na entidade 611fefdd-3160-e572-eb47-78ac444cf5b0, modo 0, ensureDurability 0 wipeDisk 0, entity type is CdbObjectNode, use static dedupRatio 1.000000, what-if reason 0, dedupScope 0, encryption 0
A VM inacessível de produção não voltará até que todos esses nós recém-adicionados sejam retirados do modo de manutenção.
2021-08-23T19:52:45.831+08:00 INFO vsan-mgmt[08861] [VsanHealthSummaryLogUtil::P rintHealthResult opID=noOpId] Cluster VxRail-Virtual-SAN-Cluster
Integridade geral : vermelho
Integridade de dados do grupo: vermelho
Testar integridade objecthealth: vermelho
Visão geral: Health/Objects ObjectCount
(íntegro, 474), (Datamove, 10), (disponibilidade reduzida-com-recriação ativa, 14), (disponibilidade reduzida-com-não-recriação, 3), (inacessível, 11),
Durante o teste de expansão de nó, três nós são removidos do modo de manutenção após a tarefa de expansão do VxRail. As VMs que não são de produção são migradas para esses nós.
Simultaneamente, o DRS (que foi definido como totalmente automatizado) começou a mover a carga de trabalho.
Também houve um problema de configuração de rede nessas VMs migradas.
Para resolver a configuração de rede nas VMs, as VMs que não são de produção foram migradas de volta para os nós existentes.
Durante esse período, o cliente observou VMs se tornando inacessíveis, o que causou indisponibilidade de dados (DU).
2021-08-23T16:46:03.444+08:00 INFO vsan-mgmt[08861] [VsanHealthSummaryLogUtil::P rintHealthResult opID=noOpId] Cluster VxRail-Virtual-SAN-Cluster Integridade geral: vermelho
Integridade dos dados do grupo: vermelho
Testar a integridade do objeto: vermelho
Visão geral: Health/Objects ObjectCount
(Healthy, 413), (Datamove, 13), (Reduced-Availability-With-No-Rebuild-Delay-Timer, 84),
2021-08-23T16:50:23.911+08:00 INFO vsan-mgmt[08861] [VsanHealthSummaryLogUtil::P rintHealthResult opID=noOpId] Cluster VxRail-Virtual-SAN-Cluster Integridade geral : vermelho
Integridade dos dados do grupo: vermelho
Testar integridade do objeto: vermelho
Visão geral: Health/Objects ObjectCount
(íntegro, 364), (Datamove, 4), (disponibilidade reduzida com recriação ativa, 1), (disponibilidade reduzida com temporizador de atraso sem reconstrução, 131), (inacessível, 11),
2021-08-23T16:53:41.081+08:00 INFO vsan-mgmt[08861] [VsanHealthSummaryLogUtil::P rintHealthResult opID=noOpId] Cluster VxRail-Virtual-SAN-Cluster Integridade geral : vermelho
Integridade de dados do grupo: vermelho
Testar integridade objecthealth: vermelho Visão geral: vermelho
Visão geral: Health/Objects ObjectCount
(íntegro, 318), (Datamove, 2), (disponibilidade reduzida com recriação ativa, 3), (disponibilidade reduzida com temporizador de atraso sem recriação, 158), (inacessível, 29),
Os nós de teste são colocados no modo de manutenção por Sem modo
de migração de dados2021-08-23T07:14:28.848Z: [UserLevelCorrelator] 12121590652us: [esx.audit.maintenancemode.exited] O host saiu do modo de manutenção.
2021-08-23T08:52:28.717Z: [UserLevelCorrelator] 18001459300us: [esx.audit.maintenancemode.entering] O host começou a entrar no modo de manutenção.
2021-08-23T08:52:30.346Z: [UserLevelCorrelator] 18003088181us: [esx.audit.maintenancemode.entered] O host entrou no modo de manutenção.
Bootstop 2021-08-23T11:48:19Z: O host está reinicializando
2021-08-23T11:52:22.478Z: [UserLevelCorrelator] 28795220410us: [esx.audit.maintenancemode.exited] O host saiu do modo de manutenção.
modo 0
2021-08-23T08:52:18.681Z info clomd[2167677] [Originator@6876] CLOMWhatIfEntityDecom: Iniciando a decom na entidade 611fefdd-3160-e572-eb47-78ac444cf5b0, modo 0, ensureDurability 0 wipeDisk 0, entity type is CdbObjectNode, use static dedupRatio 1.000000, what-if reason 0, dedupScope 0, encryption 0
A VM inacessível de produção não voltará até que todos esses nós recém-adicionados sejam retirados do modo de manutenção.
2021-08-23T19:52:45.831+08:00 INFO vsan-mgmt[08861] [VsanHealthSummaryLogUtil::P rintHealthResult opID=noOpId] Cluster VxRail-Virtual-SAN-Cluster
Integridade geral : vermelho
Integridade de dados do grupo: vermelho
Testar integridade objecthealth: vermelho
Visão geral: Health/Objects ObjectCount
(íntegro, 474), (Datamove, 10), (disponibilidade reduzida-com-recriação ativa, 14), (disponibilidade reduzida-com-não-recriação, 3), (inacessível, 11),
Cause
Isso ocorreu porque os nós foram colocados no modo de manutenção com "No data migration".
As VMs de produção durante o teste foram migradas para novos nós no RAID 5. Quando os nós foram colocados no modo de manutenção para ajustar a configuração de rede das VMs, os nós de cluster existentes perderam o controle sobre os blocos de dados da VM de produção.
As VMs de produção durante o teste foram migradas para novos nós no RAID 5. Quando os nós foram colocados no modo de manutenção para ajustar a configuração de rede das VMs, os nós de cluster existentes perderam o controle sobre os blocos de dados da VM de produção.
Résolution
Ao usar o modo de proteção RAID 5, use "Ensure accessibility" ao colocar o nó no modo de manutenção.
Verifique se não há atividade de dados de ressincronização do VSAN existente e se o DRS não está em execução.
Se estiver usando o vSphere 7.x, marque Skyline Health and Data e/ou VSAN Object Health. Não prossiga com nenhuma atividade se houver erros.
Verifique se não há atividade de dados de ressincronização do VSAN existente e se o DRS não está em execução.
Se estiver usando o vSphere 7.x, marque Skyline Health and Data e/ou VSAN Object Health. Não prossiga com nenhuma atividade se houver erros.
Produits concernés
VMware VSANPropriétés de l’article
Numéro d’article: 000191096
Type d’article: Solution
Dernière modification: 16 Feb 2026
Version: 3
Trouvez des réponses à vos questions auprès d’autres utilisateurs Dell
Services de support
Vérifiez si votre appareil est couvert par les services de support.