VxRail: objeto inaccesible a vSAN, falla de disco, latencia excesiva de I/O, estado general del disco en rojo

Summary: No elimine discos durante la resincronización de vSAN, ya que puede provocar una pérdida de datos.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Este artículo se aplica a las versiones de VxRail 7.x y VxRail 8.x.

La evaluación del estado de vSAN detecta una falla de disco, o vmware-vsan-health-summary-result.log Encuentra physdiskoverall La salud es roja o amarilla.

VxRail-Virtual-SAN-Cluster-xxxxxxxxx  Overall Health : red
   Group physicaldisks health : red
      Test physdiskoverall health : red
         DisksWithIssues: Host  Disk  OverallOperationHealth  Metadata  Operational  InCmmds/Vsi  OperationalState  Recommendation  Uuid
                             (Host-10, LocalToshibaDisk(Naa.50000xxxxxxxxxx), Red, Green, Red, Yes/Yes, ImpendingPermanentDiskFailure,EvacuationFailedDueToInaccessibleObjects, PleaseReferTo'Data'HealthCheckAndResolveTheInaccessibleObjects

vsandevicemonitord.log reports:

INFO vsandevicemonitord WARNING - WRITE Average Latency on VSAN device naa.50000xxxxxxxx has exceeded threshold value 2000000 us 2 times.
INFO vsandevicemonitord Tier 2 (naa.50000xxxxxxxx) as unhealthy

Cause

La función Manejo de discos moribundos (DDH) de vSAN diagnostica el estado del disco o del grupo de discos mediante la detección de una latencia de I/O excesiva para un disco vSAN o la congestión máxima del registro que vSAN determina que se debe a problemas de pérdida de registro en un grupo de discos vSAN durante un período prolongado. Los discos o grupos de discos en mal estado se marcan como tales y el disco o los grupos de discos ya no se utilizan para la nueva ubicación de datos.

Cuando DDH detecta que un disco ha superado el umbral de latencia de I/O durante el intervalo de monitoreo, vSAN genera una observación de VMkernel (VOB) y registra un mensaje en el vsandevicemonitord.log en el archivo /var/run/log directorio. La siguiente entrada de registro es un ejemplo de un disco que se debe reemplazar una vez que se completa la evacuación de datos necesaria y el disco se encuentra en un estado de evacuación:

WARNING - WRITE Average Latency on VSAN device <NAA disk name> has exceeded threshold value <IO latency threshold for disk> us <# of intervals with excessive IO latency> times.

Cuando DDH detecta que un nivel de almacenamiento en caché tiene una congestión excesiva de registros durante el intervalo de monitoreo, vSAN genera un VOB y registra en el vsandevicemonitord.log . Los mensajes de congestión de registros excesivos tienen este formato:

WARNING - Maximum log congestion on VSAN device <NAA disk name> <current intervals with excessive log congestion>/<intervals required to be unhealthy>

En ambas situaciones, vSAN activa la evacuación de algunos o todos los datos del disco o los grupos de discos afectados. La sección de estado general de los discos en la interfaz de usuario de monitoreo del estado de vSAN informa cualquiera de los siguientes estados operativos para el disco o los grupos de discos afectados, junto con recomendaciones para el usuario. Las recomendaciones una vez finalizada la evacuación difieren en función de si vSAN detectó latencias de I/O excesivas o una congestión excesiva de registros.

Resolution

Consulte el artículo 326878 de VMware, Manejo de discos (DDH) moribundo en vSAN Este hipervínculo lo redirige a un sitio web fuera de Dell Technologies. 

No quite ni reemplace el disco durante las siguientes situaciones cuando la resincronización de vSAN esté en curso. Si lo hace, puede producirse una pérdida de datos.

Impending permanent disk failure, data evacuation failed due to insufficient resources (Health state - Red)

O bien,

Impending permanent disk failure, data evacuation failed due to inaccessible objects (Health state - Red)

No quite ni reemplace un disco cuando no se pueda acceder al objeto.
"Objeto inaccesible" significa que faltan todas las copias del objeto. Si quita o reemplaza un disco, esto puede causar una pérdida de datos.

Solución alternativa:

  1. Involucrar a VMware
  2. Si una latencia de I/O excesiva causó el estado incorrecto del disco de capacidad, recupere el disco mediante el remontaje. Volver a montar el disco no cambia el UUID de vSAN del disco.
esxcli vsan storage diskgroup unmount -u <disk group UUID>
esxcli vsan storage diskgroup mount -u <disk group UUID>

Affected Products

VMware VSAN
Article Properties
Article Number: 000186364
Article Type: Solution
Last Modified: 17 Jun 2025
Version:  9
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.