Dell NativeEdge: Comportamiento del almacén de datos compartido con un defecto de kernel conocido
Summary: En este artículo de la base de conocimientos, se documenta el comportamiento previsto e intencional de la versión de NativeEdge v4.2.0.0: Para evitar daños en los discos de VM, NativeEdge deshabilita discard="unmap" en almacenes de datos compartidos. Como resultado, la recuperación automática de almacenamiento no se produce hasta que se resuelve el problema subyacente del kernel de Ubuntu. ...
Symptoms
En el lanzamiento de NativeEdge v4.2.0.0, en "Shared_DataStore", los usuarios observan que la capacidad de almacenamiento utilizada aumenta gradualmente, incluso cuando se eliminan los archivos dentro de la VM. Y la recuperación de almacenamiento no se realiza automáticamente.
El comportamiento es el resultado de una observación interna informada en la que, en entornos escalados con una gran cantidad de VM implementadas para Shared_DataStore, las máquinas virtuales pueden:
- Falla en el arranque,
- Se queda atascado en una pantalla de firmware o gestor de arranque,
- O experimentar errores de I/O de disco, como
"Block device libvirt-3-format is ejected."
El problema apareció varias horas después de la implementación correcta (por lo general, ~8 horas).
Cause
La versión 4.2.0.0 de NativeEdge presentó un nuevo parámetro de VM: discard="unmap"
Esto se agregó para admitir la funcionalidad TRIM y resolver un problema con un cliente anterior para recuperar espacio no utilizado en la máquina virtual. Sin embargo, cuando las VM se implementan en Shared_DataStore, la habilitación de discard="unmap" conduce a daños en el disco de la VM debido a un problema de kernel en Ubuntu 24.04 que afecta a block-discard operaciones en CephFS.
Cuando… discard="unmap" se deshabilitó (discard="ignore") para el almacenamiento compartido, se ignoran todas las operaciones de TRIM/descarte de VM que se emiten desde el sistema operativo al sistema de archivos CephFS. Esto hará que los bloques eliminados dentro de la VM (espacio no utilizado) no se puedan reclamar o no regresen al almacén de datos compartido, lo que da como resultado un crecimiento constante del uso del almacén de datos compartido con el tiempo.
Esto no es una regresión, y es el comportamiento en el software lanzado hasta que se restaure el soporte del kernel ascendente.
Resolution
- Continuar usando
`discard="ignore"`para`Shared_DataStore`VM en NativeEdge v4.2.0.0 para evitar daños en las VM. - Volver a habilitar
discard="unmap"solo después de que Ubuntu lance un parche de kernel validado. Destino actual desconocido