Dell NativeEdge: Comportamento del datastore condiviso con difetto noto del kernel
Summary: Questo articolo della KB documenta il comportamento previsto e intenzionale per la versione NativeEdge v4.2.0.0: Per evitare il danneggiamento del disco della VM, NativeEdge disabilita discard="unmap" sui datastore condivisi. Di conseguenza, il recupero automatico dello storage non si verifica fino a quando il problema del kernel Ubuntu sottostante non viene risolto. ...
Symptoms
Al rilascio di NativeEdge v4.2.0.0, in "Shared_DataStore", gli utenti osservano che la capacità di storage utilizzata aumenta gradualmente, anche quando vengono eliminati i file all'interno della VM. Inoltre, il recupero dello storage non avviene automaticamente.
Il comportamento è il risultato di un'osservazione interna segnalata in cui in ambienti dimensionati con un numero elevato di VM implementate per Shared_DataStore, le macchine virtuali possono:
- Avvio non riuscito,
- Rimanere bloccati su una schermata del firmware o del bootloader,
- Oppure si verificano errori di I/O del disco, ad esempio
"Block device libvirt-3-format is ejected."
Il problema si è verificato diverse ore dopo il completamento dell'implementazione (in genere ~ 8 ore).
Cause
La versione 4.2.0.0 di NativeEdge ha introdotto un nuovo parametro per le macchine virtuali: discard="unmap"
Questa funzionalità è stata aggiunta per supportare la funzionalità TRIM e risolvere il problema di un cliente precedente per recuperare lo spazio inutilizzato nella VM. Tuttavia, quando le VM vengono implementate su Shared_DataStore, l'abilitazione discard="unmap" porta al danneggiamento del disco della VM a causa di un problema del kernel in Ubuntu 24.04 che influisce block-discard operazioni su CephFS.
Quando discard="unmap" è stato disabilitato (discard="ignore") per lo storage condiviso, tutte le operazioni di TRIM/eliminazione della VM eseguite dal sistema operativo al file system CephFS vengono ignorate. Ciò comporterà che i blocchi eliminati all'interno della VM (spazio inutilizzato) non potranno essere recuperati o non potranno essere restituiti al datastore condiviso, con conseguente crescita costante dell'utilizzo del datastore condiviso nel tempo.
Non si tratta di una regressione e si presenta il comportamento del software rilasciato fino a quando non viene ripristinato il supporto del kernel upstream.
Resolution
- Continuare a utilizzare
`discard="ignore"`Per`Shared_DataStore`VM in NativeEdge v4.2.0.0 per evitare il danneggiamento delle VM. - Riabilita
discard="unmap"solo dopo che Ubuntu rilascia una patch del kernel convalidata. Target corrente sconosciuto