Dell NativeEdge: Gedeeld datastoregedrag met bekend kerneldefect
Summary: Dit KB-artikel documenteert het verwachte en opzettelijke gedrag voor de NativeEdge v4.2.0.0 release: Om beschadiging van de VM-schijf te voorkomen, schakelt NativeEdge discard="unmap" uit op gedeelde datastores. Als gevolg hiervan vindt het automatisch vrijmaken van storage pas plaats als het onderliggende Ubuntu-kernelprobleem is opgelost. ...
Symptoms
Bij de release van NativeEdge v4.2.0.0 zien gebruikers op "Shared_DataStore" dat de gebruikte storagecapaciteit geleidelijk toeneemt, zelfs wanneer bestanden in de VM worden verwijderd. Het terugwinnen van storage gebeurt niet automatisch.
Het gedrag is het resultaat van een interne gerapporteerde observatie waarbij in geschaalde omgevingen met grote aantallen VM's die zijn geïmplementeerd op Shared_DataStore, virtuele machines het volgende kunnen doen:
- Kan niet opstarten,
- Vast komen te zitten bij een firmware- of bootloader-scherm,
- Of schijf-I/O-fouten ervaren, zoals
"Block device libvirt-3-format is ejected."
Het probleem verscheen enkele uren na de succesvolle implementatie (meestal ~8 uur).
Cause
NativeEdge v4.2.0.0 release introduceerde een nieuwe VM-parameter: discard="unmap"
Dit is toegevoegd om de TRIM-mogelijkheden te ondersteunen en een eerdere klant op te lossen om ongebruikte ruimte in de VM vrij te maken. Wanneer VM's echter op Shared_DataStore worden geïmplementeerd, is het mogelijk om discard="unmap" leidt tot beschadiging van de VM-schijf als gevolg van een kernelprobleem in Ubuntu 24.04 dat block-discard activiteiten op CephFS.
Wanneer discard="unmap" was uitgeschakeld (discard="ignore") voor gedeelde opslag worden alle VM TRIM/verwijderingsbewerkingen die vanuit het besturingssysteem aan het CephFS-bestandssysteem worden uitgegeven, genegeerd. Dit zal ertoe leiden dat de verwijderde blokken in de VM (ongebruikte ruimte) niet kunnen worden teruggevorderd of niet kunnen worden geretourneerd naar de gedeelde datastore, wat resulteert in een gestage groei van het gebruik van de gedeelde datastore in de loop van de tijd.
Dit is geen regressie en is het gedrag in uitgebrachte software totdat upstream-kernelondersteuning is hersteld.
Resolution
- Doorgaan met gebruiken
`discard="ignore"`Voor`Shared_DataStore`VM's in NativeEdge v4.2.0.0 om VM-corruptie te voorkomen. - Opnieuw inschakelen
discard="unmap"pas nadat Ubuntu een gevalideerde kernelpatch heeft uitgebracht. Huidig doel onbekend