OpenShift-händelsekod: 1038NOD0007
Résumé: Filsystemet förutspås få slut på utrymme inom de närmaste 4 timmarna.
Symptômes
När ett filsystem börjar få ont om utrymme försämras systemets prestanda vanligtvis gradvis.
Om ett filsystem fylls och får slut på utrymme kan processer som behöver skriva till filsystemet inte längre göra det, vilket kan leda till förlorade data och instabilitet i systemet.
Cause
Informationen NodeFilesystemSpaceFillingUp Aviseringen utlöses när två villkor är uppfyllda:
- Den aktuella användningen av filsystemet överskrider ett visst tröskelvärde.
- En extrapoleringsalgoritm förutsäger att filsystemet kommer att få slut på utrymme inom en viss tid. Om tidsperioden är kortare än 24 timmar är detta en
WarningAlert. Om tiden är mindre än 4 timmar är detta enCriticalAlert.
Résolution
Diagnos
-
Studera de senaste trenderna för filsystemanvändning på en instrumentpanel. Ibland kan ett periodiskt mönster för skrivning och rensning i filsystemet göra att den linjära förutsägelsealgoritmen utlöser en falsk avisering.
-
Använd Linux-operativsystemets verktyg och verktyg för att undersöka vilka kataloger som använder mest utrymme i filsystemet. Är problemet ett oregelbundet tillstånd, till exempel en process som inte städar upp bakom sig själv och använder mycket utrymme? Eller verkar problemet vara relaterat till organisk tillväxt?
För att hjälpa dig med din diagnos kan du titta på följande mått i PromQL(kör frågan på OCP-webbkonsolen: Observera → mått → kör frågor):
node_filesystem_free_bytes |
Kontrollera sedan mountpoint etikett för aviseringen.
Lindring
Om den mountpoint etiketten är /, /sysroot eller /vartar du bort oanvända bilder för att lösa problemet:
-
Felsök noden genom att komma åt nodens filsystem:
$ NODE_NAME=<instansetikett från varning> $ oc -n standardnod för felsökning/$NODE_NAME $ chroot /värd
-
Ta bort dinglande bilder:
$ podman bilder -q -f dingling=true | xargs --no-run-if-empty podman rmi
-
Ta bort bilder som inte används:
$ Podman bilder | grep -v -e registry.redhat.io -e "quay.io/openshift" -e registry.access.redhat.com -e docker-registry.usersys.redhat.com -e docker-registry.ops.rhcloud.com -e rhmap | xargs --no-run-if-empty podman rmi 2>/dev/null
-
Avsluta felsökning:
$ avsluta $ avsluta
Support
Om inget av stegen ovan kan lösa problemet kontaktar du Dell EMC:s tekniska support för vidare undersökning.