Openshift Event Code: 1038NODE0007
Résumé: Filesystemet er spådd å gå tom for plass i løpet av de neste 4 timene.
Symptômes
Når et filsystem begynner å få lite plass, forringes systemytelsen vanligvis gradvis.
Hvis et filsystem fylles opp og går tom for plass, kan prosesser som må skrive til filsystemet, ikke lenger gjøre det, noe som kan føre til tapte data og ustabilitet i systemet.
Cause
Informasjonen i NodeFilesystemSpaceFillingUp Varselutløsere når to betingelser er oppfylt:
- Den nåværende filsystembruken overskrider en viss terskel.
- En ekstrapoleringsalgoritme forutsier at filsystemet vil gå tom for plass innen en viss tid. Hvis tidsperioden er mindre enn 24 timer, er dette en
WarningVarsel. Hvis tiden er mindre enn 4 timer, er dette enCriticalVarsel.
Résolution
Diagnose
-
Studer de nyeste trendene for bruk av filsystemer på et instrumentbord. Noen ganger kan et periodisk mønster for skriving og opprydding i filsystemet føre til at den lineære prediksjonsalgoritmen utløser et falskt varsel.
-
Bruk Linux-operativsystemverktøyene og verktøyene til å undersøke hvilke kataloger som bruker mest plass i filsystemet. Er problemet en uregelmessig tilstand, for eksempel en prosess som ikke klarer å rydde opp bak seg selv og bruker mye plass? Eller ser problemet ut til å være relatert til organisk vekst?
Hvis du vil ha hjelp til diagnosen, kan du se følgende beregning i PromQL (utfør spørringen på OCP-nettkonsollen: Vær oppmerksom på → Metrics → Run-spørringer):
node_filesystem_free_bytes |
Kontroller deretter mountpoint etikett for varselet.
Klimatiltak
Hvis mountpoint etiketten er /, /sysroot eller /var, fjern ubrukte bilder for å løse problemet:
-
Feilsøk noden ved å få tilgang til nodefilsystemet:
$ NODE_NAME=<forekomstetikett fra varsel> $ oc -n default debug node/$NODE_NAME $ chroot / vert
-
Fjern dinglende bilder:
$ podman bilder-q-f dingling = sant | xargs --no-run-if-empty podman rmi
-
Fjern ubrukte bilder:
$ Podman bilder | grep -v -e registry.redhat.io -e "quay.io/openshift" -e registry.access.redhat.com -e docker-registry.usersys.redhat.com -e docker-registry.ops.rhcloud.com -e rhmap | xargs --no-run-if-empty podman rmi 2>/dev/null
-
Avslutt feilsøking:
$ avslutt $ avslutt
Support
Hvis alle trinnene ovenfor ikke kan løse problemet, kontakter du teknisk støtte hos Dell EMC for videre undersøkelser.