Код события Openshift: 1038УЗЕЛ0007
Résumé: По прогнозам, в файловой системе скоро закончится пространство.
Symptômes
По мере того как в файловой системе начинает заканчиваться пространство, производительность системы обычно постепенно снижается.
Если файловая система заполняется и в ней заканчивается пространство, процессы, которым необходимо записывать в файловую систему, больше не могут этого делать, что может привести к потере данных и нестабильности системы.
Cause
Переменная NodeFilesystemSpaceFillingUp Оповещение срабатывает при выполнении следующих двух условий:
- Текущее использование файловой системы превышает определенный пороговый уровень.
- Алгоритм экстраполяции предсказывает, что в файловой системе будет исчерпано пространство в течение определенного времени. Если этот период времени составляет менее 24 часов, это
WarningОповещения. Если прошло менее 4 часов, этоCriticalОповещения.
Résolution
Диагностика
-
Изучение последних тенденций использования файловой системы на панели управления. Иногда периодическая последовательность записи и очистки в файловой системе может привести к тому, что алгоритм линейного прогнозирования выдаст ложное оповещение.
-
Используйте инструменты и служебные программы операционной системы Linux для поиска каталогов, занимающих больше всего места в файловой системе. Является ли проблема нерегулярной, например, процесс не убирается за собой и занимает много места? Или проблема связана с органическим ростом?
Чтобы помочь в диагностике, просмотрите следующую метрику в PromQL (выполните запрос в веб-консоли OCP): Обратите внимание на метрики → → выполнения запросов.
node_filesystem_free_bytes |
Затем проверьте mountpoint для оповещения.
Смягчения
Если mountpoint label имеет значение /, /sysroot или /var, удалите неиспользуемые образы, чтобы решить эту проблему:
-
Выполните отладку узла, обратившись к его файловой системе:
$ NODE_NAME=<метка экземпляра из оповещения> $ oc -n узел отладки по умолчанию/$NODE_NAME $ chroot /хост
-
Удаление висячих изображений:
$ podman images -q -f dangling=true | xargs --no-run-if-empty podman rmi
-
Удалите неиспользуемые образы:
$ podman изображения | grep -v -e registry.redhat.io -e "quay.io/openshift" -e registry.access.redhat.com -e docker-registry.usersys.redhat.com -e docker-registry.ops.rhcloud.com -e rhmap | xargs --no-run-if-empty podman rmi 2>/dev/null
-
Выход из отладки:
$ выход $ выход
Поддержка
Если все вышеперечисленные действия не помогли решить проблему, обратитесь в службу технической поддержки Dell EMC для дальнейшего изучения.