PowerEdge. Запуск ресурсов в ОС Linux, вызывающий перезагрузку
Summary: SUSE Linux Enterprise Server для SAP периодически перезагружался один или два раза в неделю.
Symptoms
Из журналов кластера указано, что вторичная сторона перезагрузила основной узел из-за сбоя, отслеживаемого ресурсами кластера.
Cause
Перед перезагрузкой были проверены журналы и обнаружено следующее.
Resolution
Ошибка «Ресурс временно недоступен» указывает на то, что в ОС закончились ресурсы.
В этом случае проверьте отчет SAR на момент до перезагрузки сервера.
00:00:01 runq-sz plist-sz ldavg-1 ldavg-5 ldavg-15 blocked
16:40:01 20 32595 9.01 9.97 5.46 0
16:50:01 15 32611 1.49 2.81 3.70 0
Выполняется 32 611 процессов. Тем не менее, максимально допустимое количество процессов:kernel.pid_max = 32768 (Можно загрузить из файла журнала. env.txt или из команды ОС «sysctl -a | grep pid_max«
Таким образом, мы пришли к выводу, что сервер достиг максимально допустимого количества процессов. Заказчик может проверить это с помощью команды «ps aux» для проверки того, все ли процессы необходимы, или, возможно, процессы не остановлены должным образом, и продолжайте создавать новые процессы.
Исправлены ненужные процессы, исправлена проблема