PowerEdge: Ausführung von Ressourcen durch Linux-Betriebssystem, was zu einem Neustart führt
Summary: SUSE Linux Enterprise Server for SAP wurde mit Unterbrechungen ein- bis zweimal pro Woche neu gestartet.
Symptoms
Aus den Clusterprotokollen geht hervor, dass der sekundäre Node den primären Node aufgrund des von den Clusterressourcen überwachten Fehlers neu gestartet hat.
Cause
Die Protokolle wurden vor dem Neustart überprüft und wie folgt festgestellt:
Resolution
Der Fehler "Ressource vorübergehend nicht verfügbar" weist darauf hin, dass dem Betriebssystem die Ressourcen
ausgehen.Überprüfen Sie in diesem Fall den SAR-Bericht zu dem Zeitpunkt, bevor der Server neu gestartet wurde.
00:00:01 runq-sz plist-sz ldavg-1 ldavg-5 ldavg-15 blocked
16:40:01 20 32595 9.01 9.97 5.46 0
16:50:01 15 32611 1.49 2.81 3.70 0
32.611 Prozesse werden ausgeführt. Die maximal zulässigen Prozesse sind jedoch:kernel.pid_max = 32768 (Rufen Sie dies aus der Protokolldatei ab. env.txt oder über den Betriebssystembefehl "sysctl -a | grep pid_max"
Damit war der Schluss gezogen, dass der Server die maximal zulässige Anzahl von Prozessen erreicht hat. Der Kunde kann dies mit dem Befehl "ps aux", um zu überprüfen, ob alle Prozesse erforderlich sind, oder es könnte sein, dass die Prozesse nicht ordnungsgemäß gestoppt werden und immer wieder neue Prozesse erstellt werden.
Unnötige Prozesse wurden behoben und das Problem behoben