PowerEdge: Linux OS-kørsel af ressourcer, der forårsager en genstart
Summary: SUSE Linux Enterprise Server til SAP blev genstartet med mellemrum, en eller to gange hver uge.
Symptoms
I klyngelogfilerne angives det, at den sekundære genstartede den primære node på grund af den ressourceovervågede klyngefejl.
Cause
Gennemgik logfilerne før genstart og fandt som følger.
Resolution
Med fejlen "Ressource midlertidigt utilgængelig" indikerer dette, at operativsystemet var ved at løbe tør for ressourcer.
I dette tilfælde skal du kontrollere SAR-rapporten på det tidspunkt, før serveren blev genstartet.
00:00:01 runq-sz plist-sz ldavg-1 ldavg-5 ldavg-15 blocked
16:40:01 20 32595 9.01 9.97 5.46 0
16:50:01 15 32611 1.49 2.81 3.70 0
Der kører 32.611 processer. De maksimale tilladte processer er dog:kernel.pid_max = 32768 (Hent dette fra logfilen env.txt eller fra OS-kommandoen "sysctl -a | grep pid_max"
Så dette konkluderede, at serveren nåede til de maksimalt tilladte processer. Kunden kan kontrollere med kommando "ps aux" at gennemgå, om alle processerne er nødvendige, eller det kan være, at processerne ikke stoppes ordentligt og fortsætte med at skabe nye processer.
Løste de unødvendige processer, løste problemet