PowerEdge: Linux İşletim Sistemi Kaynaklarının Çalıştırılması Yeniden Başlatmaya Neden Oluyor
Summary: SAP için SUSE Linux Enterprise Server, haftada bir veya iki kez aralıklı olarak yeniden başlatıldı.
Symptoms
Küme günlüklerinden, küme kaynağı tarafından izlenen arıza nedeniyle ikincil düğümün birincil düğümü yeniden başlattığı gösterilir.
Cause
Yeniden başlatmadan önce günlükleri inceledim ve aşağıdaki gibi bulundu.
Resolution
"Kaynak geçici olarak kullanılamıyor" hatasının olması, işletim sisteminin kaynaklarının tükenmekte olduğunu gösterir.
Bu durumda, sunucu yeniden başlatılmadan önceki SAR raporunu kontrol edin.
00:00:01 runq-sz plist-sz ldavg-1 ldavg-5 ldavg-15 blocked
16:40:01 20 32595 9.01 9.97 5.46 0
16:50:01 15 32611 1.49 2.81 3.70 0
Çalışan 32.611 işlem var. Ancak izin verilen maksimum işlem sayısı şunlardır:kernel.pid_max = 32768 (Bunu günlük dosyasından alın env.txt veya işletim sistemi komutundan "sysctl -a | grep pid_max"
Böylece bu, sunucunun izin verilen maksimum işlemlere ulaştığı sonucuna vardı. Müşteri şu komutla kontrol edebilir: "ps aux" tüm süreçlere ihtiyaç duyulup duyulmadığını veya süreçlerin düzgün bir şekilde durdurulup durdurulmadığını gözden geçirmek ve yeni süreçler oluşturmaya devam etmek.
Gereksiz işlemler düzeltildi, sorun çözüldü