Dell Unity: SP'ler günlük şişirilmesi nedeniyle Servis Moduna girebilir (/nbsnas bölümü %100 dolu olur)
Summary: Bir dizi, günlük şişirilmesi nedeniyle Servis Moduna (Veri Kullanılamıyor) girebilir (Dell Tarafından Düzeltilebilir)
Symptoms
Çift SP dizileri için depolama sisteminin bir SP'si servis moduna geçer ve sistemin tamamı CLI, UI, REST API ve SMI-S dahil olmak üzere yönetim arabirimleri aracılığıyla çalıştırılamaz. Bu durum, her iki SP de Servis Moduna geçene kadar SP'lerin dönüşümlü olarak yeniden başlatılması şeklinde de görülebilir.
Her iki SP'nin de servis modunda olduğu bir Unity dizisi G/Ç hizmeti vermez. Bu nedenle bu, Veri Yok (DU) durumu anlamına gelir.
VSA için tek SP, servis modunda yeniden başlatılarak veya normal modda kalarak her iki durumda da yönetimi kaybedebilir.
Sistemin tamamı, CLI, UI, REST API ve SMI-S dahil olmak üzere yönetim arabirimleri aracılığıyla çalıştırılamaz.
SSH veya IPMI çalışmalıdır. IPMI her zaman çalışır, SSH yalnızca dizi stabilize edildikten sonra çalışabilir.
Bu sorun OE 4.0.0.x sürümünde bulunur ve OE 4.0.1.x sürümünde düzeltilir.
Cause
Kullanıcı arayüzü ve REST'ten gelen her isteği kaydeden /nbsnas/http/logs/mod_jk.log günlük dosyası, birincil SP'nin /nbsnas'ına bağlı bir dosya sisteminde bulunur. Günlük döndürme mekanizması olmadan bu dosyanın şişirilmesi, dosya sisteminin kullanılabilir alanını tüketmeye devam eder. Diğer dahili tüketiciler, dosya sisteminde boşluk kalmadığında başarısız olmaya başlar. SP'lerden biri, bu bileşenlerin tekrarlanan arızalarını algıladığında servis moduna girer.
Laboratuvarda, bu gerçekleştiğinde ve hizmetler ikincil SP'ye yük devretmeye çalıştığında da aynı belirtilerle karşılaştığı gözlemlenmiştir. SP'ler sırayla birkaç kez yeniden başlatılır ve sonunda her ikisi de servis moduna girer.
Müşteriler bu sorunu şu durumlarda görür: Depolama sistemini yapılandırmak için her zaman kullanıcı arayüzü veya REST API kullanın veya kullanıcı arayüzünü tarayıcıda açın ve kapatmadan orada bırakın. Yalnızca kullanıcı arayüzü erişimiyle, normalde müşterilerin bu sorunu görmesi birkaç ay sürer. Müşteriler depolama sisteminden sık sık veri sorgulamak için REST API kullanıyorsa bu sorun daha hızlı gerçekleşir.
Unity OE 4.0.1.8320161 sürümüne yükseltmenin, NDU sırasında söz konusu günlük dosyasını yineleyip işlemi hızlandırabileceğinden sorunu daha da kötüleştirebileceği ikinci bir sorun bulundu.
/nbsbas üzerindeki alan tüketimini denetleyerek bu durumu doğrulayabilirsiniz. Alan tüketimi minimum düzeyde veya düşükse NDU sırasında bu sorunla YAŞAMIŞSINIZDIR ve bu nedenle başka bir şeye gerek yoktur .
4.0.1.x kodları zaten ana sorunun çözümünü içeriyor, bu nedenle günlük döndürmenin kendisi düzgün çalışıyor.
Bölüm çok yüksek bir kullanım yüzdesi gösteriyorsa sorumlu günlük dosyalarının silinmesi gerekebilir (Dell desteği gerektirir).
Alan kullanımının nasıl kontrol edileceğine ve hangi günlüklerin silineceğine ilişkin örnek notlar bölümünde bulunabilir.
Dell, Unity ve UnityVSA için Unity OE 4.0.1.8320161 i support.emc.com'dan kaldırmaya karar verdi. Eylül 2016'da revize edilmiş bir Unity OE sürümü (4.0.1.8404134) yayımlanmıştır.
Resolution
Bu sorunu çözmek için Teknik Desteğin diziye kök erişimi kazanması gerekir.
Unity Teknik Destek ile iletişime geçin ve şu KB makalesinden bahsedin: 489057
Additional Information
Alan kullanımının nasıl kontrol edileceğine ilişkin örnek:
spX:~> df -h /nbsnas Filesystem Size Used Avail Use% Mounted on /dev/c4nasdba1 1013M 55M 908M 6% /nbsnas
Buna neden olan günlük veya günlükler /nbsnas/http/logs dosyasında bulunabilir:
spx:~> cd /nbsnas/http/logs spx:/nbsnas/http/logs> ll -h total 975M -rw-r--r-- 1 root root 12K Sep 8 13:32 access_log -rw-r--r-- 1 root root 165K Sep 8 08:45 access_log.1.gz -rw-r--r-- 1 root root 239K Sep 8 06:59 access_log.2.gz -rw-r--r-- 1 root root 1.6M Sep 8 13:32 error_log -rw-r--r-- 1 root root 167K Sep 3 04:56 error_log.1.gz -rw-r--r-- 1 root root 495M Sep 8 13:32 mod_jk.log <<<<<<<<<< -rw-r--r-- 1 root root 475M Sep 8 08:45 mod_jk.log.1 <<<<<<<<<<
svc_dc -lcd (liste çekirdek dökümleri) sırasında "_mgmtd" sonekine sahip birkaç döküm de gösterilebilir.
Bunlar, bazı hizmetler başlatılamadığından (/nbsnas ın dolu olması nedeniyle) SP'ler paniklediğinde oluşturulmuştur.
spx:/> svc_dc -lcd ======================== [DC copier]: Available on backend: CP_dump_spb_CKM00161701xxx_2016-09-08_13_29_47_17275_ECOM core-dump_dump_spb_CKM00161701xxx_2016-09-08_08_46_23_778_mgmtd core-dump_dump_spb_CKM00161701xxx_2016-09-08_09_18_19_11994_mgmtd core-dump_dump_spb_CKM00161701xxx_2016-09-08_09_18_53_21524_mgmtd core-dump_dump_spb_CKM00161701xxx_2016-09-08_09_41_05_11446_mgmtd core-dump_dump_spb_CKM00161701xxx_2016-09-08_09_41_45_24620_mgmtd core-dump_dump_spb_CKM00161701xxx_2016-09-08_13_28_30_3067_mgmtd core-dump_dump_spb_CKM00161701xxx_2016-09-08_13_29_08_15086_mgmtd