Dell Unity: SP mohou přejít do servisního režimu kvůli nadýmání protokolů (oddíl /nbsnas bude 100% plný).

Summary: Pole může přejít do servisního režimu (data nejsou k dispozici) z důvodu nadýmání protokolu (oprava společností Dell)

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

U dvou polí SP přejde jeden procesor úložiště do servisního režimu a celý systém nelze ovládat prostřednictvím rozhraní pro správu, včetně rozhraní pro správu, včetně rozhraní příkazového řádku, uživatelského rozhraní, rozhraní REST API a SMI-S. Může se také projevit střídavým restartováním procesorů úložiště, dokud oba procesory úložiště neskončí v servisním režimu.
Pole Unity s oběma procesory úložiště v servisním režimu nezajistí operace I/O, takže by se mohlo jednat o situaci nedostupnosti dat (DU).

V případě VSA se může jeden procesor úložiště restartovat do servisního režimu nebo zůstat v normálním režimu a v obou případech ztratit správu.

Celý systém nelze provozovat prostřednictvím rozhraní pro správu, včetně CLI, UI, REST API a SMI-S.
SSH nebo IPMI by mělo fungovat. IPMI funguje vždy, SSH může fungovat až po stabilizaci pole.

Tento problém se vyskytuje v prostředí OE verze 4.0.0.x a je opraven ve verzi OE 4.0.1.x.

 

Cause

Soubor protokolu /nbsnas/http/logs/mod_jk.log, který zaznamenává všechny požadavky z uživatelského rozhraní a REST, se nachází v systému souborů připojeném k /nbsnas primárního procesoru úložiště. Bez mechanismu rotace protokolů bude nadýmání tohoto souboru nadále spotřebovávat dostupné místo v systému souborů. Ostatní interní příjemci začnou selhávat, když v systému souborů nezůstane žádné místo. Jeden z procesorů úložiště přejde do servisního režimu, když zjistí opakované poruchy těchto komponent.

V laboratoři bylo pozorováno, že když k tomu dojde a služby se pokusí převzít služby při selhání sekundárním procesorem úložiště, dochází také ke stejným příznakům. Procesory úložiště se několikrát restartují a nakonec oba přejdou do servisního režimu.

Zákazníci se s tímto problémem setkají, pokud: vždy použijte uživatelské rozhraní nebo REST API ke konfiguraci úložného systému nebo otevřete uživatelské rozhraní v prohlížeči a nechte ho tam bez zavření. Při přístupu pouze k uživatelskému rozhraní obvykle trvá několik měsíců, než se tento problém zákazníkům projeví. Pokud zákazníci často používají rozhraní REST API k dotazování na data z úložného systému, dochází k tomuto problému rychleji.

Byl zjištěn druhý problém, kdy upgrade na verzi Unity OE 4.0.1.8320161 může problém ještě zhoršit, neboť během NDU může dojít k duplikování příslušného souboru protokolu, a tím k urychlení procesu.

Zda ano, můžete ověřit kontrolou využití místa na /nbsbas. Pokud je spotřeba místa minimální nebo nízká, k tomuto problému během upgradů bez rušení NEDOŠLO , a proto není potřeba nic dalšího.
Kódy 4.0.1.x již obsahují opravu hlavního problému, takže samotná rotace protokolu funguje správně.
Pokud oddíl vykazuje velmi vysoké procento využití, bude pravděpodobně nutné odstranit příslušné soubory protokolů (vyžaduje podporu společnosti Dell).
Příklad toho, jak zkontrolovat využití místa a jaké protokoly odstranit, najdete v části poznámky.

Společnost Dell se rozhodla odebrat verzi Unity OE 4.0.1.8320161 pro Unity a UnityVSA z support.emc.com. V září 2016 byla vydána revidovaná verze systému Unity OE (4.0.1.8404134).

 

Resolution

K vyřešení tohoto problému je nutné, aby technická podpora získala přístup root k poli.
Obraťte se na technickou podporu Unity a uveďte tento článek znalostní databáze: 489057

 

Additional Information

Příklad kontroly využití místa:

spX:~> df -h /nbsnas
Filesystem      Size  Used Avail Use% Mounted on
/dev/c4nasdba1 1013M   55M  908M   6% /nbsnas

Protokol nebo protokoly, které to způsobují, najdete v umístění /nbsnas/http/logs:

spx:~> cd /nbsnas/http/logs
spx:/nbsnas/http/logs> ll -h
total 975M
-rw-r--r-- 1 root root    12K Sep  8 13:32 access_log
-rw-r--r-- 1 root root   165K Sep  8 08:45 access_log.1.gz
-rw-r--r-- 1 root root   239K Sep  8 06:59 access_log.2.gz
-rw-r--r-- 1 root root   1.6M Sep  8 13:32 error_log
-rw-r--r-- 1 root root   167K Sep  3 04:56 error_log.1.gz
-rw-r--r-- 1 root root   495M Sep  8 13:32 mod_jk.log          <<<<<<<<<<
-rw-r--r-- 1 root root   475M Sep  8 08:45 mod_jk.log.1        <<<<<<<<<<

svc_dc -lcd (list core dumps) může také zobrazit několik výpisů s příponou "_mgmtd".
Ty byly vytvořeny, když dojde k panice procesorů úložiště, protože některé služby nelze spustit (kvůli zaplnění /nbsnas).

spx:/> svc_dc -lcd
========================
[DC copier]: Available on backend:
CP_dump_spb_CKM00161701xxx_2016-09-08_13_29_47_17275_ECOM
core-dump_dump_spb_CKM00161701xxx_2016-09-08_08_46_23_778_mgmtd
core-dump_dump_spb_CKM00161701xxx_2016-09-08_09_18_19_11994_mgmtd
core-dump_dump_spb_CKM00161701xxx_2016-09-08_09_18_53_21524_mgmtd
core-dump_dump_spb_CKM00161701xxx_2016-09-08_09_41_05_11446_mgmtd
core-dump_dump_spb_CKM00161701xxx_2016-09-08_09_41_45_24620_mgmtd
core-dump_dump_spb_CKM00161701xxx_2016-09-08_13_28_30_3067_mgmtd
core-dump_dump_spb_CKM00161701xxx_2016-09-08_13_29_08_15086_mgmtd

 

Affected Products

Dell EMC Unity Family

Products

Dell Unity 300, Dell EMC Unity 300F, Dell EMC Unity 400, Dell EMC Unity 400F, Dell EMC Unity 500, Dell EMC Unity 500F, Dell EMC Unity 600, Dell EMC Unity 600F, Dell EMC Unity Family |Dell EMC Unity All Flash, Dell EMC Unity Family , Dell EMC Unity Hybrid, Dell EMC UnityVSA Professional Edition/Unity Cloud Edition ...
Article Properties
Article Number: 000052256
Article Type: Solution
Last Modified: 18 Dec 2025
Version:  4
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.