Data Domain: Přehled služby správy systému (SMS)
Summary: Služba správy systému (SMS) je démon, který naslouchá příchozím příkazům od klientů, jako je uživatelské rozhraní Správce systému nebo příkazový řádek DD. Pokud SMS není spuštěna, systém se stane nespravovatelným a nereaguje přes uživatelské rozhraní nebo příkazový řádek; Funkce zálohování/obnovení by však neměla být ovlivněna. SMS má ve své servisní frontě osm příkazových slotů a může pracovat na osmi příkazech paralelně. Pokud se všechny úlohy v servisní frontě z nějakého důvodu zaseknou, SMS čeká 2 hodiny, než zahájí restartování. ...
Symptoms
Běžné příznaky, když se vyskytne problém s SMS:
- Rozhraní DD-CLI v omezené relaci
- Nelze provést ověření nebo interakci prostřednictvím uživatelského rozhraní nástroje PowerProtect DD System Manager (DDSM).
- Hlášení příkazů DD-CLI
*** Error connecting to management service at "localhost" - Server SMS vygeneroval výpisy paměti jádra a nereaguje
- Neplatná nebo ukončená licence (ID uzamčení) (viz článek znalostní databáze --000050243)
NOTICE: Elicense refresh error: DD_DDBOOST license: **** Invalid locking id of DD_DDBOOST.. NOTICE: Elicense refresh error: DD_REPLICATION license: **** Invalid locking id of DD_REPLICATION.
Cause
K problémům s SMS dochází, když je fronta služeb zahlcena nereagujícími příkazy nebo příkazy
, jejichž vypršel časový limit.Tyto "časové limity" ve frontě služeb lze připsat různým příčinám, například:
- Základní problémy s úložištěm nebo sítí
- Problémy s certifikátem nebo registrem.
- Překročení časového limitu ovladače nebo firmwaru
- Služba nebo démon nereaguje; Například kvůli nevrácení paměti
- Nereagující sada monitorování platformy (například iDRAC, PTAgent)
- Dochází kapacita v adresáři /ddvar
Tady je příklad, kdy vidíme, že se SMS restartovala, protože fronta služeb se zaplnila a po dobu 2 hodin nepokračovaly žádné úlohy:
V souboru sms.log:
06/15 17:48:42.745 (tid 0x3ab4400): Service Queue ----------- 8 jobs 06/15 17:48:42.745 (tid 0x3ab4400): job: 2421162, completed: NO, start_time: 1371328844356, end_time: 0, duration: 0 msec, operation: sms_enclosure_get_fans_status ... 06/15 19:51:42.823 (tid 0x3ab4400): INFO: Event posted: 341: EVT-SMS-00001: System management server restarted due to no progress for 120 minutes.
Tady vidíme, že nejstarší spuštěná úloha byla sms_enclosure_get_fans_status se všemi ostatními sloty fronty služeb spotřebovanými jinými úlohami.
V důsledku toho:
- sms_enclosure_get_fans_status byla spawnována a předána do nižších vrstev, než se zmocnila zdymadel
- sms_enclosure_get_fans_status nebyl schopen dokončit (doloženo: "dokončeno: NE')
- Jiné úlohy vyžadují přístup k zámkům, které drží sms_enclosure_get_fans_status proto je nelze spustit.
- Protože sms_enclosure_get_fans_status nelze dokončit, nacházíme se v zablokovací situaci, dokud SMS po 2 hodinách nezahájí restartování
V tomto příkladu základní modul BMC (neboli iDRAC) přestal reagovat, což vedlo k tomu, že server SMS nemohl dokončit zadané příkazy.
Resolution
-
Zkontrolujte, zda v systému běží SMS. Pokud tomu tak není, systém nemá přístup k uživatelskému rozhraní nebo příkazovému řádku, což může způsobit chyby, jako je "nelze kontaktovat službu správy" nebo příkazy přestanou reagovat na neurčito.
- Restartujte službu SMS pomocí rozhraní příkazového řádku DD-CLI.
sms restart
Poznámka: V některých verzích systému DDOS je tento příkaz omezen na režim "SE Mode" (v takovém případě kontaktujte podporu společnosti Dell a nechte nás příkaz prozkoumat a spustit).
- Restartujte službu SMS pomocí rozhraní příkazového řádku DD-CLI.
-
Je možné, že vypršení časových limitů SMS způsobí výpis jádra nebo neočekávané restartování. Pokud ano, vygenerujte balíček podpory, shromážděte relevantní výpis jádra a kontaktujte poskytovatele technické podpory, aby prozkoumal příčinu.