PowerStore: Obecný článek o neočekávaných restartech uzlů
摘要: Aby bylo možné plně identifikovat příčinu restartování nebo poskytnout úplnou analýzu hlavní příčiny (RCA), jsou potřeba různé protokoly. ...
本文适用于
本文不适用于
本文并非针对某种特定的产品。
本文并非包含所有产品版本。
症状
Nejpravděpodobnější událostí nebo chybovým kódem tohoto problému je: 0x00304404
Popis: Node has been physically removed or shut down.
Příklad z nástroje PowerStore Manager:
UPOZORNĚNÍ: Restartování uzlu může spustit další sekundární výstrahy nebo požadavky Dial Home, například:
Popis: Node has been physically removed or shut down.
Příklad z nástroje PowerStore Manager:
UPOZORNĚNÍ: Restartování uzlu může spustit další sekundární výstrahy nebo požadavky Dial Home, například:
- Výstrahy selhání spojení portů (kód události 0x00307404). Další podrobnosti najdete v článku Výstrahy Alerts: Selhání připojení portů.
- Výstrahy stavu portu (kódy událostí: 0x00305302, 0x00305303, 0x00305402, 0x00305403). Další podrobnosti najdete v článku Výstrahy Alerts: Stavy portů uzlu
POZNÁMKA: Většina restartů uzlů je opravena aktualizací na nejnovější systém PowerStoreOS. Viz 1. část článku PowerStore: Informační centrum – Dokumentace a videa k produktu.
原因
Uzel PowerStore se může neočekávaně restartovat z různých důvodů.
Každý neočekávaný restart by měl být zkoumán samostatně.
Podrobnosti o tom, co je pro toto vyšetřování potřeba, naleznete v části Další informace níže.
Každý neočekávaný restart by měl být zkoumán samostatně.
Podrobnosti o tom, co je pro toto vyšetřování potřeba, naleznete v části Další informace níže.
解决方案
Existuje několik možností, jak zkontrolovat neočekávané restartování uzlu.
Přihlaste se ke clusteru pomocí protokolu ssh a spusťte příkaz svc_dc list_dumps.
Můžete se také pokusit najít soubory výpisu z nástroje PowerStore Manager. Další podrobnosti naleznete v článku PowerStore: Jak generovat a shromažďovat různé protokoly z úložiště PowerStore.
Chcete-li se k uzlům přihlásit přes ssh, vyhledejte IP adresu clusteru nebo uzlu v nástroji PowerStore Manager v části Settings > Network IPs. Přihlaste se pomocí preferovaného klienta ssh pomocí servisního uživatelského účtu a příslušného uživatelského hesla (definovaného během nastavení systému).
To je také užitečné, protože některé neočekávané restartování nemusí vytvořit soubor výpisu.
Kontrola výstrah a událostí v nástroji PowerStore Manager (GUI)
Zkontrolujte události a výstrahy , které by mohly indikovat neočekávané restartování uzlu:- V nástroji PowerStore Manager zkontrolujte část Monitoring a podívejte se na podrobnosti na kartách ALERTS a EVENTS.
- Hledejte časová razítka, chybové kódy nebo kódy událostí, zprávy atd. Chcete-li, aby vyhledávání bylo přehlednější, použijte možnosti filtru na kartách ALERTA a EVENTS:
Kontrola souborů výpisu
Zkontrolujte, zda existují soubory výpisu systému přibližně v době výskytu chyb.Přihlaste se ke clusteru pomocí protokolu ssh a spusťte příkaz svc_dc list_dumps.
Můžete se také pokusit najít soubory výpisu z nástroje PowerStore Manager. Další podrobnosti naleznete v článku PowerStore: Jak generovat a shromažďovat různé protokoly z úložiště PowerStore.
Chcete-li se k uzlům přihlásit přes ssh, vyhledejte IP adresu clusteru nebo uzlu v nástroji PowerStore Manager v části Settings > Network IPs. Přihlaste se pomocí preferovaného klienta ssh pomocí servisního uživatelského účtu a příslušného uživatelského hesla (definovaného během nastavení systému).
Kontrola provozuschopnosti na obou uzlech
Spusťte příkaz uptime na obou uzlech. Zobrazí se informace o tom, jak dlouho byl uzel v provozu, a pomůže vám potvrdit případné restartování.To je také užitečné, protože některé neočekávané restartování nemusí vytvořit soubor výpisu.
Další ukazatele
Mezera v grafech výkonu v nástroji PowerStore Manager může také znamenat restartování uzlu. To by se mělo používat pouze pro orientaci a musíte potvrdit více důkazů, jak je uvedeno výše. Grafy výkonu jsou k dispozici v části Dashboard > PERFORMANCE nebo Hardware > Appliance X > Performance.其他信息
Co je potřeba pro analýzu hlavní příčiny (RCA)?
- Materiály podpory ze všech zařízení v clusteru. Ty by měly být shromážděny co nejblíže k restartování.
- Soubor výpisu
受影响的产品
PowerStore文章属性
文章编号: 000130141
文章类型: Solution
上次修改时间: 16 8月 2023
版本: 14
从其他戴尔用户那里查找问题的答案
支持服务
检查您的设备是否在支持服务涵盖的范围内。