PowerStore: Obecný článek o neočekávaných restartech uzlů
Summary: Aby bylo možné plně identifikovat příčinu restartování nebo poskytnout úplnou analýzu hlavní příčiny (RCA), jsou potřeba různé protokoly. ...
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Symptoms
Nejpravděpodobnější událostí nebo chybovým kódem tohoto problému je: 0x00304404
Popis: Node has been physically removed or shut down.
Příklad z nástroje PowerStore Manager:
UPOZORNĚNÍ: Restartování uzlu může spustit další sekundární výstrahy nebo požadavky Dial Home, například:
Popis: Node has been physically removed or shut down.
Příklad z nástroje PowerStore Manager:
UPOZORNĚNÍ: Restartování uzlu může spustit další sekundární výstrahy nebo požadavky Dial Home, například:
- Výstrahy selhání spojení portů (kód události 0x00307404). Další podrobnosti najdete v článku Výstrahy Alerts: Selhání připojení portů.
- Výstrahy stavu portu (kódy událostí: 0x00305302, 0x00305303, 0x00305402, 0x00305403). Další podrobnosti najdete v článku Výstrahy Alerts: Stavy portů uzlu
POZNÁMKA: Většina restartů uzlů je opravena aktualizací na nejnovější systém PowerStoreOS. Viz 1. část článku PowerStore: Informační centrum – Dokumentace a videa k produktu.
Cause
Uzel PowerStore se může neočekávaně restartovat z různých důvodů.
Každý neočekávaný restart by měl být zkoumán samostatně.
Podrobnosti o tom, co je pro toto vyšetřování potřeba, naleznete v části Další informace níže.
Každý neočekávaný restart by měl být zkoumán samostatně.
Podrobnosti o tom, co je pro toto vyšetřování potřeba, naleznete v části Další informace níže.
Resolution
Existuje několik možností, jak zkontrolovat neočekávané restartování uzlu.
Přihlaste se ke clusteru pomocí protokolu ssh a spusťte příkaz svc_dc list_dumps.
Můžete se také pokusit najít soubory výpisu z nástroje PowerStore Manager. Další podrobnosti naleznete v článku PowerStore: Jak generovat a shromažďovat různé protokoly z úložiště PowerStore.
Chcete-li se k uzlům přihlásit přes ssh, vyhledejte IP adresu clusteru nebo uzlu v nástroji PowerStore Manager v části Settings > Network IPs. Přihlaste se pomocí preferovaného klienta ssh pomocí servisního uživatelského účtu a příslušného uživatelského hesla (definovaného během nastavení systému).
To je také užitečné, protože některé neočekávané restartování nemusí vytvořit soubor výpisu.
Kontrola výstrah a událostí v nástroji PowerStore Manager (GUI)
Zkontrolujte události a výstrahy , které by mohly indikovat neočekávané restartování uzlu:- V nástroji PowerStore Manager zkontrolujte část Monitoring a podívejte se na podrobnosti na kartách ALERTS a EVENTS.
- Hledejte časová razítka, chybové kódy nebo kódy událostí, zprávy atd. Chcete-li, aby vyhledávání bylo přehlednější, použijte možnosti filtru na kartách ALERTA a EVENTS:
Kontrola souborů výpisu
Zkontrolujte, zda existují soubory výpisu systému přibližně v době výskytu chyb.Přihlaste se ke clusteru pomocí protokolu ssh a spusťte příkaz svc_dc list_dumps.
Můžete se také pokusit najít soubory výpisu z nástroje PowerStore Manager. Další podrobnosti naleznete v článku PowerStore: Jak generovat a shromažďovat různé protokoly z úložiště PowerStore.
Chcete-li se k uzlům přihlásit přes ssh, vyhledejte IP adresu clusteru nebo uzlu v nástroji PowerStore Manager v části Settings > Network IPs. Přihlaste se pomocí preferovaného klienta ssh pomocí servisního uživatelského účtu a příslušného uživatelského hesla (definovaného během nastavení systému).
Kontrola provozuschopnosti na obou uzlech
Spusťte příkaz uptime na obou uzlech. Zobrazí se informace o tom, jak dlouho byl uzel v provozu, a pomůže vám potvrdit případné restartování.To je také užitečné, protože některé neočekávané restartování nemusí vytvořit soubor výpisu.
Další ukazatele
Mezera v grafech výkonu v nástroji PowerStore Manager může také znamenat restartování uzlu. To by se mělo používat pouze pro orientaci a musíte potvrdit více důkazů, jak je uvedeno výše. Grafy výkonu jsou k dispozici v části Dashboard > PERFORMANCE nebo Hardware > Appliance X > Performance.Additional Information
Co je potřeba pro analýzu hlavní příčiny (RCA)?
- Materiály podpory ze všech zařízení v clusteru. Ty by měly být shromážděny co nejblíže k restartování.
- Soubor výpisu
Affected Products
PowerStoreArticle Properties
Article Number: 000130141
Article Type: Solution
Last Modified: 16 Aug 2023
Version: 14
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.