PowerStore : Article général sur les redémarrages inattendus du nœud
Summary: Afin d’identifier pleinement la cause d’un redémarrage ou de fournir une analyse complète des causes premières (RCA), divers journaux sont nécessaires. ...
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Symptoms
Le code d’erreur ou d’événement le plus probable pour ce problème est le suivant : 0x00304404
Description : Le nœud a été physiquement retiré ou arrêté.
Exemple de PowerStore Manager :
ATTENTION : Un redémarrage du nœud peut déclencher d’autres alertes secondaires ou des appels à distance, tels que :
Description : Le nœud a été physiquement retiré ou arrêté.
Exemple de PowerStore Manager :
ATTENTION : Un redémarrage du nœud peut déclencher d’autres alertes secondaires ou des appels à distance, tels que :
- Alertes d’échec de liaison de port (code d’événement 0x00307404). Pour plus d’informations, reportez-vous à la section Alertes PowerStore : Échec de la liaison du port.
- Alertes d’état d’intégrité du port (codes d’événement : 0x00305302, 0x00305303, 0x00305402, 0x00305403). Pour plus d’informations, reportez-vous à la section Alertes PowerStore : États d’intégrité du port du nœud
Remarque : La plupart des redémarrages de nœuds sont corrigés en effectuant une mise à jour vers la dernière version de PowerStoreOS. Reportez-vous à la section 1. de PowerStore : Hub d’informations - documentation et vidéos produit .
Cause
Un nœud PowerStore peut redémarrer de manière inattendue pour diverses raisons.
Chaque redémarrage inattendu doit faire l’objet d’une investigation séparée.
Reportez-vous à la section Informations supplémentaires ci-dessous pour plus d’informations sur les éléments nécessaires à cette investigation.
Chaque redémarrage inattendu doit faire l’objet d’une investigation séparée.
Reportez-vous à la section Informations supplémentaires ci-dessous pour plus d’informations sur les éléments nécessaires à cette investigation.
Resolution
Il existe quelques options pour rechercher des redémarrages inattendus des nœuds.
Connectez-vous au cluster via ssh et exécutez svc_dc list_dumps
Vous pouvez également essayer de trouver des fichiers de vidage à partir de PowerStore Manager. Pour plus détails, consultez PowerStore : Comment générer et collecter différents journaux à partir de PowerStore.
Pour vous connecter aux nœuds via ssh, recherchez l’adresse IP du cluster ou du nœud dans PowerStore Manager sous Paramètres > Adresses IP réseau. Connectez-vous avec votre client ssh préféré à l’aide du compte d’utilisateur de maintenance et du mot de passe de l’utilisateur de maintenance respectif (défini lors de la configuration de votre système).
Cela est également utile, car certains redémarrages inattendus peuvent ne pas produire de fichier de vidage.
Vérification des alertes et des événements à partir de PowerStore Manager (interface graphique utilisateur)
Vérifiez les événements et les alertes qui peuvent indiquer un redémarrage inattendu du nœud :- Dans PowerStore Manager, vérifiez la section Surveillance et examinez les détails sous les onglets ALERTES et ÉVÉNEMENTS .
- Recherchez les horodatages, codes d’erreur ou d’événement, messages, et ainsi de suite. Afin de rendre vos recherches plus claires, utilisez les options de filtre dans les onglets ALERTES et ÉVÉNEMENTS :
Recherche de fichiers de vidage
Vérifiez qu’il existe des fichiers de vidage système datant du moment où les erreurs se sont produites.Connectez-vous au cluster via ssh et exécutez svc_dc list_dumps
Vous pouvez également essayer de trouver des fichiers de vidage à partir de PowerStore Manager. Pour plus détails, consultez PowerStore : Comment générer et collecter différents journaux à partir de PowerStore.
Pour vous connecter aux nœuds via ssh, recherchez l’adresse IP du cluster ou du nœud dans PowerStore Manager sous Paramètres > Adresses IP réseau. Connectez-vous avec votre client ssh préféré à l’aide du compte d’utilisateur de maintenance et du mot de passe de l’utilisateur de maintenance respectif (défini lors de la configuration de votre système).
Vérification du temps d’activité sur les deux nœuds
Exécutez la commande temps d’activité sur les deux nœuds. Cela vous indiquera la durée pendant laquelle le nœud était opérationnel et vous aidera à confirmer les redémarrages possibles.Cela est également utile, car certains redémarrages inattendus peuvent ne pas produire de fichier de vidage.
Autres indicateurs
Un écart dans les graphiques de performances dans PowerStore Manager peut également indiquer un redémarrage du nœud. Ces informations ne doivent être utilisées qu’à titre indicatif, et vous devez confirmer avec d’autres preuves comme suggéré ci-dessus. Les graphiques de performances sont disponibles à partir de Tableau de bord > PERFORMANCE, ou Matériel > Appliance X > Performance.Additional Information
Quels sont les éléments nécessaires à une analyse des causes premières (RCA) ?
- Documents de support de toutes les appliances du cluster. Ces éléments doivent être collectés le plus près possible du redémarrage.
- Fichier de vidage
Affected Products
PowerStoreArticle Properties
Article Number: 000130141
Article Type: Solution
Last Modified: 16 Aug 2023
Version: 14
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.