PowerStore : Article général sur les redémarrages inattendus du nœud
Riepilogo: Afin d’identifier pleinement la cause d’un redémarrage ou de fournir une analyse complète des causes premières (RCA), divers journaux sont nécessaires. ...
Questo articolo si applica a
Questo articolo non si applica a
Questo articolo non è legato a un prodotto specifico.
Non tutte le versioni del prodotto sono identificate in questo articolo.
Sintomi
Le code d’erreur ou d’événement le plus probable pour ce problème est le suivant : 0x00304404
Description : Le nœud a été physiquement retiré ou arrêté.
Exemple de PowerStore Manager :
ATTENTION : Un redémarrage du nœud peut déclencher d’autres alertes secondaires ou des appels à distance, tels que :
Description : Le nœud a été physiquement retiré ou arrêté.
Exemple de PowerStore Manager :
ATTENTION : Un redémarrage du nœud peut déclencher d’autres alertes secondaires ou des appels à distance, tels que :
- Alertes d’échec de liaison de port (code d’événement 0x00307404). Pour plus d’informations, reportez-vous à la section Alertes PowerStore : Échec de la liaison du port.
- Alertes d’état d’intégrité du port (codes d’événement : 0x00305302, 0x00305303, 0x00305402, 0x00305403). Pour plus d’informations, reportez-vous à la section Alertes PowerStore : États d’intégrité du port du nœud
Remarque : La plupart des redémarrages de nœuds sont corrigés en effectuant une mise à jour vers la dernière version de PowerStoreOS. Reportez-vous à la section 1. de PowerStore : Hub d’informations - documentation et vidéos produit .
Causa
Un nœud PowerStore peut redémarrer de manière inattendue pour diverses raisons.
Chaque redémarrage inattendu doit faire l’objet d’une investigation séparée.
Reportez-vous à la section Informations supplémentaires ci-dessous pour plus d’informations sur les éléments nécessaires à cette investigation.
Chaque redémarrage inattendu doit faire l’objet d’une investigation séparée.
Reportez-vous à la section Informations supplémentaires ci-dessous pour plus d’informations sur les éléments nécessaires à cette investigation.
Risoluzione
Il existe quelques options pour rechercher des redémarrages inattendus des nœuds.
Connectez-vous au cluster via ssh et exécutez svc_dc list_dumps
Vous pouvez également essayer de trouver des fichiers de vidage à partir de PowerStore Manager. Pour plus détails, consultez PowerStore : Comment générer et collecter différents journaux à partir de PowerStore.
Pour vous connecter aux nœuds via ssh, recherchez l’adresse IP du cluster ou du nœud dans PowerStore Manager sous Paramètres > Adresses IP réseau. Connectez-vous avec votre client ssh préféré à l’aide du compte d’utilisateur de maintenance et du mot de passe de l’utilisateur de maintenance respectif (défini lors de la configuration de votre système).
Cela est également utile, car certains redémarrages inattendus peuvent ne pas produire de fichier de vidage.
Vérification des alertes et des événements à partir de PowerStore Manager (interface graphique utilisateur)
Vérifiez les événements et les alertes qui peuvent indiquer un redémarrage inattendu du nœud :- Dans PowerStore Manager, vérifiez la section Surveillance et examinez les détails sous les onglets ALERTES et ÉVÉNEMENTS .
- Recherchez les horodatages, codes d’erreur ou d’événement, messages, et ainsi de suite. Afin de rendre vos recherches plus claires, utilisez les options de filtre dans les onglets ALERTES et ÉVÉNEMENTS :
Recherche de fichiers de vidage
Vérifiez qu’il existe des fichiers de vidage système datant du moment où les erreurs se sont produites.Connectez-vous au cluster via ssh et exécutez svc_dc list_dumps
Vous pouvez également essayer de trouver des fichiers de vidage à partir de PowerStore Manager. Pour plus détails, consultez PowerStore : Comment générer et collecter différents journaux à partir de PowerStore.
Pour vous connecter aux nœuds via ssh, recherchez l’adresse IP du cluster ou du nœud dans PowerStore Manager sous Paramètres > Adresses IP réseau. Connectez-vous avec votre client ssh préféré à l’aide du compte d’utilisateur de maintenance et du mot de passe de l’utilisateur de maintenance respectif (défini lors de la configuration de votre système).
Vérification du temps d’activité sur les deux nœuds
Exécutez la commande temps d’activité sur les deux nœuds. Cela vous indiquera la durée pendant laquelle le nœud était opérationnel et vous aidera à confirmer les redémarrages possibles.Cela est également utile, car certains redémarrages inattendus peuvent ne pas produire de fichier de vidage.
Autres indicateurs
Un écart dans les graphiques de performances dans PowerStore Manager peut également indiquer un redémarrage du nœud. Ces informations ne doivent être utilisées qu’à titre indicatif, et vous devez confirmer avec d’autres preuves comme suggéré ci-dessus. Les graphiques de performances sont disponibles à partir de Tableau de bord > PERFORMANCE, ou Matériel > Appliance X > Performance.Informazioni aggiuntive
Quels sont les éléments nécessaires à une analyse des causes premières (RCA) ?
- Documents de support de toutes les appliances du cluster. Ces éléments doivent être collectés le plus près possible du redémarrage.
- Fichier de vidage
Prodotti interessati
PowerStoreProprietà dell'articolo
Numero articolo: 000130141
Tipo di articolo: Solution
Ultima modifica: 16 ago 2023
Versione: 14
Trova risposta alle tue domande dagli altri utenti Dell
Support Services
Verifica che il dispositivo sia coperto dai Servizi di supporto.