PowerStore : Article général sur les redémarrages inattendus du nœud

Riepilogo: Afin d’identifier pleinement la cause d’un redémarrage ou de fournir une analyse complète des causes premières (RCA), divers journaux sont nécessaires. ...

Questo articolo si applica a Questo articolo non si applica a Questo articolo non è legato a un prodotto specifico. Non tutte le versioni del prodotto sono identificate in questo articolo.

Sintomi

Le code d’erreur ou d’événement le plus probable pour ce problème est le suivant : 0x00304404
Description : Le nœud a été physiquement retiré ou arrêté.

Exemple de PowerStore Manager :

SLN322081_en_US__1image(18728)

  ATTENTION : Un redémarrage du nœud peut déclencher d’autres alertes secondaires ou des appels à distance, tels que :
Remarque : La plupart des redémarrages de nœuds sont corrigés en effectuant une mise à jour vers la dernière version de PowerStoreOS. Reportez-vous à la section 1. de PowerStore : Hub d’informations - documentation et vidéos produit .

Causa

Un nœud PowerStore peut redémarrer de manière inattendue pour diverses raisons.
Chaque redémarrage inattendu doit faire l’objet d’une investigation séparée.
Reportez-vous à la section Informations supplémentaires ci-dessous pour plus d’informations sur les éléments nécessaires à cette investigation.

Risoluzione

Il existe quelques options pour rechercher des redémarrages inattendus des nœuds.
 

Vérification des alertes et des événements à partir de PowerStore Manager (interface graphique utilisateur)

Vérifiez les événements et les alertes qui peuvent indiquer un redémarrage inattendu du nœud :
  • Dans PowerStore Manager, vérifiez la section Surveillance et examinez les détails sous les onglets ALERTES et ÉVÉNEMENTS .
  • Recherchez les horodatages, codes d’erreur ou d’événement, messages, et ainsi de suite. Afin de rendre vos recherches plus claires, utilisez les options de filtre dans les onglets ALERTES et ÉVÉNEMENTS :
SLN322081_en_US__5image(18730)
 

Recherche de fichiers de vidage

Vérifiez qu’il existe des fichiers de vidage système datant du moment où les erreurs se sont produites.

Connectez-vous au cluster via ssh et exécutez svc_dc list_dumps
Vous pouvez également essayer de trouver des fichiers de vidage à partir de PowerStore Manager. Pour plus détails, consultez PowerStore : Comment générer et collecter différents journaux à partir de PowerStore.

Pour vous connecter aux nœuds via ssh, recherchez l’adresse IP du cluster ou du nœud dans PowerStore Manager sous Paramètres > Adresses IP réseau. Connectez-vous avec votre client ssh préféré à l’aide du compte d’utilisateur de maintenance et du mot de passe de l’utilisateur de maintenance respectif (défini lors de la configuration de votre système).  

 

Vérification du temps d’activité sur les deux nœuds

Exécutez la commande temps d’activité sur les deux nœuds. Cela vous indiquera la durée pendant laquelle le nœud était opérationnel et vous aidera à confirmer les redémarrages possibles.
Cela est également utile, car certains redémarrages inattendus peuvent ne pas produire de fichier de vidage.

 

Autres indicateurs

Un écart dans les graphiques de performances dans PowerStore Manager peut également indiquer un redémarrage du nœud. Ces informations ne doivent être utilisées qu’à titre indicatif, et vous devez confirmer avec d’autres preuves comme suggéré ci-dessus. Les graphiques de performances sont disponibles à partir de Tableau de bord > PERFORMANCE, ou Matériel > Appliance X > Performance.

Informazioni aggiuntive

Quels sont les éléments nécessaires à une analyse des causes premières (RCA) ?

  • Documents de support de toutes les appliances du cluster. Ces éléments doivent être collectés le plus près possible du redémarrage.
  • Fichier de vidage
Voir PowerStore : Comment générer et collecter différents journaux à partir de PowerStore

Prodotti interessati

PowerStore
Proprietà dell'articolo
Numero articolo: 000130141
Tipo di articolo: Solution
Ultima modifica: 16 ago 2023
Versione:  14
Trova risposta alle tue domande dagli altri utenti Dell
Support Services
Verifica che il dispositivo sia coperto dai Servizi di supporto.