PowerStore: Riavvio imprevisto del nodo o errore grave del kernel

Сводка: Per identificare completamente la causa di un riavvio o fornire una Root Cause Analysis (RCA) completa, sono necessari vari log.

Данная статья применяется к Данная статья не применяется к Эта статья не привязана к какому-либо конкретному продукту. В этой статье указаны не все версии продуктов.

Симптомы

Il codice di evento o errore più probabile per questo problema è: 
0x00304404 Descrizione: Il nodo è stato fisicamente rimosso o arrestato.


Altri possibili codici evento:
  • 0x00307701: XENV non è attivo.
  • 0x00304203: Node has stopped.
  • 0x00302b04: Il nodo è stato arrestato.
  • 0x00300D06: Il servizio cluster è stato interrotto. 
  • 0x0030c601: L'appliance ha interrotto la manutenzione degli I/O.



  Un riavvio del nodo può attivare altri avvisi secondari o dial home, ad esempio:
 

Причина

Un nodo PowerStore potrebbe riavviarrsi in modo imprevisto a causa di vari motivi.
Ogni riavvio imprevisto deve essere analizzato separatamente.
Consultare la sezione Informazioni aggiuntive riportata di seguito per informazioni dettagliate su ciò che è necessario per questa indagine.

Разрешение

Esistono alcune opzioni per verificare la presenza di riavvii imprevisti del nodo.
 

Controllo di avvisi ed eventi da PowerStore Manager (GUI)

Controllare gli eventi e gli avvisi che potrebbero indicare un riavvio imprevisto del nodo:
  • In PowerStore Manager, controllare la sezione Monitoring e esaminare i dettagli nelle schede ALERTS and EVENTS .
  • Cercare timestamp, codici errore o eventi, messaggi e così via. Per rendere più chiare le ricerche, utilizzare le opzioni di filtro disponibili nelle schede ALERTS ed EVENTS:
SLN322081_en_US__5image (18730)
 
 

Verifica della presenza di dump file

Verificare la presenza di dump file di sistema al momento in cui si verificano gli errori. I dump del kernel non sono inclusi nelle raccolte dati.

Accedere al cluster tramite ssh ed eseguire svc_dc list_dumps
È anche possibile provare a trovare i dump file da PowerStore Manager. Per ulteriori informazioni, vedere PowerStore: Come generare e raccogliere vari registri da PowerStore.

Per accedere ai nodi tramite ssh, individuare l'IP del cluster o del nodo in PowerStore Manager in Impostazioni > IP di rete. Accedere con il client ssh preferito utilizzando l'account utente di servizio e la rispettiva password utente di servizio (definita durante la configurazione del sistema).  


 

Verifica dell'uptime su entrambi i nodi

Eseguire il tempo di attività del comando su entrambi i nodi. In questo modo si indicherà per quanto tempo il nodo è stato attivo e contribuirà a confermare i possibili riavvii.
Ciò è utile anche perché alcuni riavvii imprevisti potrebbero non generare un dump file.


 

Altri indicatori

Un divario nei grafici delle prestazioni in PowerStore Manager può anche indicare un riavvio del nodo. Questo deve essere utilizzato solo per le linee guida ed è necessario confermare con ulteriori prove come suggerito in precedenza. I grafici delle prestazioni sono disponibili da Dashboard > PERFORMANCE o Da Hardware > Appliance X > Performance.

Дополнительная информация

Cosa è necessario per la Root-Cause Analysis (RCA)?

  • Support Materials from all the appliances in the cluster. Questi devono essere raccolti il più vicino possibile al riavvio.
  • Dump file
Vedere PowerStore: Come generare e raccogliere vari registri da PowerStore

Затронутые продукты

PowerStore
Свойства статьи
Номер статьи: 000130141
Тип статьи: Solution
Последнее изменение: 16 Aug 2023
Версия:  14
Получите ответы на свои вопросы от других пользователей Dell
Услуги технической поддержки
Проверьте, распространяются ли на ваше устройство услуги технической поддержки.