PowerStore: artigo geral sobre reinicializações inesperadas do nó

Resumo: Para identificar totalmente a causa de uma reinicialização ou fornecer uma análise de causa raiz (RCA) completa, vários registros são necessários. ...

Este artigo aplica-se a Este artigo não se aplica a Este artigo não está vinculado a nenhum produto específico. Nem todas as versões do produto estão identificadas neste artigo.

Sintomas

O evento ou código de erro mais provável para este problema é: 0x00304404
Descrição: O nó foi removido fisicamente ou desligado.

Exemplo como exibido no PowerStore Manager:

SLN322081_en_US__1image(18728)

  ATENÇÃO: uma reinicialização de nó pode acionar outros alertas secundários ou dial homes, como:
NOTA: a maioria das reinicializações de nós é corrigida com a atualização para o PowerStoreOS mais recente. Consulte a Seção 1 em PowerStore: Hub de informações: documentação e vídeos do produto.

Causa

Um nó do PowerStore pode reinicializar inesperadamente devido a vários motivos.
Cada reinicialização inesperada deve ser investigada separadamente.
Consulte a seção Informações adicionais abaixo para obter detalhes sobre o que é necessário para esta investigação.

Resolução

Existem algumas opções para verificar se há reinicializações inesperadas do nó.
 

Verificação de alertas e eventos a partir do PowerStore Manager (GUI)

Verifique os eventos e os alertas que podem indicar uma reinicialização inesperada do nó:
  • No PowerStore Manager, verifique a seção Monitoring e veja os detalhes nas guias ALERTS e EVENTS.
  • Procure por carimbos de data/hora, códigos de erro ou evento, mensagens etc. Para tornar suas pesquisas mais claras, use as opções de filtro nas guias ALERTS e EVENTS:
SLN322081_en_US__5image(18730)
 

Como verificar a existência de dump files

Verifique a existência de dump files do sistema no momento dos erros.

Faça login no cluster via ssh e execute svc_dc list_dumps
Você também pode tentar encontrar dump files no PowerStore Manager. Para obter mais detalhes, consulte PowerStore: Como gerar e coletar vários logs do PowerStore.

Para fazer login nos nós pelo ssh, encontre o IP do cluster ou nó no PowerStore Manager em Settings > Network IPs. Faça login com seu client ssh preferido usando a conta de usuário de serviço e a respectiva senha de usuário de serviço (definida durante a configuração do sistema).  

 

Como verificar o tempo de funcionamento em ambos os nós

Execute o comando uptime em ambos os nós. Isso informará quanto tempo o nó esteve ativo e ajudará a confirmar possíveis reinicializações.
Isso também é útil, já que algumas reinicializações inesperadas podem não produzir um dump file.

 

Outros indicadores

Um espaço nos gráficos de desempenho no PowerStore Manager também pode indicar uma reinicialização de nó. Isso deve ser usado apenas para orientação, e você deve confirmar com mais evidências, conforme sugerido acima. Os gráficos de desempenho estão disponíveis em Dashboard > PERFORMANCE ou Hardware > Appliance X > Performance.

Mais informações

O que é necessário para a análise de causa raiz?

  • Materiais de suporte de todos os equipamentos no cluster. Eles devem ser coletados o mais próximo possível da reinicialização.
  • Dump file
Consulte PowerStore: como gerar e coletar vários registros do PowerStore

Produtos afetados

PowerStore
Propriedades do artigo
Número do artigo: 000130141
Tipo de artigo: Solution
Último modificado: 16 ago. 2023
Versão:  14
Encontre as respostas de outros usuários da Dell para suas perguntas.
Serviços de suporte
Verifique se o dispositivo está coberto pelos serviços de suporte.