PowerStore: artigo geral sobre reinicializações inesperadas do nó
Resumo: Para identificar totalmente a causa de uma reinicialização ou fornecer uma análise de causa raiz (RCA) completa, vários registros são necessários. ...
Este artigo aplica-se a
Este artigo não se aplica a
Este artigo não está vinculado a nenhum produto específico.
Nem todas as versões do produto estão identificadas neste artigo.
Sintomas
O evento ou código de erro mais provável para este problema é: 0x00304404
Descrição: O nó foi removido fisicamente ou desligado.
Exemplo como exibido no PowerStore Manager:
ATENÇÃO: uma reinicialização de nó pode acionar outros alertas secundários ou dial homes, como:
Descrição: O nó foi removido fisicamente ou desligado.
Exemplo como exibido no PowerStore Manager:
ATENÇÃO: uma reinicialização de nó pode acionar outros alertas secundários ou dial homes, como:
- Alertas de falha de link de porta (código do evento 0x00307404). Mais detalhes em Alertas do PowerStore: Falha no link da porta.
- Alertas do estado de integridade da porta (Códigos de evento: 0x00305302, 0x00305303, 0x00305402, 0x00305403). Mais detalhes em Alertas do PowerStore: estados de integridade da porta do nó
NOTA: a maioria das reinicializações de nós é corrigida com a atualização para o PowerStoreOS mais recente. Consulte a Seção 1 em PowerStore: Hub de informações: documentação e vídeos do produto.
Causa
Um nó do PowerStore pode reinicializar inesperadamente devido a vários motivos.
Cada reinicialização inesperada deve ser investigada separadamente.
Consulte a seção Informações adicionais abaixo para obter detalhes sobre o que é necessário para esta investigação.
Cada reinicialização inesperada deve ser investigada separadamente.
Consulte a seção Informações adicionais abaixo para obter detalhes sobre o que é necessário para esta investigação.
Resolução
Existem algumas opções para verificar se há reinicializações inesperadas do nó.
Faça login no cluster via ssh e execute svc_dc list_dumps
Você também pode tentar encontrar dump files no PowerStore Manager. Para obter mais detalhes, consulte PowerStore: Como gerar e coletar vários logs do PowerStore.
Para fazer login nos nós pelo ssh, encontre o IP do cluster ou nó no PowerStore Manager em Settings > Network IPs. Faça login com seu client ssh preferido usando a conta de usuário de serviço e a respectiva senha de usuário de serviço (definida durante a configuração do sistema).
Isso também é útil, já que algumas reinicializações inesperadas podem não produzir um dump file.
Verificação de alertas e eventos a partir do PowerStore Manager (GUI)
Verifique os eventos e os alertas que podem indicar uma reinicialização inesperada do nó:- No PowerStore Manager, verifique a seção Monitoring e veja os detalhes nas guias ALERTS e EVENTS.
- Procure por carimbos de data/hora, códigos de erro ou evento, mensagens etc. Para tornar suas pesquisas mais claras, use as opções de filtro nas guias ALERTS e EVENTS:
Como verificar a existência de dump files
Verifique a existência de dump files do sistema no momento dos erros.Faça login no cluster via ssh e execute svc_dc list_dumps
Você também pode tentar encontrar dump files no PowerStore Manager. Para obter mais detalhes, consulte PowerStore: Como gerar e coletar vários logs do PowerStore.
Para fazer login nos nós pelo ssh, encontre o IP do cluster ou nó no PowerStore Manager em Settings > Network IPs. Faça login com seu client ssh preferido usando a conta de usuário de serviço e a respectiva senha de usuário de serviço (definida durante a configuração do sistema).
Como verificar o tempo de funcionamento em ambos os nós
Execute o comando uptime em ambos os nós. Isso informará quanto tempo o nó esteve ativo e ajudará a confirmar possíveis reinicializações.Isso também é útil, já que algumas reinicializações inesperadas podem não produzir um dump file.
Outros indicadores
Um espaço nos gráficos de desempenho no PowerStore Manager também pode indicar uma reinicialização de nó. Isso deve ser usado apenas para orientação, e você deve confirmar com mais evidências, conforme sugerido acima. Os gráficos de desempenho estão disponíveis em Dashboard > PERFORMANCE ou Hardware > Appliance X > Performance.Mais informações
O que é necessário para a análise de causa raiz?
- Materiais de suporte de todos os equipamentos no cluster. Eles devem ser coletados o mais próximo possível da reinicialização.
- Dump file
Produtos afetados
PowerStorePropriedades do artigo
Número do artigo: 000130141
Tipo de artigo: Solution
Último modificado: 16 ago. 2023
Versão: 14
Encontre as respostas de outros usuários da Dell para suas perguntas.
Serviços de suporte
Verifique se o dispositivo está coberto pelos serviços de suporte.