PowerStore: artigo geral sobre reinicializações inesperadas do nó
Riepilogo: Para identificar totalmente a causa de uma reinicialização ou fornecer uma análise de causa raiz (RCA) completa, vários registros são necessários. ...
Questo articolo si applica a
Questo articolo non si applica a
Questo articolo non è legato a un prodotto specifico.
Non tutte le versioni del prodotto sono identificate in questo articolo.
Sintomi
O evento ou código de erro mais provável para este problema é: 0x00304404
Descrição: O nó foi removido fisicamente ou desligado.
Exemplo como exibido no PowerStore Manager:
ATENÇÃO: uma reinicialização de nó pode acionar outros alertas secundários ou dial homes, como:
Descrição: O nó foi removido fisicamente ou desligado.
Exemplo como exibido no PowerStore Manager:
ATENÇÃO: uma reinicialização de nó pode acionar outros alertas secundários ou dial homes, como:
- Alertas de falha de link de porta (código do evento 0x00307404). Mais detalhes em Alertas do PowerStore: Falha no link da porta.
- Alertas do estado de integridade da porta (Códigos de evento: 0x00305302, 0x00305303, 0x00305402, 0x00305403). Mais detalhes em Alertas do PowerStore: estados de integridade da porta do nó
NOTA: a maioria das reinicializações de nós é corrigida com a atualização para o PowerStoreOS mais recente. Consulte a Seção 1 em PowerStore: Hub de informações: documentação e vídeos do produto.
Causa
Um nó do PowerStore pode reinicializar inesperadamente devido a vários motivos.
Cada reinicialização inesperada deve ser investigada separadamente.
Consulte a seção Informações adicionais abaixo para obter detalhes sobre o que é necessário para esta investigação.
Cada reinicialização inesperada deve ser investigada separadamente.
Consulte a seção Informações adicionais abaixo para obter detalhes sobre o que é necessário para esta investigação.
Risoluzione
Existem algumas opções para verificar se há reinicializações inesperadas do nó.
Faça login no cluster via ssh e execute svc_dc list_dumps
Você também pode tentar encontrar dump files no PowerStore Manager. Para obter mais detalhes, consulte PowerStore: Como gerar e coletar vários logs do PowerStore.
Para fazer login nos nós pelo ssh, encontre o IP do cluster ou nó no PowerStore Manager em Settings > Network IPs. Faça login com seu client ssh preferido usando a conta de usuário de serviço e a respectiva senha de usuário de serviço (definida durante a configuração do sistema).
Isso também é útil, já que algumas reinicializações inesperadas podem não produzir um dump file.
Verificação de alertas e eventos a partir do PowerStore Manager (GUI)
Verifique os eventos e os alertas que podem indicar uma reinicialização inesperada do nó:- No PowerStore Manager, verifique a seção Monitoring e veja os detalhes nas guias ALERTS e EVENTS.
- Procure por carimbos de data/hora, códigos de erro ou evento, mensagens etc. Para tornar suas pesquisas mais claras, use as opções de filtro nas guias ALERTS e EVENTS:
Como verificar a existência de dump files
Verifique a existência de dump files do sistema no momento dos erros.Faça login no cluster via ssh e execute svc_dc list_dumps
Você também pode tentar encontrar dump files no PowerStore Manager. Para obter mais detalhes, consulte PowerStore: Como gerar e coletar vários logs do PowerStore.
Para fazer login nos nós pelo ssh, encontre o IP do cluster ou nó no PowerStore Manager em Settings > Network IPs. Faça login com seu client ssh preferido usando a conta de usuário de serviço e a respectiva senha de usuário de serviço (definida durante a configuração do sistema).
Como verificar o tempo de funcionamento em ambos os nós
Execute o comando uptime em ambos os nós. Isso informará quanto tempo o nó esteve ativo e ajudará a confirmar possíveis reinicializações.Isso também é útil, já que algumas reinicializações inesperadas podem não produzir um dump file.
Outros indicadores
Um espaço nos gráficos de desempenho no PowerStore Manager também pode indicar uma reinicialização de nó. Isso deve ser usado apenas para orientação, e você deve confirmar com mais evidências, conforme sugerido acima. Os gráficos de desempenho estão disponíveis em Dashboard > PERFORMANCE ou Hardware > Appliance X > Performance.Informazioni aggiuntive
O que é necessário para a análise de causa raiz?
- Materiais de suporte de todos os equipamentos no cluster. Eles devem ser coletados o mais próximo possível da reinicialização.
- Dump file
Prodotti interessati
PowerStoreProprietà dell'articolo
Numero articolo: 000130141
Tipo di articolo: Solution
Ultima modifica: 16 ago 2023
Versione: 14
Trova risposta alle tue domande dagli altri utenti Dell
Support Services
Verifica che il dispositivo sia coperto dai Servizi di supporto.