Event: O nó se recuperou de uma pane. As informações sobre a pane estão registradas no arquivo: var tmp panic

Summary: Este artigo explica como os usuários e o suporte técnico devem gerenciar eventos ou mensagens de "O nó se recuperou de uma pane". Revise todas as partes do artigo antes de agir.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

EVENTO
Você recebeu uma notificação de evento indicando um ou mais nós recuperados de uma pane. As informações sobre a pane são registradas em um arquivo localizado em /var/tmp/ nos nós afetados.
Exemplo:
4.3394   03/12 18:02 W    4    53125     Node 4 has recovered from a panic. Info about panic is recorded in file: /var/tmp/panic.1615590175

Cause

As causas exatas de uma pane no nó podem variar, mas as causas típicas podem incluir:
  • Falha de hardware
  • Falha de código de software
  • Configuração errada
A análise dos registros do cluster deve ser realizada com o suporte do PowerScale para a causa exata da pane.

Resolution

Para iniciar a solução do problema, primeiro confirme se o nó se recuperou do evento de pane e se não está inativo ou off-line. *

Para solucionar problemas, abra uma conexão SSH com o nó e faça log-in usando a conta "root".
Execute o seguinte comando para confirmar se o nó reingressou no cluster:
# isi status
A coluna isi status O comando retorna um resultado semelhante ao seguinte. Se o nó reingressar com sucesso no cluster, a coluna Health não exibirá "D" (desativado):
                   Health  Throughput (bps)  HDD Storage      SSD Storage
ID |IP Address     |DASR |  In   Out  Total| Used / Size     |Used / Size
---+---------------+-----+-----+-----+-----+-----------------+-----------------
  1|10.16.141.226  | OK  | 553M| 3.2M| 557M|61.9T/ 106T( 59%)|        L3:  1.5T
  2|10.16.141.227  | OK  | 481M| 96.0| 481M|62.2T/ 106T( 59%)|        L3:  1.5T
  3|10.16.141.228  | OK  | 372k| 332k| 704k|62.3T/ 106T( 59%)|        L3:  1.5T
  4|10.16.141.229  | OK  |10.8M| 941k|11.7M|62.6T/ 106T( 59%)|        L3:  1.5T
  5|10.16.141.230  | OK  | 9.4M| 393k| 9.8M|62.6T/ 106T( 59%)|        L3:  1.5T
  6|10.16.141.231  | OK  | 7.3M|256.0| 7.3M|63.4T/ 106T( 60%)|        L3:  1.5T
---+---------------+-----+-----+-----+-----+-----------------+-----------------
Cluster Totals:          | 1.1G| 4.9M| 1.1G| 375T/ 634T( 59%)|        L3:  8.7T

     Health Fields: D = Down, A = Attention, S = Smartfailed, R = Read-Only
Colete logs executando o seguinte comando e forneça o conjunto de logs ao suporte técnico do Isilon para análise da pane:
# isi_gather_info -f /var/tmp/
 
Nota: /var/tmp/ Os dados de pane não são coletados em uma coleta de logs padrão, você deve usar isi_gather_info -f /var/tmp/ para coletar informações de pânico adequadas.

Depois que os logs forem recebidos, o suporte técnico analisará e analisará os detalhes da pilha de pane. Eles determinam se a pilha de pane corresponde a algum problema conhecido ou artigo da Base de conhecimento. Caso os detalhes da pilha de pânico não correspondam a um problema conhecido ou a um artigo da KB existente, o problema será encaminhado para avaliação adicional. O suporte técnico determina quais ações são necessárias, como uma substituição de hardware, correção de código, atualização de firmware ou outra redução.

* Se o nó ainda estiver inativo, será necessário realizar uma solução de problemas adicional para colocar o nó on-line novamente. Entre em contato com o suporte técnico do Isilon se precisar de assistência.

Para obter mais informações, consulte o artigo 55936: Isilon OneFS: Notificação de evento: Node Offline - ID do evento: 200010001, 300010003, 399990001, 900160001, 910100006, 400150007

Additional Information

Nota:
  • Essa nova notificação de evento está ativada como parte dos patches de implantação de março de 2021 para o OneFS v8.1.2.0, v8.2.2.0 e v9.1.0.5. Os clusters que executam versões do OneFS anteriores ao Roll Up Patch (RUP) de março de 2021 não publicam essa notificação de evento.
  • O OneFS 9.2, 9.3, 9.4 e versões posteriores têm esse recurso incluído.
  • A atualização aciona um evento se o OneFS detecta uma reinicialização devido a uma pane do nó.
  • O evento pode incluir informações básicas, como cabeçalhos de core dump, para ajudar a entender e solucionar o problema.
  • Um SR dial-home resultante pode incluir as informações adicionais em um formato legível para triagem e análise.

Nota: Esse recurso pode causar alarmes falsos devido a eventos anteriores de pane, core dumps ou minidumps que talvez estivessem no cluster antes da instalação do RUP de março de 2021. O OneFS pode continuar alertando sobre arquivos de pânico antigos até ser removido. Realize as etapas a seguir para evitar alarmes falsos.
  1. Force a rotação dos logs para limpar o registro de mensagens. Esse recurso não verifica informações de pane em nenhum registro girado dentro de um arquivo gz, como messages.0.gz, messages.1.gz e assim por diante. Execute o seguinte comando para rotacionar /var/log/messages sempre que qualquer pane for encontrada:
isi_for_array 'grep "panic @ time" /var/log/messages && newsyslog -F /var/log/messages'.
  1. Verifique a coluna /var/crash Diretório de cada nó para qualquer arquivo core dump ou minidumps. Remova-os ou faça backup deles após obter aprovação.
  2. Execute o seguinte comando para limpar vmcore arquivos localizados em /var/crash em todos os nós.
isi_for_array 'find /var/crash/ -name "vmcore*" -delete'

Affected Products

PowerScale OneFS

Products

Isilon
Article Properties
Article Number: 000184828
Article Type: Solution
Last Modified: 18 Sept 2025
Version:  15
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.