Event: O nó se recuperou de uma pane. As informações sobre a pane estão registradas no arquivo: var tmp panic
Summary: Este artigo explica como os usuários e o suporte técnico devem gerenciar eventos ou mensagens de "O nó se recuperou de uma pane". Revise todas as partes do artigo antes de agir.
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Symptoms
EVENTO
Você recebeu uma notificação de evento indicando um ou mais nós recuperados de uma pane. As informações sobre a pane são registradas em um arquivo localizado em
Exemplo:
Você recebeu uma notificação de evento indicando um ou mais nós recuperados de uma pane. As informações sobre a pane são registradas em um arquivo localizado em
/var/tmp/ nos nós afetados.
Exemplo:
4.3394 03/12 18:02 W 4 53125 Node 4 has recovered from a panic. Info about panic is recorded in file: /var/tmp/panic.1615590175
Cause
As causas exatas de uma pane no nó podem variar, mas as causas típicas podem incluir:
- Falha de hardware
- Falha de código de software
- Configuração errada
Resolution
Para iniciar a solução do problema, primeiro confirme se o nó se recuperou do evento de pane e se não está inativo ou off-line. *
Para solucionar problemas, abra uma conexão SSH com o nó e faça log-in usando a conta "root".
Execute o seguinte comando para confirmar se o nó reingressou no cluster:
Depois que os logs forem recebidos, o suporte técnico analisará e analisará os detalhes da pilha de pane. Eles determinam se a pilha de pane corresponde a algum problema conhecido ou artigo da Base de conhecimento. Caso os detalhes da pilha de pânico não correspondam a um problema conhecido ou a um artigo da KB existente, o problema será encaminhado para avaliação adicional. O suporte técnico determina quais ações são necessárias, como uma substituição de hardware, correção de código, atualização de firmware ou outra redução.
* Se o nó ainda estiver inativo, será necessário realizar uma solução de problemas adicional para colocar o nó on-line novamente. Entre em contato com o suporte técnico do Isilon se precisar de assistência.
Para obter mais informações, consulte o artigo 55936: Isilon OneFS: Notificação de evento: Node Offline - ID do evento: 200010001, 300010003, 399990001, 900160001, 910100006, 400150007
Para solucionar problemas, abra uma conexão SSH com o nó e faça log-in usando a conta "root".
Execute o seguinte comando para confirmar se o nó reingressou no cluster:
# isi statusA coluna
isi status O comando retorna um resultado semelhante ao seguinte. Se o nó reingressar com sucesso no cluster, a coluna Health não exibirá "D" (desativado):
Health Throughput (bps) HDD Storage SSD Storage ID |IP Address |DASR | In Out Total| Used / Size |Used / Size ---+---------------+-----+-----+-----+-----+-----------------+----------------- 1|10.16.141.226 | OK | 553M| 3.2M| 557M|61.9T/ 106T( 59%)| L3: 1.5T 2|10.16.141.227 | OK | 481M| 96.0| 481M|62.2T/ 106T( 59%)| L3: 1.5T 3|10.16.141.228 | OK | 372k| 332k| 704k|62.3T/ 106T( 59%)| L3: 1.5T 4|10.16.141.229 | OK |10.8M| 941k|11.7M|62.6T/ 106T( 59%)| L3: 1.5T 5|10.16.141.230 | OK | 9.4M| 393k| 9.8M|62.6T/ 106T( 59%)| L3: 1.5T 6|10.16.141.231 | OK | 7.3M|256.0| 7.3M|63.4T/ 106T( 60%)| L3: 1.5T ---+---------------+-----+-----+-----+-----+-----------------+----------------- Cluster Totals: | 1.1G| 4.9M| 1.1G| 375T/ 634T( 59%)| L3: 8.7T Health Fields: D = Down, A = Attention, S = Smartfailed, R = Read-OnlyColete logs executando o seguinte comando e forneça o conjunto de logs ao suporte técnico do Isilon para análise da pane:
# isi_gather_info -f /var/tmp/
Nota:
/var/tmp/ Os dados de pane não são coletados em uma coleta de logs padrão, você deve usar isi_gather_info -f /var/tmp/ para coletar informações de pânico adequadas.
Depois que os logs forem recebidos, o suporte técnico analisará e analisará os detalhes da pilha de pane. Eles determinam se a pilha de pane corresponde a algum problema conhecido ou artigo da Base de conhecimento. Caso os detalhes da pilha de pânico não correspondam a um problema conhecido ou a um artigo da KB existente, o problema será encaminhado para avaliação adicional. O suporte técnico determina quais ações são necessárias, como uma substituição de hardware, correção de código, atualização de firmware ou outra redução.
* Se o nó ainda estiver inativo, será necessário realizar uma solução de problemas adicional para colocar o nó on-line novamente. Entre em contato com o suporte técnico do Isilon se precisar de assistência.
Para obter mais informações, consulte o artigo 55936: Isilon OneFS: Notificação de evento: Node Offline - ID do evento: 200010001, 300010003, 399990001, 900160001, 910100006, 400150007
Additional Information
Nota:
- Essa nova notificação de evento está ativada como parte dos patches de implantação de março de 2021 para o OneFS v8.1.2.0, v8.2.2.0 e v9.1.0.5. Os clusters que executam versões do OneFS anteriores ao Roll Up Patch (RUP) de março de 2021 não publicam essa notificação de evento.
- O OneFS 9.2, 9.3, 9.4 e versões posteriores têm esse recurso incluído.
- A atualização aciona um evento se o OneFS detecta uma reinicialização devido a uma pane do nó.
- O evento pode incluir informações básicas, como cabeçalhos de core dump, para ajudar a entender e solucionar o problema.
- Um SR dial-home resultante pode incluir as informações adicionais em um formato legível para triagem e análise.
Nota: Esse recurso pode causar alarmes falsos devido a eventos anteriores de pane, core dumps ou minidumps que talvez estivessem no cluster antes da instalação do RUP de março de 2021. O OneFS pode continuar alertando sobre arquivos de pânico antigos até ser removido. Realize as etapas a seguir para evitar alarmes falsos.
- Force a rotação dos logs para limpar o registro de mensagens. Esse recurso não verifica informações de pane em nenhum registro girado dentro de um arquivo gz, como messages.0.gz, messages.1.gz e assim por diante. Execute o seguinte comando para rotacionar /var/log/messages sempre que qualquer pane for encontrada:
isi_for_array 'grep "panic @ time" /var/log/messages && newsyslog -F /var/log/messages'.
- Verifique a coluna
/var/crashDiretório de cada nó para qualquer arquivo core dump ou minidumps. Remova-os ou faça backup deles após obter aprovação. - Execute o seguinte comando para limpar
vmcorearquivos localizados em/var/crashem todos os nós.
isi_for_array 'find /var/crash/ -name "vmcore*" -delete'
Affected Products
PowerScale OneFSProducts
IsilonArticle Properties
Article Number: 000184828
Article Type: Solution
Last Modified: 18 Sept 2025
Version: 15
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.