RHEL: Configuração de despejo de memória usando NMI no Red Hat Enterprise Linux

Resumo: Para ajudar na solução de problemas de situações em que um servidor para de responder ou reinicializa inesperadamente, é essencial identificar o componente de software, driver ou hardware que está causando o problema. O dump de falha do sistema operacional pode fornecer pistas vitais. ...

Este artigo aplica-se a Este artigo não se aplica a Este artigo não está vinculado a nenhum produto específico. Nem todas as versões do produto estão identificadas neste artigo.

Instruções

Configurar o despejo de memória no Red Hat Enterprise Linux. 

Abaixo estão listadas as etapas para configurar o despejo de memória no Red Hat Enterprise Linux e as funcionalidades NMI no iDRAC:

# sysctl kernel.unknown_nmi_panic 
  • Se o sistema não estiver configurado para chamar a rotina de pânico quando receber NMI desconhecido, esse comando produzirá a seguinte saída:
kernel.unknown_nmi_panic = 0 
  • Ao usar a configuração padrão do kernel, o kernel do Linux registra a ocorrência de uma NMI desconhecida em /var/log/messages, mas o sistema não chama a rotina de pane.
  • Para permitir que o kernel chame a rotina de pane quando receber uma NMI desconhecida, edite o arquivo /etc/sysctl.conf e certifique-se de que a seguinte linha esteja no arquivo:
kernel.unknown_nmi_panic = 1 
  • Digite o seguinte comando para recarregar a configuração. Você deve ver o relatório do novo valor como parte da saída de recarga: 
# sysctl -p

net.ipv4.icmp_echo_ignore_broadcasts = 1

net.ipv4.conf.all.rp_filter = 1

kernel.unknown_nmi_panic = 1 
  • Quando o servidor parar de responder, faça login no iDRAC - Gerenciamento de energia - NMI - Aplicar. O sistema começa a despejar a memória, aguarde de 30 a 45 minutos até que o dump seja concluído. Ao concluir, o servidor é reinicializado.

O Red Hat Support pode realizar uma análise completa do dump.

Produtos afetados

Red Hat Enterprise Linux Version 7, Red Hat Enterprise Linux Version 9, Red Hat Enterprise Linux Version 8

Produtos

C Series, Rack Servers, Tower Servers
Propriedades do artigo
Número do artigo: 000138613
Tipo de artigo: How To
Último modificado: 29 out. 2025
Versão:  7
Encontre as respostas de outros usuários da Dell para suas perguntas.
Serviços de suporte
Verifique se o dispositivo está coberto pelos serviços de suporte.