RHEL:在 Red Hat Enterprise Linux 中使用 NMI 进行故障转储配置

Summary: 为了帮助对服务器停止响应或意外重新启动的情况进行故障处理,必须确定导致问题的软件、驱动程序或硬件组件。 作系统故障转储可以提供重要线索。

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

在 Red Hat Enterprise Linux 上配置故障转储。 

下面列出了在 Red Hat Enterprise Linux 上配置崩溃转储的步骤,以及 iDRAC 中的 NMI 功能:

# sysctl kernel.unknown_nmi_panic 
  • 如果系统未配置为在收到未知 NMI 时调用死机例程,则此命令会生成以下输出:
kernel.unknown_nmi_panic = 0 
  • 使用默认内核设置时,Linux 内核会在 /var/log/messages 中记录未知 NMI 的出现,但系统不会调用崩溃例程。
  • 要使内核能够在收到未知 NMI 时调用死机例程,请编辑 /etc/sysctl.conf 文件并确保文件中包含以下行:
kernel.unknown_nmi_panic = 1 
  • 输入以下命令以重新加载设置。作为重新加载输出的一部分,您应该会看到新值的报告: 
# sysctl -p

net.ipv4.icmp_echo_ignore_broadcasts = 1

net.ipv4.conf.all.rp_filter = 1

kernel.unknown_nmi_panic = 1 
  • 服务器停止响应后,登录到 iDRAC - Power management - NMI - Apply。系统开始转储内存,请等待 30-45 分钟,以便转储完成。完成后,服务器将重新启动。

Red Hat 支持可以执行全面的转储分析。

Affected Products

Red Hat Enterprise Linux Version 7, Red Hat Enterprise Linux Version 9, Red Hat Enterprise Linux Version 8

Products

C Series, Rack Servers, Tower Servers
Article Properties
Article Number: 000138613
Article Type: How To
Last Modified: 29 Oct 2025
Version:  7
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.