RHEL:在 Red Hat Enterprise Linux 中使用 NMI 进行故障转储配置

摘要: 为了帮助对服务器停止响应或意外重新启动的情况进行故障处理,必须确定导致问题的软件、驱动程序或硬件组件。 作系统故障转储可以提供重要线索。

本文适用于 本文不适用于 本文并非针对某种特定的产品。 本文并非包含所有产品版本。

说明

在 Red Hat Enterprise Linux 上配置故障转储。 

下面列出了在 Red Hat Enterprise Linux 上配置崩溃转储的步骤,以及 iDRAC 中的 NMI 功能:

# sysctl kernel.unknown_nmi_panic 
  • 如果系统未配置为在收到未知 NMI 时调用死机例程,则此命令会生成以下输出:
kernel.unknown_nmi_panic = 0 
  • 使用默认内核设置时,Linux 内核会在 /var/log/messages 中记录未知 NMI 的出现,但系统不会调用崩溃例程。
  • 要使内核能够在收到未知 NMI 时调用死机例程,请编辑 /etc/sysctl.conf 文件并确保文件中包含以下行:
kernel.unknown_nmi_panic = 1 
  • 输入以下命令以重新加载设置。作为重新加载输出的一部分,您应该会看到新值的报告: 
# sysctl -p

net.ipv4.icmp_echo_ignore_broadcasts = 1

net.ipv4.conf.all.rp_filter = 1

kernel.unknown_nmi_panic = 1 
  • 服务器停止响应后,登录到 iDRAC - Power management - NMI - Apply。系统开始转储内存,请等待 30-45 分钟,以便转储完成。完成后,服务器将重新启动。

Red Hat 支持可以执行全面的转储分析。

受影响的产品

Red Hat Enterprise Linux Version 7, Red Hat Enterprise Linux Version 9, Red Hat Enterprise Linux Version 8

产品

C Series, Rack Servers, Tower Servers
文章属性
文章编号: 000138613
文章类型: How To
上次修改时间: 29 10月 2025
版本:  7
从其他戴尔用户那里查找问题的答案
支持服务
检查您的设备是否在支持服务涵盖的范围内。