RHEL:在 Red Hat Enterprise Linux 中使用 NMI 进行故障转储配置
Summary: 为了帮助对服务器停止响应或意外重新启动的情况进行故障处理,必须确定导致问题的软件、驱动程序或硬件组件。 作系统故障转储可以提供重要线索。
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Instructions
在 Red Hat Enterprise Linux 上配置故障转储。
下面列出了在 Red Hat Enterprise Linux 上配置崩溃转储的步骤,以及 iDRAC 中的 NMI 功能:
- 确保 CMC、iDRAC、BIOS 固件为最新版本。
- 使用以下文章在 Red Hat Linux 上配置 Kdump - 如何在 Red Hat Enterprise Linux 上使用 kdump 对内核崩溃、挂起或重新启动进行故障处理 - Red Hat Customer Portal
- 为转储分配足够的空间,以便在转储中捕获全部内存内容
- 输入以下命令以确定系统是否设置为在收到未知 NMI 时调用死机例程:
# sysctl kernel.unknown_nmi_panic
- 如果系统未配置为在收到未知 NMI 时调用死机例程,则此命令会生成以下输出:
kernel.unknown_nmi_panic = 0
- 使用默认内核设置时,Linux 内核会在 /var/log/messages 中记录未知 NMI 的出现,但系统不会调用崩溃例程。
- 要使内核能够在收到未知 NMI 时调用死机例程,请编辑 /etc/sysctl.conf 文件并确保文件中包含以下行:
kernel.unknown_nmi_panic = 1
- 输入以下命令以重新加载设置。作为重新加载输出的一部分,您应该会看到新值的报告:
# sysctl -p net.ipv4.icmp_echo_ignore_broadcasts = 1 net.ipv4.conf.all.rp_filter = 1 kernel.unknown_nmi_panic = 1
- 服务器停止响应后,登录到 iDRAC - Power management - NMI - Apply。系统开始转储内存,请等待 30-45 分钟,以便转储完成。完成后,服务器将重新启动。
Red Hat 支持可以执行全面的转储分析。
Affected Products
Red Hat Enterprise Linux Version 7, Red Hat Enterprise Linux Version 9, Red Hat Enterprise Linux Version 8Products
C Series, Rack Servers, Tower ServersArticle Properties
Article Number: 000138613
Article Type: How To
Last Modified: 29 Oct 2025
Version: 7
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.