RHEL：在 Red Hat Enterprise Linux 中使用 NMI 进行故障转储配置

摘要: 为了帮助对服务器停止响应或意外重新启动的情况进行故障处理，必须确定导致问题的软件、驱动程序或硬件组件。作系统故障转储可以提供重要线索。

说明

受影响的产品

提供反馈

本文适用于本文不适用于本文并非针对某种特定的产品。本文并非包含所有产品版本。

查看其他资源

说明

在 Red Hat Enterprise Linux 上配置故障转储。

下面列出了在 Red Hat Enterprise Linux 上配置崩溃转储的步骤，以及 iDRAC 中的 NMI 功能：

确保 CMC、iDRAC、BIOS 固件为最新版本。
使用以下文章在 Red Hat Linux 上配置 Kdump - 如何在 Red Hat Enterprise Linux 上使用 kdump 对内核崩溃、挂起或重新启动进行故障处理 - Red Hat Customer Portal
为转储分配足够的空间，以便在转储中捕获全部内存内容
输入以下命令以确定系统是否设置为在收到未知 NMI 时调用死机例程：

# sysctl kernel.unknown_nmi_panic

如果系统未配置为在收到未知 NMI 时调用死机例程，则此命令会生成以下输出：

kernel.unknown_nmi_panic = 0

使用默认内核设置时，Linux 内核会在 /var/log/messages 中记录未知 NMI 的出现，但系统不会调用崩溃例程。
要使内核能够在收到未知 NMI 时调用死机例程，请编辑 /etc/sysctl.conf 文件并确保文件中包含以下行：

kernel.unknown_nmi_panic = 1

输入以下命令以重新加载设置。作为重新加载输出的一部分，您应该会看到新值的报告：

# sysctl -p

net.ipv4.icmp_echo_ignore_broadcasts = 1

net.ipv4.conf.all.rp_filter = 1

kernel.unknown_nmi_panic = 1

服务器停止响应后，登录到 iDRAC - Power management - NMI - Apply。系统开始转储内存，请等待 30-45 分钟，以便转储完成。完成后，服务器将重新启动。

Red Hat 支持可以执行全面的转储分析。

受影响的产品

Red Hat Enterprise Linux Version 7, Red Hat Enterprise Linux Version 9, Red Hat Enterprise Linux Version 8

产品

C Series, Rack Servers, Tower Servers

文章编号: 000138613

文章类型: How To

上次修改时间: 29 10月 2025

版本: 7

RHEL：在 Red Hat Enterprise Linux 中使用 NMI 进行故障转储配置

摘要: 为了帮助对服务器停止响应或意外重新启动的情况进行故障处理，必须确定导致问题的软件、驱动程序或硬件组件。作系统故障转储可以提供重要线索。

说明

受影响的产品

说明

在 Red Hat Enterprise Linux 上配置故障转储。

受影响的产品

产品

文章属性

从其他戴尔用户那里查找问题的答案

支持服务

文章属性

从其他戴尔用户那里查找问题的答案

支持服务

RHEL：在 Red Hat Enterprise Linux 中使用 NMI 进行故障转储配置

摘要: 为了帮助对服务器停止响应或意外重新启动的情况进行故障处理，必须确定导致问题的软件、驱动程序或硬件组件。 作系统故障转储可以提供重要线索。

详细文章

说明

受影响的产品

说明

在 Red Hat Enterprise Linux 上配置故障转储。

受影响的产品

产品

文章属性

从其他戴尔用户那里查找问题的答案

支持服务

文章属性

从其他戴尔用户那里查找问题的答案

支持服务

摘要: 为了帮助对服务器停止响应或意外重新启动的情况进行故障处理，必须确定导致问题的软件、驱动程序或硬件组件。作系统故障转储可以提供重要线索。