PowerEdge:M1000e机柜的错误消息是什么

摘要: M1000e机箱错误消息、严重性和潜在原因的部分列表

本文适用于 本文不适用于 本文并非针对某种特定的产品。 本文并非包含所有产品版本。

说明


当 PowerEdge M1000e 刀片机柜遇到问题时,LCD 屏幕或机箱管理控制器 (CMC) 系统事件日志中会显示一条错误消息。

下表显示了可能的错误消息及其原因,以便您可以修复错误并清除消息。

 

CMC 状态屏幕错误消息

 

严重性级别

错误信息

原因

严重

CMC <编号> 电池:CMC 的电池传感器出现故障。

CMC CMOS 电池缺失或没有电压。

严重

CMC <编号> CPU 温度:用于 CMC 故障事件的温度传感器

CMC CPU 温度超过临界阈值。

严重

CMC <编号> 环境温度:用于 CMC 故障事件的温度传感器

CMC 环境温度超过临界阈值。


          

盘柜/机箱状态屏幕错误消息

 

严重性级别

错误信息

原因

严重

机箱风扇 <编号> 存在:已断言机箱风扇设备的风扇传感器已卸下。

卸下的风扇对于盘柜/机箱的正常冷却是必需的。

严重

电源冗余:电源设备的 PS 冗余传感器,已断言冗余丢失。

一个或多个电源设备 (PSU) 出现故障或已卸下,因此系统不再冗余。

严重

电源冗余:用于电源的 PS 冗余传感器,非冗余:资源不足

一个或多个 PSU 出现故障或已卸下,并且系统电源不足,无法维持正常操作。服务器可能已断电。

严重

控制面板温度:控制面板的温度传感器,故障事件

机箱/盘柜温度超过临界阈值。

严重

CMC<编号>(单机版):用于 CMC 的微型控制器传感器,非冗余被断言。

CMC 不再冗余。仅在备用 CMC 已卸下或出现故障时,此消息才会显示。

严重

机箱事件日志 CEL:机箱事件日志的事件日志传感器,所有事件日志记录均已禁用。

当事件日志传感器被禁用时,CMC 无法记录事件。当事件日志变满时,会禁用事件日志。清除日志将重新启用事件日志记录。

严重

机箱事件日志 CEL:机箱事件日志的事件日志传感器,断言日志已满。

机箱设备检测到只有一个条目可以在 CEL 满之前添加到 CEL。

Warning

机箱事件日志 CEL:机箱事件日志的事件日志传感器,断言日志几乎已满。

机箱事件日志已满 75%。

Warning

电源冗余:电源设备的 PS 冗余传感器,冗余降级已断言。

一个或多个 PSU 出现故障或已卸下,系统无法再支持完整的 PSU 冗余。

 

风扇状态屏幕错误消息

 

严重性级别

错误信息

原因

严重

机箱风扇 <编号> 状态:机箱风扇故障事件的风扇传感器。

指定风扇的速度不足,无法为系统提供足够的冷却。


 

IOM 状态屏幕错误消息

 

严重性级别

错误信息

原因

严重

I/O 模块 <编号> 状态:I/O 模块的模块传感器,已断言从不太严重过渡到严重。

I/O 模块有故障。如果 I/O 模块热跳闸,则同样的错误也会发生。

Warning

I/O 模块 <编号> 状态:I/O 模块的模块传感器,已断言从正常转换为非严重。

I/O 模块的结构不匹配或链路调整不匹配。

 

iKVM 状态屏幕错误消息

 

严重性级别

错误信息

原因

不可恢复

本地 KVM 运行状况:本地 KVM 的模块传感器,已断言转换为不可恢复。

串行 RIP 或 USB 主机芯片出现故障。

 

严重

本地 KVM 运行状况:本地 KVM 模块传感器,已断言从不太严重过渡到严重。

USB 主机枚举或 OSCAR 失败。

Warning

本地 KVM 运行状况:本地 KVM 的模块传感器,已断言从正常转换为非严重。

存在轻微故障,例如固件损坏。

 

PSU 状态屏幕错误消息

 

严重性级别

消息

原因

严重

电源 PSU <编号>:电源设备传感器已断言电源设备故障。

PSU 出现故障。

严重

电源 PSU <编号>:电源设备的电源传感器,输入丢失已断言。

交流电源线已拔下或交流电源已断开。

 

M1000e 刀片式服务器的服务器状态屏幕错误消息

 

严重性级别

错误信息

原因

Warning

系统主板环境温度:系统主板的温度传感器,警告事件

服务器环境温度超过警告阈值。

严重

 

系统主板环境温度:系统主板的温度传感器,故障事件

 

服务器环境温度超过故障阈值。

严重

系统主板 CMOS 电池:系统主板的电池传感器出现故障。

CMOS 电池不存在或没有电压。

 

Warning

系统主板电流监测器:系统主板的电流传感器,警告事件

 

电流超过警告阈值。

严重

系统主板电流监测器:系统主板故障事件的电流传感器

电流超过故障阈值。

严重

<电压传感器名称>:系统主板的电压传感器,已断言状态。

电压超出范围。

严重

 

CPU<number> Status:CPU<编号的处理器传感器,IERR 已断言。

 

CPU 出现故障。

严重

CPU<number> Status:CPU 编号>的处理器传感器<,断言热跳闸。

CPU 过热。

严重

CPU<number> Status:CPU<编号的处理器传感器,断言配置错误。

处理器类型不正确或位置不正确。

严重

CPU<number> Status:处理器传感器针对 CPU<编号>,存在已取消断言。

所需的 CPU 缺失或不存在。

严重

系统主板视频转接卡:已断言已卸下系统主板设备的模块传感器。

 

所需的模块已卸下。

 

严重

夹层卡 B 状态:夹层卡 B 的附加卡传感器,已断言安装错误。

 

为 I/O 结构安装了不正确的夹层卡。

严重

夹层卡 C 状态:夹层卡 C 的附加卡传感器,已断言安装错误。

为 I/O 结构安装了不正确的夹层卡。

严重


背板驱动器 <号>:背板驱动器的驱动器插槽传感器已卸下

存储驱动器已卸下。

严重


背板驱动器 <号>:背板的驱动器插槽传感器,已断言驱动器故障。

存储驱动器出现故障。

严重


系统主板故障故障保护:系统主板的电压传感器,已断言状态。

当系统主板电压不在正常水平时,将生成此事件。

严重


系统主板作系统监护程序:系统主板重新启动的监护程序传感器已断言。

iDRAC 看门狗检测到系统已崩溃(计时器已过期,因为未从主机接收到响应),操作设置为重新启动。

严重


系统主板作系统监护程序:系统主板的看门狗传感器,电源关闭已断言。

iDRAC 看门狗检测到系统已崩溃(计时器已过期,因为未从主机接收到响应),操作设置为关闭电源。

严重


系统主板作系统监护程序:系统主板电源关闭后重启的监护程序传感器已断言。

iDRAC 看门狗检测到系统已崩溃(计时器已过期,因为未从主机接收到响应),操作设置为关闭电源后再重新打开。

严重


系统主板 SEL:系统主板的事件日志传感器,已断言日志已满。

SEL 设备检测到只有一个条目可以在 SEL 满之前添加到 SEL。

Warning


ECC Corr Err:已断言内存传感器、可纠正的 ECC(<DIMM 位置>)。

可纠正的 ECC 错误已达到临界值。

严重


ECC Uncorr Err:已断言内存传感器不可纠正的 ECC(<DIMM 位置>)。

检测到不可纠正的 ECC 错误。

严重

I/O Channel Chk:严重事件传感器,I/O 通道检查 NMI 已断言。

在 I/O 通道中产生了严重中断。

严重

PCI 奇偶校验错误:严重事件传感器,PCI PERR 已断言。

在 PCI 总线上检测到奇偶校验错误。

严重

PCI 系统错误:严重事件传感器、PCI SERR(<插槽号或 PCI 设备 ID>)已断言。

设备检测到 PCI 错误。

严重

SBE Log Disabled:事件日志传感器,可纠正内存错误日志记录已禁用。

当记录太多的 SBE 时,将会禁用单位错误日志记录。

严重

已禁用日志记录:事件日志传感器,所有事件日志记录均已禁用。

所有错误日志记录已禁用。

不可恢复

CPU Protocol Err:处理器传感器,已断言转换为不可恢复。

处理器协议已进入不可恢复的状态。

不可恢复

CPU 总线 PERR:处理器传感器,已断言转换为不可恢复。

处理器总线 PERR 已进入不可恢复的状态。

不可恢复

CPU 初始化错误:处理器传感器,已断言转换为不可恢复。

处理器初始化已进入不可恢复的状态。

不可恢复

CPU Machine Chk:处理器传感器,已断言转换为不可恢复。

处理器机器检查已进入不可恢复的状态。

严重


备用内存:已断言内存传感器冗余丢失(<DIMM 位置>)。

内存备用不再冗余。

严重


已镜像的内存:已断言内存传感器冗余丢失(<DIMM 位置>)。

镜像内存不再冗余。

严重

内存 RAID:已断言内存传感器冗余丢失(<DIMM 位置>)。

RAID 内存不再冗余。

严重

内存 Cfg 错误:已断言内存传感器配置错误(<DIMM 位置>)。

系统的内存配置不正确。

Warning


内存冗余增益:已断言内存传感器冗余降级(<DIMM 位置>)。

内存冗余已降级,但未丢失。

严重

PCIE 致命错误:严重事件传感器,总线致命错误已断言。

在 PCI 总线上检测到致命错误。

严重

芯片组错误:严重事件传感器,PCI PERR 已断言。

检测到芯片错误。

Warning

内存 ECC 警告:内存传感器已断言从正常(<DIMM 位置>)转换为非严重。

可纠正的 ECC 错误超过正常值。

严重

内存 ECC 警告:内存传感器,已断言从不太严重(<DIMM 位置>)转换为严重。

可纠正的 ECC 错误已达到临界值。

严重

系统主板开机自检错误:系统主板的开机自检传感器,POST 致命错误 <和其他错误信息> 已断言。

有关 BIOS 开机自检错误的其他错误信息,请参阅《Dell PowerEdge M1000e EnclosureOwner's Manual 》。

受影响的产品

PowerEdge M1000E
文章属性
文章编号: 000130128
文章类型: How To
上次修改时间: 05 2月 2025
版本:  7
从其他戴尔用户那里查找问题的答案
支持服务
检查您的设备是否在支持服务涵盖的范围内。