Skip to main content
  • Place orders quickly and easily
  • View orders and track your shipping status
  • Enjoy members-only rewards and discounts
  • Create and access a list of your products
  • Manage your Dell EMC sites, products, and product-level contacts using Company Administration.

Dell PowerEdge M1000e 盘柜的错误消息是什么?

Summary: 部分列出的 M1000e 机箱错误消息、严重性和可能的原因。

This article may have been automatically translated. If you have any feedback regarding its quality, please let us know using the form at the bottom of this page.

Article Content


Symptoms


当驻留刀片服务器的 PowerEdge M1000e 刀片机柜遇到问题时,系统将在机箱前部或机箱管理控制器(CMC)系统事件日志(SEL)的 LCD 屏幕上显示一条错误消息。

下表显示了可能的错误消息及其原因,以便您可以修复错误并清除此消息。
此有关 Dell EMC PowerEdge 服务器的事件和错误消息参考指南介绍了有关系统固件和代理程序(用于监视系统组件)生成的事件和错误消息。

CMC 状态屏幕错误消息

 

严重性

错误信息

原因

关键

CMC < 数字 > 电池:CMC 的电池传感器已断言故障

CMC CMOS 电池缺失或没有电压。

关键

CMC < 数量 > CPU 温度:CMC 的温度传感器,故障事件

CMC CPU 温度超过临界阈值。

关键

CMC < 数量 > 环境温度:CMC 的温度传感器,故障事件

CMC 环境温度超过临界阈值。


          

盘柜/机箱状态屏幕错误消息

 

严重性

错误信息

原因

关键

机箱风扇 < 数量 > 存在:机箱风扇的风扇传感器,已删除的设备被肯定

卸下的风扇对于盘柜/机箱的正常冷却是必需的。

关键

电源设备冗余:Power Supply Redundancy: PS Redundancy sensor for Power Supply, redundancy lost was asserted(电源冗余:电源的电源冗余传感器,断言冗余丢失)

一个或多个电源设备 (PSU) 出现故障或已卸下,因此系统不再冗余。

关键

电源设备冗余:电源设备的 PS 冗余传感器,非冗余:资源不足

一个或多个 PSU 出现故障或已卸下,并且系统电源不足,无法维持正常操作。服务器可能已断电。

关键

控制面板温度:控制面板的温度传感器,故障事件

机箱/盘柜温度超过临界阈值。

关键

CMC < 数量 > 独立:CMC 的微型控制器传感器,非冗余已断言

CMC 不再冗余。仅在备用 CMC 已卸下或出现故障时,此消息才会显示。

关键

机箱 Eventlog CEL:Chassis Eventlog CEL: Event Log sensor for Chassis Eventlog, all event logging disabled was asserted(机箱事件日志 CEL:机箱事件日志的事件日志传感器,断言所有事件日志记录已禁用)

当事件日志传感器处于禁用状态时,CMC 无法记录事件。当事件日志已满时,它会处于禁用状态。清除日志将重新启用事件日志记录。

关键

机箱 Eventlog CEL:Chassis Eventlog CEL: Event Log sensor for Chassis Eventlog, log full was asserted(机箱事件日志 CEL:机箱事件日志的事件日志传感器,断言日志已满)

机箱设备检测到只有一个条目可以在 CEL 满之前添加到 CEL。

警告

机箱 Eventlog CEL:Chassis Eventlog CEL: Event Log sensor for Chassis Eventlog, log almost full was asserted(机箱事件日志 CEL:机箱事件日志的事件日志传感器,断言日志几乎已满)

机箱事件日志已满 75%。

警告

电源设备冗余:Power Supply Redundancy: PS Redundancy sensor for Power Supply, redundancy degraded was asserted(电源冗余:电源的电源冗余传感器,断言冗余降级)

一个或多个 PSU 出现故障或已卸下,系统无法再支持完整的 PSU 冗余。

 

风扇状态屏幕错误消息

 

严重性

错误信息

原因

关键

机箱风扇 < 数量 > 状态:机箱风扇的风扇传感器,故障事件

指定风扇的速度不足,无法为系统提供足够的冷却。


 

IOM 状态屏幕错误消息

 

严重性

错误信息

原因

关键

输入/输出模块 < 编号 > 状态:模块传感器,用于输入/输出模块,从低严重到严重的转换

I/O 模块有故障。如果 I/O 模块热跳闸,则同样的错误也会发生。

警告

输入/输出模块 < 编号 > 状态:模块传感器,用于输入/输出模块,从 "正常" 转换为 "非关键"

I/O 模块的结构不匹配或链路调整不匹配。

 

iKVM 状态屏幕错误消息

 

严重性

错误信息

原因

不可恢复

本地 KVM 运行状况:Local KVM Health: Module sensor for Local KVM, transition to non-recoverable was asserted(本地 KVM 运行状况:本地 KVM 的模块传感器,断言转变为不可恢复)

串行 RIP 或 USB 主机芯片出现故障。

 

关键

本地 KVM 运行状况:Local KVM Health: Module sensor for Local KVM, transition to critical from less severe was asserted(本地 KVM 运行状况:本地 KVM 的模块传感器,断言严重程度从较不严重转变为严重)

USB 主机枚举或 OSCAR 失败。

警告

本地 KVM 运行状况:Local KVM Health: Module sensor for Local KVM, transition to non-critical from OK was asserted(本地 KVM 运行状况:本地 KVM 的模块传感器,断言严重程度从正常转变为较不严重)

存在轻微故障,例如固件损坏。

 

PSU 状态屏幕错误消息

 

严重性

消息

原因

关键

电源设备 PSU < 编号 >:电源设备的电源传感器,故障已断言

PSU 出现故障。

关键

电源设备 PSU < 编号 >:电源设备的电源传感器,已断言输入丢失

交流电源线已拔下或交流电源已断开。

 

M1000e 的服务器状态屏幕错误消息

 

严重性

错误信息

原因

警告

系统板环境温度:系统板的温度传感器,警告事件

服务器环境温度超过警告阈值。

关键

 

系统板环境温度:系统板的温度传感器,故障事件

 

服务器环境温度超过故障阈值。

关键

系统板 CMOS 电池:系统板的电池传感器已断言失败

CMOS 电池不存在或没有电压。

 

警告

系统板电流监视器:系统板的电流传感器,警告事件

 

电流超过警告阈值。

关键

系统板电流监视器:系统板的电流传感器,故障事件

电流超过故障阈值。

关键

< 电压传感器名称 >:系统板的电压传感器,状态为 "已断言"

电压超出范围。

关键

 

> 状态的 CPU < 数量:处理器传感器的 CPU < 数字,IERR 已断言

 

CPU 出现故障。

关键

> 状态的 CPU < 数量:处理器传感器的 CPU < 数 >,已断言过热。

CPU 过热。

关键

> 状态的 CPU < 数量:处理器传感器的 CPU < 编号,配置错误已断言

处理器类型不正确或位置不正确。

关键

> 状态的 CPU < 数量:CPU < 数 > 的处理器传感器,存在性为未断言

所需的 CPU 缺失或不存在。

关键

系统板视频提升板:系统板的模块传感器,已删除设备已断言

 

所需的模块已卸下。

 

关键

夹层卡 B 状态:Mezz B Status: Add-in Card sensor for Mezz B, install error was asserted(夹层卡 B 状态:夹层卡 B 的附加卡传感器,断言安装错误)

 

为 I/O 结构安装了不正确的夹层卡。

关键

夹层卡 C 状态:Mezz C Status: Add-in Card sensor for Mezz C, install error was asserted(夹层卡 C 状态:夹层卡 C 的附加卡传感器,断言安装错误)

为 I/O 结构安装了不正确的夹层卡。

关键


背板驱动器 < 编号 >:背板的驱动器插槽传感器,驱动器已卸下

存储驱动器已卸下。

关键


背板驱动器 < 编号 >:背板的驱动器插槽传感器,驱动器故障已断言

存储驱动器出现故障。

关键


系统板 PFault 故障保护:系统板的电压传感器,状态为 "已断言"

当系统主板电压不在正常水平时,将生成此事件。

关键


系统板操作系统监测程序:系统板的监测器传感器,重新引导已断言

iDRAC 看门狗检测到系统已崩溃(计时器已过期,因为未从主机接收到响应),操作设置为重新启动。

关键


系统板操作系统监测程序:系统板的监测器传感器,已断言电源关闭

iDRAC 看门狗检测到系统已崩溃(计时器已过期,因为未从主机接收到响应),操作设置为关闭电源。

关键


系统板操作系统监测程序:系统板的监测器传感器,已断言电源关闭后重启

iDRAC 看门狗检测到系统已崩溃(计时器已过期,因为未从主机接收到响应),操作设置为关闭电源后再重新打开。

关键


系统板 SEL:System Board SEL: Event Log sensor for System Board, log full was asserted(系统主板 SEL:系统主板的事件日志传感器,断言日志已满)

SEL 设备检测到只有一个条目可以在 SEL 满之前添加到 SEL。

警告


ECC Corr Err:ECC Corr Err: Memory sensor, correctable ECC ( <DIMM Location> ) was asserted(ECC 可纠正的错误:内存传感器,断言可纠正的 ECC(<DIMM 位置>))

可纠正的 ECC 错误已达到临界值。

关键


ECC Uncorr Err:ECC Uncorr Err: Memory sensor, uncorrectable ECC ( <DIMM Location> ) was asserted(ECC 不可纠正的错误:内存传感器,断言不可纠正的 ECC(<DIMM 位置>))

检测到不可纠正的 ECC 错误。

关键

I/o 通道 .Chk:Chipset Err: Critical Event sensor, I/O NMI was asserted(芯片组错误:严重事件传感器,断言 PCI PERR)

在 I/O 通道中产生了严重中断。

关键

PCI 奇偶校验错误:Chipset Err: Critical Event sensor, PCI PERR was asserted(芯片组错误:严重事件传感器,断言 PCI PERR)

在 PCI 总线上检测到奇偶校验错误。

关键

PCI 系统错误:PCI System Err: Critical Event sensor, PCI SERR ( <Slot number or PCI Device ID>) was asserted(PCI 系统错误:严重事件传感器,断言 PCI SERR(<插槽编号或 PCI 设备 ID>))

设备检测到 PCI 错误。

关键

SBE 日志已禁用:事件日志传感器、已禁用的可纠正内存错误日志记录已断言

当记录太多的 SBE 时,将会禁用单位错误日志记录。

关键

已禁用日志记录:Logging Disabled: Event Log sensor, all event logging disabled was asserted(日志记录已禁用:事件日志传感器,断言所有事件日志记录已禁用)

所有错误日志记录已禁用。

不可恢复

CPU 协议错误:处理器传感器,已断言到不可恢复的转换

处理器协议已进入不可恢复的状态。

不可恢复

CPU 总线 PERR:处理器传感器,已断言到不可恢复的转换

处理器总线 PERR 已进入不可恢复的状态。

不可恢复

CPU 初始化错误:处理器传感器,已断言到不可恢复的转换

处理器初始化已进入不可恢复的状态。

不可恢复

CPU 机器的 .Chk:处理器传感器,已断言到不可恢复的转换

处理器机器检查已进入不可恢复的状态。

关键


内存备用:Memory RAID: Memory sensor, redundancy lost (<DIMM Location> ) was asserted(内存 RAID:内存传感器,断言冗余丢失(<DIMM 位置>))

内存备用不再冗余。

关键


镜像的内存:Memory RAID: Memory sensor, redundancy lost (<DIMM Location> ) was asserted(内存 RAID:内存传感器,断言冗余丢失(<DIMM 位置>))

镜像内存不再冗余。

关键

Memory RAIDMemory RAID: Memory sensor, redundancy lost (<DIMM Location> ) was asserted(内存 RAID:内存传感器,断言冗余丢失(<DIMM 位置>))

RAID 内存不再冗余。

关键

内存 Cfg 错误:内存传感器、配置错误(< DIMM 位置 >)已断言

系统的内存配置不正确。

警告


Mem Redun 增益:内存传感器,已降级冗余(< DIMM 位置 >)

内存冗余已降级,但未丢失。

关键

PCIE 致命错误:严重事件传感器,已断言总线严重错误

在 PCI 总线上检测到致命错误。

关键

芯片组错误:Chipset Err: Critical Event sensor, PCI PERR was asserted(芯片组错误:严重事件传感器,断言 PCI PERR)

检测到芯片错误。

警告

Mem ECC 警告:Mem ECC Warning: Memory sensor, transition to non-critical from OK (<DIMM Location> ) was asserted(内存 ECC 警告:内存传感器,断言严重程度从正常(<DIMM 位置>)转变为不严重)

可纠正的 ECC 错误超过正常值。

关键

Mem ECC 警告:Mem ECC Warning: Memory sensor, transition to critical from less severe ( <DIMM Location> ) was asserted(内存 ECC 警告:内存传感器,断言严重程度从较不严重(<DIMM 位置>)转变为严重)

可纠正的 ECC 错误已达到临界值。

关键

系统板开机自检错误:系统板的 POST 传感器,POST 严重错误 < 已断言 > 的额外错误信息

有关 BIOS POST 错误的其他错误信息,请参阅 Dell PowerEdge M1000e 机柜用户手册》

Cause

Dell EMC

Resolution

Dell Technologies

Article Properties


Affected Product

PowerEdge M1000E

Last Published Date

06 Apr 2021

Version

4

Article Type

Solution