未解决

已关闭

1 Rookie

 • 

3 消息

1121

2023年3月12日 20:00

iDRAC 中报 The watchdog timer expired.

如题,早上来了发现iDRAC中报“系统存在严重问题”,查看日志中报:

LxnChan_1-1678676351459.png

另外iSM也报有限功能模式,不清楚和这个是否有关

LxnChan_0-1678676321948.png

尽管有相关告警,但是实际上服务器内的操作系统和虚拟机都是正常运行的,希望能够寻求一下解决方案

 

设备:Dell T440

电源状态:开启

操作系统:ESXi 8.0.0((Updated) DEL-ESXi_800.20513097-A02 (VMware, Inc.))

Community Manager

 • 

9K 消息

2023年3月13日 00:00

1 Rookie

 • 

3 消息

2023年3月13日 07:00

您好,非常感谢您的回复

我看了一下,在此之前我已经更新到该版本了

LxnChan_0-1678716542003.png

 

Community Manager

 • 

9K 消息

2023年3月13日 19:00

您好!

 

The watchdog timer expired一般都是由于硬件故障或驱动程序问题引起的。

 

正常的解决方法就是需要更新所有硬件驱动程序和 BIOS 固件。如果idrac更新过了,你再更新以下其它的固件,如果有装openmanage enterprise service的话,也更新一下。

 

如果你的机器上装了,Server Update Utility (SUU),直接全部更新一下。

 

Dell EMC Server Update Utility (SUU) - 指南和下载

https://www.dell.com/support/kbdoc/zh-cn/000123359/dell-emc-server-update-utility-suu-%E6%8C%87%E5%8D%97-%E5%92%8C-%E4%B8%8B%E8%BD%BD

 

如果更新后仍然存在问题,则可以尝试重新插拔硬件或排查一下有无故障硬件并更换。

 

还有就是,您还可以尝试使用「VMware vSphere Health Check」工具来诊断和解决问题。该工具可以识别大多数 ESXi 问题,并给出相应的解决方案。

1 Rookie

 • 

3 消息

2023年3月18日 21:00

感谢您的回复,我下载了ssu的iso并导入了lifecycle进行更新,更新后还是显示告警,问题可能仍旧没有解决。

设备上基本没有可拔插(PCIe)硬件,在该问题出现前几天也只插入过两根内存条,现在设备运行一切正常,只有idrac里面显示告警,且只有3月9日那一天出现了这条报错日志,如果不是什么重要问题,请问如何解除告警并恢复idrac首页的绿色状态?

LxnChan_0-1679198637052.png

LxnChan_1-1679198742025.png

还有就是您提到的「VMware vSphere Health Check」工具我没有在Web上搜索到相关资料,请问在哪里能够下载或使用?

 

Community Manager

 • 

9K 消息

2023年3月20日 01:00

您好!

 

请您参考下面的文章清除一下日志看看。如果还是不行,关机,拔掉电源,按住开机点20秒放个电,然后再接上电源开机看看。 

 

12G 服务器如何在BIOS 下清除iDRAC 日志

https://www.dell.com/support/kbdoc/zh-cn/000139577/12g-%e6%9c%8d%e5%8a%a1%e5%99%a8%e5%a6%82%e4%bd%95%e5%9c%a8bios-%e4%b8%8b%e6%b8%85%e9%99%a4idrac-%e6%97%a5%e5%bf%97

 

有关VMware vSphere Health Check,我之前也是在VMware那边找到过一些资料,您可以参考看看:

https://download3.vmware.com/vcat/documentation-center/index.html#page/Software%20Tools/6%20Software%20Tools.2.31.html

 

找不到事件!

Top