PowerEdge:对无法启动的服务器进行故障处理 - 无法通电、无法开机自检、无法启动或无视频
Summary: 本文提供 PowerEdge 服务器的不能通电、无法开机自检、无法启动和无视频问题的故障处理方法。这包括刀片式、机架式和塔式服务器。
Instructions
目录
- 定义
- 开始对 Dell PowerEdge 服务器进行故障处理之前
- 对 Dell PowerEdge 服务器上的不能通电进行故障处理
- 对 Dell PowerEdge 服务器上的无法开机自检进行故障处理
- 对 Dell PowerEdge 服务器上的无法开机进行故障处理
- 对 Dell PowerEdge 服务器上的无视频进行故障处理
定义
不能通电
按下电源按钮后,诊断 LED 指示灯未亮起。电源按钮 LED 指示灯也未亮起。系统没有通电迹象。风扇没有声音,因为它没有在转动。iDRAC 应不响应 ping。这定义为不能通电。请执行下面的“不能通电”故障处理步骤。
无法开机自检 (POST)
按下电源按钮后系统通电,但无法完成开机自检。在开机自检过程中,系统会经历一系列内部检查。如果这些检查中的任何一个失败,系统会在 LCD 液晶屏(如有)上显示错误,或者亮起 LED 指示灯以帮助指示潜在问题。这定义为无法开机自检。请执行下面的“不能通电”故障处理步骤。
无法启动
系统加载戴尔启动画面并完成开机自检检查后,戴尔启动画面消失,系统操作转交给操作系统。如果操作系统因任何原因不启动,则称为无法启动问题。另一个常见症状是,没有任何可用的启动设备,并显示以下错误:“未找到启动设备。”如果虚拟磁盘因硬盘或 PERC 问题无法联机,会出现这种情况。执行以下无法启动故障处理步骤。
无视频
按下电源按钮后,系统开机并显示开机自检检查,在这期间您可能会看到诊断 LED 指示灯短暂亮起。电源按钮 LED 和键盘 LED 亮起,但显示屏上无视频迹象。iDRAC 正常工作,会在虚拟控制台(虚拟控制台可用于 Enterprise 许可证)中看到视频输出,您会遇到无视频情形。执行以下无视频故障处理步骤。
请在此视频中找到定义的概述:
诊断服务器启动问题
持续时间:00:01:37 (hh:mm:ss)
如果可用,可以使用此视频播放器上的 CC 图标选择隐藏式字幕(字幕)语言设置。
开始对 Dell PowerEdge 服务器进行故障处理之前
收集以下信息:
- 发生故障之前发生了什么事件?哪个步骤后出现问题?
- 自服务器上次正常工作起发生了什么变化?
- 您最近是否有添加或删除硬件或软件?如果有,您是否记得在必要时更改服务器安装实用程序中的相应设置?
- 服务器经历问题症状有多长时间了?
- 如果偶然发生问题,持续时间多长或频率怎样?
获得以下信息后,您应查看 iDRAC 日志,以获取可为故障处理提供帮助的其他信息。(这不适用于不能通电问题。)登录到 iDRAC 以查看日志。此外,查看生命周期日志,因为这些日志也可为故障处理提供帮助。
iDRAC9:转至 Maintenance > ,然后转至 LifeCycle Logs + System Event Logs。
iDRAC8:转至 Logs + LifeCycle Logs。如何导出 iDRAC 日志以提供给戴尔技术支持并查看系统的整体运行状况:
有关对错误进行故障处理的信息,请参阅特定型号的用户手册。
返回目录
对 Dell PowerEdge 服务器上的不能通电进行故障处理
根据开始对 Dell PowerEdge 服务器进行故障处理之前收集故障处理信息。
- 首先拔下两根电源线并按住电源按钮十秒钟,以释放残余电量。如何重置和耗尽 Dell PowerEdge 服务器的电量?
- 将电源线插入电源,如果正在使用任何 UPS,请暂时绕过它们。电源装置 (PSU) 上的 LED 指示灯应亮起。如果需要,按下 PSU 内置自检 (BIST) 按钮。
- 如果没有任何 PSU BIST LED 指示灯亮起,请使用已知正常工作的电源线和墙上插座进行检查。
- 此文章中提供了进一步的诊断步骤 PowerEdge PSU:如何对服务器电源装置进行故障处理?
对 Dell PowerEdge 服务器上的无法开机自检进行故障处理
根据开始对 Dell PowerEdge 服务器进行故障处理之前收集故障处理信息。
- 拔下两根电源线并按住电源按钮十秒钟,以释放残余电量。
- 重新插入电源线,然后等待两分钟,以使 iDRAC 初始化,然后再尝试开机。
检查电源上的电源 LED 指示灯是否呈绿色亮起,以确认服务器已接通电源。
- 如果电源 LED 呈琥珀色亮起,请验证接入的电源状态是否良好,如果不好,请更换电源。
有关如何卸下组件的详细说明,请参阅相应的用户手册。
- 卸下所有外部设备,显示器(包括鼠标和键盘)除外。
- 卸下这些设备后,尝试对服务器运行开机自检。
- 如果服务器现在可以完成开机自检,请逐一插回外部设备,直到找到有故障的设备。找到有故障的设备后予以更换。
- 如果服务器仍无法完成开机自检,转至下一步。
- 卸下这些设备后,尝试对服务器运行开机自检。
- 卸下所有第三方组件和部件。
- 卸下这些部件后,尝试对服务器运行开机自检。
- 如果服务器现在可以完成开机自检,请逐一插回这些部件,直到找到有故障的部件。找到有故障的部件后予以更换。
- 如果服务器仍无法完成开机自检,转至下一步。
- 卸下这些部件后,尝试对服务器运行开机自检。
- 断开硬盘与服务器的连接。
- 卸下这些部件后,尝试对服务器运行开机自检。
- 如果服务器现在可以完成开机自检,请逐一插回这些部件,直到找到有故障的部件。找到有故障的部件后予以更换。
- 如果服务器仍无法完成开机自检,转至下一步。
- 卸下这些部件后,尝试对服务器运行开机自检。
- 断开光驱和任何内部磁带机的连接。
- 卸下这些部件后,尝试对服务器运行开机自检。
- 如果服务器现在可以完成开机自检,请逐一插回这些部件,直到找到有故障的部件。找到有故障的部件后予以更换。
- 如果服务器仍无法完成开机自检,转至下一步。
- 卸下这些部件后,尝试对服务器运行开机自检。
- 卸下 PCI 卡,包括集成 NDC/PERC(如果适用)。
- 卸下这些部件后,尝试对服务器运行开机自检。
- 如果服务器现在可以完成开机自检,请逐一插回这些部件,直到找到有故障的部件。找到有故障的部件后予以更换。
- 如果服务器仍无法完成开机自检,转至下一步。
- 卸下这些部件后,尝试对服务器运行开机自检。
- 重新拔插控制面板接头。
- 某些平台具有右侧和左侧控制面板,请查看您正在使用的系统的配置详细信息,了解更多详细信息。
- 在第 14 代、第 15 代、第 16 代系统和更高版本的系统上工作时,应考虑断开控制面板的连接,并尝试从背面系统 ID 按钮打开服务器电源,作为打开服务器电源的替代方法。在尝试此故障处理步骤时,应卸下机箱盖。
- 使用以最低配置进行开机自检进行测试。这通常包括电源装置 (PSU)、主板、CPU 1、一个 RAM 条和背板。可在 用户手册 的“开机自检最低配置”下找到最基本的开机自检详细信息。
- 如果服务器现在可以完成开机自检,请逐一插回这些部件,直到找到有故障的部件。找到有故障的部件后予以更换。
- 应收集最低开机自检配置的清晰图片,以确保在隔离过程中测试了真正的开机自检最低配置。 在故障处理过程中很容易遗漏服务器中的某些组件,通过图片捕获视觉确认有助于确保每个人都在同一页面上。
- 如果服务器仍然无法完成开机自检,则必须考虑其余部件(例如,主板、背板、控制面板和 PDU)。
请参阅此视频:
PowerEdge 服务器上无法开机自检
持续时间:00:04:29 (hh:mm:ss)
如果可用,可以使用此视频播放器上的 CC 图标选择隐藏式字幕(字幕)语言设置。
您也可以在 YouTube 上观看此视频。
对 Dell PowerEdge 服务器上的无法开机进行故障处理
根据开始对 Dell PowerEdge 服务器进行故障处理之前收集故障处理信息。无法启动意味着服务器通电并显示戴尔屏幕,但是当应加载操作系统时,显示错误“No Boot Device Available”,并且不进行任何操作。
服务器完成开机自检 (POST) 阶段后,会尝试启动可启动设备。可启动设备是可读取或包含系统启动所需的文件的任何硬件。可在 BIOS 中选择默认的可启动介质。默认情况下,首先选择 RAID 控制器卡 (PERC)。可启动设备(RAID、USB 闪存盘、DVD、ISO 文件)中可用的文件包含操作系统启动说明。当找不到这些文件时,将显示 No Boot Device Available 错误。
可以执行一些作来检查哪些作未正常工作。
分辨率:手动选择启动设备。
首先要检查的是选择哪个设备作为主启动。要进行快速检查,请使用 F11 以启动手动引导选择。
- 重新启动系统。
- 在开机自检过程中按 F11 以进入启动管理器。
- 选择已安装操作系统的正确硬盘驱动器(虚拟驱动器)。
- 从该设备启动。
如果系统现在正常启动至操作系统,则表明硬件状况良好,同时 BIOS 设置中存在启动顺序冲突。此情况最有可能的原因是:系统设置为先于驱动器从 CD、DVD 或 USB 启动(这是一项逻辑设置)。要解决此问题,请确保开启系统时没有插入 USB 或 CD 或 DVD。
您可以永久更改系统设置中的启动顺序设置,首先从驱动器启动。要更改此设置:
- 重新启动系统。
- 在系统启动过程中按下 F2 以进入系统设置。
- 更改启动设置中的启动顺序。
- 使用屏幕右上角的退出离开此菜单。
对 Dell PowerEdge 服务器上的无视频进行故障处理
根据开始对 Dell PowerEdge 服务器进行故障处理之前收集故障处理信息。如果服务器已完成开机自检并启动至操作系统,但在系统直接连接的显示器上没有视频。
- 检查显示器输入选择是否设置为正确的输入。
- 如果使用 KVM,请确保选择了正确的系统。
- 拔下显示器线缆以执行显示器自检,以确保显示器正常工作。
- 如果显示器自检失败,请使用另一台显示器进行测试。有关更多信息,请参阅文章如何在戴尔显示器上运行诊断测试。
- 将显示器线缆更换为已知正常工作的线缆。
- 绕过任何 KVM 并直接在服务器的正面和背面输出上进行测试。
- 如果显示器仅在前面板连接上出现故障,请尝试重新拔插前面板线缆连接(如果适用)。如果重新拔插线缆没有帮助,请更换前控制面板。
- 确认显示器线缆已连接到服务器上的正确视频输出。如果安装了附加显卡,请确保显示器线缆已连接到附加显卡,而不是集成视频源。
- 释放服务器电量,然后检查开机自检视频以排除操作系统。有关更多信息,请参阅文章如何重置和耗尽 Dell PowerEdge 服务器的电量?
- 当嵌入式视频控制器设置为已禁用时,确保根据 PCIe 枚举将显示器线缆连接到第一个显卡。