VxRail:iSM“未运行”、“运行有限的功能”或“处于非活动状态(无效)”
Summary: iSM 处于“未运行”或“运行有限的功能”状态。本文介绍解决方法。
Symptoms
iDRAC Service Module (iSM) 是主机上的一项重要服务,能够从 iDRAC 收集信息以进行监视。
这可能在 iDRAC 中显示为以下状态。
要检查 iSM 服务状态:
所有 VxRail 至 7.0.x
/etc/init.d/dcism-netmon-watchdog status
8.0+
/etc/init.d/dellism status
它们可能具有以下状态之一:
- iSM 处于活动状态(正在运行)
- 这是完全正常工作的状态
- iSM is active (not running)
- iSM 处于活动状态(运行有限的功能)
- iSM 处于非活动状态(无效)
Cause
此问题有许多可能的原因。一个此类示例是 iDRAC 上的服务未完全正常工作,导致 iSM 无法与其通信。
应在正常技术审查(日志、发行说明、知识库文章 (KB) 等)下调查任何单个根本原因,并根据需要使用标准流程(CTE、DE、EE)上报。
Resolution
要解决此问题,请遵循以下步骤:
-
打开与 iSM 未在 IDRAC 上运行的每个节点的 SSH 会话。
在每个节点上执行以下步骤:
-
首先,冷重新启动 iDRAC 以重新启动其作系统。以下每种方法都是完成此任务的方法;因此,不一定要同时运行这三项。
/opt/vxrail/tools/ipmitool mc reset cold SSH into iDRAC (same login as web) racadm> racreset hard
-
停止节点上的 iSM 服务。
7.0.x and earlier # /etc/init.d/dcism-netmon-watchdog stop 8.0 # /etc/init.d/dellism stop
-
安装 iSMPKIHelper
# cd /opt/dell/srvadmin/iSM/bin # ./Invoke-iSMPKIHelper -install
-
在节点上启动 iSM 服务。
7.0.x and earlier # /etc/init.d/dcism-netmon-watchdog start 8.0 # /etc/init.d/dellism start
-
将服务从 0 设置为 1
# esxcli system wbem set -e 0 # esxcli system wbem set -e 1
-
运行 SupportAssistCollection 脚本以收集 iDRAC 日志
# cd /opt/dell/srvadmin/iSM/bin # ./Invoke-SupportAssistCollection SupportAssist log Collection is in progress.. [||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||]100% Downloading the collected log file is in progress.. SupportAssist Collection logs can be found in path /tmp/TSR20190826xxxxxx_xxxxxx.zip
如果 iSM 处于“活动(未运行)”状态,并且无法通过”/etc/init.d/dcism-netmon-watchdog restart“或”/etc/init.d/dellism“:它可能与以下服务相关。
请尝试执行以下步骤。
/etc/init.d/dcism-netmon-watchdog status /etc/init.d/sfcbd-watchdog stop /etc/init.d/sfcbd-watchdog start /etc/init.d/dcism-netmon-watchdog restart /etc/init.d/dcism-netmon-watchdog status
以下工作与上述工作相同:
7.0.x 及更早版本
/opt/vxrail/tools/ipmitool mc reset cold ; sleep 300 ; /etc/init.d/sfcbd-watchdog stop ; /etc/init.d/dcism-netmon-watchdog stop; /etc/init.d/vxrail-pservice stop; rm /var/run/log/vxps_cache.dat ; sleep 10 ; /etc/init.d/sfcbd-watchdog start ; /etc/init.d/dcism-netmon-watchdog start; sleep 120 ; /etc/init.d/vxrail-pservice start
8.0
/opt/vxrail/tools/ipmitool mc reset cold ; sleep 300 ; /etc/init.d/sfcbd-watchdog stop ; /etc/init.d/dellism stop; /etc/init.d/vxrail-pservice stop; rm /var/run/log/vxps_cache.dat ; sleep 10 ; /etc/init.d/sfcbd-watchdog start ; /etc/init.d/dellism start; sleep 120 ; /etc/init.d/vxrail-pservice start
8.0.3xx:
/opt/platformsvc/bin/ipmitool.sh mc reset cold ; sleep 300 ; /etc/init.d/sfcbd-watchdog stop ; /etc/init.d/dellism stop; esxcli daemon control stop -s platformsvc; rm /var/run/log/vxps_cache.dat ; sleep 10 ; /etc/init.d/sfcbd-watchdog start ; /etc/init.d/dellism start; sleep 120 ; esxcli daemon control start -s platformsvc
如果 iSM 状态为“非活动(无效)”,则重新启动 iSM 服务不会将其状态从“无效”更改为“无效”。尝试通过 iSM 删除、升级或安装会导致以下错误。
It is not safe to continue. Please reboot the host immediately to discard the unfinished update.
cause = ('DEL-dcism(4.1.0.0.2410-DEL.700.0.0.15843807)', "Failed to unmount tardisk dcism.v00 of VIB DEL_bootbank_dcism_4.1.0.0.2410-DEL.700.0.0.15843807: Error in running [rm /tardisks/dcism.v00]:\nReturn code: 1\nOutput: rm: can't remove '/tardisks/dcism.v00': Device or resource busy\n")
vibs = ['DEL_bootbank_dcism_4.1.0.0.2410-DEL.700.0.0.15843807']
Please refer to the log file for more details.
[root@nl93vh1012:/tardisks] localcli software vib remove -n dcism
Errors:
[LiveInstallationError]
DEL_bootbank_dcism_4.1.0.0.2410-DEL.700.0.0.15843807: Failed to unmount tardisk dcism.v00 of VIB DEL_bootbank_dcism_4.1.0.0.2410-DEL.700.0.0.15843807: Error in running [rm /tardisks/dcism.v00]:
Return code: 1
Output: rm: can't remove '/tardisks/dcism.v00': Device or resource busy
停止服务以释放对上述 tardisk 的访问权限。在此之后,iSM 进程可以启动备份。
/etc/init.d/sfcbd-watchdog stop
然后,您可以重试升级或立即手动更新 iSM,如下所示:
esxcli software vib update -d /vmfs/volumes/vsan\:*/upgradeBundles-*/<ISM version being upgraded to>.zip
其中,vSAN upgradeBundles 文件夹涉及 UUID,ISM 版本取决于 VxRail 升级要升级到的版本。
如果这不能解决问题,您可能必须耗尽节点的电量。
建议先尝试虚拟电量释放,因为它可以远程完成。物理电量消耗需要物理访问。
Dell EMC VxRail:如何通过 iDRAC 执行节点的远程辅助电源释放( 需要戴尔支持帐户才能查看本文)
如果问题仍然存在,建议联系戴尔技术支持以获得帮助;请参阅此知识库文章。