VxRail:iSM“未运行”、“运行有限的功能”或“处于非活动状态(无效)”

Summary: iSM 处于“未运行”或“运行有限的功能”状态。本文介绍解决方法。

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

iDRAC Service Module (iSM) 是主机上的一项重要服务,能够从 iDRAC 收集信息以进行监视。

这可能在 iDRAC 中显示为以下状态。
显示服务模块状态的 IDRAC UI

要检查 iSM 服务状态:
所有 VxRail 至 7.0.x

/etc/init.d/dcism-netmon-watchdog status

8.0+

/etc/init.d/dellism status

它们可能具有以下状态之一:

  • iSM 处于活动状态(正在运行)
    • 这是完全正常工作的状态
  • iSM is active (not running)
  • iSM 处于活动状态(运行有限的功能)
  • iSM 处于非活动状态(无效)

 

Cause

此问题有许多可能的原因。一个此类示例是 iDRAC 上的服务未完全正常工作,导致 iSM 无法与其通信。

应在正常技术审查(日志、发行说明、知识库文章 (KB) 等)下调查任何单个根本原因,并根据需要使用标准流程(CTE、DE、EE)上报。

 

Resolution

提醒:自 VxRail 8.0 起,重命名了 iSM 服务脚本。

要解决此问题,请遵循以下步骤:

  • 打开与 iSM 未在 IDRAC 上运行的每个节点的 SSH 会话。

在每个节点上执行以下步骤:

  1. 首先,冷重新启动 iDRAC 以重新启动其作系统。以下每种方法都是完成此任务的方法;因此,不一定要同时运行这三项。

    /opt/vxrail/tools/ipmitool mc reset cold
    
    SSH into iDRAC (same login as web)
    racadm> racreset hard
  2. 停止节点上的 iSM 服务。

    7.0.x and earlier
    # /etc/init.d/dcism-netmon-watchdog stop
    8.0
    # /etc/init.d/dellism stop
  3. 安装 iSMPKIHelper

    # cd /opt/dell/srvadmin/iSM/bin
    # ./Invoke-iSMPKIHelper -install
  4. 在节点上启动 iSM 服务。

    7.0.x and earlier
    # /etc/init.d/dcism-netmon-watchdog start
    8.0
    # /etc/init.d/dellism start
  5. 将服务从 0 设置为 1

    # esxcli system wbem set -e 0
    # esxcli system wbem set -e 1
  6. 运行 SupportAssistCollection 脚本以收集 iDRAC 日志

    # cd /opt/dell/srvadmin/iSM/bin
    # ./Invoke-SupportAssistCollection
    SupportAssist log Collection is in progress.. 
    [||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||]100% 
    Downloading the collected log file is in progress.. 
    SupportAssist Collection logs can be found in path /tmp/TSR20190826xxxxxx_xxxxxx.zip
提醒:在完全运行状态之前,iSM 可能需要几分钟时间。建议在尝试之前以及应用下一步之后,留出 5 分钟的时间让 iSM 启动。

如果 iSM 处于“活动(未运行)”状态,并且无法通过”/etc/init.d/dcism-netmon-watchdog restart“或”/etc/init.d/dellism“:它可能与以下服务相关。
请尝试执行以下步骤。

/etc/init.d/dcism-netmon-watchdog status
/etc/init.d/sfcbd-watchdog stop
/etc/init.d/sfcbd-watchdog start
/etc/init.d/dcism-netmon-watchdog restart
/etc/init.d/dcism-netmon-watchdog status

以下工作与上述工作相同:
7.0.x 及更早版本

/opt/vxrail/tools/ipmitool mc reset cold ; sleep 300 ; /etc/init.d/sfcbd-watchdog stop ; /etc/init.d/dcism-netmon-watchdog stop; /etc/init.d/vxrail-pservice stop; rm /var/run/log/vxps_cache.dat ; sleep 10 ; /etc/init.d/sfcbd-watchdog start ; /etc/init.d/dcism-netmon-watchdog start; sleep 120 ; /etc/init.d/vxrail-pservice start

8.0

/opt/vxrail/tools/ipmitool mc reset cold ; sleep 300 ; /etc/init.d/sfcbd-watchdog stop ; /etc/init.d/dellism stop; /etc/init.d/vxrail-pservice stop; rm /var/run/log/vxps_cache.dat ; sleep 10 ; /etc/init.d/sfcbd-watchdog start ; /etc/init.d/dellism start; sleep 120 ; /etc/init.d/vxrail-pservice start

8.0.3xx:

/opt/platformsvc/bin/ipmitool.sh mc reset cold ; sleep 300 ; /etc/init.d/sfcbd-watchdog stop ; /etc/init.d/dellism stop; esxcli daemon control stop -s platformsvc; rm /var/run/log/vxps_cache.dat ; sleep 10 ; /etc/init.d/sfcbd-watchdog start ; /etc/init.d/dellism start; sleep 120 ; esxcli daemon control start -s platformsvc



如果 iSM 状态为“非活动(无效)”,则重新启动 iSM 服务不会将其状态从“无效”更改为“无效”。尝试通过 iSM 删除、升级或安装会导致以下错误。

It is not safe to continue. Please reboot the host immediately to discard the unfinished update.
cause = ('DEL-dcism(4.1.0.0.2410-DEL.700.0.0.15843807)', "Failed to unmount tardisk dcism.v00 of VIB DEL_bootbank_dcism_4.1.0.0.2410-DEL.700.0.0.15843807: Error in running [rm /tardisks/dcism.v00]:\nReturn code: 1\nOutput: rm: can't remove '/tardisks/dcism.v00': Device or resource busy\n")
vibs = ['DEL_bootbank_dcism_4.1.0.0.2410-DEL.700.0.0.15843807']
Please refer to the log file for more details.
[root@nl93vh1012:/tardisks] localcli software vib remove -n dcism
Errors:
[LiveInstallationError]
DEL_bootbank_dcism_4.1.0.0.2410-DEL.700.0.0.15843807: Failed to unmount tardisk dcism.v00 of VIB DEL_bootbank_dcism_4.1.0.0.2410-DEL.700.0.0.15843807: Error in running [rm /tardisks/dcism.v00]:
Return code: 1
Output: rm: can't remove '/tardisks/dcism.v00': Device or resource busy

停止服务以释放对上述 tardisk 的访问权限。在此之后,iSM 进程可以启动备份。

/etc/init.d/sfcbd-watchdog stop

然后,您可以重试升级或立即手动更新 iSM,如下所示:

esxcli software vib update -d /vmfs/volumes/vsan\:*/upgradeBundles-*/<ISM version being upgraded to>.zip

其中,vSAN upgradeBundles 文件夹涉及 UUID,ISM 版本取决于 VxRail 升级要升级到的版本。

如果这不能解决问题,您可能必须耗尽节点的电量。
建议先尝试虚拟电量释放,因为它可以远程完成。物理电量消耗需要物理访问。
Dell EMC VxRail:如何通过 iDRAC 执行节点的远程辅助电源释放( 需要戴尔支持帐户才能查看本文)

如果问题仍然存在,建议联系戴尔技术支持以获得帮助;请参阅此知识库文章。

 

Affected Products

VxRail 460 and 470 Nodes, VxRail D560, VxRail D560F, VxRail E460, VxRail E560, VxRail E560 VCF, VxRail E560F, VxRail E560F VCF, VxRail E560N, VxRail E560N VCF

Products

VxRail E660, VxRail E660F, VxRail E660N, VxRail E665, VxRail E665F, VxRail E665N, VxRail G560, VxRail G560 VCF, VxRail G560F, VxRail G560F VCF, VxRail P470, VxRail P570, VxRail P570 VCF, VxRail P570F, VxRail P570F VCF, VxRail P580N, VxRail P580N VCF , VxRail P670F, VxRail P670N, VxRail P675F, VxRail P675N, VxRail S470, VxRail S570, VxRail S570 VCF, VxRail S670, VxRail V470, VxRail V570, VxRail V570 VCF, VxRail V570F, VxRail V570F VCF, VXRAIL V670F, VxRail VD-4000R, VxRail VD-4000W, VxRail VD-4000Z, VxRail VD-4510C, VxRail VD-4520C, VxRail VE-660, VxRail VE-6615, VxRail VP-760, VxRail VP-7625, VxRail VS-760 ...
Article Properties
Article Number: 000042093
Article Type: Solution
Last Modified: 22 Sep 2025
Version:  24
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.