VxRail: iSM «не работает», «работает с ограниченной функциональностью» или «неактивен (не работает)»
Summary: Контроллер iSM находится в состоянии «не работает» или «работает с ограниченной функциональностью». В данной статье описаны методы решения проблемы.
Symptoms
iDRAC Service Module (iSM) — это важная служба на хостах, которая может собирать информацию от iDRAC для мониторинга.
Это может отображаться в iDRAC в следующем состоянии.
Чтобы проверить состояние службы iSM:
Все VxRail до версии 7.0.x
/etc/init.d/dcism-netmon-watchdog status
8.0+
/etc/init.d/dellism status
Они могут иметь один из приведенных ниже статусов.
- ISM активен (выполняется)
- Это полностью функциональное состояние
- iSM is active (not running)
- Контроллер iSM активен (работает с ограниченной функциональностью)
- СМ неактивен (мертв)
Cause
Существует множество возможных причин этой проблемы. Одним из таких примеров является то, что службы на iDRAC не полностью работают, что не позволяет iSM взаимодействовать с ним.
Любая отдельная первопричина должна быть изучена в рамках обычной технической проверки (журналов, примечаний к выпуску, статей базы знаний (KB) и т. д.) и эскалирована по мере необходимости с использованием стандартных процессов (CTE, DE, EE).
Resolution
Для устранения этой неполадки выполните следующие действия.
-
Подключитесь по SSH к каждому узлу, на котором модуль iSM не запущен в iDRAC.
Выполните следующие действия на каждом узле.
-
Сначала выполните холодную перезагрузку iDRAC, чтобы перезагрузить операционную систему. Каждый из следующих методов является способом выполнения этой задачи; Из-за этого не обязательно запускать все три.
/opt/vxrail/tools/ipmitool mc reset cold SSH into iDRAC (same login as web) racadm> racreset hard
-
Остановите службу iSM на узле.
7.0.x and earlier # /etc/init.d/dcism-netmon-watchdog stop 8.0 # /etc/init.d/dellism stop
-
Установите iSMPKIHelper.
# cd /opt/dell/srvadmin/iSM/bin # ./Invoke-iSMPKIHelper -install
-
Запустите службу iSM на узле.
7.0.x and earlier # /etc/init.d/dcism-netmon-watchdog start 8.0 # /etc/init.d/dellism start
-
Установите для сервиса значение 0 на 1
# esxcli system wbem set -e 0 # esxcli system wbem set -e 1
-
Запустите сценарий SupportAssistCollection для сбора журналов iDRAC.
# cd /opt/dell/srvadmin/iSM/bin # ./Invoke-SupportAssistCollection SupportAssist log Collection is in progress.. [||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||]100% Downloading the collected log file is in progress.. SupportAssist Collection logs can be found in path /tmp/TSR20190826xxxxxx_xxxxxx.zip
Если ISM находится в состоянии «активно (не выполняется)» и не может восстановиться с помощью команды «/etc/init.d/dcism-netmon-watchdog restart" или "/etc/init.d/dellism": это может быть связано со следующей услугой.
Попробуйте выполнить следующие действия.
/etc/init.d/dcism-netmon-watchdog status /etc/init.d/sfcbd-watchdog stop /etc/init.d/sfcbd-watchdog start /etc/init.d/dcism-netmon-watchdog restart /etc/init.d/dcism-netmon-watchdog status
Работает то же самое, что и выше:
7.0.x и более ранние версии
/opt/vxrail/tools/ipmitool mc reset cold ; sleep 300 ; /etc/init.d/sfcbd-watchdog stop ; /etc/init.d/dcism-netmon-watchdog stop; /etc/init.d/vxrail-pservice stop; rm /var/run/log/vxps_cache.dat ; sleep 10 ; /etc/init.d/sfcbd-watchdog start ; /etc/init.d/dcism-netmon-watchdog start; sleep 120 ; /etc/init.d/vxrail-pservice start
8.0
/opt/vxrail/tools/ipmitool mc reset cold ; sleep 300 ; /etc/init.d/sfcbd-watchdog stop ; /etc/init.d/dellism stop; /etc/init.d/vxrail-pservice stop; rm /var/run/log/vxps_cache.dat ; sleep 10 ; /etc/init.d/sfcbd-watchdog start ; /etc/init.d/dellism start; sleep 120 ; /etc/init.d/vxrail-pservice start
8.0.3хх:
/opt/platformsvc/bin/ipmitool.sh mc reset cold ; sleep 300 ; /etc/init.d/sfcbd-watchdog stop ; /etc/init.d/dellism stop; esxcli daemon control stop -s platformsvc; rm /var/run/log/vxps_cache.dat ; sleep 10 ; /etc/init.d/sfcbd-watchdog start ; /etc/init.d/dellism start; sleep 120 ; esxcli daemon control start -s platformsvc
Если iSM находится в состоянии «неактивен (мертв)», перезапуск службы iSM не меняет ее состояние с мертвого. Попытка извлечения, обновления или установки через iSM приводит к следующей ошибке.
It is not safe to continue. Please reboot the host immediately to discard the unfinished update.
cause = ('DEL-dcism(4.1.0.0.2410-DEL.700.0.0.15843807)', "Failed to unmount tardisk dcism.v00 of VIB DEL_bootbank_dcism_4.1.0.0.2410-DEL.700.0.0.15843807: Error in running [rm /tardisks/dcism.v00]:\nReturn code: 1\nOutput: rm: can't remove '/tardisks/dcism.v00': Device or resource busy\n")
vibs = ['DEL_bootbank_dcism_4.1.0.0.2410-DEL.700.0.0.15843807']
Please refer to the log file for more details.
[root@nl93vh1012:/tardisks] localcli software vib remove -n dcism
Errors:
[LiveInstallationError]
DEL_bootbank_dcism_4.1.0.0.2410-DEL.700.0.0.15843807: Failed to unmount tardisk dcism.v00 of VIB DEL_bootbank_dcism_4.1.0.0.2410-DEL.700.0.0.15843807: Error in running [rm /tardisks/dcism.v00]:
Return code: 1
Output: rm: can't remove '/tardisks/dcism.v00': Device or resource busy
Остановите сервис, чтобы он освободил свой доступ к указанному выше tardisk. После этого процессы iSM могут начать резервное копирование.
/etc/init.d/sfcbd-watchdog stop
Затем можно повторить попытку модернизации или сразу же обновить iSM вручную, как:
esxcli software vib update -d /vmfs/volumes/vsan\:*/upgradeBundles-*/<ISM version being upgraded to>.zip
Где папки vSAN upgradeBundles содержат UUID, а версия ISM зависит от того, до какой конфигурации модернизируется VxRail.
Если это не устранит проблему, может потребоваться удалить питание узла.
Рекомендуется сначала попробовать виртуальное отключение энергии, так как это можно сделать удаленно. Для физического потребления энергии требуется физический доступ.
Dell EMC VxRail. Как выполнить удаленный дополнительный отвод питания узла через iDRAC (для просмотра этой статьи требуется учетная запись службы поддержки Dell)
Если проблемы не будут устранены, рекомендуется обратиться за помощью в службу технической поддержки Dell. См. эту статью базы знаний.