VxRail: iSM "не працює", "працює з обмеженою функціональністю" або "неактивний (мертвий)"
Summary: iSM знаходиться в стані «не працює» або «працює з обмеженою функціональністю». У даній статті описані методи їх вирішення.
Symptoms
Модуль обслуговування iDRAC (iSM) є важливою послугою на хостів, щоб мати можливість збирати інформацію з iDRAC для моніторингу.
Це може відображатися в iDRAC як такий стан.
Щоб перевірити статус послуги iSM:
Усі VxRail до 7.0.x
/etc/init.d/dcism-netmon-watchdog status
8.0+
/etc/init.d/dellism status
Вони можуть мати один з таких статусів:
- iSM активний (виконується)
- Це повністю функціональний стан
- iSM активний (не запущений)
- iSM активний (працює з обмеженою функціональністю)
- iSM неактивний (мертвий)
Cause
Існує багато можливих причин цієї проблеми. Одним із таких прикладів є те, що послуги на iDRAC не є повністю функціональними, що не дозволяє iSM спілкуватися з ним.
Будь-яка окрема першопричина має бути досліджена під час звичайного технічного огляду (журнали, примітки до випуску, статті бази знань (KBs) тощо) і за необхідності розширена за допомогою стандартних процесів (CTE, DE, EE).
Resolution
Щоб вирішити цю проблему, виконайте наведені нижче дії.
-
Відкрийте сеанс SSH для кожного вузла, на якому iSM не запущено на IDRAC.
Дотримуйтесь наведених нижче дій на кожному з вузлів:
-
Спочатку холодне перезавантаження iDRAC, щоб перезавантажити його операційну систему. Кожен з наведених нижче методів є способами виконання цього завдання; Через це не обов'язково запускати всі три.
/opt/vxrail/tools/ipmitool mc reset cold SSH into iDRAC (same login as web) racadm> racreset hard
-
Зупиніть послугу iSM на вузлі.
7.0.x and earlier # /etc/init.d/dcism-netmon-watchdog stop 8.0 # /etc/init.d/dellism stop
-
Встановити iSMPKIHelper
# cd /opt/dell/srvadmin/iSM/bin # ./Invoke-iSMPKIHelper -install
-
Запустіть службу iSM на вузлі.
7.0.x and earlier # /etc/init.d/dcism-netmon-watchdog start 8.0 # /etc/init.d/dellism start
-
Встановити сервіс від 0 до 1
# esxcli system wbem set -e 0 # esxcli system wbem set -e 1
-
Запустіть скрипт SupportAssistCollection для збору журналів iDRAC
# cd /opt/dell/srvadmin/iSM/bin # ./Invoke-SupportAssistCollection SupportAssist log Collection is in progress.. [||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||]100% Downloading the collected log file is in progress.. SupportAssist Collection logs can be found in path /tmp/TSR20190826xxxxxx_xxxxxx.zip
Якщо iSM "активний (не запущений)" і не може відновитися за допомогою "/etc/init.d/dcism-netmon-watchdog restart" або "/etc/init.d/dellism»: це може бути пов'язано з наступною послугою.
Спробуйте виконати наведені нижче дії.
/etc/init.d/dcism-netmon-watchdog status /etc/init.d/sfcbd-watchdog stop /etc/init.d/sfcbd-watchdog start /etc/init.d/dcism-netmon-watchdog restart /etc/init.d/dcism-netmon-watchdog status
Наступні працюють так само, як і вище:
7.0.x і старші
/opt/vxrail/tools/ipmitool mc reset cold ; sleep 300 ; /etc/init.d/sfcbd-watchdog stop ; /etc/init.d/dcism-netmon-watchdog stop; /etc/init.d/vxrail-pservice stop; rm /var/run/log/vxps_cache.dat ; sleep 10 ; /etc/init.d/sfcbd-watchdog start ; /etc/init.d/dcism-netmon-watchdog start; sleep 120 ; /etc/init.d/vxrail-pservice start
8.0
/opt/vxrail/tools/ipmitool mc reset cold ; sleep 300 ; /etc/init.d/sfcbd-watchdog stop ; /etc/init.d/dellism stop; /etc/init.d/vxrail-pservice stop; rm /var/run/log/vxps_cache.dat ; sleep 10 ; /etc/init.d/sfcbd-watchdog start ; /etc/init.d/dellism start; sleep 120 ; /etc/init.d/vxrail-pservice start
8.0.3xx:
/opt/platformsvc/bin/ipmitool.sh mc reset cold ; sleep 300 ; /etc/init.d/sfcbd-watchdog stop ; /etc/init.d/dellism stop; esxcli daemon control stop -s platformsvc; rm /var/run/log/vxps_cache.dat ; sleep 10 ; /etc/init.d/sfcbd-watchdog start ; /etc/init.d/dellism start; sleep 120 ; esxcli daemon control start -s platformsvc
Якщо стан iSM «неактивний (мертвий)», перезапуск служби iSM не змінює її стан з мертвого. Спроба видалити, оновити або інсталювати через iSM призводить до такої помилки.
It is not safe to continue. Please reboot the host immediately to discard the unfinished update.
cause = ('DEL-dcism(4.1.0.0.2410-DEL.700.0.0.15843807)', "Failed to unmount tardisk dcism.v00 of VIB DEL_bootbank_dcism_4.1.0.0.2410-DEL.700.0.0.15843807: Error in running [rm /tardisks/dcism.v00]:\nReturn code: 1\nOutput: rm: can't remove '/tardisks/dcism.v00': Device or resource busy\n")
vibs = ['DEL_bootbank_dcism_4.1.0.0.2410-DEL.700.0.0.15843807']
Please refer to the log file for more details.
[root@nl93vh1012:/tardisks] localcli software vib remove -n dcism
Errors:
[LiveInstallationError]
DEL_bootbank_dcism_4.1.0.0.2410-DEL.700.0.0.15843807: Failed to unmount tardisk dcism.v00 of VIB DEL_bootbank_dcism_4.1.0.0.2410-DEL.700.0.0.15843807: Error in running [rm /tardisks/dcism.v00]:
Return code: 1
Output: rm: can't remove '/tardisks/dcism.v00': Device or resource busy
Зупиніть роботу служби, щоб вона звільнила свій доступ до вищезазначеного tardisk. Після цього процеси iSM можуть розпочати резервне копіювання.
/etc/init.d/sfcbd-watchdog stop
Потім ви можете повторити спробу оновлення або відразу оновити iSM вручну, як:
esxcli software vib update -d /vmfs/volumes/vsan\:*/upgradeBundles-*/<ISM version being upgraded to>.zip
Де папки vSAN upgradeBundles включають UUID, а версія ISM залежить від того, до чого оновлюється оновлення VxRail.
Якщо це не вирішить проблему, можливо, вам доведеться розрядити живлення вузла.
Рекомендується спочатку спробувати віртуальне розсіювання живлення, оскільки це можна зробити віддалено. Фізичне виснаження енергії вимагає фізичного доступу.
Dell EMC VxRail: Як виконати віддалене додаткове відключення живлення вузла через iDRAC (для перегляду цієї статті потрібен обліковий запис підтримки Dell)
Якщо проблеми не зникнуть, рекомендується звернутися за допомогою до служби технічної підтримки Dell; посилайтеся на цю базу знань.