VxRail. Руководство по поиску и устранению неисправностей для хостов VMware ESXi в состоянии «Не отвечает»
Summary: В этой статье приведены ответы на вопросы о виртуальных машинах (ВМ), размещенных на не отвечающих хостах ESXi, и приведены инструкции по возврату хостов ESXi в стабильное состояние.
Symptoms
- Хост ESXi сообщил, что веб-клиент vSphere не отвечает.
- Невозможно управлять хостами ESXi из веб-клиента vSphere.
- Можно проверить связь с не отвечающим хостом ESXi и расположенными на нем виртуальными машинами.
- Возможен доступ к виртуальным машинам через SSH или протокол удаленного рабочего стола (RDP), запущенный на хосте ESXi.
Cause
Возможно, произошел сбой одной из служб управления на хосте или она перешла в состояние «Не отвечает».
Для этого требуется анализ первопричин сбоя или прекращения работы служб управления. Соберите журналы сервера vCenter Server и хоста ESXi, используя ссылку на статью VMware Сбор диагностической информации для VMware ESXi перед возвращением кластера и ESXi в стабильное состояние.
Иногда это невозможно, так как узел не отвечает на команды сбора журналов. Ознакомьтесь с информацией в разделе «Решение» данной статьи. При необходимости с помощью службы поддержки Dell можно проанализировать журналы, чтобы понять основную причину и проверить, связаны ли с ней следующие известные проблемы.
Resolution
перезапуск», hostd или vpxa на хосте может помочь вернуть управляемость хоста в клиенте vSphere Client. Это делается с помощью сеанса SSH на хосте ESXi.
Еще одним ответом на хост ESXi, который не отвечает, является перезапуск агентов управления на хостах ESXi.
services.sh Команда restart. Перезапуск агентов управления хоста может повлиять на выполняемые задачи, в том числе на гостевые виртуальные машины на хосте.
Перезапуск агентов управления хостов ESXi выполняется напрямую с помощью интерфейса командной строки или сеанса SSH на ESXi (если SSH был включен до возникновения проблемы).
Однако если протокол SSH не включен, доступ к порту BMC-iDRAC дает доступ к экрану ESXi DCUI, на котором можно перезапустить службы управления. См. статью 1003490 VMware о перезапуске агентов управления в ESXi.
DCUI может перестать отвечать. Выключение виртуальных машин вручную с помощью SSH или RDP — единственный вариант вернуть среду в стабильное состояние. После этого с помощью BMC-iDRAC Power Control выключите и снова включите (перезагрузите) хост ESXi, чтобы вернуть хост ESXi в стабильное состояние.
Регистрация виртуальных машин на стабильных хостах сразу после их выключения позволяет сократить время простоя виртуальных машин перед перезагрузкой не отвечающего хоста ESXi. (После этого хост ESXi с проблемными ресурсами можно перезагрузить.) См. статью VMware о том, как зарегистрировать или добавить виртуальную машину (ВМ) в инвентаризацию vSphere на сервере vCenter Server
. Если не удается выключить виртуальные машины с помощью SSH или RDP, завершите работу виртуальной машины с помощью сеанса SSH хоста ESXi. См. статью VMware Не удается выключить виртуальную машину на хосте ESXi
Проблемы с виртуальными машинами:
- Не удается выключить виртуальные машины на хосте ESXi — 1014165
- Выключение не отвечающей виртуальной машины на хосте ESXi — 1004340
- Виртуальные машины отображаются как недействительные или потерянные в vCenter Server — 1003742
- Виртуальные машины, по-видимому, запущены или зарегистрированы на нескольких серверах ESX/ESXi — 319918
- Включение виртуальной машины из командной строки, если хостом невозможно управлять с помощью клиента vSphere Client, — 1038043
- Поиск и устранение неисправностей виртуальной машины, которая перестала отвечать — 1007819