PowerVault ME5. Интерфейс управления недоступен или не отвечает

Summary: Администраторы могут сообщать о невозможности доступа к PowerVault Manager, не невозможности открыть сеанс SSH или войти в сеанс последовательной передачи данных. Контроллер хранилища продолжает обслуживать данные подключенных внешних хостов. Модернизируйте микропрограмму контроллера до версии ME5.1.2.1.0 или более поздней. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Контроллер управления (MC) и контроллер хранилища (SC) — это отдельные подсистемы в массивах серии ME. Массив продолжает обслуживать операции ввода-вывода, однако все интерфейсы управления (пользовательский интерфейс, SSH, последовательной передачи, SNMP или REST API) не отвечают.

Примечание. В оригинальной статье рекомендовалось обновить до версии ME5.1.2.0.1 или более поздней. Эта статья была обновлена с учетом рекомендации по модернизации микропрограммы контроллера до версии ME5.1.2.1.0 или более поздней. В ней содержатся дополнительные исправления, которые предотвращают перезапуск контроллера управления по сигналам внешних приложений управления, использующих запросы SNMP или REST API.

Типичные признаки:

  • Пользовательский интерфейс PowerVault Manager недоступен.
  • Не удается открыть сеанс SSH для одного или обоих интерфейсов управления.
  • Не удается войти в интерфейс командной строки сеанса последовательной передачи.
  • Массив не отвечает на запросы или пропал из зоны видимости внешних приложений управления (SNMP или REST API).

После обзора журналов событий см. инструкции по устранению проблемы ниже. Администраторы могут увидеть следующую запись в журнале истории событий, даже если модернизация микропрограммы не выполняется.

...
B849       2023-08-08 01:08:16  152   WARNING        The Storage Controller is not receiving data from the Management Controller. (This is normal during firmware update.)
...

 

Cause

Из-за нехватки памяти процессы приложения управления завершаются. Инциденты могут возникать чаще в средах, где внешние приложения управления опрашивают интерфейсы управления с помощью SNMP или REST API.

Примечания к выпуску ME5.
FMW-65056 устраняет состояние, которое может привести к отсутствию отклика интерфейса командной строки (CLI) и пользовательского интерфейса.

Какие системы могут быть затронуты?

Продукт (и версия) Следующие хранилища Dell PowerVault серии ME5
  • PowerVault ME5012
  • PowerVault ME5024
  • PowerVault ME5084
Запуск базового программного обеспечения
(операционная система или операционная среда)
Микропрограмма контроллера PowerVault ME5 версии НИЖЕ ME5.1.2.0.1

 

Resolution

  1. По возможности попробуйте открыть сеанс SSH или создать последовательное USB-подключение к каждому интерфейсу управления контроллером и перезапустите службы контроллера управления. Если операция прошла успешно, модернизируйте микропрограмму контроллера.
  2. В случаях, когда невозможно войти в систему с помощью последовательного подключения SSH или USB, необходимо физически переустановить один из затронутых модулей контроллера, а после восстановления управления на этом контроллере перезапустить одноранговый контроллер. В массиве с одним модулем контроллера или конфигурациями с хостами без резервирования пути необходимо организовать окно обслуживания, завершить работу хостов, а затем отключить питание массива.
  3. После восстановления доступа к управлению для обоих модулей контроллера модернизируйте микропрограмму модуля контроллера до ME5.1.2.1.0 или более поздней версии.

Процедура:

Шаг 1. Попробуйте перезапустить службы управления на обоих контроллерах.

  • Этот шаг может быть недоступен в любых обстоятельствах. Перезапуск контроллера управления не влияет на производительность.
  • На этом этапе сеанс управления завершается, и доступ к управлению восстанавливается примерно через две или три минуты после перезапуска служб.
  • Если службы управления можно успешно перезапустить на обоих модулях контроллера, перейдите к шагу 3. Модернизируйте микропрограмму модуля контроллера до ME5.1.2.1.0 или более поздней версии.
  1. Откройте сеанс SSH в интерфейсе управления каждого контроллера и войдите в систему как пользователь уровня управления или администратора. Кроме того, администратор может попробовать подключиться к каждому контроллеру через последовательный порт USB. Если вход в систему с помощью SSH или последовательного подключения невозможен, перейдите к шагу 2. Физически переустановите один модуль контроллера или отключите питание массива.

  2. Если вход в систему выполнен успешно, перезапустите контроллер управления на каждом из них с помощью следующей команды:

    restart mc full
    
    # restart mc full
    During the restart process you will briefly lose communication with the specified Management Controller(s).
    Do you want to continue? (y/n) y
    
    Info: Restarting the local MC (A)...
    Success: Command completed successfully. (2023-08-24 05:34:01)
    # Killed

Шаг 2. Физически переустановите один модуль контроллера или отключите питание массива.

ВНИМАНИЕ! Извлечение контроллеров может нарушить доступ хостов к данным, а в некоторых случаях необходимо заранее остановить операции ввода-вывода хоста, чтобы предотвратить непредвиденный перебой в работе или потенциальную потерю данных.

Сценарий 1. Два контроллера с конфигурацией хоста с резервированием пути
Эти шаги можно реализовать без необходимости в окне обслуживания.

Должны выполняться следующие условия.

  • Хосты должны иметь путь подключения к контроллерам A и B.
  • Для хостов должна быть настроена и включена поддержка нескольких путей.
  • Все инициаторы хостов должны быть сопоставлены с томами.

Инструкции см. в разделе Извлечение и замена модулей > Заменяемые клиентом компоненты документа Руководство пользователя хранилища Dell PowerVault серии ME5.

  1. Физически потяните модуль контроллера B вперед в его слоте примерно на пять сантиметров (около двух дюймов), затем через 30 секунд установите на место модуль контроллера.

  2. Подождите примерно две или три минуты, пока контроллер B запустится и загрузит микропрограмму.

  3. Откройте сеанс SSH по IP-адресу управления контроллера B и войдите в систему как пользователь уровня управления или администратора.

  4. Перезапустите одноранговый контроллер хранилища A. Введите команду:

    restart sc a
    
    # restart sc a  While a Storage Controller is restarting, communication will temporarily be lost with the corresponding Management Controller, and also may cause a temporary loss of data availability. Do you want to continue? (y/n) y Success: Command completed successfully. - The command to restart SC A completed successfully. The controller will restart in approximately 30 seconds. (2023-08-24 07:08:39)
  5. Когда одноранговый контроллер включен, войдите в PowerVault Manager и перейдите к шагу 3. Модернизируйте микропрограмму модуля контроллера до ME5.1.2.1.0 или более поздней версии.

Сценарий 2. Конфигурация с одним модулем контроллера или без резервирования пути хоста
Требуется окно обслуживания. Неожиданное удаление единственного пути к данным приводит к тому, что хост теряет к ним доступ и перестает отвечать!

Инструкции см. в разделе Извлечение и замена модулей > заменяемых клиентом компонентов в Руководстве пользователя хранилища Dell PowerVault серии ME5.

  1. Уведомите пользователей о перебое в работе и следуйте инструкциям в руководстве пользователя операционной системы хоста, чтобы перевести подключенный хост в режим обслуживания или отключить хосты.

  2. На задней панели массива выключите оба блока питания примерно на 60 секунд, затем снова включите их.

  3. Подождите примерно три минуты, пока контроллеры запустятся и загрузят микропрограмму.

  4. Войдите в PowerVault Manager и перейдите к шагу 3. Модернизируйте микропрограмму модуля контроллера до ME5.1.2.1.0 или более поздней версии.

Шаг 3. Модернизируйте микропрограмму модуля контроллера до ME5.1.2.1.0 или более поздней версии.

См. раздел Обновление микропрограммы системы в Руководстве администратора Dell PowerVault серии ME5.

  • Скачайте обновление микропрограммы контроллера. В браузере откройте Dell Support
  • Введите сервисный код PowerVault ME или выберите модель PowerVault ME.
  • В разделе Документация выберите Примечания к выпуску хранилища Dell PowerVault ME5.
  • На вкладке Драйверы и скачиваемые материалы скачайте микропрограмму контроллера хранилища Dell PowerVault серии ME5
  • Извлеките двоичный файл микропрограммы из zip-файла.
  • С использованием Dell PowerVault Manager. Перейдите в раздел Maintenance > Firmware > System и скачайте двоичный файл микропрограммы.
  • Перейдите в раздел Maintenance > Firmware > System и нажмите ссылку Activate this Version, чтобы открыть диалоговое окно.
  • Следуйте инструкциям на экране, чтобы начать активацию.

Проверка после модернизации.

С версией ME5.1.2.0.1 или выше микропрограммы контроллера ME5 администраторы могут время от времени получать следующее информационное оповещение.
информационное оповещение
Рис. 1. Информационное оповещение

The Management Controller entered a memory exhaustion state and will reboot to recover. Data access will not be interrupted.

Контроллер управления (MC) обеспечивает пользовательский интерфейс управления и интерфейс командной строки для мониторинга и настройки системы. Перезапуск служб управления не приводит к перезагрузке контроллеров и прерыванию операций ввода-вывода. Перезапуск делает невозможным доступ к интерфейсу управления в течение двух минут. Если вы часто получаете это информационное оповещение, для определения причины может потребоваться дополнительный анализ.

ПРИМЕЧАНИЕ. Системные администраторы должны отслеживать условия сбоя коммутаторов Ethernet, которые создают состояние «отказ в обслуживании» — например, широковещательные штормы или петли остовного дерева на сетевых коммутаторах, пакеты тестов на уязвимости системы безопасности или внешние сценарии с использованием API-интерфейса REST, который выполняется в постоянной петле, создавая несколько сеансов и опрашивая массив каждую секунду, что может привести к тем же признакам, при которых интерфейс управления становится недоступным.

 

Affected Products

ME Series, PowerVault ME5012, PowerVault ME5024, PowerVault ME5084
Article Properties
Article Number: 000215402
Article Type: Solution
Last Modified: 24 Oct 2024
Version:  16
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.