PowerStore. Сбой при сборе данных. В пользовательском интерфейсе PowerStore Manager появляется сообщение с неправильной информацией

Сводка: В пользовательском интерфейсе PowerStore Manager появляются сообщения с неверными значениями, ошибками или информацией о сбое заданий. Не удается запустить вспомогательные материалы или сбор вспомогательных данных, либо операция зависает при выполнении. ...

Данная статья применяется к Данная статья не применяется к Эта статья не привязана к какому-либо конкретному продукту. В этой статье указаны не все версии продуктов.

Симптомы

Наблюдаются следующие признаки неисправности:

  • Не удается запустить вспомогательные материалы или сбор вспомогательных данных, либо операция зависает при выполнении в пользовательском интерфейсе PowerStore Manager. При запуске сбора данных через интерфейс командной строки (svc_dc run) происходит сбой и отображаются следующие сообщения. 
    • FAILURE, Running too long
    • Timed out receiving service data bundle command response from container
  • Отображаемая емкость томов составляет 0 ГБайт.  
  • Не удается создать или удалить объекты (например, тома и т. д.).  
  • Невозможно расширить тома: ошибка 0xE0A080030019.
  • Политики защиты более не работают (новые моментальные снимки не создаются, а срок действия старых не заканчивается), и происходит сбой проверки репликации.
  • Невозможно просмотреть или изменить состояние SSH. Ошибка. There was an error retrieving this information. Unknown property is_ssh_enabled requested. (0xE04040020002)
  • Ошибки подключения домена LDAP
  • Оповещения о заполнении корневого раздела или о нехватке свободного места. Временные файлы сбора данных не удаляются из /cyc_var/cyc_service/tmp на дополнительном узле, что может привести к заполнению корневого раздела. В системе появляется следующее предупреждение: «Root partition usage of node X has exceeded Y% (codes: 0x00400601 or 0x00400602)
  • В некоторых крайних случаях, когда не предпринимается никаких действий по устранению проблем с пространством корневого раздела, дополнительный узел может перейти в режим обслуживания.
  • Мониторинг > системных проверок выполнить проверку > системы с ошибкой команды Fireman. (0xE0F010200004)



Пример проблемы сбора данных, которая наблюдается в PowerStore Manager.

image.png


Пример сбоя проверки системы, который наблюдается в PowerStore Manager.

image.png


 

Причина

Множество сеансов входа в систему с использованием systemd приводит к утечке памяти в служебном контейнере. Работа сервиса fireman в служебном контейнере прекращается во время сбора данных из-за нехватки памяти.

Сервис fireman остается в нерабочем состоянии, если systemd не обнаруживает неисправность после прекращения работы fireman.

Разрешение

Исправление

Исправление для предотвращения этой проблемы установлено в версиях PowerStoreOS 2.1.1.0-1649887. Рекомендуется выполнить модернизацию.

Это исправление указано в примечаниях к выпуску PowerStoreOS версии 2.1.1.0 (исправления A03 или выше):
Идентификатор проблемы Функциональная область Описание
MDT-361718  PowerStore Manager (графический интерфейс) Из-за проблем с управляющим путем или ресурсами управления со временем возможно ухудшение работы пользовательских интерфейсов системы PowerStore. Это может привести к медленному отклику или невозможности сбора данных в PowerStore Manager (UI).

Временное решение


Примечание.: Временное решение проблемы доступно только для моделей PowerStore T. В PowerStore X есть дополнительные требования и шаги, которые необходимо выполнить перед перезапуском любых служб.

Если проблема уже существует, обратитесь в службу технической поддержки Dell или к уполномоченному представителю отдела технического обслуживания и укажите идентификатор этой статьи базы знаний, прежде чем пытаться выполнить модернизацию.

Чтобы устранить эту проблему, если она уже присутствует, необходимо перезапустить две службы.
  • Сервисный контейнер на затронутом узле.
    • Перезапуск сервисного контейнера занимает около 10 минут.
    • Это никакое не повлияет на систему, кроме кратковременной потери доступа к контейнеру сервисов (ssh или cli) затронутого узла.
  • Путь управления (CP) или службы управления.
    • Перезапуск занимает около пяти минут.
    • Это не повлияет на работу системы, кроме кратковременной потери доступа к пользовательскому интерфейсу PowerStore Manager.

Через несколько минут пространство в корневом разделе дополнительного узла уменьшится до нормального уровня.

Если содержание раздела /cyc_cfs превышает 85%, удалите старые контроллеры домена из пользовательского интерфейса PowerStore Manager.

После перезапуска служб могут появиться некоторые оповещения, например:
  • Оповещения о возможности подключения SupportAssist.
  • Оповещения о целевой точке восстановления репликации не выполнены.
  • Оповещения об автоматическом удалении моментальных снимков.
Все они должны удаляться самостоятельно после составления плана действий. Чтобы некоторые из них могли дождаться следующего цикла целевой точки восстановления (репликации) или расписания создания снимков, требуется некоторое время.

Дополнительная информация

Определение проблемы

Проверьте, нет ли большого количества утечек в сеансах входа (более 5000 утечек свидетельствуют о наличии проблемы).
[SVC:service@xxxxxxx-A ~]$ ll /run/systemd/system/ | wc -l  
23251


Сбой при сборе данных со следующим сообщением об ошибке: FAILURE, Running too long:
[SVC:service@xxxxxxx-A user]$ svc_dc list e62c17be-7716-49ef-a0b0-7365db383e6e
start_timestamp            2022-01-19 04:42:46
end_timestamp              2022-01-19 04:59:46
status                     FAILURE
status_message             FAILURE, Running too long.
state                      OFFLINE
description
profiles                   Essential
creator_type               Manual
compressed_size
uncompressed_size
uploaded                   Never
downloaded                 Never
id                         e62c17be-7716-49ef-a0b0-7365db383e6e


Если процесс fireman больше не существует на основном узле, при сборе данных происходит сбой со следующей ошибкой: «Timed out receiving service data bundle command response from container».
[SVC:service@xxxxxxx-B user]$ svc_dc list 7ad948cb-5029-422f-b4dc-5bf2f9abf512
start_timestamp            2021-10-21 06:03:11
end_timestamp              2021-10-21 06:03:11
status                     FAILURE
status_message             Timed out receiving service data bundle command response from container  
state                      OFFLINE
description                2021-10-21 Daily Data Collection
profiles                   Essential
creator_type               Scheduled
compressed_size
uncompressed_size
uploaded                   Never
downloaded                 Never
id                         7ad948cb-5029-422f-b4dc-5bf2f9abf512

Затронутые продукты

PowerStore

Продукты

Storage, Entry Level & Midrange, PowerStore, PowerStore 1000X, PowerStore 1000T, PowerStore 3000X, PowerStore 3000T, PowerStore 5000X, PowerStore 5000T, PowerStore 500T, PowerStore 7000X, PowerStore 7000T, PowerStore 9000X, PowerStore 9000T
Свойства статьи
Номер статьи: 000193605
Тип статьи: Solution
Последнее изменение: 29 May 2024
Версия:  21
Получите ответы на свои вопросы от других пользователей Dell
Услуги технической поддержки
Проверьте, распространяются ли на ваше устройство услуги технической поддержки.