PowerStore. Сбой при сборе данных. В пользовательском интерфейсе PowerStore Manager появляется сообщение с неправильной информацией

Summary: В пользовательском интерфейсе PowerStore Manager появляются сообщения с неверными значениями, ошибками или информацией о сбое заданий. Не удается запустить вспомогательные материалы или сбор вспомогательных данных, либо операция зависает при выполнении. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Наблюдаются следующие признаки неисправности:

  • Не удается запустить вспомогательные материалы или сбор вспомогательных данных, либо операция зависает при выполнении в пользовательском интерфейсе PowerStore Manager. При запуске сбора данных через интерфейс командной строки (svc_dc run) происходит сбой и отображаются следующие сообщения. 
    • FAILURE, Running too long
    • Timed out receiving service data bundle command response from container
  • Отображаемая емкость томов составляет 0 ГБайт.  
  • Не удается создать или удалить объекты (например, тома и т. д.).  
  • Невозможно расширить тома: ошибка 0xE0A080030019.
  • Политики защиты более не работают (новые моментальные снимки не создаются, а срок действия старых не заканчивается), и происходит сбой проверки репликации.
  • Невозможно просмотреть или изменить состояние SSH. Ошибка. There was an error retrieving this information. Unknown property is_ssh_enabled requested. (0xE04040020002)
  • Ошибки подключения домена LDAP
  • Оповещения о заполнении корневого раздела или о нехватке свободного места. Временные файлы сбора данных не удаляются из /cyc_var/cyc_service/tmp на дополнительном узле, что может привести к заполнению корневого раздела. В системе появляется следующее предупреждение: «Root partition usage of node X has exceeded Y% (codes: 0x00400601 or 0x00400602)
  • В некоторых крайних случаях, когда не предпринимается никаких действий по устранению проблем с пространством корневого раздела, дополнительный узел может перейти в режим обслуживания.
  • Мониторинг > системных проверок выполнить проверку > системы с ошибкой команды Fireman. (0xE0F010200004)



Пример проблемы сбора данных, которая наблюдается в PowerStore Manager.

image.png


Пример сбоя проверки системы, который наблюдается в PowerStore Manager.

image.png


 

Cause

Множество сеансов входа в систему с использованием systemd приводит к утечке памяти в служебном контейнере. Работа сервиса fireman в служебном контейнере прекращается во время сбора данных из-за нехватки памяти.

Сервис fireman остается в нерабочем состоянии, если systemd не обнаруживает неисправность после прекращения работы fireman.

Resolution

Исправление

Исправление для предотвращения этой проблемы установлено в версиях PowerStoreOS 2.1.1.0-1649887. Рекомендуется выполнить модернизацию.

Это исправление указано в примечаниях к выпуску PowerStoreOS версии 2.1.1.0 (исправления A03 или выше):
Идентификатор проблемы Функциональная область Описание
MDT-361718  PowerStore Manager (графический интерфейс) Из-за проблем с управляющим путем или ресурсами управления со временем возможно ухудшение работы пользовательских интерфейсов системы PowerStore. Это может привести к медленному отклику или невозможности сбора данных в PowerStore Manager (UI).

Временное решение


Примечание.: Временное решение проблемы доступно только для моделей PowerStore T. В PowerStore X есть дополнительные требования и шаги, которые необходимо выполнить перед перезапуском любых служб.

Если проблема уже существует, обратитесь в службу технической поддержки Dell или к уполномоченному представителю отдела технического обслуживания и укажите идентификатор этой статьи базы знаний, прежде чем пытаться выполнить модернизацию.

Чтобы устранить эту проблему, если она уже присутствует, необходимо перезапустить две службы.
  • Сервисный контейнер на затронутом узле.
    • Перезапуск сервисного контейнера занимает около 10 минут.
    • Это никакое не повлияет на систему, кроме кратковременной потери доступа к контейнеру сервисов (ssh или cli) затронутого узла.
  • Путь управления (CP) или службы управления.
    • Перезапуск занимает около пяти минут.
    • Это не повлияет на работу системы, кроме кратковременной потери доступа к пользовательскому интерфейсу PowerStore Manager.

Через несколько минут пространство в корневом разделе дополнительного узла уменьшится до нормального уровня.

Если содержание раздела /cyc_cfs превышает 85%, удалите старые контроллеры домена из пользовательского интерфейса PowerStore Manager.

После перезапуска служб могут появиться некоторые оповещения, например:
  • Оповещения о возможности подключения SupportAssist.
  • Оповещения о целевой точке восстановления репликации не выполнены.
  • Оповещения об автоматическом удалении моментальных снимков.
Все они должны удаляться самостоятельно после составления плана действий. Чтобы некоторые из них могли дождаться следующего цикла целевой точки восстановления (репликации) или расписания создания снимков, требуется некоторое время.

Additional Information

Определение проблемы

Проверьте, нет ли большого количества утечек в сеансах входа (более 5000 утечек свидетельствуют о наличии проблемы).
[SVC:service@xxxxxxx-A ~]$ ll /run/systemd/system/ | wc -l  
23251


Сбой при сборе данных со следующим сообщением об ошибке: FAILURE, Running too long:
[SVC:service@xxxxxxx-A user]$ svc_dc list e62c17be-7716-49ef-a0b0-7365db383e6e
start_timestamp            2022-01-19 04:42:46
end_timestamp              2022-01-19 04:59:46
status                     FAILURE
status_message             FAILURE, Running too long.
state                      OFFLINE
description
profiles                   Essential
creator_type               Manual
compressed_size
uncompressed_size
uploaded                   Never
downloaded                 Never
id                         e62c17be-7716-49ef-a0b0-7365db383e6e


Если процесс fireman больше не существует на основном узле, при сборе данных происходит сбой со следующей ошибкой: «Timed out receiving service data bundle command response from container».
[SVC:service@xxxxxxx-B user]$ svc_dc list 7ad948cb-5029-422f-b4dc-5bf2f9abf512
start_timestamp            2021-10-21 06:03:11
end_timestamp              2021-10-21 06:03:11
status                     FAILURE
status_message             Timed out receiving service data bundle command response from container  
state                      OFFLINE
description                2021-10-21 Daily Data Collection
profiles                   Essential
creator_type               Scheduled
compressed_size
uncompressed_size
uploaded                   Never
downloaded                 Never
id                         7ad948cb-5029-422f-b4dc-5bf2f9abf512

Affected Products

PowerStore

Products

Storage, Entry Level & Midrange, PowerStore, PowerStore 1000X, PowerStore 1000T, PowerStore 3000X, PowerStore 3000T, PowerStore 5000X, PowerStore 5000T, PowerStore 500T, PowerStore 7000X, PowerStore 7000T, PowerStore 9000X, PowerStore 9000T
Article Properties
Article Number: 000193605
Article Type: Solution
Last Modified: 29 May 2024
Version:  21
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.