PowerStore. После перезапуска CP в PowerStoreOS 3.2 или 3.5 процедура диагностики системы может сообщать о нескольких сбоях

Summary: В этой статье объясняется, как после перезапуска CP (включая NDU) в системе PowerStoreOS 3.2 или 3.5 может возникнуть следующая проблема. - Выполнение диагностики системы может привести к нескольким неудачным проверкам. - Сессии репликации также могут находиться в состоянии «приостановлено системой». - Невозможно добавить удаленную систему. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

- Проверка системы может возвращать следующие непройденные проверки:
Pre-Upgrade Check              node_a     Failed     PUHC health check returned 3 failed checks.
Checking SFP Alerts                       Failed
Checking Active Imports                   Failed 
Checking Storage Migrations               Failed  
REST Configuration Service     node_a     Failed     Unable to perform health check due to communication error.


- Сессии репликации могут находиться в состоянии системной приостановки.
Alert 0x01302d03 Data transfer is paused for file system replication session
Alert 0x01700403 A replication session associated with resource VolumeABC123 is in System_Paused state because of error.

- Попытка добавить удаленную систему может завершиться сбоем сразу или через 60 секунд.

Cause

Эта проблема возникла из-за проблемы с программным обеспечением, начиная с версии 3.2.
Имеется несколько сертификатов, что соответствует нескольким IP-адресам, используемым кластером.
Во время перезапуска CP (это может произойти во время бесперебойного обновления, так как мы перезапускаем CP во время бесперебойного обновления, а также это может произойти во время ручного перезапуска CP или любого другого перезапуска CP при работе на затронутой версии) возникает состояние гонки, из-за которого CP не может постоянно загружать все правильные сертификаты.
В результате может быть нарушена связь, зависящая от сертификата, в том числе:

— соединение управления репликацией разорвано и затронуты сессии репликации.
- Сбой диагностики системы.
- Невозможно добавить удаленную систему для настройки репликации.

Resolution

Временное решение.

- Временное решение для сбоя PUHC:
Перезапустите Control Path (CP) еще раз и выполните диагностику системы через пять минут.
svc_container_mgmt restart CP
ПРИМЕЧАНИЕ. Если повторный перезапуск CP не помог устранить проблему, подождите 15 минут и снова перезапустите CP.
Перезапуск CP (служб управления) не влияет на доступ хостов и должен лишь приводить к кратковременной потере доступа к пользовательскому интерфейсу (UI) PowerStore Manager.

 - Временное решение проблемы с приостановкой репликации:
1. Перезапустить Снова выполните CP на проблемном устройстве.
2. Возобновите replication_session в пользовательском интерфейсе исходного дискового массива. Проверьте результат.

- Временное решение для проблемы «Не удается добавить удаленную систему»:

1. Перезапустите CP на проблемном устройстве.
2. Повторите попытку «добавить удаленную систему» в пользовательском интерфейсе исходного дискового массива. Проверьте результат.

 

ПРИМЕЧАНИЕ. Если повторный перезапуск CP не помог устранить проблему, подождите 15 минут и снова перезапустите CP.
Перезапуск CP (служб управления) не влияет на доступ хостов и должен лишь приводить к кратковременной потере доступа к пользовательскому интерфейсу (UI) PowerStore Manager.

 

Исправление:

Исправление этой проблемы доступно в PowerStoreOS 3.6.

Affected Products

PowerStore, PowerStore 1000T, PowerStore 1200T, PowerStore 3000T, PowerStore 3200T, PowerStore 5000T, PowerStore 500T, PowerStore 5200T, PowerStore 7000T, PowerStore 9000T

Products

PowerStore 9200T
Article Properties
Article Number: 000216753
Article Type: Solution
Last Modified: 26 Feb 2024
Version:  8
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.