PowerStore: A verificação de integridade do sistema pode relatar várias falhas após a reinicialização do CP PowerStoreOS 3.2 ou 3.5

Summary: Este artigo explica como, após uma reinicialização do CP (incluir NDU) em um sistema PowerStoreOS 3.2 ou 3.5, o seguinte problema pode ocorrer. - A execução de uma verificação de integridade do sistema pode resultar em várias verificações com falha. - As sessões de replicação também podem estar em um estado pausado do sistema. - Não é possível adicionar um sistema remoto. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

- A verificação do sistema pode retornar as seguintes verificações com falha:
Pre-Upgrade Check              node_a     Failed     PUHC health check returned 3 failed checks.
Checking SFP Alerts                       Failed
Checking Active Imports                   Failed 
Checking Storage Migrations               Failed  
REST Configuration Service     node_a     Failed     Unable to perform health check due to communication error.


- As sessões de replicação podem estar em um estado pausado do sistema.
Alert 0x01302d03 Data transfer is paused for file system replication session
Alert 0x01700403 A replication session associated with resource VolumeABC123 is in System_Paused state because of error.

- A tentativa de adicionar um sistema remoto pode falhar imediatamente ou após 60 segundos.

Cause

Esse problema é resultado de um problema de software desde a versão 3.2.
Há vários certificados, corresponde a vários IPs que o cluster usa.
Durante a reinicialização do CP (pode acontecer durante o NDU, já que reiniciamos o CP durante o NDU, também pode acontecer durante a reinicialização manual do CP ou qualquer outra reinicialização do CP durante a execução na versão afetada), há uma condição de corrida em que o CP não pode carregar todos os certificados corretos o tempo todo durante cada reinicialização.
Como resultado, as comunicações que dependem do certificado podem ser afetadas, incluindo, por exemplo:

- Conexão de gerenciamento de replicação interrompida e sessões de replicação afetadas.
- Falha na verificação de integridade do sistema.
- Não é possível adicionar um sistema remoto para configurar a replicação.

Resolution

Solução temporária:

- Solução temporária para falha de PUHC:
reinicie o caminho de controle (CP) novamente e execute uma verificação de integridade do sistema após cinco minutos.
svc_container_mgmt restart CP
Nota: Se reiniciar outro CP não resolver o problema, aguarde 15 minutos e reinicie o CP novamente.
Reiniciar o CP (serviços de gerenciamento) não afeta o acesso ao host e deve causar apenas uma breve perda de acesso à interface do usuário (UI) do PowerStore Manager.

 - Solução temporária para o problema de pausa da replicação:
1. Reiniciar CP novamente no aparelho problemático.
2. Retome o replication_session na interface do usuário do array de origem. Confira o resultado.

- Solução temporária para o problema "não é possível adicionar o sistema remoto":

1. Reinicie o CP no equipamento problemático.
2. Repita "add remote system" na interface do usuário do array de origem. Confira o resultado.

 

Nota: Se reiniciar outro CP não resolver o problema, aguarde 15 minutos e reinicie o CP novamente.
Reiniciar o CP (serviços de gerenciamento) não afeta o acesso ao host e deve causar apenas uma breve perda de acesso à interface do usuário (UI) do PowerStore Manager.

 

Correção:

A correção para esse problema está disponível no PowerStoreOS 3.6.

Affected Products

PowerStore, PowerStore 1000T, PowerStore 1200T, PowerStore 3000T, PowerStore 3200T, PowerStore 5000T, PowerStore 500T, PowerStore 5200T, PowerStore 7000T, PowerStore 9000T

Products

PowerStore 9200T
Article Properties
Article Number: 000216753
Article Type: Solution
Last Modified: 26 Feb 2024
Version:  8
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.