PowerFlex: Erros de E/S do client quando a replicação está sendo usada

Summary: Client/servidores estão enfrentando erros de E/S em dispositivos com suporte do PowerFlex. O back-end geral (MDM/SDSes) parece estar íntegro. A replicação do PowerFlex está sendo usada e há alguns erros de RPO em relação a um ou mais RCGs. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

  • Nenhuma capacidade degradada ou com falha
  • Nenhum SDS dissociado ou dispositivos SDS relatando erros.
  • Nenhum MDM desconectado

O recurso de replicação está sendo usado.
Um ou mais alertas na interface do usuário relatando os seguintes erros:

Major - The RCG consistent image is too large to be consumed by the destination in one piece.

Minor - Remote Consistency Group RPO Exceeded
Os registros de eventos do MDM podem relatar o seguinte:
2024-06-11 15:55:56.592000:0001566:RPL_PD_CAP_UTILIZATION_MINOR     WARNING  Protection Domain ID <pd_id> Replication journal capacity is at MINOR utilization level
2024-06-11 16:20:12.848000:0001567:RPL_PD_CAP_UTILIZATION_MAJOR     ERROR    Protection Domain ID <pd_id> Replication journal capacity is at MAJOR utilization level
2024-06-11 17:19:57.272000:0001584:RPL_PD_CAP_UTILIZATION_CRITICAL  CRITICAL Protection Domain ID <pd_id> Replication journal capacity is at VERY_HIGH utilization level
2024-06-11 17:52:26.352000:0001585:RPL_PD_CAP_UTILIZATION_CRITICAL  CRITICAL Protection Domain ID <pd_id> Replication journal capacity is at CRITICAL utilization level
...
2024-06-11 16:25:14.381000:0001576:RPL_CG_MOVED_TO_SLIM_MODE        INFO     Replication Consistency Group ID <rcg_id> entered slim mode
2024-06-11 18:27:29.738000:0001586:SDR_CRITICAL_CAP_CHANGE          ERROR    SDR ID <sdr_id>) handling user data changed discarded old user data and stopped to accumulate new user data due critical capacity
 

Impacto 

Os clients não conseguem acessar volumes interceptados para replicação.


Cause

Um defeito raro de software pode ocorrer quando o MDM e o componente SDR discordam nos contadores internos relacionados à capacidade de registro. Essa discrepância pode fazer com que o MDM cancele a capacidade de registro adicional alocada quando a capacidade do SDR está cheia, possivelmente levando a erros de E/S em client/servidores usando dispositivos com suporte do PowerFlex.

Resolution

Uma reinicialização contínua de todos os componentes do SDR é necessária e a propriedade do MDM no sistema de origem deve ser alternada para resolver o problema.

Reinicie os componentes do SDR:

1) Identifique todos os SDRs:

scli --query_all_sdr

2) Entre no modo de manutenção no SDR:

scli --enter_sdr_maintenance_mode --sdr_name <name>

3) Execute o comando na etapa 1 para confirmar se o SDR está totalmente no modo de manutenção.

4) Reinicie o componente SDR.

pkill sdr

5) Repita isso para todos os SDRs no local de origem.
 

Depois que todos os SDRs forem reiniciados, alterne a propriedade do MDM:

#3.x
scli --switch_mdm_ownership --new_master_mdm_name <name>
 
#4.x
scli --switch_mdm_ownership --new_primary_mdm_name <name>

*Se desejado, a propriedade pode ser transferida de volta para o servidor MDM original.

Confirme se os erros de E/S no client/servidores não são mais relatados. Se o client inseriu um file system somente leitura, o client/servidor pode exigir uma reinicialização.

Até que a causa possa ser determinada, também será recomendável que todos os RCGs no sistema de origem sejam encerrados.

Se os erros de E/S continuarem após a aplicação das etapas acima, entre em contato com a engenharia do PowerFlex.

Additional Information

Versões afetadas

PowerFlex 3.x

PowerFlex 4.x

Correção feita na versão

PFMP 4.5.3

Affected Products

PowerFlex Software
Article Properties
Article Number: 000227849
Article Type: Solution
Last Modified: 17 Nov 2025
Version:  6
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.