PowerFlex: Erros de E/S do client quando a replicação está sendo usada

Resumo: Client/servidores estão enfrentando erros de E/S em dispositivos com suporte do PowerFlex. O back-end geral (MDM/SDSes) parece estar íntegro. A replicação do PowerFlex está sendo usada e há alguns erros de RPO em relação a um ou mais RCGs. ...

Este artigo aplica-se a Este artigo não se aplica a Este artigo não está vinculado a nenhum produto específico. Nem todas as versões do produto estão identificadas neste artigo.

Sintomas

  • Nenhuma capacidade degradada ou com falha
  • Nenhum SDS dissociado ou dispositivos SDS relatando erros.
  • Nenhum MDM desconectado

O recurso de replicação está sendo usado.
Um ou mais alertas na interface do usuário relatando os seguintes erros:

Major - The RCG consistent image is too large to be consumed by the destination in one piece.

Minor - Remote Consistency Group RPO Exceeded
Os registros de eventos do MDM podem relatar o seguinte:
2024-06-11 15:55:56.592000:0001566:RPL_PD_CAP_UTILIZATION_MINOR     WARNING  Protection Domain ID <pd_id> Replication journal capacity is at MINOR utilization level
2024-06-11 16:20:12.848000:0001567:RPL_PD_CAP_UTILIZATION_MAJOR     ERROR    Protection Domain ID <pd_id> Replication journal capacity is at MAJOR utilization level
2024-06-11 17:19:57.272000:0001584:RPL_PD_CAP_UTILIZATION_CRITICAL  CRITICAL Protection Domain ID <pd_id> Replication journal capacity is at VERY_HIGH utilization level
2024-06-11 17:52:26.352000:0001585:RPL_PD_CAP_UTILIZATION_CRITICAL  CRITICAL Protection Domain ID <pd_id> Replication journal capacity is at CRITICAL utilization level
...
2024-06-11 16:25:14.381000:0001576:RPL_CG_MOVED_TO_SLIM_MODE        INFO     Replication Consistency Group ID <rcg_id> entered slim mode
2024-06-11 18:27:29.738000:0001586:SDR_CRITICAL_CAP_CHANGE          ERROR    SDR ID <sdr_id>) handling user data changed discarded old user data and stopped to accumulate new user data due critical capacity
 

Impacto 

Os clients não conseguem acessar volumes interceptados para replicação.


Causa

Um defeito raro de software pode ocorrer quando o MDM e o componente SDR discordam nos contadores internos relacionados à capacidade de registro. Essa discrepância pode fazer com que o MDM cancele a capacidade de registro adicional alocada quando a capacidade do SDR está cheia, possivelmente levando a erros de E/S em client/servidores usando dispositivos com suporte do PowerFlex.

Resolução

Uma reinicialização contínua de todos os componentes do SDR é necessária e a propriedade do MDM no sistema de origem deve ser alternada para resolver o problema.

Reinicie os componentes do SDR:

1) Identifique todos os SDRs:

scli --query_all_sdr

2) Entre no modo de manutenção no SDR:

scli --enter_sdr_maintenance_mode --sdr_name <name>

3) Execute o comando na etapa 1 para confirmar se o SDR está totalmente no modo de manutenção.

4) Reinicie o componente SDR.

pkill sdr

5) Repita isso para todos os SDRs no local de origem.
 

Depois que todos os SDRs forem reiniciados, alterne a propriedade do MDM:

#3.x
scli --switch_mdm_ownership --new_master_mdm_name <name>
 
#4.x
scli --switch_mdm_ownership --new_primary_mdm_name <name>

*Se desejado, a propriedade pode ser transferida de volta para o servidor MDM original.

Confirme se os erros de E/S no client/servidores não são mais relatados. Se o client inseriu um file system somente leitura, o client/servidor pode exigir uma reinicialização.

Até que a causa possa ser determinada, também será recomendável que todos os RCGs no sistema de origem sejam encerrados.

Se os erros de E/S continuarem após a aplicação das etapas acima, entre em contato com a engenharia do PowerFlex.

Mais informações

Versões afetadas

PowerFlex 3.x

PowerFlex 4.x

Correção feita na versão

PFMP 4.5.3

Produtos afetados

PowerFlex Software
Propriedades do artigo
Número do artigo: 000227849
Tipo de artigo: Solution
Último modificado: 19 jan. 2026
Versão:  7
Encontre as respostas de outros usuários da Dell para suas perguntas.
Serviços de suporte
Verifique se o dispositivo está coberto pelos serviços de suporte.