PowerFlex: Erros de E/S do client quando a replicação está sendo usada
Summary: Client/servidores estão enfrentando erros de E/S em dispositivos com suporte do PowerFlex. O back-end geral (MDM/SDSes) parece estar íntegro. A replicação do PowerFlex está sendo usada e há alguns erros de RPO em relação a um ou mais RCGs. ...
Symptoms
- Nenhuma capacidade degradada ou com falha
- Nenhum SDS dissociado ou dispositivos SDS relatando erros.
- Nenhum MDM desconectado
O recurso de replicação está sendo usado.
Um ou mais alertas na interface do usuário relatando os seguintes erros:
Major - The RCG consistent image is too large to be consumed by the destination in one piece. Minor - Remote Consistency Group RPO ExceededOs registros de eventos do MDM podem relatar o seguinte:
2024-06-11 15:55:56.592000:0001566:RPL_PD_CAP_UTILIZATION_MINOR WARNING Protection Domain ID <pd_id> Replication journal capacity is at MINOR utilization level 2024-06-11 16:20:12.848000:0001567:RPL_PD_CAP_UTILIZATION_MAJOR ERROR Protection Domain ID <pd_id> Replication journal capacity is at MAJOR utilization level 2024-06-11 17:19:57.272000:0001584:RPL_PD_CAP_UTILIZATION_CRITICAL CRITICAL Protection Domain ID <pd_id> Replication journal capacity is at VERY_HIGH utilization level 2024-06-11 17:52:26.352000:0001585:RPL_PD_CAP_UTILIZATION_CRITICAL CRITICAL Protection Domain ID <pd_id> Replication journal capacity is at CRITICAL utilization level ... 2024-06-11 16:25:14.381000:0001576:RPL_CG_MOVED_TO_SLIM_MODE INFO Replication Consistency Group ID <rcg_id> entered slim mode 2024-06-11 18:27:29.738000:0001586:SDR_CRITICAL_CAP_CHANGE ERROR SDR ID <sdr_id>) handling user data changed discarded old user data and stopped to accumulate new user data due critical capacity
Impacto
Os clients não conseguem acessar volumes interceptados para replicação.
Cause
Resolution
|
Uma reinicialização contínua de todos os componentes do SDR é necessária e a propriedade do MDM no sistema de origem deve ser alternada para resolver o problema. Reinicie os componentes do SDR: 1) Identifique todos os SDRs: scli --query_all_sdr 2) Entre no modo de manutenção no SDR: scli --enter_sdr_maintenance_mode --sdr_name <name> 3) Execute o comando na etapa 1 para confirmar se o SDR está totalmente no modo de manutenção. 4) Reinicie o componente SDR. pkill sdr 5) Repita isso para todos os SDRs no local de origem. Depois que todos os SDRs forem reiniciados, alterne a propriedade do MDM: #3.x scli --switch_mdm_ownership --new_master_mdm_name <name> #4.x scli --switch_mdm_ownership --new_primary_mdm_name <name> *Se desejado, a propriedade pode ser transferida de volta para o servidor MDM original. Até que a causa possa ser determinada, também será recomendável que todos os RCGs no sistema de origem sejam encerrados. Se os erros de E/S continuarem após a aplicação das etapas acima, entre em contato com a engenharia do PowerFlex. |
Additional Information
Versões afetadas
PowerFlex 3.x
PowerFlex 4.x
Correção feita na versão
PFMP 4.5.3