O SDS não consegue sair do modo de manutenção após o upgrade durante o PowerFlex NDU
Summary: Durante o NDU, o sistema fica com um SDS travado ao sair do modo de manutenção e ocorre falha na operação de upgrade do Installation Manager.
Symptoms
Os registros de eventos do MDM mostram o upgrade do SDS seguido por um comando de saída do modo de manutenção:
2023-07-15 03:12:47.469000:0012714:SDS_UPGRADED INFO SDS: <sds_name> (ID <sds_id> ) upgraded to version 3.6.x 2023-07-15 03:12:47.505000:0012715:SDS_RECONNECTED INFO SDS: <sds_name> (ID <sds_id>) reconnected. 2023-07-15 03:13:21.618000:0012930:MDM_CLI_CONF_COMMAND_RECEIVED INFO Command exit_maintenance_mode received, User: ': <user>'. [50667] SDS: ID: <sds_id>;
O SDS tenta sair do modo de manutenção, mas falha.
Os logs de rastreamento do SDS podem mostrar o seguinte:
2023/07/15 03:12:57.322606 7feaa54e0db0:contCmd_AddCombAndSetState:10712: Set comb state (reconstruct) failed 13598001806a new state SECONDARY, rc NOT_FOUND 2023/07/15 03:12:57.322806 7feaa54e0db0:contCmd_AddCombAndSetState:10712: Set comb state (reconstruct) failed 13598001808c new state SECONDARY, rc NOT_FOUND ... 2023/07/15 03:12:58.030449 7feaa57ffdb0:contDev_FlushDeviceDirtyDrl_Async:09708: Device 0xdfef6e6c001d0005 drl flush skipped due to device in error 2023/07/15 03:12:58.030459 7feaa5568db0:contDev_FlushDeviceDirtyDrl_Async:09708: Device 0xdfef6e70001d0009 drl flush skipped due to device in error ... 2023/07/15 03:13:21.650684 7fea9dc59db0:ioh_ResetCombDrl:05345: Reset Drl - No comb:13598001800b device: 0xdfef6e6c001d0005 2023/07/15 03:13:21.650911 7fea9dc15db0:ioh_ResetCombDrl:05345: Reset Drl - No comb:135980018079 device: 0xdfef6e70001d0009 ...
A saída acima mostra que, após o upgrade, os dispositivos tiveram que ser reconstruídos com o novo formato de metadados, o que acontece ao fazer upgrade da versão 3.0.x para a 3.5.x ou mais recente.
A contDev_FlushDeviceDirtyDrl_Async de função considera esses dispositivos como com erro e, em seguida, os dispositivos começam a relatar que não há pentes.
Os logs de rastreamento do SDS transmitem a linha "Reset Drl - No comb" até que o problema seja resolvido.
Cause
Durante a operação de reconstrução de metadados do dispositivo para o NDU, uma condição de corrida pode ocorrer no código do MDM que proíbe a conclusão completa da operação, e os dispositivos entram em um estado em que ele acha que não possui nenhum dos dados.
Reiniciar o serviço do SDS força o SDS a se reconectar ao MDM e o MDM instrui o SDS nos pentes de sua propriedade.
Resolution
Solução temporária
Para resolver o problema, reinicie o serviço SDS no SDS que está falhando ao sair do modo de manutenção, para reiniciar o serviço SDS, execute um pkill sds Comando.
Aguarde até que o SDS saia do modo de manutenção e repita a operação de upgrade do Installation Manager.
Versões afetadas
PowerFlex 3.x
Correção feita na versão
PowerFlex 3.6.3
PowerFlex 4.5.2
Additional Information
Versões afetadas
PowerFlex 3.x
Correção feita na versão
PowerFlex 3.6.3
PowerFlex 4.5.2