Data Domain: Problema de atualização do firmware de unidade nas versões 7.13, 8.1 e 8.2 do DDOS
Summary: Nas versões 7.13, 8.1 e 8.2 do DDOS, os DDRs (Data Domain Restorers) com atualizações de firmware de unidade ativadas podem identificar falhas inesperadas e falsas de disco. Especificamente, dois dispositivos por grupo de discos (DG) podem fazer a transição para um estado de falha devido a um problema de contagem de referências do módulo RAID no kernel. Isso pode levar à instabilidade do sistema e a possíveis riscos de disponibilidade dos dados. Uma correção foi integrada às versões 7.13.1.40, 8.3.1.10 e posteriores do DDOS. ...
Symptoms
- Dois dispositivos por grupo de dispositivos (DG) entram inesperadamente em um estado de falha
- A tentativa de falhar um terceiro dispositivo na unidade principal resulta em uma pane do sistema (estado Total Fail)
- Excessivo
kern.infoEntradas do log WARN - Status degradado do grupo de discos
- Degradação perceptível do desempenho no DDR
Sistemas afetados:
- Sistemas DD com armazenamento externo executando versões anteriores do DDOS 7.13.x.x | 8.1.x.x | 8,2x.x
- Uma correção foi disponibilizada de volta para >=7.13.1.40
- Os clientes que executam a versão 8.1 ou 8.2 devem atualizar para >=8.3.1.10
Cause
Durante o processo de atualização do firmware de unidade, o comando RAID check scan Pode ser executado várias vezes com base no número de dispositivos no sistema. Cada execução aumenta a contagem de referências do módulo RAID no kernel Linux. No kernel versão 5.5 (usado no DDOS 7.13, 8.1 e 8.2), essa contagem de referências não diminui. Se a contagem passar para zero, o kernel bloqueará o acesso do RAID interno gendisk estruturas, fazendo com que os dispositivos sejam marcados como ilegíveis e movidos para um estado de falha. Cada DG tolera apenas dois dispositivos com falha; uma terceira falha na unidade principal desencadeia uma pane no sistema.
Resolution
Uma correção permanente foi integrada às seguintes versões do DDOS:
- DDOS >= 7.13.1.40
- DDOS >= 8.3.1.10
Solução temporária:
- Crie um chamado com o suporte técnico da Dell e consulte este artigo da KB (#000331892) para agilizar a resolução.
- Suporte técnico Dell:
- Modifique o script de upgrade do firmware da unidade para retornar imediatamente após a execução, minimizando o aumento na contagem de referência do módulo RAID.
- Suporte técnico Dell: