PowerEdge: Altas taxas de erro SMART para leitura e verificação de erros ECC em determinados discos rígidos corporativos
Summary: As altas taxas de erro SMART em alguns discos rígidos Enterprise são informativas e não têm influência sobre a integridade do hardware.
Symptoms
Sumário
1. Introdução
2. Descrição
3. Solução
4. Mais informações
Introdução
S.M.A.R.T. (Self-Monitoring, Analysis, and Reporting Technology; geralmente escrito como SMART) é um sistema de monitoramento de integridade de discos rígidos e unidades de estado sólido que foi padronizado internacionalmente.
A principal função do SMART é detectar e relatar indicadores de confiabilidade da unidade, antecipando falhas para permitir a substituição de hardware antes da falha e manter a integridade dos dados.
A Dell colaborou com nossos fornecedores de discos rígidos na interpretação desses valores.
Descrição
A análise do status SMART de alguns discos rígidos corporativos revelou altas taxas de correção de ECC de leitura e verificação em determinados modelos. A comparação desses valores com outros discos rígidos pode sugerir que alguns modelos têm uma taxa de erro mais alta do que outros, que podem relatar zero correções de ECC.
Às vezes, essa taxa de erro aparece como centenas de milhões de correções de ECC e pode aumentar rapidamente à medida que mais transações de E/S ocorrem.
Um exemplo dessa situação é mostrado abaixo. Este exemplo foi coletado executando o comando "smartctl -a /dev/sdX" no sistema operacional Linux.
Figura 1: Registro de contador de erros
Smartctl O aplicativo é um componente do Smartmontools, um conjunto de ferramentas de código aberto para consultar a integridade de discos rígidos.
Smartmontools, pode não refletir com precisão a contagem de erros ECC dos dispositivos.
Cause
Resolution
Solução
A especificação inteligente permite que os fornecedores distribuam esses contadores, como os que são mostrados no exemplo acima, para fins informativos. Os contadores não são necessariamente uma contagem de falhas de hardware ou software na lógica ECC. Isso permite que cada fornecedor de unidade tenha flexibilidade quanto ao que é exibido nos campos SMART disponíveis. Para alguns fornecedores, nenhum dado de erro está nas categorias de leitura ou verificação do ECC. No exemplo acima, o fornecedor optou por usar os contadores para monitorar a funcionalidade de ECC. Os valores apresentados não representam uma taxa de erro. Da mesma forma, uma taxa mais alta de eventos em alguns discos em comparação com outros não indica que existe um problema de desempenho.
Para consultas específicas sobre contadores de integridade em um modelo de disco rígido empresarial, entre em contato com nossos técnicos de suporte para obter respostas das equipes de engenharia da Dell Technologies.
.
Additional Information
Mais informações
- Para obter mais informações sobre a padronização internacional de valores SMART e outras interfaces de armazenamento SCSI, consulte a página inicial do comitê técnico do T10 localizada aqui
.
Smartmontoolsé um utilitário para controlar e monitorar sistemas de armazenamento de computadores usando o sistema de tecnologia de automonitoramento, análise e relatório integrado aos mais modernos discos rígidos ATA, Serial ATA, SCSI/SAS e NVMe. Não é uma ferramenta da Dell. Mais informações sobreSmartmontoolspode ser encontrado aqui.