Série MD: Como substituir um disco em caso de falha preditiva ou iminente
Summary: Este artigo aborda como substituir com segurança uma unidade de falha preditiva em um armazenamento MD3xxx usando o Gerenciamento de armazenamento em disco modular (MDSM).
Instructions
Introdução
Este tutorial explica como substituir um disco em falha iminente ou preditiva. Uma falha preditiva é um recurso das modernas unidades de disco rígido (disco rígido) que foi desenvolvido para melhorar a confiabilidade do RAID. Uma falha preditiva indica que um disco rígido deve ser substituído antes que ocorra uma falha.
Causa
Durante as operações normais de leitura/gravação, um erro pode ocorrer ocasionalmente em um disco rígido. O controlador identifica esse erro e o repara. Esses erros também são conhecidos como "setores defeituosos". É por isso que o espaço de memória em um disco rígido geralmente é um pouco maior do que o especificado. Esse espaço é usado para realocar ou reparar quaisquer setores defeituosos que ocorram durante as operações normais. Um limite predeterminado de setores defeituosos é atribuído a um disco rígido individual. Quando esse limite é atingido, o controlador altera o status do disco rígido para "Falha preditiva". O disco rígido permanece operacional, no entanto, a probabilidade de que o disco rígido falhe em breve.
É recomendável que um disco rígido com status de "Falha preditiva" seja substituído imediatamente para manter a integridade do volume RAID. Para substituir o disco rígido, ele pode ser removido com segurança do volume RAID antes da substituição física. Siga o processo descrito abaixo para mudar status do disco rígido para off-line e removê-lo com segurança do volume RAID.
Solução
Nota : Antes de continuar, o Modular Disc Storage Manager(MDSM) deve ser instalado. O MDSM pode ser baixado do site de suporte. O sistema deve ter acesso ao storage array.
Siga o processo abaixo para remover o disco rígido do volume RAID off-line e com segurança.
- Inicie o MDSM e selecione o array PowerVault correspondente.
- Verifique o array correto usando o status do compartimento
- Se não houver problemas com um array, ele será exibido como "Ideal", como visto na Figura 1 abaixo

- Figura 1: Visualização de dispositivos do MDSM mostrando o estado Optimal
- Se o array tiver um disco rígido em falha preditiva, o status mudará para "Need attention"
- Clique duas vezes no array para acessar o gerenciador de array
- Verifique se não há outras unidades ausentes ou com falha no mesmo conjunto de RAID
- Clique em Hardware e selecione o disco rígido com falha preditiva. O status é exibido como "Precisa de atenção"

- Figura 2: Seção Hardware do MDSM
- Clique com o botão direito do mouse no disco rígido, selecione Avançado e, em seguida, Falhar

- Figura 3: Menu exibido ao clicar com o botão direito mostrando a opção Fail
- Confirme a operação de falha da unidade digitando "Yes"
- Se houver um disco sobressalente no array, também conhecido como "Hot Spare", deixe a caixa "Copiar conteúdo do disco rígido antes de falhar" marcada
- Os dados do disco de falha preditiva são copiados para o hot spare para evitar qualquer degradação de um RAID
- Isso é mostrado abaixo na Figura 4
- Se não houver hot spare, desmarque a caixa "Copiar conteúdo do disco físico antes de falhar"
- Não tente copiar o conteúdo, a menos que haja um hot spare disponível no array
- Essa tentativa pode causar corrupção ou perda de dados

- Figura 4: Caixa de diálogo Confirm Fail Physical Disk
- Se a opção de copiar o conteúdo for usada,
- Pode levar algum tempo até que a unidade falhe e o estado mude para "Failed"
- O status do disco rígido muda para "Failed" e tem um "X" vermelho ao lado dele
- Agora é seguro substituir fisicamente o disco rígido