XtremIO: Impacto sobre o desempenho da falha da SSD no array XtremIO
Summary: Impacto sobre o desempenho da falha da SSD no array XtremIO
Symptoms
Falhas de SSD única ou múltipla no XtremIO DPG podem causar impacto no desempenho do array XtremIO. Para entender o que causa essa situação, devemos explicar DPG Operations & DPG States:
- Principais Operações DPG:
Recriação do DPG:
- Quando: Quando uma SSD falha
- Porquê: Restaurar proteção de paridade dupla
Integração com DPG:
- Quando: Quando um técnico substitui uma SSD com falha por uma unidade totalmente nova
- Porquê: Adiciona uma nova SSD ao DPG
Estados do DPG:
- Healthy: Proteção de paridade dupla
- Único degradado: Proteção de paridade única
- Duplo degradado: Sem proteção de paridade
- Com falha: Perda de dados
O XtremIO é um armazenamento com reconhecimento de conteúdo (também conhecido como CAS). Portanto, todas as operações de E/S para o DPG são estatisticamente aleatórias, isso nos permite alcançar o mesmo desempenho, independentemente da carga de trabalho aleatória ou sequencial do usuário. Outro benefício é que, se um SSD falhar, o cluster não precisará retornar uma página ao local original.
Outros arrays que não são CAS têm requisitos para dados lógicos sequenciais e dados físicos sequenciais; Se você não retornar os dados ao local original, perderá o desempenho de E/S sequencial.
A recriação do DPG explicou:
Quando um SSD é removido ou falha, o SYM emite uma recriação automática do DPG, a recriação do DPG exige que duas operações ocorram:
Fase 1: Recupere todos os dados perdidos e grave-os em outro lugar:
As páginas perdidas (dados + paridade) são recuperadas para o DPG (novo fluxo de gravação)
As tabelas PLBM/HMD são atualizadas.
Fase 2: Atualize as informações de paridade de todas as frações:
mover páginas de dados/paridade requer a atualização de todas as paridades (em todas as frações)
Ambas as operações exigem a atualização de todas as frações para economizar tempo e reduzir as gravações. Ambos são executados em uma única iteração.
A integração do DPG foi explicada: A adição de uma nova SSD ao DPG requer uma intervenção manual.
- Requer a intervenção manual de um técnico (coloque uma nova SSD no slot do DAE)
- Há pouca ou nenhuma criticidade (em oposição a uma reconstrução)
Uma vez solicitado, o processo de integração do DPG equilibra os blocos de paridade. Somente blocos de paridade são recuperados no SSD original (para alcançar uma distribuição de paridade uniforme). Isso é feito atribuindo, adicionando e integrando a nova SSD.
Cause
Falhas de SSD única ou múltipla no DPG do XtremIO
Resolution
Com base nas informações acima, durante uma recriação/integração do DPG, há algum aumento na utilização dos recursos do cluster, embora, geralmente, não deva haver um aumento perceptível no desempenho ou na latência. No entanto, durante uma recriação de DPG duplo , o cluster concentra quase todos os seus recursos para recriar as SSDs com falha o mais rápido possível, a fim de garantir a integridade dos dados e evitar a perda de dados. Isso é esperado por projeto, e o desempenho deve voltar ao desempenho normal após a conclusão de todas as operações.