XtremIO: Como resolver e gerenciar alertas de capacidade física do cluster (XTR0200302-4, XTR0203792 e XTR0203892) (pode ser corrigido pelo usuário)
Summary: Um artigo do XtremIO detalhando a causa e a resolução dos seguintes alertas de capacidade física do cluster: sys_ud_ssd_space_limited (XTR0200302), sys_ud_ssd_space_very_limited (XTR0200303), sys_ud_ssd_space_no_free (XTR0200304), user_physical_capacity_high (XTR0203792) e user_physical_capacity_very_high (XTR0203892) ...
Symptoms
Os seguintes alertas são criados quando a capacidade física usada em um array XtremIO excede um limite predefinido ou se esgota completamente:
| Nome do alerta | Código do sintoma | Descrição |
|---|---|---|
|
|
|
A capacidade física livre do cluster está baixa. Limite: mais de 85% é usado |
|
|
|
A capacidade física livre de cluster é criticamente baixa. Limite: mais de 90% é usado |
|
|
|
O cluster não tem capacidade física livre |
|
|
|
Foi excedido o limite de alta utilização de SSD. Há 70% (free_ud_ssd_space) KB restantes.
Nota: Isso pode ser alterado para uma porcentagem definida pelo usuário
|
|
|
|
Foi excedido o limite de utilização muito alto do SSD. Há 80% (free_ud_ssd_space) KB restantes.
Nota: Isso pode ser alterado para uma porcentagem definida pelo usuário
|
No momento, não haverá impacto no cluster se algum dos códigos de sintoma acima for gerado, exceto para o código de sintoma XTR0200304.
O código de sintoma XTR0200304 indica que o espaço físico do cluster está totalmente consumido, caso em que o cluster não aceita mais gravações e os dados do cluster se tornam somente leitura/protegidos contra gravação de uma perspectiva do host. Isso pode fazer com que alguns hosts se desconectem ou tenham acesso somente leitura aos dados, ou ambos.
Cause
Consulte a seção Problemas deste artigo para saber a causa de cada um dos alertas listados.
Resolution
Se os alertas listados estiverem sendo relatados para um array de recuperação de desastres (DR) usando a replicação do RecoverPoint, consulte a KB 494416 - XtremIO ficando sem capacidade livre (local de DR do RecoverPoint) para verificar possíveis problemas conhecidos e sua resolução.
Se o descrito acima não for aplicável, libere a capacidade física no cluster afetado do XtremIO executando um ou mais dos seguintes procedimentos:
-
Recuperar espaço
O espaço excluído deve ser recuperado no host. Para todos os outros tipos de sistema operacional do host, siga as instruções na seção relevante Recuperação de espaço do Guia de configuração do host do storage array XtremIO -
Excluir ou remover volumes
não utilizados Avalie os volumes ativamente em uso no cluster do XtremIO. Considere excluir ou remover quaisquer volumes que não são mais necessários para aplicativos externos. As instruções que detalham como excluir ou remover volumes não utilizados podem ser encontradas documentadas na seção Excluindo volumes do Guia do usuário do storage array XtremIO, correspondente à versão do software do cluster afetado. Você também pode consultar a seção Resolução da KB 468164 — XtremIO: Gerenciando a capacidade do cluster em resposta a alertas de produtos para obter instruções detalhadas.Nota: Embora a capacidade física seja recuperada automaticamente pelo XtremIO após a exclusão ou remoção do volume, o espaço excluído também deve ser recuperado no lado do host seguindo as instruções da etapa 1 -
Descarregar volumes subutilizados para outra plataforma
-
Execute a expansão on-line do cluster (OCE) para adicionar mais armazenamento ao array. Isso pode ser agendado entrando em contato com sua equipe de conta local (SAM, DSM e ASR) para discutir um plano de ação para dimensionar o array XtremIO
Nota: Para gerar um alerta com um limite de capacidade predefinido (variando de 0 a 100), conecte-se à XMCLI na interface do usuário ou PuTTy e execute o seguinte comando:xmcli (admin)> modify-alert-definition alert-type="user_physical_capacity_very_high" activity-mode=enabled clearance-mode="ack_required" threshold=<threshold_value> Modified Alert Definition user_physical_capacity_high
- Activity-mode=Enabled Emita um alerta quando o limite definido for atingido. O padrão para alertas de user_physical_capacity é activity-mode=disabled
- clearance-mode=ack_required fazem com que o alerta desapareça quando a porcentagem de capacidade estiver abaixo do limite E o alerta for confirmado
- threshold=<threshold_value> permite alterar a porcentagem de espaço a ser atingida antes de acionar o alerta
Para verificar como os alertas estão configurados, execute o comando show-alert-definitions usando XMCLI.
Additional Information
Uma SR (Global Services Service Request, solicitação de serviço) automática será gerada para os códigos de sintoma XTR0200302, XTR0200303 e XTR0200304 deste artigo.