Falha na verificação de integridade do diretório Trash do Isilon PowerScale
Summary: Falha na verificação de integridade do diretório lixeira durante a execução diária do HealthCheck.
Symptoms
Cause
O Trash Directory HealthCheck falha quando o PQ do diretório de lixeira acumula mais de 10.240 entradas. Essa falha de verificação de integridade pode ser devido a muitas preocupações sobre a integridade do serviço de diretório lixeira, inclusive, entre outros: -
(1) O serviço trash directory parou de funcionar (travou/travou/desabilitou) ou o serviço apresentou falha ao limpar entradas obsoletas de PQ do diretório de lixo.
(2) Os serviços Backbone OneFS, como isi_job_d, isi_papi_d ou TreeDelete , foram travados/travados ou foram desabilitados por um usuário privilegiado.
(3) Os serviços de consumidor de diretórios lixeiras estão desativando diretórios agressivamente, ou os trabalhos em execução atualmente estão bloqueando a exclusão de diretórios descartados.
Resolution
Este artigo da KB será atualizado assim que houver qualquer patch disponível.
Solução alternativa:
As soluções temporárias a seguir devem ser úteis com base nas três categorias de causa mencionadas acima.
(1) O MCP deve reiniciar o serviço quando o serviço de diretório de lixo falhar. Verifique bugs de arquivos para problemas de serviço de diretórios de lixeira travado. Se o serviço trash directory estiver travado, ele poderá ser eliminado/reiniciado para resolução temporária. A falha de verificação de integridade do diretório de lixeira pode ser ignorada se o serviço de diretório lixeira isi_trash_d tiver sido desabilitado por um usuário privilegiado. No entanto, o serviço deve ser ativado quando apropriado, para que o serviço de diretório lixeira possa concluir a exclusão de diretórios eliminados.
isi services -a isi_trash_d enable
Execute o seguinte comando para limpar entradas obsoletas de PQ caso o serviço trash directory não limpe entradas obsoletas no PQ.
/usr/libexec/isilon/isi_trash_pq_clean --cleanup [--debug]
Verifique também se o intervalo de consulta do estado do trabalho para os trabalhos TreeDelete em fila do serviço não é maior que 30 segundos no caso mencionado acima.
isi_gconfig -t trash-config job_query_interval=30
(2) Se os serviços backbone do OneFS ou o trabalho TreeDelete forem suspensos ou tiverem sido desativados por um usuário privilegiado, a falha de verificação de integridade do diretório lixeira poderá ser ignorada. No entanto, os serviços backbone OneFS ou TreeDelete devem ser ativados quando apropriado, para que o serviço de diretório lixeira possa concluir a exclusão de diretórios eliminados.
(3) A falha de Verificação de integridade do diretório lixeira pode ser ignorada se os serviços de consumidor (movimentador de dados L hotse/snapshot gravável) forem descartados de forma agressiva nos diretórios ou se os trabalhos em execução atualmente bloquearem a exclusão de diretórios descartados. Nesse caso, os serviços Backbone OneFS são gargalos.
Se os trabalhos TreeDelete em execução que estão na fila pelo serviço trash directory estão bloqueando o processamento de um número substancial de diretórios eliminados recentemente, o limite de tempo limite do trabalho e o intervalo de consulta de trabalho para trabalhos TreeDelete enfileirados pelo serviço podem ser ajustados para um valor menor. Os valores mínimos recomendados para esses itens ajustáveis são os seguintes: -
isi_gconfig -t trash-config job_timeout_limit=3600 isi_gconfig -t trash-config job_query_interval=30
Observe que o serviço trash directory cancela o trabalho TreeDelete enfileirado pelo serviço que ainda está em execução ou pausado após o limite de tempo limite do trabalho. Portanto, se o serviço cancelar a maioria dos trabalhos TreeDelete enfileirados por si só, o limite de tempo limite do trabalho poderá ser aumentado para um valor mais alto.