Isilon PowerScale 垃圾桶目录运行状况检查失败

Summary: 每日运行 HealthCheck 期间的垃圾桶目录 HealthCheck 失败。

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

垃圾桶目录 HealthCheck trash_dir_pq_limit故障。

Cause

当垃圾桶目录 PQ 累积超过 10,240 个条目时,垃圾桶目录运行状况检查失败。此运行状况检查失败可能是由于对垃圾桶目录服务运行状况的许多顾虑造成的,包括但不限于:- 

(1) 垃圾桶目录服务已停止工作(崩溃/挂起/禁用),或服务无法清理过时的垃圾桶目录 PQ 条目。 

(2) 主干 OneFS 服务 (如 isi_job_d、isi_papi_dTreeDelete 作业 )已崩溃/挂起或已被特权用户禁用。  

(3) 垃圾桶目录使用者服务正在积极清理目录,或者当前正在运行的作业阻止删除垃圾数据目录。  

Resolution

一旦我们有任何可用的修补程序,此知识库文章将更新。 

解决 方案:
根据上面提到的三个原因类别,以下解决方法应该很有帮助。  

(1) 当垃圾桶目录服务崩溃时,MCP 应重新启动服务。请针对挂起的垃圾目录服务问题记录错误。如果垃圾桶目录服务挂起,则可以将其终止/重新启动以进行临时解决。如果特权用户已禁用垃圾桶目录服务isi_trash_d,则可以忽略垃圾桶目录运行状况检查失败。但是,应在适当情况下启用该服务,以便垃圾桶目录服务可以完成删除垃圾数据的目录。  
 

isi services -a isi_trash_d enable 


 
请运行以下命令以清理过时的 PQ 条目,以防垃圾桶目录服务无法清理 PQ 中的过时条目。 
 

/usr/libexec/isilon/isi_trash_pq_clean --cleanup [--debug] 

 

另请验证在上面提到的案例中,服务排队的 TreeDelete 作业的作业状态查询间隔不超过 30 秒。 

 

isi_gconfig -t trash-config job_query_interval=30 

 

(2) 如果主干 OneFS 服务或 TreeDelete 作业挂起或已被特权用户禁用,则可以忽略垃圾桶目录运行状况检查失败。但是,应在适当情况下启用主干 OneFS 服务或 TreeDelete 作业,以便垃圾桶目录服务可以完成垃圾数据删除目录的删除。  
 

(3) 如果使用者服务(Lhotse Data Mover/可写快照)正在积极回收目录,或者当前正在运行的作业阻止删除垃圾目录,则可以忽略垃圾桶目录运行状况检查失败。在这种情况下,主干 OneFS 服务是瓶颈。
如果由垃圾桶目录服务排队的长时间运行 TreeDelete 作业阻止处理大量最近被废弃的目录,则可以将服务队列的 TreeDelete 作业的作业超时限制和作业查询间隔调整为较小的值。这些可调的最低建议值如下:- 
 

isi_gconfig -t trash-config job_timeout_limit=3600 
isi_gconfig -t trash-config job_query_interval=30 


 
请注意,垃圾桶目录服务会取消由服务排队的 TreeDelete 作业,该作业在作业超时限制后仍在运行或暂停。因此,如果服务取消自己排队的大多数 TreeDelete 作业,则作业超时限制可以增加到更高的值。 

Affected Products

Isilon, PowerScale OneFS
Article Properties
Article Number: 000196018
Article Type: Solution
Last Modified: 29 Jun 2023
Version:  6
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.