Isilon PowerScale 휴지통 디렉토리 HealthCheck 실패
Summary: 매일 HealthCheck를 실행하는 동안 휴지통 디렉토리 HealthCheck 오류가 발생합니다.
Symptoms
Cause
휴지통 디렉토리 PQ가 10,240개 이상의 항목을 누적하면 휴지통 디렉토리 HealthCheck가 실패합니다. 이 HealthCheck 오류는 휴지통 디렉토리 서비스의 상태에 대한 많은 우려로 인해 발생할 수 있습니다. 여기에는 다음이 포함되며 이에 국한되지는 않습니다. -
(1) 휴지통 디렉토리 서비스가 작동을 중지하거나(충돌/중단/비활성화) 오래된 휴지통 디렉토리 PQ 항목을 정리하지 못했습니다.
(2) isi_job_d, isi_papi_d 또는 TreeDelete 작업과 같은 백본 OneFS 서비스가 충돌/중단되었거나 권한이 있는 사용자가 비활성화했습니다.
(3) 휴지통 디렉토리 소비자 서비스가 디렉토리를 적극적으로 폐기하거나 현재 실행 중인 작업이 휴지통 디렉토리의 삭제를 차단하고 있습니다.
Resolution
이 KB는 사용 가능한 패치가 있으면 업데이트됩니다.
해결:
다음 해결 방법은 위에 언급된 세 가지 원인 범주를 기준으로 도움이 될 것입니다.
(1) 휴지통 디렉토리 서비스가 중단되면 MCP가 서비스를 재시작해야 합니다. 중단된 휴지통 디렉토리 서비스 문제에 대한 버그를 제출하십시오. 휴지통 디렉토리 서비스가 중단되면 일시적 해결을 위해 휴지통 디렉토리 서비스를 종료/재시작할 수 있습니다. 권한이 부여된 사용자가 휴지통 디렉토리 서비스 isi_trash_d 비활성화한 경우 휴지통 디렉토리 HealthCheck 실패를 무시할 수 있습니다. 그러나 휴지통 디렉토리 서비스가 휴지통 디렉토리 삭제를 완료할 수 있도록 적절한 경우 서비스를 활성화해야 합니다.
isi services -a isi_trash_d enable
휴지통 디렉토리 서비스가 PQ에서 오래된 항목을 정리하지 못할 경우 오래된 PQ 항목을 정리하려면 다음 명령을 실행하십시오.
/usr/libexec/isilon/isi_trash_pq_clean --cleanup [--debug]
또한 위에 언급된 경우 서비스 대기열에 있는 TreeDelete 작업의 작업 상태 쿼리 간격이 30초보다 크지 않은지 확인하십시오.
isi_gconfig -t trash-config job_query_interval=30
(2) 백본 OneFS 서비스 또는 TreeDelete 작업이 중단되었거나 권한이 부여된 사용자에 의해 비활성화된 경우 휴지통 디렉토리 HealthCheck 실패를 무시할 수 있습니다. 그러나 휴지통 디렉토리 서비스가 휴지통 디렉토리 삭제를 완료할 수 있도록 적절한 경우 백본 OneFS 서비스 또는 TreeDelete 작업을 활성화해야 합니다.
(3) 소비자 서비스(Lhotse data Mover/쓰기 가능한 스냅샷)가 디렉토리를 적극적으로 휴지통에 옮기거나 현재 실행 중인 작업이 휴지통 디렉토리 삭제를 차단하는 경우 휴지통 디렉토리 HealthCheck 실패를 무시할 수 있습니다. 이 경우 백본 OneFS 서비스가 병목 현상이 발생합니다.
휴지통 디렉토리 서비스로 대기 중인 TreeDelete 작업이 최근 휴지통이 많은 디렉토리의 처리를 차단하는 경우 서비스로 대기 중인 TreeDelete 작업에 대한 작업 시간 초과 제한 및 작업 쿼리 간격을 더 작은 값으로 튜닝할 수 있습니다. 이러한 튜닝 가능 항목에 대한 최소 권장 값은 다음과 같습니다. -
isi_gconfig -t trash-config job_timeout_limit=3600 isi_gconfig -t trash-config job_query_interval=30
휴지통 디렉토리 서비스는 작업 시간 초과 제한 후에도 서비스가 대기 중인 TreeDelete 작업을 계속 실행하거나 일시 중지합니다. 따라서 서비스가 대기열에 대기하는 대부분의 TreeDelete 작업을 취소하는 경우 작업 시간 초과 제한을 더 높은 값으로 늘릴 수 있습니다.