Falla de HealthCheck del directorio de basura de Isilon PowerScale
Resumen: Se produjo una falla de HealthCheck en el directorio de la papelera durante la ejecución diaria de HealthCheck.
Síntomas
Causa
La evaluación del estado del directorio papelera falla cuando la PQ del directorio papelera acumula más de 10 240 entradas. Esta falla de evaluación del estado se puede deber a muchas preocupaciones sobre el estado del servicio de directorio de la papelera, que incluyen, entre otras, las siguientes: -
(1) El servicio de directorio de la papelera dejó de funcionar (se bloqueó/bloqueó/deshabilitó) o el servicio no pudo limpiar las entradas obsoletas de PQ del directorio de la papelera.
(2) Los servicios de la red troncal de OneFS , como isi_job_d, isi_papi_d o trabajo de TreeDelete , se bloquearon o se bloquearon, o un usuario con privilegios los deshabilitó.
(3) Los servicios al consumidor de directorios de la papelera están destruyendo directorios de forma agresiva, o actualmente los trabajos en ejecución bloquean la eliminación de directorios eliminados.
Resolución
Este artículo de la base de conocimientos se actualizará una vez que tengamos algún parche disponible.
Solución alternativa:
Las siguientes soluciones alternativas deberían ser útiles en función de las tres categorías de causas mencionadas anteriormente.
(1) MCP debe reiniciar el servicio cuando se bloquea el servicio de directorio de la papelera. Archive los errores por problemas con el servicio de directorio de la papelera bloqueado. Si el servicio de directorio de la papelera está bloqueado, se puede finalizar/reiniciar para una resolución temporal. La falla de evaluación del estado del directorio papelera se puede ignorar si un usuario con privilegios deshabilitó el isi_trash_d del servicio de directorio papel. Sin embargo, el servicio se debe habilitar cuando corresponda, de modo que el servicio de directorio de la papelera pueda terminar de eliminar los directorios a la papelera.
isi services -a isi_trash_d enable
Ejecute el siguiente comando para limpiar las entradas de PQ obsoletas en caso de que el servicio de directorio de la papelera no pueda limpiar las entradas obsoletas en PQ.
/usr/libexec/isilon/isi_trash_pq_clean --cleanup [--debug]
Verifique también que el intervalo de consulta del estado del trabajo para los trabajos de TreeDelete en línea de espera del servicio no sea superior a 30 segundos en el caso mencionado anteriormente.
isi_gconfig -t trash-config job_query_interval=30
(2) Si los servicios de la red troncal de OneFS o el trabajo de TreeDelete están bloqueados o han sido deshabilitados por un usuario con privilegios, se puede ignorar la falla de HealthCheck del directorio de la papelera. Sin embargo, los servicios de OneFS troncales o el trabajo TreeDelete se deben habilitar cuando corresponda, de modo que el servicio de directorio de la papelera pueda terminar de eliminar los directorios que se han tirado a la papelera.
(3) La falla de HealthCheck del directorio de la papelera se puede ignorar si los servicios de consumo (administrador de transferencia de datos de Lhotse/instantánea con capacidad de escritura) están tirando directorios a la basura de forma agresiva o si los trabajos en ejecución actualmente están bloqueando la eliminación de directorios eliminados. Los servicios de la red troncal de OneFS son un cuello de botella en este caso.
Si los trabajos de TreeDelete de larga duración en cola por el servicio de directorio de la papelera bloquean el procesamiento de una cantidad considerable de directorios recientemente desechados, el límite de tiempo de espera de trabajos y el intervalo de consulta de trabajos para los trabajos de TreeDelete en cola por el servicio se pueden ajustar a un valor menor. Los valores mínimos recomendados para estos sintonizables son los siguientes: -
isi_gconfig -t trash-config job_timeout_limit=3600 isi_gconfig -t trash-config job_query_interval=30
Tenga en cuenta que el servicio de directorio de la papelera cancela el trabajo TreeDelete en cola por el servicio que sigue en ejecución o en pausa después del límite de tiempo de espera agotado del trabajo. Por lo tanto, si el servicio cancela la mayoría de los trabajos de TreeDelete en línea de espera por sí mismo, el límite de tiempo de espera del trabajo se puede aumentar a un valor mayor.