Errore di HealthCheck nella directory Cestino di Isilon PowerScale
Shrnutí: Errore di HealthCheck nella directory Cestino durante l'esecuzione giornaliera di HealthCheck.
Příznaky
Příčina
HealthCheck della directory Cestino ha esito negativo quando la PQ della directory Cestino accumula più di 10.240 voci. Questo errore di HealthCheck può essere dovuto a molte preoccupazioni circa lo stato del servizio directory Cestino, tra cui, a titolo esemplificativo ma non esaustivo: -
(1) Il servizio directory Cestino ha smesso di funzionare (crashed/hung/disabled) o il servizio non è riuscito a pulire le voci PQ della directory Cestino non aggiornate.
(2) I servizi Backbone OneFS come isi_job_d, isi_papi_d o il job TreeDelete sono crashed/hung o sono stati disabilitati da un utente con privilegi.
(3) I servizi di utenti privati di directory del Cestino stanno cestino in modo aggressivo o i job in esecuzione bloccano l'eliminazione di directory con hash.
Řešení
Questo articolo della KB verrà aggiornato quando sarà disponibile una patch.
Soluzione:
Le seguenti soluzioni alternative dovrebbero essere utili in base a tre categorie di cause menzionate in precedenza.
(1) MCP deve riavviare il servizio in caso di arresto anomalo del servizio directory Cestino. Please file bug for hung trash directory service issues. Se il servizio directory Cestino è bloccato, può essere arrestato/riavviato per la risoluzione temporanea. L'errore healthcheck della directory Cestino può essere ignorato se il servizio directory Cestino isi_trash_d è stato disabilitato da un utente con privilegi. Tuttavia, il servizio deve essere abilitato quando appropriato, in modo che il servizio directory Cestino possa completare l'eliminazione delle directory tratteggiate.
isi services -a isi_trash_d enable
Eseguire il seguente comando per pulire le voci PQ non aggiornate nel caso in cui il servizio directory Cestino non riesca a pulire le voci obsolete nell'PQ.
/usr/libexec/isilon/isi_trash_pq_clean --cleanup [--debug]
Verificare inoltre che l'intervallo di query sullo stato dei job per i job TreeDelete in coda del servizio non sia superiore a 30 secondi nel caso sopra menzionato.
isi_gconfig -t trash-config job_query_interval=30
(2) Se i servizi OneFS backbone o il job TreeDelete sono sospesi o sono stati disabilitati da un utente con privilegi, l'errore HealthCheck della directory Cestino può essere ignorato. Tuttavia, i servizi OneFS backbone o il job TreeDelete devono essere abilitati quando appropriato, in modo che il servizio directory Cestino possa completare l'eliminazione delle directory con hash.
(3) L'errore HealthCheck della directory Cestino può essere ignorato se i servizi consumer (data mover Lhotse/snapshot scrivibile) sono directory cestino in modo aggressivo o se i job in esecuzione bloccano l'eliminazione delle directory tratteggiate. In questo caso, i servizi Backbone OneFS sono colli di bottiglia.
Se i job TreeDelete a esecuzione prolungata accodati dal servizio directory Cestino bloccano l'elaborazione di un numero sostanziale di directory con hash di recente, è possibile ottimizzare il limite di timeout dei job e l'intervallo di query dei job per i job TreeDelete accodati dal servizio a un valore inferiore. I valori minimi consigliati per questi dispositivi sono i seguenti: -
isi_gconfig -t trash-config job_timeout_limit=3600 isi_gconfig -t trash-config job_query_interval=30
Tenere presente che il servizio directory Cestino annulla il job TreeDelete accodato dal servizio ancora in esecuzione o sospeso dopo il limite di timeout dei job. Pertanto, se il servizio annulla la maggior parte dei job TreeDelete in coda da solo, il limite di timeout dei job può essere aumentato a un valore più elevato.