Isilon PowerScale Кошик каталог Помилка HealthCheck
Shrnutí: Помилка каталогу кошика HealthCheck під час щоденного запуску HealthCheck.
Příznaky
Příčina
Каталог кошика HealthCheck не вдається, коли каталог кошика PQ накопичує понад 10 240 записів. Ця помилка HealthCheck може бути пов'язана з багатьма побоюваннями щодо справності служби каталогів сміття, зокрема, але не виключно: -
(1) Служба каталогів сміття перестала працювати (аварійно завершилася/зависла/вимкнена), або службі не вдалося очистити застарілі записи каталогу сміття PQ.
(2) Магістральні служби OneFS, такі як завдання isi_job_d, isi_papi_d або TreeDelete , вийшли з ладу/зависли або були відключені привілейованим користувачем.
(3) Сміттєвий каталог Побутові служби агресивно знищують каталоги, або в даний час запущені завдання блокують видалення видалених каталогів.
Řešení
Ця база знань буде оновлена, як тільки у нас буде доступне виправлення.
Спосіб вирішення:
Наступні обхідні шляхи повинні бути корисними на основі трьох категорій причин, згаданих вище.
(1) MCP повинен перезапустити службу в разі аварійного завершення роботи служби каталогів сміття. Будь ласка, повідомляйте про помилки щодо проблем зі службою каталогів сміття. Якщо служба каталогів сміття зависла, її можна вбити/перезапустити для тимчасового вирішення. Помилка кошика каталогу HealthCheck може бути проігнорована, якщо isi_trash_d служби каталогів кошика було вимкнено привілейованим користувачем. Проте службу слід увімкнути, коли це необхідно, щоб служба каталогів кошика могла завершити видалення видалених каталогів.
isi services -a isi_trash_d enable
Будь ласка, запустіть наступну команду, щоб очистити застарілі записи PQ на випадок, якщо служба каталогів сміття не зможе очистити застарілі записи в PQ.
/usr/libexec/isilon/isi_trash_pq_clean --cleanup [--debug]
Також переконайтеся, що інтервал запиту стану завдання для завдань TreeDelete, що стоять у черзі служби, не перевищує 30 секунд у випадку, зазначеному вище.
isi_gconfig -t trash-config job_query_interval=30
(2) Якщо магістральні служби OneFS або завдання TreeDelete зависли або були відключені привілейованим користувачем, помилка каталогу кошика HealthCheck може бути проігнорована. Однак, магістральні служби OneFS або завдання TreeDelete повинні бути включені, коли це необхідно, щоб служба каталогів кошика могла завершити видалення видалених каталогів.
(3) Сміттєвий каталог Помилку HealthCheck можна проігнорувати, якщо побутові служби (Lhotse data mover/Writable snapshot) агресивно знищують каталоги, або поточні завдання блокують видалення видалених каталогів. Магістральні послуги OneFS в цьому випадку є вузьким місцем.
Якщо тривалі завдання TreeDelete, що стоять у черзі служби каталогів сміття, блокують обробку значної кількості нещодавно знищених каталогів, тоді ліміт тайм-ауту завдань та інтервал запитів завдань TreeDelete, що стоять у черзі сервісу, можна налаштувати на менше значення. Мінімальні рекомендовані значення для цих настроювань такі: -
isi_gconfig -t trash-config job_timeout_limit=3600 isi_gconfig -t trash-config job_query_interval=30
Зверніть увагу, що служба каталогів сміття скасовує завдання TreeDelete, поставлене в чергу службою, яка все ще працює або призупинена після обмеження часу очікування. Отже, якщо сервіс скасовує більшість завдань TreeDelete, що стоять у черзі самостійно, то ліміт часу очікування може бути збільшений до більшого значення.