PowerScale: Baza danych aparatu zadań zgłasza blokadę lub długi czas oczekiwania na sukcesję
Summary: Poziom ochrony bazy danych raportów aparatu zadań (reports.db) w dużych klastrach może powodować problemy z dostępem do bazy danych raportów.
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Symptoms
Zadania wielokrotnie przechodzą w stan oczekiwania.
Aktualizacje baz danych zajmują dużo czasu.
W
Objaw 1:
Koordynator zadań często przełącza węzły:
Aktualizacje baz danych zajmują dużo czasu.
W
isi_job_d.log i messages.log, często pojawiają się komunikaty o długim czasie oczekiwania, blokadach bazy danych i możliwych węzłach przeskakujących koordynatora zadań.
Objaw 1:
isi_job_d.log Zgłasza długi czas oczekiwania na pomyślną aktualizację:
isi_job_d[45179]: Reports database update (job state) succeeded but took 11272 msObjaw 2:
isi_job_d.log Baza raportów jest zablokowana:
isi_job_d[97274]: Failed to update Jobs (state): database is lockedObjaw 3:
Koordynator zadań często przełącza węzły:
2018-05-02T02:00:48Z <24.5> cluster01-39(id58) cluster01-39 isi_job_d[31517]: Becoming job engine coordinator 2018-05-02T02:11:26Z <24.5> cluster01-33(id52) cluster01-33 isi_job_d[36865]: Becoming job engine coordinator 2018-05-02T02:25:39Z <24.5> cluster01-33(id52) cluster01-33 isi_job_d[37310]: Becoming job engine coordinator 2018-05-02T02:36:25Z <24.5> cluster01-37(id56) cluster01-37 isi_job_d[77098]: Becoming job engine coordinator 2018-05-02T02:38:24Z <24.5> cluster01-37(id56) cluster01-37 isi_job_d[77167]: Becoming job engine coordinator 2018-05-02T02:43:33Z <24.5> cluster01-39(id58) cluster01-39 isi_job_d[32917]: Becoming job engine coordinator 2018-05-02T02:59:58Z <24.5> cluster01-39(id58) cluster01-39 isi_job_d[33518]: Becoming job engine coordinator 2018-05-02T03:02:44Z <24.5> cluster01-39(id58) cluster01-39 isi_job_d[33782]: Becoming job engine coordinator 2018-05-02T03:08:02Z <24.5> cluster01-39(id58) cluster01-39 isi_job_d[33969]: Becoming job engine coordinator
Cause
- Baza danych raportów aparatu zadań (
reports.db) jest stale aktualizowany z powodu długotrwałego zadania, które generuje wiele aktualizacji. - Każda aktualizacja pliku jest wykonywana sześć razy w klastrze. Obniżenie poziomu zabezpieczenia wyraźnie przyczynia się do przyspieszenia aktualizacji.
- W zależności od ilości czasu wstrzymanego w
isi_papi_d, oczekuje się, że przekroczenie limitu czasu koordynatora zostanie wyświetlone podczas zapisu w bazie danych (rejestrowanie). Może się to również udać, ale rejestruj, że zapis trwał dłużej niż powinien, logując się doisi_job_d.logw obu przypadkach.
Aby określić aktualny poziom ochrony
reports.db
isi get -DD /ifs/.ifsvar/modules/jobengine/reports.db
cluster01-16# isi get -DD /ifs/.ifsvar/modules/jobengine/reports.db POLICY W LEVEL PERFORMANCE COAL ENCODING FILE IADDRS 8x 8 6x concurrency off UTF-8 reports.db <25,14,1575794508288:512>, <26,17,484528026624:512>, <26,31,924241684480:512>, <27,31,145164204544:512>, <28,30,2451893562880:512>, <29,29,6440579584:512> ct: 1506750730 rt: 0 ************************************************* * IFS inode: [ 25,14,1575794508288:512, 26,17,484528026624:512, 26,31,924241684480:512, 27,31,145164204544:512, 28,30,2451893562880:512, 29,29,6440579584:512 ] ************************************************* ... * Protection Policy: 8x * Target Protection: 6x <-- six times protection
Resolution
Inżynierowie firmy Dell badają ten problem. Ten artykuł jest aktualizowany w miarę pojawiania się nowych informacji.
Aby obejść ten problem, uruchom następujące polecenie w celu zmiany poziomu ochrony bazy danych raportów o zadaniach w następujący sposób:
Jeśli opcja "automatically manage" ma wartość all, następne zadanie SmartPools może zostać ponownie rozłożone
Aby tego uniknąć, zasugeruj ustawienie opcji "Automatycznie zarządzaj ochroną" na "files_at_default".
Gdy ustawienie wartości to "files_at_default", zadania SmartPools pomijają ręcznie zarządzane pliki, co oznacza, że pozostawiają
Aby obejść ten problem, uruchom następujące polecenie w celu zmiany poziomu ochrony bazy danych raportów o zadaniach w następujący sposób:
- Wstrzymaj wszystkie uruchomione zadania. Sprawdź, czy przy użyciu polecenia nie są uruchomione żadne zadania:
isi job status
- Wyłącz mechanizm zadań i zweryfikuj
isi_job_djest martwy na wszystkich węzłach:
isi services -a isi_job_d disable isi_for_array -sX 'ps auxww |grep -i isi_job_d |grep -v grep'
- Zmień poziom ochrony
reports.dbDo 3 układów o dostępie swobodnym:
isi set -r -g reprotect -a random -p 3x -F /ifs/.ifsvar/modules/jobengine/reports.db
- Kolejne uruchomienie poniższego polecenia powinno potwierdzić
reports.dbzmienił się:
isi get -DD /ifs/.ifsvar/modules/jobengine/reports.db cluster01-16# isi get -DD /ifs/.ifsvar/modules/jobengine/reports.db POLICY W LEVEL PERFORMANCE COAL ENCODING FILE IADDRS 3x 3 3x random off UTF-8 reports.db <25,14,1575794508288:512>, <26,31,924241684480:512>, <29,16,157594713088:512> ct: 1506750730 rt: 0 ************************************************* * IFS inode: [ 25,14,1575794508288:512, 26,31,924241684480:512, 29,16,157594713088:512 ] ************************************************* *... * Protection Policy: 3x * Target Protection: 3x
- włącz mechanizm zadań:
isi services -a isi_job_d enable isi_for_array -sX 'ps auxww |grep -i isi_job_d |grep -v grep'
- wznów zadania. Komunikaty w
isi_job_d.logpowinny zostać złagodzone.
reports.db do 3x natychmiast. Niektórzy użytkownicy mogą jednak skonfigurować zadanie SmartPools tak, aby działało na "wszystkich" plikach, a nie "domyślnie".
- W pełnym dzienniku:
[xus25@elvis 2021-09-24-003]$ cat local/isi_storagepool_settings Automatically Manage Protection: all <<<< Automatically Manage Io Optimization: all
- W klastrze na żywo
steven-8220-1# isi storagepool settings view Automatically Manage Protection: all <<<< Automatically Manage Io Optimization: all
Jeśli opcja "automatically manage" ma wartość all, następne zadanie SmartPools może zostać ponownie rozłożone
reports.db Wróć do lustra 6x lub 8x.
Aby tego uniknąć, zasugeruj ustawienie opcji "Automatycznie zarządzaj ochroną" na "files_at_default".
Gdy ustawienie wartości to "files_at_default", zadania SmartPools pomijają ręcznie zarządzane pliki, co oznacza, że pozostawiają
reports.db z dowolnym poziomem ochrony, który określiliśmy.Additional Information
Poniżej przedstawiono niektóre polecane zasoby dotyczące tego tematu, które mogą Cię zainteresować:
Affected Products
PowerScale, IsilonProducts
Isilon, Isilon NL410Article Properties
Article Number: 000066019
Article Type: Solution
Last Modified: 17 Sep 2025
Version: 16
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.