NetWorker: Przerwanie kopii zapasowej/przywracania bazy danych Informix i dziennika logicznego
Summary: Baza danych Informix i kopie zapasowe dziennika logicznego są często przerywane w niektórych przestrzeniach dbspaces. "Wystąpił błąd systemu". "Przerwanie sesji XBSA". "Przerwane przez klienta". Podczas przywracania bazy danych wystąpił również ten sam błąd. ...
Symptoms
W dziennikach demona nie są wyświetlane żadne konkretne błędy.
Komunikaty o błędach w pliku libnsrifmx-xxxxx.log:
XBSA-1.0.1 #.#.#.#.Build.### 16384588 DAY MONTH ## HH:mm:SS YYYY _nwbsa_is_retryable_error: received a retryable network error (Severity 0 Number -13): busy
Komunikaty o błędach podczas tworzenia kopii zapasowej w dzienniku paska (bar_act.log):
YYYY-MM-DD HH:mm:SS 20120112 7930210 XBSA Error: (BSACreateObject) A system error occurred. Aborting XBSA session. YYYY-MM-DD HH:mm:SS 10814124 7930210 XBSA Error: (BSACreateObject) A system error occurred. Aborting XBSA session. YYYY-MM-DD HH:mm:SS 16843426 7930210 XBSA Error: (BSACreateObject) A system error occurred. Aborting XBSA session. YYYY-MM-DD HH:mm:SS 28508590 7930210 XBSA Error: (BSACreateObject) A system error occurred. Aborting XBSA session.
Komunikaty o błędach podczas przywracania.
YYYY-MM-DD HH:mm:SS 11207038 18088436 XBSA Error: (BSAGetData) A system error occurred. Aborting XBSA session. YYYY-MM-DD HH:mm:SS 11207038 18088436 (-43391) Skipped backup/restore of space '<dbspace-name>'. YYYY-MM-DD HH:mm:SS 18088436 28442904 (-43246) The ON-Bar process 11207038 exited with a problem (exit code 3 (0x3),signal 0). YYYY-MM-DD HH:mm:SS 23396846 18088436 XBSA Error: (BSAGetData) A system error occurred. Aborting XBSA session. YYYY-MM-DD HH:mm:SS 23396846 18088436 (-43391) Skipped backup/restore of space '<dbspace-name>'.
Komunikaty o błędach w pliku Informix online.log:
MM/DD/YY HH:mm:SS Archive on <dbspace-name> Completed. MM/DD/YY HH:mm:SS Level 0 Archive started on <dbspace-name> MM/DD/YY HH:mm:SS Archive on <dbspace-name> ABORTED. MM/DD/YY HH:mm:SS Aborted by client. MM/DD/YY HH:mm:SS Archive on <dbspace-name> ABORTED. MM/DD/YY HH:mm:SS Aborted by client.
Cause
Klient ustawił wartość dla BAR_MAX_BACKUP jako 0 w pliku onconfig, co oznacza nieograniczoną liczbę strumieni kopii zapasowych. Określona baza danych Informix ma 47 obszarów dbspaces i dlatego podczas tworzenia kopii zapasowych (kopia zapasowa bazy danych lub dzienników logicznych) lub przywracanie powoduje, że serwer bazy danych tworzy wiele procesów na pasku. Taka sama sytuacja występuje również podczas przywracania. Skutkuje to sytuacją wstrzymania, a niektóre wątki nie powiodły się po ponowieniu próby zgodnie z ustawioną wartością ponawiania próby dla BAR_RETRY.
Resolution
Ustawienie wartości BAR_MAX_BACKUP jako 10 w pliku onconfig (lokalizacja: /infx/inst/<DB-Name>/informixdir/etc/onconfig.xxx) rozwiązało problem. W zależności od sytuacji możemy mieć niższą wartość, np. 4 lub 6.