NetWorker: Резервне копіювання/відновлення бази даних Informix та логічного журналу перервано
Summary: Резервне копіювання бази даних Informix та Logical Log часто переривається для деяких просторів даних. «Сталася системна помилка». «Переривання сесії XBSA». «Перервано клієнтом». Така ж помилка сталася і при відновленні бази даних. ...
Symptoms
Ми не бачимо жодних конкретних помилок у журналах фонової служби.
Повідомлення про помилки у libnsrifmx-xxxxx.log:
XBSA-1.0.1 #.#.#.#.Build.### 16384588 DAY MONTH ## HH:mm:SS YYYY _nwbsa_is_retryable_error: received a retryable network error (Severity 0 Number -13): busy
Повідомлення про помилки під час резервного копіювання в журналі onbar (bar_act.log):
YYYY-MM-DD HH:mm:SS 20120112 7930210 XBSA Error: (BSACreateObject) A system error occurred. Aborting XBSA session. YYYY-MM-DD HH:mm:SS 10814124 7930210 XBSA Error: (BSACreateObject) A system error occurred. Aborting XBSA session. YYYY-MM-DD HH:mm:SS 16843426 7930210 XBSA Error: (BSACreateObject) A system error occurred. Aborting XBSA session. YYYY-MM-DD HH:mm:SS 28508590 7930210 XBSA Error: (BSACreateObject) A system error occurred. Aborting XBSA session.
Повідомлення про помилки під час відновлення.
YYYY-MM-DD HH:mm:SS 11207038 18088436 XBSA Error: (BSAGetData) A system error occurred. Aborting XBSA session. YYYY-MM-DD HH:mm:SS 11207038 18088436 (-43391) Skipped backup/restore of space '<dbspace-name>'. YYYY-MM-DD HH:mm:SS 18088436 28442904 (-43246) The ON-Bar process 11207038 exited with a problem (exit code 3 (0x3),signal 0). YYYY-MM-DD HH:mm:SS 23396846 18088436 XBSA Error: (BSAGetData) A system error occurred. Aborting XBSA session. YYYY-MM-DD HH:mm:SS 23396846 18088436 (-43391) Skipped backup/restore of space '<dbspace-name>'.
Повідомлення про помилки в Informix online.log:
MM/DD/YY HH:mm:SS Archive on <dbspace-name> Completed. MM/DD/YY HH:mm:SS Level 0 Archive started on <dbspace-name> MM/DD/YY HH:mm:SS Archive on <dbspace-name> ABORTED. MM/DD/YY HH:mm:SS Aborted by client. MM/DD/YY HH:mm:SS Archive on <dbspace-name> ABORTED. MM/DD/YY HH:mm:SS Aborted by client.
Cause
Клієнт встановив значення для BAR_MAX_BACKUP як 0 у файлі onconfig, що означає необмежену кількість потоків резервного копіювання. Конкретна база даних Informix має 47 баз даних, і тому, коли запускається резервне копіювання (резервне копіювання бази даних або логічного журналу) або відновлення, сервер бази даних створює багато процесів на панелі. Така ж ситуація відбувається і під час відновлення. Це призводить до зупинки, і деякі з потоків зазнають невдачі після повторної спроби відповідно до значення повторної спроби, встановленого для BAR_RETRY.
Resolution
Встановлення BAR_MAX_BACKUP значення як 10 у файлі onconfig (розташування: /infx/inst/<DB-Name>/informixdir/etc/onconfig.xxx) вирішено проблему. Ми можемо піти з меншим значенням, наприклад, 4 або 6 залежно від ситуації.