NetWorker. Прерывание резервного копирования/восстановления базы данных Informix и логического журнала
Summary: Базы данных Informix и резервное копирование логических журналов часто прерываются для некоторых пространств dbspace. «Произошла системная ошибка». «Прерывание сеанса XBSA». «Прервано клиентом». Такая же ошибка также произошла при восстановлении базы данных. ...
Symptoms
Мы не видим конкретных ошибок в журналах управляющей программы.
Сообщения об ошибках в libnsrifmx-xxxxx.log:
XBSA-1.0.1 #.#.#.#.Build.### 16384588 DAY MONTH ## HH:mm:SS YYYY _nwbsa_is_retryable_error: received a retryable network error (Severity 0 Number -13): busy
Сообщения об ошибках во время резервного копирования в журнале onbar (bar_act.log):
YYYY-MM-DD HH:mm:SS 20120112 7930210 XBSA Error: (BSACreateObject) A system error occurred. Aborting XBSA session. YYYY-MM-DD HH:mm:SS 10814124 7930210 XBSA Error: (BSACreateObject) A system error occurred. Aborting XBSA session. YYYY-MM-DD HH:mm:SS 16843426 7930210 XBSA Error: (BSACreateObject) A system error occurred. Aborting XBSA session. YYYY-MM-DD HH:mm:SS 28508590 7930210 XBSA Error: (BSACreateObject) A system error occurred. Aborting XBSA session.
Сообщения об ошибках во время восстановления.
YYYY-MM-DD HH:mm:SS 11207038 18088436 XBSA Error: (BSAGetData) A system error occurred. Aborting XBSA session. YYYY-MM-DD HH:mm:SS 11207038 18088436 (-43391) Skipped backup/restore of space '<dbspace-name>'. YYYY-MM-DD HH:mm:SS 18088436 28442904 (-43246) The ON-Bar process 11207038 exited with a problem (exit code 3 (0x3),signal 0). YYYY-MM-DD HH:mm:SS 23396846 18088436 XBSA Error: (BSAGetData) A system error occurred. Aborting XBSA session. YYYY-MM-DD HH:mm:SS 23396846 18088436 (-43391) Skipped backup/restore of space '<dbspace-name>'.
Сообщения об ошибках в Informix online.log:
MM/DD/YY HH:mm:SS Archive on <dbspace-name> Completed. MM/DD/YY HH:mm:SS Level 0 Archive started on <dbspace-name> MM/DD/YY HH:mm:SS Archive on <dbspace-name> ABORTED. MM/DD/YY HH:mm:SS Aborted by client. MM/DD/YY HH:mm:SS Archive on <dbspace-name> ABORTED. MM/DD/YY HH:mm:SS Aborted by client.
Cause
Заказчик задает значение для параметра BAR_MAX_BACKUP0 в файле onconfig, что означает неограниченные потоки резервного копирования. Определенная база данных Informix имеет 47 пространств баз данных, поэтому при резервном копировании (резервном копировании базы данных или резервном копировании логических журналов) или восстановлении сервер базы данных создает много процессов на панели. Такая же ситуация возникает и во время восстановления. Это приводит к зависаемости и сбою некоторых потоков после повторной попытки, как указано в значении повторной BAR_RETRY.
Resolution
Настройка BAR_MAX_BACKUP 10 в файле onconfig (местоположение: /infx/inst/<DB-Name>/informixdir/etc/onconfig.xxx) устранена. В зависимости от ситуации можно использовать меньшее значение, например 4 или 6.