NetWorker: Обслуговування медіабази даних та усунення несправностей

Summary: У цій статті описано методи виявлення та лікування проблем, пов'язаних із базою даних медіа, а також найкращі практики обслуговування та захисту.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

  • Відмова від запуску послуг.
  • Збій щоденного робочого процесу резервного копіювання сервера> захисту сервера.
  • Неповна або оманлива інформація, пов'язана зі збереженням наборів або клієнтами, що повертаються командою mminfo , або під час запиту чи перегляду наборів збережень в адмініструванні NetWorker Management Console (NMC) або NetWorker Web User Interface (NWUI).
  • Проблеми з резервним копіюванням, відновленням або клонуванням, пов'язані з неможливістю знайти набори збережень, клієнтів або томи.
  • Помилки в журналі фонової служби сервера або консолях, пов'язаних з базою даних мультимедіа:
nsrmmdbd WiSS code assertion error (st_nextrec: rec loop detected)
nsrmmdbd error, ss_clone_ensure_clone_eligibility: assertion, invalid parameters or code segment
nsrmmdbd XCHK ssid:saveset_short_ssid host:saveset_hostname name:saveset_name has a fragment with an invalid volid:saveset_volid
nsrmmdbd NSR warning WiSS code assertion error (ST_readvdir: directory read failed)
nsrmmdbd NSR critical Unexpected error reading long record directory: an invalid slot number
nsrmmdbd NSR warning partial record error, ssid: saveset_short_ssid saveset_long_ssid flags:0x00010101 size:0 files:0 tm:datetime cloneid
nsrmmdbd NSR notice media db must be scavenged
nsrmmdbd NSR critical media db scavenge failed
nsrmmdbd NSR warning Cannot scavenge path_to_mmvolume6 (Permission denied) - recover from backup media
nsrmmdbd NSR warning Cannot scavenge path_to_mmvolume6 (unknown error code) - recover from backup media
nsrmmdbd MDB warning can't fetch save set <saveset ID>
nsrmmdbd MDB warning Unable to fetch child save set <saveset ID> for cover set <saveset ID>
  • Раптова втрата безлічі збережених наборів з бази даних носіїв, або раптовий стрибок вільного місця на дисковому сховищі.
  • Програмне забезпечення не має терміну дії або не видаляє набори збережень, що призводить до швидкого використання пам'яті.

Cause

Як і будь-яка база даних, медіабаза даних може бути пошкоджена різною мірою, якщо є будь-які висновки з її звичайними операціями, наприклад. 
  • Несподіване завершення процесу nsrmmdbd (дамп ядра, аварійне завершення роботи системи, перезавантаження або втрата живлення).
  • Перервана транзакція (втручання зовнішнього захисного програмного забезпечення або виснаження дискового простору).
  • Логічна внутрішня проблема (помилка коду або необроблені умови).
  • Пряме втручання в файли медіа-бази даних або збереження файлів набору в сховищі, керованому NetWorker.
Медіа-базу даних найкраще захистити від пошкоджень за допомогою таких загальних практик:
  • Якщо можливо, використовуйте окремий локальний розділ диска для папки nsr/mm, який допомагає захистити від таких умов, як виснаження дискового простору іншими процесами. Цей розділ має бути принаймні в 3 рази більшим за медіа-базу даних; велика база даних медіа в даний час становитиме 10 ГБ; тому 100 Гб має вистачити для будь-якої установки. 
  • Переконайтеся, що робочий процес резервного копіювання сервера виконується щодня, щоб у разі аварії були доступні резервні копії медіабази даних і критичних ресурсів аварійного відновлення ( Bootstrap).
  • Періодично перевіряйте розташування Bootstraps за допомогою команди mminfo -B .
  • Ніколи не дозволяйте одночасно іншому серверу NetWorker доступ до томів сховища сервера NetWorker, оскільки це може призвести до втрати даних.
  • Якщо на сервері NetWorker встановлено антивірусне програмне забезпечення, створіть виключення для каталогу /nsr, щоб антивірусне програмне забезпечення не сканувало, не змінювало або видаляло файли NetWorker. 
  • Уникайте видалення будь-яких файлів зі сховища NetWorker вручну, щоб спробувати звільнити місце. NetWorker має процедури звільнення простору, які виконуються щодня, і слід зв'язатися зі службою підтримки, якщо вони вважаються невдалими.
  • Загалом, для планування Datazone, зберігайте дані одного типу в одних і тих же пулах для зручності обслуговування, коли це необхідно, наприклад, набори збереження vProxy, набори збережень файлової системи та набори збережень бази даних Oracle в окремих пулах.
  • Не ігноруйте повідомлення, пов'язані з помилками медіабази даних - зверніться до служби підтримки, якщо у вас виникнуть сумніви.
Пам'ятайте про зв'язок між базою даних та сховищем медіа NetWorker, а також захищайте томи прапорцем Scan Needed
  • NetWorker щодня запускає процес закінчення терміну дії в рамках робочого процесу резервного копіювання сервера. Це завдання обчислює збереження та залежності, а також завершує термін дії наборів збережень, термін зберігання яких минув і які не мають непрострочених залежних. Як тільки це буде завершено, NetWorker спробує видалити всі прострочені набори для збереження томів диска. Після цього для кожного тому виконується операція звільнення простору, яка видаляє збережені файли набору з дискових носіїв, які не мають відповідних записів у базі даних мультимедіа. Це означає, що якщо медіабаза даних буде пошкоджена або ви відновите базу даних до попереднього моменту часу, дійсні дані можуть бути видалені.
  • Якщо ви відчуваєте, що виникла проблема з будь-якими томами диска, щоб переконатися, що дійсні дані не видаляються, переконайтеся, що том демонтовано та позначено як «Потрібне сканування». Це також стосується томів після відновлення до попереднього моменту часу (якщо на диску, створеному після точки відновлення, можуть існувати допустимі набори збережень, а отже, не мати записів у відновленій базі даних). 
  • Потрібне сканування дозволяє звичайне резервне копіювання, відновлення та/або клонування, але запобігає нормальному завершенню терміну дії або видаленню, тому переконайтеся, що він використовується лише для захисту томів, які сприймаються як такі, що перебувають у небезпеці, і видаляється при поверненні до звичайних операцій. Томи потрібно демонтувати, щоб встановити або видалити цей прапорець. Зазвичай томи позначаються як «потрібне сканування» після аварійного відновлення сервера NetWorker (nsrdr), щоб запобігти небажаній втраті даних у сценарії аварійного відновлення.

Resolution

Існує кілька способів перевірити та виправити проблеми з базою даних мультимедіа. Перш ніж спробувати будь-яку з них, щоб оцінити вплив, створіть звіти до та після, щоб побачити, чи видалено збережені набори, томи, клієнти чи щось інше.
У командному рядку в каталозі для розміщення виведених даних запустіть такі команди для порівняння властивостей медіабази даних до і після процедури:
  • mminfo -C mminfo-C_pre.mmi
  • mminfo -X mminfo-X_pre.mmi
  • mminfo -ar "volid,type,location,pool,volume,state,volflags,written,savesets" -q family=disk -xc, > mminfo-vol_pre.mmi
Після завершення обслуговування повторно запустіть кожен з них в окремому файлі (наприклад, *_post.mmi) і порівняйте значення.

nsrim - Щоденний захист сервера

Щодня > виконується робочий процес резервного копіювання сервера захисту сервера, а разом із ним і дія Expiration. Дія Expiration запускає nsrim, яка є рідною утилітою обслуговування NetWorker. Це також можна запустити безпосередньо, але це може зайняти від кількох хвилин до кількох годин, залежно від навантаження на сервер та розміру медіабази даних:
nsrim -X > nsrim.out 2>&1

Якщо цей процес не запускається щодня, це навряд чи щось змінить. Перевірте журнал фонової служби на предмет щоденного завершення nsrim .

Перезапуск служби

Перезапуск служб NetWorker змушує проводити різні перевірки запуску, які можуть виявити проблеми в повідомленнях про помилки журналу фонової служби, а також потенційно виправляти будь-які. Перш ніж зупиняти роботу служб, якщо проблеми з базою даних здаються серйозними, переконайтеся, що є достатньо вільного місця та відомі місця початкового завантаження (виведення mminfo -B). В ідеалі, спочатку віддайте команду nsrmmdbasm -s nsr/mm/mmvolrel_path > mm.xdr, щоб спробувати видобути поточну копію бази даних. Перед перезапуском служб створіть копію папки mmvolrel, оскільки пізніше вона може знадобитися для криміналістики або відновлення.

Експорт та повторний імпорт медіабази даних

Цей процес дозволяє уникнути повного аварійного відновлення, витягуючи лише життєздатні записи медіабази даних і повторно імпортуючи їх на сервер без зупинки служб. Однак, це слід робити лише тоді, коли сервер не використовується, і ніколи не слід намагатися виконувати завдання, коли виконуються завдання. Використовуйте повний шлях замість mmvolrel (який може відрізнятися залежно від інсталяції або операційної системи)
  1. Перш ніж почати, позначте всі томи диска як «Потрібне сканування» після демонтування. Якщо для пристроїв, на яких розміщено томи дисків, настроєно автоматичне керування медіафайлами , спочатку потрібно вимкнути цю функцію. Стрічкові обсяги не потребують цього етапу. 
  2. Запустіть команди mminfo , описані в преамбулі, щоб підготувати попередні звіти.
  3. Перевіряємо розмір медіабази даних mmvolrel папки і запису
  4. Переконайтеся, що жоден із процесів nsrck, nsrim, nsrmmdbasmне запущено; Якщо в батьківській папці MM є будь-які великі, старі або не нещодавно змінені файли, наприклад mm[alphanumerics], перемістіть або видаліть, якщо вони не заблоковані жодним процесом.
  5. Виконайте команду для видобування медіабази даних: nsrmmdbasm -s mmvolrel > mm.xdr
  6. Порівняйте розмір нового файлу з розміром папки mmvolrel - якщо він повинен бути схожим за розміром. Якщо він крихітний (4 Б або жменька КБ), команда не спрацювала. Якщо він значно менший - можливо, в рамках процесу були видалені пошкоджені записи.
  7. Підготуйте сервер до відновлення своєї медіабази даних, встановивши поле стану сервера на аварійне відновлення в NMC/NWUI або за допомогою nwadmin.
  8. Відновіть безпосередньо з файла видобування медіабази даних за допомогою команди nsrmmdbasm знову: nsrmmdbasm -r -2 < mm.xdr
  9. Після завершення запустіть те саме mminfo, що описано в преамбулі, і порівняйте збережені встановлені та записані значення для кожного тому, переконавшись, що всі томи присутні; так само значення mminfo -C мають бути ідентичними.
  10. Якщо є будь-які розбіжності, зверніть увагу та ретельно обміркуйте, як діяти далі, і зверніться до служби підтримки, якщо ви не впевнені в результатах, які бачите:
    • Для томів, які здаються справними, ви можете зняти прапорець «Потрібне сканування» та змонтувати томи, оскільки не повинно бути небезпеки видалення набору збережень, якщо жоден набір збережень не було видалено з тому, якщо набори збереження та записані значення є однаковими. 
    • Томи, які показують меншу кількість збережених наборів або меншу загальну кількість записів , повинні залишити прапорець Потрібне сканування на місці і запустити scanner: scanner -i назва_пристрою, щоб повторно ввести файли, знайдені на томі, які більше не містять записів. Після завершення роботи сканера для кожного тому ще раз перевірте кількість збережених наборів і зніміть прапорець «Потрібне сканування». Повторно змонтуйте том, коли переконаєтеся, що сканер замінив набори збережень, які, як очікується, будуть відсутні.

НСРДР

Повне аварійне відновлення, яке виконує nsrdr, відновлює не лише медіабазу даних, але й інші елементи сервера, такі як база даних ресурсів та база даних завдань. Перегляньте Посібник із найкращих практик аварійного відновлення та доступності сервера для вашої версії, перш ніж намагатися продовжити цю роботу.
Ця команда очікує, що вузли зберігання будуть онлайн і з ними можна буде зв'язатися, щоб завершити роботу.
 
ПРИМІТКА: Завжди звертайтеся до служби підтримки, якщо виникнуть будь-які запитання чи сумніви, оскільки відновлення медіабази даних може призвести до втрати даних для томів дисків, якщо прапорець «Потрібне сканування» не використовується для захисту файлових систем із життєздатними наборами збережень, які можуть не мати записів у медіабазі даних через пошкодження або відновлення до попереднього моменту часу.

Affected Products

NetWorker

Products

Data Backup & Protection Software, NetWorker Family
Article Properties
Article Number: 000223518
Article Type: Solution
Last Modified: 08 Apr 2024
Version:  1
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.