NetWorker. Поиск и устранение неисправностей ленточной библиотеки в NetWorker
Сводка: Данная статья предназначена для помощи как в поддержке NetWorker, так и в администраторах резервного копирования NetWorker в решении проблем, связанных с ленточной библиотекой, и устранении неполадок. ...
Инструкции
Перед исследованием проблем ленточной библиотеки важно учесть следующее:
- Ленточные накопители считывают и записывают данные и метки на носитель и выполняют все функции носителя и не могут перемещать сами ленточные картриджи
- Ленточные БИБЛИОТЕКИ перемещают ленточные картриджи от элемента к элементу: Накопители, разъемы, порты импорта и экспорта, не читают и не записывают данные.
Если операции NetWorker завершаются сбоем из-за невозможности перемещения ленточных картриджей, это может быть вызвано несколькими общими причинами.
- Проблема с оборудованием или микропрограммой в библиотеке-роботе или внутренних компонентах
- Проблемы с подключением хоста NetWorker к библиотечной робототехнике по транспорту
- ОС, драйвер или проблема совместимости между хостом NetWorker и библиотекой
- Проблема конфигурации NetWorker, связанная с типом, состоянием и адресацией ленточной библиотеки
Выполните эти шаги в хронологическом порядке, чтобы определить природу проблемы и, возможно, решить ее. Если этот документ не решает проблему, в нем приводятся тесты, которые сужают круг проблемы и помогают специалисту продолжить работу.
1. Информация об условиях эксплуатации
На сервере NetWorker и затронутых узлах хранения:
- Имя хоста, тип и версия ОС.
- Номер версии и сборки NetWorker.
- Выходные данные команды '
inquire' команда, показывающая ленты и библиотеки. - Заархивированная копия текущего
nsrdb(для сохранения текущей информации о музыкальном автомате, если это необходимо, для отката)
Linux:/nsr/res/nsrdb
Windows (по умолчанию):C:\Program Files\EMC NetWorker\nsr\res\nsrdb - Узел хранения, имя NetWorker для библиотеки и список затронутых узлов, устройств и томов
- Общие сведения о проблеме (конкретные тома, конкретные диски, конкретные узлы и т. д.)
nsrget -o:d на затронутом сервере и узлах.
-o:d на любом хосте с лентами, где ленты заняты записью. Это можно проверить в консоли управления NetWorker Management Console (NMC) в разделе Monitoring ->Devices.
В следующей статье представлена информация о получении и использовании NSRGET: NetWorker. Использование инструмента сбора данных NetWorker NSRGet
2. Проверка готовности библиотеки
- Проверьте, включен ли и готов ли владелец узла хранения затронутой библиотеки:
- В NMC перейдите в раздел Devices ->Storage Nodes.
- Убедитесь, что включен режим просмотра —>диагностики .
- Проверьте столбцы «Включено » и «Готово » на панели справа.
- Если узел хранения, который должен быть включен, на самом деле не включен, нажмите правой кнопкой мыши на этом узле хранения и выберите пункт Включить/Отключить , чтобы включить его.
- Если узел хранения данных не будет готов в течение минуты или двух, необходимо выполнить дальнейшие действия отдельно. библиотека не отвечает, так как ее узел хранения недоступен.
- Проверьте, включена ли затронутая библиотека и готова ли она.
- В NMC перейдите в раздел Devices ->Libraries.
- Убедитесь, что включен режим просмотра —>диагностики .
- Проверьте столбцы «Включено » и «Готово » на панели справа. Если библиотека находится в состоянии готовности , перейдите к разделу [
4]. - Если он не включен, вы можете щелкнуть правой кнопкой мыши по экземпляру библиотеки слева и выбрать «Включить/Отключить», чтобы снова включить его.
- После его включения подождите минуту или две, снова нажмите на контейнер «Библиотеки» и проверьте, появляется ли зеленая галочка в столбце «Готово».
- Если библиотека не готова, нажмите правой кнопкой мыши на экземпляре библиотеки слева, выберите Свойства и на вкладке Общие убедитесь, что значение Порт управления соответствует
scsidev@#.#.#адрес, который вы видите вinquire. - Если порт управления не совпадает, установите для параметра Включенозначение Нет и нажмите кнопку OK. затем повторно введите свойства и измените порт управления в соответствии с
inquireАдрес обнаружен. После обновления порта управления снова измените значение Включено на Да и снова нажмите OK для повторного включения. Подождите минуту или две, чтобы проверить, готова ли библиотека. - Наконец, если после исправления значения Control Port не позволяет библиотеке стать готовой, введите свойства библиотеки в последний раз; на вкладке Дополнительно установите для параметра Уровень трассировки отладки значение 5; Отключите и снова включите , чтобы записать последовательность запуска в журнале управляющей программы в течение двух минут.
При повторном включении библиотеки в разделе [2.2], подтвердите, что nsrlcpd Запускается на нужном узле хранения. Также убедитесь, что он не останавливается и не перезапускается самостоятельно. Если идентификатор процесса (PID) продолжает изменяться, это означает, что процесс остановлен или завершен программным обеспечением или ядром дампа. Также обратите внимание на проблемы с разрешением имен между сервером и узлом хранения, которые могут препятствовать запуску. Имя, которое сервер разрешает для узла, должно совпадать с собственным именем nsrladb узла и именем сервера для узла.
- Дополнительные сведения о поиске и устранении неисправностей ленточной библиотеки см. в разделе Поиск и устранение неисправностей ленточной библиотеки в NetWorker .
- См . руководство по поиску и устранению неисправностей NetWorker. Обработка сбоев и дампов ядра, если вы видите или подозреваете, что
nsrexecd,nsrsnmdилиnsrlcpdявляются сбросом керна.
Подробный обзор процессов NetWorker для каждого хоста см. в следующих статьях: Процессы и порты NetWorker
Сообщения, касающиеся этих служб, регистрируются в daemon.raw.
- Linux:
/nsr/logs/daemon.raw - Windows (по умолчанию):
C:\Program Files\EMC NetWorker\nsr\logs\daemon.raw - NetWorker. Как использовать nsr_render_log для рендеринга файлов .raw журналов
3. Определите быстроту реагирования библиотеки.
Если библиотека не готова и вы не можете определить причину, обратитесь в саму библиотеку:
- Проверьте файл
inquireвывод узла из [1.3] и убедитесь, что библиотека отображается в выходных данных как 'Autochanger', и обратите внимание на SCSI#.#.#Адрес. - Если библиотека не отображается в
inquireoutput, убедитесь, что ОС может его обнаружить. Хосты Solaris не сообщают о библиотеке, если она настроена и включена в NetWorker. Для получения помощи см. раздел Поиск и устранение неисправностей обнаружения ленточной библиотеки в NetWorker. - Убедитесь, что библиотека реагирует на основные библиотечные команды. Использование адреса SCSI в [
3.1], выполните: 'sjisn #.#.#'. Дополнительные сведения о командах тестирования библиотеки см . в разделе Поиск и устранение неисправностей доступа к ленточной библиотеке в NetWorker. - Если команды SJI завершаются сбоем, подумайте о возможных проблемах с транспортом или оборудованием. Для получения помощи см. раздел Поиск и устранение аппаратных проблем ленточной библиотеки в NetWorker .
- Если проблема заключается в том, что ОС не обнаруживает библиотеку и правильно реагирует на команды SJI, NetWorker не удается обнаружить, попробуйте использовать метод
jbconfigи выбор варианта 2; Если это не помогло, попробуйте вариант 4, вручную укажите адрес библиотеки и настройте ее как стандартную библиотеку (вариант 56). Дополнительные сведения см. в разделе Поиск и устранение неисправностей конфигурации ленточной библиотеки в NetWorker .
4. Проверка перемещения ленты и работоспособности тома
Если библиотека готова и отвечает на запросы, но испытывает проблемы с загрузкой томов, это может быть вызвано множеством различных причин.
- Очистите всю библиотеку, если это вообще возможно; Если вы можете остановить другие операции, щелкните правой кнопкой мыши и сбросьте библиотеку на вкладке Устройства ->Библиотеки .
- Попытка загрузить один ленточный картридж в одно устройство, где, как считается, проблемы с загрузкой влияют на оба устройства; Выгружайте после каждой попытки по мере необходимости.
- Сравните с одним и тем же томом на разных дисках и разными томами на диске, который, как считается, подвержен проблеме. Обратите внимание на ошибки и закономерности, если таковые имеются.
- Если загрузка тома стабильно не работает, независимо от устройства, попробуйте выполнить следующую проверку этикетки:
- Загрузка тома без монтажа Если ленточный картридж перемещается без ошибок, вы проверили, что манипулятор исправен механически.
- Запустите
nsrmm -pv -f networker_deviceЕсли в ответе указана метка «Verified», значит, носитель также действителен и исправен. - В свойствах библиотеки при включенном режиме диагностики перейдите на вкладку Таймеры и перед нажатием кнопки ОК установите для параметра Загрузка спящего режимазначение 60.
- Выгрузите том, а затем попытайтесь перезагрузить том. Если это удается, проблема, скорее всего, была связана с синхронизацией времени (можно поэкспериментировать с более низкими значениями спящего режима, пока снова не начнет происходить сбой).
- Если
nsrmmНе удалось выполнить команду, требуется дальнейшее тестирование. Отключите рассматриваемый накопитель в NMC, нажав правой кнопкой мыши и выбрав Включить/Отключить.- Выполните команду
scannerКоманда на устройстве:- Для локального узла хранения сервера NetWorker выполните команду:
scanner -nizv local_device - На "удаленном" узле хранения NetWorker выполните команду:
scanner -s server -nizv local_device
- Для локального узла хранения сервера NetWorker выполните команду:
- Прервать после ~20 строк и проверить сообщение о прочтении метки; Об успешности свидетельствуют
8936:scanner: scanning media_type tape volume_name on device_name. - Если
scannerвозвращает сообщение о неожиданном номере файла, wanted 2, got higher_number произошла потеря данных, скорее всего, из-за сброса SCSI; см. Поиск и устранение неисправностей с перезаписанными метками и сбросами SCSI в NetWorker.
- Выполните команду
- Если
scannerвозвращаетmessage 8945:scanner: Read: -1 bytesОпределите, можно ли прочитать том на других узлах или накопителях, и определите направление проблемы. Если вы обнаружите, что некоторые тома могут быть прочитаны на некоторых узлах, но не могут быть прочитаны на других, а устройство имеет тип LTO-4 или выше, рассмотрите возможность сбоев расшифровки диска. Аппаратное шифрование LTO и NetWorker.
Дополнительные сведения о проверке носителя см. в следующих статьях: Поиск и устранение неисправностей монтирования носителя в NetWorker.
5. Проверка на наличие проблем с упорядочиванием накопителей
Если команды загрузки и монтирования выполняются успешно, а чтение этикеток или простое монтирование не выполняются, проблема может заключаться в неправильном порядке накопителей.
- Очистите всю библиотеку, если это вообще возможно; Если вы можете остановить другие операции, щелкните правой кнопкой мыши и выполните сброс библиотеки в разделе Устройства ->Библиотеки.
- Попытка загрузить один ленточный картридж в одно устройство, где, как считается, проблемы с загрузкой влияют на оба устройства; Выгружайте после каждой попытки по мере необходимости.
- Сравните с одним и тем же томом на разных дисках и разными томами на диске, который, как считается, подвержен проблеме. Обратите внимание на ошибки и закономерности, если таковые имеются.
- Если груз надежно не исправен, попробуйте выполнить следующую проверку этикетки:
Дополнительные сведения о проблемах загрузки библиотеки см. в следующих статьях: Поиск и устранение неисправностей загрузки ленточной библиотеки в NetWorker.
Если все эти тесты не пройдены и вы не продвинулись дальше, обязательно запишите результаты на каждом шаге этой статьи и обратитесь в службу поддержки NetWorker. Четкие детали необходимы для ускорения принятия решений и обеспечения ограничения количества «повторяющихся шагов».