Поиск и устранение неисправностей доступа к ленточной библиотеке в NetWorker
Сводка: Эта статья предназначена для помощи службе поддержки и администраторам NetWorker в определении причин неспособности обнаруженного робота принимать команды.
Симптомы
- Не удается получить доступ к обнаруженной установке ленточной библиотеки на узле хранения NetWorker или на сервере
- Не удается выполнить резервное копирование данных из-за непригодного для использования оборудования для резервного копирования
- Ошибки доступа к роботу:
0x29Device busyThe requested resource is busyStr=<There is an input or output error.>No such deviceNo such file or directoryInappropriate ioctl for device
Причина
Если библиотека работала ранее, а потом внезапно перестала работать, рассмотрите последнее известное изменение как вероятную причину:
- Необработанное изменение адреса библиотеки после перезагрузки, повторного обнаружения и переименования устройства
- Возможные повреждения из-за скачка напряжения, отключения или другого экологического события
- События сбоя или изменение конфигурации транспортного оборудования
- Установка, изменение или удаление программного обеспечения или драйверов, связанных с транспортом или робототехникой
Если библиотека никогда не работала, убедитесь, что оборудование поддерживается в руководстве по совместимости оборудования NetWorker(требуется учетная запись службы поддержки Dell). Помните, что библиотека может быть частично функциональной; Обнаружение само по себе не гарантирует удобства использования или поддержки.
Разрешение
Для поиска и устранения сбоев доступа к библиотеке просмотрите последние изменения. Затем используйте базовые и сторонние сравнительные тесты, чтобы подтвердить, может ли какой-либо хост или процесс вызвать реакцию робота.
Иногда желательно протестировать конкретные функции, основываясь на имеющихся доказательствах. Если хост A может запросить робота, а хост B нет, робот отвечает. Возможно, водитель хоста A блокирует робота. Если хост B по-прежнему получает ошибки после того, как все хосты не зонированы, возможно, проблема связана с драйвером, конфигурацией или программным обеспечением.
Если хост обращался к роботу до возникновения проблемы, то, скорее всего, элементы проверки изменились. Изучение сбоев или известных изменений конфигурации после события.
После обнаружения библиотеки используйте следующие команды для тестирования основных операций SCSI по транспортному каналу хранилища, а не по Ethernet или веб-интерфейсу пользователя. Всегда следите за тем, чтобы исправления операционной системы были обновлены, особенно касающиеся системы хранения данных.
nsrget -o:d на затронутом сервере и узлах.
-o:d на любом хосте с лентами, где ленты заняты записью. Это можно проверить в консоли управления NetWorker Management Console (NMC) в разделе Monitoring -> Devices.
В следующей статье представлена информация о получении и использовании NSRGET: NetWorker. Использование инструмента сбора данных NetWorker NSRGet
Доступ к библиотеке: Операционная система:
- Windows: В Windows отсутствует собственный способ запроса ленточной библиотеки;
mtx- это бесплатная утилита, которую при желании можно протестировать. Он использует дескриптор устройства изменения, а не адрес SCSI при выдаче команд (что может иметь последствия для тестирования).
- Linux: Как и Windows, не имеет встроенной команды для запроса, но также имеет команду
mtxпорт, для которого требуется дескриптор драйвера устройства (опять же, отличается от того, как NetWorker обращается к нему).
loaderinfo -f /dev/sg#
mtx -f /dev/sg# inquiry
- Solaris: Solaris включает в себя
sgenДрайвер для встроенной поддержки ленточных библиотек, но нетmtxport и для него не существует других собственных библиотечных команд. Вместо этого см. раздел о командах NetWorker для тестирования доступа к библиотеке (ниже).
- AIX: AIX не имеет встроенной поддержки ленточных библиотек (
lusвместо этого используется), и нетmtxДля него существует порт. Вместо этого см. раздел о командах NetWorker для тестирования доступа к библиотеке (ниже).
- HP-UX:
mc- это встроенная команда HP-UX для работы с устройством смены носителей:
mc -p $(ioscan FnkC autoch | grep /dev/rac) -r MIDS -q
- NetWorker. Эти команды функционируют на относительно атомарном уровне, и, хотя они написаны, скомпилированы и протестированы службой поддержки NetWorker, для их работы не требуется ни запущенный экземпляр NetWorker, ни какая-либо конфигурация NetWorker. В целом, они считаются надежными, низкоуровневыми, программно-независимыми утилитами тестирования. Чтобы увеличить отладку для большинства утилит, можно добавить следующие переменные среды:
SJI_DEBUG=9LUS_DEBUG=9 (lusdebug ffff on AIX)CDI_DEBUG=9SCSI_DEBUG=9JBDEBUG=9
В приведенном ниже тексте «<changer address>' зависит от операционной системы:
Windows: Initiator.Target.LUN (как было выявлено из inquire command) или \\.\changer# Дескриптор драйвера
Linux: Intiator.Target.LUN (как было выявлено из inquire command) или /dev/sg# ручка
драйвера Solaris: /dev/scsi/changer/c#t#d# Дескриптор драйвера
AIX: Initiator.Target.LUN (как было выявлено из inquire команда)
HP-UX: Initiator.Target.LUN (как было выявлено из inquire command) или /dev/rac/c#t#d# Ручка драйвера
sjirjc <changer address>
Запрашивает данные от робота, такие как количество дисков, поддерживаемые функции и так далее.
sjisn <changer address>
Запрашивает у робота информацию об элементе привода и серийном номере.
sjirdtag <changer address>
Запрашивает данные о расположении ленточного картриджа к элементу
cdi_inq -f <changer driver handle> -v
Запрашивает важные данные о продуктах (требуется использование дескриптора драйвера)
ielem -a <changer address>
Попытки повторной инициализации элементов - могут привести к прерыванию работы.
Доступ к библиотеке: Сброс библиотеки:
nsrjb -HEvvvvv
Выдает команду сброса проблемной библиотеке и принудительно выполняет повторную инициализацию элемента.
nsrjb -IIvvvvv
Принудительное обновление объекта музыкального автомата NetWorker nsr на основе штрихкодов, сообщаемых библиотекой, и соответствующих значений в базе данных мультимедиа.
nsrjb -HH
Принудительная выгрузка всех томов музыкального автомата и попытка мягкого сброса.
ielem -a является грубым эквивалентом nsrjb -E для этого не требуется функциональный музыкальный автомат nsr в NetWorker.
Транспорт — конфигурация
- Для SAN: Убедитесь, что робот и нужный хост управления роботом NetWorker правильно вошли в коммутатор, и проверьте зонирование для робота, чтобы убедиться, что сквозное подключение возможно.
- Роботы не предназначены для доступа или управления более чем одним хостом; Если в этом нет необходимости (например, в разделенном роботе), убедитесь, что только предполагаемый хост контроллера робота NetWorker зонирован для просмотра робота.
- Можно протестировать расширители SAS, чтобы убедиться, что роботизированное соединение установлено; Чисто двухточечная технология, такая как SCSI, требует тестирования соединения с соответствующего хоста.
Транспорт — оборудование
- При обнаружении проблем на уровне хоста или транспортного оборудования рассмотрите возможность тестирования коммутатора или модуля расширения либо замены кабелей на заведомо исправные образцы, чтобы исключить проблемы с кабелями.
- Ознакомьтесь с прошивкой транспортного оборудования, и прошивкой самого робота на предмет валюты.
- Для SCSI убедитесь, что терминаторы правильно установлены и плотно зафиксированы, соблюдаются ограничения по длине кабеля и используются надлежащие напряжения.
Транспорт хоста — конфигурация
- Убедитесь, что на соответствующем хосте установлены актуальные драйверы и микропрограммы для транспортных драйверов — используйте
EMCReports(в комплекте сnsrget -o:e). - Убедитесь, что все необходимые настройки драйверов адаптера главной шины (HBA) выполнены надлежащим образом в операционной системе.
ПО хоста — блокировка ресурсов
- Для любого хоста, который зонирован для наблюдения за роботом (в идеале - только назначенный хост NetWorker), проверьте наличие любого программного обеспечения, которое может попытаться получить доступ к роботу, такого как другое программное обеспечение для резервного копирования, программное обеспечение для мониторинга или автономные утилиты, которые могут попытаться получить доступ к роботу.
- В Solaris 10 робот недоступен при подключении процесса nsrlcpd NetWorker; таким образом, она может казаться недоступной (или даже необнаруживаемой) до тех пор, пока библиотека в NetWorker не будет отключена (принудительное
nsrlcpdотделиться и умереть). - Если какой-либо процесс, не относящийся к NetWorker, подозревается в блокировке или доступе к роботу или любому накопителю, см. раздел Устранение неполадок с перезаписанными метками и сбросами SCSI в NetWorker для получения дополнительной информации об устранении неполадок и идентификации.
Если операционная система обнаруживает библиотеку, но она не реагирует на команды, она в некоторой степени работоспособна. Возможно, он заблокирован другим процессом или хостом, подвержен проблемам транспортировки или в нем произошел сбой на уровне компонента.
Если не удается определить, что ни один процесс или хост не имеет доступа к роботу, кроме узла хранения NetWorker, предназначенного для управления роботом, обратитесь к статье Устранение неполадок оборудования ленточной библиотеки в NetWorker , чтобы определить, есть ли проблема с самим роботом.
Дополнительная информация
Убедитесь, что вы понимаете, что проблемы робототехники, которые не входят в область применения NetWorker как приложения (читай: не могут быть доступны с помощью стандартных методов операционной системы), не входят в область поддержки NetWorker.
Networker: Поиск и устранение неисправностей ленточной библиотеки в NetWorker
Служба поддержки может предоставить рекомендации, используя указанные выше критерии, но мы не располагаем ресурсами по ОС, HBA или поставщикам робототехнических средств. Это ограничение может привести к длительному и неудачному поиску и устранению неисправностей.