Solución de problemas de acceso a bibliotecas de cintas en NetWorker
Resumen: El objetivo de este artículo es ayudar al soporte y a los administradores de NetWorker a determinar las causas de la incapacidad de un robot detectado para aceptar comandos.
Síntomas
- No se puede acceder a la instalación detectada de la biblioteca de cintas en el servidor o el nodo de almacenamiento de NetWorker
- No se puede realizar una copia de seguridad de los datos debido a un hardware de copia de seguridad inutilizable
- Errores al acceder al robot:
0x29Device busyThe requested resource is busyStr=<There is an input or output error.>No such deviceNo such file or directoryInappropriate ioctl for device
Causa
Si la biblioteca funcionaba anteriormente y repentinamente no lo está, considere el último cambio conocido como la causa probable:
- Cambio no controlado en la dirección de la biblioteca después del reinicio, el redescubrimiento y el cambio de nombre del dispositivo
- Posibles daños debido a una sobrecarga eléctrica, una interrupción u otro evento ambiental
- Eventos de falla o reconfiguración del hardware de transporte
- Instalación, modificación o eliminación de software o controladores relacionados con el transporte o la robótica
Si la biblioteca nunca funcionó, confirme que el hardware sea compatible con la Guía de compatibilidad de hardware de NetWorker(es necesario iniciar sesión en la cuenta de soporte de Dell). Recuerde que es posible que una biblioteca sea parcialmente funcional; El descubrimiento por sí solo no garantiza la usabilidad ni la compatibilidad.
Resolución
Para solucionar fallas de acceso a la biblioteca, revise los cambios recientes. A continuación, utilice pruebas comparativas básicas y de terceros para confirmar si algún host o proceso puede desencadenar una respuesta del robot.
A veces es deseable probar funciones específicas, sobre la base de la evidencia disponible. Si el host A puede consultar el robot pero el host B no, el robot responde. Es posible que el controlador del host A esté bloqueando el robot. Si el host B sigue recibiendo errores después de quitar la zona de todos los hosts, es posible que el host B tenga un problema con el controlador, la configuración o el software.
Si el anfitrión accedió al robot antes del problema, lo más probable es que los elementos de revisión hayan cambiado. Investigue las fallas o los cambios en la configuración conocidos después del evento.
Después de detectar la librería, utilice los siguientes comandos para probar las operaciones básicas de SCSI mediante el transporte de almacenamiento, no mediante Ethernet ni la interfaz de usuario web. Siempre asegúrese de que los parches del sistema operativo estén actualizados, especialmente en lo que respecta al almacenamiento.
nsrget -o:d en el servidor y los nodos afectados.
-o:d en cualquier host con cintas donde las cintas estén ocupadas escribiendo. Puede comprobar esto desde NetWorker Management Console (NMC) en Monitoring -> Devices.
En el siguiente artículo, se proporciona información sobre cómo obtener y usar NSRGET: NetWorker: Cómo utilizar la herramienta de recolección de datos de NetWorker NSRGet
Acceso a la biblioteca: Sistema operativo:
- Windows: No hay ninguna forma nativa de consultar una biblioteca de cintas en Windows;
mtxes una utilidad gratuita que se puede probar si se desea. Utiliza el identificador del dispositivo del cambiador, en lugar de la dirección SCSI, cuando emite comandos (lo que puede tener implicaciones de prueba).
- Linux: Al igual que Windows, no tiene un comando nativo para consultar, pero también tiene un
mtxpuerto, que requiere el identificador del controlador de dispositivo (nuevamente, diferente de la manera en que NetWorker accede a él).
loaderinfo -f /dev/sg#
mtx -f /dev/sg# inquiry
- Solaris: Solaris incluye la función
sgenCompatibilidad con el controlador para la biblioteca de cintas nativa, pero nomtxport ni existen otros comandos de biblioteca nativos para él. Consulte la sección sobre comandos de NetWorker para probar el acceso a la biblioteca en su lugar (a continuación).
- AIX: AIX no es compatible con bibliotecas de cintas nativas (
lusen su lugar) y no haymtxEl puerto existe para ello. Consulte la sección sobre comandos de NetWorker para probar el acceso a la biblioteca en su lugar (a continuación).
- HP-UX:
mces el comando nativo de HP-UX para la manipulación del cambiador medio:
mc -p $(ioscan FnkC autoch | grep /dev/rac) -r MIDS -q
- NetWorker: Estos comandos funcionan en un nivel relativamente atómico y, aunque el soporte de NetWorker los escribe, compila y prueba, no requieren una instancia de NetWorker en ejecución para funcionar ni ninguna configuración de NetWorker. En general, se consideran utilidades de prueba fiables, de bajo nivel e independientes del software. Para aumentar la depuración de la mayoría de las utilidades, puede agregar las siguientes variables de entorno:
SJI_DEBUG=9LUS_DEBUG=9 (lusdebug ffff on AIX)CDI_DEBUG=9SCSI_DEBUG=9JBDEBUG=9
A continuación, '<changer address>' varía según el sistema operativo:
Windows: Initiator.Target.LUN (según lo revelado por inquire comando) o \\.\changer# Identificador
del controladorLinux: Intiator.Target.LUN (según lo revelado por inquire comando) o /dev/sg# Identificador
del controladorSolaris: /dev/scsi/changer/c#t#d# Maneja el controlador
AIX: Initiator.Target.LUN (según lo revelado por inquire comando)
HP-UX: Initiator.Target.LUN (según lo revelado por inquire comando) o /dev/rac/c#t#d# Manija del controlador
sjirjc <changer address>
Solicita datos del robot, como el número de unidades, las funciones compatibles, etc.
sjisn <changer address>
Solicita al robot información sobre el elemento de accionamiento y el número de serie.
sjirdtag <changer address>
Solicita el cartucho de cinta a los datos de ubicación del elemento
cdi_inq -f <changer driver handle> -v
Solicita datos vitales del producto (requiere el uso de un identificador de controlador)
ielem -a <changer address>
Los intentos de reinicializar elementos pueden ser disruptivos.
Acceso a la biblioteca: Restablecimiento de la biblioteca:
nsrjb -HEvvvvv
Emite un comando de restablecimiento a una biblioteca problemática y fuerza la reinicialización de un elemento.
nsrjb -IIvvvvv
Fuerza una actualización en el objeto de jukebox nsr de NetWorker en función de los códigos de barras informados por la biblioteca y los valores correspondientes en la base de datos de medios.
nsrjb -HH
Obliga al jukebox a descargar todos los volúmenes e intentar un restablecimiento parcial.
ielem -a es un equivalente aproximado de nsrjb -E que no requiere un jukebox nsr funcional en NetWorker.
Transporte: configuración
- Para SAN: Asegúrese de que tanto el robot como el host de control del robot de NetWorker previsto hayan iniciado sesión en el switch correctamente y revise la zonificación del robot para asegurarse de que la conexión de extremo a extremo sea posible.
- Los robots no están destinados a ser accedidos o controlados por más de un host; A menos que sea necesario (por ejemplo, un robot particionado), asegúrese de que solo el host de la controladora del robot de NetWorker previsto esté zonificado para ver el robot.
- Es posible probar los expansores SAS para garantizar que se establezca una conexión robótica; La tecnología punto a punto pura, como SCSI, requiere probar la conexión desde el host correspondiente.
Transporte: hardware
- Si se detectan problemas en el nivel del hardware de transporte o del host, considere probar el switch o el expansor o reemplazar los cables con ejemplos "en buen estado" para descartar problemas de cableado.
- Revise el firmware del hardware de transporte y el firmware del propio robot para obtener moneda.
- Para SCSI, asegúrese de que los terminadores estén correctamente colocados y colocados de manera adecuada, que se respeten los límites de longitud de los cables y que se utilicen los voltajes adecuados.
Transporte de hosts: configuración
- Asegúrese de que el host en cuestión tenga controladores y firmware actualizados para sus controladores de transporte: use
EMCReports(incluido connsrget -o:e). - Asegúrese de que cualquier configuración necesaria del controlador de la tarjeta adaptadora de bus de host (HBA) se realice de manera adecuada para el sistema operativo.
Software de host: bloqueo de recursos
- En cualquier host zonificado para ver el robot (idealmente, solo el host de NetWorker designado), compruebe si hay algún software que pueda intentar acceder al robot, como otro software de respaldo, software de monitoreo o utilidades independientes que puedan intentar acceder al robot.
- Para Solaris 10, no se puede acceder al robot cuando el proceso nsrlcpd de NetWorker está conectado; por lo tanto, puede parecer inaccesible (o incluso indetectable) hasta que se deshabilite la biblioteca en NetWorker (lo que fuerza
nsrlcpddesprenderse y morir). - Si se sospecha que algún proceso que no es de NetWorker bloquea o accede al robot o a cualquier unidad, consulte Solución de problemas de etiquetas sobrescritas y restablecimientos de SCSI en NetWorker para obtener más información sobre la solución de problemas y la identificación.
Si el sistema operativo detecta la librería, pero esta no responde a los comandos, es funcional hasta cierto punto. Es posible que otro proceso o host lo bloquee, que se vea afectado por problemas de transporte o que experimente una falla en el nivel de componente.
Si no se puede determinar que ningún proceso o host accede al robot además del nodo de almacenamiento de NetWorker destinado a controlarlo, consulte Solución de problemas de hardware de la biblioteca de cintas en NetWorker para determinar si hay un problema con el robot en sí.
Información adicional
Asegúrese de comprender que los problemas de robótica que se muestran fuera del alcance de NetWorker como una aplicación (léase: no se puede acceder mediante los métodos estándar del sistema operativo) no están dentro del alcance del soporte de NetWorker.
NetWorker: Solución de problemas de librerías de cintas en NetWorker
El soporte puede proporcionar orientación utilizando los criterios anteriores, pero no tenemos recursos de proveedores de SO, HBA o robótica. Esta limitación puede llevar a una solución de problemas prolongada y fallida.