Solución de problemas de hardware de la biblioteca de cintas en NetWorker
Resumen: El objetivo de este artículo es ayudar a los administradores de soporte y de NetWorker a verificar problemas en el nivel de librería o transporte para descartar problemas en el nivel de host y de aplicación. ...
Síntomas
- No se puede usar la biblioteca de manera confiable para el respaldo de NetWorker
- Recepción de errores o mensajes de ASC / ASCQ / SCSI SENSE en los registros del sistema o de la aplicación
- No se puede detectar la presencia de la biblioteca desde el host de control del robot previsto
- Incapacidad de la biblioteca para pasar al estado Listo en NetWorker
- Errores esporádicos o coherentes al realizar operaciones específicas o aleatorias de la biblioteca
Causa
Si la biblioteca estaba funcionando anteriormente y de repente se produce un problema, considere los posibles cambios que pueden estar obstaculizando las operaciones:
- Cambio de firmware, controlador o configuración de robot, switch o adaptador
- Adición, reemplazo o extracción de hardware de cinta, cartuchos de cinta u otros componentes de la librería
- Cambio de la versión de software de NetWorker, parches del sistema operativo
- Cualquier evento de hardware, como la pérdida de alimentación o el reinicio de cualquier componente en la ruta de datos
- Cualquier actividad que implique abrir la puerta de la biblioteca
Resolución
Para identificar un problema de hardware en una biblioteca de cintas, las operaciones se deben probar en sus niveles más descentralizados. Para aislar el problema, el transporte basado en SCSI se elimina de la ruta de datos para probar las funciones puras de la biblioteca.
Tenga en cuenta que varios componentes de la biblioteca pueden parecer funcionales. La falla de un componente oculto puede impedir que la biblioteca funcione correctamente para las aplicaciones host. Por ejemplo, un robot puede mover volúmenes correctamente, pero su lógica interna puede identificar erróneamente los números de serie de la unidad o perder el rastro de las ubicaciones de los elementos. Es posible que un comando se ejecute correctamente a través de la interfaz web, pero es posible que la biblioteca no pueda iniciar sesión en el switch SAN. Esto puede indicar un problema de GBIC o backplane del lado de destino.
Ejecute las siguientes pruebas básicas para confirmar qué funciones funcionan en cada interfaz. Utilice estas técnicas para intentar la recuperación antes de comunicarse con el proveedor de la biblioteca.
Hardware de librería: panel LCD
Comience a solucionar problemas de la forma más local posible para el robot: para la mayoría de los administradores de bibliotecas, esto significa el panel de visualización en la parte frontal de la unidad de biblioteca. Comenzar en este punto ayuda a excluir problemas específicos del transporte SCSI o de Ethernet o de la GUI web.
- Buscar errores: por lo general, una falla evidente en el almacenamiento se muestra como un código de error en la ventana principal o en un submenú "Alertas" o "Errores". Cualquier problema que se encuentre aquí debe remitirse inmediatamente al proveedor (de lo contrario, puede agravar los daños).
- Pruebe las operaciones básicas en la interfaz de usuario (las mismas que se probaron en la pantalla LCD)
- Mueva un cartucho de cinta de la ranura a la unidad, de la unidad a la unidad, de la unidad a la ranura y de la ranura a la ranura.
- Si existe una ranura o revista de importación y exportación, pruebe las mismas funciones con ellas, utilizando todas las combinaciones de origen y destino, según lo anterior.
- Pruebe la exportación e importación de cartuchos de cinta físicamente desde y hacia la biblioteca.
- Pruebe las funciones de inicialización, inventario y restablecimiento de bibliotecas, si están disponibles.
- Si no se puede quitar un cartucho de cinta de una mano, unidad o ranura robótica, debe quitarlo manualmente de la biblioteca antes de continuar.
- Confirme la presentación de datos:
- Asegúrese de que las ubicaciones de los cartuchos de cinta, los códigos de barras y los estados de las unidades sean correctos.
- Compruebe qué funciones de la biblioteca, si las hay, están activadas y confirme los efectos.
- Las bibliotecas virtuales no tienen pantallas LCD, pero su estado se puede comprobar en el nivel más primitivo en la línea de comandos del dispositivo de almacenamiento que las virtualiza; Al igual que las bibliotecas físicas, es posible que se requiera la asistencia del proveedor, con sus herramientas y conocimientos especializados.
- Para realizar pruebas de bibliotecas de Data Domain, consulte Solución de problemas de visibilidad de destino de VTL
- Para realizar pruebas de la biblioteca de discos de Dell, consulte Solución de problemas de un servidor EDL o Solución de problemas de comunicación entre la aplicación de respaldo (BSP) y EDL
Inteligencia de bibliotecas: interfaz de usuario web
El siguiente nivel de pruebas que está comúnmente disponible es la interfaz web que sirve como interfaz de usuario de la biblioteca. Esta interfaz es común a las bibliotecas de cintas físicas y virtuales, y busca proporcionar acceso completo a la biblioteca y sus funciones.
Este método de prueba omite la ruta de datos SCSI normal, incluidos el adaptador de bus de host (HBA) del host, los switches y los puertos de destino. Envía comandos SCSI directamente desde el servidor web integrado al robot. Como tal, puede no ser una representación fiel de los problemas reales que se encuentran en el uso estándar.
- Como se indicó anteriormente, compruebe la interfaz de usuario para ver si hay alertas, líneas de espera de error o indicaciones dentro de la interfaz. Una vez más, los problemas informados por la biblioteca deben remitirse inmediatamente al proveedor.
- Pruebe las operaciones básicas en la interfaz de usuario como se realizó en la pantalla LCD, si es posible
- Confirme los datos en la interfaz de usuario como se hicieron en la pantalla LCD, incluida la conectividad del host, las ubicaciones de los códigos de barras, los números de serie de las unidades y cualquier otro dato relevante
Servicio de biblioteca - Proveedor:
Si la biblioteca muestra que no hay fallas, pero aparecen problemas de hardware en las capas de switch, transporte o host, póngase en contacto con el proveedor. Pueden solucionar problemas utilizando herramientas y conocimientos especializados. Antes de hacer esto:
- Apague la biblioteca por completo y déjela sin alimentación (e idealmente, desenchufada) durante 5 minutos. Los dispositivos grandes, como las bibliotecas de cintas, necesitan tiempo para que los condensadores se descarguen y eliminen potencialmente las condiciones de mal funcionamiento.
- Organice la actualización del firmware para el robot y las unidades (a menudo esto requiere la ayuda del proveedor de todos modos). Para problemas de hardware, es mejor estar en el código actual.
- Asegúrese de que los cables o las unidades defectuosos se eliminen de la biblioteca. No es raro que un componente que funciona mal afecte a otros; intercambie los componentes sospechosos para probar, si es posible, para aislar aún más el problema.
Información adicional
NetWorker: Solución de problemas de librerías de cintas en NetWorker
El soporte puede proporcionar orientación utilizando los criterios anteriores, pero no tenemos recursos de proveedores de SO, HBA o robótica. Esta limitación puede llevar a una solución de problemas prolongada y fallida.