NetWorker : Dépannage des problèmes d’ordonnancement des lecteurs de la bibliothèque de bandes
Résumé: Cet article décrit un problème bien connu lié aux bibliothèques de bandes dans un environnement SAN, qui entraîne la modification des noms des périphériques par le système d’exploitation, entraînant ainsi des pannes d’application. ...
Symptômes
Dans un système d’exploitation Plug 'N Play, les adresses cibles SCSI sont attribuées aux appareils dans l’ordre de découverte.
Étant donné que l’ordre de découverte des SAN varie et que la perte de connectivité déclenche le remappage Plug-and-Play, les numéros de cibles changent et ne peuvent pas rester fixes.
Plug-and-Play renomme les appareils en fonction de l’ordre d’énumération, de sorte que toute interruption intentionnelle ou accidentelle de la connexion peut entraîner la réattribution de nouveaux noms d’appareils.
Un problème d’ordonnancement des disques décrit une condition dans laquelle le nom du pilote configuré par NetWorker pour un périphérique ne correspond pas au nom réel. Cela est le plus souvent dû à la modification du nom du pilote dans le système d’exploitation après la configuration initiale de la bibliothèque NetWorker. Il s’agit généralement d’un problème de système d’exploitation Plug’N Play qui affecte Windows et Linux.
Ce problème comporte de nombreuses erreurs et conditions, y compris, mais sans s’y limiter :
- Erreur : '
nsrd: media info: failed unloading drive `{driver handle}' to slot {slot number}, error '69'' - Erreur : '
{hostname} the destination component full' - Erreur : '
{driver handle} read open error, no such device or address' - Erreur : '
opening: I/O error' - Erreur : '
nsrd: Jukebox '{jukebox}' failed: expected volume '{volid}' got {volid}' - Erreur : '
nsrd: Jukebox '{jukebox}' failed: expected volume '(volume_name)' got 'NULL'' - Erreur : '
read open error, device not ready' - Erreur : '
nsrjb: Jukebox error, All allocated drives are not usable, unrecoverable operation errors' - Erreur : '
nsrd: Jukebox '{jukebox}' failed: expected volume '{volid}' got {volid}' - Erreur : '
nsrd: Jukebox '{jukebox}' failed: expected volume '{volume}' got 'NULL'' - Erreur : '
read open error, device not ready' - Erreur : '
nsrjb: Jukebox error, All allocated drives are not usable, unrecoverable operation errors' - Erreur : '
nsrd: media warning: {driver handle} reading: read open error: No media in drive.' - Erreur : '
inventory: Bar code label `{barcode}' does not match media db bar code label, updating media db' - Erreur : '
Illegal request, medium not present' - Erreur : '
nsrd: media info: failed unloading drive `{driver handle}' to slot {slot number}'
Cause
NetWorker crée l’objet de bibliothèque lors de la configuration initiale, en liant les lecteurs de bande aux descripteurs de périphérique générés par le système d’exploitation dont ils disposent à ce moment-là. Il s’agit d’une association statique qui reflète la relation au moment de la configuration. Par exemple, une bibliothèque peut avoir deux périphériques :
Lecteur physique 1 = \\.\Tape0 (ou peut-être /dev/nst0 sous Linux)
Disque physique 2 = \\.\Tape1 (ou /dev/nst1Dans
les systèmes Plug-and-Play tels que Windows ou Linux, toute disparition d’appareil, y compris les redémarrages ou les modifications de connectivité, peut obliger le système d’exploitation à renommer les appareils. En particulier sur un SAN, où la découverte des périphériques peut être désordonnée, les périphériques peuvent être nommés différemment lors du redémarrage suivant, par exemple, par opposition aux éléments ci-dessus :
Disque physique 1 = \\.\Tape1 or /dev/nst1
Disque physique 2 = \\.\Tape0 or /dev/nst0
Les commandes envoyées à ces périphériques peuvent toujours fonctionner, en supposant qu’un périphérique utilise le nom souhaité. NetWorker perd la trace des noms de périphériques, car les associations pilote-descripteur de la bibliothèque ne correspondent plus aux éléments physiques une fois que le système d’exploitation a renommé les périphériques. Par exemple, NetWorker peut charger une cartouche de bande sur un lecteur, mais utiliser un nom de périphérique obsolète et incorrect, et émettre des commandes sur le mauvais lecteur après le changement de nom du système d’exploitation. Cela peut entraîner un large éventail d’erreurs, en supposant qu’un volume inattendu (ou aucun volume du tout) soit trouvé. Il existe de nombreuses causes possibles dans les conditions d’ordonnancement des disques :
- Mauvaise configuration manuelle de la bibliothèque à l’aide de
jbconfigoujbeditCommandes - Redémarrage de l’hôte, de l’adaptateur de stockage, du matériel de connectivité de stockage ou des unités de bande
- Perte temporaire de connectivité à un appareil
- Désactivation et réactivation de l’appareil dans le système d’exploitation
- Mises à jour du système d’exploitation
- Mises à jour du pilote de l’adaptateur de stockage ou du périphérique
Résolution
Dénomination persistante :
Il s’agit d’une pratique d’excellence qui peut être recommandée par le support, même si vous ne rencontrez pas de problèmes pour vous protéger proactivement. Utilisez les informations des articles suivants :
- Mise en œuvre de la résilience des applications du nom de l’unité de bande pour Windows
- Mise en œuvre de la résilience des applications du nom de l’unité de bande pour Linux
Informations supplémentaires
Reconfiguration
manuelleSi vous ne pouvez pas activer immédiatement la résilience des applications et reconfigurer votre bibliothèque, plusieurs alternatives manuelles peuvent être envisagées :
- Reconfiguration de NMC : Vous pouvez mettre à jour la configuration de NetWorker à l’aide de l’option Reconfigure de l’instance de bibliothèque pour supprimer les définitions de périphérique pour tous les périphériques concernés, puis en supprimant les instances restantes du lecteur de bandes du conteneur Devices , avant de relancer l’analyse et de la reconfigurer avec les nouveaux noms corrigés.
jbconfigsuivante : Ces commandes font toujours partie de la suite NetWorker, mais elles ne sont plus utilisées et nécessitent des connaissances plus avancées de NetWorker, ainsi que des technologies de transport de stockage et de bibliothèque de bandes.- Pour repartir de zéro, utilisez
jbconfigPour le contrôle manuel de la création de bibliothèque : Configuration manuelle d’une bibliothèque de bandes NetWorker à l’aide de la commande jbconfig
- Pour repartir de zéro, utilisez
- Renommage forcé : Il peut être possible de désactiver ou de supprimer des périphériques et de les lire/réactiver dans l’ordre correspondant à leur configuration actuelle dans NetWorker. Par exemple, dans un scénario Windows simple pour les éléments ci-dessus, il est possible de désactiver les deux périphériques, en réactivant d’abord l’instance configurée en tant que Tape0 dans NetWorker, afin de forcer le système d’exploitation à renommer ce périphérique Tape0. La méthodologie Linux serait similaire, mais en utilisant le fichier /proc/scsi/scsi pour supprimer et analyser à nouveau directement les périphériques.