NetWorker: Mantenimiento y solución de problemas de la base de datos de medios
Summary: En este artículo, se describen métodos para identificar y tratar problemas relacionados con la base de datos de medios, así como prácticas recomendadas para el mantenimiento y la protección. ...
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Symptoms
- Falla al iniciar los servicios.
- Falla del flujo de trabajo diario de respaldo de Server Protection>Server .
- Información incompleta o engañosa relacionada con los savesets o los clientes devueltos por el comando mminfo o cuando se consultan o se navegan savesets en NetWorker Management Console (NMC) o en la administración de la interfaz de usuario web de NetWorker (NWUI).
- Problemas de respaldo, recuperación o clonación relacionados con la incapacidad de localizar savesets, clientes o volúmenes.
- Errores en el registro del demonio del servidor o en las consolas relacionados con la base de datos de medios:
nsrmmdbd WiSS code assertion error (st_nextrec: rec loop detected)
nsrmmdbd error, ss_clone_ensure_clone_eligibility: assertion, invalid parameters or code segment
nsrmmdbd XCHK ssid:saveset_short_ssid host:saveset_hostname name:saveset_name has a fragment with an invalid volid:saveset_volid
nsrmmdbd NSR warning WiSS code assertion error (ST_readvdir: directory read failed)
nsrmmdbd NSR critical Unexpected error reading long record directory: an invalid slot number
nsrmmdbd NSR warning partial record error, ssid: saveset_short_ssid saveset_long_ssid flags:0x00010101 size:0 files:0 tm:datetime cloneid
nsrmmdbd NSR notice media db must be scavenged
nsrmmdbd NSR critical media db scavenge failed
nsrmmdbd NSR warning Cannot scavenge path_to_mmvolume6 (Permission denied) - recover from backup media
nsrmmdbd NSR warning Cannot scavenge path_to_mmvolume6 (unknown error code) - recover from backup media
nsrmmdbd MDB warning can't fetch save set <saveset ID>
nsrmmdbd MDB warning Unable to fetch child save set <saveset ID> for cover set <saveset ID>
- Pérdida repentina de muchos savesets de la base de datos de medios o un salto repentino en el espacio libre disponible de almacenamiento en disco.
- El software no puede caducar ni eliminar savesets, lo que provoca un consumo de almacenamiento rápido.
Cause
Al igual que cualquier base de datos, la base de datos de medios puede dañarse en diversos grados cuando hay alguna inferencia con sus operaciones normales, como:
- Apagado inesperado del proceso nsrmmdbd (volcado de núcleo, bloqueo del sistema, reinicio o pérdida de alimentación).
- Transacción interrumpida (interferencia de software de seguridad externa o agotamiento del espacio de disco).
- Problema lógico interno (error de código o condiciones no controladas).
- Interferencia directa con archivos de bases de datos de medios o archivos de savesets en el almacenamiento administrado por NetWorker.
- Si es posible, utilice una partición de disco local separada para la carpeta nsr/mm, lo que ayuda a protegerse contra condiciones como el agotamiento del espacio de disco por otros procesos. Esta partición debe ser al menos 3 veces el tamaño de la base de datos de medios; una gran base de datos de medios de comunicación sería actualmente de 10 GB; por lo tanto, 100 GB deberían ser suficientes para cualquier instalación.
- Asegúrese de que el flujo de trabajo de respaldo del servidor se complete diariamente, de modo que los respaldos de la base de datos de medios y los recursos críticos de recuperación ante desastres (el bootstrap) estén disponibles en caso de un desastre.
- Verifique periódicamente la ubicación de los bootstraps con el comando mminfo -B .
- Nunca permita que otro NetWorker Server acceda simultáneamente a los volúmenes de almacenamiento de NetWorker Server, ya que esto puede provocar la pérdida de datos.
- Si el software antivirus está instalado en NetWorker Server, cree exclusiones para el directorio /nsr a fin de evitar que el software antivirus escanee, modifique o elimine archivos de NetWorker.
- Evite eliminar manualmente cualquier archivo en el almacenamiento de NetWorker para intentar liberar espacio. NetWorker tiene rutinas de recuperación de espacio que se ejecutan a diario y se debe comunicar con el soporte si se considera que están fallando.
- En general, para la planificación de zonas de datos, mantenga los datos del mismo tipo en los mismos pools para facilitar el mantenimiento cuando sea necesario, como savesets de vProxy, savesets del sistema de archivos y savesets de base de datos Oracle en pools separados.
- No ignore los mensajes relacionados con errores de la base de datos de medios; póngase en contacto con el soporte si tiene dudas.
- NetWorker ejecuta el proceso de vencimiento diariamente como parte del flujo de trabajo de respaldo del servidor. Este trabajo calcula las retenciones y las dependencias, y vence los savesets que están más allá de su retención y no tienen dependientes no vencidos. Una vez que se completa esto, NetWorker intenta eliminar todos los savesets de volumen de disco vencidos. Después de esto, se ejecuta la operación de recuperación de espacio para cada volumen y se eliminan los archivos de saveset de los medios de disco que no tienen entradas correspondientes en la base de datos de medios. Esto significa que si la base de datos de medios se daña o si recupera la base de datos a un punto en el tiempo anterior, se pueden eliminar datos válidos.
- Si cree que hay un problema con algún volumen de disco, para asegurarse de que no se eliminen datos válidos, asegúrese de que el volumen esté desmontado y marcado como Scan Needed. Esto también se aplica a los volúmenes después de la recuperación a un punto en el tiempo anterior (donde pueden existir savesets válidos en el disco creado después del punto de recuperación y, por lo tanto, no tener entradas en la base de datos recuperada).
- Scan Needed permite el respaldo, la recuperación o la clonación normales, pero evita el vencimiento o la eliminación normales, por lo que debe asegurarse de que se utilice solo para proteger volúmenes que se perciban como en peligro y se eliminen cuando se reanuden las operaciones normales. Los volúmenes deben estar desmontados para establecer o eliminar esta marca. Es común que los volúmenes se marquen como "scan needed" después de la recuperación ante desastres de NetWorker Server (nsrdr), para evitar una pérdida de datos no deseada en un escenario de recuperación ante desastres.
Resolution
Hay varias maneras de intentar verificar y corregir los problemas de la base de datos de medios. Antes de intentar cualquiera de estos, para evaluar los impactos, cree informes antes y después para ver si se eliminaron savesets, volúmenes, clientes o cualquier otra cosa.
En la línea de comandos, en un directorio para alojar salidas, ejecute los siguientes comandos para comparar las propiedades de la base de datos de medios antes y después del procedimiento:
A menos que este proceso no se ejecute diariamente, es poco probable que esto cambie algo. Revise el registro del demonio para la finalización diaria de nsrim .
Este comando espera que los nodos de almacenamiento estén en línea y localizables para completarse.
En la línea de comandos, en un directorio para alojar salidas, ejecute los siguientes comandos para comparar las propiedades de la base de datos de medios antes y después del procedimiento:
- mminfo -C mminfo-C_pre.mmi
- mminfo -X mminfo-X_pre.mmi
- mminfo -ar "volid,type,location,pool,volume,state,volflags,written,savesets" -q family=disk -xc, > mminfo-vol_pre.mmi
nsrim: protección diaria del servidor
Cada día se ejecuta el flujo de trabajo de respaldo del servidor de protección > del servidor y, con él, la acción de vencimiento. La acción de vencimiento ejecuta nsrim, que es la utilidad de mantenimiento nativa de NetWorker. Esto también se puede ejecutar directamente, pero puede tardar entre varios minutos y varias horas, según la carga del servidor y el tamaño de la base de datos de medios:
nsrim -X > nsrim.out 2> y 1
A menos que este proceso no se ejecute diariamente, es poco probable que esto cambie algo. Revise el registro del demonio para la finalización diaria de nsrim .
Reinicio del servicio
El reinicio de los servicios de NetWorker fuerza varias comprobaciones de inicio que pueden exponer problemas en los mensajes de error del registro del demonio y, potencialmente, corregir algunos. Antes de detener los servicios, si los problemas de la base de datos parecen ser graves, asegúrese de que haya suficiente espacio libre disponible y de que se conozcan las ubicaciones de bootstrap (salida mminfo -B). Idealmente, ejecute nsrmmdbasm -s nsr/mm/mmvolrel_path > mm.xdr primero para intentar extraer una copia actual de la base de datos de medios. Antes de reiniciar los servicios, cree una copia de la carpeta mmvolrel, ya que puede ser necesaria para fines forenses o de recuperación más adelante.Exportación y reimportación de la base de datos de medios
Este proceso evita una recuperación ante desastres completa, ya que solo extrae registros de la base de datos de medios viables y los vuelve a importar al servidor sin detener los servicios. Sin embargo, esto solo se debe hacer cuando el servidor está inactivo y nunca se debe intentar con trabajos en ejecución. Utilice la ruta completa en lugar de mmvolrel (que puede variar según la instalación o el sistema operativo)- Antes de comenzar, marque todos los volúmenes de disco como Scan Needed después del desmontaje. Si la administración automática de medios está configurada para dispositivos que alojan volúmenes de disco, primero debe deshabilitarla. Los volúmenes de cinta no necesitan este paso.
- Ejecute los comandos mminfo que se describen en el preámbulo para preparar los informes preliminares.
- Compruebe el tamaño de la carpeta y el registro mmvolrel de la base de datos de medios
- Asegúrese de que ninguno de los procesos nsrck, nsrim, nsrmmdbasmesté en ejecución; Si hay archivos grandes, antiguos o no modificados recientemente en la carpeta principal de MM como mm[alphanumerics], muévalos o elimínelos si no están bloqueados por ningún proceso.
- Ejecute el comando para extraer la base de datos de medios: nsrmmdbasm -s mmvolrel > mm.xdr
- Compare el tamaño del nuevo archivo con el tamaño de la carpeta mmvolrel, si debe tener un tamaño similar. Si es pequeño (4 B o un puñado de KB), el comando falló. Si es significativamente menor, es posible que se hayan eliminado registros dañados como parte del proceso.
- Prepare el servidor para recuperar su base de datos de medios mediante la configuración del campo de estado del servidor en recuperación ante desastres en NMC/NWUI o mediante nwadmin.
- Recupere directamente desde el archivo de extracción de la base de datos de medios mediante el comando nsrmmdbasm nuevamente: nsrmmdbasm -r -2 < mm.xdr
- Una vez que haya finalizado, ejecute el mismo mminfo que se describe en el preámbulo y compare los valores escritos y del saveset por volumen, asegurándose de que todos los volúmenes estén presentes; del mismo modo, los valores mminfo -C deben ser idénticos.
- Si hay alguna disparidad, tome nota y considere cuidadosamente cómo proceder, y póngase en contacto con el soporte si no está seguro de los resultados que ve:
- Para los volúmenes que parecen estar en buen estado, puede quitar la marca Scan Needed y montar los volúmenes, ya que no debería haber peligro de eliminación de savesets si no parece que se hayan eliminado savesets del volumen si los savesets y los valores escritos son coherentes.
- Los volúmenes que muestran menos savesets o un total escrito menor deben dejar la marca Scan Needed en su lugar y ejecutar scanner: scanner -i devicename para volver a introducir los archivos que se encuentran en el volumen y que ya no tienen registros. Una vez que se haya completado el análisis para cada volumen, vuelva a comprobar el conteo de savesets y quite la marca Scan Needed. Vuelva a montar el volumen una vez que esté seguro de que el escáner reemplazó los savesets que se espera que falten.
nsrdr
La recuperación ante desastres completa realizada por nsrdr recupera no solo la base de datos de medios, sino también otros elementos del servidor, como la base de datos de recursos y la base de datos de trabajos. Consulte la Guía de prácticas recomendadas de disponibilidad y recuperación ante desastres del servidor para obtener su versión antes de intentar continuar con esto.Este comando espera que los nodos de almacenamiento estén en línea y localizables para completarse.
NOTA: Siempre póngase en contacto con el soporte si tiene alguna pregunta o inquietud, ya que la recuperación de la base de datos de medios puede provocar la pérdida de datos de los volúmenes de disco si la marca Scan Needed no se utiliza para proteger sistemas de archivos con savesets viables que pueden no tener registros de bases de datos de medios debido a daños o la recuperación a un punto en el tiempo anterior.
Affected Products
NetWorkerProducts
Data Backup & Protection Software, NetWorker FamilyArticle Properties
Article Number: 000223518
Article Type: Solution
Last Modified: 08 Apr 2024
Version: 1
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.