NetWorker: Wartung und Troubleshooting von Mediendatenbanken

Summary: In diesem Artikel werden Methoden zur Identifizierung und Behandlung von Problemen im Zusammenhang mit der Mediendatenbank sowie bewährte Methoden für Wartung und Schutz beschrieben.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

  • Fehler beim Starten von Services.
  • Fehler beim täglichen Serverschutz-Serverbackup-Workflow>.
  • Unvollständige oder irreführende Informationen in Bezug auf Savesets oder Clients, die vom mminfo-Befehl oder beim Abfragen oder Durchsuchen von Savesets in der NetWorker Management Console (NMC)- oder NetWorker Web User Interface (NWUI)-Administration zurückgegeben werden.
  • Backup-, Recovery- oder Cloning-Probleme im Zusammenhang mit der Unfähigkeit, Savesets, Clients oder Volumes zu finden.
  • Fehler im Server-Daemon-Protokoll oder in Konsolen im Zusammenhang mit der Mediendatenbank:
nsrmmdbd WiSS code assertion error (st_nextrec: rec loop detected)
nsrmmdbd error, ss_clone_ensure_clone_eligibility: assertion, invalid parameters or code segment
nsrmmdbd XCHK ssid:saveset_short_ssid host:saveset_hostname name:saveset_name has a fragment with an invalid volid:saveset_volid
nsrmmdbd NSR warning WiSS code assertion error (ST_readvdir: directory read failed)
nsrmmdbd NSR critical Unexpected error reading long record directory: an invalid slot number
nsrmmdbd NSR warning partial record error, ssid: saveset_short_ssid saveset_long_ssid flags:0x00010101 size:0 files:0 tm:datetime cloneid
nsrmmdbd NSR notice media db must be scavenged
nsrmmdbd NSR critical media db scavenge failed
nsrmmdbd NSR warning Cannot scavenge path_to_mmvolume6 (Permission denied) - recover from backup media
nsrmmdbd NSR warning Cannot scavenge path_to_mmvolume6 (unknown error code) - recover from backup media
nsrmmdbd MDB warning can't fetch save set <saveset ID>
nsrmmdbd MDB warning Unable to fetch child save set <saveset ID> for cover set <saveset ID>
  • Plötzlicher Verlust vieler Savesets aus der Mediendatenbank oder plötzlicher sprunghafter Anstieg des verfügbaren freien Speicherplatzes auf der Festplatte.
  • Software kann Savesets nicht ablaufen lassen oder löschen, was zu einem schnellen Storage-Verbrauch führt.

Cause

Wie jede Datenbank kann auch die Mediendatenbank in unterschiedlichem Maße beschädigt werden, wenn es Rückschlüsse auf ihre normalen Vorgänge gibt, z. 
  • Unerwartetes Herunterfahren des nsrmmdbd-Prozesses (Core-Speicherabbild, Systemabsturz, Neustart oder Stromausfall).
  • Unterbrochene Transaktion (Interferenzen mit externer Sicherheitssoftware oder Erschöpfung des Speicherplatzes).
  • Logisches internes Problem (Codefehler oder nicht behandelte Bedingungen).
  • Direkte Interferenz mit Mediendatenbankdateien oder Saveset-Dateien auf einem von NetWorker verwalteten Speicher.
Die Mediendatenbank wird am besten mit den folgenden allgemeinen Praktiken vor Beschädigungen geschützt:
  • Verwenden Sie nach Möglichkeit eine separate, lokale Festplattenpartition für den Ordner nsr/mm, die zum Schutz vor Bedingungen wie Speicherplatzverknappung durch andere Prozesse beiträgt. Diese Partition sollte mindestens dreimal so groß sein wie die Mediendatenbank. eine große Mediendatenbank hätte derzeit 10 GB; Daher sollten 100 GB für jede Installation ausreichen. 
  • Stellen Sie sicher, dass der Serverbackup-Workflow täglich abgeschlossen wird, damit Backups der Mediendatenbank und der kritischen Disaster-Recovery-Ressourcen ( Bootstrap) im Notfall verfügbar sind.
  • Überprüfen Sie den Speicherort von Bootstraps regelmäßig mit dem Befehl mminfo -B .
  • Lassen Sie niemals zu, dass ein anderer NetWorker-Server gleichzeitig auf die Speicher-Volumes des NetWorker-Servers zugreift, da dies zu Datenverlust führen kann.
  • Wenn Antivirensoftware auf dem NetWorker-Server installiert ist, erstellen Sie Ausnahmen für das Verzeichnis /nsr, um zu verhindern, dass die Antivirensoftware NetWorker-Dateien scannt, ändert oder entfernt. 
  • Vermeiden Sie das manuelle Löschen von Dateien im NetWorker-Speicher, um Speicherplatz freizugeben. NetWorker verfügt über täglich ausgeführte Routinen zur Rückgewinnung von Speicherplatz. Wenn diese als fehlgeschlagen betrachtet werden, sollte der Support kontaktiert werden.
  • Im Allgemeinen sollten Sie für die Datenzonenplanung Daten desselben Typs in denselben Pools aufbewahren, um bei Bedarf die Wartung zu erleichtern, z. B. vProxy-Savesets, Dateisystem-Savesets und Oracle-Datenbank-Savesets in separaten Pools.
  • Ignorieren Sie keine Meldungen im Zusammenhang mit Mediendatenbankfehlern – wenden Sie sich an den Support, wenn Sie Bedenken haben.
Beachten Sie die Mediendatenbank und die Storage-Beziehung von NetWorker und schützen Sie Volumes mit dem Flag Scan Needed
  • NetWorker führt den Ablaufprozess täglich als Teil des Serverbackupworkflows aus. Dieser Job berechnet Aufbewahrungen und Abhängigkeiten und lässt Savesets ablaufen, deren Aufbewahrung abgelaufen ist und die keine nicht abgelaufenen abhängigen Elemente haben. Sobald dies abgeschlossen ist, versucht NetWorker, alle abgelaufenen Festplatten-Volume-Savesets zu löschen. Anschließend wird der Speicherplatzrückgewinnungsvorgang für jedes Volume ausgeführt und löscht Saveset-Dateien von Festplattenmedien, die nicht über entsprechende Mediendatenbankeinträge verfügen. Das bedeutet, dass gültige Daten gelöscht werden können, wenn die Mediendatenbank beschädigt wird oder Sie die Datenbank auf einen früheren Zeitpunkt wiederherstellen.
  • Wenn Sie der Meinung sind, dass ein Problem mit Festplatten-Volumes vorliegt, stellen Sie sicher, dass das Volume unmountet und als Scan erforderlich markiert ist, um sicherzustellen, dass gültige Daten nicht gelöscht werden. Dies gilt auch für Volumes nach der Wiederherstellung auf einen vorherigen Point-in-Time (wobei gültige Savesets möglicherweise auf der Festplatte vorhanden sind, die nach dem Recovery-Punkt erstellt wurde, und daher keine Einträge in der wiederhergestellten Datenbank haben). 
  • "Scan Needed" ermöglicht normales Backup, Recovery und/oder Cloning, verhindert jedoch ein normales Ablaufen oder Löschen. Stellen Sie daher sicher, dass es nur zum Schutz von Volumes verwendet wird, von denen angenommen wird, dass sie gefährdet sind, und bei der Rückkehr zum regulären Betrieb entfernt wird. Die Bereitstellung von Volumes muss aufgehoben werden, um dieses Flag festzulegen oder zu entfernen. Es ist üblich, dass Volumes nach der Disaster Recovery des NetWorker-Servers (nsrdr) als "Scan erforderlich" gekennzeichnet werden, um unerwünschten Datenverlust in einem Disaster-Recovery-Szenario zu verhindern.

Resolution

Es gibt mehrere Möglichkeiten, Mediendatenbankprobleme zu überprüfen und zu beheben. Bevor Sie eine dieser Maßnahmen versuchen, erstellen Sie zur Bewertung der Auswirkungen vorher und nachher Berichte, um festzustellen, ob Savesets, Volumes, Clients oder andere Elemente entfernt wurden.
Führen Sie in der Befehlszeile in einem Verzeichnis für Hostausgaben die folgenden Befehle aus, um die Eigenschaften der Mediendatenbank vor und nach dem Verfahren zu vergleichen:
  • mminfo -C mminfo-C_pre.mmi
  • mminfo -X mminfo-X_pre.mmi
  • mminfo -ar "volid,type,location,pool,volume,state,volflags,written,savesets" -q family=disk -xc, > mminfo-vol_pre.mmi
Sobald Sie die Wartung abgeschlossen haben, führen Sie sie erneut in einer separaten Datei (z. B. *_post.mmi) aus und vergleichen Sie die Werte.

nsrim – Täglicher Serverschutz

Jeden Tag wird der Serverschutz-Serverbackup-Workflow > und damit auch die Ablaufaktion ausgeführt. Die Ablaufaktion führt nsrim aus, das native Wartungsdienstprogramm von NetWorker. Dies kann auch direkt ausgeführt werden, kann jedoch je nach Serverauslastung und Mediendatenbankgröße zwischen einigen Minuten und mehreren Stunden dauern:
nsrim -X > nsrim.out 2>&1

Solange dieser Prozess nicht täglich ausgeführt wird, ist es nicht unwahrscheinlich, dass sich dadurch etwas ändert. Überprüfen Sie das Daemon-Protokoll auf den täglichen Abschluss von nsrim .

Service neu starten

Der Neustart der NetWorker-Services erzwingt verschiedene Startprüfungen, die möglicherweise Probleme in Daemon-Protokollfehlermeldungen aufdecken und möglicherweise beheben. Wenn Datenbankprobleme schwerwiegend zu sein scheinen, stellen Sie vor dem Anhalten von Services sicher, dass ausreichend freier Speicherplatz verfügbar ist und die Bootstrap-Speicherorte bekannt sind (Ausgabe mminfo -B). Idealerweise führen Sie zuerst nsrmmdbasm -s nsr/mm/mmvolrel_path > mm.xdr aus, um zu versuchen, eine aktuelle Mediendatenbankkopie zu extrahieren. Erstellen Sie vor dem Neustart der Services eine Kopie des mmvolrel-Ordners, da dieser später möglicherweise für forensische oder Recovery-Zwecke erforderlich ist.

Export und Reimport der Mediendatenbank

Dieser Prozess vermeidet eine vollständige Disaster Recovery, indem nur brauchbare Mediendatenbankdatensätze extrahiert und auf den Server erneut importiert werden, ohne die Services zu beenden. Dies sollte jedoch nur erfolgen, wenn sich der Server im Leerlauf befindet, und sollte niemals mit ausgeführten Jobs versucht werden. Verwenden Sie den vollständigen Pfad anstelle von mmvolrel (der je nach Installation oder Betriebssystem variieren kann).
  1. Bevor Sie beginnen, markieren Sie alle Festplatten-Volumes nach dem Unmounten als Scan erforderlich. Wenn die automatische Medienverwaltung für Geräte eingestellt ist, die Festplatten-Volumes hosten, müssen Sie dies zuerst deaktivieren. Für Band-Volumes ist dieser Schritt nicht erforderlich. 
  2. Führen Sie die in der Präambel beschriebenen mminfo-Befehle aus, um Ihre vorläufigen Berichte vorzubereiten.
  3. Überprüfen Sie die Größe des mmvolrel-Ordners der Mediendatenbank und zeichnen Sie sie auf
  4. Stellen Sie sicher, dass keiner der Prozesse nsrck, nsrrim, nsrmmdbasmausgeführt wird. Wenn sich große, alte oder nicht kürzlich geänderte Dateien im übergeordneten MM-Ordner befinden, z. B. MM [alphanumerisch], verschieben oder löschen Sie sie, sofern sie nicht durch einen Prozess gesperrt sind.
  5. Führen Sie den folgenden Befehl aus, um die Mediendatenbank zu extrahieren: nsrmmdbasm -s mmvolrel > mm.xdr
  6. Vergleichen Sie die Größe der neuen Datei mit der Größe des mmvolrel-Ordners - falls diese ähnlich groß sein soll. Wenn sie winzig ist (4 B oder eine Handvoll KB), ist der Befehl fehlgeschlagen. Wenn er deutlich kleiner ist, wurden möglicherweise beschädigte Datensätze im Rahmen des Prozesses entfernt.
  7. Bereiten Sie den Server auf die Wiederherstellung seiner Mediendatenbank vor, indem Sie das Feld "Serverstatus " in NMC/NWUI auf "Disaster Recovery " festlegen oder nwadmin verwenden.
  8. Stellen Sie die extrahierte Datei direkt aus der Mediendatenbank wieder mit dem Befehl nsrmmdbasm wieder her: nsrmmdbasm -r -2 < mm.xdr
  9. Führen Sie nach Abschluss des Vorgangs dieselbe mminfo wie in der Präambel beschrieben aus und vergleichen Sie die Saveset- und geschriebenen Werte pro Volume, um sicherzustellen, dass alle Volumes vorhanden sind. Ebenso sollten die mminfo -C-Werte identisch sein.
  10. Wenn es Abweichungen gibt, nehmen Sie dies zur Kenntnis und überlegen Sie sorgfältig, wie Sie vorgehen sollen. Wenden Sie sich an den Support, wenn Sie sich von den angezeigten Ergebnissen nicht sicher sind:
    • Für Volumes, die fehlerfrei zu sein scheinen, können Sie das Flag Scan erforderlich entfernen und die Volumes mounten, da keine Gefahr besteht, dass Savesets gelöscht werden, wenn scheinbar keine Savesets aus dem Volume entfernt wurden, sofern die Savesets und geschriebenen Werte konsistent sind. 
    • Volumes, die weniger Savesets oder eine niedrigere geschriebene Gesamtsumme anzeigen, sollten das Flag Scan erforderlich beibehalten und scanner: scanner -i devicename ausführen, um Dateien auf dem Volume, die keine Datensätze mehr haben, erneut einzuführen. Sobald der Scannervorgang für jedes Volume abgeschlossen ist, überprüfen Sie die Saveset-Anzahl erneut und entfernen Sie das Flag Scan erforderlich. Stellen Sie das Volume erneut bereit, sobald Sie sicher sind, dass der Scanner die als fehlend erachteten Savesets ersetzt hat.

nsrdr

Bei der vollständigen Disaster Recovery, die von nsrdr durchgeführt wird, wird nicht nur die Mediendatenbank, sondern auch andere Serverelemente wie die Ressourcendatenbank und die Jobdatenbank wiederhergestellt. Lesen Sie den Leitfaden zu den Best Practices für Server-Disaster-Recovery und -Verfügbarkeit für Ihre Version, bevor Sie versuchen, diesen Vorgang fortzusetzen.
Dieser Befehl setzt voraus, dass die Speicher-Nodes online und erreichbar sind, um abgeschlossen zu werden.
 
HINWEIS: Wenden Sie sich immer an den Support, wenn Sie Fragen oder Bedenken haben, da die Wiederherstellung der Mediendatenbank zu Datenverlust für Festplatten-Volumes führen kann, wenn das Flag Scan erforderlich nicht verwendet wird, um Dateisysteme mit brauchbaren Savesets zu schützen, die möglicherweise aufgrund einer Beschädigung oder der Wiederherstellung auf einen früheren Zeitpunkt keine Mediendatenbankdatensätze aufweisen.

Affected Products

NetWorker

Products

Data Backup & Protection Software, NetWorker Family
Article Properties
Article Number: 000223518
Article Type: Solution
Last Modified: 08 Apr 2024
Version:  1
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.