NetWorker: RPC-Fehler auf NetWorker DDBoost-Backupgeräten

Zusammenfassung: Data Domain mit aktiver Sitzung beobachtet Kommunikationsprobleme, die dazu bringen, dass die Data Domain-Geräte in einen veralteten Zustand versetzt werden. Selbst wenn nichts geschrieben wird, enthält es die nicht funktionierende Sitzung und gibt die Sitzungsinformationen, die von der Medienverwaltungsdatenbank verwendet werden, nicht frei. Alle Geräte, die demselben Pool und Speicher-Node zugeordnet sind, können keine weitere Sitzung akzeptieren. Kein Backup- oder Clone-Job wird von den betroffenen Geräten akzeptiert, was zu RPC-Fehlern führt. ...

Dieser Artikel gilt für Dieser Artikel gilt nicht für Dieser Artikel ist nicht an ein bestimmtes Produkt gebunden. In diesem Artikel werden nicht alle Produktversionen aufgeführt.

Symptome

  • Alle Backup-/Clone-Vorgänge auf dem NetWorker-Server blieben einfach im Status "Hängen/In Warteschlange", da sich die DDBOOST-Geräte im Status "Unmounted" befanden und der folgende Fehler in den Aktionsprotokollen angezeigt wird: 
Benutzername und Kennwort für Gerät RPC-Sendevorgang fehlgeschlagen; errno = Defekte Leitung
 
  • Das Backup des Saveset ist aufgrund von nicht behebbaren Fehlern fehlgeschlagen. Dies ist eine der wichtigsten Fehlermeldungen.
  • Data Domain-Geräte werden während des Backupzeitfensters unmountet, obwohl es keine Konnektivitätsprobleme zwischen NetWorker und Data Domain gibt.
  • Beschädigung in der NetWorker-Jobdatenbank, was zu Inkonsistenzen zwischen der NetWorker-Backupanwendung und der Jobdatenbank führt

Ursache

RPC-Fehler auf den Data Domain DDBOOST-Backupgeräten sollten regelmäßig überwacht und Korrekturmaßnahmen ergriffen werden, andernfalls bleiben die Backup-/Clone-Jobs einfach im Wartestatus und selbst wenn nichts geschrieben wird, enthält sie die nicht funktionierende Sitzung und gibt die Sitzungsinformationen, die von der Medienverwaltungsdatenbank verwendet werden, nicht frei.

Lösung

Der Neustart von NetWorker-Services kann in der ersten Instanz durchgeführt werden, und wir könnten feststellen, dass das Problem erneut auftritt, da die zugrunde liegenden RPC-Fehler auf den DDBOOST-Geräten weiterhin bestehen bleiben. 

Timeout-Werte auf den NetWorker-Speicher-Nodes müssen gemäß den Überlegungen zur NetWorker-Backupumgebung und dem NetWorker-Leitfaden zur Geräteoptimierung optimiert werden.

Befolgen Sie auf einem Linux Networker-Speicher-Node die folgenden Schritte, um die entsprechenden TCP Keep Alive-Timeout-Werte wie gezeigt festzulegen.
1. Wechseln Sie zu root: sudo su -
2. Führen Sie die folgenden Befehle aus, um tcp_keepalive Einstellungen zu ändern:
# echo 700 > /proc/sys/net/ipv4/tcp_keepalive_time
# echo 10 > /proc/sys/net/ipv4/tcp_keepalive_intvl
# echo 20 > /proc/sys/net/ipv4/tcp_keepalive_probes
Befolgen Sie auf einem Windows Networker-Speicher-Node die folgenden Schritte, um die entsprechenden TCP Keep Alive Timeout-Werte festzulegen, wie gezeigt:
1. Sichern Sie die Windows-Registrierung, bevor Sie Änderungen vornehmen.
2. Navigieren Sie zu " HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\Tcpip\Parameters ".
3. Erstellen Sie einen neuen REG-DWORD-Eintrag mit dem Namen KeepAliveTime.
4. Geben Sie ihm den Wert Decimal 900000 (15 Minuten) an.
5. Ein Neustart ist erforderlich, um den neuen Wert aktiv zu machen.

HINWEIS: Das zusätzliche TCP-Tuning wird im NetWorker Performance Optimization Planning Guide beschrieben, der über https://www.dell.com/support/home/product-support/product/networker/docs verfügbar ist.

Storage Node NetWorker-Services müssen neu gestartet werden, sobald die oben genannten Parameter definiert sind. Stellen Sie sicher, dass diese Werte über NetWorker-Speicher-Node-Neustarts hinweg konsistent bleiben.

Auch alle Inkonsistenzen in der NetWorker-Backupanwendung in Bezug auf den nsrmmd-Prozess auf dem NetWorker-Speicher-Node müssen durch Ausführen der unten aufgeführten Schritte beseitigt werden.

1. Beenden Sie die NetWorker-Services auf dem Backupserver.

Linux: nsr_shutdown
Windows: net stop nsrexecd /y

2. Benennen Sie die Ordner /nsr/res/jobsdb, /nsr/logs/daemon.raw und /nsr/tmp auf dem NetWorker-Server um.
3. Starten Sie die NetWorker-Services erneut auf dem Backupserver neu. Dadurch werden jetzt die NetWorker-Speichervorgänge neu initialisiert und es werden keine weiteren Werte für das Zurücksetzen der RPC-Verbindung und der Inaktivitätszeitüberschreitung festgestellt.

Linux: systemctl start networker
Windows: net start nsrd

, wenn NMC auf dem NetWorker-Server installiert ist: net start gstd

Artikeleigenschaften
Artikelnummer: 000217738
Artikeltyp: Solution
Zuletzt geändert: 15 Nov. 2023
Version:  2
Antworten auf Ihre Fragen erhalten Sie von anderen Dell NutzerInnen
Support Services
Prüfen Sie, ob Ihr Gerät durch Support Services abgedeckt ist.