NetWorker: RPC-Fehler auf NetWorker DDBoost-Backupgeräten
Zusammenfassung: Data Domain mit aktiver Sitzung beobachtet Kommunikationsprobleme, die dazu bringen, dass die Data Domain-Geräte in einen veralteten Zustand versetzt werden. Selbst wenn nichts geschrieben wird, enthält es die nicht funktionierende Sitzung und gibt die Sitzungsinformationen, die von der Medienverwaltungsdatenbank verwendet werden, nicht frei. Alle Geräte, die demselben Pool und Speicher-Node zugeordnet sind, können keine weitere Sitzung akzeptieren. Kein Backup- oder Clone-Job wird von den betroffenen Geräten akzeptiert, was zu RPC-Fehlern führt. ...
Symptome
- Alle Backup-/Clone-Vorgänge auf dem NetWorker-Server blieben einfach im Status "Hängen/In Warteschlange", da sich die DDBOOST-Geräte im Status "Unmounted" befanden und der folgende Fehler in den Aktionsprotokollen angezeigt wird:
- Das Backup des Saveset ist aufgrund von nicht behebbaren Fehlern fehlgeschlagen. Dies ist eine der wichtigsten Fehlermeldungen.
- Data Domain-Geräte werden während des Backupzeitfensters unmountet, obwohl es keine Konnektivitätsprobleme zwischen NetWorker und Data Domain gibt.
- Beschädigung in der NetWorker-Jobdatenbank, was zu Inkonsistenzen zwischen der NetWorker-Backupanwendung und der Jobdatenbank führt
Ursache
Lösung
Timeout-Werte auf den NetWorker-Speicher-Nodes müssen gemäß den Überlegungen zur NetWorker-Backupumgebung und dem NetWorker-Leitfaden zur Geräteoptimierung optimiert werden.
Befolgen Sie auf einem Linux Networker-Speicher-Node die folgenden Schritte, um die entsprechenden TCP Keep Alive-Timeout-Werte wie gezeigt festzulegen.2. Führen Sie die folgenden Befehle aus, um tcp_keepalive Einstellungen zu ändern:
# echo 700 > /proc/sys/net/ipv4/tcp_keepalive_time
# echo 10 > /proc/sys/net/ipv4/tcp_keepalive_intvl
# echo 20 > /proc/sys/net/ipv4/tcp_keepalive_probes
2. Navigieren Sie zu " HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\Tcpip\Parameters ".
3. Erstellen Sie einen neuen REG-DWORD-Eintrag mit dem Namen KeepAliveTime.
4. Geben Sie ihm den Wert Decimal 900000 (15 Minuten) an.
5. Ein Neustart ist erforderlich, um den neuen Wert aktiv zu machen.
HINWEIS: Das zusätzliche TCP-Tuning wird im NetWorker Performance Optimization Planning Guide beschrieben, der über https://www.dell.com/support/home/product-support/product/networker/docs verfügbar ist.
Storage Node NetWorker-Services müssen neu gestartet werden, sobald die oben genannten Parameter definiert sind. Stellen Sie sicher, dass diese Werte über NetWorker-Speicher-Node-Neustarts hinweg konsistent bleiben.
Auch alle Inkonsistenzen in der NetWorker-Backupanwendung in Bezug auf den nsrmmd-Prozess auf dem NetWorker-Speicher-Node müssen durch Ausführen der unten aufgeführten Schritte beseitigt werden.
1. Beenden Sie die NetWorker-Services auf dem Backupserver.
Linux: nsr_shutdown
Windows: net stop nsrexecd /y
2. Benennen Sie die Ordner /nsr/res/jobsdb, /nsr/logs/daemon.raw und /nsr/tmp auf dem NetWorker-Server um.
3. Starten Sie die NetWorker-Services erneut auf dem Backupserver neu. Dadurch werden jetzt die NetWorker-Speichervorgänge neu initialisiert und es werden keine weiteren Werte für das Zurücksetzen der RPC-Verbindung und der Inaktivitätszeitüberschreitung festgestellt.
Linux: systemctl start networker
Windows: net start nsrd
, wenn NMC auf dem NetWorker-Server installiert ist: net start gstd