NetWorker:NetWorker DDBoost 备份设备上的 RPC 错误

Summary: 具有活动会话的 Data Domain 观察通信问题,从而使 Data Domain 设备进入过时状态。即使没有任何写入内容,它也会保存无法工作的会话,并且不会从介质管理数据库中释放使用的会话信息。与同一池和存储节点关联的所有设备都无法接受任何更多会话;受影响的设备不接受任何备份或克隆作业,从而导致 RPC 错误。

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

  • 由于 DDBOOST 设备处于卸载状态,并且操作日志中将显示以下错误,因此 NetWorker 服务器上的所有备份/克隆操作都将保持挂起/已排队 状态: 
无法获取设备的用户名和密码;RPC 发送操作失败;errno = 断开管道
 
  • 由于不可恢复的错误导致存储集备份失败是一条重大错误消息。
  • Data Domain 设备在备份窗口期间卸载,但 NetWorker 和 Data Domain 之间没有连接问题。
  • NetWorker 作业数据库中的损坏,导致 NetWorker 备份应用程序与作业数据库之间不一致

Cause

应定期监视 Data Domain DDBOOST 备份设备上的 RPC 错误并采取纠正措施,否则备份/克隆作业只是保持在等待状态,即使没有任何写入操作,它也不会保存无法正常工作的会话,并且不会从介质管理数据库中释放使用的会话信息。

Resolution

可以在第一个实例中重新启动 NetWorker 服务,我们可能会注意到,由于 DDBOOST 设备上的底层 RPC 错误仍然存在,因此再次出现此问题。 

NetWorker 存储节点上的超时值必须根据 NetWorker 备份环境注意事项和 NetWorker 设备优化指南进行微调。

在 Linux Networker 存储节点上,按照以下步骤设置相应的 TCP Keep Alive 超时值,如图所示。
1.切换到 root:sudo su -
2。运行以下命令以修改tcp_keepalive设置:
# echo 700 > /proc/sys/net/ipv4/tcp_keepalive_time
# echo 10 > /proc/sys/net/ipv4/tcp_keepalive_intvl
# echo 20 > /proc/sys/net/ipv4/tcp_keepalive_probes
在 Windows Networker 存储节点上,按照以下步骤设置相应的 TCP Keep Alive 超时值,如下所示:
1.在进行更改之前,请备份 Windows 注册表。
2.导航至“ HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\Tcpip\Parameters ”。
3.创建名为“ KeepAliveTime ”的新 REG-DWORD 条目。
4.为其提供十进制值 900000(15 分钟)。
5.需要重新启动才能使新值处于活动状态。

提醒:NetWorker 性能优化规划指南 中详细介绍了其他 TCP 调整,可通过 https://www.dell.com/support/home/product-support/product/networker/docs 获得。

定义上述参数后,必须重新启动存储节点 NetWorker 服务。确保这些值在 NetWorker 存储节点重新启动时保持一致。

此外,还必须通过执行下面提到的步骤来消除 NetWorker 备份应用程序上与 NetWorker 存储节点上的 nsrmmd 进程相关的任何不一致。

1.停止备份服务器上的 NetWorker 服务。

Linux: nsr_shutdown
Windows: net stop nsrexecd /y

2.重命名 NetWorker 服务器上的 /nsr/res/jobsdb 、/nsr/logs/daemon.raw 和 /nsr/tmp 文件夹。
3.在备份服务器上再次重新启动 NetWorker 服务,这将重新初始化 NetWorker 保存操作,不会注意到进一步的 RPC 连接重置和非活动超时值。

Linux: systemctl start networker
Windows: net start nsrd

(如果 NMC 安装在 NetWorker 服务器上): net start gstd

Article Properties
Article Number: 000217738
Article Type: Solution
Last Modified: 15 Nov 2023
Version:  2
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.