NetWorker:NetWorker DDBoost 备份设备上的 RPC 错误

摘要: 具有活动会话的 Data Domain 观察通信问题,从而使 Data Domain 设备进入过时状态。即使没有任何写入内容,它也会保存无法工作的会话,并且不会从介质管理数据库中释放使用的会话信息。与同一池和存储节点关联的所有设备都无法接受任何更多会话;受影响的设备不接受任何备份或克隆作业,从而导致 RPC 错误。

本文适用于 本文不适用于 本文并非针对某种特定的产品。 本文并非包含所有产品版本。

症状

  • 由于 DDBOOST 设备处于卸载状态,并且操作日志中将显示以下错误,因此 NetWorker 服务器上的所有备份/克隆操作都将保持挂起/已排队 状态: 
无法获取设备的用户名和密码;RPC 发送操作失败;errno = 断开管道
 
  • 由于不可恢复的错误导致存储集备份失败是一条重大错误消息。
  • Data Domain 设备在备份窗口期间卸载,但 NetWorker 和 Data Domain 之间没有连接问题。
  • NetWorker 作业数据库中的损坏,导致 NetWorker 备份应用程序与作业数据库之间不一致

原因

应定期监视 Data Domain DDBOOST 备份设备上的 RPC 错误并采取纠正措施,否则备份/克隆作业只是保持在等待状态,即使没有任何写入操作,它也不会保存无法正常工作的会话,并且不会从介质管理数据库中释放使用的会话信息。

解决方案

可以在第一个实例中重新启动 NetWorker 服务,我们可能会注意到,由于 DDBOOST 设备上的底层 RPC 错误仍然存在,因此再次出现此问题。 

NetWorker 存储节点上的超时值必须根据 NetWorker 备份环境注意事项和 NetWorker 设备优化指南进行微调。

在 Linux Networker 存储节点上,按照以下步骤设置相应的 TCP Keep Alive 超时值,如图所示。
1.切换到 root:sudo su -
2。运行以下命令以修改tcp_keepalive设置:
# echo 700 > /proc/sys/net/ipv4/tcp_keepalive_time
# echo 10 > /proc/sys/net/ipv4/tcp_keepalive_intvl
# echo 20 > /proc/sys/net/ipv4/tcp_keepalive_probes
在 Windows Networker 存储节点上,按照以下步骤设置相应的 TCP Keep Alive 超时值,如下所示:
1.在进行更改之前,请备份 Windows 注册表。
2.导航至“ HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\Tcpip\Parameters ”。
3.创建名为“ KeepAliveTime ”的新 REG-DWORD 条目。
4.为其提供十进制值 900000(15 分钟)。
5.需要重新启动才能使新值处于活动状态。

提醒:NetWorker 性能优化规划指南 中详细介绍了其他 TCP 调整,可通过 https://www.dell.com/support/home/product-support/product/networker/docs 获得。

定义上述参数后,必须重新启动存储节点 NetWorker 服务。确保这些值在 NetWorker 存储节点重新启动时保持一致。

此外,还必须通过执行下面提到的步骤来消除 NetWorker 备份应用程序上与 NetWorker 存储节点上的 nsrmmd 进程相关的任何不一致。

1.停止备份服务器上的 NetWorker 服务。

Linux: nsr_shutdown
Windows: net stop nsrexecd /y

2.重命名 NetWorker 服务器上的 /nsr/res/jobsdb 、/nsr/logs/daemon.raw 和 /nsr/tmp 文件夹。
3.在备份服务器上再次重新启动 NetWorker 服务,这将重新初始化 NetWorker 保存操作,不会注意到进一步的 RPC 连接重置和非活动超时值。

Linux: systemctl start networker
Windows: net start nsrd

(如果 NMC 安装在 NetWorker 服务器上): net start gstd

文章属性
文章编号: 000217738
文章类型: Solution
上次修改时间: 15 11月 2023
版本:  2
从其他戴尔用户那里查找问题的答案
支持服务
检查您的设备是否在支持服务涵盖的范围内。