NetWorker:繁忙的 Linux NetWorker 服务器报告消息“nsrd RPC 严重无法接受客户端连接:打开的文件太多”

Summary: 繁忙的 Linux NetWorker 服务器报告消息“nsrd RPC critical Unable to accept client connection:打开的文件太多”

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

NetWorker 服务器变得无响应,包括:

  • NMC 控制台在进度条处挂起
  • 如果您主要使用 CIFS/NFS 来写入备份,则应使用 nsradmin 命令未返回
  • 如果您主要使用 CIFS/NFS 来写入备份,则应使用 nsrwatch 不返回
  • 客户端断开连接

NetWorker for Linux 服务器上的守护程序启动时的打开文件限制太低。这是因为守护程序在启动时不继承每个进程的限制。使用的限制回退到 1024。这在较大的数据区上可能不够。

Cause

NetWorker 服务器上的打开文件限制太低。

  1. 获取 nsrd 的 PID
$ ps aux | grep nsrd | grep -v grep | grep -v disp | awk '{ print $2; }'
4021
  1. PID 是 中的路径的一部分 /proc/<nsrd_PID>/limits 要使用 cat 命令执行此操作:
    
$ cat /proc/4021/limits
Limit                     Soft Limit           Hard Limit           Units
Max cpu time              unlimited            unlimited            seconds
Max file size             unlimited            unlimited            bytes
Max data size             unlimited            unlimited            bytes
Max stack size            10485760             unlimited            bytes
Max core file size        unlimited            unlimited            bytes
Max resident set          unlimited            unlimited            bytes
Max processes             63833                63833                processes
Max open files            1024                 1024                 files
Max locked memory         32768                32768                bytes
Max address space         unlimited            unlimited            bytes
Max file locks            unlimited            unlimited            locks
Max pending signals       63833                63833                signals
Max msgqueue size         819200               819200               bytes
Max nice priority         0                    0
Max realtime priority     0                    0
$

Resolution

提醒:本文中的说明可在 NetWorker 性能优化和规划指南中找到。请参见 https://www.dell.com/support/product-details/product/networker/docs

 

在 NetWorker 服务启动之前启用以下环境变量,为负载较重的 NetWorker 服务器创建单独的启动脚本:

 

要在完整的作系统级别进行设置:

 

打开文件描述符:将打开的文件描述符参数更改为以下最小值:

  • 8192(小型 NetWorker 环境)
  • 16384(中型 NetWorker 环境)
  • 32768(大型 NetWorker 环境)

小型、中型或大型 NetWorker 服务器的定义可在 NetWorker 性能优化和规划指南中找到。

最大打开文件数

在 Linux NetWorker 服务器上,添加 ulimit -n 8192.bash_profile 文件,然后重新启动当前会话。

要设置每个进程的最小和最大文件描述符,请执行以下作:Red Hat 7、SLES 12、SLES 15

prlimit --pid <pid_of_the_process> --nofile=<min_limit>:<max_limit>
示例:
prlimit --pid 12345 --nofile=1024:4096

要设置每个进程的最小和最大文件描述符,请执行以下作:Red Hat 6

echo -n "Max open files=min_limit:max_limit" > /proc/pid_of_the_process/limits
示例:
echo -n "Max open files=4096:16384" > /proc/1208/limits

TCP 参数

当 NetWorker 服务器在负载繁重的情况下运行时,添加以下 TCP 参数(在服务器应用程序端口上发出许多套接字请求时并发运行):

  • 在 Linux NetWorker 服务器上,在 /etc/sysctl.conf 文件并运行 sysctl --system 命令执行此操作:
    net.ipv4.tcp_fin_timeout = 30
    net.ipv4.ip_local_port_range = 15000 65535
    net.core.somaxconn = 1024
    
    
  • 在 Linux NMC 服务器上,将 file-max值更新为 65536,以便在 NetWorker 服务器负载繁重时确保 Postgres 数据库连接:
    echo 65536 > /proc/sys/fs/file-max
    

Additional Information

Article Properties
Article Number: 000026874
Article Type: Solution
Last Modified: 16 Apr 2025
Version:  5
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.