NetWorker:如何使用 nsrwatch 实用程序对 NetWorker 中的服务响应问题进行故障处理
Summary: nsrwatch 实用程序允许对存在指示核心 NetWorker 进程可能无响应的症状的问题进行故障处理。
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Instructions
NetWorker 服务器安装软件包提供了称为 nsrwatch 的命令行实用程序。nsrwatch 命令用于监视和操作 NetWorker 服务器。它还可用于对无响应或意外占用系统资源的 NetWorker 进程进行故障处理。使用 nsrwatch 实用程序不是对 NetWorker 中的服务响应问题进行故障处理的第一步。只有在排除了更可能的服务原因或与性能相关的问题后,才应使用它:
首先检查:
- 支持 NetWorker 数据区的所有元素。
- 请参阅 elab navigator 上的兼容性指南: https://elabnavigator.dell.com/eln/modernHomeAutomatedTiles?page=NetWorker
- 请参阅戴尔支持站点上提供的特定于版本的《NetWorker 性能和优化指南》: https://www.dell.com/support/product-details/product/networker/overview
- 在部署了远程 NetWorker 存储节点的环境中。存储节点的 NetWorker 版本必须与 NetWorker 服务器的 NetWorker 版本匹配。
- NetWorker 服务器上没有磁盘空间问题。
- Linux:
df -Th
-
- Windows:通过 Windows 文件资源管理器 或 磁盘管理检查磁盘空间使用情况。
- NetWorker 服务器上的可用资源(CPU、RAM 等)在高峰时段不会耗尽。
- Linux:
top
-
- Windows:任务管理器 或 Perfmon
- NetWorker:按进程对内存或 CPU 使用率高的问题进行故障处理
- Windows:任务管理器 或 Perfmon
- 操作系统日志中没有重大错误
- Linux:/var/log/messages
- Windows:事件查看器 (应用程序 和 系统 事件日志)
- 所有标准 NetWorker 操作都存在此问题,不是更具体的问题,例如: 备份到一个存储节点,仅克隆操作受影响,等等。
- 已在 NetWorker 服务器上的操作系统级别启用核心转储生成,并且没有进程核心转储。
- NetWorker 性能和优化规划:
提醒:有关详细信息,请参阅特定于版本的《NetWorker 性能和优化规划指南》。本指南可在戴尔支持网站 https://www.dell.com/support/product-details/product/networker/docs 上找到。
-
- 有足够的目标卷可用于 NetWorker 备份。
- 在 Linux NetWorker 服务器上定义了足够的打开文件描述符。请参阅:NetWorker 内核参数要求
- 已应用性能优化设置和参数。
- NetWorker 服务器满足此大小的数据区的最低要求。请参阅:系统组件。
- 对于大型数据区,NMC 服务器与 NetWorker 服务器位于不同的计算机上。请参阅:NetWorker 服务器和 NetWorker 管理控制台的内存要求
- 已根据 《安全配置指南》正确设置端口范围 ,https://www.dell.com/support/product-details/product/networker/docs
nsrwatch 命令行选项:
| 选项 | 功能 |
| -c 计数 | 检测响应问题期间要执行的核心转储数。(服务或流程可用性或响应) |
| -d 分隔符 | 用于原始输出的可选分隔符 |
| -g dir | 生成核心转储以及到给定目录的堆栈跟踪。 |
| -i 间隔 | 服务器查询之间的间隔(以秒为单位) |
| -k 间隔 | 堆栈跟踪日志记录之间的间隔(以秒为单位) |
| -n 计数 | 要生成的最大核心转储数 |
| -p 程序[:version] | 带有可选版本的 RPC 程序名称;例如:nsrd、nsrjobd、nsrmmdbd、nsrmmd:405 |
| -S dir | (仅限 Windows)符号程序数据库 (PDB) 文件的路径 |
| -t 阈值 | nsrwatch 报告响应能力问题之前的阈值(以秒为单位)。 |
| -u 阈值 | nsrwatch 报告高 CPU 利用率之前的 %CPU 中的阈值 |
| -v | 在记录堆栈跟踪时包含其他上下文。 |
Windows OS:如何使用 nsrwatch 对明显的 NetWorker 服务或进程问题进行故障处理:
- 在 NetWorker 服务器上安装适用于 Windows 的调试工具
- 确保cdb.exe位于 Windows PATH 变量
中。必须打开新的命令提示符窗口才能使此更改生效。不需要重新启动。
- 您的 NetWorker 版本的符号文件(pdb 文件)必须可用。Dell NetWorker 支持可以提供这些内容。
- 运行 nsrwatch 并保持运行状态,等待服务或进程条件。
例如:E:\Symbols 是部署 pdb 文件的路径。
C:\>nsrwatch -p nsrd -i 10 -t 10 -k 10 -S E:\Symbols > E:\Logs\nsrwatch.nsrd 2>&1 C:\>nsrwatch -p nsrexecd -i 10 -t 10 -k 10 -S E:\Symbols > E:\Logs\nsrwatch.nsrexecd 2>&1 C:\>nsrwatch -p nsrmmdbd -i 10 -t 10 -k 10 -S E:\Symbols > E:\Logs\nsrwatch.nsrmmdbd 2>&1 C:\>nsrwatch -p nsrjobd -i 10 -t 10 -k 10 -S E:\Symbols > E:\Logs\nsrwatch.nsrjobd 2>&1
要收集的日志:
- 渲染daemon.raw
- daemon.raw
- 相关守护程序的 nsrwatch 输出(如上所述)。
- 系统和应用程序事件日志
Linux 操作系统:如何使用 nsrwatch 对明显的 NetWorker 服务或进程问题进行故障处理:
- 安装未条带的二进制文件,以替换感兴趣的进程的标准二进制文件:通常是 nsrd、nsrjobd、nsrmmdbd 和 nsrexecd。这些可以通过戴尔 NetWorker 支持提供。
- 这需要首先关闭 NetWorker。他们必须具有正确的权限。
- 运行 nsrwatch 并保持运行状态,等待服务或进程问题。
nsrwatch -p nsrd -i 30 -t 30 -k 30 > nsrd_out nsrwatch -p nsrexecd -i 30 -t 30 -k 30 > nsrexecd_out nsrwatch -p nsrjobd -i 30 -t 30 -k 30 > nsrjobd_out nsrwatch -p nsrmmdbd -i 30 -t 30 -k 30 > nsrmmdbd_out
要收集的日志:
- 渲染daemon.raw
- daemon.raw
- 相关守护程序的 nsrwatch 输出。
- 操作系统消息文件 (/var/log/messages)
- 确保检查 /var/log/messages 文件,并确保日志涵盖整个 nsrwatch 窗口。如果服务器上存在大量活动,则消息日志可能会滚动更新。如果消息日志文件已滚动更新,则存在其他 /var/log/messages-date 或 /var/log/messages#。仔细查看这些文件创建时的时间戳。如果它们还涵盖 nsrwatch 会话,请也获取这些额外的消息日志。
Additional Information
NetWorker 进程和端口
NetWorker:如何调试备份操作
NetWorker:日志文件和位置
NetWorker 故障处理指南:进程崩溃和核心转储
NetWorker:按进程对内存或 CPU 使用率高的问题进行故障处理
Affected Products
NetWorkerProducts
NetWorkerArticle Properties
Article Number: 000021140
Article Type: How To
Last Modified: 15 Aug 2025
Version: 6
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.