NetWorker:如何调试备份操作
摘要: 列出了几个用于调试失败的 NetWorker 备份的选项。
说明
1.日志文件:
用于调试备份失败的主要日志是位于以下位置的 策略日志文件 。
Linux: /nsr/logs/policy_name/workflow_name/action_name
Windows(默认值): C:\Program Files\EMC NetWorker\nsr\logs\policy_name\workflow_name\action_name
以下位置有原始格式的工作流日志文件 /nsr/logs/policy/policy_name/workflow_name/jobid.raw 以及每个作的子目录。作的每个子作都有自己的日志文件,其中包含 jobid 那份儿童工作。当父作启动子作时,NetWorker 将为这些子作日志创建一个目录。
示例:
日志大小因备份期间使用的调试级别而异。原始文件是工作流日志,而 backup_[jobid]_logs 目录包含作日志和子作日志。
所有 NetWorker作的主要 NetWorker 日志文件是 daemon.raw 日志文件。
/nsr/logs/daemon.raw
Windows(默认值):
C:\Program Files\EMC NetWorker\nsr\logs\daemon.raw
要读取此日志,请使用 nsr_render_log 命令,请参阅:NetWorker:如何使用nsr_render_log呈现.raw日志文件
示例:
其他资源:
- NetWorker:日志文件和位置
- NetWorker:进程和端口
- NetWorker:如何使用 NSRGet NetWorker 数据收集工具(英文版)
- 请参阅《 NetWorker Command Reference Guide》,网址为:适用于NetWorker的支持 |手册和文档 (您必须使用戴尔支持帐户登录)。
2. save 在 NetWorker 客户端上:
NetWorker 基于客户端的备份使用保存过程。保存进程与 NetWorker 服务器、存储节点(如果适用)或目标备份设备介质进行通信。通过使用 NetWorker Management Console (NMC) 或使用 nsradmin 命令。
在 NMC 中,将相关客户端属性中的“备份命令”字段更改为”save -D9':
示例:
您可以使用 nsradmin 命令执行相同的作:
示例:
其他资源:
- NetWorker:NDMP 故障处理指南
- NetWorker:NMM 故障处理指南
- NetWorker:如何为 NMDA 启用调试
- NetWorker VMware Protection-vProxy:如何启用调试日志记录
3.NetWorker 服务器上的工作流作:
调试需要工作流作的启动和详细的调试输出。
nsrworkflow -D9 -p [policy] -w [workflow]
这会将工作流作业调试输出记录到以下位置的原始文件中:
/nsr/logs/policy/policy_name/workflow_name/
示例:
运行 nsrworkflow 命令手动启动作业,但使用与计划自动备份相同的计划和级别配置选项。另一种可能性是使用 -a 标志来定义 nsrworkflow 以 adhoc 备份,允许覆盖备份计划或级别。要指定所需的备份级别(而不是为今天的工作流运行设置的级别),请使用 -l (或 -L 对于虚拟机备份)。
示例:
nsrworkflow -p [policy] -w [workflow] -A "'[action]' -l [level]" -ansrworkflow -p Mona -w Bokonon_wf -A "'backup' -l full" -a
其他资源:
- NetWorker:如何使用 NetWorker nsrworkflow 命令
- NetWorker:如何使用 NetWorker nsrpolicy 命令
- 请参阅《 NetWorker Command Reference Guide》,网址为:适用于NetWorker的支持 |手册和文档 (您必须使用戴尔支持帐户登录)。
4. savefs 在 NetWorker 客户端上:
而 savefs 命令在基于客户端的备份期间使用。在 NetWorker 服务器上启动备份后,它将发送到 NetWorker 客户端。 savefs 此进程负责确定要为此客户端上运行的特定备份进行备份的文件和目录。
您可以从策略日志 (/nsr/logs/policy/[policy name]/[workflow name])。然后在客户端运行此命令,添加 -D9 选项:
示例:
在 NetWorker 服务器上:
然后在客户端:
5.在 NetWorker 服务器上分配目标介质:
为备份分配正确的目标卷由 管理 nsrd 进程处理的所有设备操作。要对此进行调试,您必须临时提高 nsrd 使用 NetWorker 服务器上的进程 dbgcommand。
示例:
调试完成后,必须通过将调试级别设置回零来禁用调试:
dbgcommand 可用于进程名称或进程 ID (PID),例如:
dbgcommand -n PROCESS_NAME Debug=DEBUG_LEVEL
dbgcommand -p PROCESS_ID Debug=DEBUG_LEVEL
其他资源:
6.等待可写卷的备份:
如果 NetWorker 服务器找不到要写入的合适 NetWorker 卷,它将停止响应并生成警报。在这种情况下,作业处于“活动”状态。您可以使用以下命令检查作业的状态: nsrpolicy monitor 命令验证每个 SP 是处于正常模式还是修复模式。
示例:
NetWorker Management Console 中的警报提供了有关正在查找的卷类型以及存储节点上的更多详细信息。
示例:
其他资源:
- 对介质等待事件进行故障处理 - 正在等待 1 个可写卷或没有匹配的设备
- NetWorker:对 NetWorker 中的磁带库问题进行故障处理
- NetWorker:如何使用 DDPCONNCHK 工具测试来自 NetWorker 主机的 DD ddboost 连接
- 采用 Data Domain Cloud Tier 的 NetWorker:分流和故障处理指南
7.备份由于并行度而意外停止响应:
如果 NetWorker 服务器确定由于没有可用的并行度插槽而无法继续备份,则作业处于“排队”状态。
为了调试并行度,您必须提高 nsrjobd NetWorker 服务器上的进程,如下所示。守护程序日志文件输出大量与并行度相关的调试数据。
示例:
其他资源:
- NetWorker:并行度和目标会话
- 请参阅 NetWorker 管理和性能优化与规划指南。适用于NetWorker的支持 |手册和文档 (您必须使用戴尔支持帐户登录)。
8.Client Direct 备份无法按预期工作:
“Client Direct”备份直接将数据从 NetWorker 客户端发送到目标介质,无需先写入 NetWorker 存储节点。
您可以在客户端属性中定义是否应将 Client Direct 备份用于此客户端实例。
要排除 Client Direct 是否正常工作,您必须按照以下示例检查日志:
示例:
日志输出:客户端直接作。
而 daemon.raw NetWorker 服务器上的文件:
91787 MM/DD/YYYY HH:mm:SS nsrmmd NSR notice Save-set ID '4091251191' (vm-lego-231:/NetWorker) is using direct file save with Data Domain device 'dd4500-dd.local_onetwoone'.
lsof 在 NetWorker 客户端上
[root@vm-lego-231 ~]# lsof -i TCP | grep save save 9831 root 3u IPv4 111668 0t0 TCP vm-lego-231:23178->vm-lego-121:8985 (ESTABLISHED) save 9831 root 5u IPv4 111695 0t0 TCP vm-lego-231:19752->vm-lego-121:9417 (ESTABLISHED) save 9831 root 7u IPv4 111720 0t0 TCP vm-lego-231:31095->vm-lego-121:9035 (ESTABLISHED) save 9831 root 8u IPv4 111728 0t0 TCP vm-lego-231:12421->vm-lego-121:9653 (ESTABLISHED) save 9831 root 9u IPv4 111731 0t0 TCP vm-lego-231:33739->dd4500-dd.local:nfs (ESTABLISHED) save 9831 root 10u IPv4 111736 0t0 TCP vm-lego-231:60278->dd4500-dd.local:midnight-tech (ESTABLISHED)
lsof 列出从客户端到 NetWorker 服务器和到 DD 的打开的 TCP 连接。要确定 NetWorker 服务器连接到哪些进程,您可以使用 lsof 在服务器上。第四列是正在使用的文件描述符。
在 Windows 主机上,您可以使用 SysInternals Procmon 执行类似的诊断。
9:Client Direct 备份未使用 Client Direct:
而 daemon.raw NetWorker 服务器上的文件:
91797 MM/DD/YYYY HH:mm:SS nsrmmd NSR severe Unable to perform direct file save with Data Domain device 'ONETWOONE'; setting up traditional save for save-set ID '4024143566' (vm-lego-231:/NetWorker)
traditional 在日志中快速为您提供此输出。请参阅 NetWorker Administration Guide中列出的客户端直接工作必须满足的条件。最常见的原因是客户端缺少对 Data Domain 的直接网络访问,或者其名称解析无法正常工作。
lsof 在 NetWorker 客户端上:
[root@vm-lego-231 ~]# lsof -i TCP | grep save save 10114 root 3u IPv4 123335 0t0 TCP vm-lego-231:46461->vm-lego-121:8985 (ESTABLISHED) save 10114 root 5u IPv4 123369 0t0 TCP vm-lego-231:12593->vm-lego-121:9417 (ESTABLISHED) save 10114 root 7u IPv4 123392 0t0 TCP vm-lego-231:63952->vm-lego-121:9035 (ESTABLISHED) save 10114 root 8u IPv4 123400 0t0 TCP vm-lego-231:29597->vm-lego-121:9653 (ESTABLISHED)
其他资源:
- NetWorker:网络配置的最佳实践
- 请参阅性能 优化和规划指南。适用于NetWorker的支持 |手册和文档 (您必须使用戴尔支持帐户登录)。
10.并行存储流 (PSS) 备份:
调试 PSS 备份。确保勾选 NetWorker Management Console 中的客户端资源中的“并行存储流”属性。修改 save 命令,根据第 2 节将其置于调试中。此外,在以下位置创建一个空文件: ../nsr/debug 称为”mbsdopen'.这将在 中的客户端上提供额外的调试日志记录 /nsr/tmp 以及 NetWorker 服务器上的策略日志(请参阅第 1 节)。
示例:
其他资源:
- 如何对 NetWorker 并行存储流备份进行故障处理
- 请参阅性能 优化和规划指南。适用于NetWorker的支持 |手册和文档 (您必须使用戴尔支持帐户登录)。
11.NetWorker 存储节点 nsrmmd 进程在写入目标介质时未按预期工作:
您可以提高 nsrmmd 使用 的进程 dbgcommand (参见第 5 节)。您可以增加所有调试级别 nsrmmd 进程或使用作系统工具来识别哪些 nsrmmd 进程处于活动状态:
其他资源:
- NetWorker:对 NetWorker 中的磁带库问题进行故障处理
- NetWorker:如何使用 DDPCONNCHK 工具测试来自 NetWorker 主机的 DD ddboost 连接
- 采用 Data Domain Cloud Tier 的 NetWorker:分流和故障处理指南
- 请参阅《 NetWorker DD Boost 集成指南》,网址为:适用于NetWorker的支持 |手册和文档 (您必须使用戴尔支持帐户登录)。





