NetWorker:如何调试备份操作
Summary: 列出了几个用于调试失败的 NetWorker 备份的选项。
Instructions
日志文件:
用于调试备份失败的主要日志是位于以下位置的 策略日志文件 。
Linux:/nsr/logs/policy_name/workflow_name/action_name
Windows:..程序文件EMC NetWorker srlogspolicy_nameworkflow_nameaction_name
/nsr/logs/policy/policy_name/workflow_name/jobid.raw下有原始格式的工作流日志文件,以及每个作的子目录。作的每个子作都有自己的日志文件,其中包含该子作业的作业 ID。当父作启动子作时,NetWorker 将为这些子作日志创建一个目录。
示例:
在这里,我们可以看到策略日志的位置,以及日志的大小不同,具体取决于备份期间使用的调试级别。 原始文件是工作流日志,而 backup_[jobid]_logs 目录包含作日志和子作日志。
所有 NetWorker作的主 NetWorker 日志文件是 daemon.raw 日志文件。
它位于 [NetWorker_install_dir]日志中。
Windows:C:Program FilesEMC NetWorker srlogs
要读取此日志,请使用 nsr_render_log 命令。
示例:
更多资源:
503582 :NetWorker 日志文件以及如何收集以进行分析
469489 :要收集
的日志的 NetWorker 列表 457094 : 要收集和提供给支持一般 NetWorker 问题的
日志文件和信息NetWorker命令参考指南
在 NetWorker 客户端上节省成本
NetWorker 基于客户端的备份使用保存过程。保存进程与 NetWorker 服务器、存储节点(如果适用)或目标备份设备介质进行通信。通过使用 NetWorker Management Console (NMC) 或使用 nsradmin 命令将 -D debug 标记传递到保存进程,可以在保存进程上启用调试。
在 NMC 中,将相关客户端属性中的“备份命令”字段更改为“save -D9”:
示例:
您可以使用 nsradmin 命令执行相同的作:
示例:
或者,在 Linux 系统上,您可以使用 printf 命令在一行中进行此 nsradmin 更改:
示例:
printf "show
. type : NSR Client; name : vm-lego-231; save set : /alice
update backup command : save -D9
" | nsradmin -i -
更多资源:
NetWorker命令参考指南
如何使用 NetWorker nsradmin 验证检查
NetWorker nsradmin 程序的特殊用途技术说明
NetWorker 服务器上的工作流作
调试需要工作流作的启动和详细的调试输出。
nsrworkflow -D9 -p [policy] -w [workflow]
这会将工作流作业调试输出记录到以下位置的原始文件中:
/nsr/logs/policy/policy_name/workflow_name/
示例:
运行 nsrworkflow 命令将手动启动作业,但使用与计划自动备份相同的计划和级别配置选项。 另一种可能性是使用 -a 标记将 nsrworkflow 运行定义为临时备份,这样可以覆盖备份计划或级别。 要指定所需的备份级别(而不是为当前运行的工作流设置的级别),请使用 -l(或 -L 表示虚拟机备份)。
示例:
nsrworkflow -p [policy] -w [workflow] -A “'[action]' -l [level]” -a
nsrworkflow -p Mona -w Bokonon_wf -A “'backup' -l full” -a
更多资源:
516616 : 如何使用 NetWorker nsrworkflow 命令
513030:如何使用 NetWorker nsrpolicy 命令
NetWorker 9.1.x 发行说明:
NetWorker命令参考指南
NetWorker 客户端上的 Savefs
在基于客户端的备份期间使用 savefs 命令。在 NetWorker 服务器上启动备份后,它将发送到 NetWorker 客户端。 savefs 是此进程,它负责确定要为此客户端上运行的特定备份进行备份的文件和目录。
您可以从策略日志 (/nsr/logs/policy/[policy name]/[workflow name]) 中的原始文件获取客户端上运行的确切 savefs 命令。 然后在客户端运行此命令,添加 -D9 选项:
示例:
在 NetWorker 服务器上:
然后在客户端:
更多资源:
在 NetWorker 服务器上分配目标介质
为备份分配正确的目标卷由 NetWorker 服务器上的 nsrd 进程管理。 要对此进行调试,您必须使用 dbg命令在 NetWorker 服务器上临时提高 nsrd 进程的调试级别。
示例:
调试完成后,必须关闭调试,如下所示:
更多资源:
等待可写卷的备份
如果 NetWorker 服务器找不到要写入的合适 NetWorker 卷,它将停止响应并生成警报。 在这种情况下,作业将处于“活动”状态。 您可以使用 nsrpolicy monitor 命令检查作业的状态。
示例:
NetWorker Management Console 中的警报提供了有关正在查找的卷类型以及存储节点上的更多详细信息。
示例:
更多资源:
备份由于并行度而意外停止响应
如果 NetWorker 服务器确定由于没有可用的并行度插槽而无法继续备份。 在这种情况下,作业处于“排队”状态。
为了调试并行度,您必须提高 NetWorker 服务器上 nsrjobd 进程的调试级别,如下所示。 守护程序日志文件输出大量与并行度相关的调试数据。
示例:
更多资源:
Client Direct 备份未按预期工作
“Client Direct”备份直接将数据从 NetWorker 客户端发送到目标介质,无需先写入 NetWorker 存储节点。
您可以在客户端属性中定义是否应将 Client Direct 备份用于此客户端实例。
要排除 Client Direct 是否正常工作,您必须按照以下示例检查日志:
示例:
日志输出:Client Direct 正在运行中。
NetWorker 服务器上的守护程序日志文件:
91787 08/01/2014 01:37:35 PM nsrmmd NSR 通知存储集 ID “4091251191” (vm-lego-231:/NetWorker) 正在使用 Data Domain 设备“dd4500-dd.local_onetwoone”的直接文件保存。
NetWorker 客户端上的 lsof
[root@vm-lego-231 ~]# lsof -i TCP |grep save
save 9831 root 3u IPv4 111668 0t0 TCP vm-lego-231:23178-vm-lego-121>:8985 (ESTABLISHED)
save 9831 root 5u IPv4 111695 0t0 TCP vm-lego-231:19752-vm-lego-121>:9417 (ESTABLISHED)
save 9831 root 7u IPv4 111720 0t0 TCP vm-lego-231:31095-vm-lego-121>:9035 (ESTABLISHED)
save 9831 root 8u IPv4 111728 0t0 TCP vm-lego-231:12421-vm-lego-121>:9653 (ESTABLISHED)
save 9831 root 9u IPv4 111731 0t0 TCP vm-lego-231:33739-dd4500-dd.local>:nfs (ESTABLISHED)
save 9831 root 10u IPv4 111736 0t0 TCP vm-lego-231:60278-dd4500-dd.local>:midnight-tech (ESTABLISHED)
提醒:我们可以看到,从客户端到 NetWorker 服务器和 DD 都有开放的 TCP 连接。 如果您需要知道 NetWorker 服务器上到底连接到了哪些进程,可以与服务器上的 lsof 进行交叉检查。 第四列是正在使用的文件描述符。
在 Windows 系统上,您可以使用 resmon 看到类似的输出: 开始 - 运行 - resmon - 网络选项卡 - TCP 连接
日志输出: 备份未使用 Client Direct。
NetWorker 服务器上的守护程序日志文件:
91797 08/01/2014 01:57:51 PM nsrmmd NSR 严重 无法使用 Data Domain 设备“ONETWOONE”执行直接文件保存;为存储集 ID '4024143566' 设置传统存储 (vm-lego-231:/NetWorker)
提醒: 在日志中查找“traditional”一词可快速获得此输出。 如果您需要了解它为什么不使用 client direct,请首先查看 NetWorker Administration Guide中的客户端直接工作需要满足的条件列表。 最常见的原因是客户端无法从其正在使用的 NIC 直接通过网络访问 DD,或者客户端的名称解析无法正常工作。
NetWorker 客户端上的 lsof:
[root@vm-lego-231 ~]# lsof -i TCP |grep save
save 10114 root 3u IPv4 123335 0t0 TCP vm-lego-231:46461-vm-lego-121>:8985 (ESTABLISHED)
save 10114 root 5u IPv4 123369 0t0 TCP vm-lego-231:12593-vm-lego-121>:9417 (ESTABLISHED)
save 10114 root 7u IPv4 123392 0t0 TCP vm-lego-231:63952-vm-lego-121>:9035 (ESTABLISHED)
save 10114 root 8u IPv4 123400 0t0 TCP vm-lego-231:29597-vm-lego-121>:9653 (ESTABLISHED)
提醒: 此处仅打开与 NetWorker 服务器(在此示例中也是存储节点)的 TCP 连接。 没有与 DD 开放的 TCP 连接。 所有数据都将进入存储节点。
更多资源:
并行存储流备份
调试 PSS 备份。确保勾选 NetWorker Management Console 中的客户端资源中的“并行存储流”属性。 修改 save 命令,根据上面的第 1 条将其置于调试中。 此外,在 .. 中创建一个空文件。/nsr/debug called 'mbsdopen'。 这将在客户端的 /nsr/tmp 和 NetWorker 服务器上的策略日志中提供额外的调试日志记录(请参阅上面的第 1 条)。
示例:
更多资源:
如何对 NetWorker 并行存储流备份
进行故障处理NetWorker性能优化规划指南
NetWorker 存储节点 nsrmmd 进程在写入目标介质时未按预期工作。
您可以使用 dbgcommand 提高 nsrmmd 进程的调试级别(如上面的第 7 条所述)。 您可以提高所有 nsrmmd 进程的调试级别,或者使用作系统工具来确定哪个 nsrmmd 进程处于活动状态:
更多资源:
479665 : 分流文章:对 NetWorker
中的磁带库问题进行故障处理 NetWorkerData Domain Boost 集成指南











