NetWorker:修复不一致的 NSR 对等信息
摘要: NetWorker 通信报告无法向另一个 NetWorker 主机进行身份验证。这些错误表明对等身份验证失败。
症状
客户端上的备份、恢复和通信失败,并显示以下错误:
Error: 'nsrexecd: SYSTEM error: There is already a machine using the name (NETWORKER_CLIENT_NAM). Either choose a different name for your machine, or delete the "NSR peer information" entry for (NETWORKER_CLIENT_NAM) on host: (HOST_NAME)' Error: 'nsrexecd: SYSTEM error: Connection reset by peer' Error: Could not get session key from NETWORKER_CLIENT_NAME for GSS authentication with SERVER_NAME: Authentication error; why = Server rejected credential
系统中也会出现类似的错误 daemon.raw 日志文件:
- Linux:
/nsr/logs/daemon.raw - Windows(默认值):
C:\Program Files\EMC NetWorker\nsr\logs\daemon.raw - NetWorker:如何使用nsr_render_log呈现.raw日志文件
原因
所有 NetWorker 服务器、存储节点和客户端都包含 nsrladb 文件夹中。
- Linux:
/nsr/res/nsrladb - Windows(默认值):
C:\Program Files\EMC NetWorker\nsr\res\nsrladb
在第一次连接时,主机将请求并接收其连接到的主机的证书,并缓存托管证书以供将来比较。此文件夹包含主机的对等信息,以及已使用 nsrauth 对等成功进行身份验证的其他 NetWorker 系统上的证书。这些缓存的证书反映在配置树的本地主机分支中。
对等证书不匹配可能由各种情况或问题引起。例如:
- 名称解析、寻址或通信问题
- NetWorker 升级
- 主机级别系统更改,导致系统级别信息与存储在 中的信息之间存在差异
nsraldb。
解决方案
NSR 对等信息在客户端级别设置,而不是在服务器级别设置。换言之,您必须连接到 NSRLA,而不是 NSR 数据库。要执行此操作,您必须使用”nsradmin -p nsrexec“或”nsradmin -p nsrexecd”的输出。
删除生成错误消息 (host_name) 的 NetWorker 主机上客户端 (client_name) 的不匹配和缓存的旧证书。
- 使用 NMC 中的本地主机,从具有旧证书副本的任何主机中删除已更新的客户端证书
- 使用命令行从受影响的客户端中删除旧证书
清除客户端计算机的对等主机信息(从服务器)
nsradmin -s <host_name> -p nsrexec nsradmin> delete type: nsr peer information; peer hostname: <client_name>
从客户端计算机中清除对等方信息。
nsradmin -p nsrexec nsradmin> print type: nsr peer information delete
其他信息
如果允许的身份验证方法不匹配,也可能会出现对等问题。在现代 NetWorker 实施中,仅 nsrauth 应该使用。传统(19.4.x 之前的版本)NetWorker 系统可能包括”oldauth”的输出。具有以下功能的 NetWorker 系统的示例: oldauth 已启用回退:
[root@lnx-srvr01 ~]# nsradmin -p nsrexec
NetWorker administration program.
Use the "help" command for help, "visual" for full-screen mode.
nsradmin> p type: nsrla
type: NSRLA;
name: lnx-srvr01.networker.lan;
reverse DNS state: uncached;
nsrmmd version: 19.14.0.0.Build.12;
nsrsnmd version: 19.14.0.0.Build.12;
Multi-subnet state: Disabled;
TCP Retry: 5;
NW instance info operations: ;
NW instance info file: ;
installed products: ;
auth methods: "0.0.0.0/0,nsrauth/oldauth";
max auth attempts: 8;
...
...
使用 oldauth 因为通信回退可能会解决某些通信或对等连接故障;然而 oldauth 不应使用。 oldauth 被视为不安全。
nsrauth 是所有受支持的 NetWorker 版本使用的默认身份认证方法。部署在高于 19.4.x 的版本上的客户端没有 oldauth 启用。使用 升级客户端 oldauth “已启用”不会自动删除此设置。必须手动删除该设置。
[root@lnx-srvr01 ~]# nsradmin -p nsrexec
NetWorker administration program.
Use the "help" command for help, "visual" for full-screen mode.
nsradmin> . type: nsrla
Current query set
nsradmin> update auth methods: "0.0.0.0/0,nsrauth"
auth methods: "0.0.0.0/0,nsrauth";
Update? y
updated resource id 3.0.243.13.0.0.0.0.101.15.41.103.192.168.0.6(517)
nsradmin> show auth methods
nsradmin> print
auth methods: "0.0.0.0/0,nsrauth";
nsradmin>
重新启动 NetWorker 服务:
- Linux:
systemctl restart networker - Windows (PowerShell):
net stop nsrexecd ; net start nsrexecd
net start nsrd 和 net start gstd。
清除与主机通信的 NetWorker 系统中的对等信息,其中 oldauth 被禁用。