此帖子已超过 5 年
258 消息
0
7128
客户端nsrexecd进程无法启动
客户端系统是solaris10 这台主机重启后,我发现nsrexecd进程启动失败:
8616 01/02/14 12:28:06 2 0 0 6040 4356 0 alarmdb nsrexecd User administrator@backup-server authorized by server Backup-Server through optional remote NetWorker server based authentication.
61307 01/02/14 12:36:15 2 0 0 1 14016 0 alarmdb nsrexecd Failed to bind socket socket for nsrexecd service: Address already in use
61307 01/02/14 12:37:23 2 0 0 1 14051 0 alarmdb nsrexecd Failed to bind socket socket for nsrexecd service: Address already in use
61307 01/02/14 12:39:05 2 0 0 1 14095 0 alarmdb nsrexecd Failed to bind socket socket for nsrexecd service: Address already in use
0 01/02/14 13:02:09 2 0 0 1 14708 0 alarmdb nsrexecd @(#) Product: NetWorker
0 01/02/14 13:02:09 2 0 0 1 14708 0 alarmdb nsrexecd @(#) Release: 7.6.Build.142
0 01/02/14 13:02:09 2 0 0 1 14708 0 alarmdb nsrexecd @(#) Build number: 142
0 01/02/14 13:02:09 2 0 0 1 14708 0 alarmdb nsrexecd @(#) Build date: Sat Nov 7 22:45:01 PST 2009
0 01/02/14 13:02:09 2 0 0 1 14708 0 alarmdb nsrexecd @(#) Build arch.: solaris8w
0 01/02/14 13:02:09 2 0 0 1 14708 0 alarmdb nsrexecd @(#) Build info: DBG=0,OPT=-O2 -fno-strict-aliasing
68616 01/02/14 13:03:46 2 0 0 9 14708 0 alarmdb nsrexecd User administrator@backup-server authorized by server Backup-Server through optional remote NetWorker server based authentication.
61307 01/02/14 13:07:02 2 0 0 1 14964 0 alarmdb nsrexecd Failed to bind socket socket for nsrexecd service: Address already in use
61307 01/02/14 13:09:15 2 0 0 1 15051 0 alarmdb nsrexecd Failed to bind socket socket for nsrexecd service: Address already in use
61307 01/02/14 13:14:27 2 0 0 1 15186 0 alarmdb nsrexecd Failed to bind socket socket for nsrexecd service: Address already in use
61307 01/02/14 13:17:41 2 0 0 1 15272 0 alarmdb nsrexecd Failed to bind socket socket for nsrexecd service: Address already in use
在备份服务器上rpcinfo -p alarmdb 居然能看到7个nsrmmd,
39010420705 tcp 9641 nsrmmd
39010420805 tcp 8134 nsrmmd
39010420905 tcp 9861 nsrmmd
39010420605 tcp 8906 nsrmmd
39010421005 tcp 9561 nsrmmd
39010420405 tcp 9725 nsrmmd
39010420505 tcp 8783 nsrmmd
我把/nsr下的tmp和/nsr/res/jobsdb重命名后,把客户端上的/nsr/tmp也重命名后,重启备份服务器的NW服务,然后再重启客户端的nw服务,还是无法启动啊
suolv
258 消息
0
2014年1月2日 02:00
alarmdb% nsrports
Service ports: 7937-9936
Connection ports: 0-0
alarmdb% nsrports -s backup-server
Service ports: 7937-9936
Connection ports: 0-0
alarmdb%
suolv
258 消息
0
2014年1月2日 02:00
root@Backup-Server # rpcinfo -p alarmdb
program vers proto port service
100000 4 tcp 111 rpcbind
100000 3 tcp 111 rpcbind
100000 2 tcp 111 rpcbind
100000 4 udp 111 rpcbind
100000 3 udp 111 rpcbind
100000 2 udp 111 rpcbind
300598 1 udp 32776
300598 1 tcp 32773
805306368 1 udp 32776
805306368 1 tcp 32773
100249 1 udp 32777
100249 1 tcp 32774
100229 1 tcp 32775 metad
100229 2 tcp 32775 metad
100001 2 udp 32780 rstatd
100001 3 udp 32780 rstatd
100001 4 udp 32780 rstatd
100422 1 tcp 32776
100242 1 tcp 32777 metamedd
100230 1 tcp 32778 metamhd
100068 2 udp 32781
100068 3 udp 32781
100068 4 udp 32781
100068 5 udp 32781
100083 1 tcp 32779
100002 2 tcp 32780 rusersd
100002 3 tcp 32780 rusersd
100002 2 udp 32782 rusersd
100002 3 udp 32782 rusersd
100011 1 udp 32783 rquotad
100005 1 udp 32817 mountd
100005 1 tcp 34359 mountd
100005 2 udp 32817 mountd
100005 2 tcp 34359 mountd
100005 3 udp 32817 mountd
100005 3 tcp 34359 mountd
100003 2 udp 2049 nfs
100003 3 udp 2049 nfs
100227 2 udp 2049 nfs_acl
100227 3 udp 2049 nfs_acl
100003 2 tcp 2049 nfs
100003 3 tcp 2049 nfs
100003 4 tcp 2049 nfs
100227 2 tcp 2049 nfs_acl
100227 3 tcp 2049 nfs_acl
100024 1 udp 32818 status
100024 1 tcp 34362 status
100133 1 udp 32818
100133 1 tcp 34362
100021 1 udp 4045 nlockmgr
100021 2 udp 4045 nlockmgr
100021 3 udp 4045 nlockmgr
100021 4 udp 4045 nlockmgr
100021 1 tcp 4045 nlockmgr
100021 2 tcp 4045 nlockmgr
100021 3 tcp 4045 nlockmgr
100021 4 tcp 4045 nlockmgr
39010420705 tcp 9641 nsrmmd
39010420805 tcp 8134 nsrmmd
39010420905 tcp 9861 nsrmmd
39010420605 tcp 8906 nsrmmd
39010421005 tcp 9561 nsrmmd
39010420405 tcp 9725 nsrmmd
39010420505 tcp 8783 nsrmmd
390436 1 tcp 8731
390435 1 tcp 9843
390113 1 tcp 7937 nsrexec
alarmdb并没有配置成存储节点
TimQuan
2 Intern
2 Intern
•
1.2K 消息
1
2014年1月2日 17:00
谢谢。
目前三个建议值得尝试:
1.在alarmdb上关闭SunRPC portmapper服务,然后重启NetWorker服务。
2.升级到NetWorker 7.6.5
3.在alarmdb上卸载NetWorker 7.6.1并安装NetWorker 7.6.5。
另外,日志里面还有没有其他报错信息?
born_chen
1.8K 消息
1
2014年1月2日 17:00
7.1?
TimQuan
2 Intern
2 Intern
•
1.2K 消息
0
2014年1月2日 17:00
写错,谢谢提醒,已更正。
suolv
258 消息
0
2014年1月6日 03:00
客户端主机名修改之后,一定要跟用户沟通主机名未修改之前的数据是否还要,如果不要,在重新配置客户端时,一定要先停止客户端的nsrexecd进行,如果有存储节点,在NMC上删除,然后在NMC上删除注册的客户端,然后再叫业务厂商去改主机名,按照这样的步骤,不会出现nsrexecd进程启不来的情况