开始新对话

此帖子已超过 5 年

Solved!

Go to Solution

7128

2014年1月1日 21:00

客户端nsrexecd进程无法启动

客户端系统是solaris10 这台主机重启后,我发现nsrexecd进程启动失败:

8616 01/02/14 12:28:06  2 0 0 6040 4356 0 alarmdb nsrexecd User administrator@backup-server authorized by server Backup-Server through optional remote NetWorker server based authentication.

61307 01/02/14 12:36:15  2 0 0 1 14016 0 alarmdb nsrexecd Failed to bind socket socket for nsrexecd service: Address already in use

61307 01/02/14 12:37:23  2 0 0 1 14051 0 alarmdb nsrexecd Failed to bind socket socket for nsrexecd service: Address already in use

61307 01/02/14 12:39:05  2 0 0 1 14095 0 alarmdb nsrexecd Failed to bind socket socket for nsrexecd service: Address already in use

0 01/02/14 13:02:09  2 0 0 1 14708 0 alarmdb nsrexecd @(#) Product:      NetWorker

0 01/02/14 13:02:09  2 0 0 1 14708 0 alarmdb nsrexecd @(#) Release:      7.6.Build.142

0 01/02/14 13:02:09  2 0 0 1 14708 0 alarmdb nsrexecd @(#) Build number: 142

0 01/02/14 13:02:09  2 0 0 1 14708 0 alarmdb nsrexecd @(#) Build date:   Sat Nov  7 22:45:01 PST 2009

0 01/02/14 13:02:09  2 0 0 1 14708 0 alarmdb nsrexecd @(#) Build arch.:  solaris8w

0 01/02/14 13:02:09  2 0 0 1 14708 0 alarmdb nsrexecd @(#) Build info:   DBG=0,OPT=-O2 -fno-strict-aliasing

68616 01/02/14 13:03:46  2 0 0 9 14708 0 alarmdb nsrexecd User administrator@backup-server authorized by server Backup-Server through optional remote NetWorker server based authentication.

61307 01/02/14 13:07:02  2 0 0 1 14964 0 alarmdb nsrexecd Failed to bind socket socket for nsrexecd service: Address already in use

61307 01/02/14 13:09:15  2 0 0 1 15051 0 alarmdb nsrexecd Failed to bind socket socket for nsrexecd service: Address already in use

61307 01/02/14 13:14:27  2 0 0 1 15186 0 alarmdb nsrexecd Failed to bind socket socket for nsrexecd service: Address already in use

61307 01/02/14 13:17:41  2 0 0 1 15272 0 alarmdb nsrexecd Failed to bind socket socket for nsrexecd service: Address already in use

在备份服务器上rpcinfo -p alarmdb 居然能看到7个nsrmmd,

   39010420705   tcp   9641  nsrmmd

    39010420805   tcp   8134  nsrmmd

    39010420905   tcp   9861  nsrmmd

    39010420605   tcp   8906  nsrmmd

    39010421005   tcp   9561  nsrmmd

    39010420405   tcp   9725  nsrmmd

    39010420505   tcp   8783  nsrmmd

我把/nsr下的tmp和/nsr/res/jobsdb重命名后,把客户端上的/nsr/tmp也重命名后,重启备份服务器的NW服务,然后再重启客户端的nw服务,还是无法启动啊

258 消息

2014年1月2日 02:00

alarmdb% nsrports

Service ports: 7937-9936

Connection ports: 0-0

alarmdb% nsrports -s backup-server

Service ports: 7937-9936

Connection ports: 0-0

alarmdb%

258 消息

2014年1月2日 02:00

root@Backup-Server # rpcinfo -p alarmdb

   program vers proto   port  service

    100000    4   tcp    111  rpcbind

    100000    3   tcp    111  rpcbind

    100000    2   tcp    111  rpcbind

    100000    4   udp    111  rpcbind

    100000    3   udp    111  rpcbind

    100000    2   udp    111  rpcbind

    300598    1   udp  32776

    300598    1   tcp  32773

805306368    1   udp  32776

805306368    1   tcp  32773

    100249    1   udp  32777

    100249    1   tcp  32774

    100229    1   tcp  32775  metad

    100229    2   tcp  32775  metad

    100001    2   udp  32780  rstatd

    100001    3   udp  32780  rstatd

    100001    4   udp  32780  rstatd

    100422    1   tcp  32776

    100242    1   tcp  32777  metamedd

    100230    1   tcp  32778  metamhd

    100068    2   udp  32781

    100068    3   udp  32781

    100068    4   udp  32781

    100068    5   udp  32781

    100083    1   tcp  32779

    100002    2   tcp  32780  rusersd

    100002    3   tcp  32780  rusersd

    100002    2   udp  32782  rusersd

    100002    3   udp  32782  rusersd

    100011    1   udp  32783  rquotad

    100005    1   udp  32817  mountd

    100005    1   tcp  34359  mountd

    100005    2   udp  32817  mountd

    100005    2   tcp  34359  mountd

    100005    3   udp  32817  mountd

    100005    3   tcp  34359  mountd

    100003    2   udp   2049  nfs

    100003    3   udp   2049  nfs

    100227    2   udp   2049  nfs_acl

    100227    3   udp   2049  nfs_acl

    100003    2   tcp   2049  nfs

    100003    3   tcp   2049  nfs

    100003    4   tcp   2049  nfs

    100227    2   tcp   2049  nfs_acl

    100227    3   tcp   2049  nfs_acl

    100024    1   udp  32818  status

    100024    1   tcp  34362  status

    100133    1   udp  32818

    100133    1   tcp  34362

    100021    1   udp   4045  nlockmgr

    100021    2   udp   4045  nlockmgr

    100021    3   udp   4045  nlockmgr

    100021    4   udp   4045  nlockmgr

    100021    1   tcp   4045  nlockmgr

    100021    2   tcp   4045  nlockmgr

    100021    3   tcp   4045  nlockmgr

    100021    4   tcp   4045  nlockmgr

    39010420705   tcp   9641  nsrmmd

    39010420805   tcp   8134  nsrmmd

    39010420905   tcp   9861  nsrmmd

    39010420605   tcp   8906  nsrmmd

    39010421005   tcp   9561  nsrmmd

    39010420405   tcp   9725  nsrmmd

    39010420505   tcp   8783  nsrmmd

    390436    1   tcp   8731

    390435    1   tcp   9843

    390113    1   tcp   7937  nsrexec

alarmdb并没有配置成存储节点

2 Intern

 • 

1.2K 消息

2014年1月2日 17:00

谢谢。

目前三个建议值得尝试:

1.在alarmdb上关闭SunRPC portmapper服务,然后重启NetWorker服务。
2.升级到NetWorker 7.6.5
3.在alarmdb上卸载NetWorker 7.6.1并安装NetWorker 7.6.5。

另外,日志里面还有没有其他报错信息?

1.8K 消息

2014年1月2日 17:00

7.1?

2 Intern

 • 

1.2K 消息

2014年1月2日 17:00

写错,谢谢提醒,已更正。

258 消息

2014年1月6日 03:00

客户端主机名修改之后,一定要跟用户沟通主机名未修改之前的数据是否还要,如果不要,在重新配置客户端时,一定要先停止客户端的nsrexecd进行,如果有存储节点,在NMC上删除,然后在NMC上删除注册的客户端,然后再叫业务厂商去改主机名,按照这样的步骤,不会出现nsrexecd进程启不来的情况

找不到事件!

Top