开始新对话

未解决

此帖子已超过 5 年

W

2576

2014年7月21日 15:00

"Agent Main --Estream construct failed. Err: RWSockErr: in RWSocket::getpeername: NOTCONN" 这个错误什么意思

​最近连接CX4-240的sun 890主机多次出现这样的提示​​"Agent Main --Estream construct failed. Err: RWSockErr: in RWSocket::getpeername: NOTCONN" ​​ 代表什么意思?而且很奇怪,每次出现都是差不多的时间,​

​Jun 28 10:38:52 prodserver EV_AGENT[464]: [ID 334978 daemon.error] Agent Main --Estream construct failed. Err: RWSockErr: in RWSocket::getpeername: NOTCONN​

​Jul 3 10:42:36 ​​prodserver​​ EV_AGENT[464]: [ID 334978 daemon.error] Agent Main --Estream construct failed. Err: RWSockErr: in RWSocket::getpeername: NOTCONN​

​Jul 21 10:40:13 ​​prodserve​​r EV_AGENT[464]: [ID 334978 daemon.error] Agent Main --Estream construct failed. Err: RWSockErr: in RWSocket::getpeername: NOTCONN​

​会影响存储上的数据吗?​

4K 消息

2014年7月21日 18:00

CX4和Sun主机之间是FC还是iSCSI?Navisphere Agent版本是多少?看你存储还是CX4,太旧的NaviAgent版本可能会有各种bug。

getpeername是系统命令,用于返回套接口关联的远程协议地址。从日志中的NOTCONN也可以粗略得出可能是网络方面引起的原因。网络方面的日志和监控系统有捕捉到任何异常不?有没有可能某个特定时间网络繁忙导致的拥塞,可以看看是不是备份脚本还是业务高峰引起。

如果网络方面和业务方面的原因都排除了,也有一定可能是SP故障。可以参考知识库文档 https://support.emc.com/kb/39684 中的要求,用SP Qualifier (SPQ)工具对SP做检测。

如果网络、NaviAgent版本、SP故障的原因都排除了,且存储和应用都正常,那这个日志可以暂时忽略。

40 消息

2014年7月21日 18:00

是FC

我也怀疑和网络有关,但这个时间点没有备份任务,也非业务高峰

刚才去问了管网络的同事,他说网络设备上也未见异常。

打算今晚持续从主机ping 存储看看网络是否通畅,但是这个错误不是每天发生。就怕不一定遇到

目前存储没有错误日志,应用也正常。

另外请问如何查看Navisphere Agent的版本

4K 消息

2014年7月21日 19:00

最简单的方法:找一台安装了Navisphere CLI的机器(如果你是存储管理员的话自己笔记本应该有...),然后执行:

naviseccli -h getagent

例如:

navi_agent_ver.jpg

40 消息

2014年7月23日 01:00

C:\Program Files\EMC\Navisphere CLI>naviseccli -h 172.16.128.115 getagent

Security file not found.  Already removed or check -secfilepath option.

出这样的错误提示,

管理界面上能看到agent版本吗

4K 消息

2014年7月24日 01:00

登录Sun主机,用下面这个命令看看版本信息:

pkginfo |grep HOST

40 消息

2014年7月24日 05:00

运行命令后没有任何返回

4K 消息

2014年7月31日 22:00

那就是没有安装Host Agent,否则结果应该是下面这样。

找到后用pkginfo -l 就可以看到详细版本信息:

solaris_hostagent.jpg


找不到事件!

Top