开始新对话

未解决

此帖子已超过 5 年

2329

2014年8月10日 21:00

CX4-120通过系统预留管理口登陆获取日志报错,以及在热备盘使用的情况下,能否同时更换二块硬盘?

大家好:

一台CX4的机器,因为当时不知道管理 IP,因此通过机器本地管理 IP 128.228.1.250这个口登陆上去,可以正常管理 ,但是获取日志时提示:

111.jpg

请问各位有碰到过这情况吗?有何解决方案呢,非常感谢。

另外顺便问一个问题,如图,机器没有任何硬件故障,报F:

22.jpg

我每次重启servermanger 管理程序,可以解决此问题,但此机器一般2个月会出现一次这情况 ,哪位大侠能解释下此故障的原因吗?

4K 消息

2014年8月10日 23:00

1. 楼主把EMC服务端口的IP敲错啦(截图是对的),应该是

SPA: 128.221.1.250 Subnet Mask 255.255.255.248

SPB: 128.221.1.251 Subnet Mask 255.255.255.248

直连服务端口是会有这个问题,在Navisphere界面或setup页面拿到管理IP后再收集应该就好了。

2. 这个要看SPCollects才能判断。硬件有问题的可能性较大。不知道现在微码是多少?如果还在维保内且生产环境允许的话,让EMC工程师上门给你升到最新的。过了维保想要再免费升级可就麻烦了。

2014年8月11日 00:00

Can you run spcollect through CLI. You may get more visibility over this. Plus check the IP and Subnet of both the SPs & next is to check your management server.

Thanks

Rakesh

196 消息

2014年8月11日 04:00

谢谢Roger

微码版本是2.19的,CX300的老机器 ,硬件我暂时没发现问题,这台机器半年来出现了二次这种timeout的情况,我都是重启管理程序解决,据说进SP系统内杀掉(navicimon进程和naviagent进程),杀掉也可以解决,但没试。

查了下EMC KB, emc126215,故障很相似,解决方案没怎么看明白。。。

4K 消息

2014年8月12日 05:00

还是要先看日志,看看有没有下面这个错误,这条KB才适用:

"29-DEC-2005 14:12:38.625 -E- CLARiiONProvider: Attempt to manage '10.101.9.999' failing: Client non-data stream error. 10.101.9.999 Err: RWSockErr: in RWSocket::connect: TIMEDOUT Retrying..."

解决方案这些netsh命令需要RemotelyAnywhere到SP的FLARE系统(即嵌入式的Windows)再操作。一般也就EMC和经销商工程师知道咋整,最终用户想搞定的话,那是要对EMC存储相当熟的才行。

13 消息

2014年8月21日 21:00

大神。。文档能传我看一下吗,我也遇到了这种问题。会影响使用吗

4K 消息

2014年8月24日 05:00

确认是KB上说的原因引起的了?建议先分析日志再操作,RemotelyAnywhere进SP的操作都是有风险的,没把握最好别直接操作...

196 消息

2014年8月26日 05:00

谢谢roger的回答,知道为什么不能在管理口获取日志了,但有另一个新问题,别的几台CX3-80,我也是通过这个管理口,但是我从SPA,SPB都无法看到它们的IP地址,事实上它们是有配IP的,请问有哪方面的原因会这样呢?

如下图所示,随便问一句,机器坏了二块硬盘,属于同一个raid group组,一个Lun上面,已经确认已经有二块热备盘使用上了,我可以同时更换这二块硬盘吗?还是必须换一块,然后同步完成再更换第二块硬盘?

1.jpg2.jpg

196 消息

2014年8月26日 06:00

hi,roger:

解决方案这些netsh命令需要RemotelyAnywhere到SP的FLARE系统(即嵌入式的Windows)再操作。一般也就EMC和经销商工程师知道咋整,最终用户想搞定的话,那是要对EMC存储相当熟的才行。


这个我感觉大概了解是要怎么做了,remote进SP,在CX300这种老机器下我知道,emc126215中提到的

Copy the following text and run it as a batch file ON BOTH SPs in the array. Remove any carriage returns.  (The last character of each line should be "dstport=0".)

  netsh routing ip delete filter name="ManagementPort0" filtertype=input srcaddr=0.0.0.0 srcmask=0.0.0.0 dstaddr=0.0.0.0 dstmask=0.0.0.0 proto=TCP-EST srcport=25 dstport=0

是不是在SP下建立一个文件,复制上面的字样,删除空闲字符,要重命名为某种格式?

另外,听说firmware 3.29 (可能记错了)以上的版本,不能用symmremote 工具登陆系统了?要用一个naviwatchdog 工具?是这样的吗?请问有这方面的文档参考没?

另外 ,

别的几台CX3-20,我也是通过这个管理口,但是我从SPA,SPB都无法看到它们的IP地址,事实上它们是有配IP的,请问有哪方面的原因会这样呢?

如下图所示,随便问一句,机器坏了二块硬盘,属于同一个raid group组,一个Lun上面,已经确认已经有二块热备盘使用上了,我可以同时更换这二块硬盘吗?还是必须换一块,然后同步完成再更换第二块硬盘?

4K 消息

2014年8月26日 18:00

1. 可以试试看http:// /setup页面有没有IP地址。这个要么是缓存问题要么是Management Server问题。

2. 这两快盘可以同时换,热备盘已经完全顶上来的话,换盘就是一个回拷的动作(Equalizing),很安全,对系统影响也很少。

不过最好先看下日志,看看两块坏盘故障的时间间隔,如果时间间隔较近的话,说不定会存在bad block导致的数据丢失。

196 消息

2014年8月26日 18:00

Roger:

可以试试看http:// /setup页面有没有IP地址, 你说的这个IP是 128.221.1.250/251吗?如果是Management Server问题 ,在这个界面下是否也会有Restart Management Server 选项?

不过最好先看下日志,看看两块坏盘故障的时间间隔,如果时间间隔较近的话,说不定会存在bad block导致的数据丢失?

如果确实存在bad block现象,这和怎么更换硬盘会有关系吗?数据不是已经在HS硬盘里了?如果有数据丢失,在更换前,是不是数据已经丢失了?

4K 消息

2014年8月26日 18:00

这个Service LAN port IP应该不会在上面,有的话应该是Management IP。Setup页面中才有Restart Management Server,普通界面下是没的。

数据不一定100%能读取出来,如果在回拷时出现读取错误,需要从其他盘中的检验数据中反算出来。当然这种可能性不是很大,主要是这台阵列的坏盘问题没有第一时间处理。

4K 消息

2014年8月26日 18:00

Netsh就是Windows自带的网络管理命令行工具,文档要求贴在.bat批处理文件里是为了一串命令执行起来方便,一个个贴在命令行里执行也是可以的。

连进R29以后的SP用最新的EMCRemote就可以:

https://support.emc.com/docu54901_EMCRemote-7.08.06-Release-Notes.pdf

https://support.emc.com/docu54902_EMCRemote-7.08-User-Guide.pdf

235 消息

2014年8月28日 16:00

楼主还是看下盘坏的时间?

坏盘是否已经完全被设备盘顶上?

在日志查看

最后就是那个按次序换盘的事情了,保险期间还是一个一个换

要不出问题 丢数据奥

找不到事件!

Top