开始新对话

未解决

此帖子已超过 5 年

9371

2016年11月3日 20:00

VNX硬盘故障

Hi all,

    存储是VNX5500(UNIFIED)05.31.000.5.509

    存储坏了一块硬盘,之前客户自行更换了一块,但是更换后不久再次报错。我带了一块新盘再次进行更换,发现更换后磁盘状态为powering up,硬盘绿灯闪烁,大概1分钟左右,磁盘状态变为remove,状态灯为绿灯闪烁黄灯长亮。拔插过硬盘无变化,将磁盘放到存储的空槽位上磁盘状态正常。从存储上拔了一块热备盘过来换上也是同样的情况,最后one-by-one重启SP后再次换盘,情况未发生变化。

    存储在重启SP之前,一直存在SP Unmanager的情况,重启k10governor后当前的SP正常,重启另一个SP的k10governor后这个 SP又出现了Unmanger的状态。最后重启了SP两边都正常了。

    请大神们帮忙分析看看硬盘故障是怎么回事?是槽位故障,还是BUG,或者是其他的?

58 消息

2016年11月30日 20:00

Hi,

  感谢你的宝贵经验。

  这次的问题,由于客户业务重要,所以不同意换DAE,准备再加一块热备盘,然后就这样放着了,等找机会再来解决。

450 消息

2016年11月30日 20:00

没有下载日志去看。

单从故障来说,大概有三点,可以去操作一下:

1. 磁盘,首先排除磁盘的通用,在我处理的一些故障里,有碰到过powering up 之后便removed的情况,VNX 51 和53有一些盘和55 57 75上不通用。

2. LCC  ,就跟大家说的一样,LCC的故障,这个需要在KTracelog里看,是否有相关问题,不过你已经重启过存储了,也可以差不多排除。

3. 控制器, 在我之前的一个案例中,曾经由于一个硬盘故障,更换了多次硬盘之后还没好,800给方案让更换DPE,然后把控制柜直接整个换了,依然换盘还不行,最后换掉了一个控制器,很莫名其妙,不过确实换了之后换盘就正常了。

而已。

450 消息

2016年11月30日 20:00

05.31.000.5.509


目前设备的flare code 版本略低,在R32.215以前的版本,SP UNMANAGED的问题比较频繁,建议修复磁盘问题之后,可以优先把code升级到R32.221.

2 Intern

 • 

235 消息

2016年11月30日 23:00

问下 ,怎么看半年之内的日志,为啥我解析出来的日志只能是一个月左右的splog

2 Intern

 • 

4K 消息

2016年12月1日 00:00

一般不是看一个月的就是看全部的,加上-f参数即可,如:triage -f

也可以换-hours、-days、-weeks参数。TRiiAGE安装文件夹里有份TRiiAGE User Guide,里面有详细的参数说明。

2 消息

2019年8月7日 05:00

楼主问题解决了吗?

2 消息

2019年8月14日 19:00

楼主,我也遇到这样的问题,不知道你后面是怎么解决的;能分享下经验吗。
找不到事件!

Top