未解决
此帖子已超过 5 年
58 消息
0
9372
VNX硬盘故障
Hi all,
存储是VNX5500(UNIFIED)05.31.000.5.509。
存储坏了一块硬盘,之前客户自行更换了一块,但是更换后不久再次报错。我带了一块新盘再次进行更换,发现更换后磁盘状态为powering up,硬盘绿灯闪烁,大概1分钟左右,磁盘状态变为remove,状态灯为绿灯闪烁黄灯长亮。拔插过硬盘无变化,将磁盘放到存储的空槽位上磁盘状态正常。从存储上拔了一块热备盘过来换上也是同样的情况,最后one-by-one重启SP后再次换盘,情况未发生变化。
存储在重启SP之前,一直存在SP Unmanager的情况,重启k10governor后当前的SP正常,重启另一个SP的k10governor后这个 SP又出现了Unmanger的状态。最后重启了SP两边都正常了。
请大神们帮忙分析看看硬盘故障是怎么回事?是槽位故障,还是BUG,或者是其他的?
Lu_shaoyong
58 消息
0
2016年11月30日 20:00
Hi,
感谢你的宝贵经验。
这次的问题,由于客户业务重要,所以不同意换DAE,准备再加一块热备盘,然后就这样放着了,等找机会再来解决。
big_lei
450 消息
1
2016年11月30日 20:00
没有下载日志去看。
单从故障来说,大概有三点,可以去操作一下:
1. 磁盘,首先排除磁盘的通用,在我处理的一些故障里,有碰到过powering up 之后便removed的情况,VNX 51 和53有一些盘和55 57 75上不通用。
2. LCC ,就跟大家说的一样,LCC的故障,这个需要在KTracelog里看,是否有相关问题,不过你已经重启过存储了,也可以差不多排除。
3. 控制器, 在我之前的一个案例中,曾经由于一个硬盘故障,更换了多次硬盘之后还没好,800给方案让更换DPE,然后把控制柜直接整个换了,依然换盘还不行,最后换掉了一个控制器,很莫名其妙,不过确实换了之后换盘就正常了。
而已。
big_lei
450 消息
0
2016年11月30日 20:00
05.31.000.5.509
目前设备的flare code 版本略低,在R32.215以前的版本,SP UNMANAGED的问题比较频繁,建议修复磁盘问题之后,可以优先把code升级到R32.221.
yansheng
2 Intern
2 Intern
•
235 消息
0
2016年11月30日 23:00
问下 ,怎么看半年之内的日志,为啥我解析出来的日志只能是一个月左右的splog
Roger_Wu
2 Intern
2 Intern
•
4K 消息
0
2016年12月1日 00:00
一般不是看一个月的就是看全部的,加上-f参数即可,如:triage -f
也可以换-hours、-days、-weeks参数。TRiiAGE安装文件夹里有份TRiiAGE User Guide,里面有详细的参数说明。
Jianyu
2 消息
0
2019年8月7日 05:00
Jianyu
2 消息
0
2019年8月14日 19:00