未解决
此帖子已超过 5 年
196 消息
0
4320
CX300 同一个硬盘反复故障
各位大神好:
最近一台EMC CX300的同一个硬盘已经多次故障,02号硬盘在7月份failed,更换之后,在10月份巡检时发现又故障了,同时还有08号硬盘一起故障,在10.12号同时更换了这二块硬盘,当时二个硬盘状态灯正常了,但是一星期后发现这二块硬盘再次是failed了。。。请问,这是不是可能不是硬盘问题,而是盘柜问题呢
附上日志,请大家帮忙分析,谢谢啦
未解决
此帖子已超过 5 年
196 消息
0
4320
各位大神好:
最近一台EMC CX300的同一个硬盘已经多次故障,02号硬盘在7月份failed,更换之后,在10月份巡检时发现又故障了,同时还有08号硬盘一起故障,在10.12号同时更换了这二块硬盘,当时二个硬盘状态灯正常了,但是一星期后发现这二块硬盘再次是failed了。。。请问,这是不是可能不是硬盘问题,而是盘柜问题呢
附上日志,请大家帮忙分析,谢谢啦
Top
qihua1
196 消息
0
2013年10月29日 07:00
以前没有过这情况,至少我不知道吧,机器是在IDC机房,没有别的硬件改动,属于标准机房。
我的意思是有没有可能这个DAP的硬盘背板问题?
born_chen
1.8K 消息
1
2013年10月29日 07:00
CX300也有一定年限了,以前有这样频繁的情况发生么?最近是否有搬动过?
最近附近是否有新增些什么设备?比如空调、UPS啥的或者会产生震动的设备?
机房环境如何?灰尘?
是单独这个笼子坏得非常频繁还是说整个存储?
Roger_Wu
2 Intern
2 Intern
•
4K 消息
1
2013年10月29日 19:00
看了下日志,这台CX300目前两块盘故障,其中一块还是vault,要尽快换。
DPE2 Bus 0 Enclosure 0 *FAULT*
(Bus 0 Enclosure 0 : Faulted; Bus 0 Enclosure 0 Disk 2 : Removed; Bus 0 Enclosure 0 Disk 8 : Removed)
上次坏盘的时候SPcollects有收集吗?可以比较一下它们的症状是否一样,比如这一次0.0.2就是大量的bad block,然后系统盘直接判断为硬件故障(Hardware error)。0.0.8是错误数达到了PFA(Predictive Failure Analysis)阈值。
Disk Hard Soft PFA& Abort Remap Xfer Tmout Par Bad Inval Recon Recov
Drive Rg Type Media Media Hdwr ByDev Errs Errs Errs ity Blks Sects Sects ByDrv
0.0.2 0 r1_0 0 3490 0 0 0 0 0 0 3490 0 1557 1492
0.0.8 0 r1_0 0 96 1 0 0 0 0 0 96 0 12 10
B 10/12/13 14:29:55 Bus0 Enc0 Dsk8 803 Recommend Disk Replacement [PFA threshold reached] 0 0 19
B 10/14/13 04:18:55 Bus0 Enc0 Dsk2 803 Recommend Disk Replacement [Hardware error, no spare] 0 0 a0
CX300实在是太老了,倒也没法排除是不是真的背板上某一个元器件故障导致电压异常。除了Born说的这几项使用环境方面的检查外,如果有条件的话,可以考虑更换背板。
cxemc
2 Intern
2 Intern
•
362 消息
0
2013年10月29日 20:00
如果是一直同一块硬盘报错,你仔细看看这个笼子的通风情况,是不是有问题。
born_chen
1.8K 消息
0
2013年10月29日 23:00
换背板也够劳财伤神的了,还是看有没机会换新存储才是。O(∩_∩)O~
qihua1
196 消息
0
2013年10月30日 18:00
恩,谢谢ROGER的建议,我看能不能说服领导购买一台新EMC
顺便请教下,过保的EMC还能在EMC 800得到电话支持不?谢谢
born_chen
1.8K 消息
0
2013年10月30日 19:00
过保的原则上是不能再享受现场和远程支持的。但这个可以看下原厂出于友情帮助的角度看是否能提供些支持、或者找集成商解决、或者自行找第三方维保。
Yanhong1
1.6K 消息
1
2013年10月30日 20:00
过保的话分2种情况:
一种是这个产品已经过了support lifecycle了,那这样的产品EMC就不提供技术支持了。要查询support lifecycle的话,可以到对应产品的支持站点网址,在左下角的地方可以查询到
比如VNX,你就到https://support.emc.com/products/12781_VNX-Series这个网页的左下角可以查询到。
另一种情况是维保合同过期了。这种情况下你打进中国800电话时,工程师应该不会直接拒绝,在电话里会和你交流提供信息。但会把你的site id记录下来发给对应的合同续签组的同事。那里的同事会打电话给你公司跟进维保合同续签的事宜。如果确定不续签,或者已经和其他公司签了维保的话,合同续签组会在你的site id下做个记录,以后售后支持就不会提供后继服务了。