开始新对话

未解决

此帖子已超过 5 年

4320

2013年10月29日 06:00

CX300 同一个硬盘反复故障

各位大神好:

最近一台EMC CX300的同一个硬盘已经多次故障,02号硬盘在7月份failed,更换之后,在10月份巡检时发现又故障了,同时还有08号硬盘一起故障,在10.12号同时更换了这二块硬盘,当时二个硬盘状态灯正常了,但是一星期后发现这二块硬盘再次是failed了。。。请问,这是不是可能不是硬盘问题,而是盘柜问题呢

附上日志,请大家帮忙分析,谢谢啦

2个附件

196 消息

2013年10月29日 07:00

以前没有过这情况,至少我不知道吧,机器是在IDC机房,没有别的硬件改动,属于标准机房。

我的意思是有没有可能这个DAP的硬盘背板问题?

1.8K 消息

2013年10月29日 07:00

CX300也有一定年限了,以前有这样频繁的情况发生么?最近是否有搬动过?

最近附近是否有新增些什么设备?比如空调、UPS啥的或者会产生震动的设备?

机房环境如何?灰尘?

是单独这个笼子坏得非常频繁还是说整个存储?


2 Intern

 • 

4K 消息

2013年10月29日 19:00

看了下日志,这台CX300目前两块盘故障,其中一块还是vault,要尽快换。

DPE2 Bus 0 Enclosure 0       *FAULT*

  (Bus 0 Enclosure 0 : Faulted; Bus 0 Enclosure 0 Disk 2 : Removed; Bus 0 Enclosure 0 Disk 8 : Removed)

上次坏盘的时候SPcollects有收集吗?可以比较一下它们的症状是否一样,比如这一次0.0.2就是大量的bad block,然后系统盘直接判断为硬件故障(Hardware error)。0.0.8是错误数达到了PFA(Predictive Failure Analysis)阈值。

Disk                Hard  Soft  PFA& Abort Remap  Xfer Tmout   Par   Bad Inval Recon Recov

Drive     Rg Type  Media Media  Hdwr ByDev  Errs  Errs  Errs   ity  Blks Sects Sects ByDrv

0.0.2      0 r1_0      0  3490     0     0     0     0     0     0  3490     0  1557  1492

0.0.8      0 r1_0      0    96     1     0     0     0     0     0    96     0    12    10

B       10/12/13 14:29:55 Bus0 Enc0 Dsk8        803 Recommend Disk Replacement [PFA threshold reached] 0    0        19

B       10/14/13 04:18:55 Bus0 Enc0 Dsk2        803 Recommend Disk Replacement [Hardware error, no spare] 0    0        a0

CX300实在是太老了,倒也没法排除是不是真的背板上某一个元器件故障导致电压异常。除了Born说的这几项使用环境方面的检查外,如果有条件的话,可以考虑更换背板。

2 Intern

 • 

362 消息

2013年10月29日 20:00

如果是一直同一块硬盘报错,你仔细看看这个笼子的通风情况,是不是有问题。

1.8K 消息

2013年10月29日 23:00

换背板也够劳财伤神的了,还是看有没机会换新存储才是。O(∩_∩)O~

196 消息

2013年10月30日 18:00

恩,谢谢ROGER的建议,我看能不能说服领导购买一台新EMC

顺便请教下,过保的EMC还能在EMC 800得到电话支持不?谢谢

1.8K 消息

2013年10月30日 19:00

过保的原则上是不能再享受现场和远程支持的。但这个可以看下原厂出于友情帮助的角度看是否能提供些支持、或者找集成商解决、或者自行找第三方维保。

1.6K 消息

2013年10月30日 20:00

过保的话分2种情况:

一种是这个产品已经过了support lifecycle了,那这样的产品EMC就不提供技术支持了。要查询support lifecycle的话,可以到对应产品的支持站点网址,在左下角的地方可以查询到
比如VNX,你就到https://support.emc.com/products/12781_VNX-Series这个网页的左下角可以查询到。

另一种情况是维保合同过期了。这种情况下你打进中国800电话时,工程师应该不会直接拒绝,在电话里会和你交流提供信息。但会把你的site id记录下来发给对应的合同续签组的同事。那里的同事会打电话给你公司跟进维保合同续签的事宜。如果确定不续签,或者已经和其他公司签了维保的话,合同续签组会在你的site id下做个记录,以后售后支持就不会提供后继服务了。

找不到事件!

Top