开始新对话

未解决

此帖子已超过 5 年

9371

2016年11月3日 20:00

VNX硬盘故障

Hi all,

    存储是VNX5500(UNIFIED)05.31.000.5.509

    存储坏了一块硬盘,之前客户自行更换了一块,但是更换后不久再次报错。我带了一块新盘再次进行更换,发现更换后磁盘状态为powering up,硬盘绿灯闪烁,大概1分钟左右,磁盘状态变为remove,状态灯为绿灯闪烁黄灯长亮。拔插过硬盘无变化,将磁盘放到存储的空槽位上磁盘状态正常。从存储上拔了一块热备盘过来换上也是同样的情况,最后one-by-one重启SP后再次换盘,情况未发生变化。

    存储在重启SP之前,一直存在SP Unmanager的情况,重启k10governor后当前的SP正常,重启另一个SP的k10governor后这个 SP又出现了Unmanger的状态。最后重启了SP两边都正常了。

    请大神们帮忙分析看看硬盘故障是怎么回事?是槽位故障,还是BUG,或者是其他的?

2 Intern

 • 

4K 消息

2016年11月4日 02:00

是不是这个位置报Missing了?具体定位问题需要看SPCollects日志。

MIS的问题可以参考之前一篇帖子:cx4 0-0-4槽位的盘无法识别是怎么回事?

58 消息

2016年11月4日 03:00

hi,

   硬盘不是mis,是remove的状态

1.png

还有以下日志,换盘过程中重新拔插换过多次,并且one-by-one重启过SP。

2.png

3.png

2 Intern

 • 

4K 消息

2016年11月4日 05:00

把TRiiAGE_Analysis.txt、TRiiAGE_SPlogs.txt、SPA_cfg_info.txt、SPB_cfg_info.txt传到什么地方我来看一下?

主要是看插盘前后,SPlogs.txt里提示什么错误。

58 消息

2016年11月6日 17:00

Hi,

    我将几个日志文件上传到了百度云。  http://pan.baidu.com/s/1jINlDp8

2 Intern

 • 

4K 消息

2016年11月6日 21:00

问题可能是这个:Replacement SAS drives fail to spin up https://support.emc.com/kb/461573

需要Reseat LCC。Reseat LCC不管用的话,升级LCC固件版本。

看了下DAE 0_1 LCC固件版本确实有些老:

                                  A-side LCC ------------------  B-side LCC ------------------

Enclosure            Type         Serial          Assy Revision  Serial          Assy Revision

Bus 0 Enclosure 0    DPE7                                                                    

Bus 0 Enclosure 1    DAE6S        FCNBD114714228  E13  1.21      FCNBD114714833  E13  1.21   

Bus 0 Enclosure 2    DAE6S        FCNBD130930811  E13  1.44      FCNBD130930664  E13  1.44   

Bus 1 Enclosure 0    DAE6S        FCNBD114609147  E12  1.21      FCNBD114521414  E12  1.21   

Bus 1 Enclosure 1    DAE6S        FCNBD114219114  E12  1.21      FCNBD114609221  E12  1.21   

Bus 1 Enclosure 2    DAE6S        JWXPL151101699  E13  1.54      JWXPL151102178  E13  1.54   

58 消息

2016年11月7日 00:00

Hi,

   如何升级LCC微码呢?

   我在SolVe Desktop这个工具里没找到文档,Support上也没搜索到。还是升级LCC微码只能通过升级OE的方法来升级?

58 消息

2016年11月7日 01:00

Hi,

   谢了,先把方案给客户那边,让客户去考虑吧。

   另外一个问题是现在存储有故障,升级LCC微码能进行吗?貌似有点悬。

2 Intern

 • 

4K 消息

2016年11月7日 01:00

关于升级LCC固件的方法,我这台机器上SolVe Desktop还没更新没法仔细找。不过一些KB里都有提到,比如 https://support.emc.com/kb/476599

不过,VNX1、VNX2的LCC固件相关case,应该都要升级一下才行。你是经销商工程师的话,得联系售后开一个AR先。

In accordance to PCA #69 “Until further notice, all CDES issues on VNX1 and VNX 2 arrays must have AR’s opened against them for RCA purposes and to assist engineering provide remedy for the issues


Partners need to contact support to open the AR

2 Intern

 • 

4K 消息

2016年11月7日 17:00

生产系统有担忧的话建议买单次维保服务,LCC固件bug问题一般挺少遇到的。

6 消息

2016年11月9日 21:00

我曾经遇到过一个DAE坏了一个LCC卡,导致整个DAE的所有磁盘在系统中无法识别的情况。

6 消息

2016年11月9日 21:00

这种情况,更换LCC卡试一试,比开case要简单。

58 消息

2016年11月10日 01:00

Hi,

    要是不先把坏盘的问题解决了,升级固件也升级不了啊。

2 Intern

 • 

4K 消息

2016年11月10日 01:00

是啊,升级固件都没用的话,那就真的只能换新了。

2 Intern

 • 

4K 消息

2016年11月10日 17:00

Reseat过LCC了吗?如果是你们自己提供服务给客户的话,直接带新的LCC上门吧。

2 Intern

 • 

4K 消息

2016年11月29日 23:00

楼主问题怎么样了?欢迎来分享处理经验~

找不到事件!

Top