开始新对话

此帖子已超过 5 年

Solved!

Go to Solution

6144

2015年7月29日 05:00

cx4 0-0-4槽位的盘无法识别是怎么回事?

cx4 0-0-4 槽位的盘坏了,更换一个新的为啥没办法识别 到。

盘是好的

更换了多个盘,这个位置是不是被锁住了,怎么解锁

4K 消息

2015年7月31日 06:00

SPB上Disk 0.0.4的状态和SPA一样都是Missing,详细看了下日志发现这块盘触发了很多CFD (Critical Foreign & Missing Drive,它的功能是保证硬盘插入正确的槽位,具体参考KB emc233207,仅EMC员工和经销商可见),

Line 6664: A       07/30/15 06:18:52 Bus0 Enc0 Dsk4        b65 CFD disk blocked [expected sn 9QJ7DWR0]  0    39514a37 44575230
Line 8052: A       07/30/15 07:11:22 Bus0 Enc0 Dsk4        b65 CFD disk blocked [expected sn 9QJ7DWR0]  0    39514a37 44575230
Line 8610: B       07/30/15 07:29:19 Bus0 Enc0 Dsk4        b65 CFD disk blocked [expected sn 9QJ7DWR0]  0    39514a37 44575230
Line 9580: B       07/30/15 08:20:40 Bus0 Enc0 Dsk4        b65 CFD disk blocked [expected sn QJ7DWR0.]  0    514a3744 575230df
Line 9735: B       07/30/15 08:28:18 Bus0 Enc0 Dsk4        b65 CFD disk blocked [expected sn QJ7DWR0.]  0    514a3744 575230df

如果原来那个坏的盘还在,那可以尝试reseat一下看看是否能从Missing状态变为Faulted。否则确实可能是楼上说盘柜问题(LCC),对应KB参考emc310527,也是仅EMC员工和经销商可见。

4K 消息

2015年7月29日 19:00

盘的来源是?P/N都对的起来吗?

SP logs或SPCollects日志有查看过报什么错不?CX4没有什么被锁一说,或者你看看热备盘有没有顶上。

这个最好还是收集SPcollects日志分析一下。

235 消息

2015年7月30日 05:00

0-0-4 这个盘黄灯和绿灯常亮,我已经更换很多这样的盘,包括我把存储上正常的0-0-14的热备盘换过来一样的故障,

系统界面显示是faulted状态。日志

1.6K 消息

2015年7月30日 06:00

Jacks,日志有收集吗?看你上个回复好像没打全

235 消息

2015年7月30日 07:00


splog  帮看下

1个附件

1.6K 消息

2015年7月30日 07:00

回复的时候,右上角的链接可以切换到高级编辑器,里面可以加附件。不过不清楚日志会不会太大

235 消息

2015年7月30日 07:00

怎么上传日志??

4K 消息

2015年7月30日 20:00

这台设备问题一大堆啊:

(904/988/88d) Enc Over temperature  : 3,参考KB emc160824

(a4b) Coherency Error      : 45,参考KB emc160329

另外还有reboot from bugcheck,参考KB emc263133

A      07/30/15 04:39:50 Save Dump            2183 Reboot from bugcheck: 0xe111805f (0xfffffadfc2535c80, 0x0000000000000001, 0x0000000000000000, 0x000000000000029b). A dump was saved in: C:\dumps\crash.dmp. [DLS_BUGCHECK_EXECUTIONER_LOCK_REQUEST_BY_CABALID_EXPIRED ]
        [ BugcheckCode: e111805f  Definition: DLS_BUGCHECK_EXECUTIONER_LOCK_REQUEST_BY_CABALID_EXPIRED ]

这台设备还有好几次意外掉电:

Reboot Time        SP  Cause              Event Time          FE Up  Downtime  Boottime  Bugcheck Code

-----------------  ---  -----------------  ------------------  -----  --------  --------  -------------------

07/01/15 02:32:50  SPA  Powerfail          07/01/15 02:28:41  YES    00:14:07  00:09:58

07/23/15 03:02:46  SPA  Powerfail          07/23/15 02:59:07  YES    00:37:35  00:33:56

07/30/15 03:52:32  SPA  Powerfail          07/30/15 03:45:58  NO                        

07/30/15 04:39:05  SPA  Bugcheck          07/30/15 04:04:11*  NO                        E111805F DLS_BUGCHECK_EXECUTIONER_LOCK_REQUEST_BY_CABALID_EXPIRED

07/30/15 05:02:08  SPA  Unexplained        07/30/15 04:49:49*  NO                        

07/30/15 05:06:54  SPA  Powerfail          07/30/15 05:03:33*  NO                        

07/30/15 06:04:44  SPA  Unexplained        07/30/15 05:17:25*  NO                        

07/30/15 06:17:10  SPA  Powerfail          07/30/15 06:09:31*  YES    00:14:40  00:07:01

07/30/15 07:09:29  SPA  Powerfail          07/30/15 07:01:32  YES    00:11:28  00:03:31

07/30/15 07:36:32  SPA  Powerfail          07/30/15 07:20:51  YES    00:51:10  00:35:29

其中一个System LUN目前是Break (BRK)状态,就是Disk 0.0.4拔出引起:

  -    -    -  8196  961      ST4  RAID-3    -  -  17.7 GB  ---  SP-A    BRK*  0.0.0  0.0.1  0.0.2  0.0.3  0.0.4 (MIS)

由于SP意外掉电过,两边SP的状态可能不一致,需要收集两边SP的SPcollects日志一起分析。后续的处理一般也需要Level 2或者Engineering Team的介入。你是经销商还是最终用户?这台设备还有保不?如果是生产环境建议尽快联系EMC售后。

235 消息

2015年7月31日 02:00

spb log 

掉电是自己关掉sps电池的原因

现在就是004 这个盘换了很多个就是不识别

1个附件

235 消息

2015年7月31日 03:00

与柜子没关系

28 消息

2015年7月31日 03:00

换DAE的柜子吧.

遇到过这种情况.

28 消息

2015年7月31日 06:00

怎么判断与DAE没有关系的?

后端接口板积碳比较多后,就会造成接触不良...

4K 消息

2015年7月31日 20:00

楼上是汽车爱好者吧,积碳一词很穿越啊......

3.2K 消息

2015年8月1日 16:00

那应该是氧化吧

3 消息

2015年8月2日 18:00

LUN 8196已经坏了,是否可以通过FCLI把他删掉,在重新bind。不过没试过。

这个0-0-4这个盘 在日志里应该有以前那个盘的SN,找到那个快盘插回去,看能不能好。其他盘都会踢出来,如果SN不对。

找不到事件!

Top