xfwljd
1 Nickel

emc vnx5300 的机子硬盘到底是故障还正常(在线等)

emc vnx5300 7号硬盘亮橙色的灯,,,进系统看了显示removed状态,集成商安排了个工程师过来,工程师把removed的7号盘拿出来,等了5分钟又放回去,磁盘马上亮了绿灯,也不停的闪动。但是系统一直显示7号硬盘equalizing状态,已经10个小时了。坛子里有大神能帮忙看下,现在心里好没底啊!!!

第一:这个硬盘是坏了不稳定了。。。还是要时间进行equalizing(大概多久)

第二:在系统里面能看到存储风扇运行情况吗?感觉风扇嗡嗡响。

1.png2.png

标签 (1)
标记 (3)
0 项奖励
5 条回复5
xfwljd
1 Nickel

Re: emc vnx5300 的机子硬盘到底是故障还正常(在线等)

有人在吗

0 项奖励
xfwljd
1 Nickel

Re: emc vnx5300 的机子硬盘到底是故障还正常(在线等)

经过一个晚上,早上起来硬盘变成了Enabled了,,,,这块硬盘是不是好的?还是快不行了?

0 项奖励
Roger_Wu
4 Ruthenium

Re: emc vnx5300 的机子硬盘到底是故障还正常(在线等)

您好,之前您的帖子被暂时放入待审核的队列了,所以其他人无法看到您的帖子。今早我帮您将帖子放出来了。

Equalize的操作发生在如下阶段:

  1. 全局热备份运行流程如下:
    • 全局热备份在下列情形时被调用
    • 手动发起主动复制(Proactive Copy)
    • FLARE自动发起主动复制
    • 硬盘故障或被拔出
  2. FLARE会根据一定算法选择合适的热备份硬盘
  3. RAID 356,故障盘上的数据从奇偶校验位重建后放入热备盘;对RAID 1/01,数据直接从镜像盘复制到热备盘。重建结束后,RAID Group的冗余度才算恢复。一旦数据重建开始,进程将一直持续到重建完成,甚至在重建到热备盘的过程完成前拔出坏盘,这一进程也不会中断。
  4. 一旦数据完成重建或复制到热备盘,并且人工替换了坏盘,FLARE开始将数据从热备盘回拷(Equalize)至新替的盘。
  5. 一旦数据回拷完成,RAID Group就恢复到正常的状态。而热备盘也恢复可以替换其它盘的能力。

硬盘卡在Equalizing的问题可以参考知识库文档:Why is drive stuck equalizing? https://support.emc.com/kb/337040 (访问需经销商权限) 一般如果真卡了今天的话,需要Level 2工程师来看日志的:

Contact Technical Support Level 2 (TS2) for assistance. EMC Sustaining Engineering has a recovery procedure for this "stuck equalize" issue that refers to various revisions of FLARE none of which are current.

Warning!  Do NOT trespass any LUNs without first contacting TS2. When the "stuck equalize" issue happens on certain versions of FLARE code, data corruption may result if a LUN is trespassed.

一般售后这里接到这种案子,硬盘一卡会卡好几天。您这个情况,应该是已经恢复正常了。不放心的话继续观察几天好了。

posy_zhu
1 Copper

Re: emc vnx5300 的机子硬盘到底是故障还正常(在线等)

你好。

硬盘0.0.7移除以后应该是被热备盘0.0.14顶替了, 但是因为原盘又被放回去了,这时候系统认为它是新盘,在将数据从热备盘equalize回0.0.7,所以这个时候的状态是equalizing, 完成后会显示为enable.

1. 既然之前0.0.7显示removed,如果是盘自己掉的,那就说明硬件还是有点问题的,最好还是更换;

2. 日志能看到SPE/DPE的风扇转速(收取日志那个时间点的实时情况),但是看不到DAE的风扇转速。

磁盘有大量活动时风扇转速可能会增加, 建议等更换完盘之后再观察。

Roger_Wu
4 Ruthenium

Re: emc vnx5300 的机子硬盘到底是故障还正常(在线等)

楼上说的对,我以为请来了工程师直接给换了盘呢...原来是“坏”盘拔出来又插了回去...

那还是有必要收集一下SPCollects日志分析一下,可能这块盘已经有不少6A0、820的Soft Media Error或者其他什么错误了。

0 项奖励