Unsolved
This post is more than 5 years old
46 Posts
0
516
[求救]CX4-120 DAE一个RAID Group重建的同时多个磁盘Soft Read/Write Errors,急!!!
环境描述
CX4-120 + 1*DAE + 1*DAE(15*1TB 7200RPM)
RG2:Disk0~Disk8,RAID5;
RG3:Disk9,Hotspare;
问题描述:
设备一次掉电后重启,报出多个Fault:Disk2和Disk7显示Removed,Disk6显示Fault,Disk9热备状态为NA;相关LUN全部离线;
解决步骤:
- 请数据恢复专家到现场,查看硬盘编号说是希捷“固件门”批次的硬盘;我们尝试更换DAE柜子,按照专家说法DAE加电多给一段时间(5分钟以上,预留足够的时间加载硬盘)后再打开机头的SPS开关;
- 存储完全启动后磁盘全部上线,磁盘都正常,Disk6做Equalizing,Disk7做Rebuilding;Disk9热备显示顶替了Disk6;
- 一段时间后Disk6自动离线,立即更换了新磁盘,Disk6做Equalizing;
- 查看Disk属性发现Disk2的Number of Soft Write Errors是49,Disk7的Number of Soft Read Errors是30;参考文档说是硬盘快到寿命极限了,一般10就是Critical。
- 现在就是在等Disk7的Rebuilding,一夜过来,大部分LUN的重建百分比都停在50,还有几个正在等待重建。
- 现在就怕Disk2和Disk7在重建过程中出现故障。感觉这速度太慢了,RG2现在应该是处于危险状态,想开主机拷贝部分关键数据又怕对重建产生影响。
请教为什么LUN的重建都停在50%,我有什么可以做的降低一些风险?