开始新对话

此帖子已超过 5 年

Solved!

Go to Solution

2305

2013年2月3日 08:00

CX3-20报错信息

收集日志分析,出现如下报错,不知道这些soft error是什么原因引起的,谢谢!!

TM截图未命名.jpg

290 消息

2013年2月3日 17:00

要看soft error的具体代码,建议LZEvent Log查看具体日志,或者收集SP日志spcollect

1.png

SCSI soft error, 有的时候不是磁盘的损坏,而是链路上偶尔的有数据传送的错误. 具体的要看错误代码. 具体原因很多,要看日志和现场情况去具体分析

soft media error可能显示出磁盘有坏块. 这是因为CX的存储上有对磁盘坏块做校验的设计,保证数据读出的真实性和正确性,所以磁盘有很小坏块或是错误的时候都会报出来. 这样的错误要累积到一定程度才会引起磁盘离线(offline)

1.4K 消息

2013年2月3日 17:00

可能是某块盘的soft media error,是确认下这4个LUN是不是在同一个RG,到event log里看看是不是这个RG里的某块盘报的,如果是的话,可能需要把它换掉,不过soft media error到一定数量系统会报推荐更换,没报的话,还可以在用一段时间。

913 消息

2013年2月3日 18:00

很多lun都有这个报错,分布在不同的RAID组上,是不是跟nas系统有关,这是一台nas的设备。还有其中一个lun报了hard error

TM截图未命名.jpg

913 消息

2013年2月3日 18:00

那一般报soft error都有可能是哪几种问题引起的呢?谢谢

290 消息

2013年2月3日 22:00

有关Clariion/VNX上的磁盘报错解释有一篇文章总结的比较全面,推荐参考EMC Primus emc 71072。

常见error代码描述:

  • 代码6A0/820 - Soft Media Error. A bad or marginal data sector has been detected. The sector was successfully read.
  • 代码920 - Hard Media Error. A bad or marginal data sector has been detected. The data sector could not be read and the Storage Processor (SP) needed to regenerate the data using RAID reconstruction. 

出现6A0和920,一般要根据报出的频率来判断是否需要提前更换磁盘。

  • 代码801 - A SCSI operation failed and needed to be retried. The error indicates that the retry succeeded. 
  • 代码901 - A SCSI operation failed and needed to be retried. The error indicates that the retry attempts failed.

出现801和901,不一定和磁盘有关,可能是LCC线或者LCC模块导致后端Bus loop故障所以没有响应。要查看该日志中的extended code,在emc71072中有详细说明。

 

  • 代码803 - Recommend Disk Replacement. 推荐更换该盘。

290 消息

2013年2月3日 22:00

LUN上报soft error主要还是和磁盘有关系。这条LUN6上的告警是Critical- hardware error, 很可能是已经有盘坏了。LZ到disk summary那里看一下呢?

找不到事件!

Top