开始新对话

此帖子已超过 5 年

Solved!

Go to Solution

5033

2017年2月27日 21:00

T610服务器硬盘亮橙色灯,换了新硬盘问题无法解决。附上日志。

T610服务器硬盘亮橙色灯,换了新硬盘问题无法解决。硬盘放到另一台服务器确认是好的,服务器的硬盘接口全部用完了,没法测试插口的好坏,附上日志。[View:/cfs-file/__key/communityserver-discussions-components-files/251/DSET-Report-for-_5B00_YCSP001-SvcTag_2D00_96YGQ2X_2D00_PE-T610_5D00_-on-02_2D00_16_2D00_2017-at-11.40-AM.zip:550:400]

Community Manager

 • 

1.7K 消息

2017年2月28日 18:00

更换背板前,先把数据备份了,关机拔电源线,再更换背板。

另更换背板是可能导致硬盘状态变成Foreign的,但这不一定就会,即使是Foreign的状态,也没关系,我们在Raid BIOS 按F2把 Foreign的硬盘导入就好。(如图)

注意所有硬盘需要在开机前全部插入,不要分开插入,以免造成数据异常。 

Community Manager

 • 

1.7K 消息

2017年2月27日 22:00

有点像是接口坏了,但这个通常硬盘故障也可能导致类似的报错。

02/15/17 13:43:14: EVT#61016-02/15/17 13:43:14: 185=Enclosure PD 20(c None/p0) phy bad for slot 5

先排除硬盘故障先。

收集日志的时候,硬盘是插在上面的吗?如果不是,插上去之后再收集一次日志,有可能是硬盘在上面需要设置热备后重建。

2017年2月27日 23:00

[View:/cfs-file/__key/communityserver-discussions-components-files/251/DSET-Report-for-_5B00_YCSP001-SvcTag_2D00_96YGQ2X_2D00_PE-T610_5D00_-on-02_2D00_28_2D00_2017-at-02.47-PM.zip:550:400]

Community Manager

 • 

1.7K 消息

2017年2月27日 23:00

个人觉得虽然在另的服务器上检测到,但不代表就是背板的问题,可以的情况下有其它硬盘可以接在T610上重建阵列先看看,根据以下日志,硬盘接上后,一直在检测超时,所以先找硬盘重建尝试先。

另假设更换背板,数据不会丢失,数据是保存的硬盘里面的,不是在背板。但以防万一建议在做任何操作前备份好数据。

02/28/17 14:43:44: SES_MarkBadElement: enclPd 20 timeDiff cfc4c slot 5 badElmt 1 retryCnt 0 oldTime:0 currentTime:cfc4c
02/28/17 14:43:54: SES_BackplaneMapping: Un-Associated device on enclPd 20 StsCode = 6 elmtType 17 elmtIndex 5 slotPd =5 SasAddr =0
02/28/17 14:43:54: SES_MarkBadElement: enclPd 20 timeDiff a slot 5 badElmt 1 retryCnt 1 oldTime:cfc4c currentTime:cfc56
02/28/17 14:44:04: SES_BackplaneMapping: Un-Associated device on enclPd 20 StsCode = 6 elmtType 17 elmtIndex 5 slotPd =5 SasAddr =0
02/28/17 14:44:04: SES_MarkBadElement: enclPd 20 timeDiff 14 slot 5 badElmt 1 retryCnt 1 oldTime:cfc4c currentTime:cfc60
02/28/17 14:44:14: SES_BackplaneMapping: Un-Associated device on enclPd 20 StsCode = 6 elmtType 17 elmtIndex 5 slotPd =5 SasAddr =0
02/28/17 14:44:14: SES_MarkBadElement: enclPd 20 timeDiff 1e slot 5 badElmt 1 retryCnt 1 oldTime:cfc4c currentTime:cfc6a
02/28/17 14:44:24: SES_BackplaneMapping: Un-Associated device on enclPd 20 StsCode = 6 elmtType 17 elmtIndex 5 slotPd =5 SasAddr =0
02/28/17 14:44:24: SES_MarkBadElement: enclPd 20 timeDiff 28 slot 5 badElmt 1 retryCnt 1 oldTime:cfc4c currentTime:cfc74
02/28/17 14:44:34: SES_BackplaneMapping: Un-Associated device on enclPd 20 StsCode = 6 elmtType 17 elmtIndex 5 slotPd =5 SasAddr =0
02/28/17 14:44:34: SES_MarkBadElement: enclPd 20 timeDiff a slot 5 badElmt 1 retryCnt 2 oldTime:cfc74 currentTime:cfc7e
02/28/17 14:44:44: SES_BackplaneMapping: Un-Associated device on enclPd 20 StsCode = 6 elmtType 17 elmtIndex 5 slotPd =5 SasAddr =0
02/28/17 14:44:44: SES_MarkBadElement: enclPd 20 timeDiff 14 slot 5 badElmt 1 retryCnt 2 oldTime:cfc74 currentTime:cfc88
02/28/17 14:44:54: SES_BackplaneMapping: Un-Associated device on enclPd 20 StsCode = 6 elmtType 17 elmtIndex 5 slotPd =5 SasAddr =0
02/28/17 14:44:54: SES_MarkBadElement: enclPd 20 timeDiff 1e slot 5 badElmt 1 retryCnt 2 oldTime:cfc74 currentTime:cfc92
02/28/17 14:45:04: SES_BackplaneMapping: Un-Associated device on enclPd 20 StsCode = 6 elmtType 17 elmtIndex 5 slotPd =5 SasAddr =0
02/28/17 14:45:04: SES_MarkBadElement: enclPd 20 timeDiff 28 slot 5 badElmt 1 retryCnt 2 oldTime:cfc74 currentTime:cfc9c
02/28/17 14:45:14: SES_BackplaneMapping: Un-Associated device on enclPd 20 StsCode = 6 elmtType 17 elmtIndex 5 slotPd =5 SasAddr =0
02/28/17 14:45:14: SES_MarkBadElement: enclPd 20 timeDiff a slot 5 badElmt 1 retryCnt 3 oldTime:cfc9c currentTime:cfca6
02/28/17 14:45:24: SES_BackplaneMapping: Un-Associated device on enclPd 20 StsCode = 6 elmtType 17 elmtIndex 5 slotPd =5 SasAddr =0
02/28/17 14:45:24: SES_MarkBadElement: enclPd 20 timeDiff 14 slot 5 badElmt 1 retryCnt 3 oldTime:cfc9c currentTime:cfcb0
02/28/17 14:45:34: SES_BackplaneMapping: Un-Associated device on enclPd 20 StsCode = 6 elmtType 17 elmtIndex 5 slotPd =5 SasAddr =0
02/28/17 14:45:34: SES_MarkBadElement: enclPd 20 timeDiff 1e slot 5 badElmt 1 retryCnt 3 oldTime:cfc9c currentTime:cfcba
02/28/17 14:45:44: SES_BackplaneMapping: Un-Associated device on enclPd 20 StsCode = 6 elmtType 17 elmtIndex 5 slotPd =5 SasAddr =0
02/28/17 14:45:44: SES_MarkBadElement: enclPd 20 timeDiff 28 slot 5 badElmt 1 retryCnt 3 oldTime:cfc9c currentTime:cfcc4
02/28/17 14:45:44: EVT#61471-02/28/17 14:45:44: 185=Enclosure PD 20(c None/p0) phy bad for slot 5

2017年2月27日 23:00

收集日志的时候,硬盘是插上去了的。硬盘我手插到另一台T710服务器里在陈列卡界面可以识别(显示外来硬盘),应可以确认硬盘是好的。接口故障是需要更换背板吗?数据不会丢失吧!

2017年2月27日 23:00

硬盘有!但是没有了接口让我重建陈列,如果把原有的硬盘拔下来,插新硬盘重建陈列,那数据不是没有了。新手没有搞明白。麻烦指点下。非常感谢!

Community Manager

 • 

1.7K 消息

2017年2月28日 00:00

哦!~你在纠结这个!

这台T610的服务器有两组阵列,一组是146G*2 做的Raid1,一组是300GB*6 做的Raid5.

目前有问题的硬盘在Raid5上,由于Raid5可以允许一个硬盘故障而不影响数据,所以你可以更换一个新的相同类型硬盘上去,然后阵列卡会通过算法校验从其它硬盘里把数据重建回来。

2017年2月28日 00:00

旧的硬盘我拆下来更换了新的硬盘上去了,但是还是亮黄灯(硬盘没法识别)。只是旧硬盘品牌是日立,新的是希捷的。都是300G的。以前我也坏过硬盘换上新的就OK,但以前我Ctrl+R ,进陈卡PD界面查看,坏的盘会显示Fail或MISS,但这次坏的那个盘什么也不显示,8个盘位只显示7个。

Community Manager

 • 

1.7K 消息

2017年2月28日 02:00

插上去后,收份日志看一下不!!

如果使用的是相同类型的硬盘,那只能更换了背板了。

2017年2月28日 03:00

今天的那份日志就是换了新盘的日志(附件是坏盘插上的日志),更换背板,我从DELL订配件自已能更换吗?(DELL上门费用太高了)需要注意什么?我知道所有的硬盘都必需拔下来。插回去全部硬盘PD界面状态就会变成foreign,Raid 5就没法import了。

我还说明下亮黄灯的原因:

   春节开工,打扫卫生,顺便也把610的灰尘也吹也,可能是吹灰的气用大了点(直接用0.8MPA的压力吹),完了之后就黄灯了。   后悔中。。。。。。。。[View:/cfs-file/__key/communityserver-discussions-components-files/251/DSET-Report-for-_5B00_YCSP001-SvcTag_2D00_96YGQ2X_2D00_PE-T610_5D00_-on-02_2D00_28_2D00_2017-at-07.28-PM.zip:550:400]

    

2017年3月1日 01:00

你好!我那背板能帮我看下部件号是多少啊?谢谢!

Community Manager

 • 

1.7K 消息

2017年3月1日 01:00

2.5背板部件号:GW464 

3.5背板部件号:F313F

2017年3月1日 19:00

经过我反复测试,发现我背板没有问题。现在PD界面能认到硬盘了,但就是在Redy状态,没发重建陈列。我应怎么处理让他恢复数据。附上日志。[View:/cfs-file/__key/communityserver-discussions-components-files/251/DSET-Report-for-_5B00_YCSP001-SvcTag_2D00_96YGQ2X_2D00_PE-T610_5D00_-on-03_2D00_02_2D00_2017-at-10.41-AM.zip:300:200]

Community Manager

 • 

1.7K 消息

2017年3月1日 19:00

那目前这种情况就好处理点,重启服务器到Raid BIOS,然后Ctrl+N到硬盘管理介面,光标选中目前硬盘按F2,然后设置为热备,如下图:

另提醒一下,这台服务器的阵列卡电池坏了很久了需要更换,目前缓存禁用的情况下会导致性能有所下降。

03/02/17 10:31:42: EVT#61576-03/02/17 10:31:42: 150=Battery needs replacement - SOH Bad

电池部件号#NU209

Community Manager

 • 

1.7K 消息

2017年3月1日 20:00

待重建完成后,再做更换电池,重建估计几小时就搞掂。

换电池不用拔掉阵列卡,拔掉电池连接线就好,默认情况下不会导致Foreign的发生和阵列丢失。

当然备份很重要哦!

找不到事件!

Top