Sun Jul 03 11:36:17 2016 Correctable memory error logging disabled for a memory device at location DIMM_B1. 0x180102B1F87857B1000410066FA0C110h Sun Jul 03 11:36:17 2016 Persistent correctable memory errors detected on a memory device at location(s) DIMM_B1. 0x170102B1F87857B100040C016FA0C110h Sun Jul 03 11:36:17 2016 Correctable memory error logging disabled for a memory device at location DIMM_B1. 0x160102B1F87857B1000410066FA0C110h Sun Jul 03 11:36:17 2016 Persistent correctable memory errors detected on a memory device at location(s) DIMM_B1. 0x150102B1F87857B100040C016FA0C110h Sun Jul 03 11:36:16 2016 Persistent correctable memory errors detected on a memory device at location(s) DIMM_B1. 0x140102B0F87857B100040C016FA0C110h Sun Jul 03 11:36:16 2016 Persistent correctable memory errors detected on a memory device at
eahua_tang
Community Manager
Community Manager
•
1.7K 消息
0
2016年7月12日 03:00
目前你的情况,第二个电源位应该是用不的了,使用第一个吧!!
服务器电源是直接与主板连接,所以你可能需要维修或更换主板去修复。
eahua_tang
Community Manager
Community Manager
•
1.7K 消息
1
2016年7月4日 00:00
这个问题在电源部件号为F9F51或 79RDR 或 W0CTF的固件问题出现过,你可以把电源拔出来,看看上面的部件号是不是这个,如果是,你可以按照以下步骤尝试解决:
1.关机;
2.把两个电源互换位置,然后长按开机按键半分钟后放手,然后拔回电源线并开机;
3.这时如果iDRAC里可以检测到两个PSU在线,下载以下固件,直接在iDRAC里面上传更新,更新需要重启服务器,过程中,可能会黑屏几分钟,请误做关机操作,以免出现异常;
downloads.dell.com/.../Power_Firmware_PY60F_WN32_07.09.52_A00.EXE
4.更新完成即可;
另确认一下电源配置是否有误,看看配置截图情况,如果确定以上步骤后及配置都正确,仍然无法检测到故障PSU,就看看有问题的PSU是跟着位置走,还是在原来的PSU上,好确定是主板接口问题,还是PSU的问题。
Seansky
11 消息
1
2016年7月4日 20:00
貌似不是不PSU电源的问题?这图上有备件号内容吗?
之前分别用两个电源单独测试主板的两个插槽,第一个插槽随便哪个PSU都可以开机,第二个插槽插(两个都试过)电源通电之后,PSU的绿灯闪烁。
eahua_tang
Community Manager
Community Manager
•
1.7K 消息
0
2016年7月4日 21:00
图片上的部件不包括上一个回贴的固件问题,按照用户手册:绿色闪烁在热添加电源设备时,这表示电源设备与其它电源设备(在效率、功能组、运行状况和支持的电压方面)不匹配。请使用与其它已安装电源设备容量匹配的电源设备来更换指示灯闪烁的电源设备。
所以确认下电源在iDRAC里配置的情况是不是有问题,可以参照以下链接收集一下日志看看。
zh.community.dell.com/.../dset-windows-174
Seansky
11 消息
0
2016年7月11日 04:00
昨天做了测试,附件发上来了
1个附件
attach.zip
eahua_tang
Community Manager
Community Manager
•
1.7K 消息
0
2016年7月11日 20:00
HI
根据提供的硬件日志显示这台服器的硬件信息比较奇怪;
1.目前电源在日志中只检测到一个,故障信息中有显示电源丢失的报错,如果交换过情况一样,应该是主板接口的问题了;
2.内存问题,DIMM B1曾经有报过内存校验的警告,需要注意兼容性,如果系统不稳定,留意内存是否有报错,可以安装Dell Openmanager进行监控;
Sun Jul 03 11:36:17 2016 Correctable memory error logging disabled for a memory device at location DIMM_B1. 0x180102B1F87857B1000410066FA0C110h
Sun Jul 03 11:36:17 2016 Persistent correctable memory errors detected on a memory device at location(s) DIMM_B1. 0x170102B1F87857B100040C016FA0C110h
Sun Jul 03 11:36:17 2016 Correctable memory error logging disabled for a memory device at location DIMM_B1. 0x160102B1F87857B1000410066FA0C110h
Sun Jul 03 11:36:17 2016 Persistent correctable memory errors detected on a memory device at location(s) DIMM_B1. 0x150102B1F87857B100040C016FA0C110h
Sun Jul 03 11:36:16 2016 Persistent correctable memory errors detected on a memory device at location(s) DIMM_B1. 0x140102B0F87857B100040C016FA0C110h
Sun Jul 03 11:36:16 2016 Persistent correctable memory errors detected on a memory device at
3.硬盘问题,使用非官方测试过兼容性的硬盘,日志显示阵列卡在做Raid5在做初始化,如果出现非正常读写性能情况时需要留意;
T19: EVT#02981-T19: 236=PD 00(e0x20/s0) is not a certified drive
T19: EVT#02982-T19: 91=Inserted: PD 01(e0x20/s1)
T19: EVT#02983-T19: 247=Inserted: PD 01(e0x20/s1) Info: enclPd=20, scsiType=0, portMap=00, sasAddr=500056b37789abec,0000000000000000
T19: EVT#02984-T19: 236=PD 01(e0x20/s1) is not a certified drive
T19: EVT#02985-T19: 91=Inserted: PD 02(e0x20/s2)
T19: EVT#02986-T19: 247=Inserted: PD 02(e0x20/s2) Info: enclPd=20, scsiType=0, portMap=00, sasAddr=500056b37789abe8,0000000000000000
T19: EVT#02987-T19: 236=PD 02(e0x20/s2) is not a certified drive
T19: EVT#02988-T19: 91=Inserted: PD 03(e0x20/s3)
T19: EVT#02989-T19: 247=Inserted: PD 03(e0x20/s3) Info: enclPd=20, scsiType=0, portMap=00, sasAddr=500056b37789abef,0000000000000000
T19: EVT#02990-T19: 236=PD 03(e0x20/s3) is not a certified drive
T19: EVT#02991-T19: 91=Inserted: PD 21(e0x00/s0)
T19: EVT#02992-T19: 247=Inserted: PD 21(e0x00/s0) Info: enclPd=00, scsiType=7f, portMap=00, sasAddr=500056b37789abfd,0000000000000000
4.固件问题,建议升级以下,提高稳定性;
BIOS
www.dell.com/.../DriversDetails
iDRAC
www.dell.com/.../DriversDetails
Seansky
11 消息
0
2016年7月12日 03:00
好的谢谢,我这边还有个问题问下,这个机器单电情况下是不是随便插哪个电源插槽都可以开机的?
因为这机器二号电源槽单插一个电源总是开不了机,有嘀嘀嘀的声音
Seansky
11 消息
0
2016年8月3日 10:00
好的,现在已经换了一块主板,电源问题解决了。
但是做了DEST之后发现阵列卡有个黄色提示。
提示是 learning状态,是电池没电了吗?
怎么解决这问题?
1个附件
az.png
eahua_tang
Community Manager
Community Manager
•
1.7K 消息
0
2016年8月3日 19:00
Hello!!这个是阵列卡的电池在周期性的充放电,以确保电池实际的寿命。通常三小时内完成,也不排除某情况下超过半天。
Seansky
11 消息
0
2016年8月4日 01:00
好的谢谢,已经正常了,是ready状态了,还有一个问题问下,R720XD的机器风扇转速大概在多少?
这边转速一直都在6K-7K,属于正常范围吗?我的阵列卡是用的PCI-E的H710,不是MINI的,如果换成MINI的转速会下降吗?
eahua_tang
Community Manager
Community Manager
•
1.7K 消息
0
2016年8月4日 01:00
通常正常温度三、四千转。
当然阵列卡是发热源之一,不代表更换后可以转速下降哦!!要结合室温和当前服务器的资源使用率。
eahua_tang
Community Manager
Community Manager
•
1.7K 消息
0
2016年8月4日 02:00
XD的硬盘比较密集,不排除目前是否IO读写比较大,另风扇转速高的时候噪音会比较大。要不收集一下日志看看 目前的硬件情况。
Seansky
11 消息
0
2016年8月4日 02:00
3-4K,我这个6-7K转。。不懂问题出在哪里。。。
还是XD的机器转速都高?
Seansky
11 消息
0
2016年8月4日 02:00
最近一次做的测试,看下呢。
1个附件
DSET Report for [WIN-06VQ4MKVGUN SvcTag-6LTRXBX-PE R720] on 08-04-2016 at 03.11 PM.zip
Seansky
11 消息
0
2016年8月14日 01:00
怎么没有回应了?
帮我看下日志啊,R720xd的机器,是不是会存在PCI-E插了阵列卡之后转速上升?如果这样的话,我换成MINI卡转速会下降到3-4K吗