双Control Station丢失心跳故障排除

o17Uu33DCF12520
4 Tellurium

双Control Station丢失心跳故障排除

Control Station丢失心跳故障排除

转载请在文首保留原文出处:EMC中文支持论坛https://community.emc.com/go/chinese

介绍

本文的创作灵感来自于EMC中文技术社区的一个真实的客户答疑,主题是关于“vnx5500Control Station丢失心跳的问题”。这些问题应该已经解决了,作者特此将其整理成文,以飨读者。

报错截图:

    

更多信息

control stationheartbeat是由CS上的deamon叫做nas_mcd每秒对另一个CS发出的IPMI ping

了解这个就好办了。

1.确保NAS code被分别安装到了两个CS上面,步骤有点不一样的,到https://mydocs.emc.com/VNX/requestMyDoc.jsp下载个文档。

2.查看/nas/sbin/getreason:确保所有的CS power on状态和NAS服务都在运行中。主CSreason代码应该是10,副CSreason代码应该是11

# /nasmcd/sbin/getreason

10 - slot_0 primary control station    -->This shows proper state where CS0 is running as the primary control station

11 - slot_1 secondary control station  -->This shows proper state where CS1 is running as the Secondary, or backup control station

如果不是1011,那么重启不正常的CS,再检查/nas/sbin/getreason

相关事件可以用命令nas_logviewer  /nas/log/sys_log查看事件过程。

3.经过第2步后如果,还不正常,在CS上用命令ping -c3 emcnasotherIPMICS_i3检查CS之间的IPMI互相通信。

上面的emcnasotherIPMICS_i3,到这里找到:

# head /etc/hosts (on CS0)

128.221.254.100         emcnas_ipmi            -->Represents IPMI IP address for CS0

128.221.254.101         emcnasotherIPMICS_i3   -->Represents IPMI IP address for CS1

4.另外,检查一下CS上面的NIC是否工作正常。

# /sbin/ifconfig eth1

eth1      Link encap:Ethernet  HWaddr 00:00:F0:9F:6D:54

           inet addr:128.221.254.100  Bcast:128.221.254.255  Mask:255.255.255.0

           inet6 addr: fe80::200:f0ff:fe9f:6d54/64 Scope:Link

           UP BROADCAST RUNNING MULTICAST  MTU:1500  Metric:1

           RX packets:5127468 errors:0 dropped:0 overruns:0 frame:0

           TX packets:5131544 errors:0 dropped:0 overruns:0 carrier:0

           collisions:0 txqueuelen:1000

           RX bytes:350438224 (334.2 MiB)  TX bytes:351081152 (334.8 MiB)

           Base address:0xdc00 Memory:fbee0000-fbf00000

5. 查看/var/log/messages,主要看nas_mcd相关的错误信息;

6. 确保CS之间的网线正常接驳,否则重插或者替换。

             

版本历史
修订号
1 / 1
上次更新时间:
‎01-13-2014 12:46 PM
更新依据: