Highlighted
Lu_shaoyong
2 Iron

CS recover报错

我这有一台NS-480,一个CS,两个DM。

CS坏了,更换CS进行recover,过程中出现以下报错:

Setting up the Enclosure (this may take several minutes) ...
ERROR setting up the enclosure...
Executing -rebuildConfig option discoverOnly mode
System discovery on both subnets .............
Discover 1 Mgmtswitches in Primary subnet A, 0 Mgmtswitches in Secondary
subnet B
Cannot find any Mgmtswitch in this system
ZERO Mgmtswitch detection may due to one or more of the following cases:
-Miswired cabling on Mgmtswitches that causes switch looping
-Loose/bad cable between Enclosure ID# 0 and CS
-Bad Ethernet port on CS
-Bad Mgmtswitch
Error: rebuildConfig FAIL (EDISCOVER)
Error: Unable to remove Dynamic IP Range in DHCPD_CFG
Error: REBUILDCONFIG_CMD retval = -10 (EDISCOVER)
Do you wish retry enclosure setup? [yes or no]:


请求帮助,在support.emc上查到一个类似的文档让修改S95nas文件,不过我看了两个文件都是192.168的,

另外尝试过重启DM,且将DM拔出半小时再恢复,不过依旧出现此报错,更换了DM,但是重启CS后发现,安装过程

不通过此步骤,直接跳过进入未安装完成的linux系统。

标签 (1)
标记 (2)
0 项奖励
15 条回复15
Jeffey1
4 Germanium

Re: CS recover报错

你好,shaoyong

通过你的描述,我猜楼主应该做了很多尝试,比如换CS、重启DM,找文档该配置。我想先知道一下,你是不是在输入“configure network”后出现告警信息的呢?输入窗口如下图:

Untitled_2.png

根据告警信息,系统目前无法找到mgmtswitch这个部件,这个设备如下图所示,它是一个连接Data Mover和Control Station的交换机:

Untitled.png

告警信息还提示可能是由于下列原因导致系统无法找到mgmtswitch这个部件:

ZERO Mgmtswitch detection may due to one or more of the following cases:

-Miswired cabling on Mgmtswitches that causes switch looping

-Loose/bad cable between Enclosure ID# 0 and CS

-Bad Ethernet port on CS

-Bad Mgmtswitch

因此,我建议楼主可否按照下面的思路进行排错:

  • 首先检查一下设备线路的连接是否正常,通过工具Solve-Desktop可以生成连线文档。

Untitled_3.png

  • 检查control station和Data Mover之间物理通信是否正常。
  • 检查Mgmtswitch是否存在故障。笔记本配好地址,ping通SPA和SPB,通过Unisphere去管理看管理Clariion是否正常。如果不能正常管理后端,可以重启mgmt server。方法是登录http://spa address/setup页面,选择restart mgmt server选项,点击重启。
Lu_shaoyong
2 Iron

Re: CS recover报错

Hi,Jeffey

在遇到报错之前经过了以下两步配置:

但实际过程与生成文档有一定区别还没经过以下几个步骤

另外我也检查过连线,的确是按照下图所示连接的。

我尝试过更换Blade3与CS之间的网线,不过报错依旧。后来我更换了Blade3,但是无法完成启动,状态灯一直处于1次/s(不知道是否是需要像更换DM一样进行初始化后才能启动,还是其他的问题)。不过此时重启CS就不会进入继续安装的过程,之间进入了linux系统,让输入user。

另外我想求教下如何检查CS与DM之间的通信和Mgmtswitch是否存在故障。

Best Regards!

phone:17701345660

Shaoyong Lu(卢绍勇)

发件人: Jeffey

发送时间: 2016-02-25 15:49

收件人: shaoyong

主题: 回复:[存储系统] - CS recover报错

ECN

CS recover报错

从 存储系统 中的 Jeffey 回复 - 查看完整讨论

你好,shaoyong

通过你的描述,我猜楼主应该做了很多尝试,比如换CS、重启DM,找文档该配置。我想先知道一下,你是不是在输入“configure network”后出现告警信息的呢?输入窗口如下图:

https://community.emc.com/servlet/JiveServlet/downloadImage/2-927261-129767/Untitled_2.png

根据告警信息,系统目前无法找到mgmtswitch这个部件,这个设备如下图所示,它是一个连接Data Mover和Control Station的交换机:

https://community.emc.com/servlet/JiveServlet/downloadImage/2-927261-129837/Untitled.png

告警信息还提示可能是由于下列原因导致系统无法找到mgmtswitch这个部件:

ZERO Mgmtswitch detection may due to one or more of the following cases:

-Miswired cabling on Mgmtswitches that causes switch looping

-Loose/bad cable between Enclosure ID# 0 and CS

-Bad Ethernet port on CS

-Bad Mgmtswitch

因此,我建议楼主可否按照下面的思路进行排错:

首先检查一下设备线路的连接是否正常,通过工具Solve-Desktop可以生成连线文档。

检查control station和Data Mover之间物理通信是否正常。

检查Mgmtswitch是否存在故障。

回复本电子邮件,或 前往ECN上的消息以回复本消息

在存储系统中通过 电子邮件 或在 ECN开始新讨论

在这些流中关注 CS recover报错 : 收件箱

0 项奖励
Password01_
3 Argentium

Re: CS recover报错

原CS的硬盘坏了么?

0 项奖励
Jeffey1
4 Germanium

Re: CS recover报错

你好,shaoyong

我在上次回复中添加了VNX的连线图和mgmt server的检查方法,你也可以参考一下。另外,由于在替换Control Station未成功的情况下,更换了Data Mover,替换Data Mover需要重新配置HBA卡、DM等等组件,操作需要几十步,因此这已经不是简单的换Control station问题了。

我先解释一下NS480中Data Mover和Control Station之间的通信原理:

Control Station上有三种类型的接口:

  • 管理类接口,比如serial console和MGMT口。
  • 心跳接口,主要用于主备Control Station之间的连接,使用nasmcd协议。
  • 后端接口,主要用于control station和Data Mover之间的通信,通过“Network Block Storage”协议进行传输,NBS协议类似于iSCSI协议,control station在扮演NBS客户端的角色,Data Mover扮演NBS服务器的角色。control station自身磁盘主要保存Linux操作系统的数据,而后端保存着NAS服务相关信息。这样的设计确保了control station故障,不会影响NAS的正常运行,因为NAS services相关信息保存在后端control LUN。

用户可以通过命令/nas/sbin/setup_enclosure -checkCable来检查Mgmtswitch的连线情况,命令注意大小写。

Jeffey1
4 Germanium

Re: CS recover报错

补充一下,Primus emc203444可以把NS480恢复到出厂设置,对于前端NAS设备上的数据不重要的用户,可以做为最后的备选方案。对于有条件的客户,建议开case让CE上门修复。

0 项奖励
Lu_shaoyong
2 Iron

Re: CS recover报错

hi,

   现在的问题在于进入这个未安装完成的系统后,NAS的命令全都没有,mount nas的文件也mount不了,所以检查初始化貌似都行不通啊。

   有其他方法可以使用nas的命令吗。

0 项奖励
Jeffey1
4 Germanium

Re: CS recover报错

shaoyong

根据目前的情况,NAS服务无法启动是正常情况,我们无法在系统中去运行任何NAS相关的命令。如果Data Mover和Control Station都换过了,你只有开CASE找EMC现场工程师上门或者将NS480重灌系统恢复到出厂设置。

0 项奖励
Lu_shaoyong
2 Iron

Re: CS recover报错

HI,

   更换DM未成功,也会有影响吗?全新安装的时候,安装完成之前DM也无法启动,全新安装也会进行这一步检查。是因为全新安装和Recover,中的检查脚本不同吗?

   另外更换DM后,注册新的HBA卡是在后端的CX480上进行,那配置DM的操作是在哪进行配置呢?是否可以给下配置DM的方法。

0 项奖励
Jeffey1
4 Germanium

Re: CS recover报错

shaoyong

你可以在后端Clariion上检查一下,确认Data Mover是否还能被Clariion正常识别,Data Mover功能类似于一台硬件X86主机,如果后端系统已经无法正常识别Data Mover,而且Control Station又是新更换的,我可能无法帮楼主找到这样的操作文档了。

更换Data Mover的操作,需要通过串口线连接到Data Mover的COM1口,然后进行部分配置,具体操作可以通过工具SolVe Desktop生成《NS480 Blade Enclosure Replacement》生成文档,按照文档步骤操作。

0 项奖励