开始新对话

未解决

此帖子已超过 5 年

3426

2015年10月15日 21:00

Data Mover切换

Hi,

    我遇到一个故障,存储为NS80,Data Mover过一段时间(没有固定的时间)就会切换,切换后Primary DM重启后的状态为5 - slot_2 contacted,从日志中也没找到相关的报错。当failback时,也能顺利的restore。

     求教解决故障的思路!

   

2 Intern

 • 

2.8K 消息

2015年10月15日 23:00

你好,楼主。

根据你的描述,我推测可能是网络问题造成设备主备切换。具体可能还是需要用下列命令来查查:

1. 用nas_server -l看看DM的状态;

2. 用/nas/sbin/getreason查看DM和CS状态

3. 用.server_config server_2 -v "fcp show"看看主备机网络连线是否正常;

这些命令只能检查设备运行的实时状态,主备切换可能是由于偶然的外部触发引起。因此,建议还可以抓取设备日志support materials,分析一下切换那个时间点发生了什么情况。

2 Intern

 • 

4K 消息

2015年10月26日 00:00

楼主问题解决了不?来分享一下处理经验?

58 消息

2015年10月26日 18:00

       目前还没解决,客户正在准备业务迁移和设备搬迁,准备等完成后再来处理这个问题。 

       从日志中找到一些信息,有关的有两个问题:1、LUN rebuild优先级过高,I/O需求过大而导致切换。2、文件系统大于2TB且使用率超过80%,导致读写进程堵塞。不过还要看后续的处理情况。

2 Intern

 • 

2.8K 消息

2015年10月26日 22:00

你好,楼主。

根据你提供的信息,我建议你检查一下目录/nas/var/dump下以header开头的文件。每次Data Mover的切换,系统都会自动创建一个dump文件,dump文件中包含这个header文件,通过读取这个header文件大致就能找到系统切换的原因。

但是,这个header开头的文件有时候能够读取,有时候需要通过engineering的工具才能读取。你可以贴出来给大家参考一下。

2 Intern

 • 

4K 消息

2015年11月29日 18:00

楼主这问题后来解决啦?怎么搞定的?

找不到事件!

Top