开始新对话

此帖子已超过 5 年

Solved!

Go to Solution

3243

2013年12月9日 19:00

NEW VNX做NAS机头的高可用

请问大伙,最新一代的VNX,NAS机头如果非常重要,要做到多台的高可用,是用什么技术实现的呢?

是都能主动侦测呢,还是发生故障后另外一台接管。是否需要重启NAS机头,也就是服务会不会断开?

2 Intern

 • 

2.8K 消息

2013年12月9日 20:00

在大多数的Celerra,VNX的Data Mover配置中,出于高可用性的需求,最常见的配置都会配置至少一个备用Data Mover,当主DM发生了问题或者因为管理维护需要而重启的时候,主备切换就可能发生以保证用户的数据访问。然而Data Mover的主备切换到底是做了什么?对用户又有什么样的影响?需要花多长时间才能完成呢?下文就这3个问题做了一定程度的解析。

DM发生failover的过程:

1.Data mover上发生failure
2.CS检测到这个failure
3.CS重新配置系统以使备用的DM接管发生问题的DM的业务和身份(包括名字,ip,MAC地址等各种配置);并且CS还将发生问题的DM重启,然后载入一个基本的配置(没有load任何配置或挂载任何文件系统),这么做是为了避免两个DM都load配置尝试去接管生产从而发生“精神分裂”的情况。
4.寂寞地等待了许久的备份DM,终于等到主DM发生问题,可以大展拳脚,于是它顶掉了原配,开始首先初始化一些自身的配置(例如转载各种driver,打开自己的网卡,给它们分配好IP地址,根据parameter配置文件设置各种参数等),紧接着初始化一些外部部署的配置(包括挂载文件系统,设置CIFS server等)。
5.此时DM的failover算是完成了。理论上用户即应该可以访问数据。取决于用户的客户端(以及使用的协议),failover所花的时间可能会对用户体验造成不同的影响。例如windows用户势必需要重新login一次share(当然如果用户是使用应用程序在访问或者映射了网络盘,这个重新登录的过程会由应用程序或操作系统自动完成,而用户只感到顿卡),重新login的原因是备份的DM只会继承配置文件中的配置,而不会继承用户之前login到share时记录在DM内存里的缓存,这些缓存会随着DM重启而消失;而对于Linux的用户,默认的mount方式会不断的尝试通过NFS将文件系统mount起来,因而经历过几次timeout之后,Linux用户就又恢复使用了。

推荐你看看文章:https://community.emc.com/community/support/chinese/storagehw/blog/2013/10/21/celerravnx-file-data-mover-%E4%B8%BB%E5%A4%87%E5%88%87%E6%8D%A2%E7%9A%84%E8%BF%87%E7%A8%8B%E4%BB%A5%E5%8F%8A%E5%88%87%E6%8D%A2%E7%9A%84%E6%97%B6%E9%97%B4%E5%BC%80%E9%94%80

请点击此处免费订阅论坛每月简报

2 Intern

 • 

1.1K 消息

2013年12月9日 20:00

创建一个备用Data Mover(机头)可确保持续访问文件系统。当主DM故障切换到备用DM,备用DM延续失败的DM的身份和功能。可以配置一个备用DM服务于多个主DM。如果主DM中的一个失败了,备用DM继承失败的主DM的IP和MAC地址和功能原来的备用DM现在是一个主DM,且不再处于待机状态


为了检测DM故障,control station监控所有的DM的周期性心跳数据,通过冗余的内部网络,CS连接到每个DM。如果CS检测到故障时,根据创建备份关系时建立的策略类型作出响应如果CS没有运行,则不会发生DM故障切换。

备用DM在失败发生后的几秒钟内延续用户文件系统服务(如果策略设置为自动),透明地,并且不需要用户卸载并重新挂载文件系统。

更多信息和详细配置可参考最新的VNX FILE 8.1的文档:

https://support.emc.com/docu48455_Configuring-Standbys-on-VNX-8.1.pdf?language=en_US

222 消息

2013年12月10日 17:00

一主一备即可,主的坏掉了,备用的可以接管。

16 消息

2013年12月17日 17:00

谢谢大家的热心解答,基本明白整个流程了。

2 Intern

 • 

3.2K 消息

2013年12月17日 18:00

为什么都叫机头呢?

2 Intern

 • 

1.4K 消息

2013年12月17日 18:00

可能是因为有“机尾”(后端块级存储,比如Symm/VNX/CLARIION)吧。

2 Intern

 • 

2.8K 消息

2013年12月17日 18:00

因为机头后面都要接block级别存储,如:Symmetrix或VNX-Block。

找不到事件!

Top