2 Bronze

多引擎VMAX3系统中,一个director故障后,系统如何处理?

多引擎系统中,cache是跨引擎镜像的,但VMAX3是Local RAID。当某director故障后,该director的镜像cache和RAID归属于不同引擎,系统如何做failover操作呢?

Labels (1)
0 Kudos
5 Replies
3 Silver

Re: 多引擎VMAX3系统中,一个director故障后,系统如何处理?

我觉得在你那个英文版的帖子里已经说得很清楚啦,:)

重复一下,

1. 前端口是没有Failover的,靠的是冗余;

2. cache本身跨引擎镜像,丢了一个dir就失去镜像了而已。cache是否local不是关键(虽然local当然更快一些)。cache本身是global的。坏了的dir当然不能接受写数据了(原本镜像的也只是写数据),读数据也完全由镜像dir的cache完成(原来的读数据是不镜像的,就近使用)。

3. 后端由同引擎的dir接管。

0 Kudos
2 Bronze

Re: 多引擎VMAX3系统中,一个director故障后,系统如何处理?

如果Dir1和Dir3互为镜像,Dir2与Dir4互为镜像。当Dir1故障后,Dir3会与Dir2镜像,还是与Dir4镜像,还是保持现状不镜像呢?

0 Kudos
3 Silver

Re: 多引擎VMAX3系统中,一个director故障后,系统如何处理?

首先,镜像规则尽量会采用奇偶集合,所以双引擎会是1、4卡镜像内存,2、3卡一对。

卡坏了,卡上的内存失效。此时内存靠镜像剩余部分维持运行。

经常会有人问为什么Symm在内存故障时不采用“直写”?直写用于中端产品,一般维护比较差一些,牺牲性能换取安全。

企业级存储,故障引发的性能下降几乎不可以妥协。而直写性能下降非常厉害,企业级用户几乎是不可以接受的。而且这种严重故障的维护非常快,一般都是在1天内修复(白天故障也是坚持到夜里维护),代价比“直写”低。

0 Kudos
2 Bronze

Re: 多引擎VMAX3系统中,一个director故障后,系统如何处理?

非常感谢!

还有个问题,双引擎系统中,正常情况下是跨引擎镜像,当一个引擎故障了,剩余一个引擎的两个director之间也不会重新镜像吗?

0 Kudos
3 Silver

Re: 多引擎VMAX3系统中,一个director故障后,系统如何处理?

内存还是不会更改镜像。

引擎故障是“双误”。 EMC不保证双误下的数据可用性。

一般整个引擎故障,会导致这个引擎后端挂载的所有物理磁盘不可访问。对于VMAX1/2,如果RAID5的2个成员,镜像的2个成员都在这个引擎的后端,则这些物理卷不可访问。

对于VMAX3,因为RAID的所有成员都在一个引擎上,所以一个引擎故障,则上面的所有逻辑卷不可访问。

但有一种情形可以避免单个引擎内影响的逻辑卷不可访问问题:如果该引擎的逻辑卷是SRDF全同步保护的,且前端接口和RDF接口都在另外一个引擎有连接,则所有此引擎的数据访问都可以继续通过远程存储的访问来完成。用户除了性能下降外,还是可以继续访问存储。

0 Kudos